Diskusi INAPR: FB melawan hoax & fake news

Topik ini merupakan salah satu topik diskusi di wa group Indonesian Association for Pattern Recognition, dengan judul:  Facebook akan memakai machine learning untuk menghentikan hoax dan fake news
  1. Topik itu sebenarnya judul dari satu artikel  yang membahas upaya baru dari facebook. Hal tersebut berasal dari tulisan Tessa Lyons (Product Manager ) yang dapat diakses dari  https://newsroom.fb.com/news/2018/06/increasing-our-efforts-to-fight-false-news/
  2. Hoax, berita palsu sangat sulit untuk dikenali kalau hanya mengandalkan visual inspection, karena dari sisi bahasa, gambar, video tidak mudah membedakan mana hoax mana yang bukan. Karena itu, facebook mengandalkan beberapa pendekatan. Lima disampaikan oleh Lyons :
    (i) pengecekan fakta lewat “third-party fact-checking program”
    (ii) pengecekan fakta dari foto & video
    (iii) pengecekan fakta memakai berbagai teknik baru, untuk identifikasi duplikasi atau claim review. Machine Learning dimanfaatkan tujuan tersebut.
    (iv) melakukan aksi terhadap pihak (page atau domain) yang dianggap menyebarkan berita tidak benar
    (v) peningkatan pengukuran dan transparansi lewat kerjasama dengan dunia akademik.
  3. Dari lima pendekatan yang disampaikan di atas, no. (i) mampu mereduksi 80% dari false stories di facebook. Pemanfaatan Machine Learning (ML) adalah untuk identifikasi duplikasi cerita yang salah. Misalnya menurut https://newsroom.fb.com/news/2018/06/increasing-our-efforts-to-fight-false-news/ML dipakai untuk mendeteksi perulangan dari cerita palsu : “menyelamatkan stroke lewat tusukan jarum pada jari dan mengambil darah daripadanya”. Dari cerita tersebut, menurut Lyons, ML dapat mengidentifikasi lebih dari 20 domain, lebih dari 1400 link yang menyebarkannya. Hal ini yang menarik, karena duplikasi dari suatu cerita bisa dilakukan dengan berbagai cara. Kalau memakai bahasa yang sama, relatif mudah. Tetapi bagaimana kalau duplikasinya dengan bahasa berbeda ? Sayang, tidak ada penjelasan lebih lanjut yang saya temukan terkait masalah ini.
  4. Identifikasi hoax dan fake news, saya rasa sangat penting dan memiliki keterkaitan erat dengan dinamika politik di Indonesia. Seiring dengan pilkada, pilpres, hoax sangat “kencang” beredar lewat social media. Apalagi facebook saat ini memiliki pengguna aktif 1.5 milyar di dunia. Cerita palsu sangat mudah disebarkan dengan fitur like, sharing dsb. Hal ini yang saya rasa membuat facebook merasa penting untuk melakukan penanganan terhadap hal tsb.
  5. Beberapa link lain yang terkait:
    1. paper penelitian pada facebook https://research.fb.com/publications/
    2. statistics of facebook : https://www.statista.com/statistics/346167/facebook-global-dau/
    3. How is Facebook addressing false news through third-party fact-checkers https://www.facebook.com/help/1952307158131536
    4. Facebook Is About To Bring The Hammer Down On Overseas Fake News Operators https://www.buzzfeednews.com/article/craigsilverman/facebook-is-now-trying-to-predict-whether-a-page-is-likely#.vrbpE3RDy

Tanggapan:

  1. Rizal: majalah KDD (konferensi data mining) ada yang membahas ttg deteksi fake news dari perspektif data mining: http://www.kdd.org/exploration_files/19-1-Article2.pdf
  2. Rakhmat Arianto:  Mungkin implementasi yg paling mendekati untuk deteksi hoax ada pada “drone emprit”https://endangkurniawan.com/article-drone-emprit-monitoring-sosmed-buatan-anak-indonesia.html?m=1

 

Iklan
Dipublikasi di research, Uncategorized | Meninggalkan komentar

Memahami h-index

“h-index” adalah salah satu metrik yang sering dipakai untuk mengukur kualitas seorang peneliti. Metode ini  diusulkan oleh Jorge E. Hirsch, seorang ahli fisika di Universitas California San Diego untuk mengukur kualitas peneliti. Huruf “h” pada “h-index” berasal dari nama Hirsch. Lazimnya seorang peneliti mengklaim produktifitas dan kontribusinya dalam hal publikasi lewat 2 hal : banyaknya tulisan yang dihasilkan, dan berapa banyak tulisan itu dijadikan acuan/referensi oleh peneliti lain. Semakin banyak tulisan seseorang, berarti dia semakin tinggi produktifitasnya. Semakin banyak tulisan seseorang dirujuk oleh peneliti lain, berarti semakin besar impact/pengaruh penelitian tersebut bagi peneliti lain. H-index menggabungkan kedua informasi tersebut dalam 1 angka, yang menunjukkan jumlah publikasi seseorang, dimana frekuensi sitasinya sama atau lebih dari angka tersebut. Berikut adalah 3 contoh kasus.

  1. Misalnya, seorang peneliti/perekayasa memiliki 5 paper, yang dijadikan rujukan (citation) oleh peneliti lain sebagai berikut:
    paper I : disitasi 50 kali
    paper II : disitasi 5 kali
    paper III : disitasi 3 kali
    paper IV : disitasi 2 kali
    paper V: tidak pernah disitasi peneliti lain.
    Dengan demikian, peneliti tersebut memiliki 3 paper yang dijadikan sitasi peneliti lain, setidaknya 3x. Yaitu paper I, II dan III. Maka h-indeks peneliti tersebut : 3.
  2. Contoh kedua : seorang peneliti memiliki tulisan 100 paper, tapi tidak ada satupun yang dijadikan acuan peneliti yang lain. h-index nya berarti 0.
  3. Peneliti terkenal seperti Anil K. Jain (bidang biometrics, pattern recognition), h-indeksnya 115 dari total 619 paper. Berarti, dari 619 paper beliau, ada 115 paper yang memiliki frekuensi sitasi (dijadikan rujukan peneliti lain) sebanyak minimal 115 kali.

Untuk mengetahui h-index seseorang, bisa lewat https://www.scopus.com/ untuk paper yang terindeks scopus, atau https://scholar.google.com/citations untuk yang diindeks di google scholar. Ristek Dikti memakai h-index untuk pengajuan research grant. Peneliti diperbolehkan menjadi ketua di dua skema penelitian apabila sudah memiliki h-index google scholar minimal 2. Jika kurang dari 2, hanya diperbolehkan menjadi ketua satu skema penelitian saja. Walaupun demikian, h-index memiliki beberapa kelemahan. Misalnya rentan terhadap self-citation (penulis memasukkan papernya sendiri ke salah satu referensi, dengan tujuan mendongkrak frekuensi sitasi terhadap tulisan lamanya). Untuk memahami lebih lanjut, dapat mengacu ke tulisan antara lain : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2613214/

Dipublikasi di research | Meninggalkan komentar

Proses Bisnis Penerbitan KTP Elektronik

Sumber artikel :  http://ptik.bppt.go.id/berita-ptik/66-bisnis-proses-penerbitan-ktp-elektronik

KTP Elektronik atau KTP-el merupakan program pemerintah yang didukung oleh Kementrian Dalam Negeri, Badan Pengkajian dan Penerapan Teknologi (BPPT), dan berbagai instansi pemerintah yang lain untuk merealisasikan amanat Undang-Undang. Yang menjadi dasar hukumnya adalah Undang-Undang Administrasi Kependudukan No. 23 Tahun 2006 Pasal 64 Ayat 3 yang menyatakan bahwa “Dalam KTP sebagaimana dimaksud pada ayat (1) disediakan ruang untuk memuat kode keamanan dan rekaman elektronik pencatatan Peristiwa Penting”.

Tujuan penerapan KTP elektronik adalah untuk mewujudkan dokumen identitas penduduk yang tunggal dan absah melalui proses identifikasi ketunggalan biometrik secara terpusat (nasional), dan penyimpanan dan pengamanan data dengan menggunakan chip. Manfaat yang diperoleh dari penerapan KTP-el adalah

  1. Tertib administrasi kependudukan
  2. Menjamin ketunggalan dan keabsahan identitas penduduk
  3. Mendukung keberhasilan pemilu dan pemilukada (penyusunan DP4)
  4. Meningkatkan efektifitas layanan publik
  5. Meningkatkan keamanan negara

Dalam pelaksanaannya, banyak masyarakat yang mengalami kendala dalam memperoleh KTP elektronik tersebut. Adakalanya masyarakat menunggu lebih dari 1 bulan untuk memperoleh KTP-elektroniknya, bahkan ada pula yang lebih dari 1 tahun, walaupun ada juga yang dapat memperolehnya dalam hitungan hari. Mengingat pentingnya KTP elektronik bagi penduduk sebagai syarat mengakses pelayanan publik, dalam rapat terbatas penataan administrasi kependudukan 4 April 2018 yang lalu, Kepala Negara menginstruksikan jajaran terkait untuk melakukan percepatan pelayanan KTP elektronik sehingga semua warga negara mendapatkan pelayanan yang cepat dan memiliki akses terhadap layanan publik lainnya.

Ada dua hal yang dibahas dalam tulisan ini.

  • Pertama adalah bagaimana sebenarnya proses bisnis penerbitan KTP elektronik ? Apakah bedanya dengan KTP lama ?
  • Kedua, mengapa proses penerbitan KTP elektronik tidak bisa langsung jadi di tempat layanan kependudukan sebagaimana KTP di masa lalu ? Berapa waktu yang diperlukan dan bagaimana menghitung waktu yang diperlukan untuk menerbitkan KTP-el seorang penduduk ?

Penerbitan KTP elektronik memiliki proses bisnis yang berbeda dengan KTP sebelumnya, karena ada proses penunggalan NIK penduduk. Proses penunggalan ini tidak dilakukan di lokasi layanan administrasi kependudukan, melainkan di Data Center Kementrian Dalam Negeri. Sehingga wajar kalau masyarakat tidak mengetahui apa yang terjadi setelah mereka mengikuti perekaman sidik jari, iris mata dan wajah, mengapa mereka tidak dapat menerima KTP-elektroniknya langsung pada saat perekaman, melainkan harus menunggu panggilan.

20180407-gambar-1 bisnis proses ktp-el

Gambar 1      Proses bisnis penerbitan KTP elektronik dari perekaman hingga personalisasi dan penyampaian ke penduduk

Proses bisnis penerbitan KTP elektronik secara sederhana (low level granularity) ditampilkan pada Gambar 1, mulai dari perekaman KTP elektronik hingga pada tahap penerbitannya. Penjelasan masing-masing tahapan adalah sebagai berikut:

  1. Pertama-tama penduduk datang ke tempat pelayanan di kantor kecamatan/kelurahan dengan membawa surat panggilan, kemudian melakukan verifikasi datanya dengan data penduduk yang dimiliki oleh Dukcapil. Selanjutnya dilakukan perekaman data biometrik yang meliputi 10 sidik jari, 2 iris mata dan wajah. Data yang direkam ini selanjutnya dikirimkan ke Data Center I yang berada di Jakarta, dan dilakukan “proses penunggalan” atau biasa disebut deduplikasi. Tujuan proses penunggalan adalah untuk memastikan identitas penduduk tadi tunggal atau tidak (misalnya pernah merekam sebelumnya).
  2. Di Data Center (lokasi tidak disebutkan sesuai kaidah keamanan informasi) dilakukan proses penunggalan dengan memanfaatkan teknologi biometrik. Teknologi biometrik bertujuan mengenali identitas seseorang berdasarkan ciri khas fisik atau perilaku. Dalam implementasi KTP elektronik, data biometrik yang direkam dikategorikan ciri khas fisik, yaitu sidik jari, iris mata dan wajah. Dalam proses penunggalan tersebut, data biometrik penduduk dicocokkan dengan algoritma tertentu dengan seluruh data yang telah lebih dahulu tersimpan pada database biometrik nasional. Jika dalam proses pencocokan tersebut ternyata tidak ada satu pun yang cocok, berarti penduduk yang melakukan perekaman tersebut dinyatakan tunggal atau unik. Yaitu pertama kali melakukan perekaman KTP elektronik, sehingga baginya berhak diterbitkan KTP elektronik. Proses nomer 2 inilah yang membedakan KTP elektronik dengan KTP lama, dan dilakukan tidak di tempat layanan kependudukan di Kecamatan/Kelurahan, sehingga biasanya tidak diketahui oleh penduduk. Proses ini sangat penting karena menjadi kunci utama diperolehnya identitas penduduk yang tunggal (single identity number) sebagai basis layanan publik yang prima.
  3. Selanjutnya bagi penduduk yang sudah dinyatakan tunggal dan siap cetak (Print Ready Record), dan blangko telah tersedia, akan dilakukan proses personalisasi. Dalam proses personalisasi tersebut, sidik jari telunjuk kanan dan sidik jari telunjuk kiri disimpan ke dalam chip KTP-el. Apabila kualitas perekaman sidik jari telunjuk kanan dan telunjuk kiri kurang baik untuk verifikasi sidik jari, maka sidik jari lain, yang memiliki kualitas lebih baik, yang akan disimpan di chip KTP-el untuk verifikasi sidik jari pemegang KTP-el. Informasi sidik jari mana yang direkam ini juga ikut disimpan di dalam chip. Selanjutnya kartu tersebut disampaikan kepada penduduk.

 

Bagaimanakah menghitung waktu yang diperlukan dalam proses penerbitan KTP elektronik ?

Waktu yang diperlukan dalam proses penerbitan tersebut secara sederhana dapat dihitung dengan menjumlahkan waktu yang diperlukan di 3 komponen : (i) tahap verifikasi data dan perekaman biometrik (ii) proses deduplikasi/penunggalan biometrik (iii) personalisasi.  Pada gambar 1 di atas, waktu yang diperlukan untuk masing-masing tahap dinotasikan sebagai t1, t2 dan t3.

Komponen (i) dan (iii) dilakukan di Kecamatan dan Kabupaten/Kota. Sedangkan komponen (ii) berlangsung di Data Center Kementrian Dalam Negeri. Apabila proses perekaman dan verifikasi data (i) berjalan lancar, mungkin memerlukan waktu sekitar 15 menit (t1=15 menit). Akan tetapi dalam proses perekaman biometrik, adakalanya tidak bisa sekali rekam langsung berhasil. Ketika sidik jari dipindai, ada indikator kualitas pada aplikasi perekaman yang menunjukkan layak tidaknya hasil pemindaian sidik jari tersebut. Jika ternyata hasil pemindaian tersebut tidak baik, proses pemindaian harus diulang, sesuai dengan Prosedur Operasional Standar (SOP). Hal ini yang kadang dapat menyebabkan proses perekaman berlangsung lebih lama. Sedangkan waktu yang diperlukan untuk (iii) personalisasi, mungkin bisa diselesaikan dalam waktu 10-15 menit (t3 = 15 menit)

Tinggal komponen (ii), yaitu proses deduplikasi biometrik yang sangat tergantung pada state-of-the-art teknologi biometrik dan skala database biometrik penduduk di Data Center (disebut sebagai gallery), semakin besar database penduduk yang di gallery, semakin lama waktu yang diperlukan. Dengan jumlah setidaknya 172 juta record, maka proses deduplikasi 10 jari dan 2 iris mata akan makan waktu yang tidak sebentar, belum lagi kalau terdapat dua data biometrik dengan tingkat kemiripan yang cukup tinggi. Untuk memutuskan tunggal tidaknya diperlukan proses ajudikasi yang dilakukan manual, ahli akan memeriksa dan membandingkan data biometrik yang diperoleh untuk membuat keputusan akhir status ketunggalannya. Angka 172 juta record ini dalam pengetahuan penulis adalah nomer dua terbesar di dunia setelah program UID di India. Karena itu dalam penerbitan KTP elektronik, biasanya tidak bisa selesai dalam 1 hari karena walaupun t1+t3 mungkin bisa kurang dari 1 jam, tetapi ada waktu t2 yang diperlukan oleh proses deduplikasi yang merupakan proses kunci dalam memperoleh identitas tunggal, yang tergantung pada state-of-the-art teknologi penunggalan dan skala gallery. Diperlukan pengukuran secara teknis untuk mengetahui berapa rata-rata waktu t2 sebenarnya yang diperlukan dalam proses deduplikasi, sehingga bisa menjadi acuan dalam menetapkan batas waktu penerbitan KTP elektronik bagi penduduk.

Tanpa pengukuran teknis ini, dikhawatirkan penetapan batas waktu maksimal menjadi tidak realistis dan sulit diimplementasikan di lapangan. Jangan sampai batas waktu yang ditetapkan tidak dapat diimplementasikan, dan terpaksa harus mem-bypass proses deduplikasi yang berlangsung di Data Center. Karena kalau proses deduplikasi di-bypass (dilewati), proses perekaman hingga penerbitan mungkin bisa berlangsung kurang dari satu jam. Tetapi akibatnya ketunggalan identitas penduduk yang selama ini diperjuangkan akan menjadi sia-sia, karena proses penunggalan tersebut dihentikan.

Dipublikasi di research, Uncategorized | Meninggalkan komentar