Mengikuti ICPR 2018 di Beijing

International Conference on Pattern Recognition (ICPR 2018) adalah salah satu top conference di bidang Pattern Recognition, yang diselenggarakan tiap 2 tahun sekali. Tahun ini diselenggarakan di Beijing, sedangkan 2020 akan diselenggarakan di Milano Italy, 2022 di Montreal Canada. Pada penyelenggaraan tahun ini, ada hal yang spesial bagi Indonesia. Yaitu keputusan Governing Board untuk menerima Indonesia yang diwakili oleh Indonesian Association for Pattern Recognition (INAPR) sebagai anggota resmi International Association of Pattern Recognition (IAPR). Satu hal yang sangat saya syukuri, karena saya mendapat izin  dan pendanaan untuk hadir di Beijing 20-24 Agustus 2018. Yaitu dengan dana Pusat Unggulan Iptek (PUI), dari Kemenristekdikti.

Saya tulis beberapa pengalaman saya selama konferensi tersebut, tentunya dengan bahasa informal 🙂

PS: secara bertahap tulisan ini akan dilengkapi dengan catatan yang saya buat selama konferensi berlangsung

Baca lebih lanjut

Iklan
Dipublikasi di research, trip report | Meninggalkan komentar

Diskusi INAPR: FB melawan hoax & fake news

Topik ini merupakan salah satu topik diskusi di wa group Indonesian Association for Pattern Recognition, dengan judul:  Facebook akan memakai machine learning untuk menghentikan hoax dan fake news
  1. Topik itu sebenarnya judul dari satu artikel  yang membahas upaya baru dari facebook. Hal tersebut berasal dari tulisan Tessa Lyons (Product Manager ) yang dapat diakses dari  https://newsroom.fb.com/news/2018/06/increasing-our-efforts-to-fight-false-news/
  2. Hoax, berita palsu sangat sulit untuk dikenali kalau hanya mengandalkan visual inspection, karena dari sisi bahasa, gambar, video tidak mudah membedakan mana hoax mana yang bukan. Karena itu, facebook mengandalkan beberapa pendekatan. Lima disampaikan oleh Lyons :
    (i) pengecekan fakta lewat “third-party fact-checking program”
    (ii) pengecekan fakta dari foto & video
    (iii) pengecekan fakta memakai berbagai teknik baru, untuk identifikasi duplikasi atau claim review. Machine Learning dimanfaatkan tujuan tersebut.
    (iv) melakukan aksi terhadap pihak (page atau domain) yang dianggap menyebarkan berita tidak benar
    (v) peningkatan pengukuran dan transparansi lewat kerjasama dengan dunia akademik.
  3. Dari lima pendekatan yang disampaikan di atas, no. (i) mampu mereduksi 80% dari false stories di facebook. Pemanfaatan Machine Learning (ML) adalah untuk identifikasi duplikasi cerita yang salah. Misalnya menurut https://newsroom.fb.com/news/2018/06/increasing-our-efforts-to-fight-false-news/ML dipakai untuk mendeteksi perulangan dari cerita palsu : “menyelamatkan stroke lewat tusukan jarum pada jari dan mengambil darah daripadanya”. Dari cerita tersebut, menurut Lyons, ML dapat mengidentifikasi lebih dari 20 domain, lebih dari 1400 link yang menyebarkannya. Hal ini yang menarik, karena duplikasi dari suatu cerita bisa dilakukan dengan berbagai cara. Kalau memakai bahasa yang sama, relatif mudah. Tetapi bagaimana kalau duplikasinya dengan bahasa berbeda ? Sayang, tidak ada penjelasan lebih lanjut yang saya temukan terkait masalah ini.
  4. Identifikasi hoax dan fake news, saya rasa sangat penting dan memiliki keterkaitan erat dengan dinamika politik di Indonesia. Seiring dengan pilkada, pilpres, hoax sangat “kencang” beredar lewat social media. Apalagi facebook saat ini memiliki pengguna aktif 1.5 milyar di dunia. Cerita palsu sangat mudah disebarkan dengan fitur like, sharing dsb. Hal ini yang saya rasa membuat facebook merasa penting untuk melakukan penanganan terhadap hal tsb.
  5. Beberapa link lain yang terkait:
    1. paper penelitian pada facebook https://research.fb.com/publications/
    2. statistics of facebook : https://www.statista.com/statistics/346167/facebook-global-dau/
    3. How is Facebook addressing false news through third-party fact-checkers https://www.facebook.com/help/1952307158131536
    4. Facebook Is About To Bring The Hammer Down On Overseas Fake News Operators https://www.buzzfeednews.com/article/craigsilverman/facebook-is-now-trying-to-predict-whether-a-page-is-likely#.vrbpE3RDy

Tanggapan:

  1. Rizal: majalah KDD (konferensi data mining) ada yang membahas ttg deteksi fake news dari perspektif data mining: http://www.kdd.org/exploration_files/19-1-Article2.pdf
  2. Rakhmat Arianto:  Mungkin implementasi yg paling mendekati untuk deteksi hoax ada pada “drone emprit”https://endangkurniawan.com/article-drone-emprit-monitoring-sosmed-buatan-anak-indonesia.html?m=1

 

Dipublikasi di research, Uncategorized | Meninggalkan komentar

Memahami h-index

“h-index” adalah salah satu metrik yang sering dipakai untuk mengukur kualitas seorang peneliti. Metode ini  diusulkan oleh Jorge E. Hirsch, seorang ahli fisika di Universitas California San Diego untuk mengukur kualitas peneliti. Huruf “h” pada “h-index” berasal dari nama Hirsch. Lazimnya seorang peneliti mengklaim produktifitas dan kontribusinya dalam hal publikasi lewat 2 hal : banyaknya tulisan yang dihasilkan, dan berapa banyak tulisan itu dijadikan acuan/referensi oleh peneliti lain. Semakin banyak tulisan seseorang, berarti dia semakin tinggi produktifitasnya. Semakin banyak tulisan seseorang dirujuk oleh peneliti lain, berarti semakin besar impact/pengaruh penelitian tersebut bagi peneliti lain. H-index menggabungkan kedua informasi tersebut dalam 1 angka, yang menunjukkan jumlah publikasi seseorang, dimana frekuensi sitasinya sama atau lebih dari angka tersebut. Berikut adalah 3 contoh kasus.

  1. Misalnya, seorang peneliti/perekayasa memiliki 5 paper, yang dijadikan rujukan (citation) oleh peneliti lain sebagai berikut:
    paper I : disitasi 50 kali
    paper II : disitasi 5 kali
    paper III : disitasi 3 kali
    paper IV : disitasi 2 kali
    paper V: tidak pernah disitasi peneliti lain.
    Dengan demikian, peneliti tersebut memiliki 3 paper yang dijadikan sitasi peneliti lain, setidaknya 3x. Yaitu paper I, II dan III. Maka h-indeks peneliti tersebut : 3.
  2. Contoh kedua : seorang peneliti memiliki tulisan 100 paper, tapi tidak ada satupun yang dijadikan acuan peneliti yang lain. h-index nya berarti 0.
  3. Peneliti terkenal seperti Anil K. Jain (bidang biometrics, pattern recognition), h-indeksnya 115 dari total 619 paper. Berarti, dari 619 paper beliau, ada 115 paper yang memiliki frekuensi sitasi (dijadikan rujukan peneliti lain) sebanyak minimal 115 kali.

Untuk mengetahui h-index seseorang, bisa lewat https://www.scopus.com/ untuk paper yang terindeks scopus, atau https://scholar.google.com/citations untuk yang diindeks di google scholar. Ristek Dikti memakai h-index untuk pengajuan research grant. Peneliti diperbolehkan menjadi ketua di dua skema penelitian apabila sudah memiliki h-index google scholar minimal 2. Jika kurang dari 2, hanya diperbolehkan menjadi ketua satu skema penelitian saja. Walaupun demikian, h-index memiliki beberapa kelemahan. Misalnya rentan terhadap self-citation (penulis memasukkan papernya sendiri ke salah satu referensi, dengan tujuan mendongkrak frekuensi sitasi terhadap tulisan lamanya). Untuk memahami lebih lanjut, dapat mengacu ke tulisan antara lain : https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2613214/

Dipublikasi di research | Meninggalkan komentar