Catatan mengikuti Seminar Big Data SNAPP

Pada hari Rabu, 26 Oktober 2016 kemarin, saya ditugaskan oleh kantor (BPPT) mewakili kedeputian Teknologi Informasi Energi Material (TIEM) untuk memenuhi undangan Unisba, menjadi salah satu pembicara di plenary session Seminar Nasional Penelitian Pengabdian 2016 (SNAPP). SNAPP tahun ini adalah yang ke-6 mengambil tema Big Data. Sepertinya perhatian dan minat terhadap Big Data di tanah air belakangan meningkat cukup pesat. Beberapa waktu yang lalu, saya diundang Universitas Negeri Malang dengan tema Big Data dan pendidikan. Setelah itu FMIPA UGM mengundang untuk menjadi salah satu pembicara Seminar terkait Intelligent Computing, yang tema bahasannya fokus ke Deep Learning. Berbeda dengan seminar-seminar yang terdahulu, seminar Big Data yang saya ikuti kali ini unik, karena hampir semua pembicara adalah pakar statistics, kecuali saya yg berlatar belakang komputasi. Saya dapat berkenalan dan menimba ilmu dari para pakar yang nama besarnya selama ini cuma bisa saya baca di mass media seperti Dr.Suryamin (Kepala BPS yang baru saja purnakarya), Prof.Khairil Anwar Notodiputro (IPB) dan Prof. Bustanul Arifin (Universitas Lampung). Saya sebut “berbeda”, karena seminar tentang Big Data umumnya diisi oleh expert dari IT, seringkali tidak melibatkan ahli statistika. Misalnya mengutip [1], beberapa event besar tersebut antara lain:

– White House Big Data Partners Workshop – 0/19 statisticians
– National Academy of Sciences Big Data Worskhop – 2/13 speakers statisticians
– Moore Foundation Data Science Environments – 0/3 directors from statistical background, 1/25 speakers at OSTP event about the environments was a statistician
– Original group that proposed NIH BD2K – 0/18 participants statisticians
– Big Data rollout from the White House – 0/4 thought leaders statisticians, 0/n participants statisticians.

Dari paparan para pakar statistika siang tadi, kesan saya, banyak yang memang sudah tertarik, memperhatikan dan mulai melakukan riset ke arah Big Data, tetapi ada beberapa sisi pada riset Big Data yang bagi ahli statistika masih belum bisa memuaskan. Misalnya keterwakilan populasi, validitas data yang diperoleh maupun aspek2 lain. Sebagai pakar statistika, mereka akan sangat concern dengan aspek tersebut, karena itu faktor yang penting dalam menghasilkan simpulan yang valid dan bisa dipertanggungjawabkan secara ilmiah. Di sisi lain, gelombang minat dan perhatian terhadap big data luar biasa besar merupakan fenomena yang tidak bisa dihindari. Banyak klaim yang terasa berlebihan, seolah-olah Big Data mampu menawarkan solusi yang lebih cepat, murah dan akurat dibandingkan pendekatan statistika tradisional seperti survey dsb.

Kebetulan saya mendapatkan giliran terakhir, dan memilih tema Big Data & Healthcare. Setelah menyampaikan paparan mengenai riset yang kami lakukan, di bagian akhir, saya mengulas contoh Google Flu Trends yang banyak menarik perhatian. Google Flu Trends adalah layanan yang dikembangkan oleh Google untuk memetakan aktifitas penyebaran influenza di seluruh dunia (lebih dari 25 negara), lewat ekstraksi pola pencarian di searching engine google. Data aktifitas flu bisa langsung muncul setelah jangka waktu sehari. Jauh lebih cepat dibandingkan upaya pendataan manual oleh CDC [2]. GFT yang sempat dipuji, ternyata akhirnya menuai kritik. Banyak asumsi dan cara pengolahan data yang tidak atepat dari kaidah statistika. Februari 2013 jurnal terkemuka Nature melaporkan bahwa angka kasus flu yang diprediksi oleh GFT lebih dari 2 kali angka yang diperoleh secara sahih oleh Center for Disease Control & Prevention (CDC) lewat pemantauan kunjungan ke dokter terkait flu di USA. GFT saat ini sudah tidak lagi mempublikasikan estimasi mereka. [3]

Terlepas dari berbagai kelemahan yang ada, GFT merupakan salah satu contoh collective intelligence yang bisa dipakai untuk membuat prakiraan terhadap trend yang menarik untuk diteliti lebih lanjut. Big Data perlu dikawal oleh statistika agar simpulan yang dihasilkan dapat diinterpretasikan dengan hati-hati. Walaupun tidak akan menggantikan kaidah baku yang sudah ada, tetapi pendekatan Big Data memberikan cara pandang baru terhadap proses pemaknaan data [4]-[6].

14882246_10155387210319554_5799571241761975445_o 14902905_10155387216624554_4847322560031351697_o

14925761_10155387217569554_384581234676186071_n

Referensi

  1. http://simplystatistics.org/2014/05/07/why-big-data-is-in-trouble-they-forgot-about-applied-statistics/
  2. Detecting influenza epidemics using search engine query data, Jeremy Ginsberg, Matthew H. Mohebbi, Rajan S. Patel, Lynnette Brammer, Mark S. Smolinski & Larry Brilliant, Nature Vol 457, 19 February 2009, doi:10.1038/nature07634
  3. When Google got flu wrong, Declan Butler, Nature 494, 155–156 (14 February 2013) doi:10.1038/494155a (dapat diakses dari http://www.nature.com/news/when-google-got-flu-wrong-1.12413  )
  4. The Parable of Google Flu: Traps in Big Data Analysis, David Lazer, Ryan Kennedy, Garry King, Alessandro Vespignani, Science Vol.343, pp.1203-1205, 14 March 2014
  5. Big Data for Health, J.A. Perez et al., IEEE Journal of Biomedical and Health Informatics, Vol.19, No.4, July 2015, pp.1193-1208
  6. Google Flu Trends, The Limit of Big Data, Steve Lohr, http://bits.blogs.nytimes.com/2014/03/28/google-flu-trends-the-limits-of-big-data/?_r=0
  7. Eight (No, Nine!) Problems With Big Data, Gary Marcus and Ernest Davis, New York Times, 6 April 2014, (dapat diakses dari http://www.nytimes.com/2014/04/07/opinion/eight-no-nine-problems-with-big-data.html )

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City.Since 2015, I was appointed as Program Director of R&D activities in Intelligent Computing Laboratory (former name: Digital Signal Processing Laboratory). The activities in the laboratory are organized into three groups : (i) Natural Language Processing (ii) Multimodal biometrics Identification (iii) ICT solution for Tropical Disease. I also enjoy to teach the students, as a part time lecturer in Swiss German University Serpong & UNS Sebelas Maret Surakarta. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di research, talk & seminars, trip report. Tandai permalink.

3 Balasan ke Catatan mengikuti Seminar Big Data SNAPP

  1. Buat nomor referensinya otomatis seperti mendeley atau masih manual pak?

  2. Santi Indra Astuti berkata:

    Terimakasih pak Anto. Setelah menjadi masyarakat yang Produktif, Kreatif, dan Baik Hati, saatnya kini kita menjadi masyarakat yang Kritis dan sadar akan hak kewajiban kita saat berhadapan dengan persoalan data. Sepakat sekali, kuncinya adalah pada literasi…

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s