Id Big Data Meetup di Kampus UAI

URL kegiatan: http://idbigdata.com/official/event/idbigdata-meet-up-1-2015/?instance_id=34

Hari Rabu, 25 Februari 2015 yang lalu saya mengisi sesi pagi Id BigData 1st meetup yang diselenggarakan di kampus Universitas Al Azhar Indonesia. Dalam kesempatan tersebut saya menyampaikan materi dengan tema : data dimensionality reduction memakai feature subset selection (FSS). FSS adalah mentrasnformasikan input space ke ruang dimensi yang lebih rendah, yang terbentuk dari subset feature (atribut). Misalnya jumlah feature (atribut) awal adalah d buah, maka kombinasi input yang bisa diperoleh adalah (2^d -1). Hal ini dikarenakan kombinasi string 0 (atribut tidak dipakai) atau 1 (atribut dipakai) yang bisa dibentuk adalah 2^d. Tetapi salah satu kombinasi tersebut “000….0” tidak dihitung. Dalam pembahasan FSS, ada 2 aspek yang diperhatikan : (i) bagaimana cara/urutan  atribut tersebut dipilih ?  (ii) bagaimana mengukur kualitas atribut yang dipilih.

Saya dulu mendalami teknik FSS saat masih S3, dalam penelitian bioinformatika. Tema yang saya kerjakan saat itu adalah memprediksi status mutasi Tumour Suppressor Gene p53 dari ekspresi 1281 gen pasien kanker yang diukur memakai microarray. Beberapa algoritma saya evaluasi : Sequential Forward Selection, Sequential Backward Selection, Sequential Floating Selection dan Genetic Algorithm. Beberapa literatur yang direkomendasikan terkait topik ini antara lain:

  1. “Feature Selection for Knowledge Discovery and Data Mining”, Huan Liu and Hiroshi Motoda, July 1998, ISBN 0-7923-8198-X,  Kluwer Academic Publishers
  2. “Feature Extraction, Construction and Selection: A Data Mining Perspective”, (with Hiroshi Motoda), July 1998 (2nd Printing, 2001), ISBN 0-7923-8196-3, Kluwer Academic Publishers.
  3. Feature Extraction, Foundations and Applications, Isabelle Guyon, Steve Gunn, Masoud Nikravesh, and Lofti Zadeh, Editors.  Series Studies in Fuzziness and Soft Computing, Physica-Verlag, Springer, 2006.

Feature Subset Selection mendapat perhatian khusus saat KDD Cup 2001 (http://pages.cs.wisc.edu/~dpage/kddcup2001/) diselenggarakan. Dalam kompetisi dunia yang bertemakan “Genomic Challenge” tersebut, pertama kali topik genomic diangkat dalam kompetisi. Ada 3 problem yang harus dipecahkan. Khusus topik pertama : memprediksi compound yang terikat pada thrombin, sangat berkaitan erat dengan FSS.  Data yang harus diolah terdiri dari hampir 140 ribu atribut, yang tidak mungkin diolah dengan software komersial yang ada. Para peserta kompetisi memakai self-customized software untuk menyelesaikan masalah tersebut. Dalam survey yang diadakan terhadap peserta, ternyata FSS menempati peringkat pertama sebagai metode yang paling banyak dipakai. Dengan FSS, atribut 140 ribu tersebut bisa direduksi sehingga data dapat direpresentasikan dengan input yang lebih sedikit dan informatif.

Saya tulis juga catatan mengenai salah satu pertanyaan yg diajukan ke saya: https://asnugroho.wordpress.com/2015/02/27/berapakah-jumlah-sampel-yang-dibutuhkan-seiring-dengan-meningkatnya-dimensionality-dari-data/

Senang rasanya dapat berada di kampus UAI lagi, dan mengisi kegiatan akademik di sana. Saya terakhir mengajar di UAI pada tahun 2013, yaitu mata kuliah image processing. Setelah itu saya kesulitan ke kampus UAI karena lokasinya yang cukup jauh dari kantor.  Setelah paparan saya selesai, acara dilanjutkan dengan workshop pengenalan Hadoop. Sayang sekali, saya harus segera kembali ke laboratorium di kantor Serpong, karena ada agenda lain.

Workshop ini akan dilanjutkan dengan workshop berikutnya, setahap demi setahap mendiseminasikan teknologi Big Data di Indonesia. Semoga saya bisa mengikuti juga untuk workshop berikutnya.

Beberapa foto di bawah saya peroleh dari posting Dr.Moeljono Widjaja (PTIK-BPPT) di FB Group PTIK-BPPT, dan dua foto berikutnya dari posting Destini Bebasari di Social Media.

10915070_10205552548669212_7393942497937145461_oIMG_2015-02-28 20:32:49

Iklan

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City. My research is on pattern recognition and image processing with applied field of interests on biometrics identification & development of computer aided diagnosis for Malaria. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di talk & seminars. Tandai permalink.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s