Pemahaman konsep kadangkala perlu proses panjang

Belakangan ini, beberapa kali berdiskusi dg pemakai teknik Machine Learning. Banyak dari mereka yang memakai teknik A, B dan C, tanpa memahami karakteristik masalahnya sebenarnya bagaimana. Gagal memakai A, kemudian memakai teknik B, dsb. Seperti coba-coba, iseng-iseng berhadiah. Hal ini yang saya berusaha hindarkan. Sejauh mungkin, saya berupaya untuk memahami konsepnya. Hal ini saya coba terapkan di kelas datamining. Siang ini membahas praktek feature subset selection (FSS) memakai Weka. Sebelum praktek, saya bahas dulu dua pendekatan FSS : filter vs wrapper. Sebagai contoh pendekatan filter, saya pilih Information Gain sebagai feature evaluator untuk menentukan peringkat/rank-nya. Untuk membahas information gain, mau tidak mau membahas konsep entropy. Setelah itu, karena inputnya continous, perlu dilakukan diskretisasi. Dari berbagai teknik yang ada, saya pilih pemakaian information gain sebagai contoh untuk menentukan cutting point. Tentunya akan timbul pertanyaan, berapa banyaknya cutting point yang diperlukan ? Di situ, perlu untuk membaca paper-nya Fayyad & Irani tahun 93, tentang pemakaian Minimum Description Length (MDL). Rantai yang panjang perlu dilalui untuk bisa memahami, konsep feature subset selection. Kalau mau shortcut ya tinggal belajar cara pakai Weka saja. Tapi kalau berhenti di sini, akhirnya tidak bisa memahami keindahan sisi matematis-nya. Kalau gagal, tidak akan faham cara memperbaikinya, karena tidak tahu apa penyebab kegagalannya. Tidak tahu penyebab kegagalannya karena tidak faham konsep dari metode yang dipakai.

Iklan

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City. My research is on pattern recognition and image processing with applied field of interests on biometrics identification & development of computer aided diagnosis for Malaria. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di research. Tandai permalink.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s