Corat-coret Anto S. Nugroho

Paper survey, Trip Report, Summary

Arsip untuk Januari 29th, 2007

Menyelidiki kegagalan eksperimen memakai SVM

Ditulis oleh Anto Satriyo Nugroho di/pada Januari 29, 2007

Di milis sc-ina, mas Achmad Widodo (PKNU-Busan) mengemukakan masalah yang dihadapinya dalam memakai Support Vector Machine (SVM) untuk time-series prognosis. Saya kutip di sini tanggapan yg saya berikan, sebagai dokumentasi yang barangkali bermanfaat untuk yad. Kebetulan saat ini sedang menyiapkan materi e-tutorial SVM di milis indo-dm, jadi sekalian saja dimasukkan ke materi.

Point-point yang diperiksa jika SVM tidak berhasil mencapai performa yang memuaskan:

  1. Data Preprocessing
    1. Apakah sudah dicoba prediksi itu dengan melibatkan data sebelumnya pada interval tertentu ? Misalnya untuk memprediksi situasi saat waktu=t, model itu dilatih dengan input yang terdiri dari data pada waktu t-1, t-2,t-3,…. Saya dulu pernah membuat prediktor kemunculan kabut memakai neural network dari data hasil observasi kondisi cuaca. Datanya meliputi tekanan udara, kecepatan angin, bentuk awan, dsb. yang diamati tiap 30 menit. Untuk mendapatkan hasil yg baik saat itu saya masukkan juga data 30 menit, 60 & 90 menit sebelumnya, dst. dan dicari yg terbaik (paper1, paper2)
    2. Apakah memungkinkan jika dilakukan feature selection/extraction untuk mereduksi input yang tidak diperlukan ? Di studi yang saya lakukan mengenai analisa data interferon, SVM relatif lebih stabil terhadap keberadaan irrelevant features, dibandingkan dengan k-NN. Walau demikian, proses feature selection ini mungkin bisa membantu agar proses training SVM berlangsung efektif.
  2. Training
    1. Apakah sudah diselidiki kemungkinan pilihan fungsi Kernel & proses optimisasi parameternya kurang berhasil ?
      Selama ini saya lebih sering memakai Gaussian Kernel, dan lakukan grid search terhadap dua parameter (sigma-nya Gaussian Kernel & nilai C pada SVM). Tetapi kalau datanya skala besar, mungkin bisa memakai strategi DOE (Design of Experiment).
    2. Dari ulasan yg diberikan, mas Widodo memakai Hold-Out method untuk melakukan optimisasi parameter. Hold Out : membagi data menjadi dua: satu bagian untuk training dan satu bagian lagi untuk testing. Kalau parameter tuning dilakukan terhadap test-set, akan berakibat hasilnya kurang well-generalized. Kalau memungkinkan, ada baiknya dibagi 3 yang saling independen : training set, validation set dan test-set. Validation set dipakai untuk melakukan optimasi parameter.
    3. Salah satu hal yang mungkin bisa terjadi (walaupun ini jarang terjadi) adalah statistical characteristics (distribusi data) antara training set dan test-set berlainan. Akibatnya sejauh apapun parameter di optimize terhadap training set, hasilnya tidak akan bagus terhadap test-set. Ada baiknya dicoba mengubah pembagian datanya, untuk menghindari kemungkinan ini.
  3. -

Referensi

  1. Hastie, Tibshirani, Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Springer-Verlag, 2001
  2. Ishii, et al. Wakariyasui Patan Ninshiki, Ohmsha, 1998

Ditulis dalam kernel methods, research | Leave a Comment »

Bagaimana memberikan presentasi yang menarik dan efektif ?

Ditulis oleh Anto Satriyo Nugroho di/pada Januari 29, 2007

Saat membaca tulisan pak BR mengenai presentasi, saya jadi teringat tulisan di blog lama yang belum sempat saya pindahkan ke sini. OK deh, tak usung mrene (saya angkut ke sini deh) :-)

Source : http://asnugroho.blogspot.com/2004/09/bagaimana-memberikan-presentasi-yang.html

Presentasi merupakan satu bagian tak terpisahkan dari kegiatan kita sebagai peneliti. Dengan presentasi, kita berusaha mengkomunikasikan ide kita secara langsung kepada pendengar yang berarti juga pada komunitas ilmiah (thought collective).

Beberapa kali saya melihat di gakkai, banyak peneliti yang sebenarnya materinya sangat menarik, tapi cara mempresentasikan idenya membuat orang malas mengikuti. Ada yang presentasi sambil membaca teks, ada yang terlalu banyak memakai animasi power point yang tidak perlu (huruf loncat-loncat, bendera berkibar-kibar), ada juga yang presentasi seperti membaca hafalan tanpa sekalipun eye-contact dengan pendengar. Sebaliknya, ada juga presentasi yang disajikan amat menarik, efektif, mampu berkomunikasi dengan audience, kadang diselingi humor, sehingga mampu meraih perhatian pendengarnya.

Cara yang mudah untuk menilai presentasi kita adalah dari pertanyaan yang diajukan. Presentasi yang menarik, akan memancing banyaknya pertanyaan dan komentar dari pendengar, walau komentar yang bersifat kontra/serangan balik sekalipun. Sebaliknya, kalau tidak ada pertanyaan sama sekali dari pendengar, berarti presentasi kita gagal, penelitian kita tidak menarik, atau membosankan (pendengar mungkin ingin agar sesi kita cepat selesai untuk beralih ke pembicara berikutnya).

Saat masih kuliah dulu, saya kurang memikirkan pentingnya mempelajari teknik presentasi agar ide kita bisa terkomunikasikan kepada thought-collective. Minggu yll. professor di lab. saya (Prof. Hasegawa) menyampaikan rangkuman beliau ttg. tips-tips dalam presentasi penelitian. Rangkuman tsb. bersumber dari artikel di Bio Nikkei business bulan November 2001, dan dimodifikasi berdasarkan pengalaman beliau sebagai peneliti di bidang medical imaging.

 

7 tips agar anda sukses dalam presentasi

Point 1 : Untuk meyakinkan pendengar, jangan memilih cara inkonvensional (tidak lazim), tapi sampaikan presentasi yang “berisi” agar bisa difahami oleh pendengar.

Hal yang sangat penting dalam memberikan presentasi, adalah kemampuan persuasi dari materi yang disajikan. Hindarkanlah memakai trik atau cara inkonvensional yang kurang perlu, agar tidak mengurangi reliability dari materi yang disampaikan. Jika pendengar presentasi anda terdiri dari para ekspert, presentasi yang bersifat “menyerang”, “straight”, “smash” lebih efektif. Sebalikya, jika cara presentasi anda terlalu bertele-tele, berakibat menurunnya konsentrasi ekspert pendengar yang berusaha memahami penelitian anda. Untuk meningkatkan reliability, tidak ada jalan lain kecuali meningkatkan mutu dari materi yang dipresentasikan. Untuk itu, sebelum melakukan presentasi, diperlukan kerja keras untuk memilih, merangkai materi yang akan disajikan.

Baca entri selengkapnya »

Ditulis dalam research | 55 Komentar »