Tanya Jawab e-kolokium di milis sc-ina@yahoogroups.com (2)

1. Yudi

Mas Anto,

Saya ada dua pertanyaan:

  1. Dari uraian Mas Anto pertama kali, penelitian ini memang tidak ada pembanding ya, karena memang ide baru. Ada gak kira-kira kemungkinan metode lain yang bisa digunakan untuk memecahkan permasalahan serupa. Dan bagaimana kira-kira perbandingan dengan metode yang diterapkan di penelitian yang diulas ini.
  2. Ada gak pengembangan lebih lanjut dari penelitian ini seperti penerapan untuk bisa digunakan dalam membaca surat kabar/majalah atau buku, yang jumlah karakternya relatif lebih banyak atau mungkin digunakan untuk membaca handwriting dalam bentuk Kanji.

Thanks,
Yudi

2. Anto S. Nugroho

Mas Yudi dan rekan-rekan yth.
Maaf, saya terlambat menjawab pertanyaan, karena baru saja pulang dari dinas. Langsung ke hal yg ditanyakan :

> 1. Dari uraian Mas Anto pertama kali, penelitian ini memang tidak ada
> pembanding ya, karena memang ide baru. Ada gak kira-kira kemungkinan
> metode lain yang bisa digunakan untuk memecahkan permasalahan serupa.
> Dan bagaimana kira-kira perbandingan dengan metode yang diterapkan di
> penelitian yang diulas ini.

Saya amati di berbagai paper, umumnya mereka tidak membuat perbandingan antara satu metode dengan yang lain. Mungkin karena fase segmentasi ini sangat tergantung kepada bagaimana peneliti tsb. melakukan problem setting. Metode sangat spesifik dg. kondisi yang diasumsikan. Sehingga metode yang satu tidak mudah dibandingkan dengan metode yang lain, karena asumsinya berbeda. Metode saya memakai asumsi hurufnya multisegmen, dan berasal dari scene image. Dalam scene image, huruf mungkin tidak terlalu banyak jumlahnya. Kalau diterapkan kepada citra hasil scanning sebuah halaman koran berbahasa Jepang, metode saya tidak akan berhasil baik. Dalam hal ini, lebih baik dipakai algoritma segmentasi yang dikhususkan kepada citra dengan karakteristik demikian.

Berbeda halnya dengan tahap character recognition. Masalahnya seragam, sehingga kita bisa melakukan komparasi berbagai metode feature extraction, maupun classifier terhadapnya.

> 2. Ada gak pengembangan lebih lanjut dari penelitian ini seperti
> penerapan untuk bisa digunakan dalam membaca surat kabar/
> majalah atau
> buku, yang jumlah karakternya relatif lebih banyak atau mungkin
> digunakan untuk membaca handwriting dalam bentuk Kanji.

Kalau saya pribadi, sudah tidak melanjutkan lagi penelitian ini. Tetapi di beberapa kesempatan conference, saya pernah lihat penelitian yang sistemnya dipakai untuk mengenali tulisan object yang diambil
gambarnya memakai kamera pada handphone. Dalam hal ini, proses segmentasi dibuat menjadi lebih mudah, karena user memfokuskan kamera HP itu secara manual kepada object yang memiliki tulisan.

Kalau untuk majalah, surat kabar, dsb. sudah banyak riset character segmentation mengenai hal ini. Tokohnya kalau di Jepang adalah Prof. Yasuaki Nakano. Situsnya di
http://www.u-pat.org/das08/nakano/profile.html
Saat akses ke situs tsb. saya baru tahu, kalau beliau belum lama ini telah wafat.

Kalau riset di bidang character recognition, mungkin sudah tidak terlalu ramai seperti 10 atau 20 tahun yll. Yang sekarang mungkin menarik, adalah recognition untuk huruf yang kualitasnya buruk. Sistem yg dibangun nantinya bisa diaplikasikan untuk OCR, kertas-kertas yang sudah agak kotor, kumuh, tua dsb. Salah satu peneliti di bidang ini yg saya tahu, adalah Prof. Hiroshi Murase (Nagoya University),
http://www.murase.nuie.nagoya-u.ac.jp/index-en.html
dosennya mbak Lina, yang juga member milis ini.

Anto S. Nugroho

3. Yudi Agusta Bali

> Kalau riset di bidang character recognition, mungkin sudah tidak
> terlalu ramai seperti 10 atau 20 tahun yll. Yang sekarang mungkin
> menarik, adalah recognition untuk huruf yang kualitasnya buruk. Sistem
> yg dibangun nantinya bisa diaplikasikan untuk OCR, kertas-kertas yang
> sudah agak kotor, kumuh, tua dsb. Salah satu peneliti di bidang ini yg
> saya tahu, adalah Prof. Hiroshi Murase (Nagoya University),
> http://www.murase.nuie.nagoya-u.ac.jp/index-en.html
> dosennya mbak Lina, yang juga member milis ini.

Ini mungkin sangat berguna sekali untuk diterapkan di Indonesia. Karena di Indonesia, yang berbeda jauh sekali dengan Jepang, kondisi lingkungannya cenderung lebih humid, kotor dan kertas OCR yang sudah
terisi sering mengalami kerusakan sebelum masuk proses scanning dilakukan.

Di Indo, sudah ada yang menelitinya gak ya?

Regards,
Yudi
4. Anto S. Nugroho

Saya belum pernah dengar, mas. Sebenarnya bisa kita buat kompetisi yang dikaitkan dengan sebuah seminar, dimana nanti hasil riset itu bisa dipertandingkan pada seminar tsb. Untuk datanya bisa nanti kita
kita buat sendiri, atau minta izin ke museum untuk membuat scanning dari dokumen yang kualitasnya buruk.

Sepertinya kompetisi riset seperti ini belum populer di Indonesia. Padahal bisa jadi salah satu tema untuk tugas akhir mahasiswa.

Anto S. Nugroho

5. Denny Hermawanto

hasil riset dipertandingkan dalam seminar? belum pernah denger itu di Indonesia. Seperti Open Challenge ya… Mungkin nggak ya hal tersebut diadakan di Indonesia? Atau SC-INA mau jadi frontier nya? 🙂
6. Philips Kokoh Prasetyo

Pak Anto,
sedikit komentar tentang kompetisi. Kalo lihat dari konference2 di luar negeri, sepertinya kompetisi riset seperti ini merupakan salah satu cara paling ampuh untuk menarik interest banyak pihak. Netflix Challenge (http://www.netflixprize.com/) merupakan salah satu contoh kompetisi yang menarik banyak pihak untuk setidaknya menjajal pendekatan mereka untuk menyelesaikan masalahnya. Kompetisi dari x-prize (http://www.xprize.org/) juga. Banyak yang tertarik menyelesaikan masalahnya. Mungkin salah satu
sebabnya problem dan goalnya udah jelas. Tinggal aplikasikan pendekatan-pendekatan yang akan digunakan untuk menyelesaikannya.

7. M. Rahmat Widyanto

Terima kasih Pak Anto, Pak Yudi dan teman2 lain yg telah memeriahkan e-kolokium Pak Anto ini. Kami persilahkan kepada teman2 lain untuk bertanya dan berdiskusi mengenai tema character recognition ini.

FYI jadwal e-kolokium Pak Anto akan berakhir akhir minggu ini jadi sd Minggu, 2 Sept 2007 (CMIIW).

Terima kasih,

Moderator E-kolokium Pak Anto

8. Anto S. Nugroho

Benar, Philips. Kalau di bidang yg sedang saya presentasikan sekarang, kompetisinya diselenggarakan tiap tahun http://www.icdar2007.org/competition.html
Kebetulan ini sekaligus menjawab pertanyaan mas Yudi sebelumnya. Salah satu tema kompetisi tahun ini adalah segmentasi tulisan tangan.
http://www.iit.demokritos.gr/~bgat/HandSegmCont2007/
Biasanya para peneliti mengikuti kompetisi seperti ini bukan karena mengejar uang hadiah, tetapi karena semangat keilmuannya. Apalagi dengan mengikuti kompetisi, kita tidak perlu repot-repot mencari data,
dan bisa memakai data yg disediakan panitia untuk riset yg lebih lanjut.

Anto S. Nugroho

9. Peb Ruswono Aryan

Salam,
Topik riset kami di ITB tahun 2007 tentang document image recognition. Arahan ke depannya adalah ke document image understanding. adapun topik utama yang menjadi agenda riset untuk tahun ini adalah tentang pengenalan karakter. sejauh ini yang diekplorasi masih seputar karakter cetak (machine
printed). sebelumnya pernah juga diekplorasi untuk hand-printed (pada kasus tes psikologi yang menulis digit terakhir jumlah angka) namun persentase kesuksesannya kami anggap kurang signifikan sehingga tidak dipublikasikan.

sedangkan untuk machine-printed kami telah mencoba untuk berbagai dokumen dalam berbagai aplikasi pembacaan karakter:
– dokumen teks hasil scan
– plat nomor kendaraan
– angka meteran (odometer)

dari kasus-kasus tersebut yang menyebabkan hambatan yang cukup menyulitkan adalah latar belakang yang kompleks (scene image), serta segmentasi karakter yang tidak sempurna (karakter pecah atau menempel) akibat kualitas citra yang sangat jauh dari ideal (kabur, pencahayaan, dll).

selain tentang pengenalan karakter, kami juga mencoba menerapkan teknik segmentasi untuk aplikasi medik diantaranya segmentasi kromosom dan tes komet (pemeriksaan kerusakan DNA).

pendekatan soft-computing yang digunakan dalam riset kami sampai saat ini masih sejauh JST, belum mengeksplorasi tentang topik lain seperti fuzzy, evolutionary, dll.

setuju sekali dengan pendapat pak Anto tentang pembuatan kompetisi di bidang ini. saya percaya bidang ini akan memberikan manfaat jangka pendek dan jangka panjang di Indonesia.

Peb Ruswono Aryan
http://pebbie.net
http://pebbie.wordpress.com

10. Yudi Agusta

Nambahin dikit.

Di samping kompetisi, kita juga harus memikirkan bagaimana hasil penelitian yang masuk kompetisi bisa disalurkan ke industri. Dari beberapa pengimplementasian yang pernah saya ikuti, teknologi OCR dan OMR (Optical Mark Recognition) yang digunakan termasuk softwarenya banyak diimpor dari negara luar.

Mungkin kita harus mulai mengintegrasikan penelitian, pendiseminasian penelitian dan pengimplementasian penelitian ke industri secara komprehensif. Karena saya rasa teknologi seperti ini masih dalam jangkauan kita.

Presentasi-presentasi pengimplementasian seharusnya tidak hanya diikuti oleh vendor-vendor negara luar. Vendor dalam negeri dengan teknologi ciptaan sendiri rasanya masih bisa ikut bersaing.

Regards,
Yudi

11. Peb Ruswono Aryan

Salam,

Saya yakin teknologi OCR dan OMR masih dalam jangkauan kita Pak Yudi. hal ini diperkuat dengan riset Mark Recognition yang saat ini sudah digunakan oleh masyarakan luas dengan nama DMR (Digital Mark Reader). Bahkan produk serupa (kompetitor) pun juga sudah mulai banyak. untuk teknologi OCR sepertinya hanya masalah menunggu waktu saja.

12. Denny Hermawanto

Pak Yudi, maaf ikutan nimbrung: kalau menurut pendapat saya mungkin saja hal itu dikarenakan masyarakat di Indonesia masih menganggap software produk buatan luar negeri selalu lebih baik dari produk hasil buatan dalam negeri. Tingkat kepercayaan masyarakat terhadap hasil software produk anak bangsa masih kurang sehingga masyarakat lebih memilih menggunakan software produk buatan luar negeri (walaupun harus dengan membajak). Padahal mungkin saja teknologi yang dipakai sama atau bahkan lebih baik dari produk luar negeri tersebut, cuma berbeda cara mengemasnya menjadi sebuah produk.

Salam,

Denny

13. Saflis

Ass.w.w

Permasalahan Utama pattern recognition seperti dikemukakan pak Anto adalah Segmentation…
Dengan karakter source image yang tidak jau berubah2 maka segmentation tidak akan kesulitan dalam menemukan jawabannya..

Maksud saya dengan karakter image yg tidak jauh berubah adalah.. misalnya posisi plat mobil… posisinya memiliki kemungkinan besar ditengah sedikit ke bawah.. sedangkan untuk karakter image2 yang beruba-ubah segmentation mesti dikembangkan lagi… misalnya papan iklan dimana letak karakter akan
berubah-ubah… seperti yang dijelaskan dalam blog pak Anto, tapi disana lebih berat lagi L huruf kaji as a image?? Tapi Denger2 sejarahnya emang gitu.. hehehe..

Salam kenal smua..

thanks

14. Anto S. Nugroho

Kalau akan bergerak ke komersialisasi, untuk teknologi-nya saya rasa kita mampu mengerjakannya. Yang paling sulit justru penyediaan database-nya. Walaupun database untuk character recognition banyak tersedia, tetapi database tsb. tidak bisa dipakai untuk keperluan komersial. Mereka hanya boleh dipakai untuk keperluan akademik.

Riset saya saat S2 dulu salah satunya adalah handwriting katakana recognition, untuk dipasang di facsimile. Kami bekerja sama dengan SANYO. Untuk database-nya mereka membuat sendiri, discan satu per satu, disegmentasi. Untuk mendapatkan hasil yg baik, tentunya datanya harus banyak. Ribuan sampel. Dan ini sudah project yang cukup besar. Saya sempat kebagian tugas membosankan : mengecek satu persatu kualitas huruf yang ditulis, dan melakukan kategorisasi terhadapnya. Paper yg pernah dipublikasikan adalah numeral recognition
H. Kawajiri, Y. Takatoshi, T. Junji, A.S. Nugroho and A. Iwata : Hand-written Numeric Character Recognition for Facsimile Auto-dialing by Large Scale Neural Network CombNET-II, Proc. of 4th.International Conference on Engineering Applications of NeuralNetworks, pp.40-46,
June 10-12,1998, Gibraltar (dapat didownload dari asnugroho.net)

Sedangkan untuk huruf katakana, tidak dipublikasikan, karena pihak SANYO menghentikan kerjasama penelitian tsb., karena pergantian atasan. Ganti bos, ganti policy 😀

Saya kira hal ini difikirkan kalau kita akan bergerak ke arah komersialisasi riset OCR.

Anto S. Nugroho

15. Budi Santosa

Apakah ada pengusaha kita (wirausahawan) yang mau investasi utk R&D hingga jadi produk komersial?
Biasanya pengusaha kita lbh suka jadi pedagang, lbh cepat menuai untung. Itu salah satu sebab kita selalu jadi pemakai produk asing.
salam’
Budi

Iklan

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City. My research is on pattern recognition and image processing with applied field of interests on biometrics identification & development of computer aided diagnosis for Malaria. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di neuro, talk & seminars. Tandai permalink.

2 Balasan ke Tanya Jawab e-kolokium di milis sc-ina@yahoogroups.com (2)

  1. arifrahmat berkata:

    Paradigma yang diungkapkan Pak Budi Santosa mungkin saat ini memang dominan di masyarakat, tetapi kami berani mengacungkan diri untuk menjadi yang berbeda.
    Kami (yang berawal) dari Digital Mark Reader (DMR) menyatakan berkomitmen untuk berinvestasi bagi riset dan pengembangan produk perangkat lunak yang diharapkan memiliki nilai komersial dan nilai sosial yang tinggi.

  2. farkhan berkata:

    apakah saya bisa mengajukan beasiswa selain monbukagakusho,terus terang saja orang tua saya kurang mampu untuk membiayai kuliah saya,,,,,,,
    tetapi saya bersungguh2 ingin kuliah di jepang….
    mohon dibantu kakak senior…

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s