Bagaimana mencari huruf A pada suatu citra ?

Dari diskusi di milis sc-ina@yahoogroups.com

saya mau tanya.. untuk deteksi suatu pola dalam gambar pakai metode apa ya? misalkan mencari sebuah huruf “A” dalam suatu gambar. untuk pengenelan huruf saya masih bisa lakukan dengan JST jika dalam satu gambar hanya ada satu huruf dan luasan gambar seukuran huruf. tapi kalo gambarnya kompleks saya bingung cara mendeteksinya…mohon pencerahannya.. =)

Masukan saya:

Untuk kasus yg pertama “jika dalam gambar hanya ada satu huruf” itu relatif mudah. Luasan gambar tidak seukuran huruf pun relatif mudah proses segmentasinya.

Untuk kasus kedua : ada huruf A dalam gambar yang kompleks, hal ini perlu didefinisikan lebih jelas lagi. “Kompleks” di sini bagaimana maksudnya ? Kemudian, apakah huruf A itu hanya satu saja, ataukah
membentuk kata/kalimat, misalnya papan bertuliskan “Gambir” yang tertulis pada stasiun Gambir.

  1. Jika formulasi masalahnya adalah menemukan sebuah huruf A diantara berbagai object (mobil, bangunan, dsb), tahapannya bisa saja demikian:
    1. color reduction
      Ruang vektor yg dibentuk oleh RGB 24 bit terlalu besar. Untuk mereduksinya bisa dengan memakai memakai dua bit pertama dari tiap color band (sehingga diperoleh 6 bit sbg. ganti 24 bit) diikuti dengan single-link clustering, agar warna yg mirip disatukan. Dengan demikian, hanya warna yg signifikan berbeda
      saja yg diperoleh, sehingga proses komputasi lebih mudah.
    2. multivalued image decomposition
      image akan didekomposisi ke berbagai image atas dasar warnanya (asumsinya huruf A itu warnanya tunggal, misalnya merah semua, biru semua, dsb. Bukan tersusun dari warna yg kompleks/campuran)
    3. connected component extraction
      bagian yg terkoneksi akan diekstrak, termasuk di dalamnya huruf A
    4. object identification
      tahap ini baru mungkin bisa memakai classifier (e.g. neuro) untuk mengidentifikasikan apakah object yg diekstrak itu huruf A atau bukan (mobil, orang, atau object lain)
  2. Jika formulasi masalahnya adalah mengenali tulisan berupa kata atau kalimat (misalnya pada surat kabar, atau papan bertuliskan “Gambir” pada contoh di atas), maka cara no.1 kurang tepat dan computational cost-nya tinggi. Lebih baik memanfaatkan sifat spatial cohesion yang dibentuk oleh deretan huruf itu.

Umumnya huruf romawi (A, B, …, Z) terdiri dari satu connected component. Semua segmen huruf-nya bersambung sehingga saat diekstrak akan membentuk satu kesatuan. Kasusnya jadi sulit jika hurufnya multi-segment seperti misalnya huruf Jepang/Cina. Satu huruf Jepang/Cina kadang tersusun dari lebih 16 segmen yang terpisah satu sama lain, sehingga connected component dari sebuah huruf umumnya lebih dari satu. Dalam hal ini perlu strategi khusus -melibatkan proses recognition- untuk mengidentifikasikan apakah sekumpulan connected component itu membentuk sebuah huruf atau tidak. Riset saya dulu mengenai kasus yg terakhir, memakai huruf Jepang sbg. object.

Untuk referensinya silakan baca di:

  1. A.K.Jain, B.Yu, “Automatic Text Location in Images and Video Frames”, Pattern Recognition, Vol.31, No.12, pp.2055-2076, 1998
    Komentar: skema yg saya jelaskan di atas saya ambil dari paper Jain ini. Mereka mengaplikasikan metodenya untuk a.l. video indexing, web search & color image database.
  2. V.Wu, R.Mamantha, E.M. Riseman,”TextFinder: An automatic system to detect and recognize text in images”, IEEE Trans. on Pattern Analysis & Machine Intelligence, Vol.21, No.11, pp.1224-1339, Nov.1999
  3. Kalau paper saya mengenai studi ini:
    A.S. Nugroho, S. Kuroyanagi, A. Iwata: An algorithm for locating characters in color image using stroke analysis neural network, Proc. of the 9th International Conference on Neural Information Processing (ICONIP’02), Vol.4, pp.2132-2136, November 18-22, 2002, Singapore
    Tahun lalu saya presentasikan di e-kolokium milis sc-ina, bisa didownload dari arsip : http://tech.groups.yahoo.com/group/sc-ina/files/

    Sebenarnya niatnya ingin diaplikasikan untuk mendesain alat bantu tuna netra. Tapi nggak saya lanjutkan, karena banting stir, ganti tema riset ke bioinformatika.

Semoga bermanfaat.

Anto S. Nugroho, Dr.Eng
https://asnugroho.wordpress.com

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City.Since 2015, I was appointed as Program Director of R&D activities in Intelligent Computing Laboratory (former name: Digital Signal Processing Laboratory). The activities in the laboratory are organized into three groups : (i) Natural Language Processing (ii) Multimodal biometrics Identification (iii) ICT solution for Tropical Disease. I also enjoy to teach the students, as a part time lecturer in Swiss German University Serpong & UNS Sebelas Maret Surakarta. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di neuro, research. Tandai permalink.

4 Balasan ke Bagaimana mencari huruf A pada suatu citra ?

  1. miftahulmunir berkata:

    Wow. Baca judulnya aja saya udah berkunang-kunang. Ada yang bahasa indonesia pak?

  2. eca indika ratih berkata:

    salam kenal pak..
    pak saya bisa minta referensi ttg JST hopfield?
    kl ada yang versi indonesia ya pak..he..he..
    sy maw angkat judul skripsi ttg itu…untuk pengenalan huruf pak…
    makasih sebelumnya

  3. SIUMA berkata:

    JST HOPFIELD itu apaan ya

  4. Frederick berkata:

    Bapak saya mau tanya.Pada saya mengerjakan tugas akhir di mana pengenalan tulisan tangan menggunakan jaringan propagasi balik khusus untuk kata,yang ingin saya tanyakan,bagaimana mensegementasi huruf-huruf pada kata tersebut??terimakasih,mohon bimbingannya

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s