Mengenal sekilas teknologi Intelligent Character Recognition

from: http://tipemilu2009.wordpress.com/

penulis:
Oskar Riandi, M.Eng, Amien Rusdiutomo, M.Eng, Agus Nugroho, M.Sc, Anto Satriyo Nugroho, Dr.Eng

1. Teknologi ICR dalam Pemilu 2009

Tidak lama lagi, bangsa Indonesia akan melaksanakan pemilihan umum pada 9 April 2009. Menjelang hari H, berlangsung diskusi cukup hangat di masyarakat mengenai pemakaian Intelligent Character Recognition (ICR), perangkat lunak yang baru mulai dipakai pada Pemilu 2009 ini. Pemakaian ICR ini sudah ditetapkan dalam Peraturan Komisi Pemilihan Umum No. 02 tahun 2009, tentang Pedoman Pengadaan dan Pengelolaan Perangkat Teknologi Informasi untuk Penyelenggaraan Pemilihan Umum Tahun 2009 [1]. Tujuan utama yang ingin dicapai dengan penggunaan mesin pemindai yang berbasis ICR tersebut adalah:

  1. mempercepat proses perhitungan suara
  2. memperoleh tabulasi yang akurat
  3. memperoleh salinan dokumen elektronik yang otentik dan teramankan
  4. transparan dalam mendukung fungsi pengawasan langsung oleh masyarakat.

Sejak penandatanganan MoU kerjasama BPPT dan KPU pada 12 Maret 2009 yll. tim Review TI BPPT bekerja keras melakukan review dan supervisi teknologi informasi yang diterapkan di KPU. Termasuk di dalamnya upaya yang dilakukan dalam melakukan standarisasi aplikasi ICR, agar output dari ICR ini dapat diintegrasikan dengan baik dengan sistem secara keseluruhan. Dalam artikel ini akan dijelaskan teknologi ICR, kelebihan dan kelemahannya, bagaimana alur proses pengisian data di daerah hingga penayangannya pada tabulasi nasional. Dijelaskan pula upaya yang dilakukan oleh tim review Teknologi Informasi BPPT dalam melakukan standarisasi aplikasi ICR yang akan dipakai dalam tabulasi nasional pemilu 2009.

2. Apakah ICR itu ?

ICR adalah singkatan Intelligent Character Recognition, yaitu sistem ”cerdas” yang mampu mengenali tulisan tangan dan menterjemahkannya kedalam kode atau simbol digital yang ”dimengerti” (diedit, disimpan) oleh komputer. Sebuah piranti lunak ICR pada prinsipnya terdiri dari 4 bagian: preprocessing, character segmentation, character recognition dan post processing, sebagaimana ditampilkan pada Gambar 1 [1].

Gambar 1 Alur proses dalam sebuah sistem ICR

  1. Preprocessing
    Bagian pertama mengimplementasikan berbagai teknik dalam pengolahan citra untuk meningkatkan kualitas gambar agar mudah diolah oleh tahap berikutnya. Proses itu antara lain thresholding, konversi gray-scale ke binary black-white, noise removal, dsb.
  2. Character segmentation
    Bagian ini bertugas menganalisa sebuah citra text hasil scanning, menemukan lokasi text dan mengekstrak huruf per huruf untuk diolah pada tahap character recognition.
  3. Character recognition
    Bagian ini terdiri dari feature extraction dan classification. Feature extraction bertugas menemukan informasi signifikan dari citra sebuah huruf dan merepresentasikannya dalam vektor fitur (feature vector). Vektor ini kemudian diolah oleh classifier untuk menentukan kategori (jenis huruf). Berbagai metode classifier telah dikembangkan dalam bidang pengenalan pola (pattern recognition) sejak puluhan tahun yang lalu. Antara lain artificial neural network (jaringan saraf tiruan), support vector machine (SVM), maupun metode statistika yang lain.
  4. Post processing
    Bagian terakhir melakukan evaluasi terakhir untuk melakukan koreksi otomatis sekiranya terjadi kesalahan dalam pengenalan huruf yang dilakukan pada tahap 3.

Dari sisi teknologi, sebenarnya ICR bukanlah hal yang baru. Riset mengenai character recognition telah berpuluh tahun digali di dunia komputasi, khususnya pattern recognition (pengenalan pola) dan image processing (pengolahan citra). Bagi peneliti pattern recognition, masalah character recognition seolah menjadi masalah klasik untuk mencoba berbagai metode feature extraction maupun classifier yang mereka kembangkan. Teknologi ini dapat dikatakan telah mencapai maturity, dimana umumnya penelitian telah dapat menekan rasio error hingga kurang dari 1% (akurasi 99%) [3][4]. Di sisi industri, teknologi ICR telah diimplementasikan dalam berbagai produk komersial. Misalnya untuk membaca alamat pos yang diimplementasikan di United States Postal Service (USPS) [5], Bank check recognition [6], dan facsimile produksi Sanyo yang mampu membaca tulisan tangan nomer facsimile, dan langsung men-dial secara otomatis ke tujuan [7]. Dapat dikatakan bahwa teknologi ini telah matang dan potensi aplikasinya sangat tinggi.

3. Kelebihan dan Kelemahan ICR

Tiap teknologi memiliki kelebihan dan kekurangan masing-masing. Kelebihan ICR terhadap berbagai metode lain dalam data entry seperti OMR (Optical Mark Recognition) misalnya, terletak pada kemampuannya
(i)mempermudah pekerjaan operator
(ii) efisiensi biaya kertas yang diperlukan
Mempermudah di sini dimaksudkan lebih mudah bagi seseorang untuk menuliskan sebuah angka dengan baik, dibandingkan mengisi form OMR dengan mencontreng atau menghitamkan sebuah pilihan dari berbagai pilihan yang tersedia, sebagaimana saat ujian nasional, UMPTN, dsb. Apalagi dengan mempertimbangkan stamina dan kondisi petugas lapangan yang mungkin dalam kondisi lelah saat mengisi formulir. Dari sisi efisiensi, biaya pengadaan kertas dapat ditekan jauh menjadi lebih murah. Pada pemilu kali ini, formulir C1-IT terdiri dari 8 lembar yang memuat isian untuk seluruh parpol. Apabila memakai formulir khusus OMR, banyaknya halaman akan sesuai dengan jumlah parpol, karena data 1 parpol memerlukan 1 halaman OMR. Misalnya jumlah parpol 38, maka diperlukan 38 halaman [8]. Namun demikian, bukan berarti ICR bebas resiko. Apabila akurasi ICR terlalu rendah, preprocessing dan segmentasinya tidak akurat, mengakibatkan beban operator untuk melakukan verifikasi menjadi berat, sehingga tidak efektif. Dapat disimpulkan bahwa dari sisi akurasi, OMR lebih menjanjikan daripada ICR, tetapi ICR lebih unggul dari sisi biaya pengadaan kertas maupun resiko error yang timbul karena kondisi psikis di lapangan.

4. Alur Pengisian Data di KPUD Kabupaten/Kota hingga penayangannya pada tabulasi nasional


Gambar 2 Alur pemrosesan form C1-IT dari KPUD Kabupaten Kota ke KPU Pusat

Gambar 2 memperlihatkan alur bagaimana data yang diisikan pada formulir C1-IT di KPUD Kabupaten dapat ditayangkan pada tabulasi nasional. Pertama-tama formulir C1-IT yang telah diisi akan dipindah (scan). Citra hasil pemindaian tersebut akan dibubuhkan watermark, sehingga terjamin otentisitasnya. Maksudnya, setiap ada upaya ilegal untuk mengubah citra tsb. akan selalu diketahui, sehingga citra tersebut kelak dapat menjadi bukti hukum yang sah apabila ada masalah timbul di belakang hari. Setiap formulir C1-IT terdiri dari 8 lembar, sehingga total diperoleh 8 buah citra. Selanjutnya citra hasil pemindaian tersebut akan dibaca oleh ICR, dikonversikan menjadi simbol angka berupa kode ASCII. Hasil baca ini selanjutnya diverifikasi oleh operator. Apabila ada kesalahan baca, operator akan memperbaiki kesalahan tersebut. Setiap modifikasi yang dilakukan akan selalu tercatat dalam sebuah log file. Setelah error tidak ditemukan lagi, file disimpan pada struktur direktori tertentu. Keseluruhan file tsb. saat disimpan telah dalam kondisi terenkripsikan (tersandikan) sehingga isinya tidak dapat dibaca oleh pihak yang tidak diinginkan. File elektronik ini selanjutnya dikirimkan ke pusat lewat jaringan khusus yang disebut VPN (Virtual Private Network). Karena pengiriman ini lewat VPN, bukan lewat jaringan internet biasa, diharapkan akan handal terhadap upaya vandalisme terhadap data tsb. Setelah sampai di Data Center KPU Pusat, file tersebut akan diekstrak, didekripsikan, validasi dan diperiksa otentisitasnya, baru kemudian dikelola dalam pusat penyimpanan data. Data inilah yang kemudian ditayangkan di internet, sehingga proses perhitungan suara dapat dipantau secara transparan oleh semua pihak.

5. Apakah yang harus dilakukan agar ICR bekerja optimal ?

Dari uraian di atas jelas terlihat bahwa ICR ini berada pada ujung tombak sistem TI yang digunakan. Keberhasilan tabulasi nasional sangat bergantung pada keberhasilan ICR dalam membaca data yang dituliskan pada formulir C1-IT. Mengingat pentingnya peran ICR dalam sistem TI Pemilu 2009, perangkat lunak itu harus memenuhi 4 aspek:

  1. Tepat
    yaitu sesuai dan mampu mengolah format C1-IT, sehingga terjaga interoperabilitasnya dengan sistem yang lain
  2. Akurat
    memiliki ”kecerdasan” yang tinggi, maksudnya mampu membaca dengan akurat tulisan tangan angka pada formulir C1-IT. Secara sederhana dapat diilustrasikan demikian. Sebuah ICR yang memiliki akurasi 95% akan beresiko salah baca 5 dari 100 angka, sehingga operator hanya mengoreksi 5 angka saja. Adapun ICR yang memiliki akurasi 80% berpotensi salah baca 20 dari 100 angka, sehingga operator harus mengoreksi 20 angka atau 4 kali lipat. Apabila jumlah TPS ratusan atau ribuan, upaya koreksi ini akan berlipat ganda dan akan memberatkan operator.
  3. Aman
    yaitu terjamin keamanannya secara berjenjang pada saat data dibuat, disimpan sampai penayangannya di tabulasi nasional. Karena itulah dipasang berlapis-lapis pengamanan seperti watermark dan enkripsi.
  4. Cepat
    instalasi, setting dan kemudahan antarmuka (userfriendly interface) akan membuat pekerjaan operator menjadi lebih cepat dan ringan.

6. Standarisasi ICR

Sejak dibentuk lewat MoU BPPT-KPU pada 12 Maret 2009, tim review BPPT berupaya membuat standar ICR, agar dapat diolah oleh bagian Sistem Integration, untuk dikirim, diolah dan ditampilkan pada tabulasi nasional [9]. Standar ICR ini merupakan penjabaran teknis dari spesifikasi yang ditetapkan pada Peraturan Komisi Pemilihan Umum No. 02 tahun 2009 [1]. Setiap vendor yang ingin menjual produk ICR nya harus memenuhi kriteria standar tersebut, agar hasilnya dapat diterima dan diolah oleh sistem yang dibangun di KPU. File standar ICR tersebut dapat didownload dari sini [9].

7. Penutup

Pemilu 9 April 2009 memanfaatkan teknologi Intelligent Character Recognition (ICR). Dari sisi teknologi, ICR sebenarnya sudah lama dikembangkan dan telah sampai ke level yang mature. ICR telah dipakai dalam berbagai aplikasi industri. Tujuan pemakaian ICR dalam pemilu ini adalah untuk memperoleh hasil yang cepat, akurat, aman, citra yang dapat dipakai sebagai bukti otentik, dan transparan dalam mendukung fungsi pengawasan langsung oleh masyarakat.

8. Referensi

  1. Peraturan Komisi Pemilihan Umum No. 02 tahun 2009, tentang Pedoman Pengadaan dan Pengelolaan Perangkat Teknologi Informasi untuk Penyelenggaraan Pemilihan Umum Tahun 2009.
  2. R. Plamondon, S.N. Srihari: “Online and Off-line Handwriting Recognition: A Comprehensive Survey”, IEEE Trans. Pattern Analysis & Machine Intelligence
  3. Yann LeCun, Corinna Cortes: The MNIST Database of handwritten digits : http://yann.lecun.com/exdb/mnist/ (diakses 19 Maret 2009)
  4. Ranzato Marc’Aurelio, Christopher Poultney, Sumit Chopra and Yann LeCun: “Efficient Learning of Sparse Representations with an Energy-Based Model”, in J. Platt et al. (Eds), Advances in Neural Information Processing Systems (NIPS 2006), MIT Press, 2006
  5. S.N. Srihari and E.J. Keubert: “Integration of Handwritten Address Interpretation Technology into the United States Postal Service Remote Computer Reader System”, Proc. of Fourth Int’l Conf. Document Analysis and Recognition, Vol.2, pp.892-896, Ulm, Germany, Aug, 1997
  6. G.Dimauro, S.Impedovo, G.Ppirlo, and A. Salzo, “A Multi-Expert Signature Verification System for Bankcheck Processing,” Int’l Journal on Pattern Recognition and Artificial Intelligence, Vol.11, No.5, pp.827-844, 1997
  7. H. Kawajiri, Y. Takatoshi, T. Junji, A.S. Nugroho and A. Iwata : Hand-written Numeric Character Recognition for Facsimile Auto-dialing by Large Scale Neural Network CombNET-II, Proc. of 4th.International Conference on Engineering Applications of NeuralNetworks, pp.40-46, June, 10-12, 1998 Gibraltar
  8. Bambang Edhi Leksono S, Hemat Dwi Nuryanto: “Laporan Kegiatan Konsultasi Sistem Informasi Pemilihan Umum November-Desember 2008”, Komisi Pemilihan Umum, Jakarta 14 Januari 2009
  9. Tim Review TI KPU : Standar dan Kriteria Piranti Lunak ICR (Intelligent Character Recognition), ver 2.0 – 090320, 20 Maret 2009,
    Addendum1

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City.Since 2015, I was appointed as Program Director of R&D activities in Intelligent Computing Laboratory (former name: Digital Signal Processing Laboratory). The activities in the laboratory are organized into three groups : (i) Natural Language Processing (ii) Multimodal biometrics Identification (iii) ICT solution for Tropical Disease. I also enjoy to teach the students, as a part time lecturer in Swiss German University Serpong & UNS Sebelas Maret Surakarta. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di research. Tandai permalink.

5 Balasan ke Mengenal sekilas teknologi Intelligent Character Recognition

  1. Akhmad Syarwani berkata:

    terima kasih banyak Pak, saya ingin mendalami character recognizer,tulisan bapak membuat saya termotivasi kembali untuk mencari ide penerapannya dibidang lain.

  2. Joannes berkata:

    wow! tulisan bapak membuat saya semakin tertarik untuk membuat skripsi tentang hal ini, karena kebetulan saya sedang berputar-putar dengan topik. terima kasih.

  3. Perkenalkan, nama saya Taufik, salah satu mahasiswa Teknik Informatika IT Telkom angkatan akhir.

    saat ini saya sedang berupaya untuk membuat TA mengenai ICR. namun, saya masih sedikit bingung mengenai perbedaan antara OCR dengan ICR. apakah bapak dapat menjelaskan dengan detil mengenai hal ini?

    kemudian, apakah saya dapat menerapkan penggabungan metode Principal Component Analysis (PCA) sebagai future extraction dan Learning Vector Quantization (LVQ) sebagai main classifiernya?

    Terimakasih sebelumnya.

  4. Donie berkata:

    kaya nya pernah liat artikel ini… dimana ya…

  5. %Taufik
    Sebenarnya dulu, baik handwriting maupun printed semua disebut dengan OCR. Tetapi akhir-akhir ini orang membedakan OCR untuk printed characters, sedangkan ICR untuk handwriting characters. Disebut “intelligent” karena dianggap cerdas, mampu mengenali tulisan tangan yang demikian bervariasi.
    Gabungan antara PCA dan LVQ bisa saja dicoba, tetapi harus hati-hati terutama pada penerapan PCA. PCA waktu dipakai untuk mereduksi dimensi data, akan beresiko mengorbankan discriminative features, sehingga non linearity dari data akan hilang. Kalau tujuannya untuk reduksi dimensi (seperti image, signal processing) PCA memang sering dipakai. Tetapi kalau untuk klasifikasi, akan ada resiko spt di atas.

    %Donie
    Mungkin di situs yang URL tertulis di bagian paling atas artikel ini: http://tipemilu2009.wordpress.com/

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s