Apa sebenarnya fungsi OCR ?

Hari ini salah seorang murid saya bertanya: Pak, apa sebenarnya fungsi OCR (Optical Character Recognition) ? Saya jawab, OCR itu piranti lunak yang mampu mengkonversikan huruf dari format citra (image) menjadi simbol. Citra huruf tersusun dari pixel (disederhanakan) hitam di atas background putih dengan susunan tertentu, sedangkan simbol huruf adalah kode huruf tersebut -misalnya- dalam ASCII yang difahami oleh komputer. OCR berfungsi mengolah input berupa pixel, menterjemahkannya ke dalam simbol ASCII. Kalau sudah direpresentasikan dalam deretan kode ASCII, maka kita bisa men-select, copy, paste, searching dsb. Tetapi bila masih dalam bentuk gambar, kita tidak bisa melakukan operasi di atas. Karena itu adakalanya dokumen pdf yang kita punya bisa di-select (berarti symbol-based), tapi adakalanya tidak bisa diselect (karena image), adakalanya bisa dilakukan pencarian kata kunci tertentu (kalau sudah symbol based), dan adakalanya tidak bisa dilakukan pencarian (kalau masih berupa image). Dokumen pdf yang berupa gambar itu biasanya berasal dari hasil pemindaian terhadap dokumen dalam bentuk kertas, kemudian di-save ke pdf. Dokumen pdf yang berupa text, biasanya berasal dari dokumen asli yang di-“save as” format pdf.

Perbedaan antara image vs symbol ini bisa dicontohkan sebagai berikut. Misalnya ada tulisan dalam huruf Cina. Orang yang tidak faham bahasa Cina, akan mengingat huruf itu berupa gambar dalam ingatannya. Sedangkan orang yang mampu baca tulis huruf Cina, akan mengingatnya sebagai simbol, yaitu huruf pada urutan tertentu di antara ribuan huruf Cina, yang memiliki makna tertentu. Menyimpan informasi dalam bentuk symbol, jauh lebih efisien daripada menyimpannya dalam bentuk image. Untuk menyimpan “gambar huruf A”, diperlukan -misalnya- image berukuran 8×8 pixel. Kalau 1 pixel direpresentasikan dalam 1 bit (hitam vs putih), diperlukan 64 bit atau 8 byte. Tetapi symbol A dalam ASCII code direpresentasikan dalam 1 byte. Dengan demikian, bisa dikompres sehingga menjadi 8 kali lebih kecil. Satu lembar dokumen berisi text yang dipindai, kemudian di-save sebagai pdf, biasanya ukurannya lebih besar daripada jika dokumen itu saat dibuat (misalnya diedit memakai MS Word), disave sebagai pdf. Yang pertama menyimpan “gambar”, yang kedua menyimpan “simbol”.

Kalau berbicara ke character recognition secara umum, contoh aplikasi dari teknologi character recognition ini bisa dipakai juga untuk video indexing. Bayangkan kalau ada film, kemudian scene yang menampilkan huruf direcognize semua, kita bisa mencari bagian scene mana dalam video tersebut, menit keberapa,  yang -misalnya- menampilkan nama stasiun “Gambir”

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City.Since 2015, I was appointed as Program Director of R&D activities in Intelligent Computing Laboratory (former name: Digital Signal Processing Laboratory). The activities in the laboratory are organized into three groups : (i) Natural Language Processing (ii) Multimodal biometrics Identification (iii) ICT solution for Tropical Disease. I also enjoy to teach the students, as a part time lecturer in Swiss German University Serpong & UNS Sebelas Maret Surakarta. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di kuliah, research. Tandai permalink.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s