Book Reading : Pattern Matching (Chap 8 of Bioinformatics Computing)

Tugas malam ini adalah “mengunyah” Chap 8 buku Bryan Bergeron “Bioinformatics Computing”, yang membahas mengenai pattern matching. Isi dari bab ini sebenarnya mengenai aplikasi pattern matching di bioinformatika, yaitu pada sequence alignment (pairwise & multiple). Urutan buku Bryan memang agak lain dengan buku bioinformatika yang lain. Umumnya, topik sequence alignment ini diletakkan di bagian awal, tetapi di buku Bryan topik ini dibahas di bagian mendekati akhir. Sayang buku ini tidak dilengkapi dengan slide-slide pendukung. Saya sudah kontak ke Dr. Bergeron, dan dijanjikan akan dikirimi file-file gambar yang dipakai dalam buku beliau.

Point-point penting :

  1. Tantangan terbesar penerapan pattern matching di bioinformatika adalah pada masalah waktu. Bagaimana menemukan matched pattern dari database skala besar dalam waktu yang singkat, dengan memakai hardware yang “terjangkau”.
  2. Tujuan utama dari sequence alignment adalah inferring homologi dan fungsi.
    1. Dua buah sequence yang memiliki bagian yang mirip, berarti kemungkinan besar mereka homolog.
    2. Jika sequence protein atau suatu molekul matched dengan sequence sebuah protein yang struktur dan fungsinya sudah diketahui, kemungkinan keduanya memiliki struktur atau fungsi yang sama.
  3. Sering ada kerancuan antara “homology” dan “similarity” of sequences. Hal ini juga disitir di buku D.W.Mount (p.72), bahwa banyak literatur biologi molekuler yang membuat kesalahan dengan memakai istilah “homology” untuk hal yang sebenarnya dimaksudkan dengan “similarity” of sequences. Definisinya demikian:
    1. Homology antara dua buah sequence bermakna bahwa mereka berasal dari moyang yg sama (common ancestor) pada proses evolusi
    2. Sequence similarity dimaksudkan dengan level kemiripan nucleotide atau polypeptide dua buah sequence
  4. Ada tiga metode utama dalam Pair-wise Sequence Alignment :
    1. Dot matrix Analysis
    2. Dynamic Programming Algorithm
    3. Word atau k-tuple methods, yang diimplementasikan pada FASTA & BLAST
  5. Ada kesalahan tulis di buku ini, yaitu pada halaman 307. Sequence G) salah ketik ! Kalau sequence G) dikoreksi, alignment score-nya mestinya berubah menjadi 7.5 (13 alignments, 4 gaps dengan penalty score -0.5, dan 7 inexact matches dengan penalty score -0.5).
  6. Ada kesalahan lagi, dan ini fatal ! Page 323, Fig.8-11, bagian (3) dan (4). Dalam penjelasan Dynamic Programming, score yang dianalisa pada bagian di atas tidak sesuai dengan formula yang didefinisikan oleh Smith-Waterman (page 322). Aduh aduh aduuuh….fatal benar kesalahannya, Oom (^^;   Penjelasan yang benar adalah sebagaimana ditulis D.W Mount di buku “Bioinformatics : Sequence & Genome Analysis”, Fig.3.10. Capek deeh…bobok dulu aja (12.43 am). Entar disambung lagi habis sahur.
Iklan

Tentang Anto Satriyo Nugroho

My name is Anto Satriyo Nugroho. I am working as research scientist at Center for Information & Communication Technology, Agency for the Assessment & Application of Technology (PTIK-BPPT : Pusat Teknologi Informasi & Komunikasi, Badan Pengkajian dan Penerapan Teknologi). I obtained my doctoral degree (Dr.Eng) from Nagoya Institute of Technology, Japan in 2003. My office is located in Serpong, Tangerang Selatan City. My research is on pattern recognition and image processing with applied field of interests on biometrics identification & development of computer aided diagnosis for Malaria. Should you want to know further information on my academic works, please visit my professional site at http://asnugroho.net
Pos ini dipublikasikan di biomedical eng. & bioinformatics, research. Tandai permalink.

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s