Corat-coret Anto S. Nugroho

Paper survey, Trip Report, Summary

Seminar Bioinformatika di Tokyo University (22 Desember 2005)

Ditulis oleh Anto Satriyo Nugroho di/pada Februari 5, 2006


Pada tanggal 22 December 2005, saya mengikuti seminar komunitas bioinformatika yang diselenggarakan di Tokyo University. Seminar ini merupakan seminar gabungan SIG-IPSJ (Information Processing Society of Japan) dan JSBI (Japanese Society of Bioinformatics). Bagi SIG-IPSJ, seminar ini adalah yang ke-3, sedangkan bagi JSBI adalah seminar ke-7. Dalam seminar tersebut dipresentasikan 14 penelitian, yang dapat terbagi ke dalam 4 kelompok : (1) Sequence & Structure Analysis (2) Pathway and database (3) Expression Analysis (4) Text Mining.

Bagian (1) mewadahi tema penelitian yang mengolah deretan asam amino dan kaitannya dengan struktur/fungsi protein. Pada tema ini, 3 penelitian dipresentasikan. Pendekatan yang dipakai adalah machine learning, yaitu metode yang performanya diperbaiki secara bertahap, berdasarkan performa yang dicapai sebelumnya. Artificial Neural Network, Support Vector Machine, Hidden Markov Model merupakan contoh beberapa metode machine learning yang popular. Target penelitian ini antara lain memprediksi struktur RNA, menemukan protein yang memiliki kemiripan interaksi berdasarkan profile situs interaksi antara protein dan compound complex, dsb.

Bagian kedua berusaha menemukan network yang menggambarkan interaksi antara molekul protein yang tersuruk di dalam ribuan data. Salah satu peneliti dari Osaka University menjelaskan metode untuk mengekstrak conserved subnetwork pada metabolic network memakai profile filogenetik.

Bagian ketiga mengolah signal aktifasi gen yang diamati dengan DNA microarray. Dengan jumlah sekitar 32 ribu, ekspresi gen memberikan informasi dalam dimensi yang sangat tinggi. Jika metode konvensional mengamati aktifitas gen secara individual, maka DNA microarray adalah terobosan teknologi baru yang memungkinkan pengamatan ekspresi ribuan gen secara simultan. Pendekatan yang dipakai antara lain memakai teori graph untuk memprediksi struktur operon berdasarkan profile ekspresi gen.

Bagian keempat adalah pendekatan bioinformatika dari sisi Natural Language Processing dan Datamining. Riset dilakukan untuk mengolah ribuan abstrak journal yang didokumentasikan di situs Medline, PubMed dsb. Situs Medline misalnya pada tahun 2003 dilaporkan memuat 12 juta abstrak. Jika satu abstrak terdiri dari 200 kata, maka jumlah kata yang terekam pada Medline sekitar 2.4 milyar. Suatu jumlah yang fantastis. Text mining dalam bioinformatika memfokuskan penelitiannya dalam mengolah data abstrak dan mempresentasikannya dalam bentuk informasi yang terstruktur. Salah satu hasil yang ingin dicapai adalah mengekstrak informasi interaksi antar gen yang memiliki relevansi dengan penyakit tertentu. Salah satu kendala adalah terminology yang dipakai pada abstrak biasanya sangat teknis, dan tidak mudah difahami oleh peneliti dengan bidang yang berlainan seperti NLP misalnya. Untuk itu telah dirintis pengembangan corpus, ontology, kamus, seperti GENIA Project yang dibuat di Tokyo University. Ada 3 jenis corpus yang dikembangkan di Genia : Technical Term, Part-of-Speech dan Treebank. Technical Term misalnya memfokuskan pada anotasi substansi dan lokasi biologis yang berkaitan dengan reaksi protein, dalam format XML. Saat ini Genia Corpus berisikan 2000 abstrak, yang diseleksi dengan keyword : human, blood cells, dan transcription factors. Penelitian lain adalah mengekstrak protein functional site information dari literature penelitian

2 Tanggapan ke “Seminar Bioinformatika di Tokyo University (22 Desember 2005)”

  1. Dommy Asfiandy berkata

    Saya sangat tertarik untuk mengetahui lebih jauh tentang bioinformatika tetapi masih bingung harus memulai dari mana..Mungkin anda mempunyai saran referensi yg bisa saya pelajari..Mohon bantuan dan bimbingannya..Terima kasih..

  2. asnugroho berkata

    Pak Dommy Asfiandy yth.
    Buku referensi bioinformatics yang direkomendasikan sebagai salah satu yg terbaik adalah karangan David W. Mount : Bioinformatics: Sequence and Genome Analysis. Silakan lihat di http://www.bioinformaticsonline.org/
    Ada beberapa artikel pengantar mengenai tema bioinformatika dalam bahasa Indonesia, yang dapat didownload dari situs ilmukomputer.com. Untuk diskusi dengan rekan-rekan peminat bidang ini, silakan bergabung di Himpunan Bioinformatika Indonesia http://groups.yahoo.com/group/ilmukomputer-bioinformatika
    Salam,

Tinggalkan Balasan

XHTML: Anda dapat gunakan tag ini: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <pre> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>