BIOLOGI ONLINE

blog pendidikan biologi

FOTOSINTESIS

BAB I

PENDAHULUAN

  1. A.      Latar Belakang

Fotosintesis merupakan proses utama yang dilakukan oeleh tumbuhan. Sesuai dengan fungsinya yaitu mengolah bahan makanan menjadi energi. Tanpa adanya energy, semua makhluk hidup tidak dapat melakukan aktivitas. Oleh karena itu dapat dikatakan bahwa fotosintesis merupakan proses vital yang wajib terjadi pada tumbuhan.

Selain itu, hasil dari proses fotosintesis juga dimanfaatkan oleh makhluk hidup lain untuk menimbulkan energi pula. Sehingga, fotosintesis merupakan proses yang penting untuk dipelajari.

  1. B.   Tujuan
  2. Mengetahui proses-proses yang terjadi pada peristiwa fotosintesis.
  3. Mempelajari reaksi-reaksi yang terjadi peda proses fotosintesis.

  1. C.   Rumusan Masalah
    1. Apakah yang dimaksud dengan fotosintesis?
    2. Percobaan apa saja yang berhubungan dengan fotosintesis?
    3. Bagaimana proses fotosintesis?
    4. Faktor – faftor apa saja yang mempengaruhi fotosintesis?
    5. Apakah peran cahaya dalam fotosintesis

BAB II

PEMBAHASAN

 

  1. A.   Pengertian

Fotosintesis : Peristiwa penyusunan zat organik (gula)  dari zat anorganik          (CO2 dan H2O) dengan pertolongan energi cahaya.  Karena bahan baku yang digunakan adalah CO2 (zat karbon) maka fotosintesis dapat pula disebut asimiliasi karbon. Proses pembuatan makanan pada tumbuhan hijau dapat terjadi dengan bantuan:

  • sinar matahari,
  • air,
  • garam mineral yang diserap,
  • karbondioksida dari udara diubah menjadi zat makanan.

  1. B.      Percobaan yang Berhubungan dengan Fotosintesis
  2. Ingenhousz

Orang pertama yang melakukan penelitian adalah Jan Ingenhousz. Ia memasukkan Hydrilla verticillata dalam bejana yang berisi air. Bejana ditutup dengan corang terbalik dan diatasnya diberi tabung reaksi yang diisi air sampai penuh. Bejana tersebut diletakkan di terik matahari, kemudian muncul gelembung udara dari tumbuhan itu. Gelembung idara tersebut menandakan adanya gas yaitu oksigen. Ingenhousz menyimpulkan bahwa fotosintesis menghasilkan oksigen.

  1. T.W Engelmann

Ia melakukan percobaan dengan menggunakan alga spirogyra. Hanya kloroplas yang terkena cahaya yang mengeluarkan oksigen. Hal tersebut dibuktikan dengan banyaknya bakteri yang berkerumun di bagian kloroplas yang terkana cahaya. Sehingga disimpulkan bahwa:

  1. Fotosintesis dilakukan oleh kloroplas
  2. Kloroplas hanya berfotosintesis jika terkena cahaya.
  3. J.V. Sachs

Ia membuktikan bahwa fotosintesis menghasilkan amilum. Caranya, daun dibungkus kertas timah dan dibiarkan terkena cahaya matahari sejak pagi hingga sore. Kemudian daun tersebut direbus untuk mematikan sel-selnya. Kemudian daun tersebut dimasukkan dalam alcohol agar klorofilnya larut dan daun menjadi pucat. Kemudian ditetesi dengan iodine, sehingga bagian yang pucat tetap pucat sedangkan yang tidak tertutup berwarna biru kehitaman. Warna tersebut menandakan bahwa di daun terdapat amilum.

  1. Robert Hill

Hill membuktikan bahwa energi cahaya untuk memecah air (fotolisis), disebut reaksi terang yang terjadi di grana.

  1. Blackman

Blacman membuktikan bahwa reduksi karbon dioksida oleh H2 tanpa keterlibatan langsung dari cahaya, disebut reaksi gelap yang terjadi di stroma.

  1. C.            Proses Fotosintesis

Fotosintesis merupakan proses menggabungkan CO2, H2O menjadi gula dengan menggunakan energi cahaya dengan menggunakan organel yang disebut kloroplas.

Proses fotosintesis dibagi menjadi dua reaksi yaitu :

  1. Reaksi Terang

Reaksi terang merupakan langkah-langkah mengubah energy matahari menjadi energy kimia. Cahaya yang diserap oleh klorofil menggerakkan transport electron dan hydrogen dari air ke penerima ( aseptor ) yang disebut NADP+ yang berfungsi sebagai pembawa electron dalam respirasi seluler. Reaksi terang menggunakan tenaga matahari untuk mereduksi NADPmenjadi NADPH dengan cara menambahkan sepasang electron bersama dengan nucleus hydrogen atau H+. Reaksi terang juga menghasilkan ATP dengan memeberi tenaga bagi penambahan gugus fosfat yang pada ADP, proses ini disebut fotofosforilasi.

Reaksi terang terjadi di grana, persisnya di membran tilakoid. Reaksi terang menggunakan 2 fotosistem yang berhubungan. Fotosistem I menyerap cahaya dengan panjang gelombang 700 nm maka disebut P700, berfungsi untuk menghasilkan NADPH. Fotosistem II menyerap cahaya dengan panjang gelombang 680 nm maka disebut P680, berfungsi untuk membuat potensial oksidasi cukup tinggi sehingga bisa memecah air. Bila bekerja bersama, 2 fotosistem ini melakukan proses fotofosforilasi non-siklik yang menghasilkan ATP dan NADPH. Fotosistem I mentransfer elektron ke NADP+ untuk membentuk NADPH. Kehilangan elektron digantikan oleh elektron dari fotosistem II. Fotosistem II dengan potensial oksidasinya yang tinggi dapat memecah air untuk menggantikan elektron yang ditransfer ke fotosistem I. Kedua fotosistem ini dihubungkan oleh kompleks pembawa elektron yang disebut sitokrom/komplek b6-f. Kompleks ini menggunakan energi dari pemindahan elektron untuk memindahakan proton dan mengaktifkan gradien proton yang digunakan oleh enzim ATP sintase.

Saat pusat reaksi Fotosistem II menyerap foton, elektron tereksitasi pada molekul klorofil P680, yang mentransfer elektron ini ke akseptor elektron. P680 teroksidasi melepaskan elektron dari kulit terluar atom Mg. Atom Mg yang teroksidasi dengan bantuan enzim pemecah air, melepaskan elektron dari atom oksigen dari 2 molekul air. Proses ini membuat P680 menyerap 4 foton untuk melengkapi oksidasi 2 molekul air dan mengahsilkan 1 oksigen. Elektron yang tereksitasi dibawa oleh plastoquinon dan kemudian diterima oleh kompleks b6-f. Kehadiran elektron menyebabkan kompleks memompa proton ke celah tilakoid, kemudian elektron dibawa oleh plastosianin ke fotosistem I.

Pusat reaksi fotosistem I menyerap foton maka elektronnya tereksitasi. ”Lobang” yang ditinggal elektron segera ditempatin olek elektron dari Fotosistem II, sedangkan elektron yang tereksitasi tersebut ditanggap oleh ferredoxin. Ferredoxin tereduksi membawa elektron dengan potensial yang tinggi kemudian ditangkap oleh NADP+ untuk membentuk NADPH.Reaksi ini dikatalisasi oleh enzim NADPH reduktase. Enzim ATP sintase menggunakan gradien proton yang tercipta saat tranpor elektron untuk mensintesis ATP dari ADP + Pi.

  1. Reaksi Gelap

Reaksi gelap adalah reaksi pembentukan gula dari CO2 yang terjadi di stroma. Berbeda dengan reaksi terang, reaksi gelap atau reaksi tidak bergantung cahaya bisa terjadi pada saat siang dan malam, namun pada siang hari laju reaksi gelap tentu lebih rendah dari laju reaksi terang.

Reaksi gelap dimulai dengan pengikatan atau fiksasi 6 molekul CO2 ke 6 molekuk gula 5 karbon yaitu ribulosa 1,5 bifosfat, dikatalisis oleh enzim ribulosa bifosfat karboksilase/oksigenase(rubisco) yang kemudian membentuk 6 molekul gula 6 karbon. Molekul 6 karbon ini tidak stabil maka pecah menjadi 12 molekul 3 karbon yaitu 3 fosfogliserat. 3 fosfogliserat kemudian difosforilasi oleh 12 ATP membentuk 1,3 bifosfogliserat. 1,3 bifosfogliserat difosforilasi lagi oleh 12 NADPH membentuk 12 molekul gliseradehida 3 fosfat/PGAL. 2 PGAL digunakan untuk membentuk 1 molekul glukosa atau jenis gula lainnya, sedangkan 10 molekul lainnya difosforilasi oleh 6 ATP untuk kembali membentuk 6 molekul Ribulosa 1,5 bifosfat. Proses pengikatan CO2 ke RuBP disebut fiksasi, proses pemecahan molekul 6 karbon menjadi molekul 3 karbon disebut reduksi dan proses pembentukan kembali RuBP dari PGAL disebut regenerasi.
Fotosintesis ini disebut mekanisme C3, karena molekul yang pertama kali terbentuk setelah fiksasi karbon adalah molekul berkarbon 3. Kebanyakan tumbuhan menggunakan fotosintesis C3 disebut tumbuhan C3.

Untuk beberapa tumbuhan, mereka terpaksa melakukan fotosintesis dengan cara yang sedikit berbeda karena kondisi lingkungan. RuBP, alih-alih mengikat CO2, justru mengikat O2 sehingga berubah menjadi glikolat dan terurai. Proses ini disebut fotorespirasi. Saat fiksasi karbon, CO2 dan O2 berkompetisi untuk berikatan dengan RuBP. Pada kondisi normal bersuhu 25 C, 20% fiksasi karbon untuk fotosintesis hilang karena fotorespirasi. Kemungkinan makin meningkat saat kondisi panas, kering dan stomata menutup di siang hari untuk menyimpan air. Kondisi ini menyebabkan CO2 tidak bisa masuk dan O2 tidak bisa keluar sehingga terjadi fotorespirasi. Untuk menanggulangi hal tersebut, maka tanaman mengikatkan CO2 ke fosfoenolpiruvat(PEP), dikatalisis oleh PEP karboksilase dan membentuk senyawa 4 karbon, biasanya oksaloasetat. Mekanisme ini disebut mekanisme C4. Pengikatan ini terjadi disel mesofil. Oksaloasetat kemudian berubah menhadi malat yang memasuki sel seludang dan disanalah malat melepaskan CO2 untuk memulai siklus Calvin. Mala berubah menjadi piruvat yang keluar menuju sel mesofil, berubah menjadi PEP untuk berikatan lagi dengan CO2.

Reaksi Fotosintesis secara Umum

  1. D.      Faktor – Faktor yang Mempengaruhi Fotosintesis
    1. a.           Intensitas cahaya
      Laju fotosintesis maksimum ketika banyak cahaya.
    2. b.           Konsentrasi karbon dioksida
      Semakin banyak karbon dioksida di udara, makin banyak jumlah bahan yang dapt digunakan tumbuhan untuk melangsungkan fotosintesis.
    3. c.            Suhu
      Enzim-enzim yang bekerja dalam proses fotosintesis hanya dapat bekerja pada suhu optimalnya. Umumnya laju fotosintensis meningkat seiring dengan meningkatnya suhu hingga batas toleransi enzim.

      1. d.           Kadar air
        Kekurangan air atau kekeringan menyebabkan stomata menutup, menghambat penyerapan karbon dioksida sehingga mengurangi laju fotosintesis.
      2. e.            Kadar fotosintat (hasil fotosintesis)
        Jika kadar fotosintat seperti karbohidrat berkurang, laju fotosintesis akan naik. Bila kadar fotosintat bertambah atau bahkan sampai jenuh, laju fotosintesis akan berkurang.
      3. f.             Tahap pertumbuhan
        Penelitian menunjukkan bahwa laju fotosintesis jauh lebih tinggi pada tumbuhan yang sedang berkecambah ketimbang tumbuhan dewasa. Hal ini mungkin dikarenakan tumbuhan berkecambah memerlukan lebih banyak energi dan makanan untuk tumbuh.

  1. E.         Cahaya yang Berperan dalam Fotosintesis

  1. F.    Fotosistem

  • Kumpulan pigmen dan protein yang berasosiasi dengan membran tilakoid yang memanen energi dari elektron yang tereksitasi
  • Energi yang ditangkap ditransfer antara molekul fotosistem sampai mencapai molekul klorofil pada pusat reaksi
  • Pada pusat reaksi terdapat 2 molekul
    • Klorofil  a
    • Akseptor elektron primer
    • Pusat reaksi klorofil dioksidasi dengan hilangnya elektron melalui reduksi akseptor elektron primer
    • Terdapat fotosistem I dan  II

  1. G.     Aliran Elektron
    1. Terdapat dua rute jalur elektron yang tersimpan pada akseptor elektron primer
    2. Kedua jalur
  • Dimulai dengan penangkapan energi foton
  • Menggunakan rantai transport elektron dengan sitokrom untuk kemiosmosis
  1. Aliran elektron nonsiklik
  • Menggunakan fotosistem II dan I
  • Elektron dari fotosistem II dihilangkan dan diganti oleh elektron yang didonasikan oleh air
  • Mensintesis ATP dan NADPH
  • Donasi elektron mengkonversi air O2 dan 2H+

  1. Aliran elektron siklik
  • Hanya menggunakan fotosistem I
  • Elektron dari fotosistem I di-recycle

  1. Mensintesis ATP

  1. H.     Tanaman CAM dan C4
    1. Tanaman C4

Tanaman C4 meminimalkan keperluan fotorespirasi dengan cara menggabungkan CO2 ke dalam senyawa empat karbon di sel mesofil

  1. Tanaman CAM

Membuka stomatanya pada malam hari, menggabungkan CO2 ke dalam asam organik

Selama siang hari, stomata tertutup

–     CO2 dilepaskan dari asam organik untuk digunakan dalam siklus Calvin

  • Anatomi daun C4 dan jalur C4

  • Ø Jalur CAM mirip dengan jalur C4

BAB III

PENUTUP

  1. A.      Kesimpulan
    1. Fotosintesis : Peristiwa penyusunan zat organik (gula)  dari zat anorganik                (CO2 dan H2O) dengan pertolongan energi cahaya
    2. Percobaan yang berkaitan dengan fotosintesis:

ü  Ingenhousz

ü  T.W Engelmann

ü  J.V. Sachs

ü  Robert Hill

ü  Blackman

  1. Proses fotosintesis terdiri dari dua reaksi, yaitu reaksi gelap dan reaksi terang.
  2. Faktor yang mempengaruhi fotosintesis:

ü    Intensitas cahaya

ü    Konsentrasi karbon dioksida

ü    Suhu

ü    Kadar air

ü    Kadar fotosintat (hasil fotosintesis)

ü    Tahap pertumbuhan

  1. Peranan cahaya dalam fotosintesis adalah sebagai sumber energy ( foton ).

 

 

 

 

 

 

 

Iklan

10/28/2011 Posted by | Fisiologi Tumbuhan | Tinggalkan komentar

Teknologi Text-Mining untuk Pengembangan Ilmu Biologi sebagai Ilmu Interdisipliner di Masa Depan

Marselina Tando, NIM 13506100

Program Studi Teknik Informatika

Sekolah Teknik Elektro dan Informatika

Institut Teknologi Bandung

Jln. Ganesha no. 10 Bandung 40132

Indonesia

email: se_tan_303@yahoo.co.id, if16100@students.if.itb.ac.id

 


Abstrak Pesatnya pertumbuhan repositori data teks menyulitkan orang-orang untuk mengakses informasi yang dibutuhkan dengan cara yang nyaman dan efektif. Permasalahan ini muncul sebagai dampak banyaknya informasi yang terintegrasi dalam teks yang kurang terstruktur. Akibatnya, komputer tidak dapat melakukan interpretasi dengan mudah. Dalam makalah ini, disajikan ulasan mengenai teknik text-mining dalam peranannya untuk menjawab kebutuhan masa depan dalam hal penyediaan informasi yang bermanfaat dan mudah diakses oleh khalayak umum. Sebagai contoh bidang aplikasi, dibahas mengenai ilmu biologi, sebagai salah satu ilmu interdisipliner yang memilki tingkat kompleksitas cukup tinggi dan tengah mengalami perkembangan pesat pada dekade ini. Contoh aplikasi langsung yang dibahas adalah mengenai pembuatan hipotesis dan pembuatan sistem ekstraksi informasi dan penjawaban query biologi. Pengembangan lebih lanjut dari konsep ini dapat diterapkan pada bidang keilmuan lainnya.

Kata Kunci: text-mining, ekstraksi informasi, ontologi, ekstraksi relasi, data mining,

 

1. PENDAHULUAN

 Era informasi telah mengakibatkan usaha penyimpanan data elektronik dalam jumlah yang sangat besar menjadi sulit untuk dilakukan. Perkembangan teknologi yang memungkinkan penemuan, pengembangan, dan pertukaran informasi dalam waktu yang cepat menimbulkan permasalahan yang sama pada repositori data : berlebihnya beban data yang harus disimpan. Hal ini juga menjadi masalah tersendiri bagi pengguna informasi, yaitu sulitnya untuk menemukan informasi yang benar-benar berguna dalam waktu yang singkat dan cara yang nyaman [3].

Biologi merupakan salah satu ilmu pengetahuan interdisipliner yang mengalami perkembangan pesat. Literatur, data, dan informasi yang berkaitan dengan biologi beserta cabang-cabangnya, seperti biosistem, biomedik, biologi molekular, dan bioinformatika, mengalami pertumbuhan secara kuantitas dengan persentase sekitar 10% setiap tahunnya. Bidang dengan kompleksitas tinggi ini menjadi salah satu area riset urtama dalam kurun waktu dua dekade terakhir [1].

Text mining menjadi kunci penting untuk menjawab permasalahan di masa depan mengenai pengaksesan informasi yang bermanfaat dengan jumlah data yang terus mengalami peningkatan. Sebagai contoh aplikasi, akan diulas mengenai pembuatan hipotesis dan sistem ektraksi informasi serta penjawaban query biologi [2].

                Dalam makalah ini, diterapkan sistematika sebagai berikut. Bagian pertama akan membahas pendahuluan, yaitu mengenai latar belakang dan sistematika penulisan makalah. Selanjutnya, akan dibahas mengenai penelitian terkait yang telah dilakukan sebelumnya. Di bagian berikutnya, akan dijelaskan mengenai tahap-tahap yang digunakan dalam text mining. Pada bagian keempat, akan dibahas mengenai aplikasi text mining dalam biologi sebagai ilmi interdisipliner. Sebagai penutup, akan disajikan kesimpulan dan arah pengembangan di masa depan yang diperoleh dari review makalah.

2. PENELITIAN TERKAIT

Dalam bagian ini dipaparkan mengenai penelitian-penelitian yang telah dilakukan sebelumnya. Pada bagian 2.1 dibahas mengenai penelitian yang telah dilakukan sebelumnya terkait dengan identifikasi entitas biologi, sedangkan pada bagian 2.2 dibahas mengenai penelitian yang telah dilakukan sebelumnya terkait dengan ekstraksi relasi biologis. Kedua penelitian tersebut memiliki peran penting dalam menyiapkan data setengah-jadi yang kemudian akan diolah lebih lanjut dengan teknik text mining untuk memperoleh informasi yang dibutuhkan.

2.1 Penelitian Terkait Identifikasi Entitas Biologi

Ekstraksi informasi dari suatu dokumen biologi sangat tergantung pada identifikasi entitas biologi dalam dokumen itu sendiri. Pada awalnya, proses identifikasi entitas dan pemberian tag masing-masing dilakukan secara manual. Namun, dengan perkembangan literatur teks dan data yang sangat pesat, tidak memungkinkan lagi untuk melakukannya secara manual. Beberapa pendekatan yang telah dilakukan dapat diklasifikasikan sebagai berikut [2].

(i)                   Pendekatan rule-based

Pendekatan ini menggunakan karakteristik morfolojik dan informasi Part-Of-Speech serta kata kunci untuk memberikan tag pada sebuah nama.

(ii)                 Pendekatan dictionary-based

Pendekatan ini melakukan identifikasi terhadap nama gen atau protein dengan melakukan pencocokkan terhadap entry dalam kamus, baru kemudian memberikan tag  tertentu.

(iii)                Pendekatan machine-learning-based

Teknik machine-learning  seperti Hidden Markov Model, Naive Bayes, dan Support Vector Machine telah berhasil diaplikasikan untuk membantu identifikasi nama entitas protein atau gen.

(iv)               Analisis statistik

Analisis statistik dilakukan untuk melakukan clustering terhadap abstrak dan melakukan identifikasi kata kunci yang terdapat dalam abstrak. Identifikasi term dan metode klasifikasi berdasarkan pembelajaran statistik ini secara umum dapat menangani tipe pengetahuan baru melakukan representasi dengan lebih efektif daripada pendekatan dengan rule-based dan dictionary-based.

(v)                 Pendekatan hibrid

Pendekatan hibrid memadukan pendekatan rule-based dan dictionary-based untuk identifikasi gen atau protein yang terdiri dari banyak kata. Walaupun hasil yang dicapai dengan metode ini cukup memuaskan, namun permasalahan sinonim tak spesifik belum dapat ditangani sepenuhnya.

2.2. Penelitian Terkait Ekstraksi Relasi Biologi

Meskipun identifikasi entitas dari teks telah cukup membantu untuk mendapatkan informasi lebih lanjut, namun inferensi terhadap isi dokumen membutuhkan lebih dari sekedar identifikasi entitas. Konteks dari entitas dalam sebuah dokumen dapat diturunkan dari analisis relasi antar-entitas dalam dokumen. Penelitian mengenai relasi ini sangat membantu dalam penerapan sistem ekstraksi informasi dan penjawaban query biologi yang akan dibahas lebih lanjut pada bagian selanjutnya. Beberapa pendekatan yang telah digunakan untuk melakukan ekstraksi relasi antraa lain sebagai berikut [2].

(i)                   Pendekatan co-occurence-based

Dengan pendekatan ini, setelah entitas biologi diekstrak dari dokumen, relasi diantaranya kemudian diturunkan dengan asumsi bahwa 2 entitas dalam kalimat atau abstrak yang sama dinyatakan berhubungan. Negasi dalam teks tidak diperhitungkan.

(ii)                 Pendekatan linguistic-based

Pendekatan ini umumnya menggunakan teknik shallow parsing untuk mengetahui lokasi kata kerja atau kata benda dalam suatu dokumen. Rule dikembangkan secara spesifik untuk mengekstrak kata-kata latar dari term yang didefinisikan sebelumnya dan memformatnya sebagai relasi.

(iii)                Pendekatan campuran

Pendekatan campuran ini dapat berupa mekanisme unsupervised learning untuk melakukan ektraksi relasi dari konsep ilmu tertentu. Sebagai contoh, dilakukan ekstraksi relasi antara konsep dalam biologi molekular dari abstrak jurnal MEDLINE yang merupakan bagian dari corpus GENIA [2]. Untuk tiap kalimat yang mengandung 2 entitas biologi, graf berarah dibuat untuk menunjukkan ketergantungan antara kedua entiti tersebut berdasarkan analisis linguistik. Meskipun akan terdapat banyak graf berarah dari ekstraksi awal corpus, hanya beberapa graf signifikan saja yang akan diidentifikasikan sebagai relasi biologi.

3. TAHAP-TAHAP DALAM TEXT-MINING

Jika proses data mining melakukan penemuan pengetahuan dari data yang sifatnya terstruktur, maka text mining menemukan dan melakukan ekstraksi pengetahuan dari data yang tidak terstruktur. Text mining melibatkan 3 aktivitas utama : (i) temu-balik informasi, yang mengumpulkan teks-teks yang relevan dengan kebutuhan, (ii) ekstraksi informasi, yang mengidentifikasi dan mengekstrak beberapa tipe spesifik dari informasi yang dicari, dan (iii) data mining, yang menemukan asosiasi antara potongan-potongan informasi yang diekstrak dari beberapa teks berbeda [1].

3.1    Tahap Temu-Balik Informasi

Tahap temu-balik informasi merupakan aktivitas untuk menemukan dokumen yang dapat menjawab kebutuhan informasi dengan menggunakan bantuan indeks. Hampir seluruh komputer pada saat ini menggunakan sistem temu-balik informasi secara frekuentif, seperti mesin pencari GoogleTM. Para pengguna yang memanfaatkan jasa mesin pencari ini harus menghadapi permasalahan yang sama : membaca dokumen yang sangat banyak untuk kemudian menemukan fakta yang dan menentukan apakah infornasi yang dibutuhkan terdapat di dalamnya.

Selain mesin pencari untuk tujuan yang tidak spesifik, telah banyak pula terdapat perangkat temu-balik informasi yang telah didesain secara spesifik untuk melakukan query terhadap basis data penerbit jurnal-jurnal yang berkaitan dengan ilmu tertentu. Beberapa contohnya antara lain sebagai berikut Textpresso, Query Chem, iHOP, dan PubMatrix [1].

3.2 Tahap Ekstraksi Informasi

Untuk melakukan identifikasi dan tabulasi dari fakta yang berada pada dokumen dalam kuantitas sangat besar, ekstraksi informasi merupakan teknologi yang sangat relevan untuk menjawab kebutuhan tersebut. Tujuan akhir dari aplikasi teknologi ini adalah untuk melakukan ekstraksi informasi dari teks tanpa mensyaratkan end-user perlu membaca  teks. Ekstraksi informasi dapat digunakan untuk mendukung layanan temu-balik fakta atau sebagai tahapan dalam melakukan text mining berbasiskan teks konseptual.

Gambar 2 Pemrosesan teks tak terstruktur menjadi teks terstruktur dengan teknik text mining

Term merupakan kunci untuk melakukan spesialisasi berdasarkan bidang ilmu karena merupakan penanda entitas biologi dalam dokumen. Sayangnya, penamaan entitas biologi ini tergolong cukup rumit dikarenakan ketidakakuratan dan inkonsistensi [1]. Variansi dari sebuah term harus dapat diidentifikasi, diindeks, dihubungkan, dan dipetakan ke basis data dan ontologi biologi yang sangat banyak. Ontologi sendiri merupakan konsep yang memegang peranan penting dalam text miningkarena konsep ini menyediakan interpretasi semantik terhadap teks serta membatasi interpretasi yang mungkin dari entitas biologi (Gambar 1) [4].

Penamaan entitas biologi merupakan tahap pertama dari ekstraksi informasi (Gambar 2). Tahapan ini bergantung pada pengenalan term secara otomatis, yang mengekstrak term dari koleksi dokumen dan memberikan label sebuah term tertentu. Mayoritas dari pendekatan yang dilakukan dalam konteks biologi adalah melakukan integrasi antara identifikasi dan klasifikasi term dalam satu tahap. Beberapa pendekatan tel2ah dibahas secara singkat pada bagian penelitian terkait, yaitu pendekatan rule-based, dictionary-based, dan machine-learning-based.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Setelah dilakukan identifikasi entitas biologi, teks kemudian dibagi-bagi menjadi token, untuk mengidentifikasi batas-batas dari kata dan kalimat, yang kemudian dilanjutkan dengan pemberian tag

(part-of-speech tagging). Pemberian tag ini merupakan aktivitas memberikan label seperti noun untuk kata benda, verb untuk kata kerja, dan adjective untuk kata sifat pada term dalam dokumen. Analisis sintaks kemudian dilakukan untuk menentukan potongan tekstual dari sebuah kalimat (Gambar 3).

Gambar 3 Part-of-Speech Tagging

3.3 Tahap Data Mining

Tahap data mining digunakan untuk menemukan asosiasi yang tidak ditemukan sebelumnya dari antara fakta-fakta yang telah diekstrak oleh tahapan sebelumnya. Tahap ini merupakan tahapan yang membungkus integrasi antara text mining dan data mining. Kebanyakan teknik data mining yang diterapkan pada biologi menggunakan asumsi bahwa data yang ada merupakan data biologi yang telah terstruktur dengan baik, tidak seperti data tekstual tak terstruktur yang digunakan dalam teknik text mining. Data tekstual tak terstruktur yang telah digunakan untuk meningkatkan performansi hasil PSI-BLAST (position spesific iterated BLAST), dan pencarian homolog sekuensial telah berhasil mengintegrasikan text mining dengan data mining untuk keperluan klasifikasi fungsional berbasis sekuens dari protein dengan menggunakan metode supervised machine-learning. Akan tetapi, karena cluster tersebut masih relatif sedikit yang melalui tahap validasi, text mining masih digunakan sebagai satu tahapan maju dari clustering ekspresi gen dan menginterpretasikan cluster tersebut melalui asosiasi dengan literatur dari penerbit.

 

4. TEXT-MINING DALAM BIOLOGI SEBAGAI ILMU INTERDISIPLINER

 

4.1 TEXT MINING DALAM PEMBUATAN HIPOTESIS

Biologi merupakan salah satu contoh bidang ilmu yang menunjukkan pergeseran kecenderungan pengetahuan sains dari cara berpikir yang digerakkan oleh hipotesis ke arah cara berpikir terintegrasi yang bersifat holistik, yaitu memadukan hipotesis dengan data. Data mengenai ilmu pengetahuan interdisiplin seperti biologi dapat ditemui dalam bentuk yang sangat beragam, seperti data terstruktur yang berasal dari basis data, data eksperimen, atau bahkan data tak terstruktur yang berasal dari teks bebas. Jumlah data tekstual yang bersifat tak terstruktur mengalami peningkatan yang sangat pesat hingga sangat sulit untuk menemukan pengetahuan dan membuat hipotesis sains tanpa penggunaan teknologi akstraksi pengetahuan, yang sangat bertumpu pada teknik data mining.

Dalam disiplin ilmu dengan data yang melimpah namun kurang berisi dalam hal hipotesis di dalamnya (seperti data gen fungsional dan biomedik), metode sains deduktif sulit untuk dipertahankan karena tidak dapat memberikan perkembangan terakhir dari ilmu pengetahuan tertentu dengan cepat. Untuk itu, pada saat ini penemuan pengetahuan dengan metode induksi yang digerakkan oleh data mengalami perkembangan yang pesat. Ciri khas metode ini adalah rapid mining kandidat hipotesis dari literatur-literatur, yang kemudian diuji dan divalidasi secara subsekuens dengan data eksperimen yang tersedia [1].

Dengan metode tersebut dapat dibuat koneksi antara beberapa argumen yang nampak terpisah dan tidak memilki korelasi apapun. Beberapa koneksi dari jurnal-jurnal dan informasi penerbit MEDLINE yang dibuat dengan metode ini antara lain sebagai berikut: (i) keterhubungan antara penyakit migraine dan defisiensi magnesium, yang telah divalidasi secara subsekuens melalui eksperimen, (ii) keterhubungan antara indomethacin dan gangguan Alzheimer, (iii) serta keterhubungan antara Curcuma longa dan gangguan retina. Dengan menggunakan teknik yang sama pula dan dengan berdasar kepada bukti literatur, dapat diberikan saran mengenai pemberian thalidomide untuk penanganan beberapa penyakit, seperti hepatitis C kronis dan gangguan pankreas akut [1].

Pembuatan hipotesis dengan text mining dilakukan berdasarkan fakta bahwa kemungkinan adanya keterhubungan atau asosiasi antara entitas atau fakta yang terpisah satu sama lain dapat terjadi. Kemungkinan-kemungkinan ini dimunculkan dan dipadukan dengan data-data yang ada, sehingga dapat menghasilkan informasi yang berguna.

4.2 TEXT MINING DALAM SISTEM EKSTRAKSI INFORMASI DAN PENJAWABAN QUERY BIOLOGI

Untuk memperoleh pemahaman yang lebih mendalam mengenai sistem ekstraksi informasi biologi ini, dibahas secara spesifik mengenai salah satu contohnya, yaitu BIEQA : Biological Information Extraction and Query Answering. BIEQA secara khusus dirancang untuk menerima teks atau dokumen biologi yang telah diberikan tag secara ontologis sebagai input dan melakukan ekstraksi dari informasi tersebut mengenai relasi yang menghubungkan dua konsep biologi dalam teks tersebut. Relasi hasil ekstraksi digunakan untuk membantu pengguna melakukan ekstraksi informasi dari dokumen teks dengan cara yang lebih efisien. Sistem ini dibuat khusus dengan menggunakan corpus ontologi GENIA dan bersifat spesifik untuk jurnal-jurnal yang ada dalam basis data penerbit MEDLINE.

Beberapa aspek unik dari BIEQA antara lain sebagai berikut.

(i)   Sistem menggunakan pendekatan yang mengintegrasikan pemrosesan bahasa alami dan teknik pencocokan pola untuk memperoleh seluruh relasi biologi yang terdapat dalam sebuah corpus. Sistem telah dirancang untuk bekerja dengan koleksi abstrak di mana entitas biologinya telah diberi tag sesuai dengan konsep ontologinya, bersama dengan ontologi yang menjadi input. Hal ini menginisiasi pattern mining dengan rangkaian konsep ontologi untuk mengekstrak relasi biologi di dalamnya.

(ii) Relasi biner yang telah diekstrak kemudian direpresentasikan dalam bentuk triplet berurut <Ci, R, Cj>, di mana Ci dan Cj merupakan konsep biologi dan R merupakan relasi biologi yang diperoleh dari corpus. Seluruh relasi diasosiasikan dengan nilai keanggotaan fuzzy, berdasarkan frekuensi relatif kemunculan relasi. Seluruh relasi didefinisikan pada level konseptual untuk memudahkan deskripsinya.

(iii)              Seluruh informasi relevan, seperti nama entitas biologi dan kategori biologisnya, serta  relasi biologi dan kemunculannya, seluruhnya dikumpulkan dalam sebuah basis data pengetahuan yang terstruktur. Basis pengetahuan ini kemudian diindeks berdasarkan relasi, entitas, dan konsepnya dengan menggunakan mekanisme indeks novel.

Secara umum, sistem yang dibahas memiliki 5 modul utama yang memilki peranan masing-masing yang terintegrasi dalam sistem [2].

(i)           Ekstraktor Entitas

Modul ini menerima masukan berupa abstrak makalah biologi yang telah mengandung tag dan mengekstrak nama entitas dari teks. Karena entitas dapat saja diselipkan dalam tag tunggal maupun ganda, maka diperlukan desain rule untuk melakukan pre-proses dan kemudian mengekstrak entitas biologi dari dokumen teks yang telah diberi tag.

(i)             Meta Language (ML) Tag Filter dan POS Tagger

Modul ini berfungsi untuk menyaring tag-tag ML dari dokumen input. Dokumen yang telah disaring kemudian dianalisa dengan bantuan POS (Part-of-Speech) Tagger untuk mengubah tiap kalimat ke dalam bentuk semi-terstruktur berbasiskan konsep.

(ii)           Biological Relation Extractor

Modul ini menggunakan rekord semi-terstruktur yang dihasilkan dari modul sebelumnya melalui kolaborasi dengan ontologi yang telah didefinisikan sebelumnya, untuk pertama-tama mengekstrak seluruh komponen informasi dan seluruh triplet relasi biologi (Ci, R, Cj).

(iii)                            Knowledge Base Manager

Modul ini menyimpan koleksi abstrak untuk melakukan ekstraksi informasi yang lebih efisian dari waktu ke waktu. Di dalamnya terdapat parser dokumen yang menyimpan lokasi terdapatnya relasi biologi dalam koleksi untuk membuat basis data yang telah terindeks menurut entitas, konsep, dan relasi.

(iv) Pemroses Query

Modul pemrosesan query menyediakan antar-muka query intelijen yang memungkinkan pengguna untuk membuat formulasi query pada tingkat spesifikasi yang berbeda-beda. Query yang dimasukkan oleh pengguna dapat mengandung informasi yang sederhana hingga kompleks, dapat meliputi pertanyaan mengenai eksistensi nama entitas tertentu hingga eksistensi sepasang entiitas atau konsep yang dihubungkan oleh relasi biologi tertentu.

 

 

5. KESIMPULAN

Teknologi text mining dapat diaplikasikan dalam berbagai area ilmu pengetahuan, termasuk biologi sebagai ilmu interdisipliner. Beberapa pengembangan text-mining dalam bidang biologi antara lain pembuatan hipotesis/kesimpulan secara induktif serta pembuatan sistem ekstraksi informasi biologi untuk identifikasi relasi dan akses literatur yang relevan.

Beberapa arah pengembangan text-mining untuk menjadi teknologi masa depan yang dapat membantu perkembangan ilmu pengetahuan antara lain sebagai berikut [1].

i)              i)    Tersedianya jurnal atau literatur dalam format full-text akan memberikan signifikansi yang cukup besar dalam performansi text-mining, mengingat masih banyaknya abstrak yang kekurangan informasi relevan di dalamnya.

ii)                      ii)   Integrasi text mining dengan data mining akan merintis pengembangan aplikasi yang lebih luas dalam berbagai bidang ilmu pengetahuan teori maupun terapan, seperti pencarian similaritas struktur kimiawi atau integrasi rekam medis dengan data gen dan bukti dari literatur untuk kepentingan aplikasi farmasi. Dengan memadukan aplikasi dengan konsep sistem tersebar, maka akan memberikan lebih banyak manfaat kepada masyarakat.

iii)   Pengembangan konsep text-mining  juga dapat dimanfaatkan dalam pembuatan model berdasarkan litaratur yang ada. Pembuatan model ini dapat diawali dengan perancangan model kualitatif atau struktural, yang biasanya diturunkan dari rangkaian gen dan kemudian dapat diintegrasikan dengan bukti yang diturunkan dari literatur melalui konsep text-mining.

Eksplorasi dan eksploitasi teknik data mining masih berada pada tahap awal pengembangan, namun telah mencapai kemajuan yang cukup pesat. Teknik ini diharapkan dapat menjadi alat yang dapat diandalkan oleh para ahli ilmu pengetahuan di masa depan untuk dapat melakukan ekstraksi informasi pengetahuan intersisipliner dengan lebih efektif dan efisien, yang pada akhirnya akan membawa kemajuan yang lebih pesat pada perkembangan ilmu pengetahuan secara keseluruhan.

 

 

DAFTAR REFERENSI

[1] Ananiaduo, Sophia. et al. (2006) Text mining and its appplications in systems biology.

[2] Abulaish, M. and Dey, Lipika. (2006) Biological relation extraction and query answering from MEDLINE abstracts using ontology-based text mining.

[3] Cohen, Aaron M. and Hersh, William R. (2004) A survey of current work in biomedical text mining.

[4] Spasic, Irene. et al. (2005) Text mining and ontologies in biomedicine : Making sense of raw text.

10/28/2011 Posted by | Uncategorized | Tinggalkan komentar