Question Answering System



Question-Answering System merupakan sebuah sistem yang mengijinkan pengguna untuk menyatakan kebutuhan informasinya dalam bentuk yang lebih spesifik dan alami, yaitu dalam bentuk natural language questionQuestion-Answering System mengembalikan daftar dokumen teks singkat atau frase sebagai jawaban yang harus disaring lagi oleh user untuk menentukan apakah dokumen-dokumen tersebut mengandung jawaban yang sesuai.

Sistem Question Answering (QA) System mengijinkan user untuk menginputkan pertanyaan dalam bahasa natural, yaitu bahasa yang digunakan dalam percakapan sehari-hari, dan memperoleh jawaban dengan cepat serta ringkas, atau bahkan disertai dengan kalimat yang cukup untuk mendukung kebenaran dari jawaban tersebut. 

Secara umum, arsitektur Question-Answering System tersusun atas enam tahapan proses, yaitu question analysisdocument collection preprocessingcandidate document selectioncandidate document analysisanswer extraction, danresponse generation (Gunawan & Lovina, 2005).

1.      Question Analysis
Pertanyaan yang dijadikan input oleh user harus memenuhi beberapa persyaratan tertentu, seperti terbatas pada penggunaan kosakata dan sintaks tertentu. Pada tahap question analysis ini akan diadakan analisa yang akan menghasilkan dua buah representasi pertanyaan sebagai output. Representasi pertama berupa sebuah query yang akan diteruskan pada tahap candidate document selection, dan representasi kedua merupakan representasi semantik dari pertanyaan. Representasi semantik dari pertanyaan mengarah pada jenis informasi atau tipe jawaban yang diinginkan oleh pertanyaan yang dijadikan input. Misalnya, pertanyaan “Kapan...” menginginkan jawaban berupa tanggal atau waktu, sedangkan pertanyaan “Siapa...” menginginkan jawaban berupa nama orang.

2.      Document Collection Preprocessing
Proses ini bertujuan untuk mempermudah akses pada koleksi dokumen dalam upaya menemukan jawaban yang tepat atas pertanyaan user dalam waktu yang sesingkat mungkin. Sebagian besar Question Answering System melakukan preprocessing dengan mengandalkan document indexing engine. Namun, tahap preprocessing tidak terbatas pada indexing saja. Tiga buah alternatif lain yang digunakan untuk melakukan preprocessing dokumen: part-of-speech taggingnamed entity recognition, mengubah teks dokumen ke dalam bentuk logika atau ke bentuk lain agar mudah untuk diakses.

3.      Candidate Document Selection
Dengan berdasarkan pada query yang dihasilkan dari proses analisis pertanyaan, tahap candidatedocument selection akan mengidentifikasi dokumendokumen yang mungkin mengandung jawaban atas pertanyaan dengan metode Surface Text Patterns.

4.      Candidate Document Analysis
Dokumen-dokumen yang dikembalikan akan dianalisis lebih lanjut untuk memperkecil ukuran dokumen yang nantinya diakses untuk ekstraksi jawaban. Proses analisis kandidat dokumen ini sebenarnya tidak diperlukan lagi apabila sistem telah melaksanakan preprocessing secara lengkap terhadap semua dokumen.

5.      Answer Extraction
Tahap answer extraction bertugas untuk mencocokkan kandidat dokumen dengan representasi semantik dari pertanyaan, dan kemudian menghasilkan daftar jawaban.

6.      Response Generation
Setelah sistem berhasil mengekstrak jawaban, maka proses selanjutnya adalah menentukan respon yang akan dihasilkan, yaitu bagaimana jawaban tersebut disajikan. Contoh bentuk-bentuk penyajian sistem adalah: daftar dokumen, daftar paragraf, daftar kalimat, atau daftar frase jawaban sebagai respon.

Metode Penterjemahan
-          Rule-Based Question Answering System
Rule-Based Question Answering System menggunakan sejumlah rule untuk mencari bukti bahwa sebuah kalimat mengandung jawaban dari sebuah pertanyaan. Setiap tipe pertanyaan mencari tipe jawaban yang berbeda, sehingga rule-based menggunakan set rule yang terpisah untuk setiap tipe pertanyaan (siapa, apa, kapan, dimana, dan mengapa). Analisa secara sintaks tidak digunakan, namun QAS menggunakan analisa secara morfologi, tag jenis kata, tag kelas semantik, dan pengenalan entitas (Riloff & Thelen, 2003).  

Komentar