Question-Answering
System merupakan sebuah sistem yang mengijinkan pengguna untuk
menyatakan kebutuhan informasinya dalam bentuk yang lebih spesifik dan alami,
yaitu dalam bentuk natural language question. Question-Answering
System mengembalikan daftar dokumen teks singkat atau frase sebagai
jawaban yang harus disaring lagi oleh user untuk menentukan
apakah dokumen-dokumen tersebut mengandung jawaban yang sesuai.
Sistem Question
Answering (QA) System mengijinkan user untuk
menginputkan pertanyaan dalam bahasa natural, yaitu bahasa yang
digunakan dalam percakapan sehari-hari, dan memperoleh jawaban dengan cepat
serta ringkas, atau bahkan disertai dengan kalimat yang cukup untuk mendukung
kebenaran dari jawaban tersebut.
Secara umum, arsitektur Question-Answering System tersusun
atas enam tahapan proses, yaitu question analysis, document
collection preprocessing, candidate document selection, candidate
document analysis, answer extraction, danresponse
generation (Gunawan & Lovina, 2005).
1. Question
Analysis
Pertanyaan yang
dijadikan input oleh user harus memenuhi
beberapa persyaratan tertentu, seperti terbatas pada penggunaan kosakata dan
sintaks tertentu. Pada tahap question analysis ini akan
diadakan analisa yang akan menghasilkan dua buah representasi pertanyaan
sebagai output. Representasi pertama berupa sebuah query yang
akan diteruskan pada tahap candidate document selection, dan
representasi kedua merupakan representasi semantik dari pertanyaan.
Representasi semantik dari pertanyaan mengarah pada jenis informasi atau tipe
jawaban yang diinginkan oleh pertanyaan yang dijadikan input.
Misalnya, pertanyaan “Kapan...” menginginkan jawaban berupa tanggal atau waktu,
sedangkan pertanyaan “Siapa...” menginginkan jawaban berupa nama orang.
2. Document
Collection Preprocessing
Proses ini bertujuan untuk
mempermudah akses pada koleksi dokumen dalam upaya menemukan jawaban yang tepat
atas pertanyaan user dalam waktu yang sesingkat mungkin.
Sebagian besar Question Answering System melakukan preprocessing dengan
mengandalkan document indexing engine. Namun, tahap preprocessing tidak
terbatas pada indexing saja. Tiga buah alternatif lain yang
digunakan untuk melakukan preprocessing dokumen: part-of-speech tagging, named
entity recognition, mengubah teks dokumen ke dalam bentuk logika atau ke bentuk
lain agar mudah untuk diakses.
3. Candidate
Document Selection
Dengan berdasarkan pada query yang
dihasilkan dari proses analisis pertanyaan, tahap candidatedocument
selection akan mengidentifikasi dokumendokumen yang mungkin mengandung
jawaban atas pertanyaan dengan metode Surface Text Patterns.
4. Candidate
Document Analysis
Dokumen-dokumen yang
dikembalikan akan dianalisis lebih lanjut untuk memperkecil ukuran dokumen yang
nantinya diakses untuk ekstraksi jawaban. Proses analisis kandidat dokumen ini
sebenarnya tidak diperlukan lagi apabila sistem telah melaksanakan preprocessing secara
lengkap terhadap semua dokumen.
5. Answer
Extraction
Tahap answer
extraction bertugas untuk mencocokkan kandidat dokumen dengan
representasi semantik dari pertanyaan, dan kemudian menghasilkan daftar jawaban.
6. Response
Generation
Setelah sistem berhasil
mengekstrak jawaban, maka proses selanjutnya adalah menentukan respon yang akan
dihasilkan, yaitu bagaimana jawaban tersebut disajikan. Contoh bentuk-bentuk
penyajian sistem adalah: daftar dokumen, daftar paragraf, daftar kalimat, atau
daftar frase jawaban sebagai respon.
Metode Penterjemahan
- Rule-Based
Question Answering System
Rule-Based Question Answering
System menggunakan
sejumlah rule untuk mencari bukti bahwa sebuah kalimat
mengandung jawaban dari sebuah pertanyaan. Setiap tipe pertanyaan mencari tipe
jawaban yang berbeda, sehingga rule-based menggunakan
set rule yang terpisah untuk setiap tipe pertanyaan (siapa,
apa, kapan, dimana, dan mengapa). Analisa secara sintaks tidak digunakan, namun
QAS menggunakan analisa secara morfologi, tag jenis
kata, tag kelas semantik, dan pengenalan entitas (Riloff &
Thelen, 2003).
Komentar
Posting Komentar