Perolehan informasi dokumen suara pembicaraan berdasarkan hasil dari sistem pengenalan suara untuk bahasa indonesia

Armando Yonathan, author

Perolehan informasi dokumen suara pembicaraan berdasarkan hasil dari sistem pengenalan suara untuk bahasa indonesia

Armando Yonathan; Mirna Adriani, supervisor (Universitas Indonesia, 2009)

Abstrak

Informasi yang terdapat saat ini tidak hanya terbatas disimpan dalam bentuk dokumen teks saja, tetapi banyak juga dalam bentuk dokumen suara. Banyaknya informasi yang disimpan dalam bentuk dokumen suara menyebabkan diperlukannya teknik perolehan informasi yang dapat diterapkan kepada koleksi dokumen tersebut. Pendekatan yang banyak dilakukan adalah dengan menggunakan hasil pengenalan suara oleh Sistem Pengenalan Suara Otomatis (SPSO). Tetapi, hasil pengenalan suara oleh SPSO tidak sepenuhnya benar sehingga menurunkan tingkat akurasi perolehan informasi dokumen suara. Pada penelitian ini penulis mencoba empat jenis hasil pengenalan suara untuk melakukan perolehan informasi dokumen suara, yaitu 1-best output, n-best word output, n-best pronounciation output, word posterior lattice. Selain itu, penulis juga mencoba tiga jenis kueri pada penelitian ini, yaitu kueri satu kata, kueri frase dua kata dan kueri kalimat. Hasil yang didapat pada penelitian ini menyimpulkan bahwa penggunaan 1-best output pada perolehan informasi dokumen suara menghasilkan kinerja yang lebih baik dibandingkan penggunaan hasil pengenalan suara yang lain. Mean Average Precision (MAP) hasil eksperimen dengan 1-best output lebih besar 0.64% dibandingkan penggunaan n-best output , 8,88% lebih besar dibandingkan penggunaan word posterior lattice dan lebih besar 92.68% dibandingkan penggunaan n-best pronounciation output. Pada eksperimen dengan kueri frase, sistem dengan akurasi terbaik adalah sistem yang menggunakan word posterior lattice. Pada eksperimen dengan kueri satu kata dan kueri kalimat, sistem yang menggunakan n-best word output menghasilkan kinerja terbaik.

The information today is not only limited in the form of text documents, but also in the form of spoken documents. The growing number of those spoken documents requires the information retrieval techniques to make the retrieval process easier. The approach for spoken documents retrieval is using automatic speech recognition (ASR). However, the results of the speech recognition by ASR are not entirely correct, so reduce the level of accuracy of information retrieval of spoken documents. This experiment uses four types results of the speech recognition by ASR, the 1-best output, n-best output, n-best pronunciation output, word posterior lattice. In addition, this experiment also investigates the effect of the use of query types (phrase, single word and sentence). Results obtained from this experiment concluded that the use of 1-best output on spoken document retrieval produces better performance results than the use of other results of the speech recognition. Mean Average Precision (MAP) results of experiments with 1-best output is 0.64% higher than the use of n-best output, 8.88% higher than the use of word posterior lattice and 92.68% higher than the use of n-best pronunciation output. In phrase based query experiment, the best accuracy is word posterior lattice while the best accuracy in single word query and sentence query is n-best word output.

File Digital: 5

Shelf

SK-784-Perolehan informasi-Kesimpulan.pdf :: Unduh

SK-784-Perolehan informasi-HA.pdf :: Unduh

SK-784-Perolehan informasi-Lampiran.pdf :: Unduh

SK-784-Perolehan informasi-Bibligrafi.pdf :: Unduh

SK-784-Perolehan informasi-Abstrak.pdf :: Unduh

Kata Kunci

information retrieval

voice recognition

word posterior lattice

automatic speech recognition

Metadata

Jenis Koleksi :	UI - Skripsi Open
No. Panggil :	S-Pdf
Entri utama-Nama orang :	Armando Yonathan, author


Entri tambahan-Nama orang :	Mirna Adriani, supervisor
Entri tambahan-Nama badan :	Universitas Indonesia. Fakultas Ilmu Komputer


Subjek :	Information retrieval
Penerbitan :	Depok: Universitas Indonesia, 2009

Bahasa :	ind
Sumber Pengatalogan :
Tipe Konten :
Tipe Media :
Tipe Carrier :
Deskripsi Fisik :	xiv, 86 lembar; il., 29 cm.
Naskah Ringkas :
Lembaga Pemilik :	Universitas Indonesia
Lokasi :	Perpustakaan FASILKOM UI

Ketersediaan
Ulasan
Sampul

No. Panggil	No. Barkod	Ketersediaan
S-Pdf	14-21-348071808	TERSEDIA

Ulasan:

Tidak ada ulasan pada koleksi ini: 122632

UI - Skripsi Open :: Kembali

UI - Skripsi Open :: Kembali

Perolehan informasi dokumen suara pembicaraan berdasarkan hasil dari sistem pengenalan suara untuk bahasa indonesia

Abstrak

File Digital: 5

Kata Kunci

Metadata