Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 33 dokumen yang sesuai dengan query
cover
Framadhana Arnely
"Sistem perolehan gambar merupakan sistem untuk memperoleh dokumen gambar dari suatu koleksi dokumen gambar berdasarkan query tertentu. Sistem perolehan gambar yang dikembangkan merupakan sistem satu bahasa dan lintas bahasa. Sistem satu bahasa merupakan sistem yang menerima query, dimana bahasa query sama dengan bahasa koleksi dokumen. Sedangkan sistem lintas bahasa merupakan sistem yang menerima query, dimana bahasa query berbeda dengan bahasa koleksi dokumen. Sistem satu bahasa menggunakan query dalam bahasa Inggris, sedangkan sistem lintas bahasa menggunakan query dalam bahasa Indonesia yang digunakan untuk mencari dokumen dalam bahasa Inggris. Sistem perolehan gambar yang dikembangkan untuk penelitian ini menggunakan koleksi dokumen gambar yang disertai dengan teks yang berisi informasi tentang gambar tersebut (text caption). Query yang digunakan terdiri dari query gambar dan query teks. Query teks terdiri dari dua bentuk, yaitu judul dan narasi. Untuk mengolah data yang berupa teks, digunakan sistem IR Lucene, sedangkan untuk mengolah data yang berupa gambar, digunakan sistem CBIR GIFT dan VSMImage. Penelitian ini merupakan bagian dari kegiatan Image Cross Language Evaluation Forum (ImageCLEF) tahun 2005. Data-data berupa query, koleksi dokumen, dan hasil penilaian (relevance judgment) menggunakan data yang diberikan oleh ImageCLEF. Penelitian ini juga ingin mempelajari perbaikan hasil perolehan gambar dengan menggunakan query teks yang diterjemahkan dari bahasa Indonesia ke bahasa Inggris. Metode-metode yang digunakan dalam perbaikan hasil terjemahan query teks ini menggunakan perluasan query dan menggabungkan hasil pencarian query gambar dengan hasil pencarian query teks. Penggunaan query teks yang diterjemahkan terlihat menurunkan precision dengan rata-rata penurunan sebesar 44.97% terhadap query teks yang tidak diterjemahkan. Dari hasil eksperimen, penggunaan perluasan query memperburuk hasil pencarian query teks yang diterjemahkan dengan rata-rata penurunan precision sebesar 16.42%. Penggabungan hasil perolehan sistem CBIR GIFT dengan hasil query teks yang diterjemahkan dapat memperbaiki hasil pencarian query teks yang diterjemahkan dengan kenaikan precision rata-rata sebesar 8.70%. Penggabungan hasil pencarian sistem CBIR VSMImage dengan hasil query teks yang tidak diterjemahkan, belum dapat memperbaiki hasil pencarian query yang diterjemahkan."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rinawati
"Sistem Tanya Jawab (Question Answering) merupakah sistem yang menerima query (pertanyaan) berupa bahasa alami atau bahasa yang biasa digunakan untuk berkomunikasi antar manusia sebagai masukan (input) dan mengembalikan jawaban yang tepat sebagai keluaran (output). Tujuan dari penelitian ini adalah dikembangkannya Sistem Tanya Jawab Satu Bahasa (Monolingual Question Answering System) dan Sistem Tanya Jawab Lintas Bahasa (Cross Language Quetion Answering System). Yang menjadi masukan pada Sistem Tanya Jawab Satu Bahasa adalah query berbahasa Inggris dan keluarannya adalah jawaban berbahasa Inggris, sedangkan pada Sistem Tanya Jawab Lintas Bahasa yang menjadi masukan pada sistem adalah query berbahasa Indonesia dan keluarannya adalah jawaban yang menggunakan bahasa Inggris. Teknik perolehan jawaban yang digunakan pada Sistem Tanya Jawab yang dilakukan oleh penulis ini adalah teknik yang menganalisa passage. Yang dimaksud dengan passage adalah bagian kecil dari dokumen yang isinya dapat berupa sejumlah kata (jumlahnya bervariasi, misalnya 50, 100 atau 200 kata), kalimat atau paragraf. Masing-masing passage tersebut selanjutnya akan diberikan nilai dan diberi keterangan (document annotation). Selanjutnya jawaban dari suatu query diperoleh dari passage yang mempunyai nilai tertinggi dan keterangan yang sesuai dengan query. Uji coba sistem dilakukan terhadap 200 query berbahasa Inggris untuk Sistem Tanya Jawab Satu Bahasa dan 200 query berbahasa Indonesia (hasil terjemahan dari query bahasa Indonesia yang dilakukan secara manual oleh penulis) untuk Sistem Tanya Jawab Lintas Bahasa. Mesin Pencari Informasi yang digunakan untuk menemukan dokumen adalah Lemur sedangkan koleksi dokumen yang digunakan adalah Los Angeles Times tahun 1994 dan Glasgow Herald tahun 1995. Baik query maupun koleksi dokumen, keduanya diperoleh dari CLEF 2004. Evaluasi Sistem Tanya Jawab dilakukan dengan cara mencocokkan jawaban dari hasil penelitian yang dilakukan penulis dengan hasil jawaban yang telah dinilai oleh CLEF 2004. Evaluasi sistem dilakukan untuk mengetahui seberapa baik sistem dapat memperoleh jawaban dengan benar. Hasil dari Sistem Tanya Jawab yang dilakukan penulis adalah 20 buah pertanyaan (10%) dari seluruh query berbahasa Inggris yang dimasukkan ke dalam sistem berhasil dijawab dengan benar sedangkan untuk query berbahasa Indonesia, sebanyak 16 buah pertanyaan (8%) berhasil dijawab dengan benar."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Indah
"Penelitian ini melakukan klasifikasi otomatis lagu-lagu daerah Indonesia, yaitu daerah Jawa Tengah, Bali, dan Jakarta. Penelitian dilakukan pada lagu berformat MIDI berjenis monophonic. Pengklasifikasian dilakukan dengan lima metode yaitu klasifikasi berdasarkan rata-rata tick/detik per 4 ketukan, klasifikasi berdasarkan range nada, klasifikasi berdasarkan rata-rata jumlah nada per 4 ketukan, klasifikasi berdasarkan kontur nada dengan local alignment similarity, dan yang terakhir adalah klasifikasi berdasarkan kontur nada dengan vector space similarity. Hasil penelitian yang dilakukan pada 24 lagu daerah ini menunjukkan bahwa klasifikasi berdasarkan rata-rata tick/detik per 4 ketukan memberikan ketepatan hasil sebesar 87.5 %, klasifikasi berdasarkan range nada memberikan ketepatan hasil sebesar 45.83 %, klasifikasi berdasarkan rata-rata jumlah nada per 4 ketukan memberikan ketepatan hasil sebesar 45.83 %, klasifikasi berdasarkan kontur nada dengan local alignment similarity memberikan ketepatan hasil sebesar 58.33 %, dan yang terakhir ketepatan hasil yang diberikan oleh klasifikasi berdasarkan kontur nada dengan vector space similarity adalah 66.67 %."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2004
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Haryani Diah Sitawati
"Peringkas Otomatis merupakan pembuatan ringkasan dengan bantuan komputer. Peringkas Otomatis bertujuan untuk menemukan dokumen yang relevan atau mengetahui isi suatu dokumen secara mudah dan cepat. Penelitian ini mengembangkan Peringkas Otomatis untuk dokumen ilmiah bahasa Indonesia menggunakan dua metode yaitu metode Tf-Idf dan metode Frase Penunjuk. Metode Tf-Idf dan metode Frase Penunjuk memiliki kesamaan yaitu sama-sama menghitung bobot untuk kata-kata tertentu dalam dokumen untuk selanjutnya dijumlahkan untuk tiap kalimat dan diambil yang bobot kalimatnya tertinggi. Khusus untuk metode Frase Penunjuk dilakukan serangkaian pelatihan lebih dahulu untuk menghasilkan kamus Frase Penunjuk untuk dokumen ilmiah berbahasa Indonesia.
Pengujian hasil ringkasan dilakukan dengan menggunakan rasio kompresi 10% dan 20%. Berdasarkan pengujian, didapat bahwa nilai precision dan recall dari ringkasan dengan metode Tf-Idf lebih baik daripada menggunakan metode Frase Penunjuk. Untuk rasio kompresi 10%, nilai precision metode Tf-Idf adalah sebesar 45,1%, sedangkan nilai precision metode Frase Penunjuk adalah sebesar 43%. Namun untuk rasio kompresi 20%, nilai precision metode Tf-Idf adalah sebesar 60,8%, sedangkan nilai precision metode Frase Penunjuk adalah sebesar 60,1%. Nilai recall untuk metode Tf-Idf dengan rasio kompresi 10% adalah 21,6% sedangkan untuk metode Frase Penunjuk adalah sebesar 20,6%. Untuk rasio kompresi 20%, nilai recall dari metode Tf-Idf adalah sebesar 14,5% dan nilai recall dari metode Frase Penunjuk adalah sebesar 13,3%. Jika diukur berdasarkan waktu eksekusi, ringkasan dengan metode Frase Penunjuk membutuhkan waktu yang lebih singkat daripada waktu eksekusi metode Tf-Idf yaitu 0,6 menit dibanding 5,4 menit. Sedangkan untuk panjang kata, ringkasan dengan metode Tf-Idf menghasilkan ringkasan dengan jumlah kata yang lebih banyak dari pada metode Frase Penunjuk. Untuk rasio kompresi 10%, jumlah kata metode Tf- Idf adalah 484 kata, sedangkan untuk metode Frase Penunjuk adalah sebanyak 357 kata. Untuk rasio kompresi 20%, jumlah kata dari metode Tf-Idf adalah sebanyak 845 kata dan untuk metode Frase Penunjuk adalah sebanyak 670 kata."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2005
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Monica Lestari Paramita
"Pesatnya perkembangan informasi menuntut dikembangkannya suatu sistem pencarian data yang baik, yang memberikan kemudahan untuk menemukan informasi yang diinginkan. Sistem pencarian data yang umum digunakan saat ini adalah sistem pencarian data berbasiskan kata. Masukan dari pengguna yang berupa pertanyaan (query) dalam bahasa natural (natural language) akan digunakan oleh sistem pencari informasi untuk menemukan dokumen yang mengandung kata-kata pada query tersebut. Pencarian ini menyebabkan jumlah dokumen yang ditemukan umumnya terlalu banyak karena dokumendokumen yang hanya mengandung sebagian kata dalam query juga akan ikut ditemukan. Jika ditinjau dari isinya, baik query maupun dokumen hampir selalu memiliki keterkaitan dengan lokasi di dalamnya. Hal-hal tersebut mendasari pengembangan sistem pencarian data yang berbasiskan kepada data-data geografis. Sistem bertujuan untuk mengambil nama lokasi dalam query dan membatasi pencarian data pada dokumendokumen yang memiliki lokasi representatif sesuai dengan query saja. Sistem yang dikembangkan dalam penelitian ini dinamakan Sistem Perolehan Informasi Geografis (Geographic Information Retrieval - GIR). Sistem GIR dikembangkan dengan 2 metode utama, yaitu metode pemilihan satu lokasi representatif (metode SLR) dan metode pemilihan banyak lokasi representatif (metode BLR) dalam dokumen. Evaluasi dilakukan dengan membandingkan nilai average precision tiap metode dengan Sistem Bahasa Natural (Natural Language - NL). Hasil metode SLR mengalami penurunan sebesar 15.67% sedangkan hasil metode BLR mengalami penurunan sebesar 6.54%. Untuk memperbaiki hasil tersebut, diimplementasikan 2 metode proses perluasan lokasi yaitu perluasan lokasi ke tingkat lebih tinggi dan lebih rendah (metode QE_S); dan perluasan lokasi ke tingkat yang lebih tinggi, lebih rendah dan tingkat yang sama (metode QE_ETS). Hasil metode SLR dengan QE_S (SLR_QE_S) mengalami peningkatan sebesar 29.23% dan hasil metode SLR dengan QE_ETS (SLR_QE_ETS) mengalami peningkatan sebesar 30.57%. Saat perluasan lokasi diimplementasikan dengan metode BLR, hasil yang diperoleh justru menurun, yaitu hasil metode BLR dengan QE_S (BLR_QE_S) memiliki penurunan sebesar 22.47% dan metode BLR dengan QE_ETS (BLR_QE_ETS) memiliki penurunan sebesar 34.36%. Berdasarkan hasil tersebut, dapat disimpulkan bahwa sistem GIR yang memberikan hasil terbaik adalah metode SLR_QE_ETS sedangkan sistem GIR yang memberikan hasil terburuk adalah metode BLR_QE_ETS."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dessy Natalia
"Pada era informasi ini, informasi yang tersedia untuk diakses oleh masyarakat sangat berlimpah. Untuk mencari suatu informasi, seorang pengguna dapat memanfaatkan sistem perolehan informasi untuk memperoleh sekumpulan dokumen yang berisi informasi yang dicarinya. Tetapi seringkali untuk mendapatkan jawaban singkat dari suatu pertanyaan, pengguna perlu mencarinya dari banyak dokumen. Untuk menangani kesulitan tersebut, diperlukan suatu sistem yang dapat menerima pertanyaan dalam bahasa sehari-hari dan mengembalikan jawaban secara tepat sehingga pengguna tidak perlu membaca keseluruhan dokumen untuk mencari jawaban. Sistem yang dimaksud adalah sistem tanya jawab, suatu sistem yang dapat mengembalikan jawaban atas pertanyaan bahasa alami dari sekumpulan teks dokumen.
Penelitian ini mengembangkan suatu Sistem Tanya Jawab Bahasa Indonesia (STJBI), yaitu sistem tanya jawab yang melakukan pencarian jawaban dari koleksi dokumen berbahasa Indonesia. Pertanyaan yang dapat diproses STJBI adalah pertanyaan yang berdasarkan fakta tertentu dan berkaitan dengan nama orang, nama organisasi, nama lokasi, serta waktu kejadian. Pertanyaan tersebut dijadikan masukan untuk mencari dokumen yang relevan. Dokumen yang dianggap relevan ini kemudian dibagi menjadi bagian-bagian yang lebih kecil (passage) untuk mendapatkan kandidat jawaban. STJBI menggunakan aturan statistik untuk memberikan bobot pada tiap kandidat jawaban.
Kandidat jawaban yang memiliki nilai tertinggi akan dipilih sebagai jawaban. Pada penelitian ini digunakan tiga ukuran passage yang berbeda yaitu 2, 5, dan 8 kalimat. Hasil uji coba menunjukkan bahwa STJBI dapat mengembalikan jawaban dengan tingkat ketepatan tertinggi sebesar 88.89%, yaitu dengan menggunakan passage yang berukuran 2 kalimat. Dengan menggunakan passage yang berukuran 5 kalimat, STJBI memiliki tingkat ketepatan 86.1%. Sedangkan dengan menggunakan passage yang berukuran 8 kalimat, STBJI hanya memiliki tingkat ketepatan 80.56%. Ketiga jenis ukuran passage memberikan tingkat ketepatan yang sama untuk pertanyaan WAKTU dan ORANG, yaitu sebesar 100% dan 90%. Untuk pertanyaan OGRANISASI, STBJI memiliki tingkat ketepatan 90% (dengan passage berukuran 2 iv kalimat), 80% (dengan passage berukuran 5 kalimat), dan 70% (dengan passage berukuran 8 kalimat). Kinerja STJBI paling buruk diperoleh untuk pertanyaan LOKASI, yaitu hanya 71.4% (dengan passage berukuran 2 dan 5 kalimat) dan 57.1% (dengan passage berukuran 8 kalimat)."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Siahaan, Edison Pardengganan
"Penelitian yang dilakukan pada tesis ini dimotivasi oleh adanya kebutuhan untuk dapat melakukan pengelolaan informasi pada dokumen suara khususnya berita berbahasa Indonesia. Informasi pada dokumen suara berita berbahasa Indonesia dapat diubah menjadi informasi berbentuk dokumen teks, dengan menggunakan perangkat lunak Automatic Speech Recognition (ASR). Pada penelitian ini perangkat ASR yang digunakan adalah perangkat ASR Sphinx 4.
Penggunaan perangkat Sphinx 4 ini didasari telah dilakukannya penelitian tentang transkripsi dokumen suara berbahasa Indonesia menggunakan perangkat ini. Hasil keluaran dari ASR berupa dokumen teks yang tidak memiliki batasan akhir dan tidak tersegmentasi secara jelas, tentu menyulitkan dalam pengolahan data teks tersebut. Dalam kerangka itu, maka penelitian yang dilakukan pada tesis ini ditujukan untuk mengetahui metode yang efektif dalam melakukan segmentasi hasil transkripsi berita suara berbahasa Indonesia. Metode yang akan diuji pada penelitian ini adalah metode TextTiling berbasis perbandingan blok dengan pembobotan TF-IDF-Mutual Information, TF-IDFMutual Information-Word Similarity, TF-IDF-Word Frequency, TF-IDF, Latent Semantic Analysis dan metode TextTiling berbasis Vocabulary Introduction. Segmentasi dilakukan untuk berita teks dan dokumen teks hasil transkripsi berita suara yang telahdikatagorikan menjadi 5 topik yaitu topik politik, sosial budaya, ekonomi, hukum dan olah raga. Hasil pengujian terhadap masing-masing teknik pembobotan menunjukkan bahwa metode segmentasi TextTiling dengan teknik pembobotan TF-IDF-Word Frequency merupakan metode segmentasi yang paling baik untuk dipakai dalam melakukan segmentasi hasil transkripsi dari perangkat pengenal suara (Automatic Speech Recognition). Pada penelitian ini telah dibuktikan bahwa teknik pembobotan TF-IDF-Word Frequency memiliki ketepatan segmentasi lebih tinggi baik pada dokumen teks hasil transkripsi (81,4%) ataupun pada dokumen berita teks (73,3%). Metode segmentasi yang dilakukan pada penelitian ini dapat terus dikembangkan menggunakan teknik-teknik lain dalam menunjang proses segmentasi hasil transkripsi berita berberbahasa Indonesia, seperti mempergunakan metode-metode optimalisasi dalam memperoleh urutan batas segmen yang optimal."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
T-804
UI - Tesis Membership  Universitas Indonesia Library
cover
Syandra Sari
"Perolehan informasi lintas bahasa adalah bidang perolehan informasi yang semakin berkembang seiring dengan pesatnya perkembangan Internet di seluruh dunia. Perolehan informasi lintas bahasa adalah sistem perolehan informasi yang memungkinkan pengguna memberikan query dalam bahasa yang berbeda dengan bahasa dokumen. Dalam perolehan informasi lintas bahasa, masalah perbedaan bahasa diatasi dengan proses penerjemahan dokumen atau penerjemahan query. Sumber daya bahasa yang digunakan untuk proses penerjemahan pada perolehan informasi lintas bahasa dapat berupa kamus dwi bahasa, mesin penerjemah atau korpus paralel. Penelitian ini mengembangkan sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel. Padanan kata dalam bahasa Indonesia-Inggris diperoleh dengan menggunakan dua metoda yaitu informasi mutual dan similarity thesaurus. Selanjutnya untuk meningkatkan hasil perolehan dokumen berdasarkan korpus paralel, maka diterapkan teknik perluasan query yaitu pseudo-relevance feedback. Kinerja terbaik dari metoda informasi mutual dan penerapan teknik perluasan query mencapai 41,86 % dari kinerja perolehan informasi lintas bahasa monolingual; 80,5 % dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan kamus; serta mencapai 54% dari kinerja sistem perolehan informasi lintas bahasa Indonesia-Inggris menggunakan mesin penerjemah Transtool. Sedangkan kinerja terbaik dari metoda similarity thesaurus dan penerapan teknik perluasan query mencapai 55,61 % dari kinerja perolehan informasi lintas bahasa monolingual; mencapai 107% dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan kamus; serta mencapai 71% dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan mesin penerjemah Transtool. Berdasarkan hasil tersebut diatas, terlihat bahwa perluasan query dengan teknik pseudo-relevance feedback yang diterapkan pada sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel dengan metoda informasi mutual dan similarity thesaurus dapat meningkatkan kinerja sampai dengan 25 % dibanding tanpa proses perluasan query. Kemudian, dari hasil tersebut diatas juga dapat diambil kesimpulan umum bahwa sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel dapat menjadi alternatif bagi pengembangan sistem perolehan informasi lintas bahasa Indonesia-Inggris. Dan penelitian lebih lanjut mengenai metoda berdasarkan korpus paralel yang lebih baik serta usaha perbaikan kualitas korpus paralel perlu terus dilakukan bagi peningkatan kinerja sistem perolehan informasi lintas bahasa Indonesia-Inggris di masa yang akan datang."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Lily Fitria
"Penelitian ini bertujuan untuk mengembangkan sebuah Sistem Tanya Jawab (Question Answering System). Sistem Tanya Jawab merupakan sebuah sistem yang menerima masukan (input) pertanyaan dalam bahasa alami (natural language) bukan keywords, kemudian memproses koleksi dokumen yang tidak terstruktur, dan terakhir mengembalikan sebuah jawaban yang tepat sebagai keluaran (output), bukan dokumen. Sistem Tanya Jawab yang dihasilkan dalam penelitian ini menerima masukan sejumlah pertanyaan berbahasa Inggris dari query set Cross-Language Evaluation Forum (CLEF) dan menggunakan koleksi dokumen CLEF. Sistem Tanya Jawab ini dikembangkan dengan menerapkan teknik-teknik IR dan mengkombinasikannya dengan teknik pemrosesan bahasa alami. Aspek pemrosesan bahasa alami ditekankan pada analisis struktur ketergantungan (dependency structures) antar kata pada sebuah kalimat. Struktur ketergantungan antar kata diterjemahkan dalam skema anotasi hubungan sintaktik (syntactic relations annotation scheme). Hasil analisis struktur ketergantungan kalimat berupa aturanaturan yang dipakai untuk mengekstrak jawaban dan memperluas pertanyaan. Evaluasi terhadap Sistem Tanya Jawab menghasilkan 20 rights, 19 unsupporteds, dan 3 inexacts untuk query set tahun 2005 yang terdiri dari 92 queries. Sementara untuk query set tahun 2006 diperoleh 32 rights, 16 unsupporteds, dan 4 inexacts dari 152 queries."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Amalia Zahra
"Dengan adanya internet, media televisi, dan radio, data yang tersedia sangat banyak, termasuk data suara. Oleh karena itu, dibutuhkan suatu cara untuk mengorganisasikannya, yakni dengan mengubah data suara menjadi teks terlebih dahulu. Pengolahan selanjutnya cukup dilakukan terhadap teks. Proses konversi data suara menjadi teks inilah yang dikenal dengan sistem pengenalan suara (SPS) otomatis.
Saat ini, SPS untuk berbagai bahasa di dunia telah berkembang pesat, seperti Bahasa Inggris, Perancis, Jepang, Thai, dan lain-lain, sedangkan penelitian SPS untuk Bahasa Indonesia sudah dimulai, namun masih dalam tahap awal. Adanya kebutuhan akan SPS dan perkembangan SPS bahasa lain yang pesat memotivasi penulis untuk melakukan penelitian SPS untuk Bahasa Indonesia.
Fokus penelitian ini adalah pembuatan model akustik yang berkaitan erat dengan kamus fonetik yang digunakan. Oleh karena itu, penulis melakukan eksperimen menggunakan enam jenis kamus fonetik, yaitu IPA, SAMPA, ARPABET, Lestari [LEST06], Sakti [SAKT08], dan kamus yang dikembangkan oleh penulis (kamus Zahra). Eksperimen terbagi menjadi dua proses besar, yaitu pelatihan, dengan menggunakan 1.000 data suara rekaman telepon, dan pengujian terhadap 250 data suara rekaman telepon.
Hasil eksperimen menunjukkan bahwa akurasi SPS tertinggi diperoleh saat menggunakan kamus Zahra, yakni sebesar 73,5%. Dengan menggunakan kamus fonetik yang sama, pengujian terhadap 100 berkas rekaman berita RRI menghasilkan akurasi maksimum sebesar 71,6% dengan OOV (Out of Vocabulary) sebesar 8,92%. Kamus tersebut merupakan kamus fonetik yang paling tepat untuk mendefinisikan bunyi dalam Bahasa Indonesia, dengan total simbol yang digunakan adalah 33 simbol."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
<<   1 2 3 4   >>