Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 10 dokumen yang sesuai dengan query
cover
Lea, Wayne A.
:Englewood Cliffs, NJ : Prentice-Hall, 1980
621.380 412 LEA t
Buku Teks  Universitas Indonesia Library
cover
New York: Springer-Verlag, 1980
001.534 DIG
Buku Teks SO  Universitas Indonesia Library
cover
Abstrak :
Jenis ikan yang tergolong dalam ikan jenis sonikrous mempunyai suara yang khas_ Beberapa diantaxanya dapat mengeluarkan lebih dari satu jenis suara. Sebagai contoh ikan wealdish (Cynoscion regalis) jantan akan mengeluarkan suara drumming pada masa bertelur dan suara chartering untuk aktiiitas hidup sehari-bali, sedangkan untuk betina hanya mengbluarkan suara cha!!ering.

Untuk dapat mengenali suara ikan tersebut clengan cepat diperlukan suam sarana agar proses identifikasi dapat dilalcukan dengan mudah, Penerapan teknologi voice recognition dapat mempemwdah dan mempercepat proses pengenalan suara ikan. Dengan diketahul suara ikan tersebut mal-za berarti pula dapat diketahui keberadaan jenis ikan dan aktiiitas hidup beberapa jenis ikan tertentu seperti proses bertelur yang terjadi di dalam laut. Penggunaan voice recognition dengan mengaplikasikan hidden mar/:ov model untuk mengidentifikasi suara ikan dapat mengenali dengan baik suara ikan yang dimasukan dalam sistem. Sistem dengan training data berupa sampel suara ikan yang terdiri dari kombinasi beberapa bursi dan satu periode pcnuh dari suara ikan menghasilkan sistem dengan kemampuan recognition yang Iebih baik. Dari percobaan yang dilakukan menunjukan sistem mempunyai tingkat akurasi yang baik sampai sekitar 5O - 90 %.
Fakultas Teknik Universitas Indonesia, 2002
S39789
UI - Skripsi Membership  Universitas Indonesia Library
cover
Amalia Zahra
Abstrak :
Dengan adanya internet, media televisi, dan radio, data yang tersedia sangat banyak, termasuk data suara. Oleh karena itu, dibutuhkan suatu cara untuk mengorganisasikannya, yakni dengan mengubah data suara menjadi teks terlebih dahulu. Pengolahan selanjutnya cukup dilakukan terhadap teks. Proses konversi data suara menjadi teks inilah yang dikenal dengan sistem pengenalan suara (SPS) otomatis. Saat ini, SPS untuk berbagai bahasa di dunia telah berkembang pesat, seperti Bahasa Inggris, Perancis, Jepang, Thai, dan lain-lain, sedangkan penelitian SPS untuk Bahasa Indonesia sudah dimulai, namun masih dalam tahap awal. Adanya kebutuhan akan SPS dan perkembangan SPS bahasa lain yang pesat memotivasi penulis untuk melakukan penelitian SPS untuk Bahasa Indonesia. Fokus penelitian ini adalah pembuatan model akustik yang berkaitan erat dengan kamus fonetik yang digunakan. Oleh karena itu, penulis melakukan eksperimen menggunakan enam jenis kamus fonetik, yaitu IPA, SAMPA, ARPABET, Lestari [LEST06], Sakti [SAKT08], dan kamus yang dikembangkan oleh penulis (kamus Zahra). Eksperimen terbagi menjadi dua proses besar, yaitu pelatihan, dengan menggunakan 1.000 data suara rekaman telepon, dan pengujian terhadap 250 data suara rekaman telepon. Hasil eksperimen menunjukkan bahwa akurasi SPS tertinggi diperoleh saat menggunakan kamus Zahra, yakni sebesar 73,5%. Dengan menggunakan kamus fonetik yang sama, pengujian terhadap 100 berkas rekaman berita RRI menghasilkan akurasi maksimum sebesar 71,6% dengan OOV (Out of Vocabulary) sebesar 8,92%. Kamus tersebut merupakan kamus fonetik yang paling tepat untuk mendefinisikan bunyi dalam Bahasa Indonesia, dengan total simbol yang digunakan adalah 33 simbol.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Arina Haq
Abstrak :
Aktivitas bongkar muat kargo bahan bakar dengan kapal tanker di pelabuhan di Indonesia memiliki kekurangan terkait efisiensi waktu dan kecepatan. Sebuah virtual robotic dibuat untuk dapat meningkatkan efisiensi waktu terhadap proses bongkar muat tersebut. Namun dibutuhkan suatu cara agar robot dapat berkomunikasi dengan petugas kapal tanker selama proses bongkar muat dilakukan. Karena pelabuhan tempat proses bongkar muat termasuk kedalam lokasi berbahaya dan mudah meledak, maka komunikasi yang diperbolehkan hanyalah komunikasi suara melalui radio Very High Frequency (VHF) laut. Solusi untuk mengatasi masalah tersebut adalah dengan merancang teknologi yang dapat melakukan pengenalan suara melalui radio VHF laut, salah satunya dengan metode Deep Learning menggunakan arsitektur DeepSpeech. Skripsi ini telah mengembangkan simulasi pengenalan suara menggunakan metode DeepSpeech architecture pada komunikasi radio VHF bagi petugas kapal tanker di pelabuhan laut. Skripsi ini telah mengembangkan uji coba dengan arsitektur DeepSpeech untuk menghasilkan model pengenalan suara dengan hasil keluaran nilai rata-rata Word Error Rate (WER) sebesar 0,335 dan rata-rata Character Error Rate (CER) sebesar 0,263. Skripsi ini juga menganalisa pengaruh variasi nilai learning rate, dropout rate, dan epoch untuk mendapatkan model sistem pengenalan suara terbaik. ......The loading and unloading of fuel cargo by tanker ships at ports in Indonesia has a problem in terms of time efficiency and speed. A virtual robotic is created to increase the time efficiency of the loading and unloading process. However, the robot needs a way to communicate with the tanker ship officers during the process. Because the port where the loading and unloading process took place is considered as a dangerous and explosive location, the only communication allowed is through voice communication via marine Very High Frequency (VHF) radio. The solution to overcome this problem is to design a technology that can perform speech recognition via marine VHF radio, one of which is using the Deep Learning method with DeepSpeech architecture. This thesis has simulated speech recognition system using DeepSpeeh architecture method on VHF radio communication for tanker ship officers at sea ports. This thesis has tested the DeepSpeech architecture to produce a speech recognition model with an average WER value of 0,335 and an average CER value of 0,263. This thesis also analyzes the effect of variations in learning rate, dropout rate, and epoch value to get the best speech recognition system model.
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hari Bagus Firdaus
Abstrak :
Paper ini memaparkan hasil penelitian dalam membangun aplikasi pendiktean Bahasa Indonesia untuk waktu nyata. Dalam membangun sebuah aplikasi pendiktean, terdapat beberapa masalah seperti perintah suara (voice command), Out Of Vocabulary (OOV), noise, dan filler. Adapun yang menjadi fokus dalam penelitian ini adalah penanganan perintah suara dan OOV dari kata yang didiktekan. Pendiktean suara merupakan pengembangan lanjut dari pengenalan suara secara waktu nyata dengan tambahan metode untuk menangani hal-hal yang telah dinyatakan sebelumnya. Untuk menangani perintah suara, sebuah modul ditambahkan untuk mengecek hasil decoding dari sistem pengenalan suara. Adapun untuk menangani OOV, ditambahkan modul penanganan pengejaan setelah sebelumnya dinyatakan status ejaan. Model perintah suara dan model huruf ditambahkan ke dalam kamus dan digunakan sebagai pelatihan dari model bahasa n-gram. Dalam pengujian, dilakukan evaluasi terhadap sistem pengenalan suara, penanganan perintah suara, dan modul pengejaan sebagai strategi untuk menangani kata OOV. Untuk modul pengenalan suara, akurasi yang dicapai adalah 70%. Untuk modul penanganan perintah suara, pengujian menunjukkan bahwa perintah suara dapat ditangani dengan baik. Sedangkan untuk modul pengejaan, pengujian menunjukkan bahwa hanya 20 dari 26 huruf yang berhasil dikenali.
Abstract
In this paper, we presented the results of research in building applications dictation of the Bahasa Indonesia for real-time. In developing a dictation application, there are some problems such as voice command, Out of Vocabulary (OOV), noise, and filler. As the focus in this research is the handling of voice command and OOV from dictated words. Voice dictation is a further development of real time voice recognition with an additional method to deal with things that have been stated before. To handle voice commands, a module is added to check the results of decoding of the voice recognition system. To handle OOV, spelling handling module is added after the previously stated spelling status. Voice command model and the model letter are added to the dictionary and used as the training of n-gram language model. In testing, we conducted an evaluation of speech recognition systems, voice commands and spelling handling module as a strategy to deal with OOV words. For the speech recognition module, the achieved accuracy is 70%. For voice commands handling module, the test showed that voice commands can be handled properly. As for the spelling module, testing showed that only 20 of the 26 letters that successfully recognized.
[Institut Teknologi Bandung, Sekolah Teknik Elektro dan Informatika;Institut Teknologi Bandung. Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung. Sekolah Teknik Elektro dan Informatika], 2011
PDF
Artikel Jurnal  Universitas Indonesia Library
cover
Yuliadi Syarief
Abstrak :
Speech recognition atau pengenalan suara dengan beragam aplikasinya semakin banyak dimanfaatkan diberbagai bidang kehidupan seperti telekomunikasi, sistem keamanan, kedokteran, administrasi dan bidang-bidang praktis lainnya. Karena itulah teknologi ini terus dikembangkan untuk mendapatkan unjuk kerja yang semakin baik. Sejak dimulai pengembangannya, telah banyak metode yang digunakan dengan kemajuan-kemajuan yang berarti dibandingkan metode sebelumnya, termasuk metode yang sampai saat ini terus dikembangkan yaitu metode statistik menggunakan permodelan Hidden Markov. Walaupun masih ada metode lain yang juga memiliki unjuk kerja yang dapat dibandingkan seperti menggunakan jaringan saraf tiruan (neural network). Pada Skripsi ini disimulasikan penggunaan metode permodelan Hidden Markov (HMM) dengan Linear Predictive Coding (LPC) sebagai pengolah sinyal. Parameter-parameter yang dianalisa adalah variasi jumlah data latih, jumlah state, dan jumlah iterasi. Berdasarkan hasil simulasi didapatkan bahwa jumlah data latih memiliki peran terpenting untuk mendapatkan unjuk kerja System yang baik. Sedangkan jumlah state dan jumlah iterasi juga mempengaruhi kemampuan pengenalan walaupun tidak terlalu berarti.
Depok: Fakultas Teknik Universitas Indonesia, 2000
S39817
UI - Skripsi Membership  Universitas Indonesia Library
cover
Oshi Isbani
Abstrak :
Pattern recognition adalah merupakan salah satu pendekatan yang dipakai dalam speech recognition. Salah satu metode pattern recognition yang mudah implementasinya adalah metode Dynamic Time Warping. Metode ini cocok diterapkan untnk sinyal yang memiliki speech rate yang kecil. Pada metode Dynamic Time Warping diterapkan pengenalan terhadap pola atau karakteristik dari sinyal referensi (template) sebagai pola acuan. Kemudian dilakukan pengujian terhadap sinyal uji coba (fest signal) yang akan dibandingkan dengan pola dari sinyal referensi. Perbandingan antara kedua sinyal tersebut akan direpresentasikan secara matematis dalam besaran jarak (distance) yang diperoleh dengan menormalisasi nilai vektor kedua sinyal. Pada skripsi ini, metode Dynamic Time Warping digunakan pada proses speech recognition dan cough detection. Dua buah algoritma yang diusulkan oleh Itakura dan Sakoe-Chiba dibandingkan masing-masing untuk kerjanya. Dari simulasi diperoleh hasil bahwa penggunaan focal consiraini Sakoe-Chiba memberikan prosentase keberhasilan yang lebih baik dibandingkan dengan untuk local constraint Itakura. Secara keseluruhan prosentase keduanya mencapai angka diatas 90 % untuk kondisi speaker dependent dan independent.
Depok: Fakultas Teknik Universitas Indonesia, 2001
S39865
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aswin Juari
Abstrak :
Paper ini menjelaskan tentang implementasi pengenalan OOV (Out of Vocabulary) words pada Aplikasi Pengenal Suara Berbahasa Indonesia. Pengenalan OOV words penting karena masalah ini tidak dapat diselesaikan dengan menambah ukuran kamus. Untuk mengimplementasi pengenalan OOV words, dilakukan transduksi fonem ke kata. Klasifikasi kata-kata diberikan dengan melihat model bahasa dan probabilitas perubahan fonem untuk menentukan bagian yang termasuk OOV words. Pada paper ini juga dilakukan evaluasi terhadap beberapa jenis kamus yang digunakan pada sistem pengenal suara. Modifikasi pada kamus sistem pengenal bahasa Indonesia menghasilkan peningkatan sekitar 4% sedangkan hasil deteksi akurasi OOV sebesar sekitar 77%.
[Fakultas Ilmu Komputer UI;Institut Teknologi Bandung. Teknik Informatika, Institut Teknologi Bandung. Teknik Informatika], 2009
PDF
Artikel Jurnal  Universitas Indonesia Library
cover
Ruki Harwahyu
Abstrak :
ABSTRAK
Fitur suara dapat menjadi alternatif model interaksi pada perangkat tertanam yang dirancang tanpa memiliki banyak tombol kendali, seperti sistem bantu penderita buta warna yang dirancang, yang disebut Chromophore. Skripsi ini membandingkan kinerja fitur suara yang dibuat dengan SAPI5.1 dan fitur suara yang dibuat manual dengan metode penggabungan fonem dan DTW, untuk diimplementasikan pada Chromophore. Skripsi ini juga membandingkan kompatibilitas OS tertanam WinCE6 dan WES09 untuk mendukung fitur suara tersebut. Pengujian fitur suara dilakukan dengan 10 responden untuk mengenali kata-kata yang disintesis sistem dan mengucapkan kata agar dikenali sistem. Pengujian OS dilakukan dengan melihat ukuran, durasi boot, dan dukungannya terhadap aplikasi berfitur suara. Dari uji coba tersebut, diketahui bahwa fitur suara yang dibuat dengan SAPI5.1 memiliki kinerja yang lebih baik dibandingkan dengan fitur suara yang dibuat manual, dengan keberhasilan sintesis suara sebesar 88,33% dan pengenalan suara sebesar 75,87% pada kondisi tenang dan 74,76% pada kondisi bising. Pengujian kedua membuktikan WES09 lebih cocok digunakan dikarenakan dukungannya pada .NET 3.5 dan SAPI5.1.
ABSTRACT
Speech feature can be an alternative interaction model for embedded device, which is designed without many buttons for its control, such as color-blind aid system that is designed, namely Chromophore. This paper compares performance of a speech feature created using SAPI5.1 and a speech feature created manually using phone-concatenate and DTW, to be implemented in Chromophore. This paper also compares the compatibility of embedded operating systems, WinCE6 and WES09, to support the speech feature. The testing for speech feature is done using 10 respondents to identify words synthesized by the systems and to say words to be recognized by the systems. The testing for operating systems is done by observing their size, boot time, and their support for the speech feature. As the result, speech feature created using SAPI5.1 is better than the manually-created one, with success rate 88,33% for speech synthesis, 75,87% and 74,76% for speech recognition in silent and noisy condition. The second testing shows that WES09 is more suitable because of its support for .NET 3.5 and SAPI5.1.
Fakultas Teknik Universitas Indonesia, 2011
S845
UI - Skripsi Open  Universitas Indonesia Library