Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 115791 dokumen yang sesuai dengan query
cover
Indri Neforawati
Depok: Fakultas Teknik Universitas Indonesia, 2005
TA3364
UI - Tugas Akhir  Universitas Indonesia Library
cover
Indri Neforawati
"Dalam beberapa tahun ini, minat dalam pencapaian pengkodean suara toll-quality pada data laju kurang atau sama dengan 4 kbps makin meningkat. Penerapan speech coding yang semakin meluas, seperti pada jaringan nirkabel ketiga dalam sistem LEO (Low Earth Orbit), mendorong dilakukannya penelitian-penelitian. Kualitas pengkodean suara berbasis CELP (Code Excited Linier Prediction) menurun dengan cepat pada laju data 6 kbps, sehingga kurang sesuai untuk memenuhi kebutuhan tersebut. ITU (International Telecommunication Union) juga belum menetapkan standar pengkode suara untuk data 4 kbps dengan kualitas toll, sehingga penelitian di bidang ini masih terbuka. Salah satu kandidat pengkode suara untuk memenuhi kebutuhan di atas ialah Wave Interpolation Coder (WIC/Pengkode Interpolasi Gelombang). Pengkode ini pertama kali dikembangkan di AT&T pada tahun 80-an.
Tujuan utama tesis ini ialah untuk meningkatkan kinerja pengkode WI dengan meningkatkan kineija pitch estimator. Pada tesis ini akan diujikan pitch estimator usulan yang dikembangkan dari pitch estimator rekornendasi ITU-T G.729 dan EVRC. Kinerja pengkode WI disimulasikan dengan menggunakan bahasapemprograman Matlab. Simulasi yang dilakukan meliputi pengukuran level SQNR, level segSNR dan rekonstruksi sinyal suara. Pada level SQNR didapatkan harga rata-rata negatip dan level segSNR menpunyai harga kurang dari 5 db , hal ini menunjukkan kinelja WIC lebih ditentukan oleh periodesitas sinyal. Rekonstruksi sinyal menunjukkan hasil yang lebih baik dengan menggunakan filter pitch. Hasil simulasi dengan menggunakan estimator pitch rata-rata menunjukkan peningkatan meskipun tidak signifikan.

Recently the interest of speech code achievement of near-toll-quality at rates of 4 kbps or below increases. The application of speech coding, such as third generation wireless network and Low Earth Orbit (LEO) as well has encouraged the motivation research in this field. In fact, the Quality based on Code Excited Linear Prediction (CELP) ,decreasing at rates 6 kbps and not appropriate with this need. Speech coding standard for the rates of4 kbps and below hasn't obtained recommend ITU-T, and the research in this field is still open. One of the candidates to fulfill that Waveform Interpolation (WI) coder, the code was developed at the first time by AT & T in l980.
The primary objective of this research is to increase of WI code by developing pitch estimator performance. In this research will test the proposed of pitch estimator which developed by from pitch estimator recommended by ITU-T G.729 and EVRC. Simulation performance WIC used MATLAB program, and will be measure SQNR level , segSNR level, and speech reconstruction is analyze. The result of SQNR level giving average negative value and segSNR level have less than 5 dB, this is proved that WIC performance more depend of signal periods not power level.Signal reconstruction used pitch estimator which proposed and pitch filter look more better than another both pitch estimator."
Depok: Fakultas Teknik Universitas Indonesia, 2005
T16114
UI - Tesis Membership  Universitas Indonesia Library
cover
cover
"Teknologi pengenalan suara saat ini telah mengalami perkembangan terutama dalam hal speech processing. Speech processing merupakan suatu cara untuk mengekstrak informasi yang diinginkan dari sebuah sinyal suara. Penelitian ini membahas sistem klasifikasi suara manusia male dan female."
620 JTEK 9 (1-2) 2010
Artikel Jurnal  Universitas Indonesia Library
cover
Andi Yusuf
"Pengenalan ucapan atau disebut juga speech recognition adalah suatu pengembangan teknik dan sistem yang memungkinkan perangkat system untuk menerima masukan berupa kata yang diucapkan. Teknologi ini memungkinkan suatu perangkat untuk mengenali kata yang diucapkan dengan cara merubah kata tersebut menjadi sinyal digital dan mencocokkan dengan suatu pola tertentu yang tersimpan dalam suatu perangkat. Pola tertentu yang tersimpan pada suatu perangkat sebenarnya sampel kata yang diucapkan pengguna. Salah satu algoritma yang digunakan sebagai pemodelan dasar untuk pengenalan ucapan adalah Dynamic Time Warping (DTW). DTW digunakan sebagai algoritma untuk mencocokkan pola yang dimaksud dengan mengukur dua buah sekuensial pola dalam waktu yang berbeda[7].
Dalam penelitian ini akan dibahas mengenai perancangan IC pattern matching menggunakan algoritma DTW dan diimplementasikan pada sebuah Field Programmable Gate Array (FPGA). Algoritma DTW yang digunakan merupakan pengembangan dari algoritma standar yaitu FastDTW[13]. Perancangan difokuskan pada pembuatan layout Complementary Metal Oxide Silicon (CMOS) pada skala 0,18μm dengan metode semi custom. Layout ang terbentuk baik layout untuk IC DTW maupun layout - layout gerbang logika dasar penyusun IC tersebut, dapat dilihat behavior-nya. Dengan menggunakan Computer Aided Design (CAD) Electric behavior dapat diterjemahkan dalam bahasa hardware yang dikenal dengan Very High Speed Integrated Circuit Hardware Description Language (VHSIC HDL atau VHDL). Proses verifikasi dilakukan dengan membuat prototype perangkat keras menggunakan rangkaian ADC dan FPGA Spartan-IIELC yang telah diimplementasikan VHDL dari IC DTW.

Speech recognition is also called a development of techniques and systems that enable the device system to receive input of the spoken word. This technology allowsa device to recognize words spoken in a way to change the word into a digital signal and the match with a particular pattern stored in a device. Certain patterns that are stored on a device is a spoken word sample of users. One algorithm used as a basis for modeling of speech recognition is the Dynamic Time Warping (DTW). DTW is used as an algorithm to match the pattern in question by measuring two sequential patterns in different time [7].
In this research will be discussed regarding the design of the IC pattern matching using DTW algorithm and implemented on a Field Programmable Gate Array (FPGA). DTW algorithm used is the development of a standard algorithm that is FastDTW [13]. The design focused on making the layout of Complementary Metal Oxide Silicon (CMOS) on a scale of 0.18 μm with a method of semi-custom. Formed a good layout for IC DTW and layout of the basic logic gate, we can see his behavior. By using Computer Aided Design (CAD) Electric, behavior can be translated in hardware language, known as Very High Speed Integrated Circuit Hardware Description Language (VHSIC HDL or VHDL). The verification process is done by making a prototype hardware uses a circuit of ADC and the FPGA Spartan-IIELC that have been implemented VHDL from IC DTW.
"
Depok: Fakultas Teknik Universitas Indonesia, 2011
T29927
UI - Tesis Open  Universitas Indonesia Library
cover
Naibaho, Benyamin Parulian
Depok: Fakultas Teknik Universitas Indonesia, 1993
S38346
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sclater, Neil, editor
Indianapolis, Indiana: Howard W. Sams, 1983
621.381 9 SCL i
Buku Teks SO  Universitas Indonesia Library
cover
Mohammad Salman Alfarisi
"

Salah satu permasalahan yang terdapat pada sistem Automatic Speech Recognition (ASR) yang sudah ada adalah kurangnya transparansi dalam penanganan data suara, yang tentunya membuat adanya keraguan terhadap privasi data tersebut. Di sisi lainnya, untuk mengembangkan sebuah sistem ASR yang memiliki akurasi memadai dan dapat bekerja secara luring membutuhkan jumlah data yang banyak, khususnya data suara yang sudah diiringi dengan transkripnya. Hal ini menjadi salah satu hambatan utama pengembangan sistem pengenalan suara, terutama pada yang memiliki sumber daya minim seperti Bahasa Indonesia. Oleh karena itu, dalam penelitian ini dilakukan perancangan sistem pengenalan suara otomatis berbasis model wav2vec 2.0, sebuah model kecerdasan buatan yang dapat mengenal sinyal suara dan mengubahnya menjadi teks dengan akurasi yang baik, meskipun hanya dilatih data dengan label yang berjumlah sedikit. Dari pengujian yang dilakukan dengan dataset Common Voice 8.0, model wav2vec 2.0 menghasilkan WER sebesar 25,96%, dua kali lebih baik dibandingkan dengan model Bidirectional LSTM biasa yang menghasilkan 50% namun membutuhkan jumlah data dengan label 5 kali lipat lebih banyak dalam proses pelatihan. Namun, model wav2vec membutuhkan sumber daya komputasi menggunakan 2 kali lebih banyak RAM dan 10 kali lebih banyak memori dibandingkan model LSTM


One of the main problems that have plagued ready-to-use Automatic Speech Recognition (ASR) Systems is that there is less transparency in handling the user’s voice data, that has raised concerns regarding the privacy of said data. On the other hand, developing an ASR system from scratch with good accuracy and can work offline requires a large amount of data, more specifically labeled voice data that has been transcribed. This becomes one of the main obstacles in speech recognition system development, especially in low-resourced languages where there is minimal data, such as Bahasa Indonesia. Based on that fact, this research conducts development of an automatic speech recognition system that is based on wav2vec 2.0, an Artificial Model that is known to recognize speech signals and convert it to text with great accuracy, even though it has only been trained with small amounts of labeled data. From the testing that was done using the Common Voice 8.0 dataset, the wav2vec 2.0 model produced a WER of 25,96%, which is twice as low as a traditional Bidirectional LSTM model that gave 50% WER, but required 5 times more labeled data in the training process. However, the wav2vec model requires more computational resource, which are 2 times more RAM and 10 times more storage than the LSTM model.

"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Harrington, Jonathan, 1950-
Chichester, U.K.: Wiley-Blackwell, 2010
414.8 HAR p
Buku Teks SO  Universitas Indonesia Library
cover
Pujatmanto Bastriadi
Depok: D3 AKK FKM UI, 1999
808.51 PUJ p
Buku Teks SO  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>