Salah satu kendala terbesar manusia untuk memahami suatu informasi adalah bahasa. Informasi yang ada saat ini berjumlah sangat banyak dan telah dapat disediakan dalam bermacam-macam bentuk mulai dari yang paling sederhana yaitu teks hingga yang lebih canggih dengan menggunakan berkas suara. Informasi yang disediakan dalam berkas suara akan lebih mudah dimengerti oleh manusia, tetapi tetap saja informasi ini tidak lepas dari permasalahan utama yaitu bahasa. Dengan adanya permasalahan diatas, dilakukanlah pengembangan sistem penerjemahan suara ke suara untuk bahasa Indonesia ke bahasa Inggris yang memungkinkan penerjemahkan berkas suara berbahasa Indonesia menjadi suara dalam bahasa Inggris sehingga kendala pemahaman untuk kedua bahasa tersebut dapat dikurangi. Pengembangan sistem penerjemahan suara ke suara ini melibatkan sistem pengenalan suara yang memungkinkan pengubahan data suara menjadi teks, mesin penerjemah yang memungkinkan komputer untuk melakukan penerjemahan teks dari satu bahasa ke bahasa lain dan sistem sintesis suara yang memungkinkan komputer untuk menghasilkan suara dari teks. Pada penelitian ini, terdapat tiga macam data yang digunakan yaitu rekaman percakapan, rekaman novel dan rekaman menggunakan telepon. Akurasi tertinggi dari hasil yang dikeluarkan oleh sistem pengenalan suara adalah pengenalan kata sebesar 96.10% untuk rekaman percakapan dan pengenalan kalimat sebesar 83.70% untuk rekaman percakapan. Untuk mesin penerjemah, akurasi tertinggi yang diperoleh adalah sebesar 0.38 pada rekaman percakapan, sedangkan akurasi sistem sintesis suara adalah 34% untuk rekaman menggunakan telepon.
The biggest challenge for human to understand information is language barrier. Nowadays, the number of information has grown rapidly and the information is available from text to multimedia such as audio or speech. The information presented in a speech document can be understood more easily by human; however, this information is difficult to be translated into another language. The development of Indonesia - English speech to speech translation system enables the translation of Indonesian speech into English speech. The development of speech to speech translation system involves the speech recognition system which enables the conversion of speech data into text, machine translation system which enables the computer to translate texts form one language to another and a speech synthesis system which enables the computer to produce speech form texts. There are three kinds of speech data that are used on this research: conversation and novel sentences recorded using a speech recorder and conversation sentences recorded using mobile telephone. The highest accuracy for speech recognition system`s output is 96.10% for the word recognition and 83.70% for the sentence recognition on conversation speech. For the machine translation, the highest accuracy is 0.38 for conversation recorded using a speech recorder, while the speech synthesis system achieves the highest accuracy of 34% for the conversation recorded using mobile telephone.