Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 141270 dokumen yang sesuai dengan query
cover
Hansel Tanuwijaya
"Mesin penerjemah merupakan alat penerjemah otomatis pada sebuah teks dari satu bahasa ke bahasa lainnya. Mesin penerjemah statistik adalah sebuah pendekatan mesin penerjemah dengan hasil terjemahan dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus teks bilingual (atau paralel). Kualitas hasil terjemahan Bahasa Inggris - Bahasa Indonesia tersebut masih jauh dari sempurna dan memiliki nilai akurasi yang rendah.
Diawali dari permasalahan ini, muncullah sebuah ide untuk membuat aturan-aturan restrukturisasi teks pada Bahasa Inggris sesuai dengan struktur Bahasa Indonesia dengan tujuan untuk meningkatkan kualitas dan nilai akurasi hasil terjemahan mesin penerjemah statistik. Aturan restrukturisasi teks tersebut bisa berupa word reordering, phrase reordering, ataupun keduanya. Dalam penelitian ini, penulis merancang 7 buah aturan word reordering, 7 buah aturan phrase reordering, dan 2 buah aturan gabungan phrase reordering dan word reordering.
Hasil eksperimen menunjukkan peningkatan akurasi dan kualitas penerjemahan yang efektif diperoleh dengan word reordering. Word reordering dapat memberikan peningkatan nilai BLEU sebesar 1.3896% (dari 0.1871 menjadi 0.1897) dan nilai NIST sebesar 0.6218% (dari 5.3876 menjadi 5.4211). Pada korpus bible, rata-rata nilai peningkatan nilai BLEU yang diperoleh dengan restrukturisasi teks adalah 0.5871% dan untuk nilai NIST terjadi penurunan sebesar 0.0144%. Pada korpus novel, rata-rata nilai peningkatan nilai BLEU yang diperoleh dengan restrukturisasi teks adalah 0.8751% dan untuk nilai NIST terjadi peningkatan sebesar 0.3170%. Besarnya peningkatan dan penurunan yang terjadi pada penelitian ini cenderung kecil (masih di bawah 1%). Hal ini disebabkan aturan penerjemahan Bahasa Inggris-Indonesia menggunakan aturan MD-DM yang melibatkan penukaran kata yang jaraknya dekat sudah tercakup dalam distortion model pada mesin penerjemah statistik berdasarkan frase."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
AJ-Pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Hansel Tanuwijaya
"Mesin penerjemah merupakan alat penerjemah otomatis pada sebuah teks dari satu bahasa ke bahasa lainnya. Tujuan dari mesin penerjemah adalah dapat membuat orang ? orang yang berasal dari berbagai budaya, yang memiliki bahasa yang berbeda, dapat berkomunikasi satu sama lain dengan mudah. Mesin penerjemah statistik adalah sebuah pendekatan mesin penerjemah dimana hasil terjemahan dihasilkan atas dasar model statistik yang parameter-parameternya diambil dari hasil analisis korpus teks bilingual (atau paralel). Penelitian di bidang mesin penerjemah statistik untuk Bahasa Inggris ? Bahasa Indonesia belum terlalu mendapat perhatian. Kualitas hasil terjemahan Bahasa Inggris ? Bahasa Indonesia tersebut masih jauh dari sempurna dan memiliki nilai akurasi yang rendah.
Diawali dari permasalahan ini, munculah sebuah ide untuk membuat aturan-aturan restrukturisasi teks pada Bahasa Inggris sesuai dengan struktur Bahasa Indonesia dengan tujuan untuk meningkatkan kualitas dan nilai akurasi hasil terjemahan mesin penerjemah statistik. Aturan restrukturisasi teks tersebut bisa berupa word reordering, phrase reordering, ataupun keduanya. Dalam penelitian ini penulis merancang 7 buah aturan word reordering, 7 buah aturan phrase reordering dan 2 buah aturan gabungan phrase reordering dan word reordering.
Penelitian dilakukan dengan menggunakan Stanford POS Tagger, Stanford Parser, dan MOSES. Stanford POS Tagger digunakan dalam tahap word reordering, Stanford Parser dalam tahap phrase reordering, dan MOSES dalam tahap penerjemahan. Hasil eksperimen menunjukkan peningkatan akurasi dan kualitas penerjemahan yang efektif diperoleh dengan word reordering. Word reordering dapat memberikan peningkatan nilai BLEU sebesar 1.3896% (dari 0.1871 menjadi 0.1897) dan nilai NIST sebesar 0.6218% (dari 5.3876 menjadi 5.4211). Pada korpus bible, rata ? rata nilai peningkatan nilai BLEU yang diperoleh dengan restrukturisasi teks adalah 0.5871% dan untuk nilai NIST terjadi penurunan sebesar 0.0144%. Pada korpus novel, rata ? rata nilai peningkatan nilai BLEU yang diperoleh dengan restrukturisasi teks adalah 0.8751% dan untuk nilai NIST terjadi peningkatan sebesar 0.3170%. Besarnya peningkatan dan penurunan yang terjadi pada penelitian ini cenderung kecil (masih di bawah 1%). Hal ini dikarenakan aturan penerjemahan Bahasa Inggris-Indonesia menggunakan aturan MD-DM yang melibatkan penukaran kata yang jaraknya dekat sudah tercakup dalam distortion model pada mesin penerjemah statistik berdasarkan frase.

Machine translation is an automatic translation tool for a text from one language to another language. The goal of machine translation is to allow people with different cultures and languages to communicate with each other easily. Statistical machine translation is an approach to machine translation in which the results produced on the basis of statistical model that its parameters taken from the bilingual corpus (or parallel) text analysis. The research on statistical machine translation from English to Indonesian has not been received much attention. The English - Indonesian translation quality is still far from perfect and has low accuracy.
Based on this issue, come out an idea to make some text restructuring rules on English according to Indonesian languange structure, with the purpose of improvement the quality and accuracy of the statistical machine translation. Text restructuring rules can be word reordering or phrase reordering or both. In this research, the authors design 7 word reordering rules, 7 phrase reordering rules and 2 combined phrase reordering and word reordering rules.
This research uses Stanford POS Tagger, Stanford Parser, and MOSES. Stanford POS Tagger is used in word reordering process, Stanford parser used in phrase reordering process, and MOSES in translation process. The results from experiments show that the most effective improvement is word reordering. The improvement with word reordering in BLEU score is 1.3896% (from 0.1871 become 0.1897) and for NIST score is 0.6218% (from 5.3876 become 5.4211). On bible corpus, the average of all text restructuring rules score are increased 0.5871% (BLEU) and decreased 0.0144% (NIST). On novel corpus, the average of all text restructuring rules score are increased 0.8751% (BLEU) and increased 0.3170% (NIST). The amount of increase and decrease that occurred in this study is considered as a small occurence (which is still under 1%). This is caused by the MD-DM rules that involve exchanging words that have small distances between their range which have already been accounted for by the distortion model in phrase based statistical machine translation."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Bernadia Puspasari
"Mesin Penerjemah digunakan untuk menerjemahkan teks dari suatu bahasa ke bahasa lain secara otomatis. Mesin Penerjemah Statistik adalah Mesin Penerjemah yang menggunakan pendekatan statistik dalam proses menerjemahkan teks. Penelitian dilakukan dengan menggunakan Mesin Penerjemah Statistik berdasarkan frase yang memanfaatkan korpus dwibahasa paralel sebagai data pelatihannya.
Korpus dwibahasa Indonesia - Jepang yang digunakan berupa koleksi dokumen Kitab Suci, artikel berita, dan percakapan sehari-hari dengan jumlah keseluruhan kalimat sebanyak 24.365 kalimat. Koleksi dokumen dalam bahasa Jepang tersedia dalam dua macam bentuk tulisan, yaitu Kanji atau Romaji. Penelitian dilakukan pada korpus dwibahasa tanpa faktor tambahan dan korpus yang menggunakan perangkat bahasa tambahan, yaitu lema.
Dari hasil penelitian, didapati bahwa kinerja penerjemahan teks Indonesia - Jepang menggunakan Mesin Penerjemah Statistik berdasarkan frase pada penelitian ini, nilai akurasi tertinggi berdasarkan BLEU score mencapai 0,2027. Nilai akurasi tertinggi tersebut didapatkan pada jenis dokumen artikel berita tanpa faktor tambahan dengan model bahasa 5-gram. Sedangkan penambahan perangkat bahasa lema pada korpus pelatihan menurunkan kinerja dari Mesin Penerjemah Statistik berdasarkan frase.

Machine Translation translates text from one language to another automatically. Statistical Machine Translation uses statistical approach to translate text. This research uses phrase-based Statistical Machine Translation system. We use Indonesian ? Japanese bilingual corpora as the training data which consist of holy writings, news article, and daily conversation with total of 24.365 sentences. Japanese document collections are written in Kanji and Romaji.
This research uses unfactored training corpora and factored training corpora (lemma). The highest accuracy based on evaluation of the translation result is 0.2027 in BLEU score which is the score of news article document written in Romaji using 5-gram language model. Factored training corpora (lemma) decreases the performance of the machine translation system."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Rahayu Surtiati Hidayat
"Bertutur pada dasarnya menyampaikan informasi, atau dengan kata lain berkata. Berkata adalah mengujarkan atau melaksanakan tindak lokusi. Kegiatan itu mencakup tiga perbuatan yang berbeda:
1. Tindak menghasilkan inskripsi (urutan lambing di dalam suatu media fisik).
2. Tindak menyusun kalimat
3. Tindak mengkontekstualisasi kalimat itu.
Konteks menentukan makna ujaran pada tiga tataran yang berbeda di dalam analisi teks. Pertama, konteks dapat menjelaskan kalimat apa yang diujarkan atau apakah kalimat memang telah diujarkan. Kedua, konteks biasanya menjelaskan proposisi apa yang diungkapkan atau apakah proposisi memang diungkapkan. Ketiga Konteks menjelaskan bahwa proposisi yang dimaksud diungkapkan dengan satu macam kekuatan ilokusi. Ketiga kegunaan konteks itu menunjukan bahwa konteks relevan untuk menetukan apa yang dkatakan.
Jika kenyataan itu dihubugnkan dengan bahasa Jawa, muncul masalah yang menarik untuk diteliti, yaitu bagaimana berkata itu dilaksanakan dalam bahasa itu. Kita tahu bahwa dalam bahasa itu, ragam bahasa dibedakan secarta demikian eksplisit sehingga konteks sangat menetukan pertuturan."
Depok: Lembaga Penelitian Universitas Indonesia, 1990
LP-pdf
UI - Laporan Penelitian  Universitas Indonesia Library
cover
cover
Zainuddin Mansur
1994
LP-pdf
UI - Laporan Penelitian  Universitas Indonesia Library
cover
Natama Paramatatya
"Skripsi ini membahas tentang kohesi gramatikal dan kohesi leksikal yang terdapat dalam laman www.twitter.com berbahasa Rusia pada olahraga hoki periode tahun 2011 dan 2012. Tujuan penelitian untuk mengidentifikasikan kohesi gramatikal dan kohesi leksikal yang paling dominan dan berpengaruh dalam media tersebut. Analisis dilakukan pada 81 kicauan dari segi kohesi gramatikal dan kohesi leksikalnya, dan hasil yang diperoleh adalah dari 81 kicauan terdapat alat kohesi elipsis nomina dan kata umum yang memiliki persentase tertinggi. Dari penelitian ini disimpulkan bahwa kohesi gramatikal dan kohesi leksikal memiliki peran penting dalam unsur kepaduan suatu teks media online olahraga hoki berbahasa Rusia.

This thesis discusses about the grammatical cohesion and lexical cohesion contained from the website www.twitter.com on hockey in Russian language from the period of 2011 and 2012. The purpose of this research is to find the effect and to identify the most dominant element from grammatical cohesion and lexical cohesion from the online media Twitter. Analyses were conducted on 81 tweets for grammatical and lexical cohesions, and the results show that nominal ellipsis and general word have the highest percentage. This study suggests that the grammatical cohesion and lexical cohesion have an important role in the cohesion of a text element of online media for hockey in Russian language."
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2012
S42914
UI - Skripsi Open  Universitas Indonesia Library
cover
Ngusman Abdul Manaf
"ABSTRACT
The focus of this sociolinguistic study is the relationship between social economic status (socionomic status) and the linguistic code, especially the sentence complexity. The purposes of the study are (1) to measure sentence patterns' among groups of speaker socionomic lower-low, upper-low, lower-middle, and upper-middle; (2) to measure the index of sentence complexity based of the average sentence length (ASL), the index of sentence complexity based on average block length (ABL), and the index of sentence based of the average clause depth (ACD) of four socionomic status groups; (3) to measure the variety of sentence complexity among four socionomic status groups; (4) to measure the effect of socionomic status on the sentence complexity; (5) to measure the contributions of each subvariable of socionomic status to the sentence complexity, and; (6) to measure the close relationship between socionomic status and sentence complexity.
This study used two approaches, namely lingustic and sociological approaches. The relationship between socionomic status and sentence complexity was analyzed in terms deficit theory. The subjects of this study were the native speakers of the Minangkabau language in Municipality of Padang. The data were sentences spoken by informants and individual reports about the social, economic, and cultural conditions of the informants. The data were collected by using recording and questionnaire. The data in the form of sentence were analyzed by using the technique of sentence patterns measurement and sentence complexity according to Cook (1979). Data that were collected by using questionnaire were analyzed by using Hollingshead and Redlich's (1958) and Labov's techniques (1966) to measure the socionomic status of the speakers. Sentence complexity variation among the four socionomic status groups was measured by using one-way variant analysis. The effect of socionomic to the sentence complexity and the contributions of each socionomic's subvariables to sentence complexity were measured by using double regresion analysis technique.
The findings of this study include the following.
There is no significant different between sentence patterns and the index of sentence complexity of oral Minangkabau language spoken by lower-low, upper-low, lower-middle, and upper-middle socionomic status speaker. The sentence patterns and sentence complexity do not indicate the socionomic status of its speakers. There is no difference of linguistic codes in sentence complexity among the four socionomic status groups.
There is no significant effect between socionomic and ASL. On other side, socionomic status gives significant effect to ABL and ACD. All socionomic's subvariables (Job, education, and income) do not give significant contribution to ASL. Among the three subvariables of socionomic, it is only the income that gives significant contribution to ABL and ACD. Although the effect of socionomic to ASL is minimal, it indicates positive correlation between the socionomic status and ASL, ABL, and ACD.
"
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 1997
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ira Purwo Kinanti
"Skripsi ini meneliti ragam bahasa lisan dan kalimat elips dalam tweet akun pribadi berbahasa Jerman. Selain itu, skripsi ini juga meneliti pengetahuan tata bahasa para pengguna Twitter Jerman. Penelitian ini bertujuan untuk mendeskripsikan ragam bahasa lisan dan kalimat elips dalam tweet akun pribadi berbahasa Jerman serta mengetahui apakah pengguna Twitter Jerman tetap mengetahui tata bahasa yang benar. Data berasal dari seratus tweet berbahasa Jerman dan 52 angket yang telah diisi oleh pengguna Twitter Jerman. Dasar teori yang digunakan adalah teori ragam bahasa lisan dari Schwitalla, teori kalimat elips dari Ludger Hoffmann, dan teori perkembangan bahasa dari Rudi Keller. Hasil analisis menunjukkan bahwa 51 tweet menggunakan ragam bahasa lisan dan/ atau kalimat elips dan 81% responden tetap mengetahui tata bahasa Jerman dengan benar.

This thesis researches variation of oral language and elliptical sentence usage in german-speaking personal account tweet. Also, the thesis researches grammar knowledge possessed by german-speaking twitter users. This study aims to describe the variation of oral language and elliptical sentence in german speaking personal account's tweet and to find out whether the german-speaking twitter user still understand the proper grammar. The data comes from observation of 100 german speaking-tweets and 52 questionnaires which have been answered by german speaking twitter users. Theoritical background used here are theory of variation of oral language by Schwitalla, theory of elliptical sentence by Ludge Hoffmann, and theory of language change by Rudi Keller. Analysis result shows that 51 tweet use oral language and/ or elliptical sentence while 81% of respondents still know how to use proper german-grammar in composing their tweets."
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2013
S44247
UI - Skripsi Membership  Universitas Indonesia Library
cover
<<   1 2 3 4 5 6 7 8 9 10   >>