Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 1812 dokumen yang sesuai dengan query
cover
Koehn, Philipp
Cambridge, UK: Cambridge University Press, 2010
418.020 285 KOE s
Buku Teks SO  Universitas Indonesia Library
cover
Tatag Aziz Prawiro
"Normalisasi teks merupakan task pada NLP yang dapat digunakan untuk meningkatkan performa dari aplikasi-aplikasi NLP lain. Penelitian tentang normalisasi teks pada bahasa Indonesia masih jarang dan kebanyakan masih hanya menormalisasi pada tingkat token. Penelitian ini bertujuan untuk mengevaluasi pembangunan model normalisasi dengan menggunakan algoritma statistical machine translation (SMT). Isu dari pendekatan machine translation dalam penyelesaian task normalisasi teks
adalah butuhnya data yang relative banyak. Penelitian ini juga melihat bagaimana pengaruh dari pemelajaran semi-supervised dengan cara menggunakan pseudo-data dalam pembangunan model normalisasi teks dengan algoritma statistical machine translation. Model SMT memiliki performa yang cukup baik pada data tanpa tanda baca, namun memiliki performa yang buruk pada data bertanda baca karena banyaknya noise. Pendekatan semi-supervised menurunkan performa SMT secara keseluruhan, namun, pada jenis data tidak bertanda baca penurunan relatif tidak signifikan.

Text normalization is a task in NLP which can be used to improve the performance of other NLP
applications. Research on text normalization in Indonesian language is still rare and most only
normalize at the token level. This study attempts to improve the development of the normalization
model by using the statistical machine translation (SMT) algorithm. The issue in building a good
performing text normalization model using the machine translation approach is the relatively large
data needs. This research also looks at how using semi-supervised learning by using pseudo-data as
training data in SMT approach affects text normalization performance. The SMT model has a fairly
good performance on data without punctuation, but has poor performance on data with a punctuation
due to the amount of noise. The semi-supervised approach reduces the overall performance of the
SMT model, but the reduction in performance is relatively insignificant on data without punctuation.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Massachusetts: MIT Press, 1965
410 MAC;410 MAC
Buku Teks SO  Universitas Indonesia Library
cover
"On application of natural language processor that has been widely developed is translation machine, a machine translating sentences from one natural language in to another natural language...."
Artikel Jurnal  Universitas Indonesia Library
cover
Andri Apriyana SA
"ABSTRAK
Sebagai proses alamiah dalam mencapai titik ekuilibrium, perkembangan ekonomi digital akan selalu diikuti oleh peningkatan risiko keamanan cyber. Penelitian ini membahas analisis big data percakapan media sosial Twitter dengan tipe data yang tidak terstruktur untuk memprediksi risiko cyber berupa keberhasilan serangan exploit terhadap kerentanan sistem informasi yang dipublikasikan pada situs kerentanan global cvedetails.com common vulnerabilities and exposures CVE . Penelitian ini mengeksplorasi aspek kualitatif dan kuantitatif atas data yang bersumber dari twitter dan CVE menggunakan metode pemodelan algoritmik statistical machine learning. Prediksi dilakukan dengan membandingkan beberapa model klasifikasi yang dipilih dari sepuluh algoritma yang paling banyak digunakan dalam data mining berdasarkan survey yang dilakukan oleh IEEE pada International Conference on Data Mining tahun 2006. Hasil prediksi terbaik dihasilkan melalui model algoritma Artificial Neural Networks dengan tingkat akurasi 96,73 . Model prediksi dapat dimanfaatkan oleh perusahaan asuransi dengan produk perlindungan risiko cyber untuk mengurangi potensi penyebaran klaim terjadinya risiko. Model juga dapat dimanfaatkan oleh perusahaan umum untuk melakukan mitigasi risiko cyber secara efektif dan efisien dengan menghindari situasi false-negatives error dalam pengelolaan risiko.

ABSTRACT
As a natural process in achieving equilibrium state, digital economic progress will always be followed by the increase of cyber security risk exposure. This research is focusing on unstructured Twitter social media big data analytics to predict cyber risks event in terms of successful attack on exploit based software vulnerability published in global vulnerability information websites cvedetails.com common vulnerabilities and exposures CVE . This research explores qualitative and quantitative aspect of data extracted from Twitter and CVE using statistical machine learning algorithmic modeling method. Prediction result obtained by comparing and selecting classification model from several statistical machine learning algorithm based on top ten algorithms in data mining survey produced by IEEE in 2006 International Conference on Data Mining. The best prediction results provided through Artificial Neural Networks algorithm with 96,73 accuracy rate. This prediction model offers advantages for insurance company with cyber liability product by reducing claim spread probability over cyber risk loss event. Prediction model can also be beneficial for company in general by providing an effective and efficient way to mitigate cyber risks through false negatives error avoidance in risk management."
2017
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Hawari Ibadillah
"Ketepatan transfer makna dalam penerjemahan teks hukum sangatlah penting. Karya tulis ini bertujuan untuk menganalisis penerjemahan teks hukum berdasarkan teori Koponen (2010). Metode penelitian ini merupakan metode kualitatif dengan membandingkan terjemahan teks hukum dari bahasa Belanda ke dalam bahasa Indonesia yang dilakukan oleh 2 mesin penerjemah dan 1 model bahasa kecerdasan buatan dengan arsitektur GPT (Generative Pre-Trained Transformer) dengan terjemahan manusia sebagai pembanding. Hasil terjemahan dianalisis berdasarkan klasifikasi kesalahan penerjemahan mesin Maarit Koponen, dengan fokus pada aspek kebahasaan dan kontekstual. Klasifikasi kesalahan yang paling banyak ditemukan adalah konsep yang salah diterjemahkan (55,3%) disusul dengan penggantian konsep (30,3%). Kesalahan-kesalahan yang terjadi disebabkan oleh kompleksitas transfer makna, terutama yang menuntut ketelitian ekstra dalam proses penerjemahan. Temuan ini menegaskan pentingnya peran manusia dalam proses penerjemahan, terutama penerjemahan teks yang memerlukan ketelitian dan pemahaman mendalam terhadap terminologi dan konteks khusus, di antaranya teks hukum.

Accuracy in meaning transfer in legal text translation is crucial. This paper aims to analyze the translation of legal texts based on Koponen's (2010) theory. The research method is qualitative, comparing translations of legal texts from Dutch to Indonesian performed by 2 translation machines and 1 artificial intelligence language model with a Generative Pre-Trained Transformer (GPT) architecture, using human translation as a benchmark. The translations are analyzed based on Maarit Koponen's machine translation error classification, focusing on linguistic and contextual aspects. The most frequently found error classification is mistranslation of concepts (55.3%), followed by concept substitution (30.3%). The errors occur due to the complexity of meaning transfer, particularly requiring extra precision in the translation process. These findings emphasize the important role of humans in the translation process, especially for texts that require meticulousness and deep understanding of specific terminology and context, including legal texts.
"
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Muhammad Hawari Ibadillah
"Ketepatan transfer makna dalam penerjemahan teks hukum sangatlah penting. Karya tulis ini bertujuan untuk menganalisis penerjemahan teks hukum berdasarkan teori Koponen (2010). Metode penelitian ini merupakan metode kualitatif dengan membandingkan terjemahan teks hukum dari bahasa Belanda ke dalam bahasa Indonesia yang dilakukan oleh 2 mesin penerjemah dan 1 model bahasa kecerdasan buatan dengan arsitektur GPT (Generative Pre-Trained Transformer) dengan terjemahan manusia sebagai pembanding. Hasil terjemahan dianalisis berdasarkan klasifikasi kesalahan penerjemahan mesin Maarit Koponen, dengan fokus pada aspek kebahasaan dan kontekstual. Klasifikasi kesalahan yang paling banyak ditemukan adalah konsep yang salah diterjemahkan (55,3%) disusul dengan penggantian konsep (30,3%). Kesalahan-kesalahan yang terjadi disebabkan oleh kompleksitas transfer makna, terutama yang menuntut ketelitian ekstra dalam proses penerjemahan. Temuan ini menegaskan pentingnya peran manusia dalam proses penerjemahan, terutama penerjemahan teks yang memerlukan ketelitian dan pemahaman mendalam terhadap terminologi dan konteks khusus, di antaranya teks hukum.

Accuracy in meaning transfer in legal text translation is crucial. This paper aims to analyze the translation of legal texts based on Koponen's (2010) theory. The research method is qualitative, comparing translations of legal texts from Dutch to Indonesian performed by 2 translation machines and 1 artificial intelligence language model with a Generative Pre-Trained Transformer (GPT) architecture, using human translation as a benchmark. The translations are analyzed based on Maarit Koponen's machine translation error classification, focusing on linguistic and contextual aspects. The most frequently found error classification is mistranslation of concepts (55.3%), followed by concept substitution (30.3%). The errors occur due to the complexity of meaning transfer, particularly requiring extra precision in the translation process. These findings emphasize the important role of humans in the translation process, especially for texts that require meticulousness and deep understanding of specific terminology and context, including legal texts.
"
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Muhammad Hawari Ibadillah
"Ketepatan transfer makna dalam penerjemahan teks hukum sangatlah penting. Karya tulis ini bertujuan untuk menganalisis penerjemahan teks hukum berdasarkan teori Koponen (2010). Metode penelitian ini merupakan metode kualitatif dengan membandingkan terjemahan teks hukum dari bahasa Belanda ke dalam bahasa Indonesia yang dilakukan oleh 2 mesin penerjemah dan 1 model bahasa kecerdasan buatan dengan arsitektur GPT (Generative Pre-Trained Transformer) dengan terjemahan manusia sebagai pembanding. Hasil terjemahan dianalisis berdasarkan klasifikasi kesalahan penerjemahan mesin Maarit Koponen, dengan fokus pada aspek kebahasaan dan kontekstual. Klasifikasi kesalahan yang paling banyak ditemukan adalah konsep yang salah diterjemahkan (55,3%) disusul dengan penggantian konsep (30,3%). Kesalahan-kesalahan yang terjadi disebabkan oleh kompleksitas transfer makna, terutama yang menuntut ketelitian ekstra dalam proses penerjemahan. Temuan ini menegaskan pentingnya peran manusia dalam proses penerjemahan, terutama penerjemahan teks yang memerlukan ketelitian dan pemahaman mendalam terhadap terminologi dan konteks khusus, di antaranya teks hukum.

Accuracy in meaning transfer in legal text translation is crucial. This paper aims to analyze the translation of legal texts based on Koponen's (2010) theory. The research method is qualitative, comparing translations of legal texts from Dutch to Indonesian performed by 2 translation machines and 1 artificial intelligence language model with a Generative Pre-Trained Transformer (GPT) architecture, using human translation as a benchmark. The translations are analyzed based on Maarit Koponen's machine translation error classification, focusing on linguistic and contextual aspects. The most frequently found error classification is mistranslation of concepts (55.3%), followed by concept substitution (30.3%). The errors occur due to the complexity of meaning transfer, particularly requiring extra precision in the translation process. These findings emphasize the important role of humans in the translation process, especially for texts that require meticulousness and deep understanding of specific terminology and context, including legal texts.
"
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2024
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Felicia Salim
"Perkembangan teknologi membawa banyak inovasi pada berbagai bidang, salah satunya dalam bidang penerjemahan sastra dan bahasa. Dengan munculnya mesin-mesin penerjemah berbasis Neural Machine Translate (NMT) membantu dan mempercepat penerjemahan kumpulan karya dan teks dalam berbagai bahasa, tetapi tidak diketahui apakah terjemahan mesin tersebut sudah tepat dan lebih unggul dibandingkan dengan terjemahan manusia. Penelitian ini mengkaji secara semantis dan sintaktis hasil terjemahan mesin berbasis NMT yaitu Baidu Translate, Youdao Translate dan Google Translate dibandingkan dengan terjemahan penerjemah pada buku Dizigui. Metode yang digunakan adalah metode penelitian kualitatif dengan melakukan penelusuran terhadap suku kata, frasa, klausa dan kalimat kemudian dikomparasikan hasil terjemahan tersebut dengan hasil terjemahan penerjemah dalam buku Dizigui. Hasil penelitian menemukan bahwa terjemahan manusia memiliki keunggulan dibandingkan dengan terjemahan mesin penerjemah. Hal membedakan terjemahan  mesin dan manusia terdapat pada cara mesin memaknai karakter, interpretasi mesin terhadap komposisi sintaktis dan pengetahuan konsep budaya pada setiap karakter kutipan teks.

Technology developments have brought many innovations in various fields, one of which is in the field of literary and language translation. With the advance of machine translation based on Neural Machine Translate (NMT) it helps and accelerates the translation of collections of works and texts in various languages, but it’s unknown whether machine translation is correct and superior to human translation. This study examines semantically and syntactically the results of NMT-based machine translations Baidu Translate, Youdao Translate and Google Translate compared to translator’s translations in Dizigui book. The method used is a qualitative research method by searching syllables, phrases, clauses and sentences then compared the results of the translation with the results of the translator's translation in Dizigui's book. The results of the study found that human translation has an advantage over machine translation. What distinguishes machine and human translation lies in the way the machine interprets the characters, the machine's interpretation of the syntactic composition and knowledge of the cultural concept in each character of the text quote."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Evan Aurelrius
"Di era kemajuan teknologi yang pesat, pembelajaran daring semakin populer terutama setelah COVID-19. Namun, tunarungu sering menghadapi kesenjangan dalam memahami video pembelajaran. Salah satu solusi yang dapat membantu adalah dengan menyediakan subtitle dalam bahasa isyarat, khususnya Sistem Isyarat Bahasa Indonesia (SIBI). Untuk mengembangkan subtitle ini, diperlukan teks input dari video pembelajaran. Namun, teks input seringkali terlalu panjang dan mengandung banyak kata yang tidak ada dalam kamus bahasa isyarat SIBI. Metode yang ada sekarang pun menghasilkan animasi SIBI secara kata demi kata, yang mengakibatkan animasi bergerak cepat dan sulit diikuti oleh pengguna tunarungu. Penelitian ini membahas integrasi translasi teks dalam pengembangan subtitle animasi isyarat SIBI untuk aplikasi Moodle, menggunakan machine learning. Penelitian ini bertujuan untuk mengembangkan solusi yang lebih efektif dengan menerapkan terjemahan teks. Penelitian ini mengusulkan penggunaan dua model pretrained, yaitu mBART50 dan NLLB200 sebagai baseline model dan model yang akan di-finetuning. Eksperimen ini menggunakan dataset yang dikumpulkan dari 12 video pembelajaran. Kemudian data ini diproses, dianotasi oleh guru Sekolah Luar Biasa (SLB), dan digunakan untuk training, validation, serta testing dan dataset ini dinamakan SIBIVID-MP12. Eksperimen dilakukan dengan membandingkan model baseline dengan model yang sudah di-finetuning. Finetuning dilakukan dengan dan tanpa custom loss function yang merupakan inovasi pada penelitian ini. Custom loss function menambahkan SIBIDictLoss pada total loss model, sehingga akan memaksa model untuk hanya menggunakan kata yang ada pada kamus SIBI. Hasil eksperimen menunjukkan bahwa dengan adanya finetuning, model mBART50 dan NLLB200 mengalami peningkatan performa dibandingkan model baseline-nya tanpa finetuning dalam melakukan terjemahan teks Bahasa Indonesia ke dalam SIBI. Model NLLB200 FT+CL dengan varian batch size 4, penggunaan weighting varian kedua, ukuran weight 0,2, dan besaran penalti 0,1 menjadi varian dengan nilai evaluasi tertinggi dengan peningkatan nilai sacreBLEU sebesar 71%, nilai chrF++ sebesar 9,79%, nilai METEOR 22,92%, dan nilai ROUGE-L 14,55% dibandingkan dengan model baseline. Ini menunjukkan bahwa mengintegrasikan model terjemahan teks dapat meningkatkan inklusivitas dan aksesibilitas platform pembelajaran daring bagi komunitas tunarungu di Indonesia.

In the era of rapid technological advancement, online learning has become increasingly popular, particularly following the COVID-19 pandemic. However, the deaf community often faces challenges in comprehending educational videos. One potential solution is to provide subtitles in sign language, specifically the Indonesian Sign Language System (SIBI). Developing these subtitles requires text input from educational videos. However, the input text is often too lengthy and contains many words that do not exist in the SIBI dictionary. Current methods generate SIBI animations word by word, resulting in fastmoving animations that are difficult for deaf users to follow. This research discusses the integration of text translation in the development of SIBI animated subtitles for the Moodle application, using machine learning. The study aims to develop a more effective solution by implementing text translation. The research proposes the use of two pretrained models, mBART50 and NLLB200, as baseline models and models for fine-tuning. The experiment utilizes a dataset collected from 12 educational videos. This data is processed, annotated by Special Education (SLB) teachers, and used for training, validation, and testing, and is named SIBIVID-MP12. Experiments were conducted by comparing the baseline models with the fine-tuned models. Fine-tuning was performed with and without a custom loss function, which is an innovation in this study. The custom loss function adds SIBIDictLoss to the total model loss, thereby compelling the model to use only words present in the SIBI dictionary. The experimental results show that with fine-tuning, both mBART50 and NLLB200 models demonstrated improved performance compared to their baseline models in translating Indonesian text into SIBI. The NLLB200 FT+CL model, with a batch size variant of 4, the second weighting variant, a weight size of 0.2, and a penalty size of 0.1, achieved the highest evaluation scores, with an increase in sacreBLEU score by 71%, chrF++ score by 9.79%, METEOR score by 22.92%, and ROUGE-L score by 14.55% compared to the baseline model. This indicates that integrating text translation models can enhance the inclusivity and accessibility of online learning platforms for the deaf community in Indonesia."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>