Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Gorrell, Paul. author
Abstrak :
An examination of the role of syntax in theories of sentence comprehension.
New York: Cambridge University Press, 2006
415 GOR s
Buku Teks  Universitas Indonesia Library
cover
Ria Yuliana
Abstrak :
Pada skripsi ini akan membahas mengenai pengimplementasi pendeteksian pengulangan kata menggunakan Cosine Similarity, sedangkan untuk melihat makna antar kalimat akan dilakukan pembobotan kalimat yang sebelumnya di lakukan proses parsing, stemming, stopword dan melakukan pemisahan antar kalimat. Metode stemming yang akan digunakan adalah metode stemming Arifin-Setiono, proses stemming digunakan untuk mencari kata dasar dari setiap kata pada jawaban dan kemudian dibandingkan dengan kata yang ada pada database. Jika antar kalimat masing-masing dibandingkan dan memiliki nilai cosine similarity lebih dari 0.5 maka sistem tambahan akan menghapus satu kalimat tersebut. Waktu proses antara sistem SIMPLE-O murni lebih cepat jika dibandingkan dengan SIMPLE-O dengan pendeteksian kata yang berulang antar kalimat dengan selisih waktu 0.22 detik. Korelasi nilai antara SIMPLE-O+Cosine dengan Human Raters adalah yaitu sebesar 0.38 untuk soal nomor satu dan untuk soal nomor dua memiliki nilai korelasi yang bernilai negatif 0.08 , untuk soal tiga 0.13, untuk soal empat 0.65 dan 0.022 untuk soal nomor lima. ...... In this paper will discuss the use of word repetition detection implement Cosine Similarity, while to see the meaning of the sentence will be weighted between sentences previously performed process of parsing , stemming , stopword and separation between sentences . Stemming method to be used is a method of stemming Arifin - Setiono , stemming process used to find root of each word in student answer , and then compared with of the word database . If the inter- sentence and has been compared and have value of cosine similarity more than 0.5 , the additional features on the system will remove a sentence . The time between system processes SIMPLE - O more fast when compared with SIMPLE-O with additional features on the system that will repetitive detection word sentence with a time difference between 0.22 seconds. The correlation value of the Human Raters with the SIMPLE-O + Cosine is 0.383 for the first question, -0.08 for the second question, 0.13 for the third question, 0.65 for the fourth question and 0.02 for the fifth question.
Depok: Fakultas Teknik Universitas Indonesia, 2015
S60130
UI - Skripsi Membership  Universitas Indonesia Library
cover
Agus Mulyanto
Abstrak :
ABSTRAK
Sistem pendeteksi emosi EmoLogus ditujukan untuk mengetahui nilai emosi yang terkadung didalam sebuah kalimat percakapan di dalam bahasa perancis pada anak-anak berusia antara 5-9 tahun. Proses pengolahan kalimat untuk mendapatkan nilai emosi meliputi proses pemisahan kalimat kedalam bentuk kata, pembentukan kata agar sesuai dengan struktur bahasa perancis, proses pemahaman kalimat, dan perhitungan nilai emosi. Nilai emosi di definisikan dalam nilai positif dan negative dengan range -2 sampai +2. Nilai negative mewakili perasaan jijik, ketakutan, kemarahan, dan kesedihan, nillai nol mewakili rasa netral, dan nilai positif mewakili rasa gembira dan kejutan. Penelitian ini ditujukan untuk merancang ulang sistem Emologus untuk menghasilkan sebuah aplikasi baru yang lebih mudah di gunakan oleh pengguna awam, sehingga kedepannya EmoLogus tidak hanya diterapkan untuk robot saja, tapi juga untuk aplikasi-aplikasi komputer, mobile dan lain-lain. Dalam penelitian ini digunakan bahasa pemrograman java untuk desain interface grafis dan bahasa pemrograman λProlog yang digunakan untuk pengembangan Emolgus. Hasil penelitian menunjukan bahwa Java dapat berkomunikasi dengan baik dengan bahasa pemrograman λProlog dan aplikasi yang dihasilkan lebih user mudah digunakan yang mana sebelumnya tidak dapat dilakukan dengan bahasa pemrograman λProlog.
ABSTRACT
EmoLogus emotion detection system is intended to determine the value of emotions which is contained in a conversational sentence in French towards children aged between 5-9 years old. The word processing to get the value of emotion includes the sentence separation process into the form of word, formation of words in the structure of French, process of sentence comprehension and calculating the value of emotional. The value of emotion is defined in the positive and negative values with a range of -2 to +2. Negative value represents the feelings of disgust, fear, anger, and sadness. The value of zero represents a sense of neutral. Positive value represents a sense of joy and surprise. This study is aimed to redesign the system of Emologus to generate a new application which is easier to be used by novice users, so that Emologus is not only applied for robots, but also for computer applications, mobiles and others. This study uses java programming language for graphics and interface design and λProlog which is used for the development Emolgus before. The result of this research shows that Java can communicate well with λProlog programming language and the application which is produced is better than before. It could not be done before with λProlog programming language, but now it can.
2012
T30941
UI - Tesis Open  Universitas Indonesia Library
cover
Muhammad Faisal Adi Soesatyo
Abstrak :
Pendekatan transfer learning telah digunakan di beragam permasalahan, khususnya low-resource language untuk meningkatkan performa model di masing-masing permasalahan tersebut. Fokus pada penelitian ini ingin menyelidiki apakah pendekatan cross-lingual transfer learning mampu meningkatkan performa pada model constituency parsing bahasa Indonesia. Constituency parsing adalah proses penguraian kalimat berdasarkan konstituen penyusunnya. Terdapat dua jenis label yang disematkan pada konstituen penyusun tersebut, yakni POS tag dan syntactic tag. Parser model yang digunakan di penelitian ini berbasis encoder-decoder bernama Berkeley Neural Parser. Terdapat sebelas macam bahasa yang digunakan sebagai source language pada penelitian ini, di antaranya bahasa Inggris, Jerman, Prancis, Arab, Ibrani, Polandia, Swedia, Basque, Mandarin, Korea, dan Hungaria. Terdapat dua macam dataset bahasa Indonesia berformat Penn Treebank yang digunakan, yakni Kethu dan ICON. Penelitian ini merancang tiga jenis skenario uji coba, di antaranya learning from scratch (LS), zero-shot transfer learning (ZS), dan transfer learning dengan fine-tune (FT). Pada dataset Kethu terdapat peningkatan F1 score dari 82.75 (LS) menjadi 84.53 (FT) atau sebesar 2.15%. Sementara itu, pada dataset ICON terjadi penurunan F1 score dari 88.57 (LS) menjadi 84.93 (FT) atau sebesar 4.11%. Terdapat kesamaan hasil akhir di antara kedua dataset tersebut, di mana masing-masing dataset menyajikan bahwa bahasa dari famili Semitic memiliki skor yang lebih tinggi dari famili bahasa lainnya. ......The transfer learning approach has been used in various problems, especially the low-resource languages, to improve the model performance in each of these problems. This research investigates whether the cross-lingual transfer learning approach manages to enhance the performance of the Indonesian constituency parsing model. Constituency parsing analyzes a sentence by breaking it down by its constituents. Two labels are attached to these constituents: POS tags and syntactic tags. The parser model used in this study is based on the encoder-decoder named the Berkeley Neural Parser. Eleven languages are used as the source languages in this research, including English, German, French, Arabic, Hebrew, Polish, Swedish, Basque, Chinese, Korean, and Hungarian. Two Indonesian PTB treebank datasets are used, i.e., the Kethu and the ICON. This study designed three types of experiment scenarios, including learning from scratch (LS), zero-shot transfer learning (ZS), and transfer learning with fine-tune (FT). There is an increase in the F1 score on the Kethu from 82.75 (LS) to 84.53 (FT) or 2.15%. Meanwhile, the ICON suffers a decrease in F1 score from 88.57 (LS) to 84.93 (FT) or 4.11%. There are similarities in the final results between the two datasets, where each dataset presents that the languages from the Semitic family have a higher score than the other language families.
Depok;;: Fakultas Ilmu Komputer Universitas Indonesia;;, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Machffud Tra Harana Vova
Abstrak :
Indonesia merupakan negara yang wilayahnya sering mengalami bencana alam. Salah satu penanganan bencana alam adalah pengumpulan informasi berita bencana seperti artikel atau koran, yang mana berguna untuk meningkatkan readability. Meskipun be- gitu, sekadar pengumpulan artikel saja cukup sulit karena identfikasinya dapat memakan waktu serta makna yang termuat pada berita juga masih perlu diserap. Oleh karena itu perlu dilakukan klasifikasi dokumen untuk memilih teks dokumen yang relevan dengan bencana alam, kemudian dari teks dokumen yang relevan dilakukan ekstraksi informasi. Penelitian mengenai klasifikasi teks bencana alam serta ekstraksi informasi yang sudah dilakukan masih menggunakan pendekatan pemelajaran mesin tradisional serta belum memanfaatkan pre-trained model berbasis bahasa Indonesia. Penggunaan pre-trained model dan pendekatan deep learning sendiri sering memperoleh performa yang lebih baik, sehingga ada kemungkinan performa yang dihasilkan dapat ditingkatkan. Dalam penelitian ini dilakukan eksperimen menggunakan pre-trained word embedding seperti Word2Vec dan fastText, pendekatan deep learning seperti BERT dan BiLSTM untuk task klasifikasi. Hasil dengan pendekatan pemelajaran mesin tradisional dengan BoW yang sudah direproduksi menjadi yang terbaik hampir secara keseluruhan, meskipun jenis classifier yang digunakan adalah MLP yang mana sudah menerapkan deep learning karena memiliki beberapa neuron. Kemudian pada penggunaan model pre-trained seperti BERT, terdapat keterbatasan panjang masukan. Keterbatasan ini dapat ditangani dengan membuat representasi dokumen menjadi lebih pendek menggunakan metode peringkasan teks. Hasil representasi ringkasan dokumen dalam penelitian ini mampu meningkatkan performa akurasi klasifikasi baik pada pendekatan pemelajaran mesin tradisional maupun deep learning. Penelitian ini juga melakukan ekperimen penggunaan pre-trained model yang sudah fine-tuned untuk task ekstraksi lokasi seperti NER dan dependency parsing berbasis bahasa Indonesia, meskipun belum dihasilkan performa yang cukup baik. ......Indonesia is a country whose often experiences natural disasters. One way to deal with natural disasters is to collect disaster news information such as articles or newspapers, which are useful for increasing readability. Even so, just collecting articles is quite difficult because identification can take time and the meaning contained in the news still needs to be absorbed. Therefore, it is necessary to classify documents to select document texts that are relevant to natural disasters, then extract information from the relevant document texts. Research on natural disaster text classification and information extraction that has been carried out still uses the traditional machine learning approach and has not yet utilized Indonesian language-based pre-trained models. The use of pre- trained models and deep learning approaches themselves often get better performance, so there is a possibility that the resulting performance can be improved. In this study, experiments were carried out using pre-trained word embedding such as Word2Vec and fastText, deep learning approaches such as BERT and BiLSTM for classification tasks. The results with traditional machine learning approaches with reproducible BoW are the best almost overall, even though the type of classifier used is MLP which already implements deep learning because it has few neurons. Then in the use of pre-trained models such as BERT, there are limitations to the length of the input. This limitation can be overcome by making the document representation shorter using the text summary method. The results of the document summary representation in this study were able to improve the performance of classification accuracy in both traditional and deep learning machine learning approaches. This study also conducted experiments using pre-trained models that had been fine-tuned for location extraction tasks such as NER and Indonesian language-based dependency parsing, although they did not produce sufficiently good performance.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library