Ditemukan 152606 dokumen yang sesuai dengan query
Stanley Pratama
"Parafrasa merupakan suatu cara untuk menuliskan kalimat dengan kata-kata lain dengan maksud atau tujuan yang sama. Pendeteksian parafrasa otomatis dapat dilakukan dengan menggunakan Natural Language Sentence Matching (NLSM) yang merupakan bagian dari Natural Language Processing (NLP). NLP merupakan teknik komputasi untuk memproses teks secara umum, sedangkan NLSM dikhususkan untuk mencari hubungan antar dua kalimat. Dengan adanya perkembangan neural network (NN), maka saat ini NLP dapat lebih mudah dilakukan oleh komputer.Model untuk mendeteksi maupun membuat parafrasa Bahasa Inggris sudah banyak dikembangkan dibandingkan dengan Bahasa Indonesia yang data pelatihannya lebih sedikit. Penelitian ini mengusulkan Model SPratama yang memodelkan deteksi parafrasa untuk Bahasa Indonesia menggunakan recurrent neural network (RNN) yaitu bidirectional long short-term memory (BiLSTM) dan bidirectional gated recurrent unit (BiGRU). Data yang digunakan adalah “Quora Question Pairs” yang diambil dari Kaggle dan diterjemahkan ke Bahasa Indonesia menggunakan Google Translate. Hasil penelitian ini menunjukkan bahwa model-model yang diusulkan mendapatkan akurasi sekitar 80% untuk pendeteksian kalimat parafrasa.
Paraphrasing is a way to write sentences with other words with the same intent or purpose. Automatic paraphrase detection can be done using Natural Language Sentence Matching (NLSM) which is part of Natural Language Processing (NLP). NLP is a computational technique for processing text in general, while NLSM is used specifically to find the relationship between two sentences. With the development neural network (NN), nowadays NLP can be done more easily by computers. Many models for detecting and paraphrasing in English have been developed compared to Indonesian, which has less training data. This study proposes SPratamaModel, which models paraphrase detection for Indonesian using a recurrent neural network (RNN), namely bidirectional long short-term memory (BiLSTM) and bidirectional gated recurrent unit (BiGRU). The data used is "Quora Question Pairs" taken from Kaggle and translated into Indonesian using Google Translate. The results of this study indicate that the proposed models have the accuracy of around 80% for the detection of paraphrased sentences."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Yogi Lesmana Sulestio
"Penelitian Part-of-Speech tagger (POS tagger) untuk bahasa Indonesia telah banyak dikembangkan. Sayangnya, sejauh ini baru Polyglot yang menggunakan POS tag menurut pedoman anotasi Universal Dependencies (UD). Namun, Polyglot sendiri masih mempunyai kekurangan karena belum dapat mengatasi klitik dan kata ulang yang terdapat dalam bahasa Indonesia. Tujuan penelitian ini adalah mengembangkan POS tagger untuk bahasa Indonesia yang tidak hanya sesuai dengan ketentuan anotasi UD, tapi juga sudah mengatasi kekurangan Polyglot. POS tagger ini akan dikembangkan dengan metode deep learning menggunakan arsitektur yang merupakan versi modifikasi dari Recurrent Neural Network (RNN), yaitu Bidirectional Long Short-Term Memory (Bi-LSTM). Dataset yang digunakan untuk mengembangkan POS tagger adalah sebuah dependency treebank bahasa Indonesia yang terdiri dari 1.000 kalimat dan 19.401 token. Hasil eksperimen dengan menggunakan Polyglot sebagai pembanding menunjukkan bahwa POS tagger yang dikembangkan lebih baik dengan tingkat akurasi POS tagging yang meningkat sebesar 6,69% dari 84,82% menjadi 91,51%.
There have been many studies that have developed Part-of-Speech tagger (POS tagger) for Indonesian language. Unfortunately, so far only Polyglot that has used POS tag according to Universal Dependencies (UD) annotation guidelines. However, Polyglot itself still has shortcomings since it has not been able to overcome clitics and reduplicated words in Indonesian language. The purpose of this study is to develop POS tagger for Indonesian language which is not only in accordance with UD annotation guidelines, but also has overcome Polyglot’s shortcomings. This POS tagger will be developed under deep learning method by using modified version of Recurrent Neural Network (RNN) architecture, Bidirectional Long Short-Term Memory (Bi-LSTM). The dataset used to develop POS tagger is an Indonesian dependency treebank consisting of 1.000 sentences and 19.401 tokens. Result of experiment using Polyglot as baseline shows that the developed POS tagger is better. This is indicated by increased accuracy POS tagging by 6,69% from 84,82% to 91,51%."
Depok: Fakultas Ilmu Kompter Universitas Indonesia, 2020
TA-pdf
UI - Tugas Akhir Universitas Indonesia Library
Theresia Gowandi
"Analisis sentimen adalah salah satu bidang dari Pemrosesan Bahasa Alami yang membangun sistem untuk mengenal opini dalam teks dan mengelompokkan ke dalam sentimen positif atau negatif. Banyak peneliti telah membangun model yang menghasilkan akurasi terbaik dalam melakukan analisis sentimen. Tiga diantaranya adalah Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU), yang merupakan bagian dari deep learning. CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dalam penggalan kalimat, sedangkan LSTM dan GRU digunakan karena kemampuannya yang memiliki memori akan input yang telah diproses sebelumnya. GRU memiliki struktur yang lebih sederhana dibandingkan dengan LSTM. Ketiga model tersebut dapat digabungkan menjadi model gabungan LSTM-CNN, CNN-LSTM, GRU-CNN, dan CNN-GRU. Penelitian sebelumnya telah membuktikan bahwa model gabungan tersebut memiliki akurasi yang lebih baik dibandingkan dengan model dasar LSTM, GRU, dan CNN. Implementasi model dilakukan pada data ulasan aplikasi berbahasa Indonesia. Hasilnya, didapatkan bahwa hampir seluruh model gabungan memiliki akurasi yang lebih baik dibandingkan dengan model dasar.
Sentiment analysis is one of the fields of Natural Language Processing that builds a system to recognize and extract opinion in the form of text into positive or negative sentiment. Nowadays, many researchers have developed methods that yield the best accuracy in performing analysis sentiment. Three particular models are Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU), which are part of deep learning architectures. CNN is used because of its ability to extract important features from each sentence fragment, while LSTM and GRU are used because of their ability to have a memory of prior inputs. GRU has a simpler and more practical structure compared to LSTM. These models can be combined into combined LSTM-CNN, CNN-LSTM, GRU-CNN, and CNN-GRU model. Former researches have proved that these models have better accuracy compared to standard models. This research is focused on the performance of all the combined LSTM-CNN, CNN-LSTM, GRU-CNN, CNN-GRU models and will be compared to the standard LSTM, GRU, CNN models. Implementation of the model is performed on a collection of application review data in Indonesian text. As a result, almost all of the combined models have better accuracy than the standard models."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Muhammad Rafii Zain
"Bahasa Isyarat Indonesia atau BISINDO adalah bahasa yang sering ditemukan di kalangan Teman Tuli maupun Teman Inklusi dibentuk oleh Teman Tuli dan muncul secara alami berdasarkan pengamatan Teman Tuli yang menyebabkan BISINDO sendiri memiliki variasi atau dialek di berbagai daerah dan BISINDO disampaikan dengan gerakan dua tangan. BISINDO sendiri dapat digunakan sebagai dataset pada metode deep learning seperti LSTM. Di mana pada BISINDO terdapat gerakan dinamis yang membuatnya sulit untuk dilakukan dengan metode CNN. Dengan LSTM dan menggabungkan nya dengan library dari MediaPipe dan Streamlit kita dapat membuat model deep learning yang dapat mendeteksi gerakan secara real-time, akurasi yang baik dan dapat diakses melalui browser. Pada penelitian dibuat rancangan dan pengujian untuk mendeteksi BISINDO secara real-time dengan metode LSTM di bantu dengan library MediaPipe Holistic untuk mendeteksi landmark dari wajah, pose, dan tangan serta Streamlit untuk dapat membuat model diakses melalui browser. Metrik evaluasi yang digunakan pada penelitian ini adalah data dari akurasi, validasi akurasi, loss, validasi loss, confusion matrix, dan classification report untuk mendapatkan data presisi, recall, akurasi, dan f1-score. Pada training model dengan 130 epochs didapat loss 6.19%, akurasi 98.23%, validasi loss 4.58%, dan validasi akurasi 100% serta pengujian model secara real-time yang berhasil dilakukan dengan Visual Studio Code dan browser dengan Streamlit.
Indonesian Sign Language or BISINDO is a language that is often found among Deaf Friends and Inclusion Friends formed by Deaf Friends and appears naturally based on the observations of Deaf Friends which causes BISINDO itself to have variations or dialects in various regions. BISINDO is conveyed with two hand gestures. BISINDO itself can be used as a dataset in deep learning methods such as LSTM. Whereas in BISINDO there is a dynamic movement which makes it difficult to do with the CNN method. With LSTM and combining it with libraries from MediaPipe and Streamlit, we can create deep learning models that can detect motion in real-time, have good accuracy, and can be accessed via a browser. In this research, a design and test were made to detect BISINDO in real-time with the LSTM method assisted by the MediaPipe Holistic library to detect landmarks from faces, poses, and hands and Streamlit to be able to make models accessible via a browser. The evaluation metrics used in this study are data from accuracy, accuracy validation, losses, validation losses, confusion matrices, and classification reports to obtain data on precision, gain, accuracy, and f1-score. The training model with 130 epochs obtained 6.19% loss, 98.23% accuracy, 4.58% loss validation, and 100% accuracy validation and real-time model testing which was successfully carried out with Visual Studio Code and a browser with Streamlit."
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Savira Amalia
"Pemantauan harga komoditas strategis merupakan pekerjaan yang penting karena kontribusi signifikan yang dimiliki oleh komoditas strategis terhadap perhitungan laju inflasi. Untuk membantu menyelesaikan pekerjaan ini, dibutuhkan metode prediksi terbaik yang mampu memprediksi pergerakan harga komoditas pangan strategis. Penelitian ini memiliki tujuan untuk menemukan model prediksi terbaik di antara Long-Short-Term Memory (LSTM) dan Gated Recurrent Unit (GRU), dalam memprediksi harga harian sepuluh komoditas pangan strategis: bawang merah, bawang putih, beras, cabai merah, cabai rawit, daging ayam, daging sapi, gula pasir, minyak goreng, dan telur ayam. Model ARIMA digunakan sebagai standar model klasik dalam penelitian kali ini. Mean Absolute Error (MAE) dan Mean Absolute Percentage Error (MAPE), GRU memberikan hasil prediksi harga harian paling baik pada enam dari total sepuluh komoditas dan LSTM memberikan hasil prediksi terbaik pada empat komoditas sisanya. Model terbaik pada tiap komoditas berhasil mengurangi angka MAE dari ARIMA sekitar 3% hingga 43%. Ketika model mempelajari data, GRU berhasil menyelesaikan prosesnya lebih cepat daripada LSTM pada delapan komoditas. Model peramalan terbaik yang ditemukan pada penelitian kali ini dapat digunakan untuk memperbaiki metode peramalan klasik yang telah digunakan dalam memprediksi harga harian pangan Indonesia, sehingga dapat membantu pemerintah dalam memformulasikan kebijakan dan peraturan terkait manajemen stabilitas harga pangan.
Managing strategic commodities prices in the market is considered an important task since they have a significant contribution to the calculation of the inflation rate. To aid this task, it is necessary to find the best forecasting model that can predict commodities daily price. This paper aims to find the best prediction model between Long Short-Term Memory (LSTM) and Gated Recurrent Unit (GRU) in forecasting the daily price of ten Indonesia’s strategic commodities: shallot, garlic, rice, chili pepper, cayenne pepper, broiler meat, topside beef, granulated sugar, cooking oil, chicken egg. This research used ARIMA as a benchmark model. Based on Mean Absolute Error (MAE) and Mean Absolute Percentage Error (MAPE), GRU gave the best result in predicting the daily price of six out of ten commodities. It is found that the best model for each commodity managed to reduce the MAE score from ARIMA by around 3% until 43%. GRU managed to finish faster than LSTM in training eight commodities data. The best forecasting method found in this research can be used to improve the classic method to forecast the daily price of Indonesia’s food commodities in assisting the government in formulating policies and regulations related to food price management."
Depok: Fakultas Teknik Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership Universitas Indonesia Library
Fathia Amira Nuramalia
"Twitter adalah platform media sosial microblogging yang memungkinkan komunikasi dua arah untuk mengutarakan opini dan komentar. Komentar-komentar yang beragam ini dapat memperlihatkan sentimen-sentimen masyarakat apabila dilakukan analisis sentimen. Analisis sentimen adalah studi yang menganalisis opini orang terhadap suatu produk, organisasi, individu, atau jasa tertentu. Machine learning merupakan metode yang dapat mempermudah proses klasifikasi sentimen. Penelitian ini dilakukan pada cuitan berbahasa Indonesia terkait Kampus Merdeka yang diambil dari Twitter menggunakan package tweepy sebanyak 1.651 cuitan terhitung dari tanggal 5 Maret 2022 hingga 13 Maret 2022. Model machine learning yang digunakan pada penelitian ini adalah Bidirectional Long Short-Term Memory (BiLSTM), dengan dua model hybrid LSTM-based, yaitu CNN-LSTM dan LSTM-CNN sebagai pembanding. Kinerja model diukur dengan metrik kinerja accuracy, precision, recall, dan F1-score. Implementasi dilakukan pada data yang telah dilakukan oversampling untuk mendapatkan hasil yang optimal. Penelitian menunjukkan bahwa model BiLSTM memiliki kinerja yang lebih unggul dibandingkan dengan dua model pembanding lainnya pada seluruh metrik dengan besar metrik, yaitu: accuracy dan recall sebesar 79,577%; precision sebesar 73,097%; dan F1-score sebesar 75,634%.
Twitter is a microblogging social media platform that allows two-way communication to express opinion and comments. These various comments can show us sentiment of the public when we perform a sentiment analysis. Sentiment analysis is a study that analyze the opinion of people towards a specific product, organization, individual, or service. Machine learning is a method that will help perform sentiment classification easier. This study performs analysis on 1.651 data tweets about Kampus Merdeka taken from Twitter using a package called tweepy since March 5th 2022 until March 13th 2022. The machine learning model used in this study is Bidirectional Long Short-Term Memory (BiLSTM), with two LSTM-based hybrid model, CNN-LSTM and LSTM-CNN as comparison models. Model performance is measured by performance metrics accuracy, precision, recall, and F1-score. Implementation was done on data that has been going through oversampling to achieve the best result. The study shows that BiLSTM performs better than the other two comparison models for all the metrics with the percentage of the each metric being: 79.577% for accuracy and recall; 73,097% for precision; and 75,634% for F1-score."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Agung Firmansyah
"Jurnal ini membahas tentang pengembangan Sistem Penilaian Esai Otomatis (SIMPLE-O) untuk Bahasa Indonesia menggunakan BERT (Bidirectional Encoder Representations from Transformers) dan Bidirectional LSTM. BERT digunakan untuk melakukan sentence embedding pada jawaban mahasiswa dan dosen, yang kemudian diproses oleh Bidirectional LSTM. Kemiripan antara jawaban diukur dengan menggunakan Manhattan Distance dan Cosine Similarity. Hasil pengujian menunjukkan bahwa rata-rata selisih absolut antara nilai model dengan nilai human rater adalah 22.83 dengan error MAE dan RMSE sebesar 0.2462 dan 0.2850 untuk Manhattan Distance, dan 12.88 dengan error MAE dan RMSE sebesar 0.1614 dan 0.1946 untuk Cosine Similarity.
This paper presents the development of an Automatic Essay Scoring System (SIMPLE-O) for the Indonesian using BERT (Bidirectional Encoder Representations from Transformers) and Bidirectional LSTM. BERT is used to perform sentence embedding on both student and lecturer answers, which are then processed by Bidirectional LSTM. The similarity between the answers is measured using Manhattan Distance and Cosine Similarity. The test results show that the average absolute difference between the model score and the human rater score is 22.83 with MAE and RMSE error of 0.2462 and 0.2850 for Manhattan Distance, and 12.88 with MAE and RMSE error of 0.1614 and 0.1946 for Cosine Similarity."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Noer Fitria Putra Setyono
"SIBI merupakan bahasa isyarat resmi yang digunakan di Indonesia. Penggunaan SIBI seringkali ditemukan permasalahan karena banyaknya gerakan isyarat yang harus diingat. Penelitian ini bertujuan untuk mengenali gerakan isyarat SIBI dengan cara mengekstraksi fitur tangan dan wajah yang kemudian diklasifikasikan menggunakan Bidirectional Long ShortTerm Memory (BiLSTM). Ekstraksi fitur yang digunakan dalam penelitian ini adalah Deep Convolutional Neural Network (DeepCNN) seperti ResNet50 dan MobileNetV2, di mana kedua model tersebut digunakan sebagai pembanding. Penelitian ini juga membandingkan performa dan waktu komputasi antara kedua model tersebut yang diharapkan dapat diterapkan pada smartphone nantinya, dimana model tersebut akan diimplementasikan. Hasil penelitian menunjukkan bahwa penggunaan model ResNet50-BiLSTM memiliki kinerja yang lebih baik dibandingkan dengan MobileNetV2-BiLSTM yaitu 99,89%. Namun jika akan diaplikasikan pada arsitektur mobile, MobileNetV2-BiLSTM lebih unggul karena memiliki waktu komputasi yang lebih cepat dengan performa yang tidak jauh berbeda jika dibandingkan dengan ResNet50-BiLSTM.
SIBI is a sign language that is officially used in Indonesia. The use of SIBI is often found to be a problem because of the many gestures that have to be remembered. This study aims to recognize SIBI gestures by extracting hand and facial features which are then classified using Bidirectional Long ShortTerm Memory (BiLSTM). The feature extraction used in this research is Deep Convolutional Neural Network (DeepCNN) such as ResNet50 and MobileNetV2, where both models are used as a comparison. This study also compares the performance and computational time between the two models which is expected to be applied to smartphones later, where both models can now be implemented on smartphones. The results showed that the use of ResNet50-BiLSTM model have better performance than MobileNetV2-BiLSTM which is 99.89\%. However, if it will be applied to mobile architecture, MobileNetV2-BiLSTM is superior because it has a faster computational time with a performance that is not significantly different when compared to ResNet50-BiLSTM."
Depok: Fakultas Komputer Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership Universitas Indonesia Library
Kevin Ahmad Faisal
"Grammatical Error Correction (GEC) merupakan salah satu topik yang menarik dalam penelitian Natural Language Processing (NLP). Sudah banyak penelitian mengenai GEC untuk bahasa universal seperti Inggris dan Cina, namun sedikit penelitian mengenai GEC untuk bahasa Indonesia. Pada penelitian ini penulis mengembangkan framework GEC untuk memperbaiki kesalahan 10 jenis Part of Speech (POS) bahasa Indonesia dengan arsitektur Gated Recurrent Unit (GRU). Dataset yang digunakan adalah Indonesian POS Tagged Corpus yang disusun oleh Ruli Manurung dari Universitas Indonesia. Hasil penelitian ini berhasil memberikan rata-rata Macro-Average F0.5 Score sebesar 0.4882 dan meningkatkan kecepatan prediksi sebesar 30.1%.
Grammatical Error Correction (GEC) is one of the exciting topics in Natural Language Processing (NLP) research. There have been many studies on GEC for universal languages such as English and Chinese, but little research on GEC for indonesian. In this study, the authors developed a GEC framework to correct ten Indonesian Part of Speech (POS) errors with the Gated Recurrent Unit (GRU) architecture. The dataset used is the Indonesian POS Tagged Corpus compiled by Ruli Manurung from the University of Indonesia. The results of this study succeeded in providing an average Macro-Average F0.5 Score of 0.4882 and increase prediction time by 30.1% "
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Gita Kartika Suriah
"Analisis sentimen merupakan suatu proses untuk menentukan sikap atau sentimen dari penulis mengenai hal tertentu. Proses pengelompokan sentimen secara manual membutuhkan waktu cukup lama, sehingga diusulkan untuk menggunakan machine learning. Pada penelitian ini, model machine learning yang digunakan merupakan model CNN-BiLSTM (Convolutional Neural Network - Bidirectional Long Short-Term Memory) dan BiLSTM-CNN (Bidirectional Long Short-Term Memory - Convolutional Neural Network) yang menghasilkan kinerja yang lebih baik dibandingkan model CNN dan BiLSTM pada permasalahan analisis sentimen. Supaya model dapat belajar secara berkelanjutan dari beberapa domain data, model tersebut juga diimplementasikan lifelong learning. Hasilnya, model CNN-BiLSTM menunjukkan kinerja transfer of knowledge yang lebih baik dibandingkan oleh model BiLSTM-CNN maupun model dasarnya. Di sisi lain, model BiLSTM-CNN menunjukkan kinerja yang lebih buruk dibandingkan model dasarnya. Sedangkan, hasil loss of knowledge menunjukkan bahwa kinerja model CNN- BiLSTM lebih buruk dari BiLSTM-CNN. Selain itu, kedua model gabungan tersebut menunjukkan kinerja yang lebih baik dibandingkan model CNN, tetapi lebih buruk dibandingkan model BiLSTM. Untuk pengembangan lebih lanjut, diimplementasikan pula lifelong learning dengan pembaruan vocabulary. Dengan implementasi tersebut, model mampu mempelajari vocabulary dari domain data 2, 3, 4, dan 5. Pembaruan vocabulary ternyata meningkatkan kinerja model pada transfer of knowledge dan loss of knowledge.
Sentiment analysis is a process to determine the attitude or sentiment of the author regarding certain matters. The process of classifying sentiments manually takes a long time, so it is proposed to use machine learning. In this study, the machine learning model used is the CNN-BiLSTM (Convolutional Neural Network - Bidirectional Long Short-Term Memory) and BiLSTM-CNN (Bidirectional Long Short-Term Memory - Convolutional Neural Network) models which produce better performance than the CNN and BiLSTM models on the problem of sentiment analysis. In order for the model to learn continuously from several data domains, the model is also implemented lifelong learning. As a result, the CNN-BiLSTM model shows better transfer of knowledge performance compared to the BiLSTM-CNN model and its base model. On the other hand, the BiLSTM-CNN model shows a worse performance than its base model. Meanwhile, the results of loss of knowledge show that the performance of the CNN-BiLSTM model is worse than the BiLSTM-CNN model. In addition, the two combined models show better performance than the CNN model, but worse than the BiLSTM model. For further development, lifelong learning is also implemented with an update to vocabulary. With this implementation, the model is able to learn vocabulary from data domain 2, 3, 4, and 5. In fact, the vocabulary update has an effect in increasing the performances of transfer of knowledge and loss of knowledge."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership Universitas Indonesia Library