Ditemukan 207443 dokumen yang sesuai dengan query
Annisa Yuni Safira
"Analisis sentimen adalah studi komputasi yang bertugas mengelompokkan sentimen atau opini dari teks yang ada dalam dokumen, kalimat, atau pendapat ke kelas sentimen positif, negatif, atau netral. Terdapat banyak model deep learning yang terkenal untuk analisis sentimen, dua di antaranya adalah Convolutional Neural Network (CNN) dan Gated Recurrent Unit (GRU), yang termasuk dalam Recurrent Neural Network (RNN). Bidirectional Gated Recurrent Unit (BiGRU) merupakan bagian dari Bidirectional Recurrent Neural Network (BiRNN) yang dapat bekerja secara dua arah dan memungkinkan untuk menangkap pola yang mungkin diabaikan oleh GRU. Untuk meningkatkan kinerja model menjadi lebih baik, beberapa peneliti mencoba menerapkan model hybrid dengan menggabungkan dua atau lebih model deep learning dasar. CNN memiliki keunggulan dalam mendapatkan fitur terpenting, sedangkan BiGRU dapat merepresentasikan kata dengan memperhatikan urutan dengan dua arah. Kedua model tersebut dapat digabungkan menjadi model CNN-BiGRU dan BiGRU-CNN. Implementasi kedua model dilakukan untuk data opini yang diambil dari Twitter mengenai tiga dompet digital, yaitu Gopay, OVO, dan ShopeePay. Hasil penelitian didapat bahwa kedua model memiliki kinerja yang berbeda untuk setiap dataset. Kemudian, didapat bahwa kedua model tersebut memiliki nilai akurasi dan f1 score yang tidak lebih tinggi dibandingkan model dasarnya.
Sentiment analysis is a computational study that is used to classify sentiments or opinions from texts in documents, sentences, or opinions into positive, negative, or neutral sentiment classes. There are many well-known deep learning models for sentiment analysis, two of which are the Convolutional Neural Network (CNN) and the Gated Recurrent Unit (GRU), which are included in the Recurrent Neural Network (RNN). The Bidirectional Gated Recurrent Unit (BiGRU) is part of the Bidirectional Recurrent Neural Network (BiRNN) which can work in both directions and allows for capturing patterns that the GRU might ignore. To improve model performance, some researchers are trying to implement a hybrid model by combining two or more basic deep learning models. CNN has the advantage of getting the most important features, while BiGRU can represent words by paying attention to the order in two directions. The two models can be combined into CNNBiGRU and BiGRU-CNN models. The implementation of the two models is used for opinion data taken from Twitter regarding three digital wallets, namely Gopay, OVO, and ShopeePay. The results showed that the two models have different performances for each dataset. Then, it was found that both models have an accuracy value and an f1 score that is not higher than the basic model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Theresia Gowandi
"Analisis sentimen adalah salah satu bidang dari Pemrosesan Bahasa Alami yang membangun sistem untuk mengenal opini dalam teks dan mengelompokkan ke dalam sentimen positif atau negatif. Banyak peneliti telah membangun model yang menghasilkan akurasi terbaik dalam melakukan analisis sentimen. Tiga diantaranya adalah Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU), yang merupakan bagian dari deep learning. CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dalam penggalan kalimat, sedangkan LSTM dan GRU digunakan karena kemampuannya yang memiliki memori akan input yang telah diproses sebelumnya. GRU memiliki struktur yang lebih sederhana dibandingkan dengan LSTM. Ketiga model tersebut dapat digabungkan menjadi model gabungan LSTM-CNN, CNN-LSTM, GRU-CNN, dan CNN-GRU. Penelitian sebelumnya telah membuktikan bahwa model gabungan tersebut memiliki akurasi yang lebih baik dibandingkan dengan model dasar LSTM, GRU, dan CNN. Implementasi model dilakukan pada data ulasan aplikasi berbahasa Indonesia. Hasilnya, didapatkan bahwa hampir seluruh model gabungan memiliki akurasi yang lebih baik dibandingkan dengan model dasar.
Sentiment analysis is one of the fields of Natural Language Processing that builds a system to recognize and extract opinion in the form of text into positive or negative sentiment. Nowadays, many researchers have developed methods that yield the best accuracy in performing analysis sentiment. Three particular models are Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU), which are part of deep learning architectures. CNN is used because of its ability to extract important features from each sentence fragment, while LSTM and GRU are used because of their ability to have a memory of prior inputs. GRU has a simpler and more practical structure compared to LSTM. These models can be combined into combined LSTM-CNN, CNN-LSTM, GRU-CNN, and CNN-GRU model. Former researches have proved that these models have better accuracy compared to standard models. This research is focused on the performance of all the combined LSTM-CNN, CNN-LSTM, GRU-CNN, CNN-GRU models and will be compared to the standard LSTM, GRU, CNN models. Implementation of the model is performed on a collection of application review data in Indonesian text. As a result, almost all of the combined models have better accuracy than the standard models."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Azizah Zuhriya Nurmadina
"Model deep learning adalah model dengan banyak lapisan jaringan saraf tiruan. Model Bidirectional Gated Recurrent Unit (BiGRU) adalah salah satu jenis model deep learning yang memproses urutan data dalam dua arah, yaitu arah maju dan arah mundur. Hal tersebut memungkinkan model BiGRU untuk mengakses informasi masa depan dan masa lalu dari setiap titik dalam urutan data untuk pemahaman konteks yang lebih baik. Model BiGRU dapat digunakan untuk analisis sentimen, yaitu proses mengategorikan sentimen opini dalam teks menjadi negatif, netral, atau positif. Representasi teks yang digunakan pada penelitian ini adalah Bidirectional Encoder Representations from Transformers (BERT) karena kemampuannya memahami kata secara kontekstual sehingga meningkatkan akurasi. Salah satu masalah umum pada analisis sentimen adalah ketidakseimbangan data Penggunaan data tidak seimbang mempengaruhi kinerja model dalam melakukan klasifikasi sentimen karena bias terhadap kelas mayoritas. Oleh karena itu, penggunaan Synthetic Minority Oversampling Technique (SMOTE) dalam mengatasi ketidakseimbangan kelas pada data dilakukan pada penelitian ini. SMOTE digunakan untuk melakukan oversampling pada data kelas minoritas dan dipasangkan dengan model BiGRU yang menggunakan fungsi kerugian categorical cross entropy menghasilkan kinerja dengan nilai akurasi sebesar 85,52% yang merupakan akurasi tertinggi dibandingkan dengan daripadamodel BiGRU dengan fungsi kerugian categorical cross entropy tanpa penanganan SMOTE (model standar dalam penelitian ini) dan model BiGRU dengan fungsi kerugian weighted cross entropy yang dibangun untuk memperkuat bukti bahwa model yang diajukan adalah model terbaik.
Deep learning models are models with multiple layers of artificial neural networks. The Bidirectional Gated Recurrent Unit (BiGRU) model is one type of deep learning model that processes data sequences in two directions, the forward direction and the backward direction. This allows the BiGRU model to access future and past information from each point in the data sequence for better context understanding. The BiGRU model can be used for sentiment analysis, which is the process of categorizing the sentiment of opinions in text into negative, neutral, or positive. The text representation used in this research is Bidirectional Encoder Representations from Transformers (BERT) because of its ability to understand words contextually to increase accuracy. One of the common problems in sentiment analysis is data imbalance. The use of unbalanced data affects the performance of the model in performing sentiment classification due to bias towards the majority class. Therefore, the use of Synthetic Minority Oversampling Technique (SMOTE) in overcoming class imbalance in the data is done in this study. SMOTE is used to perform oversampling on minority class data and paired with the BiGRU model using the categorical cross entropy loss function results in performance with an accuracy value of 85.52% which is the highest accuracy compared to the BiGRU model with the categorical cross entropy loss function without SMOTE handling (the standard model in this study) and the BiGRU model with the weighted cross entropy loss function built to strengthen the evidence that the proposed model is the best model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Maranatha Florensia Wijaya
"Analisis sentimen merupakan bidang studi yang menganalisis pendapat seseorang terhadap suatu entitas untuk mencari polaritas sentimennya. Potensi manfaat yang besar didukung dengan ketersediaan data teks beropini yang melimpah di internet memicu dikembangkannya model yang mampu melakukan analisis sentimen secara otomatis dan seakurat mungkin. Dua diantaranya adalah Long Short-Term Memory (LSTM) dan Convolutional Neural Network (CNN) yang merupakan arsitektur deep learning. LSTM digunakan karena dapat menangkap aliran informasi pada kalimat, sedangkan CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dari tiap penggalan kalimat atau region. Kedua model ini dapat digabungkan menjadi model gabungan LSTM-CNN yang telah terbukti mampu meningkatkan akurasi model. Penelitian ini kemudian akan mengajukan modifikasi pada model gabungan LSTM-CNN dengan mengganti LSTM menjadi Bidirectional LSTM (BiLSTM) dan CNN menjadi CNN Multi Region Size CNNMRS sehingga terbentuk tiga model modifikasi yaitu BiLSTM-CNN, LSTM-CNNMRS, dan BiLSTM-CNNMRS. Implementasi model, baik untuk model gabungan LSTM-CNN standar maupun model modifikasi, dilakukan pada data tweets berbahasa Indonesia. Hasilnya, didapatkan kesimpulan bahwa penggunaan BiLSTM untuk menggantikan LSTM pada model gabungan LSTM CNN tidak meningkatkan akurasi dari model. Hal berbeda didapatkan dari penggunaan CNNMRS untuk menggantikan CNN yang memberikan peningkatan akurasi pada model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Suci Fitriyani
"Analisis sentimen merupakan studi komputasi untuk menganalisis opini seseorang terhadap suatu entitas yang diekspresikan dalam sebuah teks. Tersedia cukup banyak model machine learning terutama deep learning yang dapat digunakan untuk melakukan analisis sentimen seperti Convolutional Neural Network (CNN) dan Bidirectional Long Short-Term Memory (BiLSTM). Pada dasarnya, model deep learning tidak dapat memproses langsung sebuah data dalam bentuk teks sehingga diperlukan metode untuk mentransformasi teks menjadi tensor numerik seperti word embedding. Pada penelitian ini, diajukan model gabungan CNN-BiLSTM dengan word embedding fastText untuk melakukan analisis sentimen. Model tersebut dilatih menggunakan data tweet berbahasa Indonesia tentang opini masyarakat mengenai rencana subsidi pembelian kendaraan listrik di Indonesia. Data tersebut diklasifikasikan menjadi sentimen positif, negatif, dan netral dan ditemukan bahwa komposisi dari ketiga sentimen tersebut tidaklah seimbang (imbalanced dataset) dimana kelas positif memiliki lebih sedikit data dibanding kelaskelas lainnya. Untuk mengatasi masalah tersebut, digunakan metode resampling SMOTE agar jumlah data pada kelas positif dapat mengimbangi kelas lainnya. Model fastTextCNN-BiLSTM diukur performanya dengan melihat nilai akurasi, precision, recall, dan f1-score. Dari hasil penelitian didapat bahwa model gabungan CNN-BiLSTM memberikan nilai akurasi, precision, recall, dan f1-score yang paling baik dibanding model CNN dan BiLSTM saja. Model-model yang menggunakan word embedding fastText juga memberikan performa yang lebih baik dibanding model tanpa fastText (menggunakan word embedding standar). Secara keseluruhan, model gabungan fastTextCNN-BiLSTM ditemukan memiliki performa yang lebih baik dibandingkan dengan model-model lainnya.
Sentiment analysis is a computational study to analyze person’s opinion about an entity expressed in text. There are several machine learning models, especially deep learning models that can be used for sentiment analysis, such as Convolutional Neural Network (CNN) and Bidirectional Long Short-Term Memory (BiLSTM). Essentially, deep learning models cannot directly process textual data and they need a method to transform text into numerical tensors such as word embedding. In this research, a hybrid model CNN-BiLSTM with fastText word embedding is proposed for sentiment analysis. The model is trained using Indonesian tweets data regarding public opinions on the plan for subsidizing the purchase of electric vehicles in Indonesia. The data is classified into positive, negative, and neutral sentiments, and it is found that the composition of these sentiments is imbalanced, with the positive class having fewer data compared to the other classes. To address this issue, the SMOTE resampling method is used to balance the data in the positive class with the other classes. The performance of the fastText-CNNBiLSTM model is measured by accuracy, precision, recall, and f1-score. The research results show that the hybrid model CNN-BiLSTM achieves the highest accuracy, precision, recall, and f1-score compared to the single models CNN and BiLSTM. Models with fastText word embedding also outperform models without fastText (with standard word embedding). Overall, the hybrid model fastText-CNN-BiLSTM is found to outperform other models in terms of performance."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Sidauruk, Febriana Pasonang
"Skripsi ini membahas mengenai Pengembangan Sistem Penilaian Esai Otomatis (SIMPLE-O) dengan menggunakan Stacked Bidirectional GRU dengan Manhattan Distance dan Cosine Similarity yang diterapkan untuk menilai jawaban esai bahasa Indonesia. Data yang digunakan pada sistem terdiri dari jawaban esai pelajar dan kunci jawaban dari pengajar. Sistem akan melalui tahapan pre-processing, word embedding, kemudian proses training, dan terakhir proses testing. Data sebelumnya diolah untuk dilakukan training terlebih dahulu dengan memberikan tujuh skenario pengujian agar memberikan selisih dan error yang rendah. Kedua jawaban akan diuji menggunakan dengan variasi hyperparameter sesuai dengan hasil terbaik dari seluruh skenario pengujian, kemudian diukur kemiripan hasil keduanya menggunakan dua jenis metrics yaitu, Manhattan Distance dan Cosine Similarity. Model menggunakan Cosine Similarity menghasilkan rata-rata nilai selisih 1.935 untuk fase training dan 8 untuk fase testing. Sedangkan Manhattan Distance menghasilkan selisih 1.887 untuk fase training dan 9.039 untuk fase testing.
This thesis discusses the design of an Automatic Essay Scoring System (SIMPLE-O) using Stacked Bidirectional GRU with Manhattan Distance and Cosine Similarity for Indonesian essay grading. The system utilizes a dataset consisting of student essay answers and corresponding teacher's answer key. The system goes through several stages including pre-processing, word embedding, training, and testing processes. The data is pre-processed and then trained using seven different testing scenarios to achieve low difference and low-error results. The system is evaluated using various hyperparameter settings based on the best results obtained from all testing scenarios. The similarity between the generated scores and the reference scores is measured using two metrics: Manhattan Distance and Cosine Similarity. The Cosine Similarity-based model achieved an average difference of 1.935 during the training phase and 8 during the testing phase. On the other hand, the Manhattan Distance-based model achieved an difference of 1.887 during the training phase and 9.039 during the testing phase."
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Fadhlan Akmal Prasetianto
"Uji kendali mutu pada citra mamografi dengan menggunakan fantom CDMAM merupakan langkah penting dalam memastikan kualitas proses diagnostik pada pesawat mamografi. Namun, untuk mengatasi masalah variabilitas manusia dan meningkatkan efisiensi waktu, penggunaan Convolutional Neural Network (CNN) dapat menjadi solusi yang akurat dalam menganalisis citra fantom CDMAM. Penelitian ini menerapkan arsitektur CNN Resnet50 pada total 1.392 citra fantom CDMAM dengan dan tanpa regularizer L2. Hasil prediksi CNN pada rentang diameter 0,10 hingga 0,20 mm menunjukkan tingkat prediksi dengan tingkat kesalahan relatif di bawah 32% pada prediksi satuan dan di bawah 16% pada rata-rata prediksi dari 16 citra. Dari hasil prediksi yang diperoleh, diperlukan optimasi lebih lanjut untuk mencapai akurasi prediksi yang lebih tinggi.
Quality control testing on mammography images using CDMAM phantoms is an important step in ensuring the quality of the diagnostic process in mammography devices. However, to overcome human variability issues and improve time efficiency, the use of Convolutional Neural Network (CNN) can be an accurate solution for analyzing CDMAM phantom images. This study applied the CNN architecture ResNet50 to a total of 1.392 CDMAM phantom images with and without L2 regularizer. The CNN prediction results for the diameter range of 0,10 to 0,20 mm showed prediction with relative error below 32% for individual predictions and below 16% for average predictions from 16 images. Based on the obtained prediction results, further optimization is needed to achieve higher prediction accuracy."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Elyaser Ben Guno
"
Automatic Modulation Classification (AMC) secara otomatis mengidentifikasi jenis modulasi apa yang digunakan pada pemancar berdasarkan pengamatan terhadap sinyal yang diterima. Seiring dengan perkembangan pada topik ini,
Deep Learning (DL) dapat diterapkan pada AMC dan memiliki kinerja yang menjanjikan. Namun, sebagian besar model DL yang dibuat hanya berfokus pada akurasi, mengabaikan ukuran model dan kompleksitas komputasi yang dapat menjadi masalah bagi perangkat dengan ukuran memori dan daya komputasi yang terbatas. Dalam penelitian ini, model
Convolutional Long short-term memory Deep Neural Network (CLDNN) ringan diusulkan untuk mengklasifikasi modulasi. Model yang diusulkan dilatih dan diuji dengan dataset RML2016.10b. Model yang diusulkan memiliki ukuran model dan jumlah parameter yang lebih kecil, serta waktu pelatihan dan klasifikasi yang lebih cepat, relatif terhadap model pembanding, dengan tetap menjaga kualitas akurasinya.
Automatic Modulation Classification (AMC) automatically identifies what type of modulation is used on the transmitter based on observations of the received signal. Along with the development on this topic, Deep Learning (DL) can be applied to AMC and has promising performance. However, most of the DL models created only focus on accuracy, ignoring the model size and computational complexity which can be a problem for devices with limited memory size and computing power. In this study, a lightweight Convolutional Long short-term memory Deep Neural Network (CLDNN) model was proposed to classify modulation. The proposed model was trained and tested with the RML2016.10b dataset. The proposed model has a small model size and parameters, as well as fast training and classification time, relative to the comparison models, while maintaining the quality of its accuracy."
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Muhammad Taqiyuddin
"Penggunaan analisis sentimen semakin umum digunakan. Dalam pengembangan analisis sentimen ini banyak tantangan yang perlu dihadapi. Karena analisis ini termasuk Natural Language Processing NLP, hal yang perlu dimengerti adalah kompleksitas bahasa. Dengan berkembangnya teknologi Artificial Neural Network, ANN semakin banyak permasalahan yang bisa diselesaikan.
Ada banyak contoh struktur ANN dan untuk penelitian ini yang digunakan adalah Convolutional Neural Network CNN dan Recurrent Neural Network RNN. Kedua jenis ANN tersebut sudah menunjukkan performa yang baik untuk beberapa tugas NLP. Maka akan dilakukan analisis sentimen dengan menggunakan kedua jenis ANN tersebut dan dibandingkan kedua performa ANN tersebut. Untuk data yang akan digunakan diambil dari publikasi stanford dan untuk mengubah data tersebut bisa digunakan pada ANN digunakan word2vec.
Hasil dari analisis menunjukkan bahwa RNN menunjukkan hasil yang lebih baik dari CNN. Walaupun akurasi tidak terlalu terlihat perbedaan yaitu pada RNN yang mencapai 88.35 0.07 dan CNN 87.11 0.50, tetapi waktu pelatihan RNN hanya membutuhkan waktu 8.256 detik sedangkan CNN membutuhkan waktu 544.366 detik.
Term of sentiment analysis become popular lately. There are many challenges developing sentiment analysis that need to be addressed. Because this kind analysis is including Natural Language Processing, the thing need to understand is the complexity of the language. With the current development of Artificial Neural Network ANN, more problems can be solved. There are many type of ANN and for this research Convolutional Neural Network CNN and Recurrent Neural Network will be used. Both already showing great result for several NLP tasks. Data taken from stanford publication and transform it with word2vec so could be used for ANN. The result shows that RNN is better than CNN. Even the difference of accuracy is not significant with 88.35 0.07 for RNN and 87.11 0.50 for CNN, the training time for RNN only need 8.256 secods while CNN need 544.366 seconds."
Depok: Fakultas Teknik Universitas Indonesia, 2017
S68746
UI - Skripsi Membership Universitas Indonesia Library
Dwi Guna Mandhasiya
"Ilmu Data adalah irisan dari matematika dan statistika, komputer, serta keahlian domain. Dalam beberapa tahun terakhir inovasi pada bidang ilmu data berkembang sangat pesat, seperti Artificial Intelligence (AI) yang telah banyak membantu kehidupan manusia. Deep Learning (DL) sebagai bagian dari AI merupakan pengembangan dari salah satu model machine learning yaitu neural network. Dengan banyaknya jumlah lapisan neural network, model deep learning mampu melakukan proses ekstrasi fitur dan klasifikasi dalam satu arsitektur. Model ini telah terbukti mengungguli teknik state-of-the-art machine learning di beberapa bidang seperti pengenalan pola, suara, citra, dan klasifikasi teks. Model deep learning telah melampaui pendekatan berbasis AI dalam berbagai tugas klasifikasi teks, termasuk analisis sentimen. Data teks dapat berasal dari berbagai sumber, seperti sumber dari media sosial. Analisis sentimen atau opinion mining merupakan salah satu studi komputasi yang menganalisis opini dan emosi yang diekspresikan pada teks. Pada penelitian ini analisis peforma machine learning dilakukan pada metode deep learning berbasis representasi data BERT dengan metode CNN dan LSTM serta metode hybrid deep learning CNN-LSTM dan LSTM-CNN. Implementasi model menggunakan data komentar youtube pada video politik dengan topik terkait Pilpres 2024, kemudian evaluasi peforma dilakukan menggunakan confusion metric berupa akurasi, presisi, dan recall.
Data Science is the intersection of mathematics and statistics, computing, and a domain of expertise. In recent years innovation in the field of data science has developed very rapidly, such as Artificial Intelligence (AI) which helped a lot in human life. Deep Learning (DL) as part of AI is the development of one of the machine learning models, namely neural network. With the large number of neural network layers, deep learning models are capable of performing feature extraction and classification processes in a single architecture. This model has proven to outperform state-of-the-art machine learning techniques in areas such as pattern recognition, speech, imagery, and text classification. Deep learning models have gone beyond AI-based approaches in a variety of text classification task, including sentiment analysis. Text data can come from various sources, such as source from social media. Sentiment analysis or opinion mining is a computational study that analyze opinions and emotions expressed in text. In this research, machine learning performance analysis is carried out on a deep learning method based on BERT data representation with the CNN and LSTM and hybrid deep learning CNN-LSTM and LSTM-CNN method. The implementation of the model uses YouTube commentary data on political videos related to the 2024 Indonesia presidential election, then performance analysis is carried out using confusion metrics in the form of accuracy, precision, and recall."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership Universitas Indonesia Library