Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Dhio Makarim Utomo
Abstrak :
Sistem Penilaian Esai Otomatis (SIMPLE-O) dikembangkan oleh Departemen Teknik Elektro Fakultas Teknik Universitas Indonesia untuk ujian bahasa Indonesia. Skripsi ini akan membahas mengenai pengembangan SIMPLE-O untuk penilaian ujian bahasa Indonesia menggunakan metode Gated Recurrent Unit (GRU) dan bahasa pemrograman Python. Terdapat dua dokumen yang akan menjadi input, yaitu jawaban esai dari peserta ujian dan jawaban referensi dari penguji. Kedua jawaban diproses dengan layer GRU yang sama. Selanjutnya, kemiripan antara keduanya dihitung dengan fungsi persamaan. Rata-rata nilai akurasi yang didapatkan adalah 98.84 untuk fase training dan 86.82 untuk validasi
The Automatic Essay Assessment System (SIMPLE-O) was developed by the Department of Electrical Engineering, Faculty of Engineering, University of Indonesia for the Indonesian language test. This thesis will discuss the development of SIMPLE-O for the assessment of Indonesian language tests using the Gated Recurrent Unit (GRU) method and the Python programming language. There are two documents that will be input, essay answers from examinees and answer answers from examiners. Both answers are processed with the same GRU layer. Next, the similarity between the two is calculated by the similarity function. The average accuracy value obtained was 98.84 for the training phase and 86.82 for validation
Depok: Fakultas Teknik Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Taqiyuddin
Abstrak :
Penggunaan analisis sentimen semakin umum digunakan. Dalam pengembangan analisis sentimen ini banyak tantangan yang perlu dihadapi. Karena analisis ini termasuk Natural Language Processing NLP, hal yang perlu dimengerti adalah kompleksitas bahasa. Dengan berkembangnya teknologi Artificial Neural Network, ANN semakin banyak permasalahan yang bisa diselesaikan. Ada banyak contoh struktur ANN dan untuk penelitian ini yang digunakan adalah Convolutional Neural Network CNN dan Recurrent Neural Network RNN. Kedua jenis ANN tersebut sudah menunjukkan performa yang baik untuk beberapa tugas NLP. Maka akan dilakukan analisis sentimen dengan menggunakan kedua jenis ANN tersebut dan dibandingkan kedua performa ANN tersebut. Untuk data yang akan digunakan diambil dari publikasi stanford dan untuk mengubah data tersebut bisa digunakan pada ANN digunakan word2vec. Hasil dari analisis menunjukkan bahwa RNN menunjukkan hasil yang lebih baik dari CNN. Walaupun akurasi tidak terlalu terlihat perbedaan yaitu pada RNN yang mencapai 88.35 0.07 dan CNN 87.11 0.50, tetapi waktu pelatihan RNN hanya membutuhkan waktu 8.256 detik sedangkan CNN membutuhkan waktu 544.366 detik. ......Term of sentiment analysis become popular lately. There are many challenges developing sentiment analysis that need to be addressed. Because this kind analysis is including Natural Language Processing, the thing need to understand is the complexity of the language. With the current development of Artificial Neural Network ANN, more problems can be solved. There are many type of ANN and for this research Convolutional Neural Network CNN and Recurrent Neural Network will be used. Both already showing great result for several NLP tasks. Data taken from stanford publication and transform it with word2vec so could be used for ANN. The result shows that RNN is better than CNN. Even the difference of accuracy is not significant with 88.35 0.07 for RNN and 87.11 0.50 for CNN, the training time for RNN only need 8.256 secods while CNN need 544.366 seconds.
Depok: Fakultas Teknik Universitas Indonesia, 2017
S68746
UI - Skripsi Membership  Universitas Indonesia Library
cover
Akmal Ramadhan Arifin
Abstrak :
Sistem Penilaian Esai Otomatis (SIMPLE-O) dikembangkan oleh Departemen Teknik Elektro Fakultas Teknik Universitas Indonesia untuk ujian bahasa Indonesia. Skripsi ini akan membahas mengenai pengembangan SIMPLE-O untuk penilaian ujian bahasa Indonesia menggunakan metode Siamese Manhattan Long Short-Term Memory (LSTM) dan bahasa pemrograman Python. Terdapat dua dokumen yang akan menjadi input, yaitu jawaban esai dari peserta ujian dan jawaban referensi dari penguji. Kedua jawaban diproses dengan layer LSTM yang sama. Selanjutnya, kemiripan antara keduanya dihitung dengan fungsi persamaan. Pengujian dengan dataset jawaban dummy mendapatkan nilai MAE dan RMSE sebesar 0.0254 dan 0.0346. Kemudia, pengujian dengan dataset jawaban asli mendapatkan nilai MAE dan RMSE terbaik sebesar 0.1596 dan 0.2190. Rata-rata nilai akurasi yang didapatkan adalah 92.82 untuk fase training dan 84.03 untuk validasi.


The Automatic Essay Assessment System (SIMPLE-O) was developed by the Department of Electrical Engineering, Faculty of Engineering, University of Indonesia for the Indonesian language test. This thesis will discuss the development of SIMPLE-O for the assessment of Indonesian language tests using the Siamese Manhattan Long Short-Term Memory (LSTM) method and the Python programming language. There are two documents that will be input, essay answers from examinees and answer answers from examiners. Both answers are processed with the same LSTM layer. Next, the similarity between the two is calculated by the similarity function. Testing with dummy answer dataset produces MAE and RMSE values of 0.0254 and 0.0346. Then, testing with the real answer dataset produces MAE and RMSE values of 0.1596 and 0.2190. The average accuracy value obtained was 92.82 for the training phase and 84.03 for validation.

Depok: Fakultas Teknik Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ilma Alpha Mannix
Abstrak :
Penelitian ini bertujuan untuk menguji efektivitas pre-trained language model BERT pada tugas pencarian dosen pakar. Bidirectional Encoder Representations from Transformers (BERT) merupakan salah satu state-of-the-art model saat ini yang menerapkan contextual word representation (contextual embedding). Dataset yang digunakan pada penelitian ini terdiri dari data pakar dan bukti kepakaran. Data pakar merupakan data dosen Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI). Data bukti kepakaran merupakan data abstrak digital tugas akhir mahasiswa Fasilkom UI. Model yang diusulkan pada penelitian ini terdiri dari tiga variasi BERT, yaitu IndoBERT (Indonesian BERT), mBERT (Multilingual BERT), dan SciBERT (Scientific BERT) yang akan dibandingkan dengan model baseline menggunakan word2vec. Terdapat dua pendekatan yang dilakukan untuk mendapatkan urutan dosen pakar pada variasi model BERT, yaitu pendekatan feature-based dan fine-tuning. Penelitian ini menunjukkan bahwa model IndoBERT dengan pendekatan feature-based memberikan hasil yang lebih baik dibandingkan baseline dengan peningkatan 6% untuk metrik MRR hingga 9% untuk metrik NDCG@10. Pendekatan fine-tuning juga memberikan hasil yang lebih baik pada model IndoBERT dibandingkan baseline dengan peningkatan 10% untuk metrik MRR hingga 18% untuk metrik P@5. Diantara kedua pendekatan tersebut, dibuktikan bahwa pendekatan fine-tuning memberikan hasil yang lebih baik dibandingkan dengan pendekatan feature-based dengan peningkatan 1% untuk metrik P@10 hingga 5% untuk metrik MRR. Penelitian ini menunjukkan bahwa penggunaan pre-trained language model BERT memberikan hasil yang lebih baik dibandingkan baseline word2vec dalam tugas pencarian dosen pakar. ......This study aims to test the effectiveness of the pre-trained language model BERT on the task of expert finding. Bidirectional Encoder Representations from Transformers (BERT) is one of the current state-of-the-art models that applies contextual word representation (contextual embedding). The dataset used in this study consists of expert data and expertise evidence. The expert data is composed of faculty members from the Faculty of Computer Science, University of Indonesia (Fasilkom UI). The expertise evidence data consists of digital abstracts by Fasilkom UI students. The proposed model in this research consists of three variations of BERT, namely IndoBERT (Indonesian BERT), mBERT (Multilingual BERT), and SciBERT (Scientific BERT), which will be compared to a baseline model using word2vec. Two approaches were employed to obtain the ranking of expert faculty members using the BERT variations, namely the feature-based approach and fine-tuning. The results of this study shows that the IndoBERT model with the feature-based approach outperforms the baseline, with an improvement of 6% for the MRR metric and up to 9% for the NDCG@10 metric. The fine-tuning approach also yields better results for the IndoBERT model compared to the baseline, with an improvement of 10% for the MRR metric and up to 18% for the P@5 metric. Among these two approaches, it is proven that the fine-tuning approach performs better than the feature-based approach, with an improvement of 1% for the P@10 metric and up to 5% for the MRR metric. This research shows that the use of the pre-trained language model BERT provides better results compared to the baseline word2vec in the task of expert finding.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dhita Putri Pratama
Abstrak :
COVID-19 telah merenggut nyawa banyak manusia. Tercatat per tanggal 29 Juni 2021, sudah terdapat sekitar 3,923,238 pasien yang meninggal dunia akibat penyakit dengan tingkat penularan yang tinggi ini. Dengan semakin banyaknya orang yang terinfeksi COVID-19, persediaan alat untuk mendeteksi penyakit ini pun juga semakin terbatas yang dapat menyebabkan pandemi COVID-19 pun menjadi semakin tidak terkendali. Oleh karena itu, penting untuk mempertimbangkan metode deteksi COVID-19 lainnya yang dapat membantu para staf kesehatan untuk melakukan deteksi pasien positif COVID-19. Metode deteksi COVID-19 lainnya yang bisa dipertimbangkan untuk dikembangkan adalah metode deteksi COVID-19 dengan artificial intelligence. Dengan metode tersebut, data-data seperti data gejala pasien, data citra toraks, serta data interpretasi citra berupa teks dapat dimanfaatkan untuk mengembangkan suatu model prediksi COVID-19. Ketiga tipe data yang berbeda tersebut dapat dikombinasikan sebagai data input untuk membangun suatu model klasifikasi COVID-19. Pengkombinasian data yang berbeda dapat dilakukan dengan cara melakukan konkatenasi pada tiap input layer yang menerima data gejala dan data teks dengan suatu layer dari arsitektur CNN. Beberapa arsitektur CNN yang dapat digunakan pada penelitian ini adalah ResNet, DenseNet, Inception-ResNet, DarkCovidNet, CoroNet, dan COVID-Net. Selain itu, metode Grad-CAM juga dipilih untuk proses deteksi persebaran coronavirus. Hasil pengujian menunjukkan bahwa banyak model yang dihasilkan dari pendekatan kombinasi data gambar, data tabular, dan data teks memiliki nilai sensitivitas, akurasi, serta f1-score yang tinggi. Hal tersebut menunjukkan bahwa pendekatan tersebut secara umum menghasilkan model-model dengan performa yang tinggi juga seimbang. Namun, berdasarkan hasil pengujian pula, diketahui bahwa model yang memiliki performa tertinggi dicapai oleh model dari pendekatan klasifikasi gambar dengan data tabular yang menggunakan arsitektur DenseNet khususnya dengan nilai learning rate = 10-3. Model tersebut tercatat memiliki performa yang tinggi dan seimbang dengan nilai sensitivitasnya mencapai angka 1,00, akurasi mencapai angka 0,94, dan F1-Score mencapai angka 0,94. ......COVID-19 has taken the lives of many people. As of June 29th 2021, there were approximately 3.923.238 deaths due to this highly contagious disease. With the increasing number of infected people, the COVID-19 detection tool supplies are also getting limited that can lead to an out-of-control situation. Therefore, it is quite necessary to consider alternative methods for COVID-19 detection. Another COVID-19 detection that can be considered to be developed is a COVID-19 detection method with artificial intelligence. With artificial intelligence, a COVID-19 prediction model can be built by using any available data such as patient symptom dataset, patient thorax images especially chest X-Ray, and thorax interpretations in text form. Those three types of data can be utilized and combined as data input to build a COVID-19 detection system. The combination of those three different types of data can be done with the concatenation of each input layer of tabular and text data with a layer from a CNN architecture. In this study, there are six CNN architectures used and those are ResNet, DenseNet, Inception-ResNet, DarkCovidNet, CoroNet, and COVID-Net. Besides, the Grad-CAM technique is also implemented for coronavirus detection purposes. The result shows that most of the models from the combined image, tabular, and text datasets offer high sensitivities, accuracies, and scores of F1-Score. It means that the combined image, tabular, and text datasets generally obtained high performance and balanced models. However, according to the test results, the best performance model is achieved by the combined image and tabular datasets approach with DenseNet architecture and the learning rate of \(10^{-3}\). Such a model achieves the best performance model with an accuracy score of 0.94, a sensitivity score of 1.00, and an f1-score of 0.94.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library