Hasil Pencarian

Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 10 dokumen yang sesuai dengan query
Hannah Gracia Tiurinda
"Melalui penelitian dan penulisan ini, program Sistem Penilaian Esai Otomatis (SIMPLE-O) dikembangkan untuk penilaian esai berbahasa Indonesia menggunakan algoritma hybrid CNN dan Bidirectional GRU dengan metrik Manhattan Distance dan Cosine Similarity. CNN digunakan untuk melakukan ekstraksi fitur dari masukan teks. Bidirectional GRU digunakan untuk menangkap makna atau konteks teks dari dua arah. Pengembangan program ini menggunakan bahasa pemrograman Python untuk proses deep learning. Hasil rata-rata selisih penelitian ini adalah 15.04 untuk model metrik Manhattan Distance dan 22.02 untuk model Cosine Similarity.

Through this research and writing, the Automatic Essay Scoring System (SIMPLE-O) program was developed for evaluating essays in the Indonesian language using a hybrid CNN and Bidirectional GRU algorithm with Manhattan Distance and Cosine Similarity metrics. CNN is employed to extract features from the input text, while Bidirectional GRU captures the meaning or context of the text from both directions. The development of this program utilizes the Python programming language for deep learning processes. The average differences results of this research is 15.04 for the Manhattan Distance metric model and 22.02 for the Cosine Similarity model."
Lengkap +
Depok: Fakultas Teknik Universitas Indonesia, 2023
UI - Skripsi Membership  Universitas Indonesia Library
Wongkar, Enggelin Giacinta
"With the vast development of data to become informations on the Internet, everything online seems to explode at a rapid rate. These informations, including online news which is created as a complement to the original printed media, has even overtaken the latter. Subdirectorate of Household National Account and Non-profit Institution of Statistics Indonesia is in charge for the work of media research. In the process of media research, time and human resources are two important elements but yet having problem of ineffective and inefficient process. This study aimed to overcome that problem by developing a web crawler system that could do summarization automatically from online news sites (currently from Bisnis and Kontan) with output in Microsoft Word format file and minimizing number of similar news. This system is developed using several techniques in information technologies such as crawling and wrapping method and cosine similarity method to minimalize similar news. The result shows the process of media research by using this system much more effective and efficient."
Lengkap +
Jakarta: Sekolah Tinggi Ilmu Statistik (STIS-Statistics Institute Jakarta, 2014
JASKS 6:2 (2014)
Artikel Jurnal  Universitas Indonesia Library
Agung Firmansyah
"Jurnal ini membahas tentang pengembangan Sistem Penilaian Esai Otomatis (SIMPLE-O) untuk Bahasa Indonesia menggunakan BERT (Bidirectional Encoder Representations from Transformers) dan Bidirectional LSTM. BERT digunakan untuk melakukan sentence embedding pada jawaban mahasiswa dan dosen, yang kemudian diproses oleh Bidirectional LSTM. Kemiripan antara jawaban diukur dengan menggunakan Manhattan Distance dan Cosine Similarity. Hasil pengujian menunjukkan bahwa rata-rata selisih absolut antara nilai model dengan nilai human rater adalah 22.83 dengan error MAE dan RMSE sebesar 0.2462 dan 0.2850 untuk Manhattan Distance, dan 12.88 dengan error MAE dan RMSE sebesar 0.1614 dan 0.1946 untuk Cosine Similarity.

This paper presents the development of an Automatic Essay Scoring System (SIMPLE-O) for the Indonesian using BERT (Bidirectional Encoder Representations from Transformers) and Bidirectional LSTM. BERT is used to perform sentence embedding on both student and lecturer answers, which are then processed by Bidirectional LSTM. The similarity between the answers is measured using Manhattan Distance and Cosine Similarity. The test results show that the average absolute difference between the model score and the human rater score is 22.83 with MAE and RMSE error of 0.2462 and 0.2850 for Manhattan Distance, and 12.88 with MAE and RMSE error of 0.1614 and 0.1946 for Cosine Similarity."
Lengkap +
Depok: Fakultas Teknik Universitas Indonesia, 2024
UI - Skripsi Membership  Universitas Indonesia Library
Ahmad Rasyid Maulana
"Perubahan adalah sesuatu yang biasa terjadi dalam kehidupan sehari-hari. Baik itu masyarakat, lingkungan, dan khususnya teknologi tidak lepas dari perubahan. SIMPLE-O merupakan salah satu bentuk perkembangan teknologi yang memungkinkan otomatisasi koreksi soal dalam bentuk esai. Pada skripsi ini akan dilakukan integrasi sistem SIMPLE-O dengan web interface yang telah diciptakan tahun lalu, dan menggabungkan algoritma LSA dengan algoritma Cosine Similarity dan algoritma Jaro Winkler Distance untuk kemudia diuji dan dianalisis hasilnya. Berdasarkan hasil analisis, algoritma gabungan lebih efektif dan akurat dalam 5 dari 6 skenario, dengan nilai korelasi yang lebih tinggi. Namun, untuk algoritma gabungan maupun algoritma yang tidak dimodifikasi, tingkat akurasi masih rendah jika menggunakan jawaban yang menggunakan banyak kata-kata. Tingkat akurasi masih termasuk rendah untuk kedua algoritma, dengan korelasi tertinggi hanya mencapai 0.416883886. Sistem dengan Algoritma LSA memiliki keunggulan waktu proses yang signifikan atas sistem dengan Algoritma gabungan, dimana keunggulan waktu sampai dengan 531%.

Change is something that occurs frequently in our daily lives. Nothing is free of change, be it the public, the environment, and especially technology. SIMPLE-O is a form of technology advancement which makes automatic essay correction possible. This essay will integrate SIMPLE-O with a web interface that was created specifically for SIMPLE-O last year, and integrate Cosine Similarity and Jaro Winkler Distance algorithms into the system. Based on the analysis, the joined algorithm is more effective and accurate in 5 out of 6 scenarios, whic is indicated by a higher correlation number. However, for the algorithm whether it is joined or not, the accuracy is still low if it is used for processing long answers. The accuracy level is still low for both systems, with the highest correlation value being 41%. Regarding execution time, the unmodified system is vastly superior with processing speeds up to 531% faster than the modified system.
Lengkap +
Depok: Fakultas Teknik Universitas Indonesia, 2016
UI - Skripsi Membership  Universitas Indonesia Library
Vincent Sanjaya
"Penelitian ini membahas tentang pengembangan sistem Chatbot pada customer service bengkel motor dengan menggunakan algoritma cosine similarity. Cosine Similarity merupakan algoritma dengan basis dua vektor yang dihitung persamaannya berdasarkan sudut kedua vektor tersebut untuk mengukur tingkat kemiripan teks. Masukan sistem berupa percakapan teks yang pada proses selanjutnya diubah menjadi vektor dengan besar nilai vektor mengikuti dataset yang ada menggunakan metode Bag Of Words dengan dataset untuk membalas percakapan tersebut. Kemiripan suatu teks menggunakan akurasi dari perhitungan cosine similarity dengan akurasi sebesar 82.7%. Diamati faktor-faktor yang mempengaruhi akurasi setiap pengguna. Dalam penelitian ini, sistem menggunakan dataset sebesar 472 data katalog sepeda motor.

This paper discusses the development of a chatbot system in a motorcycle garage using the cosine similarity algorithm. Cosine similarity is an algorithm to calculate the degree of similarity of two vectors based on the value of the angle between the two vectors. The chatbot receives an input consisting of a sentence which is then converted into a vector using the Bag of Words algorithm. Using the cosine similarity algorithm, an accuracy of 82.7% is achieved. This paper utilizes 472 motorcycle catalogues as a dataset to perform the calculation and prediction previously mentioned."
Lengkap +
Depok: Fakultas Teknik Universitas Indonesia, 2020
UI - Skripsi Membership  Universitas Indonesia Library
Naura Asyifa
"Sistem Penilaian Esai Otomatis (SIMPLE-O) merupakan teknologi deep learning yang dikembangkan oleh Departemen Teknik Elektro, Fakultas Teknik Universitas Indonesia. SIMPLE-O dikembangkan untuk menilai ujian esai Bahasa Indonesia menggunakan gabungan algoritma CNN dengan Bidirectional LSTM. Dokumen yang menjadi input untuk sistem berupa jawaban mahasiswa dan kunci jawaban dosen. Keduanya akan melalui proses pre-processing yang dilanjut menuju proses embedding dan masuk ke dalam model deep learning. Selanjutnya akan dilakukan perhitungan dengan metrik penilaian yaitu Manhattan Distance dan Cosine Similarity. Pengujian dilakukan dengan mencari hyperparameter terbaik dari enam skenario yang dijalankan. Hasil pengujian skenario akhir fase training dan testing pengukuran Manhattan Distance mendapatkan nilai rata-rata selisih sebesar 0,72 dan 15,19. Untuk pengujian akhir pengukuran Cosine Similarity didapatkan nilai sebesar 1,07 dan 15,43.

The Automated Essay Assessment System (SIMPLE-O) is a deep learning technology developed by the Department of Electrical Engineering, Faculty of Engineering, University of Indonesia. SIMPLE-O was developed to assess Indonesian essay exams using the CNN algorithm and the Bidirectional LSTM. Documents that become input for the system are student answers and lecturer answer keys. Both of them will go through a pre-processing process, leading to the embedding process and entering the deep learning model. Next, calculations will be done with assessment metrics: Manhattan Distance and Cosine Similarity. Testing is done by looking for the best hyperparameters from the six-run scenarios. The results of testing the scenario at the end of the training and testing phase of the Manhattan Distance measurement obtained an average difference of 0.72 and 15.19. For the final test of the Cosine Similarity measurement, values were obtained of 1.07 and 15.43."
Lengkap +
Depok: Fakultas Teknik Universitas Indonesia, 2023
UI - Skripsi Membership  Universitas Indonesia Library
Fika Fikria Riasti
"Skripsi ini membahas mengenai pengembangan Sistem Penilaian Esai Otomatis (SIMPLE-O) untuk ujian esai berbahasa Indonesia. Sistem ini dirancang dengan menggunakan Stacked Bidirectional LSTM dan menggunakan dua jenis similarity measurement, yaitu Manhattan Distance dan Cosine Similarity, untuk mencari model dengan performa paling optimal dan selisih terbaik dari tiap jenis similarity measurement. Sistem ini menggunakan bahasa pemrograman Python, dan terdiri atas tahap preprocessing, word embedding, training menggunakan deep learning, testing, dan similarity measure untuk menghitung kemiripan antar kata pada input. Input yang digunakan pada sistem ini adalah jawaban dosen sebagai kunci jawaban dan jawaban mahasiswa. Fase training menggunakan data augmentasi dan fase testing menggunakan jawaban mahasiswa asli. Pengujian sistem ini dilakukan dengan menggunakan 7 jenis skenario. Dengan hasil selisih akhir dari model untuk fase training dan testing pada Manhattan Distance sebesar 1.871 dan 7.808, dan Cosine Similarity sebesar 2.31 dan 7.635.

This thesis discusses the development of an Automated Essay Scoring System (SIMPLE-O) for Indonesian-language essay exams. This system is designed using Stacked Bidirectional LSTM and uses two types of similarity measurement, which are Manhattan Distance and Cosine Similarity, to find the model with the most optimal performance and the best difference from each type of similarity measurement. The system uses Python programming language, and the system's stages consist of preprocessing, word embedding, training using deep learning, testing, and similarity measuring to calculate the similarity between words on the input. The inputs used in this system are lecturers' answers as answer keys and students' answers. The training phase uses augmented data, and the testing phase uses original student answers. To test this system uses 7 types of scenarios. The final difference results of the model for the training and testing phases are 1.871 and 7.808 on Manhattan Distance and 2.31 and 7.635 on Cosine Similarity."
Lengkap +
Depok: Fakultas Teknik Universitas Indonesia, 2023
UI - Skripsi Membership  Universitas Indonesia Library
Wishnu Hardi
"The Australian Embassy in Jakarta stores a wide array of media release document. Analyzing particular and vital patterns of the documents collection is imperative as it may result new insights and knowledge of significant topic groups of the documents. K-Means algorithm was used as a non-hierarchical clustering method which partitioning data objects into clusters. The method works through minimizing data variation within clusters and maximizing data variation between clusters. Of the documents issued between 2006 and 2016, 839 documents were examined in order to determine term frequencies and generate clusters. Evaluation was conducted by nominating an expert to validate the cluster result. The result showed that there were 57 meaningful terms grouped into 3 clusters. “People to people links”, “economic cooperation”, and “human development” were chosen to represent topics of the Australian Embassy Jakarta media releases from 2006 to 2016. Text mining can be used to cluster topic groups of documents. It provides a more systematic clustering process as the text analysis is conducted through a number of stages with specifically set parameters."
Lengkap +
Jakarta: Pusat Jasa Perpustakaan dan Informasi, 2019
020 VIS 21:1 (2019)
Artikel Jurnal  Universitas Indonesia Library
Ria Yuliana
"Pada skripsi ini akan membahas mengenai pengimplementasi pendeteksian pengulangan kata menggunakan Cosine Similarity, sedangkan untuk melihat makna antar kalimat akan dilakukan pembobotan kalimat yang sebelumnya di lakukan proses parsing, stemming, stopword dan melakukan pemisahan antar kalimat. Metode stemming yang akan digunakan adalah metode stemming Arifin-Setiono, proses stemming digunakan untuk mencari kata dasar dari setiap kata pada jawaban dan kemudian dibandingkan dengan kata yang ada pada database. Jika antar kalimat masing-masing dibandingkan dan memiliki nilai cosine similarity lebih dari 0.5 maka sistem tambahan akan menghapus satu kalimat tersebut. Waktu proses antara sistem SIMPLE-O murni lebih cepat jika dibandingkan dengan SIMPLE-O dengan pendeteksian kata yang berulang antar kalimat dengan selisih waktu 0.22 detik. Korelasi nilai antara SIMPLE-O+Cosine dengan Human Raters adalah yaitu sebesar 0.38 untuk soal nomor satu dan untuk soal nomor dua memiliki nilai korelasi yang bernilai negatif 0.08 , untuk soal tiga 0.13, untuk soal empat 0.65 dan 0.022 untuk soal nomor lima.
In this paper will discuss the use of word repetition detection implement Cosine Similarity, while to see the meaning of the sentence will be weighted between sentences previously performed process of parsing , stemming , stopword and separation between sentences . Stemming method to be used is a method of stemming Arifin - Setiono , stemming process used to find root of each word in student answer , and then compared with of the word database . If the inter- sentence and has been compared and have value of cosine similarity more than 0.5 , the additional features on the system will remove a sentence . The time between system processes SIMPLE - O more fast when compared with SIMPLE-O with additional features on the system that will repetitive detection word sentence with a time difference between 0.22 seconds. The correlation value of the Human Raters with the SIMPLE-O + Cosine is 0.383 for the first question, -0.08 for the second question, 0.13 for the third question, 0.65 for the fourth question and 0.02 for the fifth question."
Lengkap +
Depok: Fakultas Teknik Universitas Indonesia, 2015
UI - Skripsi Membership  Universitas Indonesia Library
Farah Halimatun Najdah
Pada skripsi ini akan membahas mengenai integrasi antarmuka web Simple-O dengan fitur-fiturnya yang telah dikembangkan sebelumnya. Fitur-fitur yang diintegrasikan di antaranya adalah fitur pendeteksi kata kerja aktif-pasif dan pengulangan kata menggunakan Cosine Similarity. Kata kerja yang sebelumnya berbentuk pasif sehingga tidak terdeteksi oleh sistem penilai Latent Semantic Analysis(LSA) akan diubah ke dalam bentuk kata dasarnya sehingga bisa ikut dinilai oleh sistem. Kata-kata yang sering diulang dalam jawaban yang membuat nilai melonjak juga akan dibandingkan dan apabila memiliki nilai cosine similarity lebih dari satu maka sistem akan menghapus kalimat tersebut.
Korelasi nilai antara Simple-O dan Simple-O+Fitur adalah sebesar 0.99082 untuk soal pertama, 0.993315156 untuk soal nomor dua, dan 0.959658282 untuk soal ketiga.

This paper will discus about integration of Simple-O interface with the features that has been developed before. There are two features integrated in the system which is Active-Passive Phrase and Words Repetition Detectors using Cosine Similarity. A passive phrase, which is not detected as one of the keyword will be detected and reformed into the basic form of the word, which makes the grading system Latent Semantic Analysis(LSA) to be able to grade it. Words that are repetitive in the answers will be compared, when it has cosine similarity value more than 0.5, one of the words will be removed.
Correlation value between Simpe-O and Simple-O+Features is 0.99082 for the first question, 0.993315156 for the second one, dan 0.959658282 for the third one."
Lengkap +
UI - Skripsi Membership  Universitas Indonesia Library