Ditemukan 174365 dokumen yang sesuai dengan query
Paskalis Nandana Yestha Nabhastala
"Penelitian yang dilakukan berupa pengembangan terhadap sistem pendeteksi plagiarisme otomatis sehingga dapat menerapkan jaringan saraf tiruan Self-Organizing Map SOM untuk melakukan klasifikasi terhadap hasil keluaran Latent Semantic Analysis. SOM dipilih untuk melakukan klasifikasi karena algoritma ini tidap perlu melakukan supervisi pada proses pembelajarannya sehingga dapat secara otomatis menentukan tingkat plagiarisme antar paragraf yang tidak mudah ditentukan secara langsung oleh manusia. Selain itu dilakukan perbandingan akurasi penentuan tingkat plagiarisme yang dimiliki oleh sistem apabila hanya menggunakan LSA saja, penggunaan LSA dengan SOM, dan penggunaan LSA dengan Learning Vector Quantization LVQ.
Penggunaan SOM dan LVQ dilakukan untuk melakukan klasifikasi tingkat plagiarisme dari hasil keluaran LSA. Penentuan tingkat plagiarisme sudah cukup dilakukan apabila hanya menggunakan LSA saja, dimana sudah dapat menghasilkan tingkat akurasi paling tinggi yaitu 86,24. Namun, penggunaan SOM dengan jumlah kelas sebanyak 2 dengan 3 parameter memberikan rata-rata tingkat akurasi yang sedikit lebih rendah, yaitu sebesar 82,00. Sedangkan penggunaan LVQ dengan jumlah kelas sebanyak 2 dengan 3 parameter juga memberikan rata-rata tingkat akurasi yang sedikit lebih tinggi dibandingkan, yaitu sebesar 82,10.
This research has concern on deployment of neural network algorithm Self Organizing Map SOM in automatic plagiarism detector so it could be used to classify the output from Latent Semantic Analysis. SOM is chosen because it is an unsupervised neural network algorithm. With unsupervised neural network, it could determine the plagiarism level between paragraf automatically, which hard for human to determine it. Other than deployment of SOM, this research also focusses on the comparison of accuracy of the system if the system only deploys pure LSA, combination of LSA and SOM, and combination of LSA and Learning Vector Quantization LVQ. SOM and LVQ are used to do classification for the output from LSA. Plagiarism level could be determined by the result of LSA only. It has 86,24 as the highest accuracy level. But, the usage of SOM with 2 classes and 3 parameters gives lower average of accuracy, which is 82,00 . Therefore, usage of LVQ with 2 classes and 3 parameters gives slight better accuracy than SOM, which is 82,10."
Depok: Fakultas Teknik Universitas Indonesia, 2018
Spdf
UI - Skripsi Membership Universitas Indonesia Library
Ihsan Ibrahim
"Di Indonesia yang mayoritas karya tulis di dunia akademiknya masih menggunakan bahasa Indonesia dan referensi yang digunakan mayoritas berbahasa Inggris, memudahkan terjadinya tindak plagiarisme daripada penggunaan bahasa yang sama. Departemen Teknik Elektro telah mengembangkan sistem pendeteksi plagiarisme dwibahasa berbasis Latent Semantic Analysis LSA . Lamanya eksekusi, membuat paralelisme menjadi solusi untuk mengurangi waktu eksekusi dari sistem. Pada penelitian ini dilakukan pengembangan dengan pemrosesan paralel terhadap sistem dengan menggunakan OpenMP. Proses yang diparalelkan adalah, yaitu Singular Value Decomposition SVD, operasi-operasi matriks, dan proses Learning Vector Quantization LVQ dengan melakukan pada pendekatan loop-loop-nya.
Pada pengujian yang dilakukan, akurasi dari proses paralel memiliki konsistensi yang baik karena hasil yang sama dengan proses serial dan didapatkan peningkatan kecepatan eksekusi sistem sebesar 4-7,9 . Dengan fenomena pemrosesan paralel dengan menggunakan 1 thread memiliki waktu eksekusi yang lebih lambat daripada proses serial. Sedangkan saat menggunakan 2 thread dan 4 thread, didapatkan hasil yang lebih cepat daripada proses serial meskipun penggunaan 4 thread hanya berbeda sedikit atau cenderung sama dengan 2 thread. Hal ini disebabkan adanya overhead OpenMP yang terjadi saat pemrosesan paralel berjalan sebesar 20 , dan overhead MySQL yang membuat proses menjadi sangat lama karena besarnya yang mencapai 70 saat proses serial dan 50 pada proses paralel.
Majority of academic environment in Indonesia is still using Indonesian language and its references are in English. This condition led to ease the plagiarism acts when compared to same language environment. Due to this problem, Department of Electrical Engineering has developed bilingual plagiarism detection system based on Latent Semantic Analysis LSA . Parallelism becomes a solution to duration of execution problem. Development of parallel processing on the system with using OpenMP was conducted in this research. The parallelized processes were Singular Value Decomposition SVD , matrices operations, and Learning Vector Quantization LVQ with approach on loops. In the testing process, accuracy of the parallel process had the same accuracy with the serial process. It is mean that the parallel process has good consistency. Then, the result of execution time has 4 7.9 of improvement compared to the serial one. There was a phenomenon that 1 thread of parallel process had worse performance than the serial process. Furthermore, use of 2 threads and 4 threads in the parallel process had a better execution time, even 4 threads is only slightly better or tend to be the same with 2 threads. These happened due to overhead presences. OpenMP overhead appeared at 20 when parallel executed and MySQL had more with 70 of system computation process in serial and 50 when executed in parallel."
Depok: Fakultas Teknik Universitas Indonesia, 2018
T50881
UI - Tesis Membership Universitas Indonesia Library
Darien Jonathan
"
ABSTRAKDistribusi normal adalah salah satu jenis persebaran kelompok data yang didefinisikan berdasarkan rata-rata dan standar deviasi dari sekelompok data, yang dapat digunakan untuk mengelompokkan data berdasarkan posisinya terhadap standar deviasi dari kelompok data tersebut. Learning Vector Quantization adalah salah satu jenis neural network yang bisa mempelajari sendiri masukan yang ia terima kemudian memberi keluaran sesuai dengan masukan tersebut, dengan metode supervised dan competitive learning. Skripsi ini membahas penerapan dan analisis dari kedua sistem tersebut untuk menguji hasil deteksi plagiarisme oleh sistem deteksi plagiarisme berbasis latent semantic analysis, yang berasal dari program Simple-O. Beberapa modifikasi dilakukan untuk meningkatkan akurasi pengujian, antara lain dengan melakukan variasi parameter-parameter dari metode distribusi normal, yakni dengan mengubah batas standar deviasi maupun dengan mengubah koefisien pengali batas nilai pada standar deviasi tertentu, dimana hasilnya adalah standar deviasi maupun koefisien pengalinya berbanding lurus dengan aspek relevansi program (recall) namun tidak pada akurasi (F-Measure). Modifikasi juga dilakukan pada parameter percepatan belajar dari algoritma learning vector quantization, dimana hasilnya adalah parameter percepatan belajar berbanding terbalik dengan relevansi program maupun akurasi. Kemudian variasi dan analisis dilakukan pada tujuh jenis besaran hasil keluaran sistem deteksi plagiarisme berbasis latent semantic analysis, yakni frobenius norm, slice, dan pad, beserta kombinasinya, dimana hasilnya keberadaan frobenius norm diwajibkan untuk melakukan evaluasi kemiripan antara dua teks. Kemudian hasil pengujian menggunakan kedua metode digabungkan menggunakan operasi AND yang memberikan hasil yang beragam, dengan catatan perlunya keseimbangan antara precision dan recall dari masing pengujian yang akan dilakukan operasi AND untuk memberikan hasil yang baik. Dengan menggunakan kombinasi metode dan parameter yang tepat, terdapat peningkatan akurasi sistem dari 35-46% pada penelitian sebelumnya hingga maksimal 65,98%.
ABSTRACTNormal distribution is a type of data distributions which is defined from the average and standard deviation of the data cluster. It can be used to group datas based on its position from the standard deviation of the data cluster. Learning vector quantization is a type of neural networks that can learn from inputs it gets to give appropriate outputs, with supervised and competitive learning methods. This thesis discusses the implementation and analysis of both methods to verify the plagiarism detection results from detection plagiarism system based on latent semantic analysis, which is based on Simple-O program. Some modifications are made, such as by variating the parameters of normal distribution method, by changing the limits of standard deviation or by changing the factor of the number limit at a particular standard deviation. Both of them appear to be directly proportional to the relevance (recall), but not with accuracy (F-Measure). Modifications are also made at the learning acceleration parameters from the learning vector quantization algorithm, which sees the parameters being inversely proportional to both the relevance and accuracy. Then, variations and analysis are done to seven types of magnitude from the results of the plagiarism detection system, which are frobenius norm, slice, and pad, and their combinations, which suggest that frobenius norm is the most verifiable results, and must be included to be evaluated when text similarity analysis are conducted. Then, verification results using both methods are combined using AND operation which gives diverse results. However, it is needed to have a balance between precision and recall from each verifications to produce good results. With correct combinations of methods and parameters, system accuracy are increased from 35-46% of last research to maximum accuracy of 65,98%."
Fakultas Teknik Universitas Indonesia, 2016
S62578
UI - Skripsi Membership Universitas Indonesia Library
Rizal Adi Saputra
"Macular edema is a kind of human sight disease as a result of advanced stage of diabetic retinopathy. It affects the central vision of patients and in severe cases lead to blindness. However, it is still difficult to diagnose the grade of macular edema quickly and accurately even by the medical doctor's skill. This paper proposes a new method to classify fundus images of diabetics by combining Self-Organizing Maps (SOM) and Generalized Vector Quantization (GLVQ) that will produce optimal weight in grading macular edema disease class. The proposed method consists of two learning phases. In the first phase, SOM is used to obtain the optimal weight based on dataset and random weight input. The second phase, GLVQ is used as main method to train data based on optimal weight gained from SOM. Final weights from GLVQ are used in fundus image classification. Experimental result shows that the proposed method is good for classification, with accuracy, sensitivity, and specificity at 80%, 100%, and 60%, respectively."
Surabaya: Faculty of Information and Technology, Department of Informatics Institut Teknologi Sepuluh Nopember, 2014
AJ-Pdf
Artikel Jurnal Universitas Indonesia Library
Dian Rismawati
"Departemen Teknik Elektro Universitas Indonesia telah mengembangkan suatu sistem berbasis Latent Semantic Analysis (LSA) untuk mendeteksi plagiarisme pada karya tulis berbahasa Indonesia dan Inggris. Data keluaran sistem deteksi plagiarisme berbasis LSA adalah nilai frobenius norm, slice, dan pad. Pada skripsi ini akan menjelaskan serta memberikan analisis pada pengembangan sistem deteksi plagiarisme yang telah ada yaitu dengan menerapkan algoritma Support Vector Machine (SVM).
Support Vector Machine (SVM) adalah suatu Learning Algoritm yang bertujuan untuk menemukan suatu hipotesis berupa bidang pemisah (hyperplan) terbaik dari sekumpulan data yang dapat dipisahkan secara linear maupun tidak linear. SVM akan memisahkan data hasil keluaran sistem deteksi plagiat bebasis LSA menjadi dua kelas yaitu "plagiat" dan "tidak plagiat" dengan menggunakan 2 metode yaitu kombinasi data input dan kombinasi data output dengan metode AND. Beberapa modifikasi terhadap imput program dilakukan diantaranya memvariasikan parameter-parameter pembelajaran dan memvariasikan data hasil keluaran program deteksi plagiarisme berbasis LSA.
Hasil dari analisis serta pengujian yang telah dilakukan yaitu jika menggunakan parameter serta kombinasi data yang tepat, SVM mampu untuk meningkatkan akurasi sistem dari sistem yang menggunakan metode Learning Vector Quantization (LVQ) pada penelitian sebelumnya hingga menghasilkan akurasi sebesar 63,15% hal ini dilihat jika mempertimbangkan keseimbangan terhadap aspek presisi dan relevansi program sedangkan jika dilihat melalui presentase jumlah data yang berhasil diklasifikasikan dengan tepat, SVM mampu menghasilkan akurasi sebesar 97,04%.
Department of Electrical Engineering, University of Indonesia has developed a system based on Latent Semantic Analysis (LSA) to detect plagiarism between two paper written in different languages, which are Indonesian and English. The output data of plagiarism detection system are frobenius norm, slice, and pad. This thesis will explain and provide analysis of the development of plagiarism detection system that already exist by applying Support Vector Machine (SVM) algorithm. Support Vector Machine (SVM) is a Learning Algorithm that aims to find a best hypothetical form called hyperplan to separated a set of data that can be separated linearly and nonlinearly. SVM will separate output data of plagiarism detection system into two classes, "plagiat" class and "tidak plagiat" class by using two methods: combination of input data method and output data combined with AND method. Some modifications to input program are made, such as variating the parameters of learning and variating the output data of plagiarism detection program. The results of analysis and test that has been done are: if the system use correct parameters and correct combinations of the data, SVM is able to improve accuracy of the system from the last research that using Learning Vector Quantization (LVQ). The accuracy of SVM is 63,15% if considering the balance of precision and relevance of the program, while when viewed through a percentage of the amount of data that appropriately classified, the accuracy of SVM is 97.04%."
Depok: Fakultas Teknik Universitas Indonesia, 2016
S65023
UI - Skripsi Membership Universitas Indonesia Library
Muhammad Yusuf Irfan Herusaktiawan
"Penelitian ini mengembangkan dan menganalisa sistem pendeteksi plagiarisme dua bahasa berbasis Latent Semantic Analysis untuk karya tulis berbahasa Indonesia dan referensi berbahasa Inggris. Sistem pendeteksi plagiarisme menggunakan algoritma backpropagation neural network untuk melakukan klasifikasi pasangan karya tulis berbahasa Indonesia dan Inggris yang sudah dinilai tingkatan plagiarismenya secara manual. Sistem dapat memperoleh klasifikasi akurasi F-measure sampai dengan 92.75.
Hasil percobaan menunjukkan bahwa akurasi tertinggi dapat diperoleh jika menggunakan metode term frequency binary dalam penghitungan jumlah kata dan penggunaan frobenius norm, vector angle slice, dan vector angle pad sebagai pilihan fitur untuk masukan backpropagation neural network.
This research aims to develop and analyse dual language plagiarism detection system based on Latent Semantic Analysis for papers with Indonesian language and reference text with English language. The plagiarism detection system uses backpropagation neural network algorithm to classify pairs of Indonesian and English papers which plagiarism levels has been graded manually. The system has reached classification accuracy using F measure metric up to 92.75. Experiment results show that the highest accuracy obtained when using term frequency binary method in counting frequency of words and using frobenius norm, vector angle slice, and vector angle pad features for backpropagtion neural network input."
Depok: Fakultas Teknik Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership Universitas Indonesia Library
Hanifah Khairunnisa
"
ABSTRAKDalam penelitian ini, Sistem Penilaian Esai Ototmatis (Simple-O) dirancang menggunakan algoritma Latents Semantic Analysis (LSA), Term Frequency-Inverse Document Frequency, dan algoritma Support Vector Machine (SVM). Algoritma LSA digunakan untuk mengolah kata-kata yang merepresentasikan kata-kata dalam teks menjadi matriks. Algoritme SVM digunakan untuk mengklasifikasikan esai jawaban siswa berdasarkan topiknya. TF-IDF digunakan untuk menimbang setiap kata dalam teks yang akan menjadi input SVM. Dari penelitian ini ketepatan penggunaan jawaban dosen sebagai jawaban referensi adalah 72,01% dan ketepatan penggunaan kata kunci sebagai jawaban referensi adalah 69,5%.
ABSTRACTIn this study, the Automatic Essay Assessment System (Simple-O) was designed using the Latents Semantic Analysis (LSA) algorithm, Term Frequency-Inverse Document Frequency, and the Support Vector Machine (SVM) algorithm. The LSA algorithm is used to process words that represent words in the text into a matrix. The SVM algorithm is used to classify student essays based on their topic. TF-IDF is used to weigh each word in the text that will become SVM input. From this research, the accuracy of using lecturers' answers as reference answers was 72.01% and the accuracy of using keywords as reference answers was 69.5%."
Depok: Fakultas Teknik Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Nanda Girindratama
"Pada penelitian ini, dikembangkan HPC yang menerapkan multicore processing pada program Sistem Pendeteksi Plagiarisme dengan memanfaatkan infrastruktur komputasi awan berbasis OpenStack. Sistem Pendeteksi Plagiarisme merupakan program yang dikembangkan untuk mendeteksi tingkat plagiarisme dari suatu karya ilmiah. Algoritma program yang digunakan untuk penelitian kali ini adalah latent semantic analysis (LSA). Implementasi HPC dilakukan dengan bantuan library OpenMP yang didesain untuk bahasa pemrograman C. Diterapkan dua jenis paralelisme pada program, yaitu paralelisme fungsi dan paralelisme data. Setelah dilakukan pengujian, didapati hasil bahwa kedua metode paralelisme ini mempercepat eksekusi program. Paralelisme fungsi mempercepat waktu eksekusi hingga sebesar 1,03 kali waktu eksekusi serial dan paralelisme data mempercepat waktu eksekusi hingga 1,34 kali waktu eksekusi serial.
In this research, HPC with multicore processing is developed on Plagiarism Detection System using OpenStack based cloud computing infrastructure. Plagiarism Detection System is a software developed to detect plagiarism level of a scientific papers. The algorithm used in this program is latent semantic analysis (LSA). HPC implementation is done using OpenMP library which is designed to be used in C programming language. There are two types of paralelism in this program, which are function paralelism and data paralelism, both accelerate the execution time. Function paralelism accelerates program by up to 1,03 times of serial execution while data paralelism decreases the execution time by up to 1,34 times serial execution time."
Depok: Fakultas Teknik Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership Universitas Indonesia Library
Dyah Lalita Luhurkinanti
"Sistem penilai otomatis SIMPLE-O untuk bahasa Jepang telah diteliti selama beberapa tahun belakangan. Namun, penilaian yang dilakukan belum mencakup nilai morfologis, padahal morfologi merupakan hal yang penting dalam ujian sastra. Penelitian ini melakukan clustering pada 215 jawaban mahasiswa dan mengelompokkannya ke 6 cluster berdasarkan topiknya. Berdasarkan hasil, didapatkan bahwa K-means clustering mengelompokkan dengan lebih baik dibanding hierarchical agglomerative clustering (HAC), terutama dengan penambahan Romanisasi. K-means clustering dengan Romansasi menunjukkan 96.5% precision dan 96% recall, sementara HAC memiliki 95% precision dan 93.7% recall. Pada proses penilaian, jawaban dinilai pertopik atau nomor soal dan dicari rasio antara nilai yang didapat dari LSA dengan nilai morfologi dengan akurasi tertinggi. LSA memiliki rata-rata akurasi 79.92%. Penambahan analisis morfologi pada nilai akhir mendapatkan akurasi tertinggi sebesar 78.77% dengan bobot 10% nilai morfologi dan 90% nilai LSA.
The research on automated grading system SIMPLE-O for Japanese language has been done for a few years. However, in the grading system, there is still no means to grade the morphological component even though it is an important part of language test. This research groups 215 student answers to 6 cluster according to the topics. According to the results, K-means clustering performs better than hierarchical agglomerative clustering (HAC) especially with Romanization. K-means clustering with Romanization shows 96.5% precision and 96% recall while HAC has 95% precision and 93.7% recall. For the grading prosess, the answers will be scored by its topic or question number and the ratio between similarity measurement score and morphological score with the highest accuracy will be selected. LSA has the average accuracy of 79.92%. With the addition of morphological analysis on the final score, the highest average accuracy of 78.77% is selected with the ratio of 10% morphological score and 90% LSA score."
Depok: Fakultas Teknik Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership Universitas Indonesia Library
Fakhrul Agustriwan
"
ABSTRAKPeramalan trafik internet merupakan salah satu pendekatan yang dapat diterapkan oleh penyedia jasa internet dalam menjaga dan meningkatkan kualitas pelayanan internet yang ditawarkan. Pada penelitian ini, digunakan metode peramalan berupa kombinasi algoritma self organizing map (SOM) dan support vector regression (SVR). Metode SOM digunakan untuk membagi data historis trafik internet secara keseluruhan ke dalam beberapa cluster, sedangkan metode SVR digunakan untuk membentuk model peramalan pada setiap cluster yang terbentuk. Hasil peramalan data trafik internet pada penelitian ini menunjukkan bahwa model peramalan dengan metode SOM-SVR dapat memberikan prediksi yang lebih akurat terkait nilai error yang lebih kecil dibandingkan dengan metode SVR tunggal.
ABSTRACTTraffic internet forecasting is one kind of approaches which can be implemented by internet service provider in order to keep and improve the offered internet service quality. This research uses the combination of self organizing map (SOM) and support vector regression (SVR) algorithm as forecasting method. SOM is first used to decompose the whole historical data of traffic internet into some clusters, while SVR is used to build a forecasting model in each formed cluster. The forecasting results of internet traffic data in this research show that the forecasting model by using SOM-SVR method can give more accurate prediction in terms of smaller error value compared to single SVR method.
"
2015
S59440
UI - Skripsi Membership Universitas Indonesia Library