Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 71589 dokumen yang sesuai dengan query
cover
Rifqi Wazirsyah
"E-Learning Management System (EMAS) merupakan aplikasi yang dibuat oleh Universitas Indonesia dengan berbagai fitur salah satunya forum diskusi online. Dalam forum diskusi online, mahasiswa dapat membuat postingan-postingan dalam bentuk teks untuk bisa berdiskusi. Postingan-postingan dalam bentuk teks memiliki peran penting dalam meningkatkan performa mahasiswa yang terkhusus pada kelulusannya. Pada tugas akhir ini, Multinomial Naïve Bayes (MNB) digunakan untuk mengklasifikasi performa mahasiswa berdasarkan postingan-postingan dalam bentuk teks pada forum diskusi online. Sebelum dilakukan tahapan klasifikasi, postingan-postingan tersebut dilakukan preprocessing dan pemberian bobot kata pada teks menggunakan TF-IDF. Hasil TF-IDF dinyatakan dalam bentuk vektor-vektor, proses ini disebeut dengan proses vektorisasi. Banyaknya dokumen dari data hasil vektorisasi TF-IDF yang digunakan yaitu sebanyak 228, dengan proporsi mahasiswa lulus dan tidak lulus secara berturut-turut, yaitu sebesar 219 dan 9. Pada data tersebut didominasi oleh mahasiswa lulus, artinya data tersebut tidak seimbang, sehingga diperlukan proses SMOTE untuk menyeimbangkan data. Kemudian, dilakukan implementasi model MNB pada 3 kasus pembagian data training dan data testing, yaitu 70%;30%, 80%:20% dan 90%:10%, dengan cara melatih model pada data training dan menguji model pada data testing untuk memperoleh klasifikasi performanya. Implementasi dilakukan sebanyak lima kali percobaan, sehingga didapatkan model MNB dapat mengklasifikasi performa mahasiswa dengan baik dan hasil kinerja model terbaik pada data testing 30% yaitu rata-rata akurasi sebesar 0,956, rata-rata recall sebesar 0,979, dan rata-rata f1-score sebesar 0,977. Namun rata-rata presisi terbaik didapatkan pada data testing 20%, yaitu sebesar 0,977.

E-Learning Management System (EMAS) is an application created by the University of Indonesia with various features, one of which is an online discussion forum. In online discussion forums, students can make posts in the form of text to be able to discuss. Posts in the form of text have an important role in improving student performance, especially at graduation. In this final project, Multinomial Naive Bayes (MNB) is used to classify student performance based on posts in text form on online discussion forums. Prior to the classification stage, the posts were preprocessed and assigned word weights to the text using TF-IDF. The results of TF-IDF are expressed in the form of vectors, this process is called the vectorization process. The number of documents from the TF-IDF vectorized data used is 228, with the proportion of students graduating and not graduating respectively, which is 219 and 9. SMOTE to balance data. Then, the implementation of the MNB model was carried out in 3 cases of distribution of training data and testing data, namely 70%; 30%, 80%:20% and 90%:10%, by training the model on the training data and testing the model on the testing data to obtain performance classification. The implementation was carried out five times, so that the MNB model was able to classify student performance well and the best model performance results were on 30% testing data, namely an average accuracy of 0.956, an average recall of 0.979, and an average f1-score of 0.956. 0.977. However, the best average precision was obtained at 20% testing data, which was 0.977."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Junanto Prihantoro
"

Konsumsi energi nasional secara signifikan dikontribusikan oleh tenaga listrik rumah tangga. Untuk mengetahui penggunaan energi listrik di setiap peralatan listrik rumah tangga, teknik yang disebut Non-Intrusive Load Monitoring (NILM) digunakan. NILM adalah alat untuk memantau dan mengidentifikasi kekuatan setiap peralatan listrik. Baru-baru ini beberapa metode klasifikasi data seperti jaringan saraf, pembelajaran mendalam telah diterapkan untuk mengembangkan NILM. Dalam tulisan ini, metode naive bayes digunakan untuk NILM. Metode ini untuk mengklasifikasikan kondisi on-off peralatan listrik. Untuk meningkatkan akurasi, metode preprocessing data yang normalisasi dan diskritisasi digunakan. Perbandingan kinerja dievaluasi untuk setiap metode. Dalam tulisan ini, dataset REDD digunakan. Metode Supervised learning yang digunakan adalah Naive Bayes dan K Nearest Neighbour. Hasil simulasi menunjukkan bahwa dua metode ini dapat mengenali data NILM dengan akurasi yang tinggi. Metode naive bayes dengan diskritisasi memperoleh akurasi tertinggi dengan nilai 96.64% diikuti oleh KNN dengan k =5 dengan nilai 96.1287%.

 


National energy consumption is significantly contributed by household electricity. To find out the use of electrical energy in every household electrical equipment, a technique called Non-Intrusive Load Monitoring (NILM)  used. NILM is a tool to monitor and identify the strength of each electrical equipment. Recently several methods of data classification such as neural networks, deep learning have been applied to develop NILM. In this paper, the naive Bayes method used for NILM. This method is to classify the conditions of on-off electrical equipment. Accuracy to improve, data preprocessing techniques that are normalised and discretised used. Performance comparisons are evaluated for each method. In this paper, the REDD dataset used. The Supervised learning method used is Naive Bayes and K Nearest Neighbor. The simulation results of the two classification methods can recognise NILM data with high accuracy, the naive Bayes method with discretisation obtained the highest accuracy with an amount of 96.64% followed by KNN with 5 with a value of 96.1287%.

 "

2019
T53159
UI - Tesis Membership  Universitas Indonesia Library
cover
Annisa Kamalia
"ABSTRACT
Talasemia adalah penyakit yang disebabkan oleh adanya kelainan dalam hemoglobin. Penyakit talasemia merupakan penyakit herediter atau penyakit keturunan dimana pembawa gen talasemia adalah orang tua dari penderita. Di Indonesia, pada tahun 2015 diketahui jumlah kasus talasemia mencapai 7.029 kasus. Sampai saat ini talasemia belum dapat disembuhkan namun dapat dikenali sifat pembawanya dengan skrining. Dalam tugas akhir ini, akan dibandingkan performa dari dua metode yang digunakan untuk mengklasifikasikan data talasemia, yaitu K-Nearest Neighbor dan Naive Bayes. Data yang digunakan adalah 82 data pasien talasemia dan 68 data pasien non-talasemia dari Rumah Sakit Anak dan Bunda Harapan Kita, Jakarta Barat. Hasil akhir menunjukkan bahwa metode Naive Bayes memberikan nilai akurasi yang lebih besar dari K-Nearest Neighbor dalam mengklasifikasikan talasemia. Rata-rata akurasi Naive Bayes sebesar 99.775% dengan rata-rata waktu running 0.0554 detik dan rata-rata akurasi K-Nearest Neighbor adalah 97.142% dengan rata-rata waktu running 0.081 detik. Untuk nilai spesifikasi, keduanya memberikan performa yang sama, yaitu dari K-Nearest Neighbor diperoleh ketika K=3 yaitu sebesar 100% dan dari Naive Bayes sebesar 100%. Hasil rata-rata sensitivitas tertingi diberikan oleh Naive Bayes yaitu sebesar 99.59%, sedangkan K-Nearest Neighbor sebesar 96.25% untuk K=1.

ABSTRACT
Thalassemia is a disease caused by abnormalities in the hemoglobin. Thalassemia is a hereditary disease which the thalassemia gene carriers are parents of sufferers. In Indonesia, in 2015 it was found that the number of thalassemia cases reached 7,029 cases. Until now thalassemia has not been cured, but it can be recognized the nature of its carrier by screening. In this final project, the performance of the two methods will be compared to classify thalassemia data, namely K-Nearest Neighbor and Naive Bayes. The data used were 82 data on thalassemia patients and 68 data on non-thalassemia patients from Harapan Kita Children and Womans Hospital, West Jakarta. The final results show that the Naive Bayes method provides greater accuracy value than K-Nearest Neighbor in classifying thalassemia. The average accuracy of Naive Bayes is 99.775% with an average running time of 0.0554 seconds and the average accuracy of K-Nearest Neighbor is 97.142% with an average running time of 0.081 seconds. For specification values, both give the same performance. The result of specification values using K-Nearest Neighbor yield when K = 3 that is 100% and from Naive Bayes that is 100%. The highest average sensitivity results are given by Naive Bayes is 99.59%, while K-Nearest Neighbor is 96.25% for K = 1."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
"Information retrieval of text document requires a method that is able to restore a number of documents that have high relevance according to the user's request. One important step in the process is a text representation of the weighting process. The use of LCS in Tf-Idf weighting adjustments considers the appearance of the same order of words between the query and the text in the document. There is a very long document but irrelevant cause weight produced is not able to represent the value relevance of documents. This research proposes the use of LCS which gives weight to the word order by considering long documents related to the average length of documents in the corpus. This method is able to return a text document effectively. Additional features of word order by normalizing the ratio of the overall length of the document to the documents in the corpus generate values of precision and recall as well as the method of Tasi et al.
Sistem temu kembali dokumen teks membutuhkan metode yang mampu mengembalikan sejumlah dokumen yang memiliki relevansi tinggi sesuai dengan permintaan pengguna. Salah satu tahapan penting dalam proses representasi teks adalah proses pembobotan. Penggunaan LCS dalam penyesuaian bobot Tf-Idf mempertimbangkan kemunculan urutan kata yang sama antara query dan teks di dalam dokumen. Adanya dokumen yang sangat panjang namun tidak relevan menyebabkan bobot yang dihasilkan tidak mampu merepresentasikan nilai relevansi dokumen. Penelitian ini mengusulkan penggunaan metode LCS yang memberikan bobot urutan kata dengan mempertimbangkan panjang dokumen terkait dengan rata-rata panjang dokumen dalam korpus. Metode ini mampu melakukan pengembalian dokumen teks secara efektif. Penambahan fitur urutan kata dengan normalisasi rasio panjang dokumen terhadap keseluruhan dokumen dalam korpus menghasilkan nilai presisi dan recall yang sama baiknya dengan metode Tasi dkk."
Surabaya: Institut Teknologi Sepuluh Nopember Surabaya, Faculty of Information Technology, Department of Infromatics Engineering, 2013
AJ-Pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Nabilla Ayu Fauziyyah
"ABSTRACT
Dewasa ini, sudah banyak rumah sakit modern yang dilengkapi dengan peralatan monitoring yang lengkap, yang menyebabkan makin banyaknya data medis yang tersimpan. Data medis ini memiliki karakteristik khusus, dan biasanya metode statistika biasa tidak dapat diterapkan begitu saja. Dari sinilah kemudian muncul gagasan mengenai Medical Data Mining (MDM) yang sudah terbukti cocok untuk diterapkan dalam analisis data medis. Naive Bayes Classifier (NBC) merupakan salah satu implementasi dari MDM. Kendati terbukti memiliki hasil yang akurat dan memuaskan dalam proses diagnosis medis, metode-metode dalam MDM belum sepenuhnya diterima dalam praktek medis untuk diterapkan. Alasan utama mengapa metode ini belum dapat diterima adalah karena terdapatnya resistansi dari tenaga medis terhadap metode diagnosis yang baru. Tujuan dari penelitian ini adalah untuk menerapkan dan mengevaluasi performa NBC  pada data rekam medis pasien kanker payudara di salah satu rumah sakit di Jakarta dalam masalah klasifikasi subtipe molekular kanker payudara, serta membandingkan hasil klasifikasi NBC dengan metode MDM lain, yaitu Decision Tree (DT). Hasil analisis menunjukkan bahwa NBC mengungguli DT dengan tingkat akurasi sebesar 92,8%. Selain itu, dapat juga ditunjukkan secara empiris bahwa NBC mampu menangani missing value dengan cukup baik dan tidak membutuhkan data dalam jumlah banyak untuk tetap dapat mengklasifikasikan sebagian besar pasien dengan benar.

ABSTRACT
Nowadays, modern hospitals are well equipped with data monitoring devices, which resulted in an abundant amount of medical data. These medical data possess specific characteristics and usually, statistical methods could not be applied directly. This is what started the notion of Medical Data Mining (MDM), which has proven to be effective in analysing medical data. Naive Bayes Classifier (NBC) is an implementation of MDM. Even though MDM methods produce a sufficiently accurate and satisfying results in diagnosis problems, these methods are still not well accepted in the medical practice. One of the main reasons is because there is a resistance of physicians to a new diagnosis method. The main goal of this study is to apply and evaluate the performance of NBC in classifying breast cancer patients in a private hospital in Indonesia into five classes of molecular subtypes and compare its performance with another popular MDM method, Decision Tree (DT). Results showed that NBC outperformed DT by reaching an accuracy rate of 92.8%. This study could also show empirically that NBC does not need a big dataset to be able to achieve a high accuracy rate and that NBC could handle the problem of missing values just fine."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Monika Adhi Permata
"E-Learning Management Systems (EMAS) adalah sebuah platform belajar daring yang digunakan oleh Universitas Indonesia (UI). Dengan menggunakan platform EMAS, aktivitas akademik mahasiswa dapat dipantau. Berdasarkan aktivitas akademik mahasiswa, dimungkinkan untuk menentukan klasifikasi performa akademik mahasiswa. Aktivitas akademik yang dimaksud diantaranya adalah mahasiswa mengakses EMAS, mahasiswa mengerjakan quiz di EMAS, dan mahasiswa berpartisipasi forum di EMAS. Pada tugas akhir ini digunakan model klasifikasi Naïve Bayes, yaitu klasifikasi dengan asumsi kondisi antar fitur adalah saling bebas. Hasil performa model dilihat dari nilai Matthew’s Correlation Coefficient (MCC) terbesar. Sebelum implementasi, ditentukan proporsi data training dan data testing terbaik. Proporsi 80%:20% dengan periode data 4 minggu adalah proporsi dengan nilai MCC terbesar, yaitu 0,4745. Metode Mutual Information menghasilkan tujuh fitur terpilih, yaitu banyaknya tugas yang diunggah, banyaknya materi yang dikunjungi, banyaknya kunjungan ke start quiz, banyaknya quiz yang diunggah, banyaknya materi dokumen yang dikunjungi, banyaknya forum yang dikunjungi, dan lamanya durasi mengerjakan quiz. Dengan 7 fitur terpilih, performa model naik sebesar 15,15%, dan performa model meningkat lagi sebesar 26,5% jika dilakukan oversampling dengan metode Synthetic Minority Oversampling Technique. Hasil prediksi dari 47 mahasiswa adalah 43 mahasiswa diprediksi benar lulus, 2 mahasiswa diprediksi benar tidak lulus, dan 2 mahasiswa yang diprediksi salah yaitu mahasiwa diprediksi tidak lulus namun sebenarnya lulus.

E-Learning Management Systems (EMAS) is an online learning platform that used by the University of Indonesia (UI). By using the EMAS platform, student academic activities can be monitored. Based on the student's academic activities, it is possible to determine the classification of student academic performance. The academic activities in question include students accessing EMAS, students taking quizzes at EMAS, and students participating in forums at EMAS. In this final project, the Naïve Bayes classification model is used, namely classification with the assumption that the conditions between features are independent of each other. The results of the model's performance are seen from the largest Matthew's Correlation Coefficient (MCC). Prior to implementation, the proportion of the best training and testing data is determined. The proportion of 80%:20% with a data period of 4 weeks is the proportion with the largest MCC value, which is 0.4745. The Mutual Information method resulted in seven selected features, namely the number of tasks uploaded, the number of materials visited, the number of visits to the quiz start, the number of quizzes uploaded, the number of document materials visited, the number of forums visited, and the length of duration of taking the quiz. With 7 selected features, the performance of the model increases by 15.15%, and the performance of the model increases again by 26.5% if oversampling is carried out using the Synthetic Minority Oversampling Technique method. The prediction results from 47 students were 43 students were predicted to pass correctly, 2 students were predicted to fail correctly, and 2 students were predicted to be wrong, namely students predicted not to pass but actually passed."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Krisna Dwi Nugroho
"Perkembangan teknologi yang cepat memberi dampak yang besar bagi kehidupan manusia. Hal ini mempermudah masyarakat dalam menerima informasi, baik itu informasi positif maupun informasi negatif. Informasi yang tergolong negatif adalah konten video pornografi. Salah satu cara paling efektif untuk melakukan pemblokiran terhadap suatu website adalah bukan dengan memblokir alamat dari website tersebut, melainkan memblokir konten yang bersangkutan, yaitu dengan membaca tag dari konten tersebut, untuk itu penelitian ini dilakukan.
Fokus utama dalam penelitian ini adalah untuk menganalisis faktor yang mempengaruhi tingkat akurasi dan menentukan algoritma mana yang lebih tepat untuk melakukan klasifikasi dan memprediksi dari suatu tag video yang diberikan. Penelitian ini diarahkan pada penggunaan machine learning untuk melakukan prediksi terhadap tag video yang diberikan sehingga diperoleh hasil dari prediksi yang dilakukan. Dari penelitian yang telah dilakukan, diperoleh hasil akurasi sebesar 97% untuk algoritma Naïve Bayes dan 97,5% untuk algoritma Bayesian Network dengan jumlah data latih sebanyak 2400 tag video.

The rapid technological development had significant impacts to human life. It is easier for the public to receive information, whether it is positive or negative information information. The information classified as negative is pornographic video content. One of the most effective ways to do the blocking of a website is not to block the address of the website, but block the content concerned, by reading the tags on them, therefore this study conducted.
The main focus of this research is to analyze the factors affecting the level of accuracy and determine which is more appropriate algorithms to classify and predict from a given video tag. This research is directed at the use of machine learning to predict the video tag is given in order to obtain the results of the predictions made. From the research that has been conducted, the results obtained an accuracy of 97% for the Naïve Bayes algorithm and 97.5% for the Bayesian Network algorithm with the amount of training data as many as 2400 video tag
"
Depok: Fakultas Teknik Universitas Indonesia, 2016
S64519
UI - Skripsi Membership  Universitas Indonesia Library
cover
Natalia Aji Yuwanti
"Metode machine learning sangat banyak digunakan dalam membantu pekerjaan manusia. Tidak semua data seperti yang diharapkan. Kebanyakan data memiliki missing value. Data yang memiliki missing value harus ditangani dulu pada tahap pra pengolahan, salah satunya adalah dengan cara imputasi missing value. Pada penelitian ini, dilakukan analisis kinerja One-Dimensional Naïve Bayes sebagai metode imputasi data masalah asuransi mobil dan keselamatan berkendara. Berdasarkan hasil simulasi menggunakan SVM didapatkan hasil yang sama untuk imputasi menggunakan modus dan One-Dimensional Naïve Bayes pada data Car Insurance yaitu 1,00. Setelah itu dilakukan telaah lebih lanjut ternyata imputasi setiap missing value dengan modus dan prediksi imputasi dengan One-Dimensional Naïve Bayes persis sama. Pada data Safe Driver, imputasi dengan modus menghasilkan akurasi 0,86 sedangkan imputasi dengan One-Dimensional Naïve Bayes menghasilkan akurasi 0,85. Hasil ini menunjukkan bahwa metode imputasi missing value dengan modus masih sangat direkomendasikan untuk tahap pra pengolahan data pada machine learning.

Machine learning methods are very widely used in helping human work. Not all data is as expected. Most data have missing values. Data which has a missing value must be handled first at the pre-processing stage, one of which is by imputation of the missing value. In this study, a One-Dimensional Naïve Bayes performance analysis was performed as a data imputation method for car insurance and safe driver problems. Based on simulation results by using SVM obtained the same results for imputation using mode and One-Dimensional NaA ve Bayes on Car Insurance data that is 1,00. After that, a further study is carried out, apparently the imputation of each missing value by mode and the prediction of imputation with One-Dimensional NaAve Bayes are the same. In Safe Driver data, imputation with mode produces 0.86 accuracy while imputation with One-Dimensional NaAve Bayes produces accuracy of 0.85. These results indicate that the method of missing value imputation with mode is still highly recommended for the pre-processing data stage in machine learning."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Sigit Suryono
"ABSTRAK
Klasifikasi sentimen merupakan salah satu cabang dari text mining. Klasifikasi sentimen dapat menjadi sesuatu yang penting dalam proses evaluasi terhadap sebuah topik permasalahan. Tujuan utama dari klasifikasi sentimen adalah untuk mencari tahu polaritas dari sentimen positif, negatif dan netral. Klasifikasi sentimen salah satunya dapat diperoleh melalui tweet yang ada pada Twitter. Dalam tulisan ini, tweet yang berhubungan dengan kata kunci yang dicari dihimpun dengan menggunakan tools yaitu API Twitter. Data yang didapat dari proses penghimpunan akan diolah dengan menggunakan Natural Language Toolkit yang berjalan diatas bahasa pemrograman Python. Data selanjutnya akan dilakukan klasifikasi sentimen dengan menggunakan Naive Bayes untuk melihat sentimen yang dihasilkan. Dari proses klasifikasi yang telah dilakukan akan diukur tingkat akurasi. Dari hasil uji coba sebanyak 3 kali, didapatkan tingkat akurasi pada percobaan pertama 64.95%, kedua 66.36% dan ketiga 66.79% Hasil lain yang didapatkan dari proses klasifikasi yaitu sentimen positif 28% sentimen negatif 20% dan sentimen netral 52%. Berdasarkan hasil persentase kelas sentimen, sentimen neutral merupakan sentimen yang paling banyak apabila dikaitkan dengan topik Presiden Joko Widodo dan pemerintahannya."
Yogyakarta: Pusat Penelitian dan Pengabdian Pada Masyarakat (P3M) STTA, 2018
600 JIA X:1 (2018)
Artikel Jurnal  Universitas Indonesia Library
cover
Nur Fitriani
"Kinerja mahasiswa adalah bagian penting dari suatu perguruan tinggi. Hal ini dikarenakan salah satu kriteria  perguruan tinggi yang berkualitas didasarkan pada  prestasi akademik yang baik. Tahun pertama perkuliahan adalah periode mahasiswa untuk meletakkan dasar atau fondasi yang selanjutnya akan mempengaruhi keberhasilan akademik karena tahun pertama memainkan peran penting dalam membentuk sikap dan kinerja siswa di tahun-tahun berikutnya. Pada Penelitian ini, pendekatan Semi-supevised Learning digunakan dalam mengklasifikasi kinerja mahasiswa tahun pertama di Departemen Matematika, Universitas Indonesia. Kinerja Mahasiswa dibagi menjadi dua kategori, yaitu sedang dan tinggi. Sampel pada penelitian ini adalah 140 mahasiswa tahun pertama dengan menggunakan 27 fitur. Ada dua proses yang digunakan, yaitu proses clustering dan klasifiksi. Pada proses clustering, mahasiswa dibagi menjadi tiga cluster/kelompok menggunakan K-Means Clustering. Sedangkan dalam proses klasifikasinya menggunakan Naïve Bayes Classifier. Kinerja algoritma yang diusulkan menghasilkan nilai akurasi 96.67% dan sensitifitas 94.44%.

Students performance is an essential part of a higher learning institution because one of the criteria for a high-quality university is based on its excellent record of academic achievements. The first- year of the lecture is the student period in laying the foundation that will affect academic success because first-year plays an important role in shaping the attitudes and performance of students in the following years. In this study, a semi-supervised learning approach is used to classify the performance of first-year students in the Department of Mathematics, Universitas Indonesia. Student performance will be divided into two categories, namely medium and high. The sample in this study consist of 140 first-year students with 27 features. There are two processes used i.e. clustering and the classification process. In the clustering process, the data is divided into three clusters using K-Means Clustering and the Naïve Bayes Classifier is chosen to classify it. The performance of the proposed algorithms is stated by accuracy and sensitivity value i.e. 96.67% and 94.44% respectively."
Depok: Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>