Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 20674 dokumen yang sesuai dengan query
cover
Nabilla Ayu Fauziyyah
"ABSTRACT
Dewasa ini, sudah banyak rumah sakit modern yang dilengkapi dengan peralatan monitoring yang lengkap, yang menyebabkan makin banyaknya data medis yang tersimpan. Data medis ini memiliki karakteristik khusus, dan biasanya metode statistika biasa tidak dapat diterapkan begitu saja. Dari sinilah kemudian muncul gagasan mengenai Medical Data Mining (MDM) yang sudah terbukti cocok untuk diterapkan dalam analisis data medis. Naive Bayes Classifier (NBC) merupakan salah satu implementasi dari MDM. Kendati terbukti memiliki hasil yang akurat dan memuaskan dalam proses diagnosis medis, metode-metode dalam MDM belum sepenuhnya diterima dalam praktek medis untuk diterapkan. Alasan utama mengapa metode ini belum dapat diterima adalah karena terdapatnya resistansi dari tenaga medis terhadap metode diagnosis yang baru. Tujuan dari penelitian ini adalah untuk menerapkan dan mengevaluasi performa NBC  pada data rekam medis pasien kanker payudara di salah satu rumah sakit di Jakarta dalam masalah klasifikasi subtipe molekular kanker payudara, serta membandingkan hasil klasifikasi NBC dengan metode MDM lain, yaitu Decision Tree (DT). Hasil analisis menunjukkan bahwa NBC mengungguli DT dengan tingkat akurasi sebesar 92,8%. Selain itu, dapat juga ditunjukkan secara empiris bahwa NBC mampu menangani missing value dengan cukup baik dan tidak membutuhkan data dalam jumlah banyak untuk tetap dapat mengklasifikasikan sebagian besar pasien dengan benar.

ABSTRACT
Nowadays, modern hospitals are well equipped with data monitoring devices, which resulted in an abundant amount of medical data. These medical data possess specific characteristics and usually, statistical methods could not be applied directly. This is what started the notion of Medical Data Mining (MDM), which has proven to be effective in analysing medical data. Naive Bayes Classifier (NBC) is an implementation of MDM. Even though MDM methods produce a sufficiently accurate and satisfying results in diagnosis problems, these methods are still not well accepted in the medical practice. One of the main reasons is because there is a resistance of physicians to a new diagnosis method. The main goal of this study is to apply and evaluate the performance of NBC in classifying breast cancer patients in a private hospital in Indonesia into five classes of molecular subtypes and compare its performance with another popular MDM method, Decision Tree (DT). Results showed that NBC outperformed DT by reaching an accuracy rate of 92.8%. This study could also show empirically that NBC does not need a big dataset to be able to achieve a high accuracy rate and that NBC could handle the problem of missing values just fine."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nafizatus Salmi
"ABSTRACT
Kanker telah dikenal sebagai penyakit yang terdiri dari beberapa jenis berbeda. Kanker adalah penyakit yang mengancam jiwa di dunia saat ini. Ada begitu banyak jenis kanker di dunia, salah satunya adalah kanker usus besar, di mana kanker ini adalah salah satu pembunuh nomor satu di dunia. Banyak pembelajaran mesin telah diterapkan dalam klasifikasi kanker. Penulis membandingkan model Naïve Bayes Classifier dan Support Vector Machine (SVM) dalam klasifikasi kanker usus besar. Naïve Bayes Classifier adalah teknik prediksi berbasis probabilitas sederhana berdasarkan pada penerapan teorema Bayes (atau aturan Bayes) dengan asumsi kemandirian yang kuat. Sedangkan konsep dasar metode SVM adalah membentuk bidang atau hyperplane optimal yang memisahkan data menjadi bidang-bidang yang memisahkan data ke dalam setiap kelas. Kedua metode menghasilkan akurasi tinggi hingga 95,24% untuk Naïve Bayes Classifier dan 94,05% untuk SVM dengan kernel linier.

ABSTRACT
Cancer has been known as a disease that consists of several different types. Cancer is a life-threatening disease in the world today. There are so many types of cancer in the world, one of which is colon cancer, where this cancer is one of the number one killers in the world. Much machine learning has been applied in the classification of cancer. The author compares the Naïve Bayes Classifier and Support Vector Machine (SVM) models in the classification of colon cancer. Naïve Bayes Classifier is a simple probability-based prediction technique based on the application of the Bayes theorem (or Bayes rule) with a strong assumption of independence. While the basic concept of the SVM method is to form an optimal plane or hyperplane that separates data into fields that separate data into each class. Both methods produce high accuracy up to 95.24% for Naïve Bayes Classifier and 94.05% for SVM with linear kernels."
2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sigit Suryono
"ABSTRAK
Klasifikasi sentimen merupakan salah satu cabang dari text mining. Klasifikasi sentimen dapat menjadi sesuatu yang penting dalam proses evaluasi terhadap sebuah topik permasalahan. Tujuan utama dari klasifikasi sentimen adalah untuk mencari tahu polaritas dari sentimen positif, negatif dan netral. Klasifikasi sentimen salah satunya dapat diperoleh melalui tweet yang ada pada Twitter. Dalam tulisan ini, tweet yang berhubungan dengan kata kunci yang dicari dihimpun dengan menggunakan tools yaitu API Twitter. Data yang didapat dari proses penghimpunan akan diolah dengan menggunakan Natural Language Toolkit yang berjalan diatas bahasa pemrograman Python. Data selanjutnya akan dilakukan klasifikasi sentimen dengan menggunakan Naive Bayes untuk melihat sentimen yang dihasilkan. Dari proses klasifikasi yang telah dilakukan akan diukur tingkat akurasi. Dari hasil uji coba sebanyak 3 kali, didapatkan tingkat akurasi pada percobaan pertama 64.95%, kedua 66.36% dan ketiga 66.79% Hasil lain yang didapatkan dari proses klasifikasi yaitu sentimen positif 28% sentimen negatif 20% dan sentimen netral 52%. Berdasarkan hasil persentase kelas sentimen, sentimen neutral merupakan sentimen yang paling banyak apabila dikaitkan dengan topik Presiden Joko Widodo dan pemerintahannya."
Yogyakarta: Pusat Penelitian dan Pengabdian Pada Masyarakat (P3M) STTA, 2018
600 JIA X:1 (2018)
Artikel Jurnal  Universitas Indonesia Library
cover
Annisa Kamalia
"ABSTRACT
Talasemia adalah penyakit yang disebabkan oleh adanya kelainan dalam hemoglobin. Penyakit talasemia merupakan penyakit herediter atau penyakit keturunan dimana pembawa gen talasemia adalah orang tua dari penderita. Di Indonesia, pada tahun 2015 diketahui jumlah kasus talasemia mencapai 7.029 kasus. Sampai saat ini talasemia belum dapat disembuhkan namun dapat dikenali sifat pembawanya dengan skrining. Dalam tugas akhir ini, akan dibandingkan performa dari dua metode yang digunakan untuk mengklasifikasikan data talasemia, yaitu K-Nearest Neighbor dan Naive Bayes. Data yang digunakan adalah 82 data pasien talasemia dan 68 data pasien non-talasemia dari Rumah Sakit Anak dan Bunda Harapan Kita, Jakarta Barat. Hasil akhir menunjukkan bahwa metode Naive Bayes memberikan nilai akurasi yang lebih besar dari K-Nearest Neighbor dalam mengklasifikasikan talasemia. Rata-rata akurasi Naive Bayes sebesar 99.775% dengan rata-rata waktu running 0.0554 detik dan rata-rata akurasi K-Nearest Neighbor adalah 97.142% dengan rata-rata waktu running 0.081 detik. Untuk nilai spesifikasi, keduanya memberikan performa yang sama, yaitu dari K-Nearest Neighbor diperoleh ketika K=3 yaitu sebesar 100% dan dari Naive Bayes sebesar 100%. Hasil rata-rata sensitivitas tertingi diberikan oleh Naive Bayes yaitu sebesar 99.59%, sedangkan K-Nearest Neighbor sebesar 96.25% untuk K=1.

ABSTRACT
Thalassemia is a disease caused by abnormalities in the hemoglobin. Thalassemia is a hereditary disease which the thalassemia gene carriers are parents of sufferers. In Indonesia, in 2015 it was found that the number of thalassemia cases reached 7,029 cases. Until now thalassemia has not been cured, but it can be recognized the nature of its carrier by screening. In this final project, the performance of the two methods will be compared to classify thalassemia data, namely K-Nearest Neighbor and Naive Bayes. The data used were 82 data on thalassemia patients and 68 data on non-thalassemia patients from Harapan Kita Children and Womans Hospital, West Jakarta. The final results show that the Naive Bayes method provides greater accuracy value than K-Nearest Neighbor in classifying thalassemia. The average accuracy of Naive Bayes is 99.775% with an average running time of 0.0554 seconds and the average accuracy of K-Nearest Neighbor is 97.142% with an average running time of 0.081 seconds. For specification values, both give the same performance. The result of specification values using K-Nearest Neighbor yield when K = 3 that is 100% and from Naive Bayes that is 100%. The highest average sensitivity results are given by Naive Bayes is 99.59%, while K-Nearest Neighbor is 96.25% for K = 1."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
"Seiring derasnya arus informasi berita elektronik, timbul kebutuhan untuk mengatur informasi tersebut sehingga pengguna dapat mengaksesnya dengan lebih mudah. Akan tetapi jika pengelompokan berita dilakukan secara manual, maka akan memakan waktu yang lama dan mahal. Klasifikasi dokumen secara otomatis sekiranya diperlukan untuk mengurangi biaya dan mempercepat pengaturan informasi. Salah satu metode yang dapat digunakan dalam pengklasifikasian yaitu Naïve Bayes Classifier. Fokus penelitian ini adalah meneliti karakteristik Naïve Bayes Classifier untuk memperoleh kinerja yang optimal dalam proses klasifikasi. Cara yang diterapkan pada penelitian ini yaitu dengan mengujicobakan metode tersebut dengan 3 perlakuan yaitu membandingkan kinerja sistem terhadap stemming maupun non stemming, berbagai proporsi dokumen pembelajaran dan jumlah kategori dalam klasifikasi. Tahapan penelitian dilakukan mulai dari studi pustaka, menerapkan metode Naïve Bayes Classifier dalam pengklasifikasian berita berbahasa Indonesia, melakukan uji coba dan analisa mengenai karakteristik metode ini serta menarik kesimpulan dari hasil analisa. Penelitian dilakukan terhadap 1351 dokumen berita berbahasa Indonesia dari situs www.suarapembaruan.com yang diambil pada bulan Januari 2004 sampai dengan bulan November 2004.
Hasil penelitian menunjukan bahwa Naive Bayes Classifier merupakan metode yang memiliki tingkat akurasi yang tinggi. Kinerja akan lebih baik jika metode ini diterapkan dengan stemming dibanding tanpa stemming walaupun selisih kinerja keduanya tidak terpaut jauh yaitu sekitar 3,87%. Selain itu, hasil penelitian juga menunjukan bahwa kinerja metode ini dipengaruhi oleh jumlah dokumen pembelajaran. Semakin banyak dokumen pembelajaran yang digunakan, maka akan semakin tinggi tingkat keakuratan metode ini. Hal ini terbukti dari uji coba kombinasi stemming dengan proporsi dokumen pembelajaran 90% yang mampu mencapai kinerja tertinggi selama penelitian yaitu recall sebesar 93,5%, precision 94,125% dan F-measure 93,81%. Hal menarik yang terjadi adalah akurasi masih tetap relatif tinggi walaupun dokumen pembelajaran secara ekstrim dikurangi menjadi 10%. Hal ini ditunjukan dengan recall sebesar 89,82%, precision 90,36% dan F-measure 90,1%.
Pada penelitian ini juga mengamati apakah Naïve Bayes Classifier merupakan metode klasifikasi yang stabil. Hal ini diteliti dengan membandingkan kinerja sistem terhadap banyaknya jumlah kategori dalam klasifikasi. Hasilnya ternyata jumlah kategori tidak mempengaruhi kinerja metode ini. NBC merupakan metode yang stabil jika dilihat dari segi kuantitas kategori."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Fitriani
"Kinerja mahasiswa adalah bagian penting dari suatu perguruan tinggi. Hal ini dikarenakan salah satu kriteria  perguruan tinggi yang berkualitas didasarkan pada  prestasi akademik yang baik. Tahun pertama perkuliahan adalah periode mahasiswa untuk meletakkan dasar atau fondasi yang selanjutnya akan mempengaruhi keberhasilan akademik karena tahun pertama memainkan peran penting dalam membentuk sikap dan kinerja siswa di tahun-tahun berikutnya. Pada Penelitian ini, pendekatan Semi-supevised Learning digunakan dalam mengklasifikasi kinerja mahasiswa tahun pertama di Departemen Matematika, Universitas Indonesia. Kinerja Mahasiswa dibagi menjadi dua kategori, yaitu sedang dan tinggi. Sampel pada penelitian ini adalah 140 mahasiswa tahun pertama dengan menggunakan 27 fitur. Ada dua proses yang digunakan, yaitu proses clustering dan klasifiksi. Pada proses clustering, mahasiswa dibagi menjadi tiga cluster/kelompok menggunakan K-Means Clustering. Sedangkan dalam proses klasifikasinya menggunakan Naïve Bayes Classifier. Kinerja algoritma yang diusulkan menghasilkan nilai akurasi 96.67% dan sensitifitas 94.44%.

Students performance is an essential part of a higher learning institution because one of the criteria for a high-quality university is based on its excellent record of academic achievements. The first- year of the lecture is the student period in laying the foundation that will affect academic success because first-year plays an important role in shaping the attitudes and performance of students in the following years. In this study, a semi-supervised learning approach is used to classify the performance of first-year students in the Department of Mathematics, Universitas Indonesia. Student performance will be divided into two categories, namely medium and high. The sample in this study consist of 140 first-year students with 27 features. There are two processes used i.e. clustering and the classification process. In the clustering process, the data is divided into three clusters using K-Means Clustering and the Naïve Bayes Classifier is chosen to classify it. The performance of the proposed algorithms is stated by accuracy and sensitivity value i.e. 96.67% and 94.44% respectively."
Depok: Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ghani Deori
"SARS-COV-2 merupakan jenis virus yang menyebabkan pandemi COVID-19. Pandemi COVID-19 pertama kali terdeteksi di Wuhan, Cina. Berdasarkan data World Health Organization (WHO), jumlah orang yang telah terpapar COVID-19 adalah 123.216.178 orang dan 2.714.517 orang meninggal akibat COVID-19 berdasarkan data www.who.int pada tanggal 23 Maret 2021. Pada skripsi ini, dilakukan klasifikasi untuk SARS-COV-2 dengan menggunakan sekuens protein dari SARS-COV-2. Sekuens protein SARS-COV- 2 di ekstraksi fitur dengan menggunakan package discere dari Python. Package discere akan menghasilkan 27 fitur, dimana fitur-fitur diseleksi dengan menggunakan metode LASSO (Least Absolute Shrinkage and Selection Operator). Setelah dilakukan seleksi fitur, dilakukan klasifikasi dengan menggunakan dua metode, yaitu metode Absolute Correlation Weighted Naïve Bayes dan metode Naïve Bayes. Rata-rata akurasi, sensitifitas, dan spesifisitas tertinggi untuk metode Absolute Correlation Weighted Naïve Bayes berturut-turut adalah 81,85%, 74,81%, dan 89,19%, sedangkan rata-rata akurasi, sensitifitas, dan spesifisitas tertinggi untuk metode Naïve Bayes berturut-turut adalah 81,44%, 74,58%, dan 88,24%. Terlihat bahwa metode Absolute Correlation Weighted Naïve Bayes mempunyai rata-rata akurasi, sensitifitas, dan spesifisitas yang lebih tinggi dibandingkan dengan metode Naïve Bayes.

SARS-COV-2 is the type of virus that causes the COVID-19 pandemic. The COVID-19 pandemic was first detected in Wuhan, China. Based on data from the World Health Organization (WHO), the number of people who have been exposed to COVID-19 is 123,216,178 people and 2,714,517 people died from COVID-19 based on data from www.who.int on March 23, 2021. In this paper, the SARS-COV-2 classification is done by using the protein sequence of SARS-COV-2. The SARS-COV-2 protein sequence will be feature extraction using the discere package from Python. The discere package will produce 27 features, where the features are selected using the LASSO (Least Absolute Shrinkage and Selection Operator) method. After feature selection, classification is carried out using two methods, namely the Absolute Correlation Weighted Naïve Bayes method and the Naïve Bayes method. The highest average accuracy, sensitivity, and specificity for the Absolute Correlation Weighted Naïve Bayes method are 81.85%, 74.81%, and 89.19%, respectively, whereas the highest average accuracy, sensitivity, and specificity for the Naïve Bayes method are 81.44%, 74.58%, and 88.24%, respectively. It can be seen that the Absolute Correlation Weighted Naïve Bayes method has a higher average accuracy, sensitivity, and specificity than the Naïve Bayes method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Junanto Prihantoro
"

Konsumsi energi nasional secara signifikan dikontribusikan oleh tenaga listrik rumah tangga. Untuk mengetahui penggunaan energi listrik di setiap peralatan listrik rumah tangga, teknik yang disebut Non-Intrusive Load Monitoring (NILM) digunakan. NILM adalah alat untuk memantau dan mengidentifikasi kekuatan setiap peralatan listrik. Baru-baru ini beberapa metode klasifikasi data seperti jaringan saraf, pembelajaran mendalam telah diterapkan untuk mengembangkan NILM. Dalam tulisan ini, metode naive bayes digunakan untuk NILM. Metode ini untuk mengklasifikasikan kondisi on-off peralatan listrik. Untuk meningkatkan akurasi, metode preprocessing data yang normalisasi dan diskritisasi digunakan. Perbandingan kinerja dievaluasi untuk setiap metode. Dalam tulisan ini, dataset REDD digunakan. Metode Supervised learning yang digunakan adalah Naive Bayes dan K Nearest Neighbour. Hasil simulasi menunjukkan bahwa dua metode ini dapat mengenali data NILM dengan akurasi yang tinggi. Metode naive bayes dengan diskritisasi memperoleh akurasi tertinggi dengan nilai 96.64% diikuti oleh KNN dengan k =5 dengan nilai 96.1287%.

 


National energy consumption is significantly contributed by household electricity. To find out the use of electrical energy in every household electrical equipment, a technique called Non-Intrusive Load Monitoring (NILM)  used. NILM is a tool to monitor and identify the strength of each electrical equipment. Recently several methods of data classification such as neural networks, deep learning have been applied to develop NILM. In this paper, the naive Bayes method used for NILM. This method is to classify the conditions of on-off electrical equipment. Accuracy to improve, data preprocessing techniques that are normalised and discretised used. Performance comparisons are evaluated for each method. In this paper, the REDD dataset used. The Supervised learning method used is Naive Bayes and K Nearest Neighbor. The simulation results of the two classification methods can recognise NILM data with high accuracy, the naive Bayes method with discretisation obtained the highest accuracy with an amount of 96.64% followed by KNN with 5 with a value of 96.1287%.

 "

2019
T53159
UI - Tesis Membership  Universitas Indonesia Library
cover
Kresna Bima Sudirgo
"Biaya transportasi adalah salah satu komponen untuk mendapatkan keuntungan maksimal, tetapi sekarang tingkat emisi yang dihasilkan dari kegiatan transportasi juga menjadi perhatian di dunia industri. Model optimal komponen biaya dan emisi diperlukan untuk mendapatkan skenario terbaik yang memiliki biaya dan emisi rendah untuk mendukung komitmen industri ramah lingkungan. Untuk mencapai model yang dapat menyerupai kondisi asli di tempat tertentu kita akan menggunakan metode classifier Naïve Bayes. Model ini akan mengklasifikasikan tingkat keramahan lingkungan dan efisiensi biaya berdasarkan pengukuran berat dan volume menggunakan database yang diperoleh dari area tertentu, pada riset ini periset menggunakan beberapa skenario transportasi dari zona industri yang memiliki aktivitas melalui pelabuhan Tanjung Priok. Sebagai hasil dari pengklasifikasi alat yang dapat mengklasifikasikan tingkat hijau, tingkat biaya dan karakteristik barang yang sesuai (apakah itu cenderung memenuhi berat atau volume) berdasarkan metode pengklasifikasi Naïve Bayes.

Transportation costs are one of the components to get the maximum profit, but now the level of emissions resulting from transportation activities also becomes a concern in the industry. Optimum models of cost and emissions components required to get the best scenario that has low costs and emissions to support green industrial commitment. To achieve a model that can resemble the original conditions on the specific place we will use the Naïve Bayes classifier method. This model will classify the environmental friendliness and cost efficiency incurred with weight and volume measurement based on existing databases acquired from specific areas, at this study researcher using multiple transportation scenarios from industrial zones that had activity through the Tanjung Priok port. As a result of a classifier of tools that can classify green levels, cost levels and suitable characteristics of goods (whether it tends to meet weight or volume) based on Naïve Bayes classifier methods."
Jakarta: Fakultas Teknik Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Daffa Jatmiko
"Peranan ibu kota sangatlah vital, saat ini pemerintah kembali memutuskan pemindahan ibu kota karena Jakarta dianggap sudah tidak layak lagi menjadi ibu kota negara Republik Indonesia. Pemindahan ibu kota Indonesia nyatanya mengundang banyaknya opini pro dan kontra di kalangan masyarakat dan respon ini menarik untuk diteliti yaitu bagaimana pandangan masyarakat terhadap kebijakan pemerintah ini yang juga menggambarkan tingkat kepercayaan kepada pemerintah. Oleh karena itu, diperlukan sentiment analysis dengan classifier berbasis machine learning yang akurat dan menentukan algoritma yang terbaik. Data berupa tweets dikumpulkan dengan web scraping dan dilakukan pra-pemrosesan yang menghasilkan label data berupa polaritas dan kategori/aspek yang teridentifikasi. Model Machine Learning dengan algoritma Naive Bayes dan Support Vector Machine kemudian digunakan dalam klasifikasi polaritas kelas biner dengan fitur n-gram (urutan kata) dan optimasi heuristik yaitu Hyperparameter Tuning. Dari kombinasi fitur dan perlakuan optimasi, nilai MCC sebagai metrik evaluasi dibandingkan dan ditemukan bahwa Naive Bayes mengungguli Support Vector Machine dalam mengklasifikasi opini publik di media sosial Twitter khususnya mengenai pemindahan ibu kota.

The role of the capital city is very vital, at this time the government has again decided to move the capital city because Jakarta is considered no longer suitable as the capital city of the Republic of Indonesia. The relocation of Indonesia's capital city in fact invites many pro and contra opinions among the public and this response is interesting to study, namely how the public views this government policy which also describes the level of trust in the government. Therefore, sentiment analysis is needed with a machine learning-based classifier that is accurate and determines the best algorithm. Data in the form of tweets is collected by web scraping and pre-processed which produces data labels in the form of polarity and identified categories/aspects. Machine Learning model with Naive Bayes algorithm and Support Vector Machine is then used in the classification of binary class polarity with n-gram features (word order) and heuristic optimization, namely Hyperparameter Tuning. From the combination of features and optimization treatment, the MCC value as an evaluation metric was compared and it was found that Naive Bayes outperformed the Support Vector Machine in classifying public opinion on Twitter social media, especially regarding the relocation of the capital city."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>