Ratna Aminah

Diabetes merupakan penyakit kronis yang terjadi ketika terdapat peningkatan kadar glukosa dalam darah karena tubuh tidak dapat atau tidak cukup menghasilkan hormon insulin atau tidak dapat menggunakan insulin secara efektif. Umumnya untuk mendeteksi penyakit diabetes adalah dengan tes kadar gula darah atau hemoglobin HbA1c yang dilakukan oleh praktisi medis. Pada penelitian ini, dibangun sistem prediksi penyakit diabetes berbasis iridologi atau melalui citra mata, menggunakan machine learning. Sistem yang dikembangkan terdiri dari instrumen akuisisi citra mata dan algoritma pengolahan citra. Metode GLCM (Gray Level Co-Occurence Matrix) digunakan untuk proses ekstraksi ciri, dengan tujuan untuk mendapatkan ciri tekstur pada citra. Metode SVM (Support Vector Machine) dan kNN (k Nearest Neighbor) digunakan untuk proses klasifikasi kelas diabetes dan non-diabetes. Hasil klasifikasi kemudian dilakukan proses validasi dengan menggunakan metode k-fold cross validation. Hasil yang diperoleh menunjukkan bahwa metode kNN memiliki performa yang lebih baik dibandingkan dengan metode SVM. Performa terbaik didapatkan saat variasi kombinasi ukuran area segmentasi 30×360 dengan jarak antar tetangga 30 pixel. Tingkat akurasi yang diapatkan dari pengujian sebesar 79,6%, dengan nilai misclassification rate (MR) 20,4%, false positive rate (FPR) 20,6%, false negative rate (FNR) 20%, sensitivity 87,1%, dan specificity 70,0%.



Diabetes is a chronic disease that occurs when there is an increase in glucose levels in the blood because the body cannot produce enough of the hormone insulin or cannot use insulin effectively. Generally, to detect diabetes is by pengujian blood sugar levels or hemoglobin HbA1c carried out by medical practitioners. In this study, a diabetes prediction system based on iridology or through eye images was constructed using machine learning. The developed system consists of eye image acquisition instruments and image processing algorithms. The GLCM (Gray Level Co-Occurence Matrix) method is used for feature extraction processes, with the aim of obtaining texture characteristics in the image. The SVM (Support Vector Machine) and kNN (k Nearest Neighbor) methods are used to classify diabetic and non-diabetic classes. The classification results are then validated by using the k-fold cross validation method. The results show that kNN method has better performance compared to the SVM method. The best performance is when size of the segmentation area 30×360 pixel with the distance between neighbors 20 pixel. The results show that the accuracy from pengujian is 79.6%, misclassification rate (MR) 20.4%, false positive rate (FPR) 20.6%, false negative rate (FNR) 20.0%, sensitivity 87.1%, and specificity 70.0%.


Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
Junanto Prihantoro

Konsumsi energi nasional secara signifikan dikontribusikan oleh tenaga listrik rumah tangga. Untuk mengetahui penggunaan energi listrik di setiap peralatan listrik rumah tangga, teknik yang disebut Non-Intrusive Load Monitoring (NILM) digunakan. NILM adalah alat untuk memantau dan mengidentifikasi kekuatan setiap peralatan listrik. Baru-baru ini beberapa metode klasifikasi data seperti jaringan saraf, pembelajaran mendalam telah diterapkan untuk mengembangkan NILM. Dalam tulisan ini, metode naive bayes digunakan untuk NILM. Metode ini untuk mengklasifikasikan kondisi on-off peralatan listrik. Untuk meningkatkan akurasi, metode preprocessing data yang normalisasi dan diskritisasi digunakan. Perbandingan kinerja dievaluasi untuk setiap metode. Dalam tulisan ini, dataset REDD digunakan. Metode Supervised learning yang digunakan adalah Naive Bayes dan K Nearest Neighbour. Hasil simulasi menunjukkan bahwa dua metode ini dapat mengenali data NILM dengan akurasi yang tinggi. Metode naive bayes dengan diskritisasi memperoleh akurasi tertinggi dengan nilai 96.64% diikuti oleh KNN dengan k =5 dengan nilai 96.1287%.


National energy consumption is significantly contributed by household electricity. To find out the use of electrical energy in every household electrical equipment, a technique called Non-Intrusive Load Monitoring (NILM)  used. NILM is a tool to monitor and identify the strength of each electrical equipment. Recently several methods of data classification such as neural networks, deep learning have been applied to develop NILM. In this paper, the naive Bayes method used for NILM. This method is to classify the conditions of on-off electrical equipment. Accuracy to improve, data preprocessing techniques that are normalised and discretised used. Performance comparisons are evaluated for each method. In this paper, the REDD dataset used. The Supervised learning method used is Naive Bayes and K Nearest Neighbor. The simulation results of the two classification methods can recognise NILM data with high accuracy, the naive Bayes method with discretisation obtained the highest accuracy with an amount of 96.64% followed by KNN with 5 with a value of 96.1287%.


Alya Fernandya

Aplikasi Meditasi berbasis EEG merupakan aplikasi yang dapat digunakan untuk mendeteksi perasaan stres seseorang dan membantunya bermeditasi dengan memanfaatkan alat EEG untuk membaca gelombang otak. Proses yang terjadi dalam aplikasi ini adalah menerima data gelombang otak dari EEG, mengubah sinyal gelombang otak dari domain waktu ke domain frekuensi dengan Fast Fourier Transform (FFT), dan mengklasifikasikan data dengan k-Nearest Neighbor (KNN). Proses klasifikasi dengan KNN diuji dengan memberikan variasi jumlah gelombang data yang digunakan serta variasi nilai k pada KNN. Dengan menggunakan nilai k = 3 dan menggunakan lima gelombang otak, yaitu gelombang delta, teta, alfa, beta, dan gama sebagai fitur dalam KNN, dapat diperoleh hasil akurasi terbaik sebesar 80% dan waktu pemrosesan tercepat sebesar 23 ms. Dalam pemakaian aplikasi meditasi, waktu rata-rata pengguna untuk dapat menurunkan tingkat stresnya adalah selama 4,2 menit. Implementasi EEG dan proses klasifikasi dengan KNN pada aplikasi meditasi ini dapat mengecek tingkat stres seseorang secara real time dan memastikan bahwa orang tersebut tidak stres lagi setelah bermeditasi.

EEG-based Meditation Application is an application that can be used for detecting someone's stress feeling and helping someone to meditate by using EEG to get brainwave signals. The processes that will be done in this application include collecting brainwave data from EEG, altering the brainwave signals from time domain to frequency domain with Fast Fourier Transform (FFT), and classifying data with k-Nearest Neighbor (KNN). Classification processes with KNN are tested by using variation in the number of brain waves used and using variation in the value of k used in KNN. By using k value of 3 and using five brainwaves, namely delta wave, theta wave, alpha wave, beta wave, and gamma wave as features in KNN, the best accuracy value can be gained, i.e. 80% with the fastest processing time, which is 23 ms. With the meditation application, the average time for the user to reduce the stress level is 4,2 minutes. The implementation of EEG and classification with KNN on this application makes it able to check a person's stress level in real time and to make sure that the person is de-stressed after meditation.

Pratiwi Yustiana
Pada penelitian ini dirancang sebuah sistem pendeteksi kantuk untuk mencegah terjadinya kelalaian pengendara yang dapat menyebabkan kecelakaan dalam bentuk aplikasi berbasis Android. Dengan menggunakan Elektoensefalogram (EEG), kondisi mengantuk pada seseorang dapat dideteksi dengan cara merekam aktivitas kelistrikan yang terjadi pada otak manusia dan direpresentasikan menjadi bentuk sinyal frekuensi. Kemudian sinyal tersebut akan dikirim ke aplikasi di smartphone Android melalui Bluetooth dan akan memberikan peringatan berupa notifikasi jika kondisi mengantuk sudah terdeteksi. Sinyal akan diproses menggunakan Fast Fourier Tranform (FFT) untuk mengekstraksi fitur pada sinyal otak dan diklasifikasi menggunakan ­K-Nearest Neighbor (KNN). Sistem tersebut diharapkan dapat meminimalisir penyebab terjadinya kecelakaan yang dikarenakan oleh pengemudi yang mengantuk. Hasil yang didapatkan dari perancangan sistem pendeteksi ini menunjukkan bahwa aplikasi sudah dapat menghasilkan performa terbaik dengan tingkat akurasi tertinggi yaitu 95.24% dengan menggunakan nilai K=3 dan dengan menggunakan 4 fitur gelombang otak (Delta, Theta, Alpha, dan Beta).

In this research, a drowsiness detection system is an Android application and it is designed to prevent drivers negligence that can cause accidents. By using Electroencephalogram (EEG), the condition of drowsiness can be detected by recording the electrical activity that occurs in human brain and represented as a frequency signal. Then the signal will be sent to the Android application on smartphone via Bluetooth and will give an alarm notification if the drowsiness is detected. The signal will be processed using Fast Fourier Transform (FFT) to extract features in human brain signals and be classified using K-Nearest Neighbor (KNN). The system is expected to minimize the causes of accidents that caused by drowsy drivers. The results obtained from the development of this detection system indicate that the application can produce the best performance with the highest accuracy of 95.24% using the value of K = 3 and by using 4 brain wave features (Delta, Theta, Alpha, and Beta)."
Fatia Marwa Nastitie
"Penyakit Parkinson atau yang biasa disebut PD merupakan gangguan pada sistem koordinasi gerakan manusia yang ditandai dengan gejala motorik dan non-motorik. Pada stadium lanjut PD, diagnosis klinis cukup jelas dalam pendeteksian. Namun, pada tahap awal, ketika gejala masih belum terlihat dengan jelas, diagnosis menjadi sulit dan terkadang pasien tetap tidak terdiagnosis atau bahkan salah diagnosis. Penelitian ini berfokus pada identifikasi faktor-faktor yang dapat menjadi gejala awal PD berdasarkan gangguan aktivitas keseharian dan gangguan perilaku tidur Rapid Eye Movement. Penelitian ini juga membahas klasifikasi penderita PD stadium awal menggunakan model klasifikasi statistika Classification tree beserta penanganan masalah missing value yang terjadi pada data PD. Faktor penting berdasarkan model Classification Tree adalah tremor, dress difficulty, speech difficulty, skor gangguan perilaku tidur REM, dan usia. Diperoleh model classification tree dengan melakukan proses penanganan missing value menggunakan metode K-Nearest Neighbour. Model tersebut memberikan nilai akurasi sebesar 86.5%, sensitivitas sebesar 80%, spesifisitas sebesar 91.57% dan AUC sebesar 0.858.

Parkinson’s Disease or commonly known as PD is a disorder in human movement coordinator system that are characterized by motoric and non-motoric symptoms. At the late stage of PD, clinical diagnosis is relatively easy to detect because the symptoms are clear-cut. However, when the symptoms are often incomplete or subtle, in the initial stage, diagnosis becomes difficult and sometimes subject still remain undiagnosed or even misdiagnosed. This research focuses on identifying factors in early stage PD based on patient daily activities and rapid eye movement sleeping behaviour disorder (RBD). Data analysis was conducted using classification tree method, to classify early stage PD patients or healthy control patients. Missing values were handled with k-Nearest Neighbour (kNN) method. The results were satisfactory, with the classification accuracy of 86.5%, sensitivity 80%, specificity 91.57% and AUC 0.858. It is also found that tremor, dressing difficulty, speech difficulty, RBD questionnaire score, and age are important in differentiating early stage PD from the healthy control."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
"Researches on computer vision are greatly developed today. The main idea is to make machine be able to recognize an object. One of practical application on computer vission for example is real time face recognition system...."
Fitra Hidiyanto
"Non-Intrusive Load Monitoring (NILM) memungkinkan pendeteksian peralatan yang aktif atau tidak aktif bahkan karakteristik untuk setiap peralatan yang dipasang di rumah, industri, laboratorium, dll, dengan mendisagregasi total konsumsi listrik yang diukur di panel daya pusat. Penerapan NILM untuk energi efisiensi, manajemen energi, dan diagnosa peralatan di rumah tangga, industri atau penyedia energi telah menunjukkan peningkatan yang menjanjikan. Metode K-NN adalah salah satu metode machine learning yang paling sederhana dan umum digunakan untuk klasifikasi dengan kinerja yang baik dan bersaing dengan metode yang bahkan lebih kompleks. KNN memiliki 3 karakteristik yang dapat diubah dan dioptimalkan untuk memberikan hasil akurasi yang lebih baik, yaitu dari sisi data, algoritma jarak, dan nilai k. Dalam makalah ini metode K nearest neighbor (KNN) dilakukan pada data NILM AMPds2 yang memiliki load karakteristik yang mirip antar peralatan yang berbeda, dengan 9 algoritma jarak yang berbeda, 7 jumlah data training (10% -70%) dan dilakukan untuk variasi k ( 1-25) pada input daya Aktif serta input daya Aktif dan Reaktif untuk didapatkan hasil terbaik, Selain itu dilakukan juga metode Backpropagation Neural Network (BPNN) dengan variasi data training sebesar 25%, 50%, 75% dan 100%, jumlah hidden 10, 20 dan 30, dan jumlah iterasi 50000 dan 150000 dengan input daya aktif dan reaktif data dan 2 metode input yaitu input statis dan dinamis, dan pada akhirnya perbandingan kinerja antara metode KNN dan backpropagation untuk memisahkan data NILM AMPds2 telah dilakukan. Dari hasil pengujian dan penelitian didapatkan bahwa dengan menambahkan data daya reaktif sebagai input, hasil disagregasi pada data NILM yang mempunyai load karakteristik yang sama antara peralatan yang berbeda dengan metode KNN diperoleh akurasi lebih dari 20% lebih akurat sampai dengan 95% akurasi, dan memiliki nilai precision dan recall mencapai 0.9565, dan perbandingan performansi antara metode KNN input daya aktif dan reaktif dan metode backpropagation input daya aktif dan reaktif untuk memisahkan data NILM AMPds2 ke dalam kluster didapatkan hasil bahwa metode KNN input daya aktif dan reaktif memiliki akurasi yang bersaing dengan akurasi 95% sedangkan akurasi hasil backpropagation input dinamis 99.85%.

Non-Intrusive Load Monitoring (NILM) enables detection of appliances that are active or non-active even characteristics for each equipment installed in homes, industries, laboratories, etc by disaggregating total electrical consumption at the Central Power panel. The application of NILM for energy efficiency, energy management, and diagnostic equipment in households, industries or energy providers has shown promising improvement. The K-NN method is one of the most simple and commonly used machine learning methods for classifying with good performance and competing with even complex methods. K-NN has 3 characteristics that can be changed and optimized to provide better accuracy results, namely in terms of data, distance algorithm, and k value. In this paper the K nearest neighbor (KNN) method is performed on NILM AMPds2 data which having distinctive similar load characteristic between different appliances, with 9 different distances, 7 types of total training data (10% -70%) and performed for k (1-25) in single input (Active Power) and double input (Active and Reactive Power) for best result, In addition, the Backpropagation Neural Network (BPNN) methode was also carried out with variations in the training data amount of 25%, 50%, 75% and 100%, hidden number of 10, 20 and 30, and iterations number of 50000 and 150000 in double input data and 2 input methodes which are static input and dynamic input, and in the end performance comparison between KNN and backpropagation methods to disaggregate NILM AMPds2 data had done. From test and research results it was found that by adding reactive power data as input, the disaggregation results on NILM data which having distinctive similar load characteristic between different appliances with KNN methode were more than 20% accurate up to 95% accuracy and had higher precision and recall value also up to 0.9565, and also performance comparison between KNN double input and backpropagation double input methode to disaggregate NILM AMPds2 data into clusters result was found that KNN methode has shown good competitive result up to 95% accuracy while backpropagation with dynamic input accuracy result is 99.85 %."
Depok: Fakultas Teknik Universitas Indonesia, 2021
Restu Eka Firdaus
"Sistem pengenalan wajah telah banyak diaplikasikan dengan menggunakan berbagai metode, diantaranya: metode PCA, metode ICA, metode LDA, metode EP, metode EBGM, metode Kernel, metode 3-D Morphable, metode 3-D Face Recognition, metode Bayesian Framework, metode HMM, metode SVM, dan sebagainya.
Pada penelitian ini digunakan metode Local Binary Pattern LBP untuk melakukan ekstraksi fitur citra wajah, serta metode SVM dan KNN untuk mengukur tingkat akurasi sistem pengenalan wajah. Data yang digunakan pada penelitian ini yaitu citra wajah 25 mahasiswa Matematika Universitas Indonesia, masing-masing individu diambil 10 citra wajah yang berbeda terdiri dari 5 citra wajah menggunakan kacamata dan 5 citra lainnya tidak menggunakan kacamata, serta diambil dari sudut yang berlainan.
Berdasarkan pengujian yang telah dilakukan, metode KNN dengan memperoleh tingkat akurasi terbaik yaitu sebesar 96.20 pada iterasi 100 dan 90 data training. Hal ini menunjukkan metode KNN lebih baik dibandingkan dengan metode SVM yang hanya memperoleh tingkat akurasi sebesar 94.80 pada iterasi 100 dan 90 data training.

Face recognition has been widely applied using various methods, that is PCA, ICA, LDA, EP, EBGM, Kernel, 3 D Morphable, 3 D Face Recognition, Bayesian Framework, HMM, SVM, etc.
In this research, the Local Binary Pattern LBP method is used to perform feature extraction of a facial image, and to measure the accuracy level of face recognition used SVM and knn method. The data used in this research are face images of 25 mathematics students of University of Indonesia, each individual took 10 different facial images consisting of 5 face images are using glasses with 5 different angles and 5 other images aren 39 t using glasses that also taken from the same 5 different angles.
Based on the tests, KNN method with K 1 obtained the best accuracy of 96.20 at 100 iterations and 90 training data. This result shows the KNN method is better than the SVM method which only obtained 94.80 at 100 iterations and 90 of training data.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
Rany Dwi Cahyaningtyas
"Produk susu bubuk balita yang beragam membuat konsumen memiliki banyak pilihan sehingga penting bagi produsen menjaga loyalitas pelanggan yang telah ada dengan memahami perilaku churn pelanggan. Churn pelanggan didefinisikan sebagai kecenderungan pelanggan untuk berhenti melakukan bisnis dengan sebuah perusahaan. Penelitian ini berfokus memprediksi pola churn pelanggan sehingga perusahaan dapat menentukan strategi untuk mengurangi churn. Penelitian ini membahas mengenai prediksi churn pelanggan berdasarkan segmen produk susu bubuk balita menggunakan model Length, Recency, Frequency, Monetary (LRFM). Responden penelitian ini adalah pelanggan PT. XYZ yang pernah bertransaksi untuk produk susu bubuk balita kelas premium (susu A) dan segmen biasa (susu B) selama periode tahun 2021. Variabel pada penelitian ini meliputi variabel LRFM dan CLV yang dibentuk dengan pembobotan variabel LRFM. Pertama metode Fuzzy C-Means Clustering digunakan untuk melakukan pelabelan target pelanggan selanjutnya metode klasifikasi K-Nearest Neighbor (KNN) digunakan untuk memprediksi churn. Hasilnya terdapat tiga kelompok pelanggan untuk masing-masing susu A dan susu B. Pelabelan yang dihasilkan yaitu pelanggan churn dengan nilai CLV rendah, potential to churn dengan nilai CLV menengah, dan loyal dengan nilai CLV tinggi. Susu B menunjukkan jumlah pelanggan churn sebesar 43,4% lebih banyak dibandingkan susu A sebanyak 34%. Tahapan akhir penelitian ini adalah menganalisis kinerja metode KNN berdasarkan nilai akurasi, recall, dan f1-score terhadap kedua susu A dan susu B. Hasil dari tugas akhir ini menunjukkan bahwa kinerja metode KNN bergantung pada pemilihan jumlah tetangga terdekat dan proporsi pemisahan data.

The variety of powdered toddler milk products gives consumers many choices, so producers need to maintain the loyalty of existing customers by understanding customer churn behaviour. Customer churn is defined as the tendency of a customer to stop doing business with a company. This study focuses on predicting customer churn patterns so companies can determine strategies to reduce churn. This study discusses the prediction of customer churn based on the segment of toddler powdered milk products using the Length, Recency, Frequency, Monetary (LRFM) model. The respondent of this research are the customers of PT. XYZ who have transacted for premium segment powdered milk products for toddlers (milk A) and ordinary segment (milk B) during 2021. Variables in the data include LRFM and CLV variables which are formed by weighting the LRFM variable. At first, Fuzzy C-Means Clustering algorithm was applied for labelling target customer and then, K-Nearest Neighbor (KNN) Classifier as churn prediction was used. As a result, there are three groups of customers for each milk A and milk B. The resulting labels are the churn customer group with low CLV value, potential to churn group with medium CLV, and loyal customer group with high CLV value. Milk B shows the number of customers churn by 43,4% more than milk A as much as 34%. In the final stage of this research, the author analyze the performance of the KNN method based on the value of accuracy, recall, and f1-score for both milk A and milk B. The results of this final project show that the performance of the KNN method depends on the selection of the number of nearest neighbors and the proportion of data splitting used."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
M. Ali Yafi Rizky
"Korosi dalam industri menyebabkan kerugian ekonomi signifikan dengan mengurangi masa pakai peralatan. Upaya pencegahan seperti penggunaan inhibitor korosi telah dilakukan, tetapi pemilihannya memakan waktu dan biaya, terutama untuk aplikasi di lingkungan asam. Oleh karena itu, pendekatan machine learning (ML) diperlukan untuk mengatasi masalah ini. ML digunakan untuk memprediksi sifat elektronik senyawa turunan pirimidina-pirazol. Sifat elektronik tersebut didapatkan melalui simulasi Teori Fungsional Kerapatan (DFT, Density Functional Theory) yang kemudian dapat digunakan untuk mengetahui efisiensi inhibitor senyawa karena memiliki korelasi yang linier. Model ML yang akan digunakan adalah K-Nearest Neighbors (KNN), Support Vector Regression (SVR), Extreme Gradient Boosting (XGBoost), Gradient Boosting, Extra Trees, dan Artificial Neural Network (ANN) dengan menggunakan deskriptor SMILES dan AlvaDesc sebagai fitur untuk menjelaskan struktur kimia dari senyawa organik. Model terbaik telah diidentifikasi yang dapat memprediksi sifat elektronik senyawa turunan pirimidina-pirazol dengan akurasi tertinggi dan jumlah fitur yang optimal. Proses validasi model dilakukan dengan membandingkan hasil prediksi dengan data dari literatur. Hasil penelitian menunjukkan model terbaik adalah model XGB dengan akurasi rata-rata yang mencapai 96,50%.

Corrosion in industry causes significant economic losses by reducing the lifespan of equipment. Various strategies, like corrosion inhibitors, are used, but selecting effective inhibitors for acidic environments is costly and time-consuming. To address this, machine learning (ML) was applied to predict the electronic properties of pyrimidine-pyrazole derivatives using Density Functional Theory (DFT) simulations. ML models employed are K-Nearest Neighbors (KNN), Support Vector Regression (KNN), Extreme Gradient Boosting (XGB), Gradient Boosting (GB), Extra Trees (ET), and Artificial Neural Network (ANN) using SMILES and AlvaDesc descriptors as features to elucidate the chemical structure of organic compounds. From the aforementioned models, the optimal model was identified that could predict the electronic properties of pyrimidine-pyrazole derivative compounds with the highest accuracy and optimal number of features. The model validation process involved a comparison of the prediction results with data from previous studies. The results demonstrated that the optimal model was XGB, with an average accuracy of 96.50%."
Depok: Fakultas Teknik Universitas Indonesia, 2024
