Arvan Aulia Rachman
"Klasifikasi data kanker dilakukan untuk menemukan terapi yang tepat yaitu memaksimalkan efektivitas dan meminimalkan toksisitas. Pada umumnya, data kanker terdiri dari banyak fitur. Namun, tidak semua fitur tersebut informatif. Oleh karena itu, fitur-fitur tersebut akan diseleksi menggunakan metode Fisher's Ratio untuk memilih fitur-fitur yang paling informatif. Fitur-fitur terbaik akan dibentuk data baru. Data, sebelum dan setelah dilakukan pemilihan fitur, diklasifikasi menggunakan metode Fuzzy C-Means. Akurasi dari proses klasifikasinya akan dibandingkan. Hasilnya, tanpa melakukan pemilihan fitur, diperoleh rata-rata akurasi sebesar 82.92%. Setelah dilakukan pemilihan fitur, diperoleh akurasi terbaik dengan menggunakan 150 fitur dengan rata-rata akurasi sebesar 89.68%.

Classification of cancer data is done to find the right therapy that maximize efficacy and minimize toxicity. In general, cancer data consists of many features. However, not all of these features are informative. Therefore, these features will be selected using Fisher's Ratio to choose features that are most informative. The best features to be formed new data. Data, before and after feature selection, are classified using Fuzzy C-Means. The accuracy of the classification process will be compared. As a result, without doing feature selection, the accuracy is 82.92%. After doing feature selection, the best accuracy is obtained by using 150 features with the accuracy is 89.68%.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
Andi Wulan Lestari A.
"Dalam dekade terakhir ini, kanker menjadi pusat perhatian dunia kesehatan dikarenakan penyakit ini termasuk dalam penyebab utama kematian di seluruh dunia. Menurut statistik GLOBOCAN, International Agency for Research on Cancer IARC pada tahun 2012, terdapat 14.067.894 kasus kanker baru dengan 8.201.575 kematian akibat kanker di seluruh dunia. Oleh sebab itu, dibutuhkan tindakan pencegahan dan pengobatan yang efektif. Salah satunya dengan metode klasifikasi kanker. Metode klasifikasi kanker dapat dijadikan sebagai alat bantu tenaga medis untuk menangani kanker. Dalam tugas akhir ini diusulkan algoritma untuk mengklasifikasikan data kanker dengan menggunakan Fuzzy Possibilistic C-means FPCM dan metode baru yang menggunakan Normed Kernel Function-based Fuzzy Possibilistic C-means NKFPCM. Tujuannya untuk mendapatkan keakuratan terbaik dalam pengklasifikasian data kanker. Untuk meningkatkan keakuratan dua metode tersebut, dilakukan evaluasi kandidat fitur dengan menggunakan pemilihan fitur. Untuk pemilihan fitur digunakan metode Laplacian Score. Hasil yang diperoleh menunjukkan perbandingan keakuratan dan running time dari FPCM dan NKFPCM tanpa dan dengan dilakukan pemilihan fitur. Hasilnya, didapatkan akurasi terbaik saat dengan menggunakan metode NKFPCM dengan dilakukan pemilihan fitur, yaitu 90,91 dengan penggunaan 750 fitur untuk data kanker kandung kemih, 100 dengan penggunaan 250 fitur untuk data kanker darah leukemia , 96,67 dengan penggunaan 3.000 fitur untuk data kanker prostat, dan 100 dengan penggunaan 250 fitur untuk data kanker lambung.

Over the past decade, cancer has become the center of attention in the medical field due to its reputation as one of the main causes of death in the worldwide. According to GLOBOCAN statistics, International Agency for Research on Cancer IARC , there were 14,067,894 new cancer cases and 8,201,575 cancer related deaths occurred in 2012. Therefore, preventive actions and effective treatments are required to reduce these threats. One method of handling of cancer using cancer classification. Cancer classification method can be used as aids to handle Cancer. This research proposed an algorithm to classify cancer data using Fuzzy Possibilistic C Means FPCM and a new method, Normed Kernel Function Based Fuzzy Possibilistic C Means NKFPCM. The purpose of this research is to obtain the best accuracy in the classification of cancer data. To improve the accuracy of these two methods, the feature candidate will be evaluated using feature selection. The feature selection was conducted using Laplacian Score. The results obtained show the comparison of the accuracy and running time of FPCM and NKFPCM without and with feature selection. The results show that the best accuracy obtained when using NKFPCM with features selection, with percentage of 90.91 by using 750 features for bladder cancer data, 100 by using 250 features for blood cancer leukemia data, 96.67 by using 3,000 features for prostate cancer data, and 100 by using 250 features for gastric cancer data.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
Nedya Shandri
"Penyakit kronis adalah penyakit yang diderita dalam waktu panjang dan dapat berkembang secara cepat, salah satunya adalah penyakit kanker dan diabetes. Oleh karena itu, dengan melakukan pendeteksian dini maka perkembangan penyakit kanker dan diabetes akan menurun. Salah satu cara pendektesian dini dapat dilakukan oleh machine learning. Teknik machine learning banyak digunakan dalam berbagai bidang khususnya untuk analisa data medis.  Clustering merupakan salah satu metode dari machine learning yang bertujuan untuk mengelompokkan suatu dataset ke dalam subset berdasarkan ukuran jarak. Salah satu contoh metode clustering adalah metode Entropi Fuzzy C-Means yang dapat mengidentifikasi entropi disetiap titik data dan memilih pusat kluster terdekat dengan entropi minimum. Pada penelitian akan digunakan data kanker dan diabetes dari UCI Repository dengan menggunakan metode Entropi Fuzzy C-Means yang akan dimodifikasi dengan kernel RBF. Sebelum dilakukan klasifikasi, dilakukan pemilihan fitur menggunakan Chi-Square. Tujuan dari penelitian ini adalah untuk mendapatkan fitur-fitur yang optimal dan mengetahui hasil akurasi menggunakan untuk klasifikasi data diabetes dan kanker. Diperoleh hasil akurasi tertinggi pada klasifikasi data medis menggunakan metode Entropi Fuzzy C-Means berbasis kernel dengan pemilihan fitur Chi-Square yaitu sebesar 83.33% untuk data diabetes dan 77.77-100% untuk data kanker.

Chronic disease is a disease that occur for a long time and can develop quickly, one of them is cancer and diabetes. The early detection is very helpful to reduce the development of the disease. One of the ways to detect cancer and diabetes disease is using machine learning technic. Machine learning technic is widely use in many aspects especially in medical data analysis. Clustering is part of machine learning technic that is used to group a dataset into subset based on space size. Entropy Fuzzy C-Means is one of the methods which can identify entropy in every data and can choose the cluster center similar with minimum entropy. In this paper we will use cancer and diabetes medical data from UCI Repository using Entropy Fuzzy C-Means method which is modified by kernel RBF. Before classification, we will select the feature using Chi-Square  to get the optimal subset feature. The purpose of this study was to obtain optimal features and find out the results of accuracy using for the classification of diabetes and cancer data. The medical data classification using Entropy Fuzzy C-Means based on kernel with Chi-Square feature selection gives the 100% highest accuration result for cancer data and 83,33% for diabetes data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
Sakinah Hayati
"Klasifikasi kanker berbasis microarray data telah menjawab tantangan pengobatan kanker dengan terapi kanker yang dapat dimaksimalkan dan toksisitas yang dapat diminimalkan. Pada tugas akhir ini, dibahas proses klasifikasi terhadap data kanker colon untuk menentukan apakah data tersebut merupakan data kanker atau normal. Tujuan dari penulisan tugas akhir ini adalah memperoleh keakuratan klasifikasi data kanker colon dengan menggunakan Tangent Fuzzy Possibilistic C-Means (TFPCM). Keakuratan klasifikasi tergantung pada parameter-parameter: nilai , derajat fuzzy, dan derajat possibilistic yang terdapat pada algoritma TFPCM, sehingga diperlukan nilai optimal dari parameter-parameter tersebut. Metode pada tugas akhir ini menggunakan teknik Robust Fuzzy Possibilistic C-Means (RFPCM) dengan fungsi Kernel yang digunakan adalah hyper tangent Kernel Bray Curtis.

Cancer classification based on microarray data has been able to cure cancer with cancer therapy that can be maximized and with toxicity that can be minimized. In this essay, classification process of colon cancer data will be discussed further to determine whether the data is a cancer data or normal data. The purpose of writing this essay is to obtain the accuracy of colon cancer data classification using Tangent Fuzzy Possibilistic C-Means (TFPCM). The accuracy depends on the parameters: value, degree of fuzzy, and degree of possibilistic in TFPCM algorithm, so the optimal value of those parameters are needed. The method in this essay using Robust Fuzzy Possibilistic C-Means technique (RFPCM) where the Kernel function that is being used is hyper tangent Kernel Bray Curtis.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
Aldi Purwanto

Kanker merupakan salah satu penyakit dengan angka kematian tertinggi di dunia. Kanker adalah penyakit ketika sel-sel abnormal tumbuh tidak terkendali yang dapat menyerang organ tubuh yang berdampingan atau menyebar ke organ lain. Untuk mendiagnosis kanker paru-paru dapat dilakukan dengan pengambilan gambar rontgen, CT scan, dan biopsi jaringan paru. Tujuan dari penelitian ini adalah untuk memprediksi apakah pasien menderita kanker paru-paru atau tidak, dengan menggunakan data gambar CT scan mereka. Oleh sebab itu, dalam penelitian ini digunakan ekstraksi fitur dari gambar CT scan sebagai data untuk mengklasifikasi kanker paru-paru. Data yang digunakan merupakan data gambar CT scan yang didapat dari SPIE-AAPM Lung CT Challenge 2015. Gambar CT scan paru-paru dengan ukuran 512x512 sebelumnya dilakukan pre-processing 2D crop dan filtering. Dengan mengekstraksi fitur dari data gambar seperti ukuran nodul, Gray Level Co-occurrence Matriks (GLCM), dan Local Binary Pattern (LBP) dapat mengubah data gambar menjadi numerik. K-Fold Cross Validation digunakan untuk memisahkan data menjadi data training dan data testing. Fuzzy C-Means (FCM) dan Fuzzy Kernel C-Means (FKCM) diterapkan untuk pengklasifikasian. Didapatkan performa FKCM lebih baik dibandingkan FCM, dengan rata-rata akurasi 75.60%, precision 83.05%, dan specificity 87.80%. Oleh karena itu, penambahan kernel pada metode Fuzzy C-Means dapat meningkatkan performa dari metode tersebut

Cancer is one of the diseases with the highest mortality rate in the world. Cancer is a disease when abnormal cells grow out of control that can attack the body's organs side by side or spread to other organs. To diagnose lung cancer can be done by taking x-ray images, CT scans, and lung tissue biopsy. The purpose of this study is to classify whether patients have lung cancer or not using their CT scan image data. Therefore, in this study feature extraction from CT images was used as data to classify lung cancer. The data used in the form of CT scan image obtained from SPIE-AAPM Lung CT Challenge 2015. Previously, a CT scan of the lung with a size of 512x512 was pre-processed 2D crop and filtering. By extracting features from image data such as nodule size, Gray Level Co-occurrence Matrix (GLCM), and Local Binary Pattern (LBP) can convert image data to numeric. K-Fold Cross Validation is used to separate data into training data and testing data. Fuzzy C-Means (FCM) and Fuzzy C-Means (FKCM) are applied for classification. FKCM performed better than FCM, with 75.60% average accuracy, 83.05% average precision, and 87.80% average specificity. Therefore, adding a kernel to the Fuzzy C-Means method can improve the performance of the method.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
Inry Raudiatul Fauzi
Kanker merupakan penyakit penyebab kematian terbesar kedua di dunia. Menurut prediksi WHO 2015 kasus kematian akibat kanker akan meningkat menjadi 21,6 juta kasus pada tahun 2030. Salah satu usaha untuk mengurangi penyebaran kanker dengan menggunakan machine learning adalah melakukan pendeteksian jenis kanker dengan memanfaatkan microarray data. Pada umumnya, microarray data kanker terdiri dari banyak fitur. Namun, tidak semua fitur yang ada pada data kanker memiliki informasi penting. Oleh karena itu, fitur-fitur tersebut akan diekstraksi menggunakan metode Principal Component Analysis PCA . Kemudian dipilih fitur-fitur yang paling informatif dari data hasil ekstraksi PCA. Fitur-fitur terpilih dari data hasil ekstraksi akan dibentuk dalam data baru. Data sebelum dan data setelah dilakukan pemilihan fitur akan diklasifikasi menggunakan metode Fuzzy Support Vector Machines FSVM . Akurasi dari proses klasifikasi dua tahap tersebut akan dibandingkan. Pendekatan one versus one akan digunakan pada masalah klasifikasi multikelas data kanker leukemia. Dengan pendekatan tersebut akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Hasilnya, tanpa melakukan pemilihan fitur, diperoleh akurasi tertinggi sebesar 87.69 . Setelah dilakukan pemilihan fitur, diperoleh akurasi terbaik dengan menggunakan 60 fitur dengan akurasi sebesar 96,92 .

Cancer is the second leading cause of death globally. According to WHO prediction 2015 cases of cancer deaths will increase become 21.6 million cases by 2030. One of the effort to reduce the spread of cancer by using machine learning is to detect the types of cancer. We can use microarray data to detect the types of cancer. In general, microarray cancer data consist of many features. However, not all features in cancer data have important information. Therefore, these features will be extracted by using Principal Component Analysis PCA method. Then, we select the most features who have important information of data extraction. The selected features of extracted data will be formed in the new data. Data, before and after selection will be classified using Fuzzy Support Vector Machines FSVM method. The accuracy of the classification process will be compared. The one versus one approach will be used on multiclass leukemia cancer data. This approach will formed the multiclass problem into k k 1 2 binary class problems, where k denotes the number of classes. The results, without doing feature selection, the highest accuracy is 87.69 . After doing feature selection, the best accuracy is obtained by using 60 features with the accuracy is 96.92 ."
Tommy Rachmansyah Adyalam
"Kanker otak adalah pertumbuhan sel-sel abnormal di organ otak yang bersifat ganas. Salah satu cara untuk mengurangi perkembangan penyakit ini adalah melakukan pendeteksian dini menggunakan machine learning. Metode machine learning yang digunakan adalah AdaBoost Support Vector Machines untuk klasifikasi. AdaBoost Support Vector Machines adalah metode ensemble antara AdaBoost dengan base classifier Support Vector Machines. Data kanker otak direpresentasikan dalam bentuk matriks berupa ekspresi gen yang disebut DNA microarray. Data DNA microarray yang berdimensi tinggi akan direduksi dengan pemilihan fitur Signal-to-noise Ratio.
Pemilihan fitur bekerja untuk menemukan fitur-fitur yang informatif dan membuang fitur-fitur yang tidak sesuai. Pertama, data diklasifikasi menggunakan AdaBoost Support Vector Machines tanpa pemilihan fitur, dilanjutkan klasifikasi menggunakan AdaBoost Support Vector Machines dengan pemilihan fitur. Pendekatan one vs one digunakan untuk menyelesaikan masalah multi kelas. Setelah melakukan pengujian, hasil akurasi terbaik adalah 91,111 pada data training 90 dengan menggunakan pemilihan fitur sebanyak 60 fitur. Hasil tersebut lebih baik dibandingkan klasifikasi tanpa pemilihan fitur yaitu 86,667 pada data training 90.

Brain cancer is the growth of abnormal cells in the brain organ malignantly. One way to reduce the progression of this disease is to do early detection using machine learning. Machine learning method used is AdaBoost Support Vector Machines for classification. AdaBoost Support Vector Machines is an ensemble method between AdaBoost and base classifier Support Vector Machines. Brain cancer data is represented in the form of matrix of gene expression called DNA microarray. The high dimensional DNA microarray data will be reduced by Signal to noise Ratio feature selection.
Feature selection works to find informative features and discard irrelevant features. Firts, the data is classified using AdaBoost Support Vector Machines without feature selection, further classified using AdaBoost Support Vector Machines with feature selection. The one vs one approach is used to solve multi class problems. After testing, the best accuracy result is 91,111 in 90 training data by using feature selection of 60 features. The result is better than the classification without feature selection that is 86,667 in 90 data training.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
Egira Adhani Khairunnisa

Saat ini tidak ada keraguan bagi siswa-siswi sekolah menengah untuk melanjutkan pendidikannya ke jenjang universitas. Namun, transisi dari sekolah menengah ke pendidikan tinggi adalah tantangan besar bagi mahasiswa tahun pertama. Kinerja mahasiswa pada tahun pertama cenderung menentukan kinerja mahasiswa tersebut di tahun-tahun akademik berikutnya. Penting untuk mencari karakteristik-karakteristik mahasiswa berdasarkan kinerjanya pada awal tahun semester akademik, sehingga dapat dilakukan pendeteksian awal untuk mencegah penurunan kinerja dan meningkatkan prestasi akademik mahasiswa. Penelitian ini bertujuan untuk mengelompokkan 140 mahasiswa semester pertama. Fitur-fitur diseleksi menggunakan Chi-Square lalu digunakan Fuzzy C-Means clustering untuk mengelompokkan mahasiswa. Dari hasil simulasi, mahasiswa dikelompokkan ke dalam dua cluster dengan kinerja cluster kedua lebih baik dibanding kinerja cluster pertama.

Currently there is no doubt for high school students to continue their education at the university level. However, the transition from high school to university is a major challenge for the first-year students. Moreover, student performance during the first year tends to determine their performance in the following academic years. It is important to find student's characteristics based on their performance at the beginning of the academic semester so that early detection can be done to prevent performance degradation and increase student academic achievement. This study aims to cluster 140 first year students. Features are selected using the Chi-Square feature selection method and then using Fuzzy C-Means clustering to group the students. From simulation result, students are grouped into two clusters with the second cluster's performance is better than the first cluster's performance.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
Devina Itsnia Rizka
Kanker serviks merupakan salah satu jenis kanker yang berbahaya. Berdasarkan data dari Departemen Kesehatan Republik Indonesia Depkes RI , kanker serviks merupakan salah satu penyakit kanker dengan prevelensi tertinggi sebesar 0.8 di Indonesia. Maka dari itu diperlukan tindakan pendeteksian dini dengan menggunakan microarray dataset. Microarray dataset mempunyai jumlah fitur yang banyak tetapi tidak semua fitur yang ada relevan dengan data yang digunakan. Oleh karena itu, perlu dilakukan pemilihan fitur untuk meningkatkan akurasi. Pemilihan fitur yang digunakan adalah Artificial Bee Colony ABC . Setelah dilakukan pemilihan fitur, akan dilakukan klasifikasi menggunakan metode klasifikasi Na ve Bayes. Hasilnya, didapatkan akurasi terbaik klasifikasi Na ve Bayes tanpa pemilihan fitur adalah 60 pada saat data training 90 dan untuk klasifikasi Na ve Bayes dengan menggunkan pemilihan fitur Artificial Bee Colony didapatkan akurasi tertinggi adalah 93.33333 . dengan fitur sebanyak 50 dan data training 90
Cervical cancer is one of the most dangerous cancer. Based on data from Departemen Kesehatan Republik Indonesia Depkes RI , cervical cancer is one of the diseases with the highest prevalence of 0.8 in Indonesia. Therefore, early detection action is needed with using microarray dataset. Microarray datasets have a large number of features but not all features are relevant to the data is used. Therefore, feature selection is needed to improve the accuracy. The feature selection that used is Artificial Bee Colony ABC . After feature selection process is done, Naive Bayes classification method will be implemented for classification process. As a result, the best accuracy of Na ve Bayes classification without feature selection is 60 with 90 training data and for Na ve Bayes classification using Artificial Bee Colony feature selection is 93.33333 with using 50 features selection and 90 training data."
Revania Rismarini
"Soft Tissue Tumor atau tumor jaringan lunak adalah suatu benjolan atau pembengkakan abnormal yang disebabkan pertumbuhan sel baru. Tumor jaringan lunak dapat terjadi di seluruh bagian tubuh mulai dari ujung kepala sampai ujung kaki. Penyakit tersebut dapat terjadi disemua kelompok umur. Menurut beberapa dokter setiap benjolan/tumor yang ada haruslah diperiksa sejak dini sehingga pasien dapat mendapatkan pengobatan yang tepat dan tidak terjadinya perkembangan kanker. Pada penelitian ini, metode machine learning yang digunakan untuk mengklasifikasi soft tissue tumor. Dengan data Soft Tissue Tumor yang memiliki beragam fitur, maka akan direduksi dengan seleksi fitur signal to noise ratio. Pada penelitian ini, penyakit Soft Tissue Tumor dideteksi dengan mengklasifikasikan pasien tersebut mengidap Soft Tissue Tumor atau tidak menggunakan Deep Neural Network dengan implementasi metode seleksi fitur signal to noise ratio dan akan dibandingkan nilai akurasi klasifikasi yang dihasilkan dari Deep Neural Network tanpa seleksi fitur dan Deep Neural Network dengan seleksi fitur signal to noise ratio. Data yang diperoleh berjumlah 76 data dengan total 17 fitur. Diperoleh hasil bahwa akurasi menggunakan seleksi fitur lebih tinggi dibandingkan tanpa seleksi fitur. Metode klasifikasi mendapat akurasi tertinggi pada jumlah fitur 14.

Soft tissue tumor is an abnormal lump or swelling caused by the growth of new cells. They can occur in all parts of the body from head to toe. Some types of this disease are more common in children, while some others are more common in adults. Though initially benign, this tumor can become aggressive if not treated. The more the tumor has invaded nearby tissues, the harder it is to completely remove. Sometimes, patients underestimate lumps because there are no distinctive clinical signs between malignant and benign tumors. Therefore, doctors suggest patients to immediately examine any existing lump so that it can be treated early and not develop into cancer. The usage of machine learning method to classify the diagnosis is very beneficial. High-dimensional soft tissue tumor data will be reduced using signal to noise ratio feature selection method. In this study, soft tissue tumor disease is detected by classifying soft tissue tumor patients and non-patients data using Deep Neural Network with the implementation of signal-to-noise feature selection. The accuracy will then be compared to Deep Neural Network classification without the implementation of feature selection. The data obtained amounted to 76 data with a total of 17 features. It is found that the accuracy of Deep Neural Network with feature selection is higher compared to the one without feature selection. The highest accuracy result is obtained with the use of 14 features."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
