Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 6 dokumen yang sesuai dengan query
cover
Fildzah Zhafarina
Abstrak :

Kanker hati merupakan penyebab utama kematian akibat kanker di seluruh dunia. Di Indonesia, kanker hati menempati angka kejadian tertinggi kedua untuk laki laki yaitu sebesar 12,4 per 100.000 penduduk dengan rata-rata kematian 7,6 per 100.000 penduduk. Pada tugas akhir ini, dibahas mengenai kanker hati primer dengan jenis hepatocellular carcinoma. Metode Twin Support Vector Machines (Twin SVM) diimplementasikan untuk mengklasifikasikan data kanker hati berdasarkan hasil CT scan. Data yang digunakan adalah data numerik hasil CT scan pasien yang menderita kanker hati dan diperoleh dari Laboratorium Radiologi RSUPN Cipto Mangunkusumo. Metode Twin SVM adalah pengembangan dari metode SVM yang menggunakan dua hyperplane dalam mengklasifikasikan sampel. Pada tugas akhir ini, kernel yang digunakan pada metode Twin SVM adalah polinomial dan radial basis function (RBF). Berdasarkan hasil perbandingan, klasifikasi data kanker hati menggunakan metode Twin SVM dengan kernel Polinomial menghasilkan akurasi tertinggi sebesar 77,30% pada penggunaan data testing sebesar 10% dan data training 90%. Selain itu, nilai akurasi terendah terdapat pada kernel RBF menghasilkan sebesar 60,10% pada penggunaan data testing sebesar 90% dan data training 10% dan nilai parameter 𝐶 = 1. Jika dibandingkan, klasifikasi data kanker hati dengan menggunakan metode Twin SVM dengan kernel polinomial menghasilkan nilai akurasi yang lebih baik.


Liver cancer is the main cause of cancer death in the worldwide. In Indonesia, the incidence rate of liver cancer is the second highest for men, that is 12.4 per 100,000 population with the average death rate is 7.6 per 100,000 population. This final project discusses primary liver cancer with a type of hepatocellular carcinoma. The Twin Support Vector Machines (Twin SVM) method was implemented to classify liver cancer data based on CT scan results. The data used are numerical data from CT scan results of patients suffering from liver cancer and obtained from the Radiology Laboratory of Cipto Mangunkusumo Hospital. The Twin SVM method is the development of the SVM method that uses two hyperplane in classifying samples. In this final project, the kernel used in the Twin SVM method is polynomial and radial basis function (RBF). Based on the comparison results, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces the highest accuracy of 77.30% on the use of testing data of 10% and training data of 90%. In addition, the lowest accuracy value is found in the RBF kernel resulting in 60.10% on the use of testing data of 90% and training data of 10% and the parameter value of C=1. When compared, the classification of liver cancer data using the Twin SVM method with a polynomial kernel produces better accuracy values.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sri Hartini
Abstrak :
Talasemia merupakan penyakit genetik dimana terjadi kelainan pada sel darah merah akibat kesalahan produksi hemoglobin. Perkawinan antara sesama pembawa gen talasemia dapat menyebabkan munculnya keturunan yang menderita talasemia mayor. Talasemia mayor merupakan jenis talasemia yang dapat menyebabkan kematian. Oleh karena itu, pendeteksian dini terhadap penyakit talasemia merupakan hal yang penting. Salah satu cara untuk melakukan pendeteksian talasemia adalah dengan menggunakan machine learning. Pada skripsi ini, algoritma KC-Means (KCM) clustering digunakan untuk memprediksi talasemia. Kemudian performa algoritma tersebut dibandingkan dengan algoritma Kernel KC-Means (KKCM) clustering, dimana fungsi kernel yang digunakan adalah kernel Gaussian Radial Basis Function (RBF) dan polinomial. Pengujian kedua algoritma tersebut dilakukan dengan menggunakan hold-out evaluation dan 5-fold cross validation. Data yang digunakan adalah data talasemia yang berasal dari Rumah Sakit Harapan Kita, Jakarta, Indonesia. Data talasemia tersebut terdiri dari 150 sampel dengan komposisi 82 sampel talasemia dan 68 sampel non-talasemia, yang tiap sampelnya memiliki 11 fitur. Berdasarkan percobaan yang dilakukan, algoritma KCM dan KKCM menghasilkan prediksi dengan akurasi, sensitivitas, presisi, spesifisitas, dan F1-Score yang sama, yaitu di atas 96 persen. Namun, waktu komputasi yang dibutuhkan oleh KKCM dapat mencapai hingga 10.25 kali lebih cepat dari waktu komputasi KCM....... Thalassemia is a genetic disease in which there are abnormalities in red blood cells due to an error in the production of hemoglobin. Marriage between thalassemia carriers can cause the birth of a child suffering from thalassemia major. Thalassemia major is a type of thalassemia that can cause death. Therefore, early detection of thalassemia is essential. One of the techniques to detect thalassemia is to use machine learning. In this thesis, the KC-Means (KCM) clustering algorithm is used to predict thalassemia. Then the performance of the algorithm is compared with the KC-Means Kernel (KKCM) clustering algorithm, where the kernel functions used are the Gaussian Radial Base Function (RBF) and polynomial kernel. Evaluation of those algorithms is carried out using hold-out evaluation and 5-fold cross-validation. The data used is thalassemia data from Harapan Kita Hospital, Jakarta, Indonesia. The data consists of 150 samples with a composition of 82 thalassemia samples and 68 non-thalassemia samples; each has 11 features. Based on the experiments, the KCM and KKCM algorithms make predictions with the same accuracy, sensitivity, precision, specificity, and F1-Score, which is above 96 percent. However, the computing time needed by KKCM can reach up to 10.25 times faster than the KCM computing time.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nedya Shandri
Abstrak :
Penyakit kronis adalah penyakit yang diderita dalam waktu panjang dan dapat berkembang secara cepat, salah satunya adalah penyakit kanker dan diabetes. Oleh karena itu, dengan melakukan pendeteksian dini maka perkembangan penyakit kanker dan diabetes akan menurun. Salah satu cara pendektesian dini dapat dilakukan oleh machine learning. Teknik machine learning banyak digunakan dalam berbagai bidang khususnya untuk analisa data medis.  Clustering merupakan salah satu metode dari machine learning yang bertujuan untuk mengelompokkan suatu dataset ke dalam subset berdasarkan ukuran jarak. Salah satu contoh metode clustering adalah metode Entropi Fuzzy C-Means yang dapat mengidentifikasi entropi disetiap titik data dan memilih pusat kluster terdekat dengan entropi minimum. Pada penelitian akan digunakan data kanker dan diabetes dari UCI Repository dengan menggunakan metode Entropi Fuzzy C-Means yang akan dimodifikasi dengan kernel RBF. Sebelum dilakukan klasifikasi, dilakukan pemilihan fitur menggunakan Chi-Square. Tujuan dari penelitian ini adalah untuk mendapatkan fitur-fitur yang optimal dan mengetahui hasil akurasi menggunakan untuk klasifikasi data diabetes dan kanker. Diperoleh hasil akurasi tertinggi pada klasifikasi data medis menggunakan metode Entropi Fuzzy C-Means berbasis kernel dengan pemilihan fitur Chi-Square yaitu sebesar 83.33% untuk data diabetes dan 77.77-100% untuk data kanker.
Chronic disease is a disease that occur for a long time and can develop quickly, one of them is cancer and diabetes. The early detection is very helpful to reduce the development of the disease. One of the ways to detect cancer and diabetes disease is using machine learning technic. Machine learning technic is widely use in many aspects especially in medical data analysis. Clustering is part of machine learning technic that is used to group a dataset into subset based on space size. Entropy Fuzzy C-Means is one of the methods which can identify entropy in every data and can choose the cluster center similar with minimum entropy. In this paper we will use cancer and diabetes medical data from UCI Repository using Entropy Fuzzy C-Means method which is modified by kernel RBF. Before classification, we will select the feature using Chi-Square  to get the optimal subset feature. The purpose of this study was to obtain optimal features and find out the results of accuracy using for the classification of diabetes and cancer data. The medical data classification using Entropy Fuzzy C-Means based on kernel with Chi-Square feature selection gives the 100% highest accuration result for cancer data and 83,33% for diabetes data.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sari Gita Fitri
Abstrak :
Kanker adalah penyakit yang disebabkan oleh ketidakteraturan perjalanan hormon yang mengakibatkan tumbuhnya daging pada jaringan tubuh yang normal atau sering dikenal sebagai tumor ganas. Kanker terjadi saat sel-sel dalam tubuh membelah diri diluar kendali. Sel-sel abnormal ini kemudian menyerang jaringan terdekat. Salah satu kanker yang paling umum terjadi adalah kanker paru-paru. Kanker paru-paru adalah kanker yang dimulai di paru-paru dan paling sering terjadi pada orang yang merokok. Paru-paru kanan memiliki 3 bagian, yang disebut dengan lobus, sedangkan paru-paru kiri memiliki 2 lobus. Kanker paru-paru merupakan penyebab utama kematian terkait kanker di seluruh dunia dengan 30%-40% terjadi di negara berkembang. Untuk memprediksi apakah seseorang menderita kanker paru-paru atau tidak dapat dilihat dari terdapatnya tumor ganas pada paru-paru yang dapat dilakukan melalui CT scan. Namun, hasil CT scan tidak cukup dalam mendeteksi atau mendiagnosis secara dini terdapatnya tumor ganas di dalam paru-paru. Untuk itu, dapat digunakan machine learning dalam mendeteksi secara dini adanya tumor ganas di dalam paru-paru. Dalam penelitian ini, penulis menggunakan Kernel K-Means based Co-clustering yang merupakan pengembangan dari K-Means based Co-clustering. K-Means mengelompokkan data menggunakan jarak Euclidean. Akan tetapi, jika data yang dipisahkan adalah data nonlinear, maka konvergensi dari data yang dipisahkan tersebut akan kecil dan membutuhkan waktu yang lama, sehingga masalah ini dapat diselesaikan dengan menggunakan fungsi kernel untuk menggantikan jarak Euclidean.Co-clustering mempartisi baris dan kolom dari suatu matriks data secara simultan, sehingga blok yang diinduksi oleh partisi adalah klaster yang baik. Metode Kernel K-Means based Co-clustering memasukkan banyak titik untuk mewakili masing-masing pusat klaster, sehingga titik-titik di dalam klaster saling berdekatan, akan tetapi jauh dari titik yang mewakili klaster lain. Data yang digunakan adalah data kanker paru-paru yang diperoleh dari laboratorium radiologi RSUPN Cipto Mangunkusumo, Jakarta. Hasil akurasi yang diperoleh untuk memprediksi penyakit kanker paru-paru dengan menggunakan metode Kernel K-Means based Co-clustering adalah 94,5%. ......Cancer is a disease caused by an irregular course of hormones that results in the growth of flesh in normal body tissues or often known as malignant tumors. Cancer occurs when cells in the body divide out of control. These abnormal cells then attack nearby tissues. One of the most common cancers is lung cancer. Lung cancer is cancer that starts in the lungs and most often occurs in people who smoke. The right lung has 3 parts, which are called lobes, while the left lung has 2 lobes. Lung cancer is the leading cause of cancer-related deaths worldwide with 30%-40% occurring in developing countries. To predict whether someone has lung cancer or can not be seen from the presence of malignant tumors in the lungs that can be done through a CT scan. However, CT scan results are not enough to detect or diagnose the presence of malignant tumors early in the lungs. For this reason, machine learning can be used to detect malignant tumors early in the lungs. In this research, the writer usesKernel K-Meansbased Co-clustering which is the development of K-Means-based Co-clustering. K-Means groups data using Euclidean distances. However, if the separated data is non-linear data, the convergence will be small and take a long time, so this problem can be solved by using the kernel function to replace the Euclidean distance. Co-clustering partitioned rows and columns of a data matrix simultaneously, so the blocks induced by partitions are good clusters. Kernel K-Meansbased Co-clustering method includes many points to represent each cluster center, so that the points within the cluster are close together, but far from the points representing other clusters. The data used are lung cancer data obtained from the radiology laboratory of Cipto Mangunkusumo General Hospital, Jakarta. Accuracy results obtained to predict lung cancer by using the Kernel K-Meansbased Co-clustering method are 94.5%.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nurma Nugraha
Abstrak :
Analisis regresi merupakan suatu metode statistik untuk menyelidiki dan memodelkan hubungan antara satu variabel respon Y dengan satu atau lebih variabel prediktor X . Hubungan antara variabel prediktor X dan variabel respon Y secara umum dapat dimodelkan dengan sebuah fungsi regresi. Menentukan fungsi taksiran regresi dapat dilakukan secara parametrik dan nonparametrik. Dalam tugas akhir ini fungsi regresi ditaksir secara nonparametrik dengan metode regresi polinomial lokal. Regresi polinomial lokal adalah suatu metode regresi nonparametrik, dengan fungsi regresi ditaksir menggunakan bentuk polinomial. Jika pada regresi polinomial biasa persamaan regresi di-fit untuk seluruh wilayah data maka dalam regresi polinomial lokal persamaan regresi di-fit sepotong-sepotong. Kemulusan kurva dari taksiran regresi ini tergantung pada pemilihan parameter pemulus atau bandwidth, sehingga diperlukan pemilihan bandwidth yang optimal, yaitu bandwidth yang meminimumkan GCV. Dalam aplikasi metode regresi polinomial lokal dibandingkan dengan metode Nadaraya-Watson. Hasil yang diperoleh adalah metode regresi polinomial lokal akan baik menaksir data yang nilainya menyimpang jauh dibandingkan nilai data yang lain, sedangkan metode Nadaraya-Watson akan baik menaksir pada data yang berkumpul.
Depok: Universitas Indonesia, 2009
S27689
UI - Skripsi Open  Universitas Indonesia Library
cover
Rafiqatul Khairi
Abstrak :
Kanker pankreas adalah penyakit di mana sel-sel tumor ganas (kanker) berkembang di jaringan pankreas, yaitu organ di belakang perut bagian bawah dan di depan tulang belakang, yang membantu tubuh menggunakan dan menyimpan energi dari makanan dengan memproduksi hormon untuk mengontrol kadar gula darah dan enzim pencernaan untuk memecah makanan. Biasanya, kanker pankreas jarang terdeteksi pada tahap awal. Salah satu tanda seseorang mengalami kanker pankreas adalah diabetes, terutama jika itu bertepatan dengan penurunan berat badan yang cepat, penyakit kuning, atau rasa sakit di perut bagian atas yang menyebar ke punggung. Di antara berbagai jenis kanker, kanker pankreas memiliki tingkat kelangsungan hidup terendah, yaitu hanya sekitar 3-6% dari mereka yang didiagnosis yang dapat bertahan hidup selama lima tahun. Jika pasien didiagnosis tepat waktu untuk perawatan, peluang mereka untuk bertahan hidup akan meningkat. Terdapat penanda tumor yang biasa digunakan untuk mengikuti perkembangan kanker pankreas, yaitu CA 19-9 yang dapat diukur dalam darah. Orang sehat dapat memiliki sejumlah kecil CA 19-9 dalam darah mereka. Kadar CA 19-9 yang tinggi seringkali merupakan tanda kanker pankreas. Tetapi kadang-kadang, kadar tinggi dapat menunjukkan jenis kanker lain atau gangguan non-kanker tertentu, seperti sirosis dan batu empedu. Karena kadar CA 19-9 yang tinggi tidak spesifik untuk kanker pankreas, CA 19-9 tidak dapat digunakan dengan sendirinya untuk skrining atau diagnosis. Ini dapat membantu memantau perkembangan kanker dan efektivitas pengobatan kanker. Dalam studi ini, metode Kernel-based Support Vector Machine digunakan untuk mengklasifikasikan hasil tes darah CA19-9 menjadi dua bagian; data pasien yang didiagnosis dengan kanker pankreas atau pasien normal (tidak terdiagnosis kanker pankreas). Metode ini memperoleh akurasi sekitar 95%.
Pancreatic cancer is a disease in which malignant (cancerous) tumor cells develop in pancreatic tissue; organ behind the lower abdomen and in front of the spine, which helps the body use and store energy from food by producing hormones to control blood sugar levels and digestive enzymes to break down food. Usually, pancreatic cancer is rarely detected at an early stage. One sign of a person with pancreatic cancer is diabetes, especially if it coincides with rapid weight loss, jaundice, or pain in the upper abdomen that spreads to the back. Among various types of cancer, pancreatic cancer has the lowest survival rate of only about 3-6% of those diagnosed who can survive for five years. If patients are diagnosed on time for treatment, their chances of survival will increase. There is a tumor marker commonly used to follow the course of pancreatic cancer, namely CA 19-9 which can be measured in the blood. Healthy people can have small amounts of CA 19-9 in their blood. High levels of CA 19-9 are often a sign of pancreatic cancer. But sometimes, high levels can indicate other types of cancer or certain noncancerous disorders, including cirrhosis and gallstones. Because a high level of CA 19-9 is not specific for pancreatic cancer, CA 19-9 cannot be used by itself for screening or diagnosis. It can help monitor the progress of your cancer and the effectiveness of cancer treatment. In this study, the Kernel-based Support Vector Machine method is used to classify CA19-9 blood test results into two sections including data on patients diagnosed with pancreatic cancer or normal patients. This method will get an accuracy of around 95%.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library