Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 59707 dokumen yang sesuai dengan query
cover
Khadijah Takbiradzani
"Investor mempunyai tujuan untuk mendapatkan keuntungan setiap melakukan investasi. Saham adalah salah satu instrumen investasi yang menawarkan tingkat keuntungan yang menarik. Di Indonesia, saham sudah menjadi salah satu instrumen investasi yang populer. Namun, walaupun saham mempunyai keuntungan yang tinggi, saham juga mempunyai risiko yang tinggi. Hal ini disebabkan karena harga saham fluktuatif dan dipengaruhi oleh faktor-faktor yang rumit. Akibat dari harga saham yang fluktuatif, investor sulit untuk mendapatkan sebuah prediksi yang akurat. Jika investor dapat memprediksi pergerakan harga saham di masa depan, investor dapat membuat keputusan yang tepat untuk beli, jual, atau hold. Dalam skripsi ini digunakan tiga jenis data perusahaan berbeda yang tercatat di dalam Bursa Efek Indonesia dengan data historis dari tahun 2017 sampai 2018. Umumnya, investor menggunakan indikator teknikal untuk memprediksi pergerakan saham. Pada skripsi ini, sebanyak tujuh belas teknikal indikator digunakan dan indikator teknikal tersebut diproses ke dalam dua jenis pendekatan. Pendekatan pertama memanfaatkan nilai-nilai indikator teknikal dan pendekatan kedua menggunakan sifat-sifat tertentu dalam menggambarkan pergerakan saham. Dua jenis data tersebut dijadikan data input bagi model prediksi dengan menggunakan metode Fuzzy Kernel Robust C-Means yang mengkelompokkan data harga saham ke dalam dua kelas, yaitu naik atau turun. Pada skripsi ini digunakan sebanyak tiga jenis label kelas yang berbeda, yaitu label kelas berdasarkan harga harian penutupan saham, label kelas yang bergantung pada rata-rata harga mingguan penutupan saham, dan label kelas yang bergantung pada rata-rata keseluruhan harga penutupan saham.

Investors must achieve a goal to obtain benefit from every investment they made. Stock offers an interesting amount of benefit. In Indonesia, stock has becoming one of the most popular investment tools. Even though stock offers an interesting amount of benefit, stock is also have a high risk. The reason behind this is because stock movement has fluctuating nature and affected by complicated factors. Due to this situation, investors hardly obtain an accurate prediction. If investors could oversee the stock price movement, investors could make right decision whether to buy, sell, or hold. Three different companies stock price data listed in Bursa Efek Indonesia from 2017 to 2018 used in this undergraduate thesis. Investors usually use technical indicators to predict the stock price movement. In this undergraduate thesis, seventeen technical indicators are used and processed into two different approaches. The first approach use the values of technical indicators and the scond one utilizes certain criteria owned by each technical indicator in describing stock price movement. Both approaches are then used as input data for prediction model using the Fuzzy Kernel Robust C-Means method which classifies the stock price data into two classes, i.e. up and down. Three different class labels are used in this undergraduate thesis, i.e. day stock price movement class label, weekly average stock price movement class label, and whole average stock price movement class label.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ruhul Selsi
"Era revolusi industri 4.0 memberikan peluang bagi data science untuk membantu kepentingan masyarakat tidak hanya di bidang teknologi dan industri, tetapi juga di bidang kesehatan. Salah satu masalah di bidang kesehatan yaitu ketika mendiagnosis suatu penyakit dari hasil biopsi, CT-scan, maupun MRI-scan para tenaga medis akan kewalahan jika memeriksanya satu per satu. Oleh karena itu, penelitian ini menggunakan machine learning untuk membantu dunia kesehatan menyelesaikan masalah overload data saat mendiagnosis pasien. Penyakit yang digunakan dalam penelitian ini adalah kanker prostat, yaitu salah satu penyebab kematian tertinggi pada pria di negara Barat. Kanker prostat adalah tumor ganas yang tumbuh secara perlahan di dalam kelenjar prostat. Pada umumnya, kanker prostat stadium awal timbul tanpa adanya gejala dan berkembang dengan perlahan. Maka, sangat penting bagi pasien untuk mendeteksi dini penyakit kanker prostat, dengan melakukan pemeriksaan kadar Prostate Specific Antigen (PSA). Kadar PSA dalam darah diukur dalam satuan nanogram per milimeter (ng / mL) yang normalnya berada pada angka 4 – 7 ng/mL. Jika lebih dari itu, disarankan untuk melakukan tes lebih lanjut atau langsung melakukan biopsi (Kementerian Kesehatan Republik Indonesia, 2017). Tingkat keganasan kanker prostat dapat diukur dengan sistem pengelompokan gleason score dari hasil tes biopsi pasien. Penelitian ini bertujuan untuk memprediksi pasien mengidap kanker prostat atau tidak dengan menggunakan citra hasil biopsi pasien yang telah diperbesar yang diambil dari Prostate cANcer graDe Assessment (PANDA) Challenge 2020. Ekstraksi fitur dengan metode Gray Level Co-occurence Matrix (GLCM) akan membantu untuk mengubah data citra menjadi data numerik. Metode yang dipilih pada penelitian ini adalah Fuzzy Robust Kernel C-Means dengan akurasi 87,5 %.

The era of the industrial revolution 4.0 provides opportunities for data science to help the interests of society not only in technology and industry, but also in the health sector. One of the problems in the health sector is that when diagnosing a disease from the results of a biopsy, CT-scan, or MRI-scan, medical personnel will be overwhelmed if they check one by one. Therefore, this study uses machine learning to help the healthcare world solve the problem of data overload when diagnosing patients. The disease used in this study is prostate cancer, which is one of the leading causes of death in men in Western countries. Prostate cancer is a malignant tumor that grows slowly in the prostate gland. In general, early stage prostate cancer appears without symptoms and develops slowly. So, it is very important for patients to detect prostate cancer early, by checking the levels of the Prostate Specific Antigen (PSA). PSA levels in the blood are measured in units of nanograms per millimeter (ng / mL), which is normally 4 - 7 ng / mL. If it is more than that, it is advisable to carry out further tests or to immediately perform a biopsy (Ministry of Health of the Republic of Indonesia, 2017). The level of malignancy of prostate cancer can be measured by a system of grouping the gleason score from the results of the patient's biopsy test. This study aims to predict whether or not a patient has prostate cancer using enlarged biopsy images of patients taken from the Prostate Cancer GraDe Assessment (PANDA) Challenge 2020. Feature extraction using the Gray Level Co-occurrence Matrix (GLCM) method will help to change image data becomes numeric data. The method chosen in this study is Fuzzy Robust Kernel C-Means with an accuracy of 87.5%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rezki Aulia Putri
"Sinusitis adalah peradangan pada dinding sinus, yaitu rongga kecil yang terhubung dengan rongga udara dalam tulang tengkorak. Sinus terletak di belakang dahi, di dalam struktur tulang pipi, di kedua sisi hidung, dan di belakang mata. Sinusitis disebabkan oleh peradangan pada rongga hidung, tumbuhnya polip, alergi, dan hal lainnya yang dapat terjadi pada orang dewasa, remaja, bahkan anak-anak. Untuk mengklasifikasi jenis sinusitis, penulis menggunakan Fuzzy C-Means Berbasis Kernel yang merupakan pengembangan dari Fuzzy C-Means. Fuzzy C-Means mengelompokkan data menggunakan jarak Euclidean. Namun, jika data yang akan dipisahkan adalah data non linear, maka konvergensinya akan kecil dan membutuhkan waktu yang lama. Untuk menyelesaikan masalah ini dapat digunakan Fuzzy C-Means Berbasis Kernel yang menggunakan fungsi kernel untuk menggantikan jarak Euclidean. Metode ini memetakan objek dari ruang data ke ruang fitur yang berdimensi lebih tinggi, sehingga dapat mengatasi kelemahan FCM. Data yang digunakan adalah data penyakit sinusitis yang diperoleh dari laboratorium radiolog RSUPN Cipto Mangunkusumo, Jakarta. Karena data yang digunakan adalah data non linear, maka metode yang lebih cocok digunakan adalah Fuzzy C-Means Berbasis Kernel. Dengan menggunakan software Matlab diperoleh akurasi 100% dengan waktu mendekati 0 detik untuk Fuzzy C-Means Berbasis Kernel.

Sinusitis is an inflammation of the sinus wall, a small cavity interconnected through the airways in the skull bones. It is located on the back of the forehead, inside the cheek bone structure, on both side of the nose, and behind the eyes. Sinusitis is caused by infection, growth of nasal polips, allergies, and others. This condition can effect adults, teenagers, and even children. To classify sinusitis we used Kernel Based Fuzzy C-Means, which is the development of Fuzzy C-Means (FCM). FCM algorithm groups data using Euclidean distance. However, when non linear data is separated, the convergence is innacurate and need a long running time. To overcome this problem, a Kernel Based Fuzzy C-Means that use kernel functions as a substitute for Euclidean distance. It maps objects from data space to a higher dimention feature space, so they can overcome FCM deficiencies. Data that is used is sinusitis dataset obtained from the laboratory of radiology at Cipto Mangunkusumo National General Hospital, Jakarta. Because the data used is non-linear dataset, the more suitable method is Kernel Based Fuzzy C-Means. By using the Matlab software 100% accuracy is obtained and running time is close to 0 for Kernel Based Fuzzy C-Means.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Charista Christie Tjokrowidjaja
"Segmentasi merupakan sebuah proses yang penting dilakukan dalam menganalisa suatu citra. Dengan melakukan segmentasi, maka citra tersebut dapat dibagi menjadi beberapa bagian yang lebih sederhana yaitu bagian-bagian yang memiliki karakteristik visual yang serupa seperti warna, gerakan, dan tekstur. Fuzzy c-means (FCM) yang diperkenalkan oleh Dunn dan dikembangkan oleh Jim Bezdek, adalah algoritma yang populer digunakan dalam segmentasi citra karena algoritma ini mudah digunakan dan akurat. Lebih tepatnya, FCM sangatlah efektif digunakan untuk mensegmentasi citra yang tidak memiliki noise. Selain sensitif terhadap noise, FCM juga sensitif terhadap outliers. Berbagai macam metode telah ditemukan untuk mengatasi kelemahan dari algoritma FCM, salah satunya menggunakan metode robust FCM (RFCM). Dari hasil penelitian yang dilakukan, dapat dilihat hasil secara kuantitatifnya lebih baik dibandingkan dengan algoritma-algoritma FCM lain. Hasil percobaan menunjukkan modifikasi RFCM memberikan hasil yang lebih baik terutama untuk data iris.

Segmentation is an important process to analyze an image. With image segmentation, an image can be partitioned into several simpler parts, which is parts that have similar visual characteristics like colors, motions, and textures. Fuzzy c-means (FCM) is introduced by Dunn and developed by Jim Bezdek. FCM is a popular algorithm to be used on image segmentation because of its simplicity and accuracy. Moreover, FCM is highly effective to segment image that have no noise. Aside its sensitiveness to noise, FCM is also sensitive to outliers. Several methods are founded to overcome FCM’s weaknesses one of which is using robust FCM method. From research, quantitatively it’s result is better compared to other FCM algorithms. Reseach done shows that modified RFCM gives better result especially for iris data.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2014
S57576
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aldi Purwanto
"

Kanker merupakan salah satu penyakit dengan angka kematian tertinggi di dunia. Kanker adalah penyakit ketika sel-sel abnormal tumbuh tidak terkendali yang dapat menyerang organ tubuh yang berdampingan atau menyebar ke organ lain. Untuk mendiagnosis kanker paru-paru dapat dilakukan dengan pengambilan gambar rontgen, CT scan, dan biopsi jaringan paru. Tujuan dari penelitian ini adalah untuk memprediksi apakah pasien menderita kanker paru-paru atau tidak, dengan menggunakan data gambar CT scan mereka. Oleh sebab itu, dalam penelitian ini digunakan ekstraksi fitur dari gambar CT scan sebagai data untuk mengklasifikasi kanker paru-paru. Data yang digunakan merupakan data gambar CT scan yang didapat dari SPIE-AAPM Lung CT Challenge 2015. Gambar CT scan paru-paru dengan ukuran 512x512 sebelumnya dilakukan pre-processing 2D crop dan filtering. Dengan mengekstraksi fitur dari data gambar seperti ukuran nodul, Gray Level Co-occurrence Matriks (GLCM), dan Local Binary Pattern (LBP) dapat mengubah data gambar menjadi numerik. K-Fold Cross Validation digunakan untuk memisahkan data menjadi data training dan data testing. Fuzzy C-Means (FCM) dan Fuzzy Kernel C-Means (FKCM) diterapkan untuk pengklasifikasian. Didapatkan performa FKCM lebih baik dibandingkan FCM, dengan rata-rata akurasi 75.60%, precision 83.05%, dan specificity 87.80%. Oleh karena itu, penambahan kernel pada metode Fuzzy C-Means dapat meningkatkan performa dari metode tersebut


Cancer is one of the diseases with the highest mortality rate in the world. Cancer is a disease when abnormal cells grow out of control that can attack the body's organs side by side or spread to other organs. To diagnose lung cancer can be done by taking x-ray images, CT scans, and lung tissue biopsy. The purpose of this study is to classify whether patients have lung cancer or not using their CT scan image data. Therefore, in this study feature extraction from CT images was used as data to classify lung cancer. The data used in the form of CT scan image obtained from SPIE-AAPM Lung CT Challenge 2015. Previously, a CT scan of the lung with a size of 512x512 was pre-processed 2D crop and filtering. By extracting features from image data such as nodule size, Gray Level Co-occurrence Matrix (GLCM), and Local Binary Pattern (LBP) can convert image data to numeric. K-Fold Cross Validation is used to separate data into training data and testing data. Fuzzy C-Means (FCM) and Fuzzy C-Means (FKCM) are applied for classification. FKCM performed better than FCM, with 75.60% average accuracy, 83.05% average precision, and 87.80% average specificity. Therefore, adding a kernel to the Fuzzy C-Means method can improve the performance of the method.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ridhani Faradina
"Salah satu perkembangan dari teknologi terbaru adalah pengenalan wajah. Pengenalan wajah pada dasarnya dilakukan berdasarkan asumsi bahwa setiap individu memiliki identitas unik. Tetapi pada kenyataannya, akan ada individu yang memiliki wajah mirip dengan individu lainnya. Penelitian ini dilakukan untuk mendeteksi individu-individu yang mirip tersebut. Metode machine learning yang digunakan adalah Support Vector Machine dan Fuzzy Kernel C-Means dengan dua jenis kernel. Metode pemilihan fitur Chi-Square juga akan digunakan untuk mereduksi dimensi data sehingga waktu yang dibutuhkan lebih cepat. Data yang digunakan adalah data foto wajah yang diambil dari Look-Alike Face Database. Hasil yang diperoleh memperlihatkan bahwa kedua metode machine learning tersebut mampu untuk melakukan pengenalan wajah pada identifikasi kemiripan, dengan akurasi tertinggi yang diperoleh SVM sebesar 94 dan FKCM sebesar 74.

One of the latest technology developments is face recognition. Face recognition is basically done on the assumption that each individual has a unique identity. But in reality, there will be individuals who have faces similar to other individuals. This research was conducted to identify look alike faces. The machine learning methods used are Support Vector Machine and Fuzzy Kernel C Means with two types of kernel. The Chi Square feature selection method was also used to reduce the dimension of the data in order to achive lower running time. The data used are face photos taken from Look Alike Face Database. The results show that both machine learning methods were able to perform face recognition on identification of look alike faces, with the highest accuracy obtained by SVM is 94 and FKCM is 74 ."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nurrimah
"Globalisasi membawa dampak besar bagi pertumbuhan ekonomi Indonesia. Sejak tahun 1961, secara umum pertumbuhan ekonomi Indonesia selalu mengalami kenaikan. Banyak faktor yang menyebabkan meningkatnya pertumbuhan ekonomi nasional. Salah satunya adalah investasi. Terdapat berbagai macam instrumen investasi. Sekarang ini yang paling banyak diminati oleh masyarakat umum adalah investasi saham. Bursa Efek Indonesia (BEI) mencatat bahwa per Juni 2018 banyaknya investor pasar modal mencapai 1,12 juta Single Investor Identification (SID) dengan 710.000 Single Investor Identification (SID) merupakan total investor saham ritel. Saham menjadi salah satu usaha dalam pemenuhan kebutuhan hidup di masa depan. Daya tarik utamanya adalah karena saham memberikan potensi keuntungan yang tinggi dalam jangka panjang. Namun, dengan potensi keuntungan yang tinggi tersebut, saham juga memiliki potensi kerugian yang tinggi. Salah satu usaha untuk meminimalkan potensi kerugian saham adalah dengan melakukan prediksi harga saham menggunakan machine learning. Harga saham akan diprediksi menggunakan metode penyelesaian masalah regresi, yaitu Fuzzy Support Vector Regression (FSVR). Fungsi pemetaan dalam fungsi keanggotaan fuzzy digunakan untuk menghasilkan fluktuasi harga saham yang tepat. Untuk memastikan keefektifan dan keefisienan penggunaan fitur, Fisher Score digunakan untuk memilih fitur yang paling berpengaruh dan informatif dalam model prediksi sehingga kesalahan hasil prediksi dapat diminimalkan. Fitur-fitur terpilih tersebut akan dijadikan sebagai variabel input dalam model prediksi. Evaluasi hasil prediksi dari data dengan dan tanpa dilakukan pemilihan fitur selanjutnya akan dianalisis menggunakan Normalized Mean Square Error (NMSE) dan dibandingkan sebagai bagian dari evaluasi performa model prediksi. Dari hasil prediksi pada salah satu data yang digunakan, tanpa pemilihan fitur, diperoleh model terbaik dengan nilai NMSE terendah sebesar 0,179 dan persentase data training 80%, sedangkan dengan pemilihan fitur Fisher Score, diperoleh model terbaik menggunakan sembilan fitur dengan nilai NMSE terendah sebesar 0,011 dan persentase data training 90%.

Globalization has a big impact on Indonesias economic growth. Since 1961, in general Indonesias economic growth has always increased. Many factors have led to an increase in national economic growth. One of which is investment. There are many investment instruments. The most popular among the public is stock investment. Indonesia Stock Exchange (IDX) recorded as of June 2018 total of capital market investors reached 1,12 million Single Investor Identification (SID) with 710,000 Single Investor Identification (SID) representing total retail stock investors. Stock has become one of the activities to fulfill the needs of life in the future. Its main attraction is that stock provides high potential return of profit in long run. However, as high return of profit, stock also has high potential return of risks. One of the ways to minimize the potential return of risks is by predicting stock prices using machine learning. The stock prices will be predicted using a regression problem solving method, namely Fuzzy Support Vector Regression (FSVR). The mapping function in fuzzy membership function is used to produce the right stock price fluctuations. To ensure the effectiveness and the efficiency of using features, Fisher Score is used to select the most influential and informative features in the prediction model so that the prediction errors can be minimized. These selected features will be used as input variables in the stock price prediction model. The evaluation of the prediction results from the data with and without feature selection will be analyzed using Normalized Mean Square Error (NMSE) and compared as part of the performance evaluation of the prediction model. From the prediction results on one of data used, without doing feature selection, the best model is obtained with the lowest error is 0.179 and 80% training data, while with doing Fisher Score feature selection, the best model is obtained by using nine features with the lowest error is 0.011 and 90% training data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Frederica Yaurita
"Masalah kebangkrutan perusahaan asuransi telah menjadi perhatian khusus bagi pimpinan, karyawan, maupun nasabah perusahaan asuransi. Kekhawatiran ini muncul seiringan dengan dampak yang dapat ditimbulkan dari kebangkrutan perusahaan, yaitu perusahaan asuransi tidak mampu memenuhi kewajibannya kepada nasabah, sehingga uang premi yang telah dibayarkan oleh nasabah dalam jangka waktu tertentu menjadi sia-sia. Maka dari itu sebagai upaya untuk mencegah terjadinya kebangkrutan perusahaan asuransi, kami mencari suatu metode yang kiranya mampu mendeteksi kebangkrutan perusahaan asuransi dengan baik. Pada penelitian ini kami menggunakan beberapa algoritma machine learning, dan ternyata nilai akurasi dari simulasi program yang dilakukan mencapai 93.00 . Ini menunjukkan bahwa algoritma machine learning yang kami gunakan pada penelitian ini dapat dijadikan alat yang efektif untuk memprediksi kebangkrutan perusahaan asuransi.

Insolvency of insurance companies has been a concern of parties such as the management, the workers, and of course the consumers of insurance companies. This concern has arisen by the impact when an insurance companies got insolvent, that is, the company is unable to fulfil their obligations to customer. So, the premium that have paid by the customer becomes useless. As the attempt to prevent the insolvency of insurance company, we were looking for methods that able to make the insolvency prediction. In this study, we used several machine learning algorithms. The results are very encouraging and show that the algorithms can be a useful tool in this sector. We found that the algorithms achieved 93.00 accuracy rate."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Praditya Nugraha
"Salah satu metode otomatis untuk analisis data tekstual adalah deteksi topik. Fuzzy C- Means di Ruang Eigen (EFCM) adalah metode berbasis soft clustering untuk pendetek- sian topik. Pada Algoritme EFCM adanya reduksi dimensi data awal menjadi lebih kecil. Namun, proses reduksi itu dapat menghilangkan beberapa fitur penting dari data tekstual. Sehingga, akurasi dapat berkurang. Dalam mengatasi hilangnya fitur penting digunakan bantuan Kernelisasi Fuzzy C-Means di Ruang Eigen sehingga proses clustering dapat di- lakukan dalam ruang dimensi yang lebih tinggi. Dalam penelitian ini akan dicek akurasi dari metode EFCM dan KEFCM dan perbandingannya dengan metode standar seperti Latent Dirichlet Allocation (LDA) dan Nonnegative Matrix Factorization (NMF) dalam masalah pendeteksian topik. Simulasi menunjukkan bahwa KEFCM memberikan akurasi yang lebih baik dalam menemukan topik daripada metode standar LDA dan EFCM namun tidak lebih baik dari NMF untuk masalah mendeteksi topik berita online di Twitter.

One of automated methods for textual data analysis is topic detection. Fuzzy C-Means in Eigenspace (EFCM) is a soft clustering-based method for topic detection. In, EFCM Algorithm there is a step to transform high dimensional textual data into lower dimensional data. However, that transformation process may eliminate some important features from the textual data. Therefore, the accuracy may be reduced. To overcome in losing important features Kernelized Fuzzy C-Means in Eigenspace (KEFCM) is needed, so that clustering process can be done in higher dimensional space. In this study the accuracy of EFCM and KEFCM will be evaluated and these methods will be compared by any standard method such as Latent Dirichlet Allocation (LDA) and Nonnegative Matrix Factorization (NMF) for topic detection problem. Simulations show that KEFCM gives better accuracy to find topics than LDA and EFCM method. However, these methods fail to give better results than NMF for the problem of sensing trending topic in online news in Twitter."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nedya Shandri
"Penyakit kronis adalah penyakit yang diderita dalam waktu panjang dan dapat berkembang secara cepat, salah satunya adalah penyakit kanker dan diabetes. Oleh karena itu, dengan melakukan pendeteksian dini maka perkembangan penyakit kanker dan diabetes akan menurun. Salah satu cara pendektesian dini dapat dilakukan oleh machine learning. Teknik machine learning banyak digunakan dalam berbagai bidang khususnya untuk analisa data medis.  Clustering merupakan salah satu metode dari machine learning yang bertujuan untuk mengelompokkan suatu dataset ke dalam subset berdasarkan ukuran jarak. Salah satu contoh metode clustering adalah metode Entropi Fuzzy C-Means yang dapat mengidentifikasi entropi disetiap titik data dan memilih pusat kluster terdekat dengan entropi minimum. Pada penelitian akan digunakan data kanker dan diabetes dari UCI Repository dengan menggunakan metode Entropi Fuzzy C-Means yang akan dimodifikasi dengan kernel RBF. Sebelum dilakukan klasifikasi, dilakukan pemilihan fitur menggunakan Chi-Square. Tujuan dari penelitian ini adalah untuk mendapatkan fitur-fitur yang optimal dan mengetahui hasil akurasi menggunakan untuk klasifikasi data diabetes dan kanker. Diperoleh hasil akurasi tertinggi pada klasifikasi data medis menggunakan metode Entropi Fuzzy C-Means berbasis kernel dengan pemilihan fitur Chi-Square yaitu sebesar 83.33% untuk data diabetes dan 77.77-100% untuk data kanker.

Chronic disease is a disease that occur for a long time and can develop quickly, one of them is cancer and diabetes. The early detection is very helpful to reduce the development of the disease. One of the ways to detect cancer and diabetes disease is using machine learning technic. Machine learning technic is widely use in many aspects especially in medical data analysis. Clustering is part of machine learning technic that is used to group a dataset into subset based on space size. Entropy Fuzzy C-Means is one of the methods which can identify entropy in every data and can choose the cluster center similar with minimum entropy. In this paper we will use cancer and diabetes medical data from UCI Repository using Entropy Fuzzy C-Means method which is modified by kernel RBF. Before classification, we will select the feature using Chi-Square  to get the optimal subset feature. The purpose of this study was to obtain optimal features and find out the results of accuracy using for the classification of diabetes and cancer data. The medical data classification using Entropy Fuzzy C-Means based on kernel with Chi-Square feature selection gives the 100% highest accuration result for cancer data and 83,33% for diabetes data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>