Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 155343 dokumen yang sesuai dengan query
cover
Muhammad Ghazy
"Indonesia merupakan salah satu negara dengan produksi tanaman padi terbesar di dunia dengan total lebih dari 150 juta ton padi dihasilkan pada 3 tahun terakhir. Meskipun sudah menjadi makanan pokok selama bertahun-tahun, tanaman padi tidak luput dari serangan penyakit yang dapat menghambat produksi beras padi. Berbagai macam penyakit dapat menghambat produksi beras padi di Indonesia. Daun tanaman padi yang terkena serangan penyakit dapat digunakan sebagai indikator jenis penyakit dikarenakan setiap penyakit tanaman padi memiliki corak yang unik pada daun tanaman padi. Dari citra daun tanaman padi yang didapat, dilakukan transformasi format citra ke dalam format grayscale untuk dibentuk Gray Level Co-occurence Matrix (GLCM) untuk beberapa sudut. Fitur Haralick kemudian diekstraksi dari GLCM yang sudah didapatkan untuk mendapatkan fitur-fitur yang dapat menjelaskan citra daun tanaman padi tersebut. Metode ini dapat digunakan dikarenakan fitur Haralick dalam GLCM mampu menangani citra yang memiliki perbedaan tekstur dengan baik dan citra daun penyakit tanaman padi memiliki perbedaan pada tekstur daun yang cukup jelas dilihat. Sehingga dapat dikatakan bahwa metode ini cocok untuk digunakan pada kasus ini. Dengan jumlah fitur Haralick yang cukup banyak, Linear Discriminant Analyis (LDA) kemudian diaplikasikan kepada fitur-fitur Haralick sebagai metode reduksi dimensi sedemikian sehingga fitur baru yang didapatkan memiliki separasi yang lebih baik. Kemudian, Support Vector Machine (SVM) digunakan sebagai classifier dalam mengklasifikasi penyakit tanaman padi menggunakan fitur LDA yang sudah didapatkan.

Indonesia is one of the world’s leading rice producers with a total of more than 150 million tons of rice produced in the last three years . Rice plants, despite being a staple crop for many years, are susceptible to diseases that can hamper rice production.  Because each diseases of rice plants has a distinctive pattern on the leaves of rice plants, the leaves of diseased rice plants can be used as indicators of the type of disease. The picture format of the rice leaf is converted to grayscale in order to create a Gray Level Co-occurence Matrix (GLCM) at multiple angles. The Haralick feature is extracted from the GLCM to obtain features that can describe the image of the rice plant leaf. Because the Haralick feature in GLCM can handle images with diverse textures and the image of leaves of rice plant diseases has differences in leaf texture that are clearly apparent, this method can be used. With a large number of Haralick features, the Linear Discriminant Analysis (LDA) is used as a dimension reduction technique for the Haralick features, resulting in better separation of the new features. The Support Vector Machine (SVM) is used as a classifier to classify rice plant diseases based on the obtained LDA features."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Putri Utami
"[ABSTRAK
Kanker payudara adalah tumor ganas yang tumbuh akibat pertumbuhan sel-sel
jaringan yang tidak normal pada jaringan payudara. Kanker payudara pada wanita
merupakan penyakit yang kini paling banyak diderita dibandingkan jenis kanker
lainnya. Cara yang dilakukan agar penyakit ini tidak memiliki kesempatan untuk
menyebar adalah dengan mendeteksinya sedini mungkin dengan menggunakan
mammografi.
Pada penelitian ini penulis telah merancang suatu sistem yang menggunakan
komputer untuk mendeteksi dan mengklasifikasi kanker payudara pada citra
mammogram. Citra mammogram yang digunakan adalah citra mammogram dari
Mommographic Image Analysis Society (MIAS) yang terdiri dari 322 citra.
Pengolahan awal citra pada sistem ini menggunakan metode Otsu Thresholding,
pendeteksian tepi dengan menggunakan metode Canny, dan metode dilasi. Ciri
yang digunakan pada sistem ini adalah Gray Level Co-occurrence Matrix
(GLCM) dan Discrete Wavelet Transform (DWT). Metode pengklasifikasian yang
digunakan pada penelitian ini adalah Support Vector Machine (SVM).
Sistem memiliki ketahanan yang baik terhadap noise salt and pepper pada nilai
noise tertentu pada tiap jenis citra mammogram yang digunakan. Tingkat
keakuratan berkisar 80% pada saat diberi noise sebesar -16dB pada citra
mammogram jinak dan ganas. Keakuratan sistem juga teruji cukup baik untuk
jumlah data latih yang hanya sebesar 70% dimana tingkat keakuratan
pendeteksian dan pengklasifikasian adalah sebesar 80,6%.

ABSTRACT
Breast cancer is a malignant tumor that grows as a result of the growth of tissue
cells that are not normal in the breast tissue. Breast cancer in women is a disease
that is now the most common cancer than other types. How that is done so that the
disease does not have a chance to spread is to detect it as early as possible by
using mammography.
In this study, the authors have designed a system that uses a computer to detect
and classify breast cancer on a mammogram image. Mammogram image has been
taken from Mommographic Image Analysis Society (MIAS) which consists of 322
images. Initial processing images on this system using Otsu Thresholding, edge
detection using Canny method, and the method of dilation. Features used in this
system is the Gray Level Co-occurrence Matrix (GLCM) and Discrete Wavelet
Transform (DWT). Claassification method was used in this study is Support
Vector Machine (SVM).
The system has good resistance to salt and pepper noise on certain noise value for
each type of mammogram image are used. The accuracy range was 80% when
given the noise of -16dB on mammogram images of benign and malignant. The
accuracy of the system was also tested well enough for the amount of training data
that only 70% where the level of detection and classification accuracy is 80,6 %.;Breast cancer is a malignant tumor that grows as a result of the growth of tissue
cells that are not normal in the breast tissue. Breast cancer in women is a disease
that is now the most common cancer than other types. How that is done so that the
disease does not have a chance to spread is to detect it as early as possible by
using mammography.
In this study, the authors have designed a system that uses a computer to detect
and classify breast cancer on a mammogram image. Mammogram image has been
taken from Mommographic Image Analysis Society (MIAS) which consists of 322
images. Initial processing images on this system using Otsu Thresholding, edge
detection using Canny method, and the method of dilation. Features used in this
system is the Gray Level Co-occurrence Matrix (GLCM) and Discrete Wavelet
Transform (DWT). Claassification method was used in this study is Support
Vector Machine (SVM).
The system has good resistance to salt and pepper noise on certain noise value for
each type of mammogram image are used. The accuracy range was 80% when
given the noise of -16dB on mammogram images of benign and malignant. The
accuracy of the system was also tested well enough for the amount of training data
that only 70% where the level of detection and classification accuracy is 80,6 %., Breast cancer is a malignant tumor that grows as a result of the growth of tissue
cells that are not normal in the breast tissue. Breast cancer in women is a disease
that is now the most common cancer than other types. How that is done so that the
disease does not have a chance to spread is to detect it as early as possible by
using mammography.
In this study, the authors have designed a system that uses a computer to detect
and classify breast cancer on a mammogram image. Mammogram image has been
taken from Mommographic Image Analysis Society (MIAS) which consists of 322
images. Initial processing images on this system using Otsu Thresholding, edge
detection using Canny method, and the method of dilation. Features used in this
system is the Gray Level Co-occurrence Matrix (GLCM) and Discrete Wavelet
Transform (DWT). Claassification method was used in this study is Support
Vector Machine (SVM).
The system has good resistance to salt and pepper noise on certain noise value for
each type of mammogram image are used. The accuracy range was 80% when
given the noise of -16dB on mammogram images of benign and malignant. The
accuracy of the system was also tested well enough for the amount of training data
that only 70% where the level of detection and classification accuracy is 80,6 %.]"
2015
T42928
UI - Tesis Membership  Universitas Indonesia Library
cover
Nurlia Angie Darmawan
"Di dunia kesehatan, tenaga medis dituntut untuk mengatasi berbagai jenis penyakit dengan gejala yang beragam. Oleh karena itu, diperlukan suatu teknologi untuk membantu mereka menyelesaikannya dengan baik. Penelitian ini mendukung mereka dengan menggunakan machine learning sebagai pemecah masalah. Metode machine learning yang digunakan pada penelitian ini adalah metode klasifikasi. Penulis membahas tentang stroke yang merupakan salah satu penyakit dengan angka kematian tertinggi di dunia. Penelitian ini mengamati perubahan densitas pada otak penderita stroke iskemik. Stroke iskemik merupakan salah satu jenis stroke yang terjadi ketika pembuluh darah tersumbat oleh trombus atau emboli. Penelitian ini menggunakan data CT scan dari Departemen Radiologi, Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Data yang berupa citra CT scan diubah menjadi data numerik dengan metode Gray Level Co-Occurrence Matrix dan Local Binary Pattern yang dibandingkan performanya pada saat melakukan proses klasifikasi. Penelitian ini menerapkan Support Vector Machines sebagai metode klasifikasi. Didapatkan hasil bahwa Support Vector Machines dengan Local Binary Pattern menghasilkan performa yang lebih baik dibandingkan Support Vector Machines dengan Gray Level Co-Occurrence Matrix.
In the health sector, the medical staffs are challenged to overcome many types of diseases with various symptoms. Therefore, a technology is needed to help them solving it well. This study is supporting them by using a machine learning as the problem solver. The machine learning method that is used in this study is classification method. The author discusses about stroke which is one of the diseases with the highest mortality rate in the world. This study observed the density changes in the brain of ischemic stroke sufferers. Ischemic stroke is one of the stroke types that occurs when the arteries are blocked by thrombus or embolism. This study used data of CT scan from Department of Radiology, Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The image data of the CT scan is changed into a numerical data by using the Gray Level Co-Occurrence Matrix method and the Local Binary Pattern which is being compared when processing the classification. This study applies Support Vector Machines as the classification method. The results showed that Support Vector Machines with Local Binary Pattern has a better performance than Support Vector Machines with Gray Level Co-Occurrence Matrix."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Alifah
"Diabetes Melitus (DM) merupakan gangguan sistem metabolik akibat pankreas tidak memproduksi cukup insulin atau tubuh tidak mampu menggunakan insulin yang ada secara efektif. Menderita diabetes dalam jangka waktu panjang dapat mengakibatkan berbagai macam komplikasi salah satu di antaranya adalah Retinopati diabetik. Retinopati diabetik  adalah kelainan pada bagian mata yang disebabkan oleh adanya kerusakan dan penyumbatan pada pembuluh darah di bagian belakang mata (retina). Pada penelitian kali ini akan di gunakan data retinopati diabetik dengan menggunakan metode seleksi fitur Recursive Feature Elimination (RFE) dan Chi-Square dan akan di klasifikasi menggunakan Support Vector Machine.

Diabetic retinopathy is one of the complication of diabetes, which is an eye disease that can cause blindness. Its happen because of damage of retina as a result of the long illness of diabetic melitus. People usually do research using image data in diabetic patients. This paper present about diabetic retinopathy will extracting with feature selection. In this study, we use data diabetic patients who will be extracted with a feature selection method. Feature selection used in this study is Recursive Feature Elimination (RFE) and Chi-Square. For classification of diabetic retinopathy has been done by Support Vector Machine (SVM). From the experimental result with various tunning hyperparameters, the classification model can obtain the accuracy between 97%-100% for both methods."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ahmad Ihsan Farhani
"Indonesia menempati posisi kedua sebagai negara penghasil karet alami di dunia. Karet alami memiliki nama lain yaitu lateks. Belakangan ini produksi lateks di Indonesia menurun. Salah satu faktor penyebab menurunnya produksi lateks Indonesia adalah penyakit gugur daun. Jamur Pestalotiopsis sp. adalah salah satu jamur yang dapat menyebabkan penyakit gugur daun. Penyakit gugur daun yang disebabkan oleh jamur ini pertama kali terjadi di Indonesia pada tahun 2016 di Sumatera Utara. Penyakit tersebut menyebabkan tanaman karet menggugurkan daun sebelum waktunya sehingga menyebabkan produksi lateks berkurang. Cadangan makanan pohon karet lebih banyak dialokasikan untuk menumbuhkan kembali daun yang telah gugur dibanding untuk memproduksi lateks. Luas lahan pohon karet di Indonesia yang terinfeksi penyakit gugur daun Pestalotiopsis sp. sudah mencapai 30.328,84 hektar pada tahun 2021 menyebabkan penurunan produksi lateks hingga 30%. Pendeteksian penyakit gugur daun dapat dilakukan secara morfologi yaitu dengan pegamatan pada daun. Gejala penyakit gugur daun yang disebabkan oleh Pestalotiopsis sp. adalah munculnya bintik cokelat pada tulang daun yang lama kelamaan berkembang menjadi bintik cokelat gelap. Bintik tersebut kemudian membesar, menyebabkan daerah di sekitar daun mengalami nekrosis kemudian gugur. Kekurangan dari pendeteksian secara morfologi adalah memerlukan waktu dan tenaga yang cukup besar, serta keahlian khusus di bidang tanaman karet. Dalam penelitian ini, akan dilakukan pendeteksian penyakit gugur daun yang disebabkan oleh jamur Pestalotiopsis sp. dengan bantuan machine learning untuk mengurangi tenaga dan waktu yang diperlukan dalam mendeteksi penyakit gugur daun. Model machine learning akan menerima input data citra daun tanaman karet. Model yang digunakan dalam pendeteksian adalah k-means clustering untuk mensegmentasi data citra daun karet, convolutional autoencoder untuk melakukan fitur ekstraksi pada data citra hasil segmentasi dan suppport vector machine sebagai classifier. Dari hasil eksperimen dengan 5 kali percobaan didapat accuracy testing sebesar 62,91%, accuracy training sebesar 78,50%. Accuracy testing dan accuracy training memiliki perbedaan yang cukup signifikan menandakan model mengalami overfitting. Overfitting terjadi ketika dataset yang tersedia hanya sedikit, pada penelitian ini yaitu 257 data citra namun, model yang dilatih kompleks. Sehingga diperlukan penambahan data citra untuk menghindari overfitting dan meningkatkan accuracy dari model.

Indonesia occupy the second position as a natural rubber producing country in the world. Natural rubber has another name, namely latex. Recently, latex production in Indonesia has declined. One of the factors causing the decline in Indonesian latex production is leaf fall disease. The fungus Pestalotiopsis sp. is one of the fungi that can cause leaf fall disease. Leaf fall disease caused by this fungus first occurred in Indonesia in 2016 in North Sumatra. The disease causes rubber plants to drop their leaves prematurely, causing reduced latex production. Rubber tree food reserves are allocated more to regrow fallen leaves than to produce latex. The area of rubber trees in Indonesia infected with the Pestalotiopsis sp. leaf fall disease. has reached 30,328.84 hectares in 2021 causing a decline in latex production by up to 30%. Disease detection can be done morphologically by observing the leaves. Symptoms of leaf fall disease caused by Pestalotiopsis sp. is the appearance of brown spots on the veins of the leaves which over time develop into dark brown spots. These spots then enlarge, causing the area around the leaves to experience necrosis and then fall. The drawback of morphological detection is that it requires a lot of time and effort, as well as special expertise in the field of rubber plantations. In this research, we will detect leaf fall disease caused by the fungus Pestalotiopsis sp. with the help of machine learning to reduce the effort and time needed to detect leaf fall disease. The machine learning model will be using image of rubber plant leaves as input data. The model used in the detection is k-means clustering to segment rubber leaf image data, convolutional autoencoder to perform feature extraction on segmented image data and support vector machine as a classifier. From the experimental results with 5 trials obtained testing accuracy of 62.91%, training accuracy of 78.50%. Accuracy testing and accuracy training have significant differences indicating that the model is overfitting. Overfitting occurs when the available dataset is only a few, namely 257 image data but the model being trained is complex. So it is necessary to add image data to avoid overfitting and increase the accuracy of the model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Amanda Rizki Bagasta
"ABSTRAK

Infark Serebri adalah kondisi dari suatu jaringan otak yang tidak teralirkan darah sehingga sel-sel otak tersebut kekurangan oksigen dan nutrisi. Hal ini dapat mengakibatkan kerusakan bahkan kematian sel-sel otak dan perlu dengan segera mendapatkan penanganan. Keadaan ini sering dikenal sebagai Stroke, dimana pada penulisan ini akan berfokus pada data stroke nonhemoragik (stroke tidak berdarah) yang diakibatkan penyumbatan pembuluh darah di otak. Biasanya penyakit ini dapat dikenali dari gejala kelumpuhan suatu bagian tubuh atau kesulitan menggunakan suatu alat indra. Menurut para ahli, penyakit ini harus dicegah sejak dini karena dapat berakibat fatal bagi keseluruhan fungsional tubuh. Salah satu tindakan yang dapat dilakukan sejak dini adalah mendeteksi kemungkinan penyakit agar dapat dilakukan penanganan secara tepat dan cepat. Dalam penelitian ini, Infark Serebri dideteksi dengan mengklasifikasi ada atau tidaknya sel abnormal pada jaringan otak pada hasil CT Scan otak pasien menggunakan Support Vector Machine dengan Seleksi Fitur RELIEF. Data yang digunakan berupa data numerik dari pasien yang melakukan pemeriksaan di RSUPN dr. Cipto Mangunkusumo Jakarta dalam bentuk hasil CT Scan otak. Terdapat Sembilan fitur indikator yang digunakan dan diproses dengan membandingkan Support Vector Machine dengan dan tanpa seleksi fitur RELIEF. Berdasarkan hasil uji coba, metode yang diusulkan mampu mencapai akurasi sebesar 95,23%. Sehingga, penggunaan seleksi fitur RELIEF pada SVM merupakan metode yang baik untuk menklasifikasi infark serebri.


ABSTRACT

 


The Cerebrovascular Infarction is a condition of an inflowed blood of brain tissue so that the brain cells lack oxygen and nutrients. This can cause the damage and even the death of brain cells and needed to get immediate treatment. This situation is often known as stroke, which at this writing will fokus on data on non-hemoragic strokes (non-bleeding strokes) caused by blockage of blood vessels in the brain. Usually this disease can be identified by symptoms of paralysis of some body part or difficulty using a human sensory. According to the experts, this disease must be prevented early because it can be fatal to the overall functional body. One of the actions that can be done early is to detect the possibility of a disease so that it can be handled appropriately and quickly. In this study, the cerebral infarction was detected by classifying the presence or absence of abnormal cells in brain tissue in the results of a CT brain scan of patients using Support Vector Machine with the RELIEF Selection Feature. The data used in the form of numerical data reports from patients who performed examinations at the RSUPN dr. Cipto Mangunkusumo Jakarta in the form of brain CT Scan. There are nine indicator features that are used and processed by comparing Support Vector Machine with and without RELIEF feature selection. Based on the results, the proposed method is able to achieve accuracy value of 95,23%. Thus, the use of RELIEF feature selection with SVM is a good method for classifying cerebral infarction.

 

"
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Arfiani
"Stroke merupakan penyakit yang menempati urutan ketiga sebagai penyebab kematian terbesar di dunia setelah penyakit jantung dan kanker. Stroke juga menduduki posisi pertama sebagai penyakit yang dapat menyebabkan kecacatan, baik ringan maupun berat. Salah satu jenis stroke yang umum terjadi adalah infark serebri. Di Indonesia, jumlah penderita stroke, terutama infark serebri, semakin meningkat setiap tahunnya. Tidak hanya terjadi pada seseorang yang berusia lanjut, namun infark serebri juga dapat terjadi pada seseorang yang masih muda dan produktif. Oleh sebab itu, pendeteksian dini terhadap infark serebri sangatlah penting. Berbagai metode medis selalu digunakan untuk mengklasifikasi infark serebri, namun dalam penelitian ini, akan digunakan metode machine learning. Metode yang diusulkan yaitu Multiple Support Vector Machine dengan Seleksi Fitur Information Gain (MSVM-IG). MSVM-IG merupakan metode baru yang menggunakan support vector sebagai data baru untuk selanjutnya dilakukan seleksi fitur dan evaluasi performa. Data yang digunakan berupa data numerik hasil CT Scan yang diperoleh dari RSUPN dr. Cipto Mangunkusumo, Jakarta. Berdasarkan hasil uji coba, metode yang diusulkan mampu mencapai nilai akurasi sebesar 88,71%. Sehingga, metode MSVM-IG ini dapat menjadi salah satu alternatif untuk membantu praktisi medis dalam mengklasifikasi infark serebri.

Stroke is a disease that ranks third as the biggest cause of death in the world after heart disease and cancer. Stroke also occupies the first position as a disease that can cause disability, both mild and severe. One type of stroke that is common is cerebral infarction. In Indonesia, the number of stroke patients, especially cerebral infarction, is increasing every year. Not only occurs in someone who is elderly, but cerebral infarction can also occur in someone who is young and productive. Therefore, early detection of cerebral infarction is very important. Various medical methods are always used to classify cerebral infarction, but in this study, machine learning methods would be used. The proposed method is Multiple Support Vector Machine with Information Gain Feature Selection (MSVM-IG). MSVM-IG is a new method that uses support vector as a new dataset, then feature selection step and performance evaluation are performed. The data used in the form of numerical data results of CT scan obtained from RSUPN Dr. Cipto Mangunkusumo, Jakarta. Based on the results, the proposed method is able to achieve an accuracy value of 88.71%. Thus, the MSVM-IG could be an alternative to assist medical practitioners in classifying cerebral infarction."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Melati Vidi Jannati
"Klasifikasi data kanker menggunakan microarray data menjadi salah satu cara untuk mendapatkan pengobatan yang lebih tepat. Kendala yang terdapat adalah karakteristik dari microarray yang memiliki fitur yang sangat banyak. Seringkali fitur tersebut tidak begitu informatif bagi pengklasifikasian sehingga perlu adanya suatu cara untuk memilih fitur-fitur yang mengandung informasi yang penting. Salah satu cara tersebut adalah dengan pemilihan fitur. Pada penelitian ini, metode pemilihan fitur yang digunakan berdasarkan clustering dengan fungsi kernel. Fitur-fitur yang sudah terpilih kemudian diklasifikasikan menggunakan metode Support Vector Machine.
Evaluasi dari klasifikasi pada penelitian ini melibatkan K-Fold Cross Validation, metode tersebut akan membagi data secara acak, tetapi merata sehingga akurasi yang didapat juga merata. Hasil akurasi tersebut dilakukan dengan berbagai uji terhadap parameter yang berkaitan seperti K partisi, nilai dan fitur-fitur yang digunakan. Pada proses klasifikasi tanpa pemilihan fitur tingkat akurasinya mencapai 89.68 dengan k partisi sebanyak 6 sementara dengan 5 fitur akurasinya menjadi 95.87 pada partisi sebanyak 10.

Classification of cancer using microarray data is one way to get a more precise treatment. The obstacle on classification data is the characteristics of microarray data that is having many features. These features are often not so informative for classification, so it needs a way to select the features that contain important information. One way is by selection feature. In this research, the method of selection features that are used based on clustering with kernel function. Features that are already selected then classified using Support Vector Machine.
Evaluation of classification in this research involves a K Fold Cross Validation, that methods split data randomly but uniformly so that it can reach all of accuracy. The results of accuracy data was done with different test against related parameters such as K partition, the value of and the features that are used. On the classification process without selection features rate of accuracy reached on 89.68 with k partition number 6 while with the 5 features obtained 95.87 on partition number 10.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
S66852
UI - Skripsi Membership  Universitas Indonesia Library
cover
Vinezha Panca
"ABSTRAK
Kanker merupakan salah satu penyebab kematian terbesar di seluruh dunia. Secara khusus, kanker otak adalah kanker yang terjadi pada sistem saraf pusat. Salah satu hal yang dapat dilakukan untuk penelitian kanker otak menggunakan machine learning adalah melakukan pendeteksian jenis kanker otak dengan memanfaatkan microarray data. Permasalahan tersebut merupakan masalah klasifikasi multikelas. Dengan menggunakan pendekatan one versus one, akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Karena data kanker otak memiliki fitur yang sangat banyak, perlu dilakukan seleksi fitur. Pada penelitian ini, akan diimplementasikan metode Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM-RFE sebagai metode seleksi fitur, dan Twin Support Vector Machine TWSVM sebagai metode klasifikasi. Pada metode MMSVM-RFE dilakukan pelatihan SVM-RFE pada setiap masalah dua kelas, sehingga setiap masalah dua kelas memiliki pengurutan fitur masing-masing. Sebagai metode klasifikasi, TWSVM memiliki tujuan untuk mencari hyperplane masing ndash; masing kelas sedemikian sehingga data kelas satu sedekat mungkin terhadap suatu hyperplane namun sejauh mungkin dengan hyperplane lainnya. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel linear pada TWSVM adalah 95,33 dengan menggunakan 200 fitur. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel RBF pada TWSVM adalah 87 dengan 70 fitur. Sedangkan apabila proses validasi juga dilakukan pada seleksi fitur, rata-rata akurasi tertinggi yang diperoleh adalah 90,67 dengan menggunakan 90 fitur.

ABSTRACT
Cancer is one of main causes of death worldwide. Brain cancer is a type of cancer which occurs at central nervous system. Taking advantage from microarray data, machine learning methods can be applied to help brain cancer prediction according to its types. This problem can be referred as a multiclass classification problem. Using one versus one approach, the multiclass problem with k classes can be transformed into k k 1 2 binary class problems. The huge amount of features makes it necessary to use feature selection. In this research, Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM RFE method is implemented as the feature selection method, and Twin Support Vector Machine TWSVM method is implemented as the classification method. The main concept of MMSVM RFE is to train SVM RFE at each binary problem so that each binary problem will have their own arrangements of feature. As a classification method, TWSVM is trained to find two hyperplanes, each representative of its own class. The data of one class must be as near as possible from its representative hyperplane while also must be as far as possible from the other hyperplane. In the simulation which uses linear kernel on MMSVM RFE and linear kernel on TWSVM, the highest average accuracy is 95,33 , using 200 features. In the simulation which uses linear kernel on MMSVM RFE and RBF kernel on TWSVM, the highest average accuracy is 87 , using 70 features. In the case where the feature selection process is included in doing validation, the highest average accuracy is 90,67 , using 90 features."
2016
S66302
UI - Skripsi Membership  Universitas Indonesia Library
cover
Selly Anastassia Amellia Kharis
"Kanker merupakan kelompok penyakit yang ditandai dengan pertumbuhan dan penyebaran sel-sel abnormal yang tidak terkendali. Jika penyebaran sel tersebut tidak terkendali, hal ini dapat menyebabkan kematian. Berdasarkan American Cancer Society, pendeteksian dini terhadap sel kanker dapat meningkatkan angka harapan hidup seorang pasien lebih dari 97 . Banyak penelitian yang telah meneliti mengenai klasifikasi kanker menggunakan microarray data. Microarray data terdiri dari ribuan fitur gen namun hanya memiliki puluhan atau ratusan sampel. Hal tersebut dapat menurunkan akurasi klasifikasi sehingga perlu dilakukannya pemilihan fitur sebelum proses klasifikasi.
Pada penelitian ini dilakukan dua tahap pemilihan fitur. Pertama, support vector machine recursive feature elimination SVM-RFE digunakan untuk prefilter gen. Kedua, hasil pemilihan fitur SVM-RFE diseleksi kembali dengan menggunakan artificial bee colony ABC yang merupakan algoritma optimisasi berdasarkan perilaku lebah madu. Penelitian ini menggunakan dua dataset, yaitu data kanker paru-paru Michigan dan Ontario dari Kent Ridge Biomedical Dataset.
Hasil percobaan dengan menggunakan SVM-RFE dan ABC menunjukkan nilai akurasi klasifikasi yang lebih tinggi daripada tanpa pemilihan fitur, SVM-RFE, dan ABC, yaitu 98 untuk data kanker paru-paru Michigan dengan menggunakan 100 fitur dan 97 untuk data kanker paru-paru Ontario dengan menggunakan 70 fitur.

Cancer is a group of diseases characterized by the uncontrolled growth and spread of abnormal cells. If the spread is not controlled, it can result in death. Based on American Cancer Society, early detection of cancerous cells can increase survival rates for patients by more than 97 . Many study showed new aspect of cancer classification based microarray data. Microarray data are composed of many thousands of features genes and from tens to hundreds of instances. It can decrease classification accuracy so feature selection is needed before the classification process
In this paper, we propose two stages feature selection. First, support vector machine recursive feature elimination recursive feature elimination SVM RFE is used to prefilter the genes. Second, the SVM RFE features selection result is selected again using Artificial Bee Colony ABC which is an optimization algorithm based on a particular intelligent behavior of honeybee swarms. This research conducted experiments on Ontario and Michigan Lung Cancer Data from Kent Ridge Biomedical Dataset.
Experiment results demonstrate that this approach provides a higher classification accuracy rate than without feature selection, SVM RFE, and ABC, 98 for Michigan lung cancer dataset with using 100 features and 97 for Ontario lung cancer dataset with using 70 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49733
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>