Hasil Pencarian

Ditemukan 171297 dokumen yang sesuai dengan query

Muhammad Ghazy

Klasifikasi Penyakit Tanaman Padi Menggunakan Ekstraksi Fitur Haralick pada Gray Level Co-occurrence Matrix Dan Metode Klasifikasi Support Vector Machine = Classification Of Rice Diseases Using Haralick Feature Extraction On Gray Level Co-occurrence Matrix And Support Vector Machine Classification Method

"Indonesia merupakan salah satu negara dengan produksi tanaman padi terbesar di dunia dengan total lebih dari 150 juta ton padi dihasilkan pada 3 tahun terakhir. Meskipun sudah menjadi makanan pokok selama bertahun-tahun, tanaman padi tidak luput dari serangan penyakit yang dapat menghambat produksi beras padi. Berbagai macam penyakit dapat menghambat produksi beras padi di Indonesia. Daun tanaman padi yang terkena serangan penyakit dapat digunakan sebagai indikator jenis penyakit dikarenakan setiap penyakit tanaman padi memiliki corak yang unik pada daun tanaman padi. Dari citra daun tanaman padi yang didapat, dilakukan transformasi format citra ke dalam format grayscale untuk dibentuk Gray Level Co-occurence Matrix (GLCM) untuk beberapa sudut. Fitur Haralick kemudian diekstraksi dari GLCM yang sudah didapatkan untuk mendapatkan fitur-fitur yang dapat menjelaskan citra daun tanaman padi tersebut. Metode ini dapat digunakan dikarenakan fitur Haralick dalam GLCM mampu menangani citra yang memiliki perbedaan tekstur dengan baik dan citra daun penyakit tanaman padi memiliki perbedaan pada tekstur daun yang cukup jelas dilihat. Sehingga dapat dikatakan bahwa metode ini cocok untuk digunakan pada kasus ini. Dengan jumlah fitur Haralick yang cukup banyak, Linear Discriminant Analyis (LDA) kemudian diaplikasikan kepada fitur-fitur Haralick sebagai metode reduksi dimensi sedemikian sehingga fitur baru yang didapatkan memiliki separasi yang lebih baik. Kemudian, Support Vector Machine (SVM) digunakan sebagai classifier dalam mengklasifikasi penyakit tanaman padi menggunakan fitur LDA yang sudah didapatkan.

Indonesia is one of the world’s leading rice producers with a total of more than 150 million tons of rice produced in the last three years . Rice plants, despite being a staple crop for many years, are susceptible to diseases that can hamper rice production. Because each diseases of rice plants has a distinctive pattern on the leaves of rice plants, the leaves of diseased rice plants can be used as indicators of the type of disease. The picture format of the rice leaf is converted to grayscale in order to create a Gray Level Co-occurence Matrix (GLCM) at multiple angles. The Haralick feature is extracted from the GLCM to obtain features that can describe the image of the rice plant leaf. Because the Haralick feature in GLCM can handle images with diverse textures and the image of leaves of rice plant diseases has differences in leaf texture that are clearly apparent, this method can be used. With a large number of Haralick features, the Linear Discriminant Analysis (LDA) is used as a dimension reduction technique for the Haralick features, resulting in better separation of the new features. The Support Vector Machine (SVM) is used as a classifier to classify rice plant diseases based on the obtained LDA features."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Putri Utami

Sistem pengklasifikasian kanker payudara berbasis ciri gray level co occurrence matrix glcm dan discrete wavelet transform dwt menggunakan support vector machine svm = Breast cancer classification system based on gray level co occurrence matrix glcm and discrete wavelet transform dwt features using support vector machine svm

"Kanker payudara adalah tumor ganas yang tumbuh akibat pertumbuhan sel-sel jaringan yang tidak normal pada jaringan payudara. Kanker payudara pada wanita merupakan penyakit yang kini paling banyak diderita dibandingkan jenis kanker lainnya. Cara yang dilakukan agar penyakit ini tidak memiliki kesempatan untuk menyebar adalah dengan mendeteksinya sedini mungkin dengan menggunakan mammografi.

Pada penelitian ini penulis telah merancang suatu sistem yang menggunakan komputer untuk mendeteksi dan mengklasifikasi kanker payudara pada citra mammogram. Citra mammogram yang digunakan adalah citra mammogram dari Mommographic Image Analysis Society (MIAS) yang terdiri dari 322 citra. Pengolahan awal citra pada sistem ini menggunakan metode Otsu Thresholding, pendeteksian tepi dengan menggunakan metode Canny, dan metode dilasi. Ciri yang digunakan pada sistem ini adalah Gray Level Co-occurrence Matrix (GLCM) dan Discrete Wavelet Transform (DWT).

Metode pengklasifikasian yang digunakan pada penelitian ini adalah Support Vector Machine (SVM). Sistem memiliki ketahanan yang baik terhadap noise salt and pepper pada nilai noise tertentu pada tiap jenis citra mammogram yang digunakan. Tingkat keakuratan berkisar 80% pada saat diberi noise sebesar -16dB pada citra mammogram jinak dan ganas. Keakuratan sistem juga teruji cukup baik untuk jumlah data latih yang hanya sebesar 70% dimana tingkat keakuratan pendeteksian dan pengklasifikasian adalah sebesar 80,6%.

Breast cancer is a malignant tumor that grows as a result of the growth of tissue cells that are not normal in the breast tissue. Breast cancer in women is a disease that is now the most common cancer than other types. How that is done so that the disease does not have a chance to spread is to detect it as early as possible by using mammography.
In this study, the authors have designed a system that uses a computer to detect and classify breast cancer on a mammogram image. Mammogram image has been taken from Mommographic Image Analysis Society (MIAS) which consists of 322 images. Initial processing images on this system using Otsu Thresholding, edge detection using Canny method, and the method of dilation. Features used in this system is the Gray Level Co-occurrence Matrix (GLCM) and Discrete Wavelet Transform (DWT).
Claassification method was used in this study is Support Vector Machine (SVM). The system has good resistance to salt and pepper noise on certain noise value for each type of mammogram image are used. The accuracy range was 80% when given the noise of -16dB on mammogram images of benign and malignant. The accuracy of the system was also tested well enough for the amount of training data that only 70% where the level of detection and classification accuracy is 80,6 %."

Depok: Fakultas Teknik Universitas Indonesia, 2015

T42928

UI - Tesis Membership Universitas Indonesia Library

Nurlia Angie Darmawan

Perbandingan antara Metode Gray Level Co-Occurrence Matrix dan Local Binary Pattern dengan Support Vector Machines untuk Klasifikasi Perubahan Densitas CT Scan Otak Penderita Stroke Iskemik = The Comparison between Gray Level Co-Occurrence Matrix and Local Binary Pattern with Support Vector Machines for Classification of Density Changes in CT Brain Scan of Ischemic Stroke Patients

"Di dunia kesehatan, tenaga medis dituntut untuk mengatasi berbagai jenis penyakit dengan gejala yang beragam. Oleh karena itu, diperlukan suatu teknologi untuk membantu mereka menyelesaikannya dengan baik. Penelitian ini mendukung mereka dengan menggunakan machine learning sebagai pemecah masalah. Metode machine learning yang digunakan pada penelitian ini adalah metode klasifikasi. Penulis membahas tentang stroke yang merupakan salah satu penyakit dengan angka kematian tertinggi di dunia. Penelitian ini mengamati perubahan densitas pada otak penderita stroke iskemik. Stroke iskemik merupakan salah satu jenis stroke yang terjadi ketika pembuluh darah tersumbat oleh trombus atau emboli. Penelitian ini menggunakan data CT scan dari Departemen Radiologi, Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Data yang berupa citra CT scan diubah menjadi data numerik dengan metode Gray Level Co-Occurrence Matrix dan Local Binary Pattern yang dibandingkan performanya pada saat melakukan proses klasifikasi. Penelitian ini menerapkan Support Vector Machines sebagai metode klasifikasi. Didapatkan hasil bahwa Support Vector Machines dengan Local Binary Pattern menghasilkan performa yang lebih baik dibandingkan Support Vector Machines dengan Gray Level Co-Occurrence Matrix.

In the health sector, the medical staffs are challenged to overcome many types of diseases with various symptoms. Therefore, a technology is needed to help them solving it well. This study is supporting them by using a machine learning as the problem solver. The machine learning method that is used in this study is classification method. The author discusses about stroke which is one of the diseases with the highest mortality rate in the world. This study observed the density changes in the brain of ischemic stroke sufferers. Ischemic stroke is one of the stroke types that occurs when the arteries are blocked by thrombus or embolism. This study used data of CT scan from Department of Radiology, Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The image data of the CT scan is changed into a numerical data by using the Gray Level Co-Occurrence Matrix method and the Local Binary Pattern which is being compared when processing the classification. This study applies Support Vector Machines as the classification method. The results showed that Support Vector Machines with Local Binary Pattern has a better performance than Support Vector Machines with Gray Level Co-Occurrence Matrix."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Harum Ananda Setyawan

Analisis Performa Metode K-Means dan Spectral Clustering pada Lahan Karet Melalui Citra Digital dengan Fitur Ekstraksi Gray Level Co-occurrence Matrix = Analysis Performance of K-Means and Spectral Clustering Methods on Rubber Fields through Digital Imagery with Gray Level Co-occurrence Matrix Extraction Features

"Karet merupakan salah satu komoditas penyumbang Produk Domestik Bruto (PDB) terbesar Indonesia. Indonesia merupakan negara dengan lahan karet terluas di dunia. Namun hasil karet yang diproduksi oleh Indonesia masih kalah dibanding Thailand. Hal tersebut disebabkan oleh pemberian pupuk, pestisida, dan perlindungan tanaman yang masih belum maksimal. Untuk perlindungan tanaman karet, di Indonesia biasanya dilakukan melalui penelitian daun karet. Akan tetapi, hal tersebut sangatlah tidak efisien dibanding dengan luas lahan yang ada. Sehingga diperlukan suatu metode yang lebih efisien untuk mendeteksi penyakit pada tanaman karet. Pada penelitian ini, penulis merancang suatu metode pendeteksian dini pengendalian penyakit tanaman karet menggunakan metode k-means clustering dan spectral clustering menggunakan citra digital yang diambil menggunakan drone. Melalui penelitian ini, diharapkan produksi tanaman karet dapat ditingkatkan dikarenakan proses pengendalian penyakit yang lebih efisien. Dengan penelitian ini, lahan karet sehat dan bergejala penyakit dapat dikelompokkan ke masing-masing klaster. Untuk selanjutnya, untuk lahan karet bergejala penyakit dapat dilakukan penelitian lebih lanjut untuk mengetahui jenis penyakit dan level penyakit yang dialami. Pendeteksian penyakit tanaman karet pada penelitian ini memiliki hasil 0,702 untuk k-means clustering dan 0,566 untuk spectral clustering dengan metode evaluasi silhouette score. Hal tersebut dikarenakan data citra yang masih sangat terbatas baik dalam jumlah maupun teknik pengambilan gambar. Namun untuk evaluasi menggunakan mean dan standard deviation, Spectral Clustering dengan perspective transform memiliki hasil yang lebih baik. Metode Spectral Clustering dengan data yang telah dilakukan perspective transform mampu mengklaster lahan karet yang hijau dan agak menguning.

Rubber is one of the largest contributors to Indonesia's Gross Domestic Product (GDP). Indonesia is a country with the largest rubber plantation in the world. However, the rubber produced by Indonesia is still inferior to Thailand. This is caused by the provision of fertilizers, pesticides, and plant protection that is still not optimal. For the protection of rubber plants, in Indonesia it is usually done through rubber leaf research. However, this is very inefficient compared to the existing land area. So we need a more efficient method to detect diseases in rubber plants. In this study, the authors designed a method for early detection of rubber plant disease control using the k-means clustering method and spectral clustering using digital images taken using drones. Through this research, it is hoped that the production of rubber plants can be increased due to a more efficient disease control process. With this research, healthy rubber fields and disease symptoms can be grouped into each cluster. Henceforth, for rubber fields with disease symptoms, further research can be carried out to determine the type of disease and the level of disease experienced. The detection of rubber plant diseases in this study had satisfactory results, namely for k-means clustering and for spectral clustering. This is because the image data is still very limited both in number and technique of taking pictures. However, for evaluation using the mean and standard deviation, Spectral Clustering with perspective transform has better results. The Spectral Clustering method with data that has been carried out with perspective transform is better able to cluster green and slightly yellow rubber land."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Alifah

Klasifikasi retinopati diabetik menggunakan Support Vector Machine (SVM) dengan metode seleksi fitur Recursive Feature Elimination (RFE) dan chi-square = Classification of retinopathy diabetic using Support Vector Machine (SVM) with feature selection method Recursive Feature Elimination (RFE) and chi-square

"Diabetes Melitus (DM) merupakan gangguan sistem metabolik akibat pankreas tidak memproduksi cukup insulin atau tubuh tidak mampu menggunakan insulin yang ada secara efektif. Menderita diabetes dalam jangka waktu panjang dapat mengakibatkan berbagai macam komplikasi salah satu di antaranya adalah Retinopati diabetik. Retinopati diabetik adalah kelainan pada bagian mata yang disebabkan oleh adanya kerusakan dan penyumbatan pada pembuluh darah di bagian belakang mata (retina). Pada penelitian kali ini akan di gunakan data retinopati diabetik dengan menggunakan metode seleksi fitur Recursive Feature Elimination (RFE) dan Chi-Square dan akan di klasifikasi menggunakan Support Vector Machine.

Diabetic retinopathy is one of the complication of diabetes, which is an eye disease that can cause blindness. Its happen because of damage of retina as a result of the long illness of diabetic melitus. People usually do research using image data in diabetic patients. This paper present about diabetic retinopathy will extracting with feature selection. In this study, we use data diabetic patients who will be extracted with a feature selection method. Feature selection used in this study is Recursive Feature Elimination (RFE) and Chi-Square. For classification of diabetic retinopathy has been done by Support Vector Machine (SVM). From the experimental result with various tunning hyperparameters, the classification model can obtain the accuracy between 97%-100% for both methods."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Ahmad Ihsan Farhani

Klasifikasi Penyakit Tanaman Karet Menggunakan Metode Convolutional Autoencoder dan Support Vector Machine (SVM) pada Citra Daun = Classification of Rubber Plant Diseases Using Convolutional Autoencoder and Support Vector Machine (SVM) Methods on Leaf Image

"Indonesia menempati posisi kedua sebagai negara penghasil karet alami di dunia. Karet alami memiliki nama lain yaitu lateks. Belakangan ini produksi lateks di Indonesia menurun. Salah satu faktor penyebab menurunnya produksi lateks Indonesia adalah penyakit gugur daun. Jamur Pestalotiopsis sp. adalah salah satu jamur yang dapat menyebabkan penyakit gugur daun. Penyakit gugur daun yang disebabkan oleh jamur ini pertama kali terjadi di Indonesia pada tahun 2016 di Sumatera Utara. Penyakit tersebut menyebabkan tanaman karet menggugurkan daun sebelum waktunya sehingga menyebabkan produksi lateks berkurang. Cadangan makanan pohon karet lebih banyak dialokasikan untuk menumbuhkan kembali daun yang telah gugur dibanding untuk memproduksi lateks. Luas lahan pohon karet di Indonesia yang terinfeksi penyakit gugur daun Pestalotiopsis sp. sudah mencapai 30.328,84 hektar pada tahun 2021 menyebabkan penurunan produksi lateks hingga 30%. Pendeteksian penyakit gugur daun dapat dilakukan secara morfologi yaitu dengan pegamatan pada daun. Gejala penyakit gugur daun yang disebabkan oleh Pestalotiopsis sp. adalah munculnya bintik cokelat pada tulang daun yang lama kelamaan berkembang menjadi bintik cokelat gelap. Bintik tersebut kemudian membesar, menyebabkan daerah di sekitar daun mengalami nekrosis kemudian gugur. Kekurangan dari pendeteksian secara morfologi adalah memerlukan waktu dan tenaga yang cukup besar, serta keahlian khusus di bidang tanaman karet. Dalam penelitian ini, akan dilakukan pendeteksian penyakit gugur daun yang disebabkan oleh jamur Pestalotiopsis sp. dengan bantuan machine learning untuk mengurangi tenaga dan waktu yang diperlukan dalam mendeteksi penyakit gugur daun. Model machine learning akan menerima input data citra daun tanaman karet. Model yang digunakan dalam pendeteksian adalah k-means clustering untuk mensegmentasi data citra daun karet, convolutional autoencoder untuk melakukan fitur ekstraksi pada data citra hasil segmentasi dan suppport vector machine sebagai classifier. Dari hasil eksperimen dengan 5 kali percobaan didapat accuracy testing sebesar 62,91%, accuracy training sebesar 78,50%. Accuracy testing dan accuracy training memiliki perbedaan yang cukup signifikan menandakan model mengalami overfitting. Overfitting terjadi ketika dataset yang tersedia hanya sedikit, pada penelitian ini yaitu 257 data citra namun, model yang dilatih kompleks. Sehingga diperlukan penambahan data citra untuk menghindari overfitting dan meningkatkan accuracy dari model.

Indonesia occupy the second position as a natural rubber producing country in the world. Natural rubber has another name, namely latex. Recently, latex production in Indonesia has declined. One of the factors causing the decline in Indonesian latex production is leaf fall disease. The fungus Pestalotiopsis sp. is one of the fungi that can cause leaf fall disease. Leaf fall disease caused by this fungus first occurred in Indonesia in 2016 in North Sumatra. The disease causes rubber plants to drop their leaves prematurely, causing reduced latex production. Rubber tree food reserves are allocated more to regrow fallen leaves than to produce latex. The area of rubber trees in Indonesia infected with the Pestalotiopsis sp. leaf fall disease. has reached 30,328.84 hectares in 2021 causing a decline in latex production by up to 30%. Disease detection can be done morphologically by observing the leaves. Symptoms of leaf fall disease caused by Pestalotiopsis sp. is the appearance of brown spots on the veins of the leaves which over time develop into dark brown spots. These spots then enlarge, causing the area around the leaves to experience necrosis and then fall. The drawback of morphological detection is that it requires a lot of time and effort, as well as special expertise in the field of rubber plantations. In this research, we will detect leaf fall disease caused by the fungus Pestalotiopsis sp. with the help of machine learning to reduce the effort and time needed to detect leaf fall disease. The machine learning model will be using image of rubber plant leaves as input data. The model used in the detection is k-means clustering to segment rubber leaf image data, convolutional autoencoder to perform feature extraction on segmented image data and support vector machine as a classifier. From the experimental results with 5 trials obtained testing accuracy of 62.91%, training accuracy of 78.50%. Accuracy testing and accuracy training have significant differences indicating that the model is overfitting. Overfitting occurs when the available dataset is only a few, namely 257 image data but the model being trained is complex. So it is necessary to add image data to avoid overfitting and increase the accuracy of the model."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Amanda Rizki Bagasta

Klasifikasi data infark serebri menggunakan support vector machine dan seleksi fitur relief = Classification of cerebral infarction using support vector machine and relief feature selection / Amanda Rizki Bagasta

"ABSTRAK

Infark Serebri adalah kondisi dari suatu jaringan otak yang tidak teralirkan darah sehingga sel-sel otak tersebut kekurangan oksigen dan nutrisi. Hal ini dapat mengakibatkan kerusakan bahkan kematian sel-sel otak dan perlu dengan segera mendapatkan penanganan. Keadaan ini sering dikenal sebagai Stroke, dimana pada penulisan ini akan berfokus pada data stroke nonhemoragik (stroke tidak berdarah) yang diakibatkan penyumbatan pembuluh darah di otak. Biasanya penyakit ini dapat dikenali dari gejala kelumpuhan suatu bagian tubuh atau kesulitan menggunakan suatu alat indra. Menurut para ahli, penyakit ini harus dicegah sejak dini karena dapat berakibat fatal bagi keseluruhan fungsional tubuh. Salah satu tindakan yang dapat dilakukan sejak dini adalah mendeteksi kemungkinan penyakit agar dapat dilakukan penanganan secara tepat dan cepat. Dalam penelitian ini, Infark Serebri dideteksi dengan mengklasifikasi ada atau tidaknya sel abnormal pada jaringan otak pada hasil CT Scan otak pasien menggunakan Support Vector Machine dengan Seleksi Fitur RELIEF. Data yang digunakan berupa data numerik dari pasien yang melakukan pemeriksaan di RSUPN dr. Cipto Mangunkusumo Jakarta dalam bentuk hasil CT Scan otak. Terdapat Sembilan fitur indikator yang digunakan dan diproses dengan membandingkan Support Vector Machine dengan dan tanpa seleksi fitur RELIEF. Berdasarkan hasil uji coba, metode yang diusulkan mampu mencapai akurasi sebesar 95,23%. Sehingga, penggunaan seleksi fitur RELIEF pada SVM merupakan metode yang baik untuk menklasifikasi infark serebri.

ABSTRACT

The Cerebrovascular Infarction is a condition of an inflowed blood of brain tissue so that the brain cells lack oxygen and nutrients. This can cause the damage and even the death of brain cells and needed to get immediate treatment. This situation is often known as stroke, which at this writing will fokus on data on non-hemoragic strokes (non-bleeding strokes) caused by blockage of blood vessels in the brain. Usually this disease can be identified by symptoms of paralysis of some body part or difficulty using a human sensory. According to the experts, this disease must be prevented early because it can be fatal to the overall functional body. One of the actions that can be done early is to detect the possibility of a disease so that it can be handled appropriately and quickly. In this study, the cerebral infarction was detected by classifying the presence or absence of abnormal cells in brain tissue in the results of a CT brain scan of patients using Support Vector Machine with the RELIEF Selection Feature. The data used in the form of numerical data reports from patients who performed examinations at the RSUPN dr. Cipto Mangunkusumo Jakarta in the form of brain CT Scan. There are nine indicator features that are used and processed by comparing Support Vector Machine with and without RELIEF feature selection. Based on the results, the proposed method is able to achieve accuracy value of 95,23%. Thus, the use of RELIEF feature selection with SVM is a good method for classifying cerebral infarction.

2019

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Melati Vidi Jannati

Klasifikasi kanker paru-paru menggunakan support vector machine dengan pemilihan fitur berbasis fungsi kernel = Classification of lung cancer using support vector machine with feature selection based on kernel function

"Klasifikasi data kanker menggunakan microarray data menjadi salah satu cara untuk mendapatkan pengobatan yang lebih tepat. Kendala yang terdapat adalah karakteristik dari microarray yang memiliki fitur yang sangat banyak. Seringkali fitur tersebut tidak begitu informatif bagi pengklasifikasian sehingga perlu adanya suatu cara untuk memilih fitur-fitur yang mengandung informasi yang penting. Salah satu cara tersebut adalah dengan pemilihan fitur. Pada penelitian ini, metode pemilihan fitur yang digunakan berdasarkan clustering dengan fungsi kernel. Fitur-fitur yang sudah terpilih kemudian diklasifikasikan menggunakan metode Support Vector Machine.

Evaluasi dari klasifikasi pada penelitian ini melibatkan K-Fold Cross Validation, metode tersebut akan membagi data secara acak, tetapi merata sehingga akurasi yang didapat juga merata. Hasil akurasi tersebut dilakukan dengan berbagai uji terhadap parameter yang berkaitan seperti K partisi, nilai dan fitur-fitur yang digunakan. Pada proses klasifikasi tanpa pemilihan fitur tingkat akurasinya mencapai 89.68 dengan k partisi sebanyak 6 sementara dengan 5 fitur akurasinya menjadi 95.87 pada partisi sebanyak 10.

Classification of cancer using microarray data is one way to get a more precise treatment. The obstacle on classification data is the characteristics of microarray data that is having many features. These features are often not so informative for classification, so it needs a way to select the features that contain important information. One way is by selection feature. In this research, the method of selection features that are used based on clustering with kernel function. Features that are already selected then classified using Support Vector Machine.
Evaluation of classification in this research involves a K Fold Cross Validation, that methods split data randomly but uniformly so that it can reach all of accuracy. The results of accuracy data was done with different test against related parameters such as K partition, the value of and the features that are used. On the classification process without selection features rate of accuracy reached on 89.68 with k partition number 6 while with the 5 features obtained 95.87 on partition number 10."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016

S66852

UI - Skripsi Membership Universitas Indonesia Library

Arfiani

Klasifikasi data infark serebri menggunakan multiple support vector machine dengan seleksi fitur information gain = Cerebral infarction data classification using multiple support vector machine with information gain feature selection

"Stroke merupakan penyakit yang menempati urutan ketiga sebagai penyebab kematian terbesar di dunia setelah penyakit jantung dan kanker. Stroke juga menduduki posisi pertama sebagai penyakit yang dapat menyebabkan kecacatan, baik ringan maupun berat. Salah satu jenis stroke yang umum terjadi adalah infark serebri. Di Indonesia, jumlah penderita stroke, terutama infark serebri, semakin meningkat setiap tahunnya. Tidak hanya terjadi pada seseorang yang berusia lanjut, namun infark serebri juga dapat terjadi pada seseorang yang masih muda dan produktif. Oleh sebab itu, pendeteksian dini terhadap infark serebri sangatlah penting. Berbagai metode medis selalu digunakan untuk mengklasifikasi infark serebri, namun dalam penelitian ini, akan digunakan metode machine learning. Metode yang diusulkan yaitu Multiple Support Vector Machine dengan Seleksi Fitur Information Gain (MSVM-IG). MSVM-IG merupakan metode baru yang menggunakan support vector sebagai data baru untuk selanjutnya dilakukan seleksi fitur dan evaluasi performa. Data yang digunakan berupa data numerik hasil CT Scan yang diperoleh dari RSUPN dr. Cipto Mangunkusumo, Jakarta. Berdasarkan hasil uji coba, metode yang diusulkan mampu mencapai nilai akurasi sebesar 88,71%. Sehingga, metode MSVM-IG ini dapat menjadi salah satu alternatif untuk membantu praktisi medis dalam mengklasifikasi infark serebri.

Stroke is a disease that ranks third as the biggest cause of death in the world after heart disease and cancer. Stroke also occupies the first position as a disease that can cause disability, both mild and severe. One type of stroke that is common is cerebral infarction. In Indonesia, the number of stroke patients, especially cerebral infarction, is increasing every year. Not only occurs in someone who is elderly, but cerebral infarction can also occur in someone who is young and productive. Therefore, early detection of cerebral infarction is very important. Various medical methods are always used to classify cerebral infarction, but in this study, machine learning methods would be used. The proposed method is Multiple Support Vector Machine with Information Gain Feature Selection (MSVM-IG). MSVM-IG is a new method that uses support vector as a new dataset, then feature selection step and performance evaluation are performed. The data used in the form of numerical data results of CT scan obtained from RSUPN Dr. Cipto Mangunkusumo, Jakarta. Based on the results, the proposed method is able to achieve an accuracy value of 88.71%. Thus, the MSVM-IG could be an alternative to assist medical practitioners in classifying cerebral infarction."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Vinezha Panca

Klasifikasi multikelas kanker otak dengan metode multiple support vector machine recursive feature elimination dan twin support vector machine = Multiclass brain cancer classification using multiple support vector machine recursive feature elimination and twin support vector machine

"ABSTRAK

Kanker merupakan salah satu penyebab kematian terbesar di seluruh dunia. Secara khusus, kanker otak adalah kanker yang terjadi pada sistem saraf pusat. Salah satu hal yang dapat dilakukan untuk penelitian kanker otak menggunakan machine learning adalah melakukan pendeteksian jenis kanker otak dengan memanfaatkan microarray data. Permasalahan tersebut merupakan masalah klasifikasi multikelas. Dengan menggunakan pendekatan one versus one, akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Karena data kanker otak memiliki fitur yang sangat banyak, perlu dilakukan seleksi fitur. Pada penelitian ini, akan diimplementasikan metode Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM-RFE sebagai metode seleksi fitur, dan Twin Support Vector Machine TWSVM sebagai metode klasifikasi. Pada metode MMSVM-RFE dilakukan pelatihan SVM-RFE pada setiap masalah dua kelas, sehingga setiap masalah dua kelas memiliki pengurutan fitur masing-masing. Sebagai metode klasifikasi, TWSVM memiliki tujuan untuk mencari hyperplane masing ndash; masing kelas sedemikian sehingga data kelas satu sedekat mungkin terhadap suatu hyperplane namun sejauh mungkin dengan hyperplane lainnya. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel linear pada TWSVM adalah 95,33 dengan menggunakan 200 fitur. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel RBF pada TWSVM adalah 87 dengan 70 fitur. Sedangkan apabila proses validasi juga dilakukan pada seleksi fitur, rata-rata akurasi tertinggi yang diperoleh adalah 90,67 dengan menggunakan 90 fitur.

ABSTRACT

Cancer is one of main causes of death worldwide. Brain cancer is a type of cancer which occurs at central nervous system. Taking advantage from microarray data, machine learning methods can be applied to help brain cancer prediction according to its types. This problem can be referred as a multiclass classification problem. Using one versus one approach, the multiclass problem with k classes can be transformed into k k 1 2 binary class problems. The huge amount of features makes it necessary to use feature selection. In this research, Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM RFE method is implemented as the feature selection method, and Twin Support Vector Machine TWSVM method is implemented as the classification method. The main concept of MMSVM RFE is to train SVM RFE at each binary problem so that each binary problem will have their own arrangements of feature. As a classification method, TWSVM is trained to find two hyperplanes, each representative of its own class. The data of one class must be as near as possible from its representative hyperplane while also must be as far as possible from the other hyperplane. In the simulation which uses linear kernel on MMSVM RFE and linear kernel on TWSVM, the highest average accuracy is 95,33 , using 200 features. In the simulation which uses linear kernel on MMSVM RFE and RBF kernel on TWSVM, the highest average accuracy is 87 , using 70 features. In the case where the feature selection process is included in doing validation, the highest average accuracy is 90,67 , using 90 features."

2016

S66302

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian