Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 131 dokumen yang sesuai dengan query
cover
Hamidah
Abstrak :

Klasifikasi stroke merupakan masalah yang harus diselesaikan dengan cepat dan tepat untuk menentukan pengobatan awal yang tepat bagi penderita stroke. Jika pengobatan awal yang tepat terlambat untuk dilakukan, maka hal ini dapat menyebabkan kecacatan bahkan kematian. Penelitian ini menyelesaikan masalah klasifikasi stroke menggunakan pendekatan machine learning dengan metode Minimally Spanned Support Vector Machine (MSSVM). Metode ini merupakan pengembangan dari metode Support Vector Machine (SVM) dimana metode ini mengaplikasikan algoritma Minimum Spanning Tree (MST) untuk mereduksi jumlah support vector pada SVM. Hal ini bertujuan untuk mempercepat waktu komputasi yang dibutuhkan oleh SVM dan meningkatkan kinerja SVM. Hal ini dikarenakan waktu komputasi yang dibutuhkan oleh SVM bergantung pada jumlah support vector dimana jumlah support vector yang semakin banyak memberikan waktu komputasi yang dibutuhkan semakin lama. Selain itu, pereduksian jumlah support vector dapat memberikan kesalahan generalisasi yang lebih kecil sehingga memberikan kinerja yang lebih baik. Pada penelitian ini, kinerja dari MSSVM dievaluasi dengan membandingkan beberapa parameter dengan kinerja SVM. Hasil yang diperoleh adalah bahwa MSSVM berhasil mereduksi jumlah support vector pada SVM sedemikian sehingga mempercepat waktu komputasi yang dibutuhkan oleh SVM dalam mengklasifikasikan data stroke tanpa mengurangi kinerja dari SVM.  


Stroke classification is a problem that must be solved quickly and precisely to determine the right initial treatment for stroke sufferers. If the right initial treatment is too late to do so, this can cause disability and even death. This study solves the problem of stroke classification using a machine learning approach with Minimally Spanned Support Vector Machine (MSSVM) method. This method is a development of Support Vector Machine (SVM) method where this method applies the Minimum Spanning Tree (MST) algorithm to reduce the number of support vectors in SVM. This aims to speed up the computation time required by SVM and improve the performance of SVM. This is because the computation time required by SVM depends on the number of support vectors where the more support vectors give the required computation time longer. In addition, reducing the number of support vectors can provide smaller generalization errors, thus providing better performance. In this study, the performance of MSSVM was evaluated by comparing several parameters with the performance of SVM. The results obtained are that MSSVM has succeeded in reducing the number of support vectors in SVM thus accelerating the computational time needed by SVM in classifying stroke data without reducing SVM performance.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Natalia Aji Yuwanti
Abstrak :
Metode machine learning sangat banyak digunakan dalam membantu pekerjaan manusia. Tidak semua data seperti yang diharapkan. Kebanyakan data memiliki missing value. Data yang memiliki missing value harus ditangani dulu pada tahap pra pengolahan, salah satunya adalah dengan cara imputasi missing value. Pada penelitian ini, dilakukan analisis kinerja One-Dimensional Naïve Bayes sebagai metode imputasi data masalah asuransi mobil dan keselamatan berkendara. Berdasarkan hasil simulasi menggunakan SVM didapatkan hasil yang sama untuk imputasi menggunakan modus dan One-Dimensional Naïve Bayes pada data Car Insurance yaitu 1,00. Setelah itu dilakukan telaah lebih lanjut ternyata imputasi setiap missing value dengan modus dan prediksi imputasi dengan One-Dimensional Naïve Bayes persis sama. Pada data Safe Driver, imputasi dengan modus menghasilkan akurasi 0,86 sedangkan imputasi dengan One-Dimensional Naïve Bayes menghasilkan akurasi 0,85. Hasil ini menunjukkan bahwa metode imputasi missing value dengan modus masih sangat direkomendasikan untuk tahap pra pengolahan data pada machine learning. ......Machine learning methods are very widely used in helping human work. Not all data is as expected. Most data have missing values. Data which has a missing value must be handled first at the pre-processing stage, one of which is by imputation of the missing value. In this study, a One-Dimensional Naïve Bayes performance analysis was performed as a data imputation method for car insurance and safe driver problems. Based on simulation results by using SVM obtained the same results for imputation using mode and One-Dimensional NaA ve Bayes on Car Insurance data that is 1,00. After that, a further study is carried out, apparently the imputation of each missing value by mode and the prediction of imputation with One-Dimensional NaAve Bayes are the same. In Safe Driver data, imputation with mode produces 0.86 accuracy while imputation with One-Dimensional NaAve Bayes produces accuracy of 0.85. These results indicate that the method of missing value imputation with mode is still highly recommended for the pre-processing data stage in machine learning.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Soya Febeauty Yama Otantia Pradini
Abstrak :
Metode klasifikasi telah banyak digunakan dalam berbagai aspek, termasuk dalam bidang bioinformatika. Salah satu penggunaan metode klasifikasi ini adalah untuk menentukan tingkatan fase dari sebuah penyakit. Dalam penelitian ini akan dilakukan pengklasifikasian parasit plasmodium falciparum. Parasit tersebut merupakan parasit penyebab penyakit malaria. Penyakit ini dapat ditularkan oleh gigitan nyamuk Anopheles betina yang mengandung plasmodium di dalamnya. Hasil penelitian ini dapat digunakan untuk menentukan fase parasit plasmodium yang berada di sel darah orang yang terjangkit malaria. Tujuan penelitian ini adalah untuk mengetahui persentase keberhasilan dan menganalisis metode Multiclass Support Vector Machines untuk memprediksi tingkatan parasit tersebut. Data yang digunakan adalah data citra sel darah merah yang telah terjangkit tiga jenis tingkatan parasit plasmodium falciparum. Dalam prosesnya, penelitian ini akan menggunakan Canopy sebagai IDE bahasa pemrograman python. Dari 112 percobaan, didapatkan tingkat akurasi tertinggi sebesar 87,5% untuk metode Multclass SVM one vs rest dan one vs one menggunakan 4-fold cross validation dengan parameter linear kernel dan C=1. ......Classification methods has been frequently used in various aspects, including bioinformatics. One of its purpose of this classification is to  determine phase level of a disease. This research will classify the phase of plasmodium falciparum parasite which causes malaria.The disease is spread by an infected female Anopheles mosquito which contains Plasmodium. The result of this research could be use to determine Plasmodium parasite phase in infected peoples red blood cells. The purpose of this research is to discover the success rate of Multiclass Support Vector Machines method and analyze it in order to predict the parasite phase levels. The data of this study is image data of red blood cells which was infected by three kinds of Plasmodium falciparum parasite levels. In the process, this study will be using Canopy as Integration Development Environtments of phyton programming language.  From 112 trials, the highest number of accuracy is 87.5% for Multiclass Support Vector Machines one vs rest and one vs all methods which used the 4-fold cross validation with C=1 as parameter for linear kernel.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T52713
UI - Tesis Membership  Universitas Indonesia Library
cover
Amanda Rizki Bagasta
Abstrak :
Topik prediksi kesulitan keuangan perusahaan menjadi penting dalam mendeteksi risiko kebangkrutan suatu perusahaan. Beberapa penelitian menunjukkan bahwa pembelajaran mesin seperti SVM, Neural Network, dan Random Forest memberikan kinerja yang lebih baik dalam memprediksi kesulitan keuangan dibandingkan dengan metode tradisional seperti Altman dan Merton. Makalah ini mengusulkan prediksi kesulitan keuangan dengan menggunakan variabel biner dari olahan rasio laporan keuangan perusahaan yang berguna untuk memperingatkan kreditur atau investor akan risiko kebangkrutan. Oleh karena itu, penelitian ini menerapkan model prediksi untuk 203 perusahaan sektor transportasi di Asia Tenggara dari tahun 2019 hingga 2020 menggunakan SMOTE Support Vector Machine dan Gaussian (RBF) untuk menangani data yang tidak seimbang. Hasil eksperimen menunjukkan bahwa metode ini dapat menghasilkan akurasi di atas 90% dan menemukan atribut fitur mana yang paling mempengaruhi hasil klasifikasi. Kami berharap dapat merangsang lebih banyak penelitian tentang prediksi financial distress dengan memanfaatkan aplikasi Artificial Intelligence. ......The topic of predicting company's financial difficulties has become important topic in detecting the risk of a company's bankruptcy. Some research showed that machine learning such as SVM, Neural Network, and Random Forest provide better performance in predicting financial distress compared to traditional methods such as Altman and Merton. This paper proposes financial distress prediction by using variables from binary processing of the company's financial statement ratios that are useful for creditors or investors who are at risk of bankruptcy. Therefore, we applied prediction model for 203 transportation sector companies in Southeast Asia from 2019 to 2020 using a SMOTE Support Vector Machine and Gaussian (RBF) in order to handle imbalanced data. Experimental results show that this method can produce accuracy above 90% and find which feature attributes that most affected the classification results. We hope that it can stimulate more research on predicting financial distress by utilizing the application of Artificial Intelligence.
Depok: Fakultas Ekonomi dan Bisinis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Febrisa Dhewi Ramadhany
Abstrak :
ABSTRACT
Thalassemia merupakan salah satu penyakit kelainan sel darah merah yang diturunkan oleh orang tua sejak lahir. Thalassemia mengakibatkan protein yang ada di dalam sel darah merah rusak dan tidak mampu berfungsi dengan baik. Hingga saat ini penyakit thalassemia belum dapat disembuhkan, namun penyakit thalassemia dapat dicegah dengan melakukan deteksi dini atau tes prenatal yang dikenal dengan skrining. Pada penelitian ini deteksi dini dilakukan dengan bantuan komputer. Ada beberapa teknik yang telah digunakan untuk mengklasifikasi skrining data thalassemia, salah satu metode yang mampu mengklasifikasi penyakit thalassemia diantaranya adalah Support Vector Machines (SVM) dan Multi-Layer Perceptron (MLP). Data thalassemia yang digunakan diperoleh dari RSAB Harapan Kita, Indonesia. Data tersebut memiliki yang memiiki 10 fitur. Setelah pengujian dilakukan, klasifikasi dengan menggunakan metode SVM menunjukkan hasil akurasi lebih baik sebesar 97,47190988%  dengan rata-rata running time 0,145899875 detik. Sedangkan MLP memperoleh hasil akurasi terbaik sebesar 63,91% dengan rata-rata running time 0,009033 detik. Kesimpulan yang diperoleh menunjukkan bahwa teknik klasifikasi menggunakan SVM memiliki akurasi yang  lebih baik apabila dibandingkan dengan MLP. 
ABSTRACT
Thalassaemia is a red blood cell disorder that is inherited by parents from birth. Thalassaemia results in damaged proteins in red blood cells and are unable to function properly. Until now, thalassaemia has not been cured, but thalassaemia can be prevented by early detection or prenatal testing known as screening. In this study, early detection is done with the help of a computer. There are several techniques that have been used to classify thalassaemia data screening, one method that is able to classify thalassaemia include Support Vector Machines (SVM) and Multi-Layer Perceptron (MLP). The thalassaemia data used was obtained from Harapan Kita Hospital, Indonesia. The data has 10 features. After the testing is done, the classification using the SVM method shows better accuracy results of 97.447190988% with an average running time of 0.145899875 seconds. While MLP obtained the best accuracy results of 63.91% with an average running time of 0.009033 seconds. The conclusions obtained showed that the classification technique using SVM had better accuracy compared to MLP.
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dhea Fairuz Vibranti
Abstrak :
Saham merupakan instrumen investasi yang menawarkan tingkat keuntungan yang menarik, namun memiliki risiko kerugian yang tinggi. Hal ini disebabkan oleh harga saham yang selalu berfluktuasi dan dipengaruhi oleh faktor-faktor tak menentu. Untuk memperoleh keuntungan seperti yang diharapkan, dibutuhkan prediksi pergerakan harga saham yang akurat. Umumnya, investor menggunakan indikator teknikal dalam mengantisipasi pergerakan harga di masa depan. Pada skripsi ini, sebanyak delapan indikator teknikal digunakan dan diproses ke dalam dua pendekatan. Pendekatan pertama memanfaatkan nilai-nilai indikator teknikal yang bersifat kontinu, sementara pendekatan lainnya memanfaatkan kriteria tertentu yang dimiliki oleh setiap indikator teknikal dalam menggambarkan pergerakan harga saham yang bersifat diskrit. Keduanya kemudian dijadikan data input bagi model prediksi dengan menggunakan metode Support Vector Machines yang mengklasifikasi data harga saham ke dalam dua kelas, yaitu naik dan turun. Hasil prediksi tersebut menunjukkan bahwa performa model prediksi yang menerapkan data input bernilai diskrit melampaui performa model prediksi yang menerapkan data input bernilai kontinu, dengan tingkat akurasi tertinggi yang diperoleh ialah sebesar 94,12. ......Stock is an investment instrument that offers an attractive rate of return, yet has a high risk of loss. This due to the nature of stock prices that are always fluctuate and influenced by uncertain factors. To obtain the expected profit, an accurate prediction of stock price movement is required. Generally, investors use technical indicators to anticipate the future price movement. In this undergraduate thesis, a number of eight technical indicators are used and processed into two approaches. The first approach use the values of technical indicators that are continuous, while the other utilizes certain criteria owned by each technical indicator in describing stock price movement which is a discrete type of value. Both approaches are then used as input data for prediction model using the Support Vector Machines method which classifies the stock price data into two classes, i.e. up and down. The prediction results indicate that the performace of prediction models applying discrete valued of input data exceeds the performance of prediction models which apply continuous valued of input data, with the highest accuracy obtained at 94.12.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
S68125
UI - Skripsi Membership  Universitas Indonesia Library
cover
Jihan Maharani
Abstrak :
Saat ini, penyusupan pada suatu sistem jaringan sering sekali terjadi. Gangguan tersebut dapat dicegah atau dideteksi salah satunya dengan menggunakan Intrusion Detection System. Intrusion Detection System sangat diperlukan untuk melindungi jaringan dan menghalangi serangan. Pada penelitian ini, dibahas pengklasifikasian data Intrusion Detection System menggunakan Multi-Class Support Vector Machine dengan pemilihan fitur Information Gain dengan data yang digunakan yaitu KDD-Cup99. Sebagai hasil, akan dibandingkan nilai akurasi model IDS menggunakan Support Vector Machine dengan dan tanpa pemilihan fitur serta percobaan pengaplikasian model untuk klasifikasi pada data unseen dengan model yang sudah didapat dengan menggunakan 8 fitur dan data training sebesar 80. ...... Nowadays, the intrusions often occur in a network system. One of ways that Intrusions can be prevented or detected is by using Intrusion Detection System. Intrusion Detection System indispensable to protect the network and to prevent the intrusions. In this paper, the author will discuss about the classification IDS data using Multi Class Support Vector Machine with feature selection using Information Gain and for the data used KDDCup99 Data Set. As a result, it will be compared the accuracy between IDS model using Support Vector Machine with and without feature selection and the application of model has been obtained from the experiment using eight features and 80 data training to unseen data.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Firman Adiyansyah
Abstrak :
Manusia memiliki kebutuhan untuk melangsungkan hidupnya. Seiring waktu harga-harga kebutuhan akan naik dikarenakan inflasi. Untuk mengantisipasi inflasi, manusia melakukan investasi. Investasi dapat bermacam-macam seperti membeli aset-aset riil (tanah, emas, dsb), ataupun membeli surat-surat berharga (efek) di pasar modal. Saham merupakan jenis efek yang paling sering diperjualbelikan. Dalam melakukan investasi saham, seorang investor memiliki permasalahan untuk memilih saham-saham yang dapat menghasilkan nilai imbal balik yang diharapkan. Permasalahan ini akan coba dijawab oleh Support Vector Machine (SVM) dengan mengklasifikasikan saham-saham apa saja yang menghasilkan imbal hasil ≥1%, dan imbal hasil <1%. Atribut yang digunakan terdapat 22, terdiri dari indikator teknikal dan nilai yang diolah dari data historis saham. Data historis saham yang digunakan adalah data perdagangan harian 30 saham dari indeks IDX30 pada jangka waktu 1 September 2020 hingga 31 Agustus 2021. Data historis saham dari 1 September 2020 hingga 5 Juni 2021 digunakan sebagai data training, dan data historis saham dari 6 Juni 2021 hingga 31 Agustus 2021 digunakan sebagai data testing. Model SVM yang dihasilkan memiliki akurasi sebesar 99,44%. Setelah didapatkan saham-saham yang berpotensi menghasilkan keuntungan yang diharapkan melalui SVM, selanjutnya akan dibuat sebuah portofolio investasi dari kumpulan saham tersebut dengan metode Mean Variance (MV). Bobot tiap saham yang dipilih adalah bobot saham yang meminimalkan variansi dari portofolio. Sebagai pembanding digunakan model pembentukan portofolio Equal Weight Portofolio (EWP) dan kinerja dari indeks IDX30. Imbal hasil dari portofolio yang dibentuk oleh SVM+MV dan SVM+EWP jauh lebih baik dari indeks IDX30. Variansi portofolio dari SVM+MV lebih kecil daripada portofolio dari SVM+EWP. ......Human must has basic need to survive. The price of basic need will increase over time because the effect of inflation. To anticipate the inflation, human tend to invest. There are two kind of investment, real asset such as land and gold, and securities such as stock and obligation. Stock is the most actively traded. When an investor decide to invest on stock, investor have to choose which stocks that will generate enough return for himself. This problem would be solved by using Support Vector Machines. SVM is one of the machine learning technique for classification, in this case we will classify the the stock based on the return ≥1% or <1%. There are 22 attribute that used for SVM. Data come from historical stock data of 30 stocks from IDX30 index. The range is from 1 September 2020 untill 31 August 2021. Data from 1 September 2020 through 5 June 2021 would be training data and data from 6 June 2021 untill 31 August 2021 would be testing data. The result from SVM model has accuracy of 99,44%. The next thing to fo after we have which stock that will be choose is to build a portofolio from it. The portofolio theory of Mean Variance will be used to build portofolio from the result of prediction stock SVM. Mean Variance method will determine how much the portion of respective stock to be invested that would be maximize returns and also minimize investment risk. For measure how well the model perform, we used Equal Weight Portofolio (EWP) method and return of IDX30 index. The result is SVM+MV model and SVM+EWP model generate more return than the underlying index. The variance of portofolio that generated from SVM+MV are smaller than portofolio generated from SVM+EWP.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dyakso Yudho Prastowo
Abstrak :
Reservoir sandstone merupakan target utama atau terpenting dalam eksplorasi hidrokarbon di Formasi Mungaroo AA daerah Offshore Cekungan Carnarvorn Utara. Salah satu lapangan dengan reservoir sandstone pada Formasi Mungaroo AA berada di Lapangan Wheatstone. Identifikasi zona reservoir potensial hidrokarbon merupakan suatu hal yang fundamental dalam industri Migas. Salah satu instrumen yang saat ini menjadi sangat powerfull karena begitu luas pemanfaataannya dan nilai investasi yang besar karena tidak semahal analisa core dan well testing adalah well log. Data well log hingga saat ini masih dilakukan intepretasi secara manual atau analisa kurva. Interpretasi secara manual memakan waktu lebih lama dan melelahkan sehingga dapat mengurangi keakuratan dalam interpretasi. Seiring perkembangan waktu dibutuhkan pemanfaatan yang lebih pada data well log dibutuhkan sebuah metode yang dapat meningkatkan kualitas interpretasi atau analisis sumur, yaitu data mining. Dalam penelitian ini, metode data mining Support Vector Machine (SVM) diterapkan untuk identifikasi zona reservoir potensial hidrokarbon dari data well log di Formasi Mungaroo AA, Lapangan Wheatstone, Cekungan Carnarvorn Utara. Data well log yang digunakan berasal dari lima (5) sumur yang dibor di Lapangan yang sama. Penerapan SVM membutuhkan proses pelatihan, satu sumur digunakan sebagai data latih dan fungsi yang diperoleh darinya diterapkan pada 4 sumur yang tersisa. Fase klasifikasi akan meliputi 2 fase, yaitu fase penentuan litologi (sandstone dan non-sand) dan penentuan potensi hidrokarbon (produktif dan non-produktif). Kedua fase ini diterapkan secara bertahap menggunakan metode SVM. Hasil penelitian didapatkan nilai rata-rata akurasi pada fase penentuan litologi (sandstone dan non-sand) menunjukkan nilai sebesar 0.98 sedangkan pada fase penentuan potensi hidrokarbon (produktif dan non-produktif) menunjukkan nilai sebesar 0.93. Hasil akhir pengujian hipotesis t dengan membandingkan distribusi nilai Net To Gross (NTG) hasil prediksi dengan NTG field report menunjukkan menunjukkan bahwa distribusi antara keduanya mendekati. Meskipun hasil pengujian hipotesa yang didapatkan mengatakan distribusi nilai NTG mendekati, peneliti merekomendasikan bahwa metode data mining dapat digunakan sebagai alat verifikasi dalam mengidentifikasi zona reservoir potensial hidrokarbon. Hal ini dapat mengurangi ketidakpastian dan meningkatkan kualitas analisis sumur. ......Sandstone reservoir occupies the first position or dominates as a hydrocarbon resource. The sandstone reservoir is the main or most important target for hydrocarbon exploration in the Mungaroo AA Formation in the Offshore area of ​​the North Carnarvon Basin. One of the fields with a sandstone reservoir in the Mungaroo AA Formation is the Wheatstone Field. Identification of potential hydrocarbon reservoir zones is a fundamental matter in the oil and gas industry. One of the instruments that are currently very powerful because of its wide use and large investment value because it is not as expensive as core analysis and well testing is the well log. Well log data is still being interpreted manually or curve analysis. Manual interpretation takes longer and is tiring so it can reduce the accuracy of interpretation. Along with the development of time, more use of well log data is needed, and a method that can improve the quality of interpretation or well analysis is needed, namely data mining. In this study, the Support Vector Machine (SVM) data mining method was applied to identify potential hydrocarbon reservoir zones from well log data in the Mungaroo AA Formation, Wheatstone Field, North Carnarvon Basin. The well log data used is from five (5) wells drilled in the same field. The application of SVM requires a training process, one well is used as training data, and the functions derived from it are applied to the remaining 4 wells. The classification phase will include 2 phases, namely the lithology determination phase (sandstone and non-sand) and the determination of the hydrocarbon potential (productive and non-productive. These two phases are implemented in stages using the SVM method. The results showed that the average accuracy value in the lithology determination phase showed a value of 0.98 while the hydrocarbon potential determination phase showed a value of 0.93. The result of testing the t hypothesis by comparing the distribution of the predicted NTG value with the NTG field report shows that the distribution between the two is identical. Although the results of the hypothesis testing obtained say the distribution of NTG values ​​is identical, the researcher recommends that the data mining method can be used as a verification tool in identifying potential hydrocarbon reservoir zones. This can reduce uncertainty and improve the quality of well analysis
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Selly Anastassia Amellia Kharis
Abstrak :
Kanker merupakan kelompok penyakit yang ditandai dengan pertumbuhan dan penyebaran sel-sel abnormal yang tidak terkendali. Jika penyebaran sel tersebut tidak terkendali, hal ini dapat menyebabkan kematian. Berdasarkan American Cancer Society, pendeteksian dini terhadap sel kanker dapat meningkatkan angka harapan hidup seorang pasien lebih dari 97 . Banyak penelitian yang telah meneliti mengenai klasifikasi kanker menggunakan microarray data. Microarray data terdiri dari ribuan fitur gen namun hanya memiliki puluhan atau ratusan sampel. Hal tersebut dapat menurunkan akurasi klasifikasi sehingga perlu dilakukannya pemilihan fitur sebelum proses klasifikasi. Pada penelitian ini dilakukan dua tahap pemilihan fitur. Pertama, support vector machine recursive feature elimination SVM-RFE digunakan untuk prefilter gen. Kedua, hasil pemilihan fitur SVM-RFE diseleksi kembali dengan menggunakan artificial bee colony ABC yang merupakan algoritma optimisasi berdasarkan perilaku lebah madu. Penelitian ini menggunakan dua dataset, yaitu data kanker paru-paru Michigan dan Ontario dari Kent Ridge Biomedical Dataset. Hasil percobaan dengan menggunakan SVM-RFE dan ABC menunjukkan nilai akurasi klasifikasi yang lebih tinggi daripada tanpa pemilihan fitur, SVM-RFE, dan ABC, yaitu 98 untuk data kanker paru-paru Michigan dengan menggunakan 100 fitur dan 97 untuk data kanker paru-paru Ontario dengan menggunakan 70 fitur. ......Cancer is a group of diseases characterized by the uncontrolled growth and spread of abnormal cells. If the spread is not controlled, it can result in death. Based on American Cancer Society, early detection of cancerous cells can increase survival rates for patients by more than 97 . Many study showed new aspect of cancer classification based microarray data. Microarray data are composed of many thousands of features genes and from tens to hundreds of instances. It can decrease classification accuracy so feature selection is needed before the classification process In this paper, we propose two stages feature selection. First, support vector machine recursive feature elimination recursive feature elimination SVM RFE is used to prefilter the genes. Second, the SVM RFE features selection result is selected again using Artificial Bee Colony ABC which is an optimization algorithm based on a particular intelligent behavior of honeybee swarms. This research conducted experiments on Ontario and Michigan Lung Cancer Data from Kent Ridge Biomedical Dataset. Experiment results demonstrate that this approach provides a higher classification accuracy rate than without feature selection, SVM RFE, and ABC, 98 for Michigan lung cancer dataset with using 100 features and 97 for Ontario lung cancer dataset with using 70 features.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49733
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>