Hasil Pencarian

Ditemukan 97922 dokumen yang sesuai dengan query

Rosyda Hanavania

Metode Filter untuk Seleksi Fitur pada Klasifikasi WIFI Attacks = Filter Method for Feature Selection on WIFI Attacks Classification

"Curse of dimensionality atau kutukan dimensi merupakan permasalahan nyata terkait dengan dimensi tinggi pada data. Fenomena ini menyebabkan model bekerja secara tidak optimal, terjadinya overfitting, dan sulitnya proses komputasi data. Kasus data dengan dimensi tinggi ini banyak ditemukan pada data IoT (Internet of Things). Kompleksitas pada ekosistem IoT tersebut membuat sistem mengalami kesulitan dalam penangkapan properti serangan dan memaksa sistem untuk memperkuat keamanannya. Salah satu upaya yang paling banyak digunakan untuk pertahanan sistem IoT adalah dengan Intrusion Detection System (IDS). Penelitian ini menggunakan dataset Aegean WIFI Intrusion Dataset (AWID2) yang berisikan lalu lintas trafik internet pada jaringan WIFI. Data AWID2 berisi 2 juta records dan dikelompokkan ke dalam empat kelas yaitu normal, impersonation, injection, dan flooding. Untuk menyelesaikan permasalahan dimensi tinggi pada data ini, dilakukan teknik reduksi dimensi yaitu seleksi fitur jenis filter. Metode filter yang digunakan yaitu, Correlation based Feature Selection (CFS), Information Gain (IG), dan ANOVA F-test. Setiap metode seleksi fitur tersebut dilanjutkan dengan metode multiclass Support Vector Machines (SVM) one vs rest dan one vs one. Hasil dari penelitian ini menunjukkan bahwa metode fitur seleksi ANOVA F-test dengan metode klasifikasi SVM kernel polynomial dengan menggunakan 7 fitur terbaik merupakan metode paling baik untuk digunakan pada klasifikasi WIFI attacks data AWID2. Hal tersebut ditunjukkan melalui nilai accuracy=0,9766, F1score=0,8385, precision=0,9854, dan recall=0,7708.

Curse of dimensionality is a problem related to high dimensions of data. This phenomenon can cause the non-optimal performance model, overfitting, and the data will be computationally expensive. This high dimensional data is mostly found in IoT (Internet of Things) data. The complexity of the IoT ecosystem makes it difficult for the system to capture potential attacks and forces the system to strengthen its security. One of the most widely used efforts to defend IoT systems is the Intrusion Detection System (IDS). This research will use the Aegean WIFI Intrusion Dataset (AWID2) which contains internet traffic on WIFI networks. AWID2 dataset contains of 2 million records and are grouped into four classes, namely normal, impersonation, injection, and flooding. To overcome the problem of high dimensions, this study used dimensional reduction techniques, namely feature selection filter method. The filter methods used are Correlation based Feature Selection (CFS) Information Gain (IG), and ANOVA F-test. Each of these feature selection methods is then followed by building a classification model using multiclass Support Vector Machines (SVM) one vs one and one vs rest method. This study tells that combination of feature selection ANOVA F-test method and SVM with polynomial kernel is the best method to use on WIFI attacks classification. It is indicated by the score of performance metrics namely, accuracy=0,9766, F1score=0,8385, precision=0,9854, and recall=0,7708. "

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Dilla Fadlillah Salma

Analisis akurasi metode support vector machine, random forest, dan logistic regression dalam mengklasifikasi data asuransi mobil dengan implementasi metode seleksi fitur one dimensional naive bayes classifier = Accuracy analysis of support vector machine, random forest, and logistic regression method in classifying car insurance data with one dimensional naive bayes classifier features selection implementation

"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional NaÃ¯ve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.
Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Kesia Gabriele

Komparasi Metode SMOTE, SMOTE-ENN, dan SMOTE-CUT dalam Menangani Imbalanced Data pada Klasifikasi Multi-Kelas dengan Support Vector Machine (SVM) = Comparative Analysis of SMOTE, SMOTE-ENN, and SMOTE-CUT in Multi-Class SVM Classification for Imbalanced Data

"Support Vector Machine (SVM) merupakan model klasifikasi yang dikenal dengan keakuratan klasifikasi yang tinggi. Namun, Support Vector Machine (SVM) menghasilkan hasil klasifikasi yang kurang optimal jika data yang digunakan tidak seimbang (imbalanced data). Terdapat beberapa cara dalam menangani data yang tidak seimbang, salah satunya dengan metode resampling. Metode resampling sendiri terbagi dalam dua pendekatan yaitu over-sampling dan under-sampling. Salah satu pendekatan over-sampling yang popular adalah Synthetic Minority Over-sampling Technique (SMOTE). SMOTE bekerja dengan membangkitkan sampel sintetis pada kelas minoritas. Untuk meningkatkan kinerja model, SMOTE dapat digabungkan dengan pendekatan under-sampling seperti Edited Nearest Neighbors (ENN) dan Cluster-based Undersampling Technique (CUT). Dalam kombinasinya dengan SMOTE, ENN berperan sebagai cleaning untuk menghapus data sintetis dari penerapan SMOTE yang tidak relevan dan dianggap sebagai noise. Sementara, CUT beperan dalam mengidentifikasi sub-kelas dari kelas mayoritas untuk menekan angka over-sampling sekaligus meminimalisir hilangnya informasi penting pada kelas mayoritas selama proses undersampling. Kombinasi over-sampling dan under-sampling ini saling melengkapi dan mengatasi kekurangan dari masing-masing metode. Penelitian ini memfokuskan perbandingan performa metode resampling SMOTE beserta variasinya, yaitu SMOTEENN dan SMOTE-CUT dalam mengklasifikasikan data multi-kelas yang tidak seimbang menggunakan Support Vector Machine. Dari analisis yang dilakukan, diperoleh kesimpulan bahwa SMOTE-CUT cenderung menghasilkan performa klasifikasi yang lebih baik dibandingkan dengan SMOTE ataupun SMOTE-ENN. Walaupun demikian, keseluruhan metode resampling (SMOTE, SMOTE-ENN, dan SMOTE-CUT) mampu meningkatkan kinerja dari model klasifikasi Support Vector Machine (SVM).
Support Vector Machine (SVM) is popular classfier that is known for its high accuracy value. However, Support Vector Machine (SVM) may not perform well on imbalanced datasets. There are several ways to handle imbalanced data, one of them is through resampling methods. Resampling methods itself divided into two approaches, oversampling and under-sampling. One of the popular over-sampling methods is Synthetic Minority Over-sampling Technique (SMOTE). SMOTE works by generating synthetic samples for the minority class. SMOTE can be combined with under-sampling methods such as Edited Nearest Neighbors (ENN) or Cluster-based Under-sampling Technique (CUT). In combination with SMOTE, ENN acts as a cleaning role to remove synthetic data generated from SMOTE application that is not relevant and considered as noise. Meanwhile, CUT plays a role in identifying sub-class form the majority class to reduce over-sampling while minimizing the loss of important information in the majority class during the under-sampling process. The combination of over-sampling and undersampling is needed to complement and overcome the weakness of each method. This research mainly focuses on comparing the performance of the resampling method SMOTE and its variations, SMOTE-ENN and SMOTE-CUT, in classifying multi-class imbalanced data using Support Vector Machine. From the analysis conducted, it was concluded that data with resampling SMOTE-CUT shows better classification performance compare to data with resampling SMOTE or SMOTE-ENN. However, any resampling method (SMOTE, SMOTE-ENN, and SMOTE-CUT) can handle imbalanced data and improve Support Vector Machine performance."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Ayu Andya Ruvita

Pengenalan wajah untuk klasifikasi pria atau wanita menggunakan support vector machine dengan pemilihan fitur fisher score = Face recognition for male or female classification using support vector machine with fisher score feature selection

"Pengenalan wajah merupakan teknologi yang berkembang sangat pesat. Pengenalan wajah mampu menghasilkan beragam informasi mengenai identitas seseorang dengan cepat dan akurat. Salah satunya, mampu memberikan informasi mengenai jenis kelamin dari setiap orang yaitu sebagai pria atau wanita. Proses klasifikasi pria atau wanita ini menjadi hal yang sangat penting dalam berbagai bidang, seperti bisnis berbasis online, kontrol akses, absensi kehadiran, sistem keamanan, identifikasi individu yang tidak dikenal, dan lain-lain. Dalam penelitian ini digunakan Fisher Score sebagai metode pemilihan fitur, dan Support Vector Machine SVM sebagai metode klasifikasi untuk mengukur tingkat akurasi dan running time dari klasifikasi pria atau wanita dengan data yang digunakan berasal dari Computer Science Research Projects. Hasil akurasi dari klasifikasi SVM kernel polynomial d = 4 dengan pemilihan fitur Fisher Score mencapai tingkat akurasi tertinggi yaitu 100 pada 3000 fitur dengan data training 90 . Sedangkan hasil akurasi terbaik dari klasifikasi SVM tanpa pemilihan fitur mencapai 77.5 pada data training 80.
Face recognition is a technology that is growing very rapidly. Face recognition is able to produce various information about the identity of a person quickly and accurately. One of the utility of face recognition is the ability to provide information about the gender of each person as a male or female. The process of classifying male or female is of paramount importance in many areas, such as online based businesses, access control, attendance, security systems, identification of unknown individuals, and so on. In this study Fisher Score is used as a feature selection method, and Support Vector Machine SVM as a classification method to measure the accuracy and running time of male or female classification with data used from Computer Science Research Projects. Accuracy results from SVM polynomial kernel classification d 4 with Fisher Score feature selection reaches the highest accuracy level of 100 at 3000 features with 90 training data. While the best accuracy results from SVM classification without feature selection reached 77.5 in 80 training data."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Soya Febeauty Yama Otantia Pradini

Klasifikasi tingkatan parasit plasmodium pada citra sel darah merah menggunakan multiclass support vector machines = Plasmodium classification on red blood cells image using multiclass support vector machines

"Metode klasifikasi telah banyak digunakan dalam berbagai aspek, termasuk dalam bidang bioinformatika. Salah satu penggunaan metode klasifikasi ini adalah untuk menentukan tingkatan fase dari sebuah penyakit. Dalam penelitian ini akan dilakukan pengklasifikasian parasit plasmodium falciparum. Parasit tersebut merupakan parasit penyebab penyakit malaria. Penyakit ini dapat ditularkan oleh gigitan nyamuk Anopheles betina yang mengandung plasmodium di dalamnya. Hasil penelitian ini dapat digunakan untuk menentukan fase parasit plasmodium yang berada di sel darah orang yang terjangkit malaria. Tujuan penelitian ini adalah untuk mengetahui persentase keberhasilan dan menganalisis metode Multiclass Support Vector Machines untuk memprediksi tingkatan parasit tersebut. Data yang digunakan adalah data citra sel darah merah yang telah terjangkit tiga jenis tingkatan parasit plasmodium falciparum. Dalam prosesnya, penelitian ini akan menggunakan Canopy sebagai IDE bahasa pemrograman python. Dari 112 percobaan, didapatkan tingkat akurasi tertinggi sebesar 87,5% untuk metode Multclass SVM one vs rest dan one vs one menggunakan 4-fold cross validation dengan parameter linear kernel dan C=1.
Classification methods has been frequently used in various aspects, including bioinformatics. One of its purpose of this classification is to determine phase level of a disease. This research will classify the phase of plasmodium falciparum parasite which causes malaria.The disease is spread by an infected female Anopheles mosquito which contains Plasmodium. The result of this research could be use to determine Plasmodium parasite phase in infected peoples red blood cells. The purpose of this research is to discover the success rate of Multiclass Support Vector Machines method and analyze it in order to predict the parasite phase levels. The data of this study is image data of red blood cells which was infected by three kinds of Plasmodium falciparum parasite levels. In the process, this study will be using Canopy as Integration Development Environtments of phyton programming language. From 112 trials, the highest number of accuracy is 87.5% for Multiclass Support Vector Machines one vs rest and one vs all methods which used the 4-fold cross validation with C=1 as parameter for linear kernel."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

T52713

UI - Tesis Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Rafiqatul Khairi

Klasifikasi Kanker Pankreas menggunakan Kernel-based Support Vector Machine = Pancreatic Cancer Classification using Kernel-based Support Vector Machine

"Kanker pankreas adalah penyakit di mana sel-sel tumor ganas (kanker) berkembang di jaringan pankreas, yaitu organ di belakang perut bagian bawah dan di depan tulang belakang, yang membantu tubuh menggunakan dan menyimpan energi dari makanan dengan memproduksi hormon untuk mengontrol kadar gula darah dan enzim pencernaan untuk memecah makanan. Biasanya, kanker pankreas jarang terdeteksi pada tahap awal. Salah satu tanda seseorang mengalami kanker pankreas adalah diabetes, terutama jika itu bertepatan dengan penurunan berat badan yang cepat, penyakit kuning, atau rasa sakit di perut bagian atas yang menyebar ke punggung. Di antara berbagai jenis kanker, kanker pankreas memiliki tingkat kelangsungan hidup terendah, yaitu hanya sekitar 3-6% dari mereka yang didiagnosis yang dapat bertahan hidup selama lima tahun. Jika pasien didiagnosis tepat waktu untuk perawatan, peluang mereka untuk bertahan hidup akan meningkat. Terdapat penanda tumor yang biasa digunakan untuk mengikuti perkembangan kanker pankreas, yaitu CA 19-9 yang dapat diukur dalam darah. Orang sehat dapat memiliki sejumlah kecil CA 19-9 dalam darah mereka. Kadar CA 19-9 yang tinggi seringkali merupakan tanda kanker pankreas. Tetapi kadang-kadang, kadar tinggi dapat menunjukkan jenis kanker lain atau gangguan non-kanker tertentu, seperti sirosis dan batu empedu. Karena kadar CA 19-9 yang tinggi tidak spesifik untuk kanker pankreas, CA 19-9 tidak dapat digunakan dengan sendirinya untuk skrining atau diagnosis. Ini dapat membantu memantau perkembangan kanker dan efektivitas pengobatan kanker. Dalam studi ini, metode Kernel-based Support Vector Machine digunakan untuk mengklasifikasikan hasil tes darah CA19-9 menjadi dua bagian; data pasien yang didiagnosis dengan kanker pankreas atau pasien normal (tidak terdiagnosis kanker pankreas). Metode ini memperoleh akurasi sekitar 95%.
Pancreatic cancer is a disease in which malignant (cancerous) tumor cells develop in pancreatic tissue; organ behind the lower abdomen and in front of the spine, which helps the body use and store energy from food by producing hormones to control blood sugar levels and digestive enzymes to break down food. Usually, pancreatic cancer is rarely detected at an early stage. One sign of a person with pancreatic cancer is diabetes, especially if it coincides with rapid weight loss, jaundice, or pain in the upper abdomen that spreads to the back. Among various types of cancer, pancreatic cancer has the lowest survival rate of only about 3-6% of those diagnosed who can survive for five years. If patients are diagnosed on time for treatment, their chances of survival will increase. There is a tumor marker commonly used to follow the course of pancreatic cancer, namely CA 19-9 which can be measured in the blood. Healthy people can have small amounts of CA 19-9 in their blood. High levels of CA 19-9 are often a sign ofÂ pancreatic cancer. But sometimes, high levels can indicate other types of cancer or certain noncancerous disorders, includingÂ cirrhosisÂ andÂ gallstones. Because a high level of CA 19-9 is not specific for pancreatic cancer, CA 19-9 cannot be used by itself for screening or diagnosis. It can help monitor the progress of your cancer and the effectiveness of cancer treatment. In this study, the Kernel-based Support Vector Machine method is used to classify CA19-9 blood test results into two sections including data on patients diagnosed with pancreatic cancer or normal patients. This method will get an accuracy of around 95%."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Theresia Veronika Rampisela

Klasifikasi data skizofrenia dengan support vector machines dan twin support vector machines = Classification of schizophrenia data using support vector machines and twin support vector machines

"Skizofrenia adalah gangguan jiwa yang serius dan kronis. Penyakit ini ditandai dengan gangguan dalam pemikiran, persepsi, dan tingkah laku. Karena gangguan-gangguan ini dapat memicu penderita Skizofrenia untuk bunuh diri atau mencoba bunuh diri, penderita Skizofrenia mempunyai usia harapan hidup yang lebih rendah dari populasi umum. Skizofrenia juga sulit untuk didiagnosis karena belum ada tes secara fisik untuk mendiagnosisnya dan gejala-gejalanya sangat mirip dengan beberapa gangguan jiwa lainnya. Dengan menggunakan Northwestern University Schizophrenia Data, penelitian ini bertujuan untuk mengklasifikasikan orang yang menderita Skizofrenia dan orang yang tidak menderita Skizofrenia. Data tersebut terdiri dari 392 observasi dan 65 variabel yang merupakan data demografis dan data kuesioner Scale for the Assessment of Positive Symptoms dan Scale for the Assessment of Negative Symptoms yang diisi oleh klinisi. Metode klasifikasi yang digunakan adalah machine learning dengan metode Support Vector Machines SVM dan Twin Support Vector Machines Twin SVM menggunakan MATLAB R2017a. Simulasi dilakukan dengan data dan persentase data training dan testing yang berbeda-beda. Pada setiap simulai, akurasi serta running time diukur. Validasi dan evaluasi performa dari model yang telah dioptimasi dilakukan dengan mengambil rata-rata dari sepuluh kali Hold-Out Validation yang dilakukan. Pada umumnya, metode Twin SVM berhasil mengklasifikasikan data Skizofrenia dengan lebih akurat dibandingkan dengan metode SVM. Metode Twin SVM dengan kernel Gaussian menghasilkan hasil akhir akurasi klasifikasi data Skizofrenia yang terbaik, yaitu 91,0 . Berdasarkan hasil akhir running time, metode SVM dengan kernel Gaussian untuk klasifikasi data Skizofrenia mempunyai running time yang paling cepat, 0,664 detik. Selain itu, metode SVM dengan kernel linear, metode SVM dengan kernel Gaussian, dan metode Twin SVM untuk klasifikasi data Skizofrenia berhasil mencapai akurasi hingga 95,0 dalam setidaknya satu simulasi.
Schizophrenia is a severe and chronic mental disorder. This disorder is marked with disturbances in thoughts, perceptions, and behaviours. Due to these disturbances that can trigger Schizophrenics to commit suicide or attempt to do so, Schizophrenics have a lower life expectancy than the general population. Schizophrenia is also difficult to diagnose as there is no physical test to diagnose it yet and its symptoms are very similar to several other mental disorders. Using Northwestern University Schizophrenia Data, this research aims to distinguish people who are Schizophrenics and people who are not. The data consists of 392 observations and 65 variables that are demographic data as well as clinician filled Scale for the Assessment of Positive Symptoms and Scale for the Assessment of Negative Symptoms questionnaires. Classification methods that are used are machine learning with Support Vector Machines SVM and Twin Support Vector Machine Twin SVM using MATLAB R2017a. Simulations are done with different data and percentage of training and testing data. In each simulation, accuracy and running time are measured. Performance validation and evaluation of the optimized models are done by taking the average of ten times Hold Out Validations that were done. In general, Twin SVM successfully classified Schizophrenia data more accurately than the SVM method. Twin SVM with Gaussian kernel produced the best final accuracy in classifying Schizophrenia data, 91.0 . Based on the final running time, SVM with Gaussian kernel has the fastest running time in classifying Schizophrenia data, 0.664 seconds. Furthermore, SVM with linear kernel, SVM with Gaussian kernel, and Twin SVM managed to reach an accuracy of 95.0 in at least one simulation in classifying Schizophrenia data."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Alya Nadifa Putri

Penerapan Support Vector Machines dan Perbandingan Metode Risk Parity, Minimum Variance, dan Equal-Weight dalam Pemilihan Portofolio ETF di Indonesia = Application of Support Vector Machines and Comparison of Risk Parity, Minimum Variance, and Equal-Weight Methods for ETF Portfolio Selection in Indonesia

"Exchange Traded Funds (ETF) adalah salah satu produk investasi pasar modal yang berupa reksa dana dan diperjualbelikan secara real time layaknya saham. ETF dapat menjadi pilihan investasi yang cocok untuk investor pemula karena lebih terdiversifikasi daripada saham. Meskipun demikian, investor tetap harus menyesuaikan profil risiko masing-masing karena semua produk investasi pasti memiliki risiko yang harus dihadapi. Oleh karena itu, sebelum membeli produk investasi perlu dilakukan analisis terlebih dahulu. Dalam penelitian ini dilakukan analisis menggunakan indikator teknikal untuk mengklasifikasi ETF menggunakan metode Support Vector Machines (SVM). Data ETF yang digunakan adalah data historis mingguan 25 ETF yang terdaftar di Bursa Efek Indonesia sejak 9 Maret 2020 hingga 6 Maret 2022. Indikator teknikal yang digunakan adalah moving average, support and resistance, Bollinger bands, dan directional indicator. Hasil dari perhitungan analisis indikator teknikal tersebut selanjutnya digunakan sebagai data input atau fitur dalam proses klasifikasi SVM. Proses klasifikasi bertujuan untuk mengklasifikasikan ETF yang berpotensi menghasilkan return ≥ 1 (return positif) atau < 1 (return negatif) di minggu selanjutnya dengan model SVM terbaik. Model SVM terbaik ditentukan berdasarkan nilai akurasi tertinggi. Pada penelitian ini, model SVM terbaik menghasilkan akurasi sebesar 77% dengan kernel polinomial dan proporsi data training sebanyak 80%. Terdapat 14 ETF yang diprediksi menghasilkan kelas positif oleh model SVM terbaik dan selanjutnya dilakukan pembentukan portofolio menggunakan metode Risk Parity (RP), Minimum Variance (MinV), dan Equal-Weight (EW). Ketiga metode pembentukan portofolio tersebut dibandingkan performanya untuk memilih portofolio terbaik berdasarkan nilai rasio Sharpe tertinggi. Hasil dari penelitian ini, metode MinV menghasilkan rasio Sharpe tertinggi dibandingkan dua metode lainnya.
Exchange-Traded Funds (ETF) is one of the Capital Market investment products in the form of mutual funds and being traded real-time like stocks. ETFs can be suitable for new investors because they are more diversified than stocks. Nonetheless, the risk profile of each investor must be suited since all investment products have risks that must be faced. Therefore, an analysis must be done before buying the investment products. In this study, an analysis was conducted using 4 technical indicators, such as, moving averages, support and resistance, Bollinger bands, and directional indicators. They were used to classify ETFs using the Support Vector Machines (SVM) method. The data used in this study consisted of weekly historical data of 25 ETFs listed on Indonesia Stock Exchange from March 9, 2020, to March 6, 2022. The result of the technical analysis calculation then be used as features in the SVM classification process. The classification process aims to classify ETFs that have the potential to generate returns of ≥ 1 (positive return) or < 1 (negative return) in the following week using the best SVM model. The best SVM model was determined based on the highest accuracy value. An accuracy of 77% with a polynomial kernel was achieved from a 80% proportion of training data. The 14 ETFs were predicted to gain a positive return using SVM for then a portfolio formed using the Risk Parity (RP), Minimum Variance (MinV) and Equal-Weight (EW) methods. The performances of those portfolio were being compared to choose the best portfolio based on the highest Sharpe Ratio value. The highest Sharpe Ratio portfolio were obtained by SVM-MinV method in this study."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Ni Putu Ayu Audia Ariantari

Perbandingan aplikasi dari klasifikasi support vector machines dan fuzzy support vector machines dalam memprediksi future claim pada asuransi kendaraan bermotor = Comparison between support vector machines and fuzzy support vector machines as classifiers for predicting future claim in automobile insurance

"Kestabilan perekonomian suatu negara ditentukan oleh sektor-sektor ekonomi di dalamnya. Salah satu sektor yang sedang berkontribusi secara signifikan di Indonesia adalah asuransi. Industri Asuransi sedang mengalami perluasan pada beberapa tahun terakhir. Seiring dengan perluasan tersebut, terdapat kompetisi antar perusahaan asuransi di Indonesia. Kompetisi ini menuntut perusahaan asuransi untuk lebih cerdik dalam mengungguli pasar. Tetapi, perlu diperhatikan bahwa perusahaan asuransi harus selalu sadar akan tingkat risiko yang harus ditanggungnya. Sehingga perlunya dilakukan penelitian tentang kemungkinan klaim di masa depan dari perusahaan asuransi.
Dalam penelitian ini, akan difokuskan pada sektor asuransi kendaraan bermotor di Indonesia. Model yang diajukan pada penelitian ini adalah suatu machine learning yang biasa digunakan untuk masalah klasifikasi dan prediksi. Metode klasifikasi yang digunakan adalah Support Vector Machines dan Fuzzy Support Vector Machines. Penelitian ini menggunakan data historis polis dari suatu perusahaan asuransi umum di Indonesia. Data historis polis ini terdiri dari 7.373 data dengan periode waktu berlaku polis adalah setahun terhitung dari Januari 2015 sampai dengan Desember 2016. Setelah itu, dibandingkan hasil dari kedua metode tersebut untuk mendapatkan hasil yang terbaik. Penggunaan data historis polis dari suatu asuransi umum di Indonesia ini menunjukkan bahwa Support Vector Machines menghasilkan tingkat akurasi rata rata 100 dalam klasifikasi dua kelas yaitu klaim dan tidak klaim. Memang waktu yang dibutuhkan relatif lama dalam mengklasifikasi data yaitu 4673,33 detik. Kemudian dibandingkan hasil olahan dengan klasifikasi Fuzzy Support Vector Machines dengan komposisi 80 training data dan akurasi yang dihasilkan adalah 99,23 .
Economics stability of a country is depending on each economics sector of the country. One of the most sector that give a significant contribution is Insurance. Insurance Industry is rapidly grow in recent years. As it grows bigger, there is exist one simple core that indeed affected Insurance Industry in Indonesia which is a competition. The competition is to force one Insurance company to be sharper to win the market. On the other hand, one should realize that Insurance company must be well aware of the immerging risk rate. Insurance company indeed should be prepared for the probability of high indemnities. It leads to the point that a study about future claim should be done for this matter.
In this study, one will focus on Automobile Insurance in Indonesia. The proposed model for this matter is using the mighty machine learning that is well known for classification and prediction problems. The classification methods that one will use are Support Vector Machines and Fuzzy Support Vector Machines. The aims of this study are to compare those two classification methods. This study also use a comprehensive historical policy data from a General Insurance company in Indonesia. This data consists of 7373 data with a one year policy starting from January 2015 until December 2016. One will has to compare those two methods to gain the best result. The used of this historical policy data will show that a classification using Support Vector Machines will result in 100 accuracy for binary classification, in this case will be yes or no claim within one year period. It is indeed takes longer to classify using this method. It takes about 4673,33 seconds. Then, one will compare the result with the other method which is Fuzzy Support Vector Machines with the used of 80 training data. It shows that the accuracy is 99,23 ."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017

S-Pdf

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Chastine Fatichah

Metode boosting dengan fungsi pengklasifikasi dasar kernel untuk deteksi obyek manusia

"Deteksi obyek manusia umumnya digunakan pada aplikasi sistem pengawasan untuk keamanan tempat-tempat vital misalnya bandara, bursa efek, bank, dan tempat lainnya. Oleh karena itu, diperlukan suatu metode deteksi obyek manusia yang mempunyai keakuratan tinggi dan waktu deteksi yang cepat. Metode deteksi obyek yang dikenal mempunyai keakuratan tinggi adalah Support Vector Machine (SVM), tetapi metode ini memerlukan waktu lama pada proses deteksi. Metode deteksi obyek yang dikenal mempunyai waktu deteksi yang cepat adalah Boosting namun tingkat akurasi pada metode ini lebih rendah dibandingkan dengan metode SVM. Penelitian ini mengusulkan metode Boosting dengan fungsi pengklasifikasi dasar kernel untuk deteksi obyek manusia atau disebut dengan metode K Boosting. Metode Boosting merupakan suatu metode yang handal dalam mengkombinasikan beberapa pengklasifikasi dasar untuk menciptakan pengklasifikasi kuat yang mempunyai tingkat akurasi lebih tinggi. Metode ini memberikan hasil yang lebih akurat, jika fungsi yang digunakan pada pengklasifikasi dasar mempunyai tingkat akurasi tinggi. Oleh karena itu, penelitian ini mengusulkan kernel sebagai fungsi pengklasifikasi dasarnya. Fungsi kernel digunakan pada metode SVM yang telah terbukti mempunyai keakuratan tinggi. Pada proses deteksi, metode K Boosting menggunakan konsep seperti pada metode Boosting yaitu mengkombinasikan hasil beberapa pengklasifikasi dasar sehingga metode ini mempunyai waktu deteksti yang cepat. Penelitian ini juga mengusulkan enam skenario ujicoba untuk mengukur kinerja metode K Boosting dan dibandingkan dengan metode SVM dan Boosting. Data pelatihan yang digunakan terdiri dari citra yang mempunyai obyek manusia dengan variasi tipe pakaian yang dikenakan dan citra dengan latar belakang natural, gedung, jalan raya, atau taman yang tidak mempunyai obyek manusia. Hasil ujicoba menunjukkan tingkat akurasi deteksi metode K Boosting dan SVM rata-rata lebih dari 80%, sedangkan metode Boosting rata-rata lebih dari 45%. Hasil ujicoba juga menunjukkan waktu deteksi metode K Boosting dan metode Boosting pada variasi data pengujian sekitar 0,015 detik. Sedangkan waktu deteksi metode SVM pada data pengujian sekitar 7 detik. Penelitian ini dapat digunakan sebagai dasar untuk dikembangkan menjadi suatu aplikasi nyata seperti aplikasi sistem pengawasan."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007

T-Pdf

UI - Tesis Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian