Hasil Pencarian

Ditemukan 65449 dokumen yang sesuai dengan query

Alexander Patrick

Pendekatan machine learning untuk klasifikasi fitur yang memengaruhi popularitas sebuah makalah penelitian = Machine learning approach in classifying features determining the popularity of a published paper

"Popularitas sebuah paper yang terpublikasi dapat dilihat dari jumlah sitasi yang diperoleh paper tersebut. Akan tetapi, faktor-faktor yang mendukung banyak atau sedikitnya jumlah sitasi yang diperoleh bisa bermacam-macam. Faktor-faktor tersebut merupakan fokus pencarian pada penelitian ini. Pendekatan machine learning digunakan untuk mengetahui faktor-faktor tersebut. Beberapa fitur telah diekstrak dari dataset yang berisi kumpulan paper. Metode klasifikasi digunakan dalam supervised learning dengan model yang dibentuk dari dataset yang digunakan. Algoritma Logistic Regression dipakai untuk melakukan fitting terhadap model dengan hasil daya diskriminasi sistem sebesar 74,1% yang dilihat dari luas wilayah di bawah kurva ROC (Area Under Curve/AUC). Nilai koefisien dari model Logistic Regression digunakan sebagai feature importance untuk mencari nilai pengaruh dari tiap fitur terhadap output klasifikasi baik positif maupun negatif.

Popularity of a published paper can be indicated by its citation number. However, the factors determining the number of citation may vary. Those factors are the focus of this research. A machine learning approach is used to find out the factors. Some features are going to be extracted from a dataset of published papers. A classification method is going to be applied in a supervised learning with the machine learning model extracted from the dataset. A classification algorithm Logistic Regression is used to fit the model resulting a discrimination power of 74.1% from a calculation of area under ROC curve (AUC). A feature importance approach using coefficient score from Logistic Regression is also applied in determining the importance of each feature in determining the negative and positive classification."

Depok: Fakultas Teknik Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Naufal Alharits Sadly

Komparasi permodelan regresi berbasis machine learning studi kasus: sistem prediksi kadar fenolik daun bisbul (diospyros discolor willd.) berbasis citra hiperspektral VNIR = Comparison of machine learning-based regression modeling case study: phenolic level prediction system for bisbul leaf (diospyros discolor willd.) based on VNIR hyperspectral image

"Sistem prediksi kadar fenolik pada daun Bisbul (Diospyros discolor Willd.) berbasis citra hiperspektral visible and near-infrared (VNIR) terbukti mampu dibuat dan mendapatkan hasil dengan nilai yang baik. Kamera hiperspektral dengan rentang panjang gelombang 400-1000 nm digunakan dalam mengakuisisi citra VNIR pada daun Bisbul. Penelitian ini membahas mengenai komparasi dari beberapa model regresi baru dengan penelitian terdahulu yang diharapkan bisa mendapatkan hasil yang lebih baik dalam memprediksi kadar fenolik pada daun Bisbul. Digunakan tiga model regresi dalam membuat sistem prediksi ini yaitu model Partial Least Square Regression (PLSR), Random Forest, dan XGBoost Regressor. Sistem Prediksi menggunakan PLSR menghasilakan sebesar 3,62 (RMSE test), 0,81 (R2 test), nilai akurasi sebesar 91,3%, dan waktu training 0,27 detik. Sistem Prediksi menggunakan Random Forest tanpa menggunakan seleksi fitur menghasilakan sebesar 4,04 (RMSE test), 0,81 (R2 test), nilai akurasi sebesar 90,86%, dan waktu training 17,81 detik. Sistem Prediksi menggunakan Random Forest dengan seleksi fitur menghasilakan sebesar 3,84 (RMSE test), 0,79 (R2 test), nilai akurasi sebesar 91,31%, dan waktu training 19,05 detik. Sistem Prediksi menggunakan XGBoost Regressor dengan menghasilakan sebesar 3,48 (RMSE test), 0,83 (R2 test), nilai akurasi sebesar 91,1%, dan waktu training 24,9 detik. Performa terbaik dihasilkan oleh model XGBoost Regressor dengan sedikit perbedaan dengan PLSR. Model XGBoost Regressor berhasil meningkatkan performa sebesar 14% pada RMSE dan 2% pada R2 berbanding dengan PLSR.

Phenolic levels prediction system on Bisbul leaves (Diospyros discolor Willld.) Based on visible and near-infrared (VNIR) hyperspectral images proved to be able to be made and get results with good values. Hyperspectral camera with a wavelength range of 400-1000 nm is used in acquiring VNIR images on Bisbul leaves. This study discusses the comparison of several new regression models with previous studies that are expected to get better results in predicting phenolic levels in Bisbul leaves. Three regression models are used in making this prediction system, namely the Partial Least Square Regression (PLSR), Random Forest, and XGBoost Regressor models. The prediction system using PLSR produces 3.62 (RMSE test), 0.81 (R2 test), an accuracy of 91.3%, and a training time of 0.27 seconds. The prediction system uses Random Forest without using the selection feature with results of 4.04 (RMSE test), 0.81 (R2 test), an accuracy of 90.86%, and a training time of 17.81 seconds. The prediction system using Random Forest with feature selection resulted in 3.84 (RMSE test), 0.79 (R2 test), an accuracy of 91.31%, and a training time of 19.05 seconds. The prediction system using the XGBoost Regressor produces 3.48 (RMSE test), 0.83 (R2 test), an accuracy of 91.1%, and training time of 24.9 seconds. The best performance is produced by XGBoost Regressor with a slight difference from PLSR. The XGBoost Regressor model managed to improve performance by 14% on RMSE and 2% on R2 compared to PLSR."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Perkembangan teknologi informasi dan komunikasi (TIK) ; faktor-faktor yang mempengaruhi serta pemetaan kondisi TIK di Jakarta Selatan

"Analisis perkembangan Teknologi Informasi dan Komunikasi (TIK)

merupakan suatu cara untuk mengetahui kondisi perkembangan TIK dan

faktor-faktor yang mempengaruhi kondisi TIK di berbagai bidang. Pada tugas

akhir ini akan dicari faktor-faktor yang mempengaruhi kondisi perkembangan

TIK pada bidang rumah tangga, pendidikan, dan bisnis di Jakarta Selatan.

Pada awal analisis, dilakukan analisis cluster berdasarkan sejumlah variabel

pada availability of infrastructure to use ICTs. Dan analisis regresi logistik

dilakukan untuk menyelidiki faktor-faktor yang mempengaruhi perkembangan

TIK di tiap-tiap bidang, dan diperoleh faktor yang mempengaruhi

perkembangan TIK di bidang rumah tangga adalah jumlah pendapatan, di

bidang pendidikan adalah uang bangunan, sedangkan di bidang bisnis

adalah jumlah infrastruktur TIK. Dan terakhir, dilakukan penggambaran

kondisi perkembangan TIK di tiap-tiap kecamatan di Jakarta Selatan

berdasarkan tiap-tiap bidang dengan menggunakan metode Geographic

Information Systems (GIS)."

Universitas Indonesia, 2009

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Aldinda Albanna

Identifikasi Zonasi Tunjangan Lokasi untuk Outlet-outlet Bank Syariah "X" Menggunakan Regresi Logistik Ordinal = Identification of Location Allowance Zone for Bank Syariah "X" Outlets Using Ordinal Logistic Regression

"Sebuah perusahaan memerlukan sumber daya manusia yang baik agar dapat mencapai visi, misi, serta tujuan yang telah ditetapkan. Sumber daya manusia yang baik dapat dibangun dengan meningkatkan kesejahteraan dan kenyamanan pegawai sehingga produktivitas bekerja diharapkan dapat meningkat. Salah satu upaya yang dapat dilakukan adalah pemberian reward, seperti tunjangan lokasi. Bank Syariah "X" merupakan salah satu lembaga pada bidang perbankan syariah yang memberikan tunjangan lokasi kepada pegawainya. Peraturan yang ditetapkan pada Bank Syariah "X" mengenai tunjangan lokasi merupakan tunjangan yang diberikan kepada pegawai berdasarkan lokasi pegawai tersebut bekerja. Bank Syariah "X" memiliki tiga kategori tunjangan lokasi, yaitu Zona 1, Zona 2, dan Zona 3 & 4. Kebijakan ini terakhir ditetapkan pada tahun 2021. Sedangkan, pada rentang waktu hingga saat ini, terdapat perubahan kondisi, seperti keadaan lokasi outlet (cabang), pertumbuhan ekonomi, dan relokasi outlet Bank Syariah "X". Oleh karena itu, penelitian ini bertujuan untuk menganalisis faktor-faktor yang menjelaskan penentuan zonasi tunjangan lokasi memprediksi zonasi tunjangan lokasi outlet baru dari Bank Syariah "X". Zonasi tunjangan lokasi ditentukan berdasarkan faktor kemahalan, keterpencilan, dan akses lokasi. Faktor-faktor yang diduga mewakili faktor kemahalan, keterpencilan, dan akses lokasi, serta memengaruhi penentuan zonasi tunjangan lokasi adalah indeks harga konsumen (IHK), indeks pembangunan manusia (IPM), indeks kemahalan konstruksi (IKK), indeks pilar infrastruktur (IPI), jarak outlet ke puskesmas terdekat (JOP), dan jarak outlet ke sekolah dasar terdekat (JOSD). Zonasi tunjangan lokasi terdiri dari tiga kategori, yaitu Zona 1, Zona 2, dan Zona 3 & 4 yang bersifat ordinal sehingga model yang cocok adalah regresi logistik ordinal. Berdasarkan tujuan penelitian dan jenis variabel terikat, metode analisis data yang digunakan adalah regresi logistik ordinal. Penelitian ini menghasilkan faktor-faktor yang menjelaskan penentuan zonasi tunjangan lokasi adalah indeks kemahalan konstruksi (IKK), indeks pilar infrastruktur (IPI), dan jarak outlet ke puskesmas terdekat (JOP). Model regresi logistik yang dibentuk menghasilkan akurasi sebesar 70% dan balanced accuracy pada Zona 1 sebesar 81.2%, Zona 2 sebesar 70.8%, dan Zona 3 & 4 sebesar 76.7%. Hasil model regresi logistik ordinal ini dapat digunakan untuk memprediksi zonasi tunjangan lokasi outlet baru dari Bank Syariah "X". Berdasarkan kebijakan awal Bank Syariah "X", diperoleh bahwa sebanyak 80 outlet atau sebesar 35.6% outlet salah diklasifikasikan oleh model.

A company needs good human resources in order to achieve the vision, mission, and goals that have been set. Good human resources can be built by improving employee welfare and comfort so that work productivity is expected to increase. One of the efforts that can be made is the reward, such as location allowances. Bank Syariah “X” is one of the institutions in the field of Islamic banking that provides location allowances to its employees. The regulations set at Bank Syariah “X” regarding location allowances are allowances given to employees based on their replacement. Bank Syariah “X” has three categories of location allowances, namely Zone 1, Zone 2, and Zones 3 & 4. This policy was last established in 2021. Meanwhile, in the time span until now, there have been changes in conditions, such as the location of outlets (branches), economic growth, and the relocation of Bank Syariah “X” outlets. Therefore, this study aims to analyze the factors that explain the determination of location allowance zoning and predict the location allowance zoning of new outlets of Bank Syariah “X”. Location allowance zoning is determined based on the factors of costliness, remoteness, and location access. Factors that are thought to represent the factors of costliness, remoteness, and location access, and influence the determination of location allowance zoning are the consumer price index (CPI), human development index (HDI), construction cost index (CCI), infrastructure pillar index (IPI), outlet distance to the nearest health center (JOP), and outlet distance to the nearest elementary school (JOSD). The location allowance zoning consists of three categories, namely Zone 1, Zone 2, and Zone 3 & 4, which are ordinal in nature, so the suitable model is ordinal logistic regression. Based on the research objectives and the type of dependent variable, the data analysis method used is ordinal logistic regression. This research results in factors that explain the zoning determination of location allowances are the construction cost index (CCI), infrastructure pillar index (IPI), and the distance of the outlet to the nearest health center (JOP). The logistic regression model that was formed produced an accuracy of 70% and balanced accuracy in Zone 1 of 81.2%, Zone 2 of 70.8%, and Zones 3 & 4 of 76.7%. The results of this ordinal logistic regression model can be used to predict the zoning allowances for the location of new outlets of Bank Syariah “X”. Based on the initial policy of Bank Syariah "X", it's obtained that 80 outlets or 35.6% of outlets misclassified by the model. "

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nadya Safitri

Perbandingan Machine Learning dan Deep Learning pada Klasifikasi Teks dan Analisis Sentimen terhadap Dampak Covid-19 di Indonesia pada Twitter dengan Pendekatan Multi-Label = Comparative of Machine Learning and Deep Learning on Text Classification and Sentiment Analysis on the Impact of Covid-19 in Indonesia on Twitter Using a Multi-Label Approach

"Pemilihan metode machine learning atau deep learning menjadi suatu permasalahan dalam klasifikasi. Hal ini didapatkan dari penelitian yang menunjukkan bahwa deep learning kinerjanya lebih baik daripada machine learning, namun terdapat penelitian bahwa kedua metode tersebut kinerjanya tidak menentu tergantung dataset yang digunakan. Oleh karena itu, penelitian ini membandingkan kinerja dari machine learning dan deep learning untuk permasalahan klasifikasi teks dan analisis sentimen terhadap dampak Covid-19 di Indonesia. Hasil penelitian ini menunjukkan bahwa kinerja pada klasifikasi teks dan analisis sentimen menggunakan metode machine learning lebih baik dibandingkan dengan deep learning. Hasil penelitian mengenai klasifikasi teks menunjukkan bahwa kinerja metode machine learning yaitu Label Powerset dan Random Forest menghasilkan akurasi 77 % sedangkan kinerja metode deep learning yaitu Long Short-Term Memory (LSTM) dan Gate Reccurent Unit (GRU) menghasilkan akurasi 48%. Hasil penelitian mengenai analisis sentimen menunjukkan bahwa kinerja metode machine learning yaitu Label Powerset dan Random Forest menghasilkan akurasi 63 % sedangkan kinerja metode deep learning yaitu Long Short-Term Memory (LSTM) dan Gate Reccurent Unit (GRU) menghasilkan akurasi 55% dan 54%. Keseimbangan jumlah label pada semua label mempengaruhi hasil dari klasifikasi. Oleh karena itu, disarankan untuk menggunakan metode untuk menyeimbangkan jumlah label yang digunakan untuk klasifikasi.

The choice of machine learning or deep learning methods becomes a problem in classification. This is obtained from research which shows that deep learning performs better than machine learning, but there is research that the two methods perform erratically depending on the dataset used. Therefore, this study compares the performance of machine learning and deep learning for text classification problems and sentiment analysis on the impact of Covid-19 in Indonesia. The results of this study indicate that the performance of text classification and sentiment analysis using machine learning methods is better than deep learning. The results of research on text classification show that the performance of machine learning methods, namely Label Power and Random Forest, produces an accuracy of 77%, while the performance of deep learning methods, namely Long Short-Term Memory (LSTM) and Gate Recurrent Unit (GRU), produces an accuracy of 48%. The results of the research on sentiment analysis show that the performance of machine learning methods, namely Label Power and Random Forest, produces an accuracy of 63%, while the performance of deep learning methods, namely Long Short-Term Memory (LSTM) and Gate Recurrent Unit (GRU), produces 55% and 54% accuracy. The balance of the number of labels on all labels affects the results of the classification. Therefore, it is advisable to use a method to balance the number of labels used for classification."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Dewi Retnoningsih

Analisis regresi logistik untuk matched data

"Skripsi ini akan membahas tentang analisis regresi logistik untuk matched data. Dalam matched data, observasi - observasi dikelompokkan ke dalam suatu kelompok yang sama, yang disebut dengan matched set, berdasarkan suatu variabel yang disebut dengan variabel matching. Keberadaan variabel matching diperhitungkan dalam analisis ini. Penaksiran parameter dalam model regresi logistik untuk matched data dilakukan dengan menggunakan metode maksimum likelihood bersyarat dengan pendekatan Newton - Raphson.

Uji kecocokan model menggunakan uji Rasio Likelihood dan uji signifikansi masing - masing parameter dalam model menggunakan uji Wald. Dalam penerapan metode analisis regresi logistik untuk matched data untuk melihat pengaruh "adanya kelahiran bayi dengan operasi caesar" dan "adanya kelahiran bayi premature" terhadap "kelahiran bayi dengan berat rendah (< 2500 gr)" dengan "umur ibu" sebagai variabel matching, didapat bahwa "adanya kelahiran bayi premature" mempengaruhi "kelahiran bayi dengan berat rendah (< 2500 gr)", dan "adanya kelahiran bayi dengan operasi caesar" tidak mempengaruhi ?kelahiran bayi dengan berat rendah (< 2500 gr)."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2007

S27721

UI - Skripsi Membership Universitas Indonesia Library

Aryo Hastungkoro Harimurti Mukarta

Penalized Logistic Regression dan Random Forest Classifier untuk Prediksi Subrogasi Potensial Penjaminan Kredit = Penalized Logistic Regression and Random Forest Classifier for Predicting Credit Guarantee Potential Subrogation

"Dalam melakukan klaim subrogasi, perusahaan penjaminan kredit sering mengalami kendala di mana pihak yang dijamin tidak melunasi pinjamannya sesuai kesepakatan. Hal ini membuat perusahaan penjaminan kredit mengklasifikasikan pihak terjamin yang berpotensi untuk melunasi pinjaman kreditnya, dan pihak terjamin yang tidak berpotensi untuk melunasi pinjaman kreditnya. Penelitian ini mengevaluasi prediksi potensi klaim subrogasi pada penjaminan kredit menggunakan berbagai model pembelajaran mesin berdasarkan data dunia nyata dari perusahaan penjaminan kredit besar di Indonesia. Eksperimen menggunakan Logistic Regression, sebuah metode prediksi berbasis persamaan linier, Penalized Logistic Regression, bentuk dari Logistic Regression yang koefisien-koefisiennya diberikan penalti, dan Random Forest Classifier, sebuah metode berbasis ensemble learning. Model diuji menggunakan Hold-out Validation dan data prediksi dibandingkan dengan data uji untuk false positive dan false negative. Hasil penelitian menunjukkan bahwa Random Forest Classifier memberikan hasil yang lebih baik, menunjukkan kinerja rata-rata yang lebih baik dibandingkan dengan Logistic Regression dan Penalized Logistic Regression . Temuan studi ini dapat digunakan oleh analis klaim dan subrogasi baik dari perusahaan penjaminan kredit maupun peneliti independen dalam menilai kekuatan dan kelemahan masing-masing model dan untuk menyusun aturan keputusan yang efektif secara empiris untuk mengevaluasi kebijakan subrogasi.

In making subrogation claims, credit guarantee companies often encounter problems where the guaranteed party does not pay off their loan according to the agreement. This makes credit guarantee companies classify those who have the potential to pay off their credit loans, or those that are not potential to pay off their credit loans. This study evaluates the prediction of potential subrogation claims in credit guarantees using various machine learning models based on real-world data from a large credit guarantee company in Indonesia. The experiment used Logistic Regression, a linear equation-based prediction method, Penalized Logistic Regression, a form of Logistic Regression whose coefficients are penalized, and the Random Forest Classifier, an ensemble learning-based method. The model was tested using Hold-out Validation and prediction dataset were compared to test dataset for false positives and false negatives. The results showed that the Random Forest Classifier gave better results, indicating a better average performance compared to Logistic Regression and Penalized Logistic Regression. The findings of this study can be used by claims and subrogation analysts from both credit guarantee companies and independent researchers in assessing the strengths and weaknesses of each model and to construct empirically effective decision rules for evaluating subrogation policies."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Ratna Azzakia

Analisis variabel-variabel yang memengaruhi partisipasi perempuan untuk bekerja di Kelurahan Pondok Cina = Analysis of variables that affect women's participation to work in Kelurahan Pondok Cina

"ABSTRAK

Partisipasi perempuan bekerja merupakan keputusan perempuan usia kerja untuk terlibat aktif secara ekonomi, baik sudah bekerja, menganggur, maupun sedang mencari pekerjaan. Persentase jumlah angkatan kerja perempuan meningkat sebesar 48 persen dalam kurun waktu 10 tahun, yaitu pada tahun 2006-2016. Keterlibatan perempuan di pasar kerja memberikan dampak positif untuk kesejahteraan ekonomi keluarga dan secara tidak langsung berdampak bagi perbaikan perekonomian negara. Penelitian ini bertujuan untuk menganalisis variabel-variabel yang memengaruhi partisipasi perempuan bekerja menggunakan metode Chi-Square Automatic Interaction Detection (CHAID) dan mengetahui risiko partisipasi perempuan bekerja berdasarkan variabel-variabel yang berpengaruh menggunakan metode Regresi Logistik. Variabel dependen pada penelitian ini adalah partisipasi perempuan bekerja, sedangkan variabel independen pada penelitian ini terdiri dari variabel tingkat pendidikan, usia, status perkawinan, pelatihan kerja, tanggungan, dukungan keluarga, hutang, dan kesehatan. Penelitian ini menggunakan data primer berjumlah 211 responden dengan lokasi penelitian di Kelurahan Pondok Cina yang terdiri dari 99 responden bekerja dan 112 responden yang tidak bekerja. Hasil analisis menggunakan

metode CHAID diperoleh variabel dukungan keluarga paling berpengaruh terhadap partisipasi perempuan bekerja. Kemudian terdapat variabel tanggungan dan tingkat pendidikan yang juga berpengaruh. Tingkat keakuratan hasil klasifikasi secara keseluruhan sebesar 73% menggunakan metode CHAID. Hasil analisis menggunakan metode Regresi Logistik diperoleh bahwa risiko partisipasi perempuan bekerja dengan mendapat

dukungan keluarga 12,64 kali lipat dari perempuan yang tidak mendapat dukungan keluarga. Perempuan yang tidak memiliki tanggungan memiliki risiko partisipasi kerja sebesar 4,25 kali lipat dari perempuan yang memiliki tanggungan, sedangkan perempuan dengan tingkat pendidikan dasar memiliki risiko partisipasi kerja sebesar 1,04 kali lipat dari perempuan dengan tingkat pendidikan tinggi.

ABSTRACT

Womens work participation is a decision of working-age women to be actively involved economically, as already working, unemployed, and those who still looking for work. Percentage of womens workforce increased up to 48 percent in a decade which is from 2006-2016. The involvement of women in the labor market gives positive impact on families economy wealthy and indirectly has an effect on improving the countrys economy. This study has a purpose to analyze variables that affect the participation

of womens work which uses Chi-Square Automatic Interaction Detection (CHAID) method. Also this study is conducted to know the risks in womens work participation based on the variables that are affected through the use of Logistic Regression method. Dependent variable in this study is womens work participation while independent variables of this study consists of level of education, age, marriage status, work training, dependent, familys support, debt, and health. This study uses primary data with total 211 respondents that consist of 99 respondents who work, and 112 respondents are unemployed. The research site is in Kelurahan Pondok Cina. The result of the analysis using CHAID method obtained variable of family`s support as the most influential variable towards womens work participation. Then dependent variable and level of education variable also affected. The overall accuracy of classification result is 73% using the CHAID method. The analysis result using Logistic Regression method found that the risk of participation of women working with family support was 12.64 times that of the women who did not receive family support. Working-women who have no dependents have a risk of work participation of 4.25 times that of women who have dependent meanwhile women with a basic level of education have a risk of participation of 1.04 times that of women with higher education."

2019

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Karin Marshanda

Penerapan Adaptive Synthetic Sampling Approach dalam Menangani Ketidakseimbangan Kelas pada Dataset Wi-Fi Attacks = Application of Adaptive Synthetic Sampling Approach in Handling Class Imbalance in Wi-Fi Attacks Dataset

"Instrusion Detection System (IDS) merupakan sistem untuk mendeteksi serangan dalam jaringan, baik lokal maupun internet. Dalam melakukan deteksi penyalahgunaan atau deteksi anomali, beberapa peneliti telah menggunakan data mining untuk mengidentifikasi berbagai jenis intrusi, termasuk yang jarang terjadi. Namun, data mining rentan terhadap data imbalance (data tidak seimbang) yang dapat mengurangi efektivitas algoritma klasifikasi karena asumsi mayoritas classifier terhadap distribusi yang seimbang. Berdasarkan permasalahan tersebut, maka akan dilakukan penelitian terkait penanganan data imbalance menggunakan metode Adaptive Synthetic Sampling (ADASYN) dengan cara menghasilkan data sintetis pada kelas minoritas agar algoritma klasifikasi dapat bekerja lebih baik. Metode ADASYN efektif bekerja pada variabel prediksi berjumlah 2 kelas (binary class), namun dikarenakan penelitian ini berurusan dengan masalah multiclass, makan akan digunakan pendekatan One-Vs-One (OVO) untuk menyeimbangkan kelas. Keefektifan ADASYN akan dievaluasi melalui implementasinya pada dataset Wi-Fi attacks, yaitu Aegean Wi-Fi Intrusion Dataset (AWID2). Data sebelum dan setelah rebalancing dievaluasi dengan menggunakan metode klasifikasi seperti regresi logistik dan Support Vector Machine (SVM), untuk dibandingkan nilai precision, recall, spesifisitas, serta F1-score dari kedua dataset tersebut. Meskipun ADASYN hanya meningkatkan nilai precision dalam dataset Wi-Fi attacks, dengan menggunakan metode klasifikasi SVM kernel polynomial terbukti efektif dalam mendeteksi kelas serangan, meskipun performa metrik lainnya tidak mencapai tingkat yang sama.

An Intrusion Detection System (IDS) is a system designed to detect attacks within networks, both local and internet-based. In the realm of misuse detection or anomaly detection, researchers have utilized data mining to identify various types of intrusions, including those that occur infrequently. However, data mining is susceptible to data imbalance, which can reduce the effectiveness of classification algorithms due to their assumption of balanced distribution. To address this issue, research will focus on handling data imbalance using the Adaptive Synthetic Sampling (ADASYN) method, which generates synthetic data for the minority class to enhance the performance of classification algorithms. ADASYN is effective for predictive variables with binary class scenarios, but since this study deals with multiclass problems, an One-Vs-One (OVO) approach will be employed to balance the classes. The effectiveness of ADASYN will be evaluated by implementing it on the Wi-Fi attacks dataset, specifically the Aegean Wi-Fi Intrusion Dataset (AWID2). Data before and after rebalancing will be evaluated using classification methods such as logistic regression and Support Vector Machine (SVM). Metrics including precision, recall, specificity, and F1-score will be compared between the two datasets. Although ADASYN only improves precision values in the Wi-Fi attacks dataset, using SVM with a polynomial kernel has proven effective in detecting attack classes, although other metric performances did not reach the same level."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

14-24-64198984

UI - Skripsi Membership Universitas Indonesia Library

Baihaqi Hamiz

Rancang Bangun Sistem Embedded Pengukuran Konsentrasi Hemoglobin Noninvasif deng = Design and Development of an Embedded System for Non Invasive Hemoglobin Concentration Measurement Using Machine Learning Method Based on Nvidia Jetson Nano

"Hemoglobin adalah komponen darah yang penting untuk mengikat oksigen di paru paru dan mendistribusikannya ke seluruh tubuh. Metode invasif tidak memungkinkan pengukuran real-time dalam situasi darurat. Pengembangan metode noninvasif untuk pemeriksaan hemoglobin menghadapi tantangan dalam hal akurasi, ketepatan, dan keringkasan alat. Pada penelitian menggunakan sensor MAX30102 sebagai pembaca gelombang merah dan inframerah, OLED sebagai alat yang menampilkan hasil prediksi, dan Nvidia Jetson Nano sebagai processor. Alat juga dilengkapi dengan pembacaan detak jantung, SpO2, dan dua tombol untuk mengulang pembacaan dan mematikan alat. Pelatihan model dilakukan menggunakan dataset yang diperoleh dari riset sebelumnya, "Pengembangan Instrumentasi Pengukur Konsentrasi Hemoglobin Non-Invasif Berbasis Photoplethysmography dan Machine Learning" oleh Ester Vinia (2023). Setelah melakukan pelatihan pada lima jenis model (Dense Neural Network, Decision Tree, Support Vector, Gradient Boosting, dan Random Forest), didapatkan model dengan metode Dense Neural Network memiliki akurasi R2 sebesar 96%, loss MAE sebesar 0,2 dan MSE sebesar 0,11, metode Decision Tree memiliki akurasi R2 sebesar 90%, loss MAE sebesar 0,27 dan MSE sebesar 0,3, metode Support Vector memiliki akurasi R2 sebesar 17%, loss MAE sebesar 1,2 dan MSE sebesar 2,61, metode Gradient Boosting memiliki akurasi R2 sebesar 89%, loss MAE sebesar 0,43 dan MSE sebesar 0,3, dan metode Random Forest memiliki akurasi R2 sebesar 99%, loss MAE sebesar 0,05 dan MSE sebesar 0,02. Prototipe alat kemudian dibuat menggunakan pembelajaran mesin bermodel Random Forest Regressor. Model kemudian ditanam di Nvidia Jetson Nano sehingga alat dapat dioperasikan dengan efisien dan cepat. Pada pengujian alat, didapatkan nilai akurasi sebesar 93,27%.

Hemoglobin is a vital blood component responsible for binding oxygen in the lungs and distributing it throughout the body. Invasive methods do not allow real-time measurement in emergency situations. Developing noninvasive methods for hemoglobin examination faces challenges in accuracy, precision, and device compactness. In this research, a MAX30102 sensor was used for reading red and infrared waves, an OLED for displaying prediction results, and an Nvidia Jetson Nano as the processor. The device also includes heart rate and SpO2 readings, and two buttons for repeating readings and turning off the device. The model was trained using a dataset obtained from previous research, "Development of Non Invasive Hemoglobin Concentration Measurement Instrumentation Based on Photoplethysmography and Machine Learning" by Ester Vinia (2023). After training on five types of models (Dense Neural Network, Decision Tree, Support Vector, Gradient Boosting, and Random Forest), the Dense Neural Network model achieved an R2 accuracy of 96%, MAE loss of 0.2, and MSE loss of 0.11; the Decision Tree method achieved an R2 accuracy of 90%, MAE loss of 0.27, and MSE loss of 0.3; the Support Vector method achieved an R2 accuracy of 17%, MAE loss of 1.2, and MSE loss of 2.61; the Gradient Boosting method achieved an R2 accuracy of 89%, MAE loss of 0.43, and MSE loss of 0.3; and the Random Forest method achieved an R2 accuracy of 99%, MAE loss of 0.05, and MSE loss of 0.02. The device prototype was then developed using the Random Forest Regressor model. The model was embedded in the Nvidia Jetson Nano, allowing the device to operate efficiently and quickly. During testing, the device achieved an accuracy of 93.27%."

Fakultas Teknik Universitas Indonesia, 2024

S-pdf

UI - Dokumentasi Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian