Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query

Doni Pradana

Pemodelan Prediksi Customer Churn Menggunakan Teknik Augmentasi Synthetic Minority Over-sampling Technique dan Optimasi Bayesian Adaboost untuk Data Tidak Seimbang = Customer Churn Prediction Modeling Using Synthetic Minority Over-sampling Technique and Adaboost Bayesian Optimization for Data Imbalanced Handling

Abstrak :
Customer churn merupakan masalah serius di banyak sektor, termasuk sektor telekomunikasi. Pengertian costumer churn adalah berhentinya penggunaan suatu layanan dan beralih ke penyedia lain atau tidak memperbarui kontrak. Untuk mengatasi risiko churn, perusahaan telekomunikasi perlu menggunakan model prediksi dengan bantuan metode machine learning. Terdapat beberapa model prediksi churn yang telah diajukan oleh para peneliti, termasuk pemilihan algoritma yang sesuai dan dataset untuk studi kasus. Pada tesis ini menggunakan dataset IBM Telco Customer Churn sebagai data pelatihan dan pengujian. Tantangan umum dalam klasifikasi adalah ketidakseimbangan data, yang dapat menyebabkan kegagalan dalam memprediksi kelas minoritas. Oleh karena itu, tesis ini menggunakan beberapa teknik augmentasi data seperti SMOTE, HAT, dan CVAE, sebagai teknik dalam menyeimbangkan data. Pembelajaran ensembel khususnya metode CART (Classification and Regression Tree) sering digunakan untuk menyelesaikan permasalahan klasifikasi dan regresi. Model Adaboost adalah algoritma pembelajaran ensemble yang menggunakan pohon keputusan sebagai dasar pembelajaran. Dalam pelatihan model Adaboost, Bayesian Optimization (BO) digunakan sebagai metode pencarian hyperparameter terbaik. Dari hasil percobaan dan pengujian yang diajukan, model Adaboost dapat memberikan nilai testing f1-score dan recall sebesar 0,661 dan 0,653 pada pelatihan dengan dataset tidak seimbang. Model Adaboost-SMOTE mempunyai nilai testing f1-score dan recall sebesar 0,646 dan 0,826. Penggunaan optimasi Bayesian Optimization pada model Adaboost-SMOTE dapat menaikkan testing f1-score dan recall menjadi 0,649 dan 0,849. Tes ANOVA dan Tukey HSD mengungkapkan variasi yang signifikan dalam hasil pelatihan dari model machine learning, dan menyoroti dampak penggunaan data seimbang dalam pelatihan model yang signifikan. ......Customer churn is a severe problem in various sectors, including telecommunications. Customer churn refers to discontinuing the service, switching to another provider, or not renewing the contract. To deal with churn risk, telecommunication companies need to use predictive models with the help of machine learning methods. Several churn prediction models have been proposed by researchers, including the selection of suitable algorithms and data sets for case studies. In this thesis, research is conducted using the IBM Telco Customer Churn dataset. A common challenge in classification is data imbalance, which can lead to failure in predicting minority classes. Therefore, this thesis using several data augmentation techniques, such as SMOTE, HAT, and CVAE, for balancing data technique. Ensemble learning, especially the CART (Classification and Regression Tree) method, is often used to solve classification and regression problems. Adaboost is an ensemble learning algorithm that uses decision trees as the basis for learning. In the Adaboost model training, Bayesian Optimization (BO) is used to find the best hyperparameters. From the trials and tests carried out, Adaboost achieved an f1-score and recall test of 0.661 and 0.653, respectively, in training with an unbalanced dataset. The Adaboost SMOTE model achieved f1 and memory test scores of 0.646 and 0.826, respectively. Using Bayesian Optimization in the Adaboost SMOTE model increased the testing f1-score and recall scores to 0.649 and 0.849, respectively. ANOVA and Tukey HSD tests reveal significant variation in machine learning model training results and highlight the considerable impact of using balanced data in model training.

Depok: Fakultas Teknik Universitas Indonesia, 2023

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Firzy Allen

Rancang Bangun Sistem Klasifikasi Pesan Whatsapp Berbasis Algoritma Bi-LSTM Dengan Optimisasi Bayesian Untuk Deteksi Penipuan = Development Of A Whatsapp Message Classification System Based On The Bi-LSTM Algorithm With Bayesian Optimization For Fraud Detection

Abstrak :
Kemajuan teknologi di era digital telah mempermudah akses informasi melalui internet, namun juga meningkatkan risiko penipuan digital. WhatsApp menjadi salah satu platform utama yang rawan terhadap penyebaran pesan penipuan. Dalam konteks ini, penelitian bertujuan untuk mengembangkan sistem klasifikasi pesan WhatsApp yang efektif dan efisien dalam Bahasa Indonesia guna melindungi pengguna dari penipuan digital. Model yang digunakan dalam penelitian ini adalah LSTM, Bi-LSTM, dan Bi-LSTM dengan Optimasi Bayesian. Data yang digunakan adalah dataset pesan dalam Bahasa Indonesia yang telah melalui proses pre-processing dan dibagi menjadi data training dan validation dengan rasio 15%, 20%, dan 30%. Seluruh model dilatih menggunakan parameter batch size 64, epochs 30, dan optimizer Adam. Hasil penelitian menunjukkan bahwa model Bi-LSTM dengan Optimasi Bayesian memiliki akurasi terbaik pada data split 15% sebesar 93%, sementara Bi-LSTM dan LSTM masing-masing mencapai akurasi terbaik sebesar 92% dan 91%. Pengembangan prototype sistem berhasil diintegrasikan dengan WhatsApp Web Client menggunakan library whatsapp-web.js, memungkinkan prediksi tipe pesan dan tingkat akurasi ditampilkan langsung di terminal command. Penelitian ini memberikan kontribusi signifikan dalam meningkatkan keamanan digital dan efisiensi komunikasi dengan mengidentifikasi pesan penipuan secara efektif ......Technological advancements in the digital era have facilitated access to information via the internet but have also increased the risk of digital fraud. WhatsApp has become one of the primary platforms vulnerable to the spread of fraudulent messages. In this context, this study aims to develop an effective and efficient WhatsApp message classification system in Indonesian to protect users from digital fraud. The models used in this study are LSTM, Bi-LSTM, and Bi-LSTM with Bayesian Optimization. The data used is a dataset of messages in Indonesian that have undergone pre-processing and split into training and validation data with ratios of 15%, 20%, and 30%. All models were trained using a batch size of 64, 30 epochs, and the Adam optimizer. The results showed that the Bi-LSTM model with Bayesian Optimization achieved the highest accuracy with a 15% data split at 93%, while the best Bi-LSTM and LSTM models achieved 92% and 91% accuracy, respectively. The prototype system development successfully integrated with the WhatsApp Web Client using the whatsapp-web.js library, allowing message type predictions and accuracy levels to be displayed directly in the command terminal. This study provides a significant contribution to enhancing digital security and communication efficiency by effectively identifying fraudulent messages.

Depok: Fakultas Teknik Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian