Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query
cover
Teuku Mohamad Anshar Lotan
Abstrak :
ABSTRAK
Tujuan dari permasalahan filtrasi spam adalah mengidentifikasi sebuah e-mail sebagai spam atau bukan spam. Dengan berkembangnya machine learning, semakin banyak permasalahan yang dapat diselesaikan. Salah satunya adalah filtrasi spam. Filtrasi e-mail spam dapat dilakukan dengan bantuan klasifikasi biner dengan machine learning untuk pengklasifikasiannya. Dalam penelitian ini akan menggunakan regresi logistik dan perceptron untuk melakukan proses filtrasi spam. Data yang digunakan menggunakan dataset Enron Spam. Hasil dari analisis menunjukkan bahwa regresi logistik menunjukkan hasil yang lebih baik dari perceptron. Di mana akurasi regresi logistik mencapai 97,02, sedangkan tingkat akurasi perceptron adalah 95,54, tetapi waktu pelatihan perceptron hanya membutuhkan waktu 3,8 sekon, sedangkan regresi logistik membutuhkan waktu 780,94 sekon.
ABSTRACT
The goal of spam filtering is to identify an e mail as spam or not spam. With the rapid development of machine learning, more problem can be solved. One of it is spam filtration. E mail spam filtering can be done with the help of binary classifier using machine learning for the classification. This research would use logistic regression and perceptron technique to filter spam. Data taken from Enron Spam dataset. The result indicate that logistic regression show better result than perceptron. Whereas the accuracy from logistic regression could reach 97,02, while accuracy from perceptron is 95,54, meanwhile the training time for perceptron takes only 3,8 second, while logistic regression takes about 780,94 second.
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Glorya Khoirunnissa
Abstrak :
Kategori email dapat diklasifikasikan dengan menggunakan pemrosesan bahasa alami (natural language processing) dan machine learning untuk mempelajari pola kata pada email. Model yang digunakan adalah support vector machine, multinomial naïve bayes, dan random forest dan digunakan teknik oversampling berupa random oversampling, synthetic minority over-sampling (SMOTE), dan adaptive synthetic sampling (ADASYN) untuk menyeimbangkan distribusi kelas dan meningkatkan performa pada model. Hasil yang diperoleh bahwa teknik ADASYN menghasilkan performa terbaik dalam klasifikasi email yang divalidasi dengan k-fold cross-validation (k=7) dibandingkan dua teknik lainnya. Rata-rata akurasi mencapai 97.87% pada support vector machine, sedangkan multinomial naive bayes 77.97% , dan random forest 95.94% dengan menggunakan teknik ADASYN. ......Email categories can be classified using natural language processing (NLP) and machine learning to learn word patterns in emails. The models used are support vector machine, multinomial naïve Bayes, and random forest. Oversampling techniques such as random oversampling, synthetic minority over-sampling (SMOTE), and adaptive synthetic sampling (ADASYN) are employed to balance the class distribution and improve model performance. The results show that the ADASYN technique achieves the best performance in email classification validated with k-fold cross-validation (k=7) compared to the other two techniques. The average accuracy reaches 97.87% for support vector machine, 77.97% for multinomial naïve Bayes, and 95.94% for random forest when using the ADASYN technique.
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fikri Afif Musyaffa
Abstrak :
Spam email merupakan salah satu masalah yang sangat sering dialami dalam komunikasi digital. Penelitian ini bertujuan untuk membandingkan efektifitas dua algoritma klasifikasi Naïve Bayes dan Support Vector Machine (SVM) dalam mendeteksi email spam. Tahapan penelitian dimulai dari pengumpulan data, pemrosesan teks seperti penghapusan angka, tanda baca, dan huruf kapital, penghapusan kata-kata umum, stemming, dan transformasi teks menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). Dataset dibagi menjadi dua bagian yaitu data latih dan data uji dengan perbandingan 80% data latih dan 20% data uji. Hyperparameter yang digunakan pada metode Naive Bayes adalah nilai alpha, sedangkan pada SVM adalah nilai C, gamma dan kernel Radial Basis Function (RBF). Evaluasi menggunakan parameter metrik akurasi, presisi, recall, dan F1 score. Hasil penelitian menunjukkan metode SVM dengan hyperparameter tuning dan teks preprocessing mendapatkan nilai akurasi 98,74% sedangkan metode naïve bayes hanya 98,35%. Sehingga dapat disimpulkan bahwa metode Support Vector Machine lebih efektif dibandingkan metode Naïve Bayes dalam mendeteksi email spam. ......Spam email is one of the most frequently encountered issues in digital communication. This study aims to compare the effectiveness of two classification algorithms, Naïve Bayes and Support Vector Machine (SVM), in detecting spam emails. The research stages begin with data collection, followed by text processing such as removing numbers, punctuation, and capital letters, removing common words, stemming, and text transformation using the Term Frequency-Inverse Document Frequency (TF-IDF) method. The dataset is divided into two parts: training data and testing data, with a ratio of 80% training data and 20% testing data. The hyperparameter used for the Naïve Bayes method is the alpha value, while for SVM, the hyperparameters are the values of C, gamma, and the Radial Basis Function (RBF) kernel. Evaluation is conducted using accuracy, precision, recall, and F1 score metrics. The results show that the SVM method, with hyperparameter tuning and text processing, achieved an accuracy of 98.74%, whereas the Naïve Bayes method only achieved 98.35%. Therefore, it can be concluded that the Support Vector Machine method is more effective than the Naïve Bayes method in detecting spam emails.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Fajar Milleano Mufianto
Abstrak :
Penggunaan email dalam berkomunikasi dan melakukan transaksi tidak dapat dihindari di era ini. Email memegang peranan penting dalam perkembangan Internet sekarang. Karena pentingnya email, maka semakin banyak pula penjahat yang berusaha mengeksploitasi email untuk kepentingan pribadi. Salah satu bentuk eksploitasi tersebut adalah pengiriman email yang tidak diinginkan (spam email). Email spam yang masuk ke kotak email pengguna dapat menimbulkan bahaya dan kerugian terhadap pengguna tersebut. Untuk mengatasinya diperlukan sebuah mekanisme penyaringan email spam sehingga tidak membahayakan pengguna. Melalui aplikasi, email akan dipilah dan apabila dikategorikan sebagai email spam, maka akan diisolasi ke tempat khusus. Aplikasi yang dipilih adalah aplikasi yang bersifat open source, sehingga mudah untuk dicapai dan digunakan oleh banyak orang seperti Apache SpamAssassin dan Rspamd. Tujuan dari Skripsi ini adalah untuk melihat seberapa efektif aplikasi penyaring spam berbasis open source untuk mengklasifikasikan dan mencegah masuknya email spam ke kotak masuk pengguna. ......The use of email in communicating and making transactions is unavoidable in this era. Email plays an important role in the development of the Internet today. Due to the importance of email, more and more criminals are trying to exploit email for personal gain. One form of exploitation is sending unsolicited email (spam email). Spam email that enter a user's mailbox can cause harm and loss to the user. To overcome this, a spam email filtering mechanism is needed so that it does not endanger users. Through the application, the email will be sorted and if it is categorized as spam, it will be isolated to a special place. The chosen application is an application that is open source, so it is easy to reach and use by many people such as Apache SpamAssassin and Rspamd. The purpose of this Thesis is to see how effective an open source based spam filter application is in classifying and preventing spam emails from entering users' inboxes.
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library