Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 8 dokumen yang sesuai dengan query
cover
Robertus Agung Pradana
Abstrak :
Pendeteksian topik adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut, bagaimana hubungan topik-topik tersebut satu sama lainnya, dan bagaimana mereka berubah dari waktu ke waktu. Metod (FCM) merupakan metode yang sering digunakan pada masalah pendeteksian topik. FCM dapat mengelompokkan dataset ke beberapa kelompok dengan baik pada dataset dengan dimensi yang rendah, namun gagal pada dataset yang berdimensi tinggi. Untuk mengatasi permasalahan tersebut, dilakukan reduksi dimensi pada dataset sebelum dilakukan pendeteksian topik. Pada penelitian ini digunakan Convolutional Autoencoder dalam reduksi dimensi pada dataset. Oleh sebab itu, metode yang digunakan pada penelitian ini dalam pendeteksian topik adalah metode Convolutional-based Fuzzy C-Means (CFCM). Data yang digunakan dalam penelitian ini data coherence pada topik antara metode CFCM dengan satu convolutional layer (CFCM-1CL) dan metode CFCM dengan tiga convolutional layer (CFCM-3CL). Hasil penelitian ini menunjukkan bahwa nilai coherence dari metode CFCM-1CL lebih tinggi dibandingkan metode CFCM-3CL.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rilo Chandra Pradana
Abstrak :

Pendeteksian topik adalah teknik untuk memperoleh topik-topik yang dikandung oleh suatu data tekstual. Salah satu metode untuk pendeteksian topik yaitu dengan menggunakan clustering. Namun, secara umum metode clustering tidak menghasilkan cluster yang efektif bila dilakukan pada data yang berdimensi tinggi. Sehingga untuk memperoleh cluster yang efektif perlu dilakukan reduksi dimensi pada data sebelum dilakukan clustering pada ruang fitur yang berdimensi lebih rendah. Pada penelitian ini, digunakan suatu metode bernama Deep Embedded Clustering (DEC) untuk melakukan pendeteksian topik. Metode DEC bekerja untuk mengoptimasi ruang fitur dan cluster secara simultan. Metode DEC terdiri dari dua tahap. Tahap pertama terdiri dari pembelajaran autoencoder untuk memperoleh bobot dari encoder yang digunakan untuk mereduksi dimensi data dan k-means clustering untuk memperoleh centroid awal. Tahap kedua terdiri dari penghitungan soft assignment, penentuan distribusi bantuan untuk menggambarkan cluster di ruang data, dan dilanjutkan dengan backpropagation untuk memperbarui bobot encoder dan centroid. Dalam penelitian ini, dibangun dua macam model DEC yaitu DEC standar dan DEC without backpropagation. DEC without backpropagation adalah DEC yang menghilangkan proses backpropagation pada tahap kedua. Setiap model DEC pada penelitian ini akan menghasilkan topik-topik. Hasil tersebut dievaluasi dengan menggunakan coherence. Dari penelitian ini dapat dilihat bahwa model DEC without backpropagation lebih baik daripada DEC standar bila dilihat dari waktu komputasi dengan perbedaan coherence antara keduanya yang tidak terlalu jauh.


Topic detection is a technique for obtaining the topics that are contained in a textual data. One of the methods for topic detection is clustering. However, generally clustering does not produce an effective cluster when it is done by using data with high dimension. Therefore, to get an effective cluster, dimensionality reduction is needed before clustering in the lower dimensional feature space. In this research we use DEC method for topic detection. DEC method is used to optimize the feature space and cluster simultaneously. DEC is divided into two stages. The first stage consists of autoencoder learning that obtains the weights of the encoder that used for dimension reduction and k-means clustering to get the initial centroid. The second stage consists of the soft assignment calculation, computing the auxiliary distribution that represents the cluster in the data space, and backpropagation to update the encoder weights and the centroid. In this research, two DEC models are built, namely the standard DEC and DEC without backpropagation. DEC without backpropagation is the DEC which eliminate the backpropagation process in the second stage. Every DEC models will produce topics. The results are evaluated using the coherence measure. From this research, it can be seen that DEC without backpropagation is better than standard DEC in terms of computation time with a slight difference in coherence measure.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Jonathan Elloy S
Abstrak :
Barcode merupakan kumpulan data optik yang dapat dimengerti sebuah mesin dan memiliki fungsi yang sangat luas, sebagai contoh adalah karcis parkir kendaraan. Karcis parkir merupakan penanda sebuah kendaraan agar bisa keluar dan masuk ke dalam parkiran tersebut. Kendaraan dapat keluar dari area parkir dengan memindai barcode yang tertera pada karcis parkir. Namun, seringkali karcis parkir memiliki kerusakan yang menyebabkan barcode yang tertera sulit terbaca dengan alat pemindaian dan kendaraan tidak dapat keluar dari area parkir. Kerusakan bisa disebabkan karena kelalaian manusia (terkena air yang menyebabkan karcis basah, atau terlipat-lipat sehingga lecek) dan juga kesalahan pencetak. Untuk menanggulangi permasalahan tersebut, sistem pembacaan barcode karcis parkir dikembangankan. Sistem tersebut menggunakan Autoencoder dan Conditional Generative Adversarial Network (CGAN) dalam merekonstruksi barcode. Barcode dikatakan berhasil direkonstruksi bila decoder (pyzxing dan pyzbar) dapat decoding gambar barcode rekonstruksi tersebut. Penelitian ini menunjukan bahwa model CGAN mampu merekonstruksi karcis parkir dunia nyata dengan true recognition rate 16% tanpa super resolution, sedangkan untuk model autoencoder masih belum mampu untuk merekonstruksi barcode dengan baik. Dengan super resolution, performa kedua model menurun dalam merekonstruksi barcode. CGAN juga lebih baik dibandingkan dengan autoencoder dalam rekonstruksi barcode generated dengan 1x augmentasi. Dengan menggunakan pyzxing decoder, Autoencoder mampu merekonstruksi barcode yang tidak terbaca dengan true recognition rate sebesar 95,50% dan CGAN mampu menghasilkan true recognition sebesar 97% dengan durasi prediksi rata-rata autoencoder 0,17 detik dibandingkan dengan CGAN 0,672 detik per 1 gambar. ......Barcode is a collection of optical data that can be scanned by a machine and has a broad function, such as a vehicle parking ticket. A parking ticket is a marker for a vehicle to enter and exit the parking lot. Vehicles can exit the parking area by scanning the barcode printed on the parking ticket. However, parking tickets often have damage that cause the barcodes printed are difficult to be scanned and the vehicle cannot exit parking area. Damage can be caused by human error (wet tickets, or it folds up so that it becomes wrinkled) as well as printer error. To overcome this problem, a parking ticket barcode reconstruction system was developed. The system uses Autoencoder and Conditional Generative Adversarial Network (CGAN) in reconstructing barcodes. The barcode is said to be reconstructed successfully if the decoders (pyzxing and pyzbar) can decode the reconstructed barcode image. This paper shows that the CGAN model can reconstruct real-world parking tickets with a true recognition rate of 16% without super resolution, while the autoencoder model is still unable to reconstruct barcodes properly. With super resolution, the performance of both models decreases in reconstructing barcodes. CGAN is better than autoencoder in reconstructing barcode generated with 1x augmentation. Using the pyzxing decoder, Autoencoder can reconstruct unreadable barcodes with a true recognition rate of 95.50% and CGAN is able to produce true recognition of 97% with an average autoencoder prediction duration of 0.17 seconds compared to CGAN of 0.672 seconds per 1 image.
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ahmad Ihsan Farhani
Abstrak :
Indonesia menempati posisi kedua sebagai negara penghasil karet alami di dunia. Karet alami memiliki nama lain yaitu lateks. Belakangan ini produksi lateks di Indonesia menurun. Salah satu faktor penyebab menurunnya produksi lateks Indonesia adalah penyakit gugur daun. Jamur Pestalotiopsis sp. adalah salah satu jamur yang dapat menyebabkan penyakit gugur daun. Penyakit gugur daun yang disebabkan oleh jamur ini pertama kali terjadi di Indonesia pada tahun 2016 di Sumatera Utara. Penyakit tersebut menyebabkan tanaman karet menggugurkan daun sebelum waktunya sehingga menyebabkan produksi lateks berkurang. Cadangan makanan pohon karet lebih banyak dialokasikan untuk menumbuhkan kembali daun yang telah gugur dibanding untuk memproduksi lateks. Luas lahan pohon karet di Indonesia yang terinfeksi penyakit gugur daun Pestalotiopsis sp. sudah mencapai 30.328,84 hektar pada tahun 2021 menyebabkan penurunan produksi lateks hingga 30%. Pendeteksian penyakit gugur daun dapat dilakukan secara morfologi yaitu dengan pegamatan pada daun. Gejala penyakit gugur daun yang disebabkan oleh Pestalotiopsis sp. adalah munculnya bintik cokelat pada tulang daun yang lama kelamaan berkembang menjadi bintik cokelat gelap. Bintik tersebut kemudian membesar, menyebabkan daerah di sekitar daun mengalami nekrosis kemudian gugur. Kekurangan dari pendeteksian secara morfologi adalah memerlukan waktu dan tenaga yang cukup besar, serta keahlian khusus di bidang tanaman karet. Dalam penelitian ini, akan dilakukan pendeteksian penyakit gugur daun yang disebabkan oleh jamur Pestalotiopsis sp. dengan bantuan machine learning untuk mengurangi tenaga dan waktu yang diperlukan dalam mendeteksi penyakit gugur daun. Model machine learning akan menerima input data citra daun tanaman karet. Model yang digunakan dalam pendeteksian adalah k-means clustering untuk mensegmentasi data citra daun karet, convolutional autoencoder untuk melakukan fitur ekstraksi pada data citra hasil segmentasi dan suppport vector machine sebagai classifier. Dari hasil eksperimen dengan 5 kali percobaan didapat accuracy testing sebesar 62,91%, accuracy training sebesar 78,50%. Accuracy testing dan accuracy training memiliki perbedaan yang cukup signifikan menandakan model mengalami overfitting. Overfitting terjadi ketika dataset yang tersedia hanya sedikit, pada penelitian ini yaitu 257 data citra namun, model yang dilatih kompleks. Sehingga diperlukan penambahan data citra untuk menghindari overfitting dan meningkatkan accuracy dari model. ......Indonesia occupy the second position as a natural rubber producing country in the world. Natural rubber has another name, namely latex. Recently, latex production in Indonesia has declined. One of the factors causing the decline in Indonesian latex production is leaf fall disease. The fungus Pestalotiopsis sp. is one of the fungi that can cause leaf fall disease. Leaf fall disease caused by this fungus first occurred in Indonesia in 2016 in North Sumatra. The disease causes rubber plants to drop their leaves prematurely, causing reduced latex production. Rubber tree food reserves are allocated more to regrow fallen leaves than to produce latex. The area of rubber trees in Indonesia infected with the Pestalotiopsis sp. leaf fall disease. has reached 30,328.84 hectares in 2021 causing a decline in latex production by up to 30%. Disease detection can be done morphologically by observing the leaves. Symptoms of leaf fall disease caused by Pestalotiopsis sp. is the appearance of brown spots on the veins of the leaves which over time develop into dark brown spots. These spots then enlarge, causing the area around the leaves to experience necrosis and then fall. The drawback of morphological detection is that it requires a lot of time and effort, as well as special expertise in the field of rubber plantations. In this research, we will detect leaf fall disease caused by the fungus Pestalotiopsis sp. with the help of machine learning to reduce the effort and time needed to detect leaf fall disease. The machine learning model will be using image of rubber plant leaves as input data. The model used in the detection is k-means clustering to segment rubber leaf image data, convolutional autoencoder to perform feature extraction on segmented image data and support vector machine as a classifier. From the experimental results with 5 trials obtained testing accuracy of 62.91%, training accuracy of 78.50%. Accuracy testing and accuracy training have significant differences indicating that the model is overfitting. Overfitting occurs when the available dataset is only a few, namely 257 image data but the model being trained is complex. So it is necessary to add image data to avoid overfitting and increase the accuracy of the model.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Wafiyulloh
Abstrak :
Serangan jaringan semakin beragam seiring berkembangnya internet. Dalam menghadapi serangan-serangan tersebut, diperlukan juga pengembangan sistem keamanan internet terhadap pengguna salah satunya adalah IDS. Intrusion detection system (IDS) merupakan sistem keamanan dalam mengawasi aktivitas jaringan yang berbahaya bagi pengguna. Metode yang umum digunakan yaitu signature-based IDS. Signature-based IDS menggunakan daftar serangan siber yang diketahui dalam menentukan jaringan berbahaya atau normal. Akan tetapi, IDS hanya mengetahui serangan yang diketahui saja dan membutuhkan input secara manual untuk mengubah daftar serangan sehingga tidak efektif dalam mengatasi serangan yang tidak ketahui. Oleh karena itu, penelitian ini berfokus pada pengembangan IDS dengan pendekatan machine learning menggunakan model autoencoder untuk reduksi dimensi dan pengaruhnya terhadap model IDS. Autoencoder yang digunakan pada penelitian ini terdapat 2 model yaitu non-symmetric deep autoencoder (NDAE) dan modifikasi dari NDAE menggunakan metode variational autoencoder (VAE) yang disebut sebagai V-NDAE, serta model PCA. Modifikasi NDAE bertujuan untuk mengambil informasi penting dengan menggunakan distribusi probabilistik sehingga menjadi data yang berkualitas untuk pelatihan model IDS. Pengujian reduksi dimensi dari model-model ini dilakukan dengan melatih model IDS yaitu model random forest. Penelitian ini dilakukan pada 2 dataset yang berbeda yaitu dataset CICIDS2017 dan dataset dari simulasi serangan jaringan. Metrik yang digunakan adalah metrik accuracy, precision, recall, F-1 score, ROC curve. Berdasarkan pengujian yang telah dilakukan terhadap dataset CICIDS2017, model NDAE memiliki nilai rata-rata akurasi validasi sebesar 90.85% sehingga memiliki nilai yang lebih besar daripada model V-NDAE yang memiliki nilai rata-rata akurasi validasi sebesar 87.65%. Pelatihan model NDAE menggunakan hyperparameter yang paling optimal yaitu dengan optimizer RMSProp dan batch size sebesar 128. Pada pengujian terhadap dataset dari simulasi serangan jaringan, model NDAE memiliki performa yang lebih baik daripada model V-NDAE dan model PCA. Model NDAE memiliki nilai rata-rata akurasi validasi sebesar 94.66% dan model V-NDAE memiliki nilai rata-rata akurasi validasi sebesar 66.32%. Pelatihan model NDAE menggunakan hyperparameter yang paling optimal yaitu dengan optimizer Adam dan batch size sebesar 32. ......The variety of network attacks increases as the internet evolves. In dealing with these attacks, the development of an internet security system for users is necessary, one of which is IDS. An intrusion detection system (IDS) is a security system designed to monitor network activity that is dangerous for users. The commonly used method is signature-based IDS. Signature-based IDS uses a signature database of known cyber attacks to determine whether a network is dangerous or normal. However, this IDS only recognizes known attacks and requires manual input to change the signature database of attacks, making it ineffective in dealing with unknown attacks. Therefore, this research focuses on developing an IDS using a machine learning approach, specifically using an autoencoder model for dimensionality reduction and its impact on the IDS model. The models used in this research consists of a non-symmetric deep autoencoder (NDAE), modification of NDAE using the variational autoencoder (VAE) method, and PCA model. The modified NDAE can capture important information from the latent distribution, which helps stabilize the training of the model. Dimensionality reduction testing for both models is performed by training an IDS model, specifically a random forest model. This research is conducted on two different datasets: the CICIDS2017 dataset and a dataset from network attack simulations. The evaluation metrics used are accuracy, precision, recall, F-1 score, and ROC curve. Based on the testing performed on the CICIDS2017 dataset, the NDAE model achieves an average validation accuracy of 90.85%, which is higher than the average validation accuracy of 87.65% for the V-NDAE model and PCA model. The NDAE model's training is done using the most optimal hyperparameters, specifically the RMSProp optimizer and a batch size of 128. In the testing on the dataset from network attack simulations, the NDAE model outperforms the V-NDAE model and PCA model. The NDAE model achieves an average validation accuracy of 94.66%, while the V-NDAE model achieves an average validation accuracy of 66.32%. The NDAE model's training is done using the most optimal hyperparameters, specifically the Adam optimizer and a batch size of 32.
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sinaga, Marshal Arijona
Abstrak :
Tugas Akhir ini menelaah least square adversarial autoencoder yang menggunakan least square generative adversarial network sebagai diskriminatornya. Diskriminator tersebut meminimalkan fungsi Pearson χ 2 divergence antara distribusi variabel laten dan suatu distribusi apriori. Adanya diskriminator memungkinkan autoencoder untuk membangkitkan data yang memiliki karakteristik yang menyerupai sampel pembelajarannya. Penelitian ini dilakukan dengan membuat program yang memodelkan least square adversarial autoencoder. Program memodelkan dua jenis autoencoder yaitu unsupervised least square adversarial autoencoder dan supervised least square adversarial autoencoder dengan memanfaatkan dataset MNIST dan FashionMNIST. Unsupervised least square adversarial autoencoder menggunakan variabel laten berdimensi 20 sementara supervised least square adversarial autoencoder menggunakan variabel laten masing-masing berdimensi 2, 3, 4, dan 5. Program diimplementasikan menggunakan framework PyTorch dan dieksekusi menggunakan Jupyter Notebook. Seluruh aktivitas pemrograman dilakukan pada environment cloud yang disediakan oleh Floydhub dan Tokopedia-UI AI Center yang masing-masing menggunakan GPU NVIDIA Tesla K80 dan NVIDIA Tesla V100 sebagai perangkat komputasinya. Proses pembelajaran pada unsupervised least square adversarial autoencoder berlangsung selama dua jam sementara pada supervised least square adversarial autoencoder berlangsung selama enam jam. Berdasarkan hasil eksperimen, nilai mean squared error unsupervised least square adversarial autoencoder untuk masing-masing dataset MNIST dan FashionMNIST adalah 0.0063 dan 0.0094. Sementara itu, nilai mean squared error supervised least square adversarial autoencoder pada dataset MNIST sebesar 0.0033. Selanjutnya, nilai Frechet Inception Distance unsupervised least square adversarial autoencoder untuk masing-masing dataset MNIST dan FashionMNIST adalah 15.7182 dan 38.6967. Sementara itu, nilai Frechet Inception Distance supervised least square adversarial autoencoder pada dataset MNIST sebesar 62.512. Hasil tersebut menunjukkan bahwa least square adversarial autoencoder mampu merekonstruksi citra dengan baik, namun kurang mampu membangkitkan citra dengan kualitas sebaik sampel pembelajarannya. ......This Final Project (Tugas Akhir) investigates the least square adversarial autoencoder that uses least square generative adversarial network as its discriminator. The discriminator minimizes the Pearson χ 2 divergence between the latent variable distribution and the prior distribution. The presence of discriminator allows the autoencoder to generate data that has characteristics that resemble the original data. Python programs were developed to model the least square adversarial autoencoder. This programs try to model two types of autoencoder namely unsupervised least square adversarial autoencoder and supervised least square adversarial autoencoder by utilizing MNIST dataset and FashionMNIST dataset. The unsupervised least square adversarial autoencoder uses latent variables of dimension 20 while the supervised least square adversarial autoencoder uses latent variables with dimensions of 2, 3, 4, and 5, respectively. This programs were implemented using PyTorch and executed using Jupyter Notebook. All of the programming activities are carried out in the cloud environment provided by Floydhub and Tokopedia-UI AI Center, respectively using NVIDIA Tesla K80 GPU and NVIDIA Tesla V100 GPU as their computing resource. Training time in unsupervised least square adversarial autoencoder lasts for two hours while in supervised least square adversarial autoencoder lasts for six hours. The Results of experiments show that the mean squared error of unsupervised least square adversarial autoencoder for MNIST dataset and FashionMNIST dataset are 0.0063 and 0.0094, respectively. Meanwhile, the mean squared error of supervised least square adversarial autoencoder for MNIST dataset is 0.0033. Furthermore, the Frechet Inception Distance scores of unsupervised least square adversarial autoencoder for MNIST dataset and FashionMNIST dataset are 15.7182 and 38.6967, respectively. Meanwhile, the value of Frechet Inception Distance score of supervised least square adversarial autoencoder in MNIST dataset is 62.512. These results indicate that the least square adversarial autoencoder is able to reconstruct the image properly, but is less able to generate images with the same quality as the learning sample.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Ratna Mufidah
Abstrak :
ABSTRAK
Analisis citra pap smear merupakan salah satu cara yang cukup aman, efektif, dan banyak digunakan untuk deteksi dini kanker leher rahim. Namun, analisis citra pap smear secara manual berdasarkan pengamatan mikroskopis dapat menghasilkan diagnosis yang tidak konsisten karena sebagian besar kriteria yang digunakan dalam pengamatan manual untuk membedakan sebuah sel normal atau tidak normal bersifat deskriptif dan relatif subyektif. Selain itu, pengamatan manual juga memerlukan waktu yang cukup lama dan rawan terjadi kesalahan. Beberapa penelitian terkait analisis citra pap smear secara otomatis telah dilakukan untuk menghemat waktu dan menghindari subyektifitas, diantaranya adalah segmentasi dan klasifikasi otomatis citra pap smear. Namun demikian, analisis pada citra pap smear berkualitas rendah dan citra pap smear multi-cell masih menjadi tantangan tersendiri. Untuk itu diperlukan sebuah metode yang mampu menghasilkan high level features karena high level features cenderung lebih konsisten dan tahan terhadap ganggguan yang terjadi pada citra. Pada penelitian ini, penulis mengusulkan metode Stacked Sparse Autoencoder SSAE sebagai salah satu pendekatan deep learning DL untuk memperoleh high level features dari low level features pada citra pap smear. High level fetaures yang dihasilkan oleh SSAE inilah yang nantinya menjadi fitur pembeda antar kelas. Sedangkan untuk citra multi-cell, penulis menerapkan teknik segmentasi yang menggabungkan teknik Maximally Stable Extremal Region MSER dengan Discrete Wavelet Transform DWT dan morphological operations untuk melakukan ekstraksi nukleus. Berdasarkan berbagai eksperimen yang dilakukan, hasil segmentasi pada kanal intensity dengan dimensi citra 72 72 mampu memperoleh hasil klasifikasi terbaik pada arsitektur SSAE 5184-324-162-2 yang dilatih menggunakan 10 epoch dengan nilai parameter sparsity 0.25. Dimana rata-rata nilai akurasi yang didapatkan sebesar 65,13 .
ABSTRACT
Analysis of pap smear image is a safe, effective and widely used method for early detection of cervical cancer. However, pap smear image analysis manually based on microscopic observation can produce an inconsistent diagnosis because most of the criteria used in the manual observation to distinguish a normal or abnormal cells are descriptive and relatively subjective. In addition, manual observation also require considerable time and error prone. Several studies concerning automatically pap smear image analysis has been done in order to save time and avoid subjectivity, such as automatic segmentation and classification of pap smear image. However, analysis of the low quality image and the multi cell image remains a challenge. Therefore, a capable method for generating high levels features is required because high level features tend to be more consistent and resistant to the disruption that occurs in the image. In this research, the authors propose Sparse Stacked Autoencoder SSAE method as an approach of deep learning DL to obtain a high level features from low level features of cytology image. High level fetaures generated by SSAE is will be the distinguishing feature between classes. As for the multi cell images, the author apply segmentation techniques that incorporate Maximally Stable Extremal Region MSER techniques with Discrete Wavelet Transform DWT and morphological operations to extract nuclei. Based on various experiment, the results of segmentation on the intensity channel with dimensions 72 72 able to obtain the best classification results on SSAE architecture 5184 324 162 2 trained using 10 epoch with sparsity parameter value 0.25. The best accuracy achieves 65.13 .
2018
T51318
UI - Tesis Membership  Universitas Indonesia Library
cover
Nabil Mafaza
Abstrak :
Penggunaan internet telah mengubah hidup dan perilaku manusia. Internet yang awalnya hanya dimanfaatkan segilintir orang, berubah menjadi sebuah hal yang banyak orang manfaatkan. Perubahan perilaku manusia terlihat dalam cara manusia berkomunikasi, belajar, sampai menikmati konten hiburan. Namun, di balik manfaatnya, internet membawa bahaya yang merugikan banyak pihak. Bahaya tersebut timbul dalam bentuk serangan siber. Untuk mengatasi serangan siber, banyak perangkat keras dan lunak yang digunakan, salah satunya adalah intrusion detection system (IDS). Akan tetapi, IDS tidak dapat mendeteksi serangan baru akibat sifat pendeteksiannya yang rule-based. Penelitian ini bertujuan untuk menambah kemampuan IDS dalam mendeteksi serangan siber dengan menggunakan model machine learning (ML), khususnya autoencoder, untuk mendeteksi serangan siber dalam lalu lintas jaringan. Autoencoder digunakan untuk meng-encode lalu lintas jaringan, kemudian men-decode/merekonstruksi hasil encode. Lalu lintas jaringan akan dideteksi sebagai serangan siber apabila perbedaan hasil rekonstruksi dengan lalu lintas jaringan asli melebihi ambang tertentu. Berdasarkan testing yang dilakukan, model autoencoder paling optimal adalah model yang di-train dengan dataset yang dipisah menjadi dense dan sparse berdasarkan nilai quantile 70% fitur tot_l_fwd_pkt dan tot_l_bwd­_pkt, dilakukan feature selection menggunakan random forest dengan nilai importance 0,2, menggunakan activation function ReLU, dan menggunakan empat layer encoder dan decoder serta jumlah neuron 16, 8, 4, 2, 1, 2, 4, dan 16. Model autoencoder untuk dataset dense terbaik memiliki F1-score 84% (lalu lintas benign) dan 83% (lalu lintas malicious), trainable parameter berjumlah 830, dan ukuran model sebesar 71 KB. Sementara, model autoencoder untuk dataset sparse terbaik memiliki F1-score 71% untuk lalu lintas benign dan malicious, trainable parameter berjumlah 890, dan ukuran model sebesar 72 KB. ......The use of the internet has transformed human lives and behavior. Initially utilized by a few, the internet has become an essential tool for many. This transformation is evident in how people communicate, learn, and enjoy entertainment content. However, alongside its benefits, the internet also poses significant risks in the form of cyber attacks. To combat these threats, various hardware and software solutions, including intrusion detection systems (IDS), are employed. Traditional IDS, however, struggle to detect new attacks due to their rule-based nature. This research aims to enhance IDS capabilities in detecting cyber attacks by using machine learning (ML) models, specifically autoencoders, to detect cyber attacks in network traffic. Autoencoders encode network traffic and then decode/reconstruct the encoded data. Network traffic is identified as a cyber attack if the reconstruction error exceeds a certain threshold. Based on the testing conducted, the most optimal autoencoder model was trained on a dataset split into dense and sparse categories based on the 70% quantile values of the tot_l_fwd_pkt and tot_l_bwd_pkt features. Feature selection was performed using random forest with an importance threshold of 0.2, employing the ReLU activation function, and using four encoder and decoder layers with neuron counts of 16, 8, 4, 2, 1, 2, 4, and 16. The best autoencoder model for dense dataset achieved an F1-score of 84% for benign traffic and 83% for malicious traffic, with 830 trainable parameters and a model size of 71 KB. Meanwhile, the best autoencoder model for sparse dataset achieved an F1-score of 71% for both benign and malicious traffic, with 890 trainable parameters and a model size of 72 KB.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library