Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 111379 dokumen yang sesuai dengan query
cover
Aditra Vito Abdul Kadir
"ABSTRACT
Big data or Data driven farming have been the latest improvement in agricultural sector. Data driven farming allows farmers to maximize the output of harvest by processing any significant data gathered regarding the crop. With the data of the crop available, it opens the possibility of evaluating the data to make a model for the crop. This model will allow predictions to be made which would improve the data driven farming to an extent. This project is based on improving Farmbot, a data driven farming tool, to allow the makings of a prediction based on sensor readings gathered by the tool. Several machine learning algorithms have been evaluated which takes account two sensor reading of the plant, and performances have been discussed. These parameters include soil moisture and light exposure level and the performance level gauged are predictability and interpretability. Based on the said parameters, Decision Tree Machine Learning Algorithm have been deemed the best method of prediction for a 2 class problem. This is based on its ability to make a prediction with relatively high confidence level with the addition of having high interpretability about how the algorithm come to the said conclusion. Decision Trees current state may be improved by implementing tree pruning method to omit unnecessary splits.

ABSTRACT
Big-Data Farming atau pertanian berbasis data merupakan perkembangan mutakhir pada sektor agrikultur. Dengan berbasis data mengenai asupan cahaya dan tingkat kelembaban, petani dapat memaksimalkan hasil panen dari suatu tanaman dengan memproses data mengenai tanaman tersebut. Dengan menyediakan data mengenai tanaman, hal ini memungkinkan pengolahan data dan membuat model yang menggambarkan pengaruh data ndash; data yang diperoleh dengan hasil panen suatu tanaman. Proyek ini dilaksanakan atas dasar mengembangkan sistem Farmbot, sebuah alat tanam automatis berbasis data, untuk menyediakan prediksi tentang bagaimana hasil panen tanaman tersebut berdasarkan data yang diperoleh dari sensor yang terdapat pada alat tersebut. Kemampuan Farmbot untuk melakukan perdiksi tersebut bisa dilakukan dengan mengimplementasikan algoritma Machine Learning, Dengan adanya berbagai macam algoritma Machine Learning, pemilihan algoritma yang paling tepat untuk implementasi Farmbot juga merupakan salah satu bahan pembahasan. Berhubung 2 parameter yang telah disebutkan merupakan kunci dari pembuatan model prediksi, algoritma Decision Tree dianggap sebagai algoritma yang paling optimal untuk diimplementasikan. Keputusan ini berdasarkan kemampuan Decision Tree dalam membuat prediksi dengan tingkat keyakinan yang tinggi dan juga berkemampuan untuk menggambarkan langkah langkah yang ditempuh untuk mencapai suatu prediksi. Algoritma Decision Tree yang telah diimplementasikan pada Farmbot dapat ditingkatkan dengan mengimplementasikan metode Tree Pruning untuk menghilangkan perpisahan yang tidak dibutuhkan."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Juan Johanes Ngongo Malo
"Seiring dengan kemajuan teknologi, fase konstruksi dan pembangunan mengalami perkembangan yang cukup pesat secara signifikan dalam mempersingkat waktu desain konstruksi. Proses desain bangunan hijau yang memakan waktu lebih lama daripada bangunan konvensional membuat industri konstruksi diharapkan mampu menemukan cara alternatif dengan alat desain terkomputerisasi yang efisien. Salah satunya dengan penerapan teknologi dengan menggunakan pembelajaran mesin. Tujuan dari penelitian ini adalah untuk menyelidiki persiapan data bangunan hijau untuk digunakan dalam alat desain berbasis pembelajaran mesin yang diusulkan agar lebih akurat dalam memprediksi variabel bangunan hijau khususnya kualitas lingkungan dalam ruangan daripada metode desain konvensional. Tinjauan literatur tentang bangunan hijau, serta pembelajaran mesin dalam konstruksi dilakukan untuk mengidentifikasi topik penelitian yang sedang dilakukan. Data umum tersebut dikuantifikasi, dianalisis, dan diproses untuk digunakan dalam model desain bangunan hijau yang dikembangkan menggunakan algoritma dan pemrograman artificial neural network dan support vector regression. Konsep pengembangan model ini menunjukkan bahwa alat desain akan membantu mengambil keputusan dalam memprediksi variabel bangunan hijau secara kuantitatif dengan akurasi yang memadai. Metode yang diambil sebagai model terbaik dalam penelitian ini adalah model dengan algoritma support vector regression.

Along with technological advances, the construction and development phases have developed quite rapidly, significantly shortening the construction design time. The green building design process which takes longer than conventional buildings makes the construction industry expected to be able to find alternative ways with efficient computerized design tools. One of them is by applying technology using machine learning. The aim of this study is to investigate the preparation of green building data for use in a machine learning-based design tool which is proposed to be more accurate in predicting green building variables especially indoor environmental quality than conventional design methods. A review of the literature on green building, as well as machine learning in construction was conducted to identify the topic of the research being carried out. The general data is quantified, analyzed, and processed to be used in a green building design model developed using algorithms and programming artificial neural networks and support vector regression. The concept of developing this model shows that design tools will help make decisions in predicting green building variables quantitatively with sufficient accuracy. The method taken as the best model in this study is a model with a support vector regression algorithm."
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ratna Aminah
"ABSTRAK
<

Diabetes merupakan penyakit kronis yang terjadi ketika terdapat peningkatan kadar glukosa dalam darah karena tubuh tidak dapat atau tidak cukup menghasilkan hormon insulin atau tidak dapat menggunakan insulin secara efektif. Umumnya untuk mendeteksi penyakit diabetes adalah dengan tes kadar gula darah atau hemoglobin HbA1c yang dilakukan oleh praktisi medis. Pada penelitian ini, dibangun sistem prediksi penyakit diabetes berbasis iridologi atau melalui citra mata, menggunakan machine learning. Sistem yang dikembangkan terdiri dari instrumen akuisisi citra mata dan algoritma pengolahan citra. Metode GLCM (Gray Level Co-Occurence Matrix) digunakan untuk proses ekstraksi ciri, dengan tujuan untuk mendapatkan ciri tekstur pada citra. Metode SVM (Support Vector Machine) dan kNN (k Nearest Neighbor) digunakan untuk proses klasifikasi kelas diabetes dan non-diabetes. Hasil klasifikasi kemudian dilakukan proses validasi dengan menggunakan metode k-fold cross validation. Hasil yang diperoleh menunjukkan bahwa metode kNN memiliki performa yang lebih baik dibandingkan dengan metode SVM. Performa terbaik didapatkan saat variasi kombinasi ukuran area segmentasi 30×360 dengan jarak antar tetangga 30 pixel. Tingkat akurasi yang diapatkan dari pengujian sebesar 79,6%, dengan nilai misclassification rate (MR) 20,4%, false positive rate (FPR) 20,6%, false negative rate (FNR) 20%, sensitivity 87,1%, dan specificity 70,0%.

 


ABSTRACT

Diabetes is a chronic disease that occurs when there is an increase in glucose levels in the blood because the body cannot produce enough of the hormone insulin or cannot use insulin effectively. Generally, to detect diabetes is by pengujian blood sugar levels or hemoglobin HbA1c carried out by medical practitioners. In this study, a diabetes prediction system based on iridology or through eye images was constructed using machine learning. The developed system consists of eye image acquisition instruments and image processing algorithms. The GLCM (Gray Level Co-Occurence Matrix) method is used for feature extraction processes, with the aim of obtaining texture characteristics in the image. The SVM (Support Vector Machine) and kNN (k Nearest Neighbor) methods are used to classify diabetic and non-diabetic classes. The classification results are then validated by using the k-fold cross validation method. The results show that kNN method has better performance compared to the SVM method. The best performance is when size of the segmentation area 30×360 pixel with the distance between neighbors 20 pixel. The results show that the accuracy from pengujian is 79.6%, misclassification rate (MR) 20.4%, false positive rate (FPR) 20.6%, false negative rate (FNR) 20.0%, sensitivity 87.1%, and specificity 70.0%.

 

"
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Iryanti Djaja
"Budidaya udang vaname (Litopenaeus vannamei) sangat diminati sehingga permintaan udang ini meningkat setiap tahunnya. Masalah terberat para petambak adalah kegagalan panen yang berakibat kepada keberlangsungan usaha mereka. Perlu adanya usaha perbaikan untuk meningkatkan keberhasilan panen. Penelitian ini bertujuan untuk lebih menggali mengenai penggunaan machine learning dalam prediksi hasil panen dari data kualitas air. Hasil prediksi ini selanjutnya dipakai dan digunakan dalam proses bisnis sehingga dapat meningkatkan produktivitas. Analisis yang digunakan pada penelitian ini adalah analisis kuantitatif dan kualitatif serta perbaikan proses bisnis. Analisis kuantitatif dengan metode big data dan machine learning. Model yang dipakai adalah k-Nearest Neighbor (kNN), Decision Tree (DT) dan Logistic Regression (LR). Analisis kualitatif dilakukan dengan observasi dan interview untuk memperbaiki proses bisnis. Proses bisnis diperbaiki mengikuti BPM Lifecycle dengan memasukan hasil analisis kuantitatif. Dari penelitian ini didapatkan bahwa prediksi machine learning dengan model Decision Tree dari variabel rasio bakteri merugikan dan NH4+ memberikan akurasi tertinggi mencapai 96%. Setelah didapatkan model dan variabel dengan akurasi tertinggi, penelitian ini juga melakukan penerapan ke dalam proses bisnis dengan pendekatan BPM Lifecycle sehingga hasil tersebut dapat diimplementasi dan memberikan hasil yang lebih produktif.

Interest in Vaname shrimp (Litopenaeus vannamei) farming is growing every year. The biggest problem for shrimp farming was the unsuccessful harvest that affected their business sustainability. So, there should be an improvement made to increase the chance of a successful harvest and its productivity. Past research mentioned that vaname shrimp harvest result can be predicted by machine learning approach from water quality data. It gave good accuracy and can be used to have faster decision making. The objective of this research is to deep dive into the utilization of machine learning to predict the successful harvest from water quality data. The predicted result will be utilized in the business process to improve productivity. Analysis that used at this research are quantitative and qualitative with business process improvement. Quantitative analysis used big data methode and machine learning. Models that have been applied are k-Nearest Neighbor (kNN), Decision Tree (DT) dan Logistic Regression (LR). Data that is used for analysis are pH, salinity, NOx, NH4+, and harmful bacteria index. Qualitative analysis was applied by observation and interview with the focus to improve business process. Business processes will be improved using BPM Lifecycle with the utilization of quantitative result. This research showed that prediction machine learning with Decision Tree model from harmful bacteria index and NH4+ giving the best accuracy until 96%. The next step was utilizing the quantitative result at the business process with BPM Lifecycle approach so the result can be implemented and gave more productive result."
Jakarta: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ardiansyah Ramadhan Pranoto
"Menurut EEB Laboratory Jakarta, pada tahun 2016 sektor bangunan memiliki mengkonsumsi 18-20% dari total penggunaan energi di Indonesia, dan terus menerus meningkat seiring perkembangan teknologi yang membutuhkan sumber energi dalam upaya peningkatan kualitas hidup penghuni bangunan. Bangunan pintar merupakan sebuah konsep pemanfaatan teknologi yang tidak hanya bertujuan meningkatkan kenyamanan penghuni, tetapi juga dapat membantu dalam upaya efisiensi energi pada operasional bangunan. Maka dari itu, penelitian ini akan membantu upaya perancangan efisiensi energi pada sebuah bangunan dengan meninjau fitur dan karakteristik yang berpotensi dalam mendukung efisiensi energi dengan penerapan konsep bangunan pintar. Selain itu, akan dibuat sebuah model dengan pemanfaatan machine learning yang mampu memberikan prediksi tingkat penggunaan energi berdasarkan fitur-fitur yang diberikan. Model machine learning yang dihasilkan memiliki rata-rata nilai kesalahan relatif sebesar 17,76%, serta didapatkan tingkat efisiensi dengan penerapan seluruh fitur yang diidentifikasi pada rentang 34,5% hingga 45,3% tergantung pada lantai yang ditinjau.

According to EEB Laboratory Jakarta, Indonesian building sector accounts for 18- 20% energy consumption in 2016, and this trend will continuously increase as technology needed to increase housing residents' quality keeps advancing. Smart building is a concept to utilise technology that does not only help increase occupants' comfort inside the building, but it can also help increase energy usage efficiency in building operations. This research aims to help the effort in designing energy efficiency planning for a building by reviewing potential features and characteristics that could help improves energy efficiency with implementation of the smart building concept. A model based on machine learning that could give prediction on the level of energy consumption based on given features will also be discussed here. This model of machine learning has a 17,76% average of relative error, as well as 34,5% until 45,3% efficienct level that includes implementation of all features, depending on analysed floor."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Tesdiq Prigel Kaloka
"ABSTRAK
Protein merupakan bagian penting dari organisme dan memiliki fungsi yang berbeda. Fungsi dan sifat interaksi protein dapat diketahui dengan mengelompokkan protein-protein yang saling berinteraksi. Objek penelitian ini adalah interaksi antara protein HIV-1 dan manusia. Biclustering merupakan metode yang dapat digunakan untuk menyelesaikan permasalahan interaksi protein. Interaksi dibagi menjadi dua, yaitu interaksi positif dan negatif, selanjutnya diubah menjadi graf bipartit dengan simpul merupakan protein HIV-1 dan protein manusia, sedangkan busur merupakan jenis interaksi yang terjadi. Algoritma POLS merupakan algoritma biclustering yang menggunakan pendekatan teori graf. Hasil bicluster dianalisis menggunakan Gene Ontology (GO) untuk memperoleh fungsi protein pada satu bicluster. Proses terakhir adalah prediksi interaksi protein berdasarkan analisis fungsi-fungsi protein. Metode yang digunakan adalah Support Vector Machine (SVM) karena SVM merupakan metode prediksi machine learning yang robust. Berdasarkan hasil penelitian, dataset interaksi positif terdapat 297 bicluster dengan bicluster terbanyak berukuran 2 X 2 dan bicluster terbesar berukuran 7 X 7. Dataset interaksi negatif diperoleh 203 bicluster dengan 110 bicluster berukuran 2 X 2 dan satu bicluster berukuran 7 X 7. Berdasarkan hasil analisis GO, terdapat protein dalam satu bicluster yang belum diketahui fungsinya. Akurasi model prediksi untuk interaksi positif = 92% dan interaksi negatif = 88%.

ABSTRACT
Protein is an important part of the organism. The function of protein can be known by grouping the interact proteins. This research discusses the interaction between HIV-1 and human protein. Biclustering is a method to solve protein interaction problem. The interaction is divided into two types, called positive and negative interactions The interaction is transformed into a bipartite graph with vertices are HIV-1 and human protein, while the edges are the interaction. POLS algorithm is a biclustering method based on graph theory. The result of a bicluster is analyzed using Gene Ontology (GO). The last process is the prediction of protein interactions based on analysis of GO. We used Support Vector Machine (SVM) because SVM is a robust machine learning method for perdiction. Based on the results, we get 297 biclusters, with 171 biclusters sized 2 X 2 and the largest bicluster sized 7 X 7 for the positive interactions. For the negative interaction, we get 203 biclusters, with 110 biclusters sized 2 X 2 and the largest bicluster sized 7 X 7. Based on GO analysis there were an unknown function in a bicluster. Accuracy of prediction models for positive and negative interaction are 92% and 88% respectively."
2019
T54139
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Daffa Reyhando Imama
"Pembangunan Ibu Kota Negara yang terletak di Kalimantan Timur menjadi proyek besar pemerintah dengan anggaran biaya Rp 466 Triliun. Untuk menjamin efisiensi biaya konstruksi dari proyek ini, diperlukan pendekatan estimasi biaya yang baik. Namun estimasi biaya dalam konstruksi di Indonesia saat ini masih didominasi metode konvensional yang masih memiliki kekurangan dalam hal akurasi maupun waktu pemantauan. Oleh karena itu, penelitian ini dilakukan dengan tujuan untuk mengembangkan model machine learning untuk memprediksi estimate at completion biaya konstruksi sebagai alternatif dari metode konvensional. Penelitian ini dilakukan dengan metode analisis studi literatur dan benchmarking dari penelitian yang telah ada untuk menjalankan simulasi model menggunakan perangkat lunak RapidMiner yang kemudian akan divalidasi oleh narasumber pakar melalui wawancara. Diperoleh hasil bahwa model terbaik didapat menggunakan algoritma neural network. Dari simulasi model tersebut dengan menggunakan data dari salah satu proyek pembangunan jalan raya di Ibu Kota Negara, didapat hasil output berupa prediksi penghematan sebesar 17,8% dari nilai budget at completion proyek. Hasil dari prediksi model tersebut menghasilkan output yang lebih konservatif apabila diperbandingkan dengan metode konvension menggunakan formula estimate at completion biaya.

The development of the National Capital City located in East Kalimantan has become a major government project with a budget of IDR 466 trillion. To ensure cost efficiency in the construction of this project, a good cost estimation approach is required. However, cost estimation in construction in Indonesia is currently dominated by conventional methods that still have shortcomings in terms of accuracy and monitoring time. Therefore, this research is conducted with the aim of developing a machine learning model to predict the estimate at completion of construction costs as an alternative to conventional methods. The research is carried out through the analysis of literature studies and benchmarking from existing research to execute a simulation model using the RapidMiner software, which will then be validated by expert informants through interviews. The results indicate that the best model is obtained by using neural network algorithm. From the simulation model using data from one of the road construction projects in the National Capital City, the output shows a predicted savings of 17.8% from the project’s budget at completion value. This model prediction produce a more conservative result than conventional methods of estimating costs at completion."
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Richie Ghifari
"Rancang campur beton merupakan proses bertahap dan kompleks untuk mencoba menemukan komposisi bahan terbaik guna menghasilkan beton dengan performa terbaik. Kuat tekan beton merupakan sifat terpenting dalam kualitas beton dibandingkan sifat-sifat lain. Dalam proses pembuatannya, banyak variabel terutama jumlah komposisi material penyusun yang dapat memengaruhi kuat tekan beton. Terdapat beberapa metode konvensional dalam memprediksi beton yang terkadang memberikan hasil prediksi lebih atau kurang dari kuat tekan yang ditargetkan. Diperlukan metode yang akurat dalam memprediksi kuat tekan beton agar dapat memberikan keuntungan secara signifikan terhadap penggunaan bahan. Oleh karena itu, penelitian ini menggunakan Deep Neural Network (DNN) sebagai subbidang dari Machine Learning (ML) dan Artificial Intelligence (AI), untuk memprediksi kuat tekan beton berdasarkan komposisi campuran dan properti materialnya. Penelitian ini menghasilkan formula matematika berupa persamaan yang dihasilkan dari model DNN terbaik dengan melihat aspek error model dan grafik model loss. Terdapat total 2048 model yang dianalisis dengan variasi jumlah variabel input (feature) yang berbeda-beda. Model 280 pada kasus 1 dan model 23 pada kasus 5 merupakan model terbaik yang dihasilkan penelitian ini, dengan masing-masing nilai error model 43,8028 dan 5778,5850 untuk Mean Squared Error (MSE) serta 5,0073 dan 59,8225 Maen Absolute Error (MAE).

Concrete mix design is a gradual and complex process of trying to find the best ingredient composition to produce the best performing concrete. The compressive strength of concrete is the most important property in concrete quality compared to other properties. In the manufacturing process, many variables, especially the amount of material composition, can affect the compressive strength of concrete. There are several conventional methods of predicting concrete that sometimes give predictive results more or less than the targeted compressive strength. An accurate method of predicting the compressive strength of concrete is needed in order to significantly benefit the use of materials. Therefore, this research utilizes Deep Neural Network (DNN), a subfield of Machine Learning (ML) and Artificial Intelligence (AI), to predict the compressive strength of concrete based on its mix composition and material properties. This research produces mathematical formulas in the form of equations generated from the best DNN model by looking at the aspects of model error and model loss graphs. There are a total of 2048 models analyzed with different variations in the number of input variables (features). Model 280 in case 1 and model 23 in case 5 are the best models produced by this study, with model error values of 43.8028 and 5778.5850 for Mean Squared Error (MSE) and 5.0073 and 59.8225 Maen Absolute Error (MAE), respectively.
"
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Wafiyulloh
"Serangan jaringan semakin beragam seiring berkembangnya internet. Dalam menghadapi
serangan-serangan tersebut, diperlukan juga pengembangan sistem keamanan internet
terhadap pengguna salah satunya adalah IDS. Intrusion detection system (IDS) merupakan
sistem keamanan dalam mengawasi aktivitas jaringan yang berbahaya bagi pengguna.
Metode yang umum digunakan yaitu signature-based IDS. Signature-based IDS
menggunakan daftar serangan siber yang diketahui dalam menentukan jaringan berbahaya
atau normal. Akan tetapi, IDS hanya mengetahui serangan yang diketahui saja dan
membutuhkan input secara manual untuk mengubah daftar serangan sehingga tidak efektif
dalam mengatasi serangan yang tidak ketahui. Oleh karena itu, penelitian ini berfokus pada
pengembangan IDS dengan pendekatan machine learning menggunakan model autoencoder
untuk reduksi dimensi dan pengaruhnya terhadap model IDS. Autoencoder yang digunakan
pada penelitian ini terdapat 2 model yaitu non-symmetric deep autoencoder (NDAE) dan
modifikasi dari NDAE menggunakan metode variational autoencoder (VAE) yang disebut
sebagai V-NDAE, serta model PCA. Modifikasi NDAE bertujuan untuk mengambil
informasi penting dengan menggunakan distribusi probabilistik sehingga menjadi data yang
berkualitas untuk pelatihan model IDS. Pengujian reduksi dimensi dari model-model ini
dilakukan dengan melatih model IDS yaitu model random forest. Penelitian ini dilakukan
pada 2 dataset yang berbeda yaitu dataset CICIDS2017 dan dataset dari simulasi serangan
jaringan. Metrik yang digunakan adalah metrik accuracy, precision, recall, F-1 score, ROC
curve. Berdasarkan pengujian yang telah dilakukan terhadap dataset CICIDS2017, model
NDAE memiliki nilai rata-rata akurasi validasi sebesar 90.85% sehingga memiliki nilai yang
lebih besar daripada model V-NDAE yang memiliki nilai rata-rata akurasi validasi sebesar
87.65%. Pelatihan model NDAE menggunakan hyperparameter yang paling optimal yaitu
dengan optimizer RMSProp dan batch size sebesar 128. Pada pengujian terhadap dataset
dari simulasi serangan jaringan, model NDAE memiliki performa yang lebih baik daripada
model V-NDAE dan model PCA. Model NDAE memiliki nilai rata-rata akurasi validasi
sebesar 94.66% dan model V-NDAE memiliki nilai rata-rata akurasi validasi sebesar
66.32%. Pelatihan model NDAE menggunakan hyperparameter yang paling optimal yaitu
dengan optimizer Adam dan batch size sebesar 32.

The variety of network attacks increases as the internet evolves. In dealing with these attacks,
the development of an internet security system for users is necessary, one of which is IDS.
An intrusion detection system (IDS) is a security system designed to monitor network
activity that is dangerous for users. The commonly used method is signature-based IDS.
Signature-based IDS uses a signature database of known cyber attacks to determine whether
a network is dangerous or normal. However, this IDS only recognizes known attacks and
requires manual input to change the signature database of attacks, making it ineffective in
dealing with unknown attacks. Therefore, this research focuses on developing an IDS using
a machine learning approach, specifically using an autoencoder model for dimensionality
reduction and its impact on the IDS model. The models used in this research consists of a
non-symmetric deep autoencoder (NDAE), modification of NDAE using the variational
autoencoder (VAE) method, and PCA model. The modified NDAE can capture important
information from the latent distribution, which helps stabilize the training of the model.
Dimensionality reduction testing for both models is performed by training an IDS model,
specifically a random forest model. This research is conducted on two different datasets: the
CICIDS2017 dataset and a dataset from network attack simulations. The evaluation metrics
used are accuracy, precision, recall, F-1 score, and ROC curve. Based on the testing
performed on the CICIDS2017 dataset, the NDAE model achieves an average validation
accuracy of 90.85%, which is higher than the average validation accuracy of 87.65% for the
V-NDAE model and PCA model. The NDAE model's training is done using the most optimal
hyperparameters, specifically the RMSProp optimizer and a batch size of 128. In the testing
on the dataset from network attack simulations, the NDAE model outperforms the V-NDAE
model and PCA model. The NDAE model achieves an average validation accuracy of
94.66%, while the V-NDAE model achieves an average validation accuracy of 66.32%. The
NDAE model's training is done using the most optimal hyperparameters, specifically the
Adam optimizer and a batch size of 32.
"
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dea Amrializzia
"Pipa transmisi adalah cara teraman dan paling efektif untuk mengangkut gas alam dalam jumlah besar dalam jarak jauh. Meskipun transportasi menggunakan pipa adalah yang paling aman, kegagalan pipa transmisi dapat menyebabkan kerusakan, kerugian finansial, dan cedera. Kegagalan pipa perlu diprediksi untuk untuk menentukan prioritas pemeliharaan pipa sebagai salah satu strategi membuat jadwal pemeliharaan prefentif yang tepat sasaran dan efisien agar pipa dapat diperbarui atau direhabilitasi pipa sebelum terjadi kegagalan. Metode yang ditawarkan pada studi ini adalah machine learning, dimana metode merupakan bagian dari insiatif transformasi digital (Hajisadeh, 2019). Model dikembangkan berdasarkan data kegagalan historis dari jaringan pipa transmisi gas darat sekitar 2010-2020 yang dirilis oleh Departemen Transportasi AS dengan karakteristik data yang tidak terstruktur dan kompleks. Proses pembelajaran mesin dapat dibagi menjadi beberapa langkah: pra-pemrosesan data, pelatihan model, pengujian model, pengukuran kinerja, dan prediksi kegagalan. Pengembangan model pada studi ini dilakukan menggunakan dua algoritma yaitu regresi logistik dan random forest. Pola perilaku dari faktor-faktor yang paling berpengaruh adalah usia dan panjang segmen pipa meiliki korelasi positif terhadap kegagalan pipa. Kedalaman pipa, ketebalan, dan diameter pipa memiliki korelasi negatif. Kegagalan pipa paling sering terjadi pada pipa dengan class location 1 dan class location 4, pipa yang ditempatkan di bawah tanah, serta pipa dengan tipe pelapis coal tar. Hasil pengembangan model menggunakan machine learning menunjukan hasil performa model akurasi prediksi 0.949 dan AUC 0.950 untuk model dengan algoritma regresi logistik. Sedangkan akurasi prediksi 0.913 dan AUC 0.916 untuk model dengan algoritma random forest. Berdasrkan hasil uji performa kita dapat menyimpulkan bahwa machine learning adalah metode yang efektif untuk memprediksi kegagalan pipa. Berdasarkan model yang dilatih pada dataset nyata pipa transmisi gas, hasil prediksi pada studi kasus dapat menghindari 29% dari kegagalan pipa pada 2025, 53% kegagalan pipa pada tahun 2030, dan 64% pada tahun 2035.

Transmission pipe is the safest and most effective way to transport large amounts of natural gas over long distances. Although transportation using pipelines is the safest, transmission pipeline failures can cause damage, financial losses, and injuries. Pipeline failures need to be predicted to determine the priority of pipeline maintenance as one of the strategies to create a schedule of maintenance targets that is right on target and efficient so that the pipeline can be rehabilitated before a failure occur. The method offered in this study is machine learning, where the method is part of the digital transformation initiative (Hajisadeh, 2019). The model was developed based on historical failure data from the onshore gas transmission pipeline around 2010-2020 released by the US Department of Transportation with unstructured and complex data characteristics. The machine learning process can be divided into several steps: data pre-processing, model training, model testing, performance measurement, and failure prediction. The development of the model in this study was carried out using two algorithms namely logistic regression and random forest. The correaltion of the factors that most influence the failure of an onshore gas transmission pipeline is the age and length of the pipe segment has a positive correlation with pipe failure. Depth of cover, thickness, and diameter of pipes have a negative correlation with pipe failures. Pipe failures most often occur in pipes with class location 1 and class location 4, undersoil, and pipes with coal tar coating types. The results of the development of the model using machine learning showed the results of the model performance prediction accuracy is 0.949 and AUC is 0.950 for models with logistic regression algorithms. Whereas the accuracy of prediction is 0.913 and AUC is 0.916 for models using the random forest algorithm. Based on the results of performance tests we can conclude that machine learning is an effective method for predicting pipe failures. Based on the model trained on a real dataset of gas transmission pipelines, the prediction results in case studies can avoid 29% of pipe failures in 2025, 53% of pipe failures in 2030, and 64% in 2035. "
Depok: Fakultas Teknik Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>