Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 8 dokumen yang sesuai dengan query
cover
Valentina Siwi Saridewi
Abstrak :
Penelitian ini membahas tentang membangun model machine learning pada aspek manusia dalam kesadaran keamanan informasi. Model dibangun melalui pendekatan classification dan clustering melalui proses secara garis besar meliputi: impor data, menangani data tidak lengkap, penyusunan dataset, feature scaling, membangun model serta mengevaluasi model. Dataset disusun berdasarkan hasil kuisioner yang merujuk The Human Aspects of Information Security Questionnaire pada masyarakat di Indonesia. Hasil model classification dievaluasi dengan beberapa metode yaitu analisa k-fold Cross Validation, Confusion Matrix, Receiver Operating Characteristic, serta perhitungan skor pada masing-masing model. Salah satu algoritma pada classification yang digunakan yaitu Support Vector Machine memiliki kinerja dengan akurasi 99,7% dan error rate sebesar 0,3%. Algoritma pada clustering salah satunya yaitu DBSCAN memiliki nilai adjusted rand index selalu mendekati nilai 0. ......This research discusses building a machine learning model on the human aspect of information security awareness. The model built through a classification and clustering approach through a broad outline process, including importing data, handling incomplete data, compiling datasets, feature scaling, building models, and evaluating models. Dataset arranged based on the results of a questionnaire that referred to The Human Aspects of Information Security Questionnaire to Indonesia society. The results of the classification model evaluated by several methods, namely k-fold Cross Validation analysis, Confusion Matrix, Receiver Operating Characteristics, and score calculation for each model. One of the algorithms for classification, the Support Vector Machine, has a performance with an accuracy of 99.7% and an error rate of 0.3%. One of the algorithms in clustering is that DBSCAN has an adjusted rand index value consistently close to 0.
Depok: Fakultas Teknik Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Darian Texanditama
Abstrak :
Pemelajaran mesin dikenal sangat berguna dalam menyelesaikan permasalahan prediksi dan klasifikasi melalui pembelajaran pola dan perilaku data yang tersedia. Oleh karena itu, pemelajaran mesin dapat dimanfaatkan di berbagai bidang kehidupan dan industri modern. Namun, kinerja pemelajaran mesin sangat tergantung dari model pemelajaran mesin yang digunakan maupun dari kualitas data yang digunakan untuk pemelajaran. Data yang tidak bersih, tidak representatif, dan ketersediaannya terbatas akan mengurangi kualitas hasil prediksinya. Penelitian ini bertujuan untuk menguji kombinasi beberapa metode pemrosesan data (yaitu MissForest, GAIN, ENN, dan TabGAN oversampling) dengan model pembelajaran mesin (yaitu model CatBoost dan model klasifikasi biner berbasis neural network) untuk memprediksi kasus mahasiswa putus studi di beberapa universitas di Indonesia menggunakan data dari PDDikti. Penambahan fitur dilakukan untuk memberi label bidang studi terhadap dataset tersebut. Selain penambahan fitur seleksi fitur relevan menggunakan korelasi Pearson serta feature importances juga dilakukan setelah pelatihan model awal. Google Colab dengan bahasa pemrograman Python digunakan untuk menjalankan algoritma pemrosesan data dan pelatihan model. Hasil penelitian menunjukkan bahwa model CatBoost dengan kombinasi metode imputasi GAIN, undersampling ENN, dan tanpa fitur kelompok bidang studi memberikan F1-score tertinggi yaitu 66,38% dengan nilai precision 71,75% dan nilai recall 61,76%. Apabila digunakan model klasifikasi biner pemelajaran dalam akan didapatkan metrik terbaik F1-score 62,32%. Hasil terbaik penelitian ini menunjukkan peningkatan F1-score sebesar 2,15% dibandingkan dengan F1-score pada penelitian sebelumnya yang menggunakan model CatBoost bersama kombinasi Missforest dan ENN tanpa fitur kelompok bidang studi. Penelitian ini menunjukkan bahwa oversampling dan undersampling memberikan dampak yang berlawanan terhadap metrik precision dan recall. Penelitian juga menemukan seleksi fitur dapat meningkatkan kinerja model namun tidak berdampak besar dibandingkan teknik-teknik lain misalnya balancing dan optimisasi hyperparameter. ......Machine learning is known to be very useful in solving prediction and classification problems by learning the patterns and behavior of available data. Therefore, machine learning can be utilized in various areas of modern life and industry. However, the performance of machine learning is highly dependent on the machine learning model used as well as on the quality of the data used for learning. Data that is not clean, not representative, and scarce will reduce the quality of the prediction results. This study aims to test the combination of several data processing methods (namely MissForest, GAIN, ENN, and TabGAN oversampling) with machine learning models (CatBoost and binary classification models based on neural networks) to predict dropout cases at several Indonesian universities using data from PDDikti. The addition of features is done to label data with their respective fields of study. Other than adding features, selection of relevant features using Pearson’s correlation as well as feature importances is also carried out after initial model training. Google Colab with the Python programming language is used to run data processing algorithms and train models. This study shows that CatBoost with the combination of GAIN imputation, ENN undersampling, and no field of study feature results in the highest F1-score of 66.38%, which are composed of 71.75% in precision and 61.76% in recall. If a deep learning binary classification model is used instead, the best F1-score result is 62.32%. The best result from this study shows an increase in F1-score of 2.15% compared to the F1-score of the previous study (64.23%) which used CatBoost along with a combination of Missforest, ENN and no field of study features. This research shows oversampling and undersampling produce opposite effects on precision and recall scores. Research has also found that feature selection can improve model performance but does not have a large impact compared to other techniques such as balancing and hyperparameter optimization
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Irham Muhammad Fadhil
Abstrak :
Meskipun pandemi COVID-19 sudah mereda yang ditandai dengan banyak negara yang melonggarkan pembatasanpembatasan, namun masih ditemui kasus dan kematian yang disebabkan oleh COVID-19. Salah satu metode pendeteksian COVID-19 adalah dengan menggunakan citra CT scan yang di-training menggunakan arsitektur berbasis deep learning. Namun, ketersediaan dataset publik mengenai hal tersebut sangat terbatas. Untuk mengatasi hal itu, diperlukan metode pembuatan citra sintesis berbasis GAN (generative adversarial networks) yang diharapkan dapat meningkatkan performa dari arsitektur deep learning. Salah satu arsitektur GAN yang dapat digunakan yakni TinyGAN yang memiliki parameter training yang lebih sederhana dari GAN namun tidak mengurangi performa yang dihasilkan. Hasil augmentasi citra sintesis menggunakan TinyGAN tersebut kemudian dibandingkan dengan metode berbasis GAN lainnya, seperti BigGAN yang mana diharapkan mengurangi cost komputasi sehingga dapat digunakan pada perangkat yang terbatas dari segi resource. Dari hasil percobaan yang telah dilakukan menunjukkan bahwa penggunaan augmentasi citra mampu meningkatkan performa secara keseluruhan, yakni akurasi sebesar 98.42% dan F1-score sebesar 98.48% dengan metode VGG 16 serta dalam pengujian menggunakan aplikasi berbasis web model mampu memprediksi dengan benar dan waktu running terbilang singkat, yakni 0.0036 detik. Dalam hal evaluasi kualitas citra, metode TinyGAN dalam hal inception score menghasilkan hasil yang lebih baik, yakni sebesar 2.2037 daripada metode BigGAN yang bernilai 2.03502. Sedangkan dalam hal frechet inception distance metode TinyGAN menghasilkan hasil yang lebih baik, yakni sebesar 39.833 daripada metode BigGAN yang bernilai 40.601. ......Although the COVID-19 pandemic has subsided, which is marked by many countries easing restrictions, there are still cases and deaths caused by COVID-19. One to detect COVID-19 is to use CT scan images trained using a deep learning-based architecture. However, the availability of public datasets on this subject is very limited. To overcome this, a synthetic image generation method based on GAN (generative adversarial networks) is needed that is expected to improve the performance of the deep learning architecture. One of the GAN architectures that can be used is TinyGAN which has simpler training parameters than GAN but does not reduce the resulting performance. The results of the synthetic image augmentation using TinyGAN are then compared with other GAN-based methods, such as BigGAN which is expected to reduce computational costs so that it can be used on devices that are limited resources. From the results of experiments that have been carried out, it shows that the use of image augmentation resulted in increased performance (accuracy of 98.42% and F1-score of 98.48% using VGG16 method) and in testing using a web-based application model. able to predict correctly and the running time is relatively short, which is 0.0036 seconds. In terms of evaluating image quality, the TinyGAN method in terms of inception score produces better results, which is equal to 2.2037 than the BigGAN method which has a value of 2.03502. Whereas in terms of frechet inception distance the TinyGAN method produces better results, namely 39,833 compared to the BigGAN method which has a value of 40,60
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Mario Claudius
Abstrak :
Obesitas merupakan salah satu masalah kesehatan yang sering dijumpai hingga saat ini. Menurut World Health Organization, pada tahun 2016 terdapat sekitar 650 juta orang dewasa yang mengalami masalah obesitas. Obesitas sendiri dapat meningkatkan risiko pada berbagai macam penyakit seperti penyakit jantung, diabetes, dan kanker jika tidak dicegah. Salah satu penyebab dari obesitas adalah konsumsi makanan fast food yang berlebihan. Konsumsi makanan fast food yang berlebihan ini seringkali terjadi karena kurangnya informasi mengenai jumlah kalori yang terkandung pada makanan fast food sehingga sulit untuk mengontrol jumlah makanan fast food yang dikonsumsi agar tidak menyebabkan obesitas. Oleh karena itu, dalam penelitian ini dilakukan perancangan aplikasi dengan sistem untuk menghitung estimasi jumlah kalori yang terkandung pada makanan cepat saji menggunakan model Mask R-CNN. Berdasarkan pengujian pada model Mask R-CNN dalam melakukan deteksi pada objek makanan cepat saji, didapatkan nilai mAP 0,636 dan nilai F1 score 0,599. Sedangkan berdasarkan hasil pengujian pada algoritma yang digunakan untuk melakukan perhitungan estimasi jumlah kalori makanan cepat saji, didapatkan tingkat kesalahan kalkulasi berupa nilai MAE sebesar 2,290 kal/g dan RMSE sebesar 2,342 kal/g.  ......Obesity is one of the most common health problem until now. According to World Health Organization, there are approximately 650 millions adult who have obesity problem at 2016. If not prevented, obesity itself can increase the risk of various diseases such as heart disease, diabetes, and cancer. One of the causes of obesity is excessive consumption of fast food. This excessive consumption of fast food often happen due to lack of information about number of calories contained in fast food, making it difficult to control the amount of fast food consumed to prevent obesity. Therefore, this research conducts development of application to calculate the amount of calories contained in fast food using Mask R-CNN. Based on the testing result for Mask R-CNN ability to detect fast food object, 0,636 obtained as value of mAP and 0,599 obtained as value of F1 score. While based on the testing result of algorithm used to calculate the estimated amount of calories contained in fast food, the calculation error rate is obtained in the form of MAE value of 2,290 cal/g and RMSE value of 2,342 cal/g.
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rama Widragama Putra
Abstrak :
Para penyandang tunarungu berkomunikasi menggunakan bahasa isyarat resmi di Indonesia, yaitu SIBI (Sistem Isyarat Bahasa Indonesia). Dengan menggunakan aplikasi penerjemah Bahasa isyarat ke teks akan membantu komunikasi antara tunarungu maupun non-tunarungu. Dengan menggunakan pre-trained model CPM (EdvardHua, 2018) akan mendapatkan informasi berupa titik-titik skeleton seperti titik tangan, bahu, dan siku. Informasi titik skeleton itu akan digunakan untuk memprediksi kata. Namun, proses tersebut perlu berjalan secara real-time, yaitu ketika pengguna membuka kamera maka akan langsung mendapatkan respon. Untuk mencapai itu diperlukan mobile deep learning framework, sehingga proses inference bisa menjadi lebih cepat dengan bantuan runtime GPU. Penelitian ini berfokus menjalankan inference menggunakan mobile deep learning framework untuk implementasi modul ekstraksi skeleton secara real-time pada Android. Pada penelitian ini digunakan Tensorflow mobile (runtime hanya CPU), MACE, dan SNPE. Dilakukan pengukuran dari sisi latency, penggunaan energi, penggunaan memori, penggunaan daya, dan perubahan suhu. Hasil pengukuran menunjukkan bahwa penggunaan MACE dan SNPE dengan runtime GPU menghasilkan latency yang lebih kecil dibandingkan penggunaan CPU. Penggunaan CPU menyebabkan thermal throttling, sehingga terjadi penurunan kinerja. Dengan runtime GPU menghasilkan penggunaan energi, memori, dan daya yang lebih sedikit dibandingkan CPU. Kenaikan suhu ketika menggunakan runtime GPU lebih kecil dibandingkan CPU. ......People with hearing impairments use the official sign language in Indonesia, namely SIBI (Sistem Isyarat Bahasa Indonesia). Using a sign language-to-text translator application will help the communication between people with hearing impairments and people without hearing impairment. By using the pre-trained CPM model (EdvardHua, 2018), the information in the form of skeleton points such as the points of the hands, shoulders, and elbows will be obtained. The skeleton point information will be used to predict its translation words. However, the translation process needs to be run in real- time, which is when users open their cameras then they will immediately receive a respond. To achieve that goal, we need a mobile deep learning framework, with the result that the inference process is faster with the help of the GPU runtime. This research focuses on running inferences using a mobile deep learning framework to implement real-time skeleton extraction module in Android. This research uses Tensorflow mobile (runtime only for CPU), MACE, and SNPE. Measurements of the latency, energy usage, memory usage, power usage, and temperature change were taken. The measurement results show that the use of MACE and SNPE with GPU runtime is in lower latency than with the use of CPU. Measurement with CPU usage causes thermal throttling, resulting in decreased performance. Measurement with GPU runtime results in lower usage of energy, memory and power compared to the measurement with CPU. The temperature increase when using the GPU runtime is lower than when using the CPU.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ivan Dewanda Dawangi
Abstrak :
Meskipun kajian mengenai bahan bakar dan penggerak alternatif sudah banyak, namun target dan aplikasinya dalam pengurangan emisi CO2 di pelabuhan masih kurang mendapat perhatian terutama di negara berkembang seperti Indonesia. Penelitian ini menggunakan machine learning dalam memperkirakan emisi CO2 dari aktivitas kapal di tujuh pelabuhan di Indonesia kemudian dicari variable yang berpengaruh pada total emisi sebagai fokus dalam pengembangan Ship Energy Efficiency Management Plan (SEEMP). Dilakukan prediksi total emisi CO2 menggunakan regresi hutan acak kemudian keefektifannya diverifikasi menggunakan validasi silang k-fold, hasil prediksi kemudian dibandingkan dengan total emisi perhitungan metode bottom-up. Hasil analisis attribute weight berdasarkan correlation menunjukkan bahwa daya mesin dan waktu operasi kapal di pelabuhan memiliki pengaruh yang lebih besar dalam menghasilkan emisi CO2. Prediksi total emisi menunjukkan bahwa model memiliki akurasi yang cukup rendah akibat banyaknya data yang kosong meskipun algoritma model sudah tergolong bagus. Akhirnya, operasi hemat bahan bakar dibahas dengan fokus pada tenaga dan bahan bakar alternatif serta peningkatan efisiensi kerja, penggunaan bahan bakar bersih dari hidrogen dan biofuel mamiliki potensi pengurangan yang paling tinggi dengan cold ironing sebagai alternatif yang dapat memenuhi syarat pengurangan emisi per tahun sebesar 20%. Dibutuhkan data yang lengkap untuk melakukan prediksi total emisi yang akurat serta pengembangan teknis dan ketersediaan sumber daya pada metode yang telah dibahas agar dapat di implementasikan kedalam Rencana Pengelolaan Efisiensi Energi Kapal. ......Although there are many studies on alternative fuels and drivers, the target and their application in reducing CO2 emissions at ports have received little attention, especially in developing countries such as Indonesia. This study uses machine learning to estimate CO2 emissions from ship activities at seven ports in Indonesia and then looks for variables that affect total emissions as a focus in developing a Ship Energy Efficiency Management Plan (SEEMP). Total CO2 emissions were predicted using random forest regression, their effectiveness was then verified using k-fold cross-validation, the prediction results were then compared with the total emissions calculated using the bottom-up method. The results of attribute weight analysis based on correlation show that engine power and ship operating time in port have a greater influence in producing CO2 emissions. Prediction of total emissions shows that the model has a fairly low accuracy due to the large number of blank data despite the model algorithm exelency. Finally, fuel-efficient operations are discussed with a focus on alternative power and fuels as well as improving work efficiency, the use of clean fuels from hydrogen and biofuels has the highest reduction potential with cold ironing as an alternative that can meet the requirements of 20% annual emission reduction. Complete data is needed to make accurate predictions of total emissions as well as technical development and resource availability on the methods discussed so that they can be implemented into the Ship Energy Efficiency Management Plan.
Depok: Fakultas Teknik Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ardiansyah Ramadhan Pranoto
Abstrak :
Menurut EEB Laboratory Jakarta, pada tahun 2016 sektor bangunan memiliki mengkonsumsi 18-20% dari total penggunaan energi di Indonesia, dan terus menerus meningkat seiring perkembangan teknologi yang membutuhkan sumber energi dalam upaya peningkatan kualitas hidup penghuni bangunan. Bangunan pintar merupakan sebuah konsep pemanfaatan teknologi yang tidak hanya bertujuan meningkatkan kenyamanan penghuni, tetapi juga dapat membantu dalam upaya efisiensi energi pada operasional bangunan. Maka dari itu, penelitian ini akan membantu upaya perancangan efisiensi energi pada sebuah bangunan dengan meninjau fitur dan karakteristik yang berpotensi dalam mendukung efisiensi energi dengan penerapan konsep bangunan pintar. Selain itu, akan dibuat sebuah model dengan pemanfaatan machine learning yang mampu memberikan prediksi tingkat penggunaan energi berdasarkan fitur-fitur yang diberikan. Model machine learning yang dihasilkan memiliki rata-rata nilai kesalahan relatif sebesar 17,76%, serta didapatkan tingkat efisiensi dengan penerapan seluruh fitur yang diidentifikasi pada rentang 34,5% hingga 45,3% tergantung pada lantai yang ditinjau. ......According to EEB Laboratory Jakarta, Indonesian building sector accounts for 18- 20% energy consumption in 2016, and this trend will continuously increase as technology needed to increase housing residents' quality keeps advancing. Smart building is a concept to utilise technology that does not only help increase occupants' comfort inside the building, but it can also help increase energy usage efficiency in building operations. This research aims to help the effort in designing energy efficiency planning for a building by reviewing potential features and characteristics that could help improves energy efficiency with implementation of the smart building concept. A model based on machine learning that could give prediction on the level of energy consumption based on given features will also be discussed here. This model of machine learning has a 17,76% average of relative error, as well as 34,5% until 45,3% efficienct level that includes implementation of all features, depending on analysed floor.
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Noperida Damanik
Abstrak :
Bank adalah salah satu industri keuangan. Sebagai industri keuangan yang melayani nasabah, ada risiko yang terjadi pada bank. Salah satu risiko yang sering terjadi dan menyebabkan kerugian di bank adalah fraud dalam bentuk skimming pada transaksi tarik tunai ATM. Penelitian ini dilakukan untuk mengetahui pemodelan data mining yang dapat digunakan untuk mendeteksi fraud skimming di salah satu bank. Tujuan dari penelitian ini adalah memberikan referensi dalam mencari pemodelan deteksi fraud. Karakteristik data yang digunakan adalah imbalanced data karena data transaksi fraud sangat kecil dibandingkan dengan data transaksi normal. Metode yang digunakan pada penelitian ini adalah tinjauan pustaka, wawancara dan eksperimen terhadap teknik machine learning. Pembentukan model pada penelitian ini dilakukan dengan mengimplementasikan kombinasi dari penggunaan feature selection dan tanpa feature selection, penggunaan SMOTE dan tanpa SMOTE, serta penggunaan feature engineering dan tanpa feature engineering dengan jarak dan jeda transaksi sehingga diperoleh delapan scenario dari hasil kombinasi. Hasil dari penelitian ini menunjukkan bahwa dari seluruh skenario yang diuji coba, algoritma Extreme Gradient Boosting merupakan algoritma terbaik dalam menghasilkan model deteksi fraud. Skenario terbaik yang dihasilkan adalah skenario dengan mengimplementasikan ketiga teknik sekaligus yaitu feature selection, SMOTE dan feature engineering dengan jarak dan jeda transaksi. Berdasarkan hasil evaluasi model, pembentukan model dengan feature engineering dengan jarak dan jeda transaksi dapat meningkatkan performa model klasifikasi. ......Bank is one of financial industry. As a financial industry that serve customers, bank is potentially exposed to risk. One of potentially risk that making loss in bank is fraud in form of skimming on ATM transaction. This study is conducted to know data mining modelling that can be used to detect skimming fraud in a bank. The purpose of this study is to provide reference in looking for fraud detection modelling. The characteristics of the data used in this study is imbalanced data since fraud transaction data is very small compared to normal transaction data. The method used in this study is the literature review, semi-structured interviews, and experiments on machine learning techniques. Creating model on this study is conducted by implementing combination of three used techniques namely feature selection, SMOTE, and feature engineering with distance and transaction lag. There are eight scenarios used in this study that were tested and analyzed the results according to the needs of the case study research. The results of this study indicate that the Extreme Gradient Boosting algorithm can identify fraudulent transactions. The best scenario is a scenario by creating a model that implements feature selection, SMOTE to handle imbalanced data, and feature engineering with distance and transaction lag. Based on model evaluation, model generation by implementing feature engineering with distance and transaction lag can improve performance of classification model.
Jakarta: Fakultas Ilmu Komputer Universitas Indonesia, 2021
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library