Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Febiola Damayanti
"Pandemi COVID-19 (coronavirus disease 2019) membuat para peneliti di seluruh dunia bekerja untuk memahaminya dengan menerapkan pendekatan machine learning. Severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) merupakan penyebab dari COVID-19. Penelitian ini membahas klasifikaasi sekuens protein SARS-CoV-2 menggunakan metode LightGBM dan Elastic Net. Metode LightGBM merupakan metode gradient boosting yang cepat dan memiliki high-performance berbasis decision tree untuk melakukan prediksi. Total data sekuens protein yang digunakan adalah 2000 data yang diambil dari situs Uniprot. Uniprot merupakan salah satu situs yang digunakan terkait bioinformatika atau sumber daya sekuens protein dan informasi fungsional yang memiliki kualitas tinggi, komprehensif dan dapat diakses secara bebas. Data tersebut memiliki perincian yaitu 1000 data sekuens protein SARS-CoV-2 dan 1000 data sekuens protein bukan SARS-CoV-2. Python package Discere digunakan untuk mengekstraksi 27 fitur sekuens protein. Selanjutnya, Elastic Net digunakan untuk memilih fitur-fitur yang optimal dan terpilih sebanyak 10 fitur. Terakhir, LightGBM digunakan sebagai metode klasifikasi sekuens protein SARS-CoV-2. Hasil evaluasi performa LightGBM diukur dari akurasi, sensitivitas, dan spesifisitas. Nilai rata-rata akurasi diperoleh 98,87%, nilai rata-rata sensitivitas diperoleh 99,02%, dan nilai rata-rata spesifisitas diperoleh 98,82%

The COVID-19 (coronavirus disease 2019) pandemic has researchers around the world working to understand it by applying a machine-learning approach. Secere acute respiratory syndrome coronavirus 2 (SARS-Cov-2) is the cause of COVID-19. This research discusses the classification of SARS-Cov-2 protein sequences using the LightGBM and Elastic Net methods. The LightGBM method is a gradient-boosting method that fast and has a high-performance decision tree based for making predictions. The total protein sequence data used is 2000 data taken from UniProt site. UniProt is one of the sites used for bioinformatics or protein sequence resources and functional information which is of high quality, comprehensive and freely accesible. The data has details, namely 1000 protein sequence data for SARS-CoV-2 and 1000 protein sequnce data for non-SARS-CoV-2. Python package Dsiscere is used to extraxt 27 protein sequence features. Futhermore, Elastic Net is used to select optimal features and 10 features are selected. While LightGBM is used as a classification method for SARS-Cov-2 protein sequences. The results of the LightGBM performance evaluation are measured by accuracy, sensitivity, and specificity. The average value for accuracy was 98,87%, the average value for sensitivity was 99,02%, and average value for specificity was 98,82%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aditya Bariq Ikhsan
"Kandungan total karotenoid dalam tumbuhan umumnya diukur menggunakan analisis spektrofotometri, dengan sifatnya yang merusak sampel terdapat batasan yang bisa dilakukan untuk penelitian selanjutnya. Digunakan pencitraan hiperspektral menggabungkan analissi spektral dan spasial yang bersifat tidak merusak sampel. Timbul masalah terutama pada bagian algoritma untuk membuat sistem prediksi pada citra hiperspektral karena diperlukan algoritma dengan akurasi yang tepat dan cepat. Penelitian ini membahas tentang komparasi algoritma pembelajara mesin metode ensemble dengan menambahkan tuning hyperparameter menggunakan random search dan memanfaatkan seleksi fitur yang dimiliki tiap model untuk meningkatkan performa dan mengurangi waktu latih model prediksi kadar karotenoid pada daun Bisbul. Sistem prediksi menghasilkan performa dasar, random forest dengan semua fitur memiliki RMSE sebesar 38,16, serta R2 sebesar 0,95, dan waktu latih 4,27s, xgboost dengan semua fitur memiliki RMSE sebesar 39,82, serta R2 sebesar 0,95, dan waktu latih 0,83s, lightgbm dengan semua fitur memiliki RMSE sebesar 35,59, serta R2 sebesar 0,96, dan waktu latih 1,73s, catboost dengan semua fitur memiliki RMSE sebesar 31,60, serta R2 sebesar 0,97, dan waktu latih 17,34s. Dengan menggunakan fitur hasil seleksi dan I, performa sistem berhasil ditingkatkan, random forest tuning dengan 30 fitur memiliki RMSE sebesar 34,39, serta R2 sebesar 0,96, dan waktu latih 5,85s, xgboost tuning dengan 120 fitur memiliki RMSE sebesar 33,32, serta R2 sebesar 0,96, dan waktu latih 1,73s, lightgbm tuning dengan 50 fitur memiliki RMSE sebesar 32,24, serta R2 sebesar 0,97, dan waktu latih 0,22s, catboost tuning dengan 40 fitur memiliki RMSE sebesar 28,53, serta R2 sebesar 0,97, dan waktu latih 4,92s. Secara umum Catboot memiliki peningkatan RMSE paling tinggi, lightgbm memiliki peningkatan waktu latih paling tinggi.

The total carotenoid content in plants is generally measured using spectrophotometric analysis, with its destructive to the sample there are limitations that can be done for further research. Hyperspectral imaging combining spectral and spatial analysis is used that is not destructive to the sample. Problems arise, especially in the algorithm section to create a prediction system on hyperspectral images because an algorithm with precise and fast accuracy is required. This study discusses the comparations of machine learning algorithm with the ensemble method by adding hyperparameter tuning using random search and utilizing the feature selection of each model to improve performance and reduce training time for predictive models of carotenoid levels in velvet leaves. The prediction system produces basic performance, random forest with all features has RMSE of 38.16, and R2 of 0.95, and training time of 4.27s, xgboost with all features has RMSE of 39.82, and R2 of 0.95, and training time of 0.83s, lightgbm with all features has an RMSE of 35.59, and R2 of 0.96, and training time of 1.73s, catboost with all features has an RMSE of 31.60, and R2 of 0.97, and training time 17.34s. By using the selected features and I, system performance has been successfully improved, random forest tuning with 30 features has an RMSE of 34.39, and R2 of 0.96, and training time of 5.85s, xgboost tuning with 120 features has an RMSE of 33, 32, and R2 of 0.96, and training time of 1.73s, lightgbm tuning with 50 features has RMSE of 32.24, and R2 of 0.97, and training time of 0.22s, catboost tuning with 40 features has an RMSE of 28.53, and R2 is 0.97, and training time is 4.92s. In general Catboot has the highest increase in RMSE, lightgbm has the highest increase in training time."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library