Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Adawiyah Ulfa
Abstrak :
Pengembangan inhibitor Dipeptidyl Peptidae-4 (DPP-4) sangat diperlukan dalam pengobatan Diabetes Mellitus tipe 2 dengan efek samping yang rendah. Pemodelan hubungan kuantitatif struktur aktivitas (QSAR) merupakan pendekatan analisis hubungan struktur kimia dengan aktivitasnya yang banyak digunakan dalam desain obat penyakit Diabetes. Pada tesis ini, model QSAR klasifikasi dibangun untuk memprediksi struktur aktivitas senyawa pada inhibitor DPP-4 yang dapat memblokir kerja enzim DPP-4. Dalam representasi molekul digunakan circular fingerprint ECFP dan FCFP yang menyajikan notasi SMILES dalam format vektor biner. Fingerprint ECFP dan FCFP yang berdiameter 4 dan 6 sebagai input data dalam membangun model QSAR klasifikasi. Pada QSAR klasifikasi dengan pendekatan deep learning memberikan waktu yang cepat dalam proses virtual screening senyawa aktif atau tidak aktif dalam inhibitor DPP-4. Penelitian ini menggunakan model Hybrid Deep Learning 1D CNN-LSTM untuk memprediksi aktivitas senyawa inhibitor dalam kelas aktif atau tidak aktif berdasarkan nilai aktivitas biologis dengan proporsi data latih dan data uji yang berbeda. Dalam arsitektur 1D CNN-LSTM terdiri dari model 1D CNN sebagai tahap ektraksi fitur dan output dari lapisan konvolusi 1D CNN digunakan dalam lapisan LSTM. Selain itu, pemilihan fitur dengan metode Random Forest-Recursive Feature Elimination (RF-RFE) digunakan untuk memperoleh fitur yang optimal dari dataset ECFP dan FCFP. Selanjutnya, penelitian ini membandingkan performa model dengan menerapkan pemilihan fitur RF-RFE dan tanpa pemilihan fitur RF-RFE. Hasil penelitian ini menunjukkan bahwa model QSAR klasifikasi menggunakan Hybrid Deep Learning yaitu 1D CNN-LSTM dengan pemilihan fitur RF-RFE memperoleh performa model yang lebih baik dibandingkan model tanpa pemilihan fitur optimal. Performa model 1D CNN-LSTM dengan pemilihan fitur RF-RFE menggunakan data ECFP_4 dengan proporsi data latih 80% memiliki akurasi sebesar 0.9075, sensitivitas 0.9008, spesifisitas 0.9142, dan nilai MCC 0.8151. ......The development of Dipeptidyl Peptidase-4 (DPP-4) inhibitors is urgently needed in the treatment of Type 2 Diabetes Mellitus with low side effects. Activity structure quantitative relationship modeling (QSAR) is an analytical approach to the relationship between chemical structure and activity which is widely used in diabetes drug design. In this thesis, a classification QSAR model was built to predict the structure of the activity of the DPP-4 inhibitor compound that can block the action of the DPP-4 enzyme. In molecular representation, ECFP and FCFP circular fingerprints are used which present SMILES notation in binary vector format. ECFP and FCFP fingerprints with diameters of 4 and 6 as input data in building a classification QSAR model. The QSAR classification with a deep learning approach provides fast time in the virtual screening process for active or inactive compounds in DPP-4 inhibitors. This study uses the Hybrid Deep Learning 1D CNN-LSTM model to predict the activity of inhibitor compounds inactive or inactive classes based on the value of biological activity with different proportions of training data and test data. The 1D CNN-LSTM architecture consists of a 1D CNN model as the feature extraction stage and output of 1D CNN convolution layer is used in the LSTM layer. In addition, feature selection using the Random Forest-Recursive Feature Elimination (RF-RFE) method was used to obtain optimal features from the ECFP and FCFP datasets. Furthermore, this study compares the performance of the model by applying the RF-RFE feature selection and without the RF-RFE feature selection. The results of this study indicate that the classification QSAR model using Hybrid Deep Learning, namely 1D CNN-LSTM with RF-RFE feature selection, obtains better model performance than the model without optimal feature selection. The performance of the CNN-LSTM 1D model with RF-RFE feature selection using ECFP_4 data with a proportion of 80% training data has an accuracy of 0.9075, sensitivity of 0.9008, specificity of 0.9142, and an MCC value of 0.8151.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Dian Puspita Sari
Abstrak :
Coronavirus yaitu kelompok virus yang menginfeksi sistem pernapasan yang dapat menyebabkan infeksi pernapasan ringan maupun berat. Salah satu virus yang termasuk ke dalam coronavirus adalah SARS-CoV-2. Penyakit yang disebabkan oleh virus SARS-CoV-2 disebut COVID-19. COVID-19 pertama kali terdeteksi pada tahun 2019 di Wuhan, China. Penyebaran COVID-19 sangat cepat dengan tingkat kematian yang tinggi terus terjadi di berbagai negara sehingga penyakit ini berstatus pandemi. Skripsi ini menyelesaikan masalah klasifikasi virus SARS-CoV-2 dengan menggunakan data sekuens protein coronavirus. Seleksi fitur pada data sekuens protein coronavirus menggunakan metode seleksi fitur Random Forest-Recurisive Feature Elimination (RF-RFE). Setelah dilakukan seleksi fitur, dilakukan klasifikasi menggunakan pendekatan machine learning dengan metode Support Vector Machine (SVM) dan Particle Swarm Optimization-Support Vector Machine (PSO-SVM). Hasil terbaik performa rata-rata akurasi, spesifisitas, dan sensitivitas untuk metode SVM berturut-turut adalah 93,43%, 98,06%, dan 88,84% pada data pelatihan sebesar 80%. Untuk metode PSO-SVM, hasil terbaik rata-rata akurasi dan spesifisitas adalah 98,48% dan 98,57% pada data pelatihan sebesar 80%, sedangkan hasil terbaik rata-rata sensitivitas adalah 98,96% pada data pelatihan sebesar 90%. Oleh karena itu, pada penelitian ini dapat disimpulkan bahwa metode PSO-SVM menghasilkan performa yang lebih baik dibandingkan dengan metode SVM. ......Coronaviruses are a group of viruses that infect the respiratory system that can cause mild or severe respiratory infections. One of the viruses that belongs to the coronavirus is SARS-CoV-2. The disease caused by the SARS-CoV-2 virus is called COVID-19. COVID-19 was first detected in 2019 in Wuhan, China. The spread of COVID-19 is very fast with a high mortality rate that continues to occur in various countries so that this disease has a pandemic status. This thesis solves the problem of classifying the SARS-CoV-2 virus using coronavirus protein sequence data. Feature selection on coronavirus protein sequence data used the Random Forest-Recursive Feature Elimination (RF-RFE) feature selection method. After feature selection, classification is carried out using a machine learning approach with the Support Vector Machine (SVM) and Particle Swarm Optimization-Support Vector Machine (PSO-SVM) methods. The best results of the average performance of accuracy, specificity, and sensitivity for the SVM method are 93.43%, 98.06%, and 88.84%, respectively, for training data of 80%. For the PSO-SVM method, the best results on average accuracy and specificity are 98.48% and 98.57% on training data of 80%, while the best results on average sensitivity are 98.96% on training data of 90%. Therefore, in this study it can be concluded that the PSO-SVM method produces better performance than the SVM method.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library