Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 6 dokumen yang sesuai dengan query
cover
Ida Mujtahidah
Abstrak :
ABSTRAK
Protein memiliki peranan penting dalam mengontrol fungsi enzim, mengatur produksi dan aktivitas di dalam sel. Untuk melakukan hal ini, protein berinteraksi dengan protein-protein lainnya, DNA dan molekul-molekul lainnya. Jaringan interaksi protein-protein ini memiliki ukuran yang sangat besar. Sehingga untuk memudahkan dalam menganalisis jaringan ini diperlukan metode clustering. Pada penelitian ini, algoritma Markov clustering digabungkan dengan algoritma firefly yang disebut sebagai algoritma firefly-Markov clustering FMCL . Pada algoritma FMCL, posisi kunang-kunang akan menggantikan nilai parameter inflate. Kemudian proses clustering akan berlangsung menggunakan algoritma Markov clustering MCL . Selanjutnya posisi kunang-kunang akan terus diperbarui dan proses clustering akan terus dilakukan sampai diperoleh hasil clustering terbaik. Komputasi paralel pada algoritma FMCL menggunakan OpenMP. Setiap thread menjalankan proses pada Markov clustering menggunakan parameter inflate yang ditentukan oleh posisi kunang-kunangnya. Hasil yang diperoleh pada data jaringan interaksi protein HIV ada 4 cluster. Dari 4 cluster ini terdapat satu cluster besar yang saling terhubung dengan 6 pusat cluster lainnya yaitu NEF, GAG, GAG-POL, VPR, VIF dan VPU. Pada 3 cluster lainnya yang menjadi pusat cluster adalah TAT, REV dan ENV. Sedangkan dengan menggunakan data jaringan interaksi protein pada Human Herpesvirus tipe 4 HHV-4 diperoleh 14 cluster. Protein yang menjadi pusat cluster adalah EBNA-LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2-BBLF3, EBNA3B, BRLF1, BGLF4, BYRF1. Selain itu, juga dapat dilihat bahwa ada beberapa cluster yang hanya merupakan interaksi antara dua protein yaitu BBRF1 dengan NFKB2, EBNA3A dengan CHEK2, LMP2A dengan ITCH, dan EBNA3C dengan EP300. Speed up algoritma FMCL yang dijalankan menggunakan OpenMP pada data HIV dan HHV-4 adalah 4.73x dan 3.21x lebih cepat dibandingkan dengan algoritma FMCL yang dijalankan secara sekuensial.
ABSTRACT
Protein plays an important role in controlling enzyme function, regulating production and activity in cell. To do this function, proteins will interact with other protein, DNA and other molecules. Protein interaction network have a very large size. Then to simplify analyzing this network is required clustering method. In this study, Markov clustering algorithm combined with a firefly algorithm called firefly Markov clustering algorithm FMCL . In FMCL algorithm, firefly position will be replace the value of inflate parameter. Then clustering process will take place using Markov clustering algorithm MCL . Futhermore, the firefly position will be updated and clustering process will be continue until its get the best clustering. Parallel computing on FMCL algorithm using OpenMP. Each thread will run the process on Markov clustering by using inflate parameter specified by the position of firefly. The clustering result from protein interaction network on HIV is 4 clusters. From this cluster, there is a large cluster connected with 6 other cluster centers, they are NEF, GAG, GAG POL, VPR, VIF and VPU. In the 3 other clusters that become the center of the cluster are TAT, REV and ENV. While by using protein interaction network on HHV 4 obtained 14 clusters. The proteins that become the center of the clusters are EBNA LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2 BBLF3, EBNA3B, BRLF1, BGLF4 and BYRF1. In addition, it can be seen that there are several clusters that are just interaction between two proteins, BBRF1 with NFKB2, EBNA3A with CHECK2, LMP2A with ITCH and EBNA3C with EP300. The speed up of FMCL algorithm by using OpenMP HIV and HHV 4 data is 4.73x and 3.21x faster than the sequentially executed.
2018
T49526
UI - Tesis Membership  Universitas Indonesia Library
cover
M. Syamsuddin Wisnubroto
Abstrak :
ABSTRAK
Protein memiliki peranan yang sangat penting dalam kehidupan. Setiap protein berinteraksi dengan protein-protein lain, DNA, dan molekul-molekul lainnya, sehingga terbentuklah jaringan interaksi protein yang berukuran sangat besar. Untuk memudahkan dalam menganalisisnya, diperlukan metode clustering. Algoritma Soft Regularized Markov Clustering (SR-MCL) merupakan pengembangan metode clustering yang mengurangi kelemahan dari Regularized Markov Clustering dan Markov Clustering. Namun, SR-MCL masih memiliki kelemahan yaitu parameter inflasi yang selalu dimasukkan secara manual oleh peneliti. Penelitian ini, SR-MCL digabung dengan Algoritma Firefly yang selanjutnya disebut Firefly Soft Regularized Markov Clustering, dimana posisi setiap firefly menggantikan parameter inflasi. Posisi firefly akan terus diperbaharui dan proses clustering akan terus dilakukan sampai memperoleh global chaos kurang dari threshold. FSR-MCL akan diterapkan secara paralel menggunakan OpenMP, yaitu setiap thread menjalankan SR-MCL dengan posisi setiap firefly yang berbeda. Proses clustering data HIV-1 diperoleh sembilan protein sebagai pusat cluster yang sangat berpengaruh dalam pembentukan dan penyebaran virus, yaitu TAT, REV, ENV, GAG, POL, VPU, VPR, NEF, dan VIF, serta didapat parameter inflasi terbaiknya 8,0 dengan speed up 4,66 kali. Proses clustering data SC5314 diperoleh enam protein sebagai pusat cluster yang merupakan protein penting dalam penyebarannya, yaitu HSP90, CBK1, MED8, NOP1, CEK1, dan CDC4, serta didapat parameter inflasi terbaiknya 5,5 dengan speed up 3,01 kali.
ABSTRACT
Protein has a very important role in life. Each protein interacts with other proteins, DNA, and other molecules, resulting in a very large protein-protein interaction. To make it easier to analyze it, clustering method is needed. Soft Regularized Markov Clustering (SRMCL) algorithm is a development of clustering method that reduces the weakness of Regularized Markov Clustering and Markov Clustering. However, SR-MCL still has a weakness that is the parameter of inflation that is always entered manually by researchers. This study, SR-MCL combined with Firefly Algorithm, hereinafter called Firefly Soft Regularized Markov Clustering, where the position of each firefly replace the parameters of inflation. The firefly position will continue to be updated and the clustering process will continue until the global chaos is less than the threshold. FSR-MCL will be applied in parallel using OpenMP, ie each thread runs SR-MCL with the position of each different firefly. The process of clustering the HIV-1 data obtained by nine proteins as the center of the cluster is very influential in the formation and spread of the virus, namely TAT, REV, ENV, GAG, POL, VPU, VPR, NEF, and VIF, and got the best inflation parameter 8.0 with speed up 4.66 times. SC5314 data clustering process obtained six proteins as the center of the cluster which is an important protein in its spreading, namely HSP90, CBK1, MED8, NOP1, CEK1, and CDC4, and got the best inflation parameter 5.5 with speed up 3.01 times.
2018
T49442
UI - Tesis Membership  Universitas Indonesia Library
cover
Mohamad Irvan Septiar Musti
Abstrak :
ABSTRAK
HIV Human Immunodeficiency Virus adalah sebuah jenis retrovirus obligat intraseluler yang menyerang sistem kekebalan tubuh manusia. Virus ini menyerang dengan cara melakukan interaksi antara protein virus dengan protein manusia. Penelitian ini menggunakan data berupa barisan asam amino dari protein yang akan diubah fiturnya menggunakan metode global encoding. Hasil ekstraksi fitur tersebut kemudian akan digunakan sebagai masukan untuk metode rotation forest guna memprediksi interaksi protein HIV dengan manusia. Selain itu pula, penelitian ini juga membandingkan performa metode rotation forest yang menggunakan Principal Component Analysis RF PCA dengan rotation forest yang menggunakan Independent Principal Component Analysis RF IPCA sebagai metode transformasi peubah bebas dalam metode tersebut. Hasil dari penelitian ini menunjukkan bahwa RF PCA memperoleh hasil performa tertinggi dalam memprediksi interaksi protein HIV dengan protein manusia, yaitu dengan nilai akurasi sebesar 79,50 , sensitivitas 79,91 , spesifisitas 79,07 dan presisi sebesar 79,77 . Sementara itu, metode RF IPCA memperoleh hasil performa tertinggi yaitu dengan nilai akurasi sebesar 77,20 , sensitivitas 76,65 , spesifisitas 77,81 , dan presisi sebesar 79,40 . Selain itu pula, dalam penelitian ini ditemukan sebanyak 2.619 protein manusia yang terprediksi berinteraksi dengan protein HIV melalui model terbaik RF PCA , dan juga ditemukan sebanyak 3.071 protein manusia yang terprediksi berinteraksi dengan protein HIV melalui model terbaik RF IPCA dari total sebanyak 7.678 protein manusia yang diteliti.
ABSTRACT
HIV Human Immunodeficiency Virus is a type of retrovirus obligate intracellular that attacks the human body 39 s immune system. This virus attacks by doing interaction between virus and human proteins. This research uses data of amino acids sequence from protein that the feature will be extracted using Global Encoding. The result of feature extraction then would be used as an input for Rotation Forest in order to predict interaction between HIV and human proteins. In addition, this research also compares the performance of Rotation Forest that using Principal Component Analysis RF PCA with Independent Principal Component Analysis RF IPCA as a method of transformation in that method. The result shows that RF PCA produced highest performance in classifying protein interactions between HIV and human, with accuracy value of 79,50 , 79,91 sensitivity, 79,07 specificity and 79,77 precision. While the RF IPCA produced highest performance with 77,20 accuracy, 76,65 sensitivity, 77,81 specificity, and 79,40 precision. In addition, there are 2.619 human protein which is predicted has an interaction with HIV protein through RF PCA best model, and there are 3.071 human protein which is predicted has an interaction with HIV protein through RF IPCA best model from the total of 7.678 human protein. All of that can be found in this research.
2018
T49480
UI - Tesis Membership  Universitas Indonesia Library
cover
Vira Yustia Nurazmi
Abstrak :
ABSTRAK
Algoritma Regularized Markov Clustering RMCL adalah suatu metode graf clustering yang merupakan pengembangan dari Markov Clustering MCL . Algoritma RMCL masih memiliki kelemahan pada parameter penggelembungan yang biasanya selalu diinputkan oleh pengguna untuk mendapatkan hasil clustering yang baik. Pada penelitian ini, RMCL digabungkan dengan algoritma Firefly untuk menganalisis jaringan interaksi protein yang disebut algoritma Firefly Regularized Markov Clustering FRMCL . Algoritma Firefly merupakan algoritma yang terinspirasi dari perilaku kunang-kunang dalam mencari koloninya. Implementasi algoritma FRMCL dilakukan pada data jaringan interaksi protein HIV-1 dan Human Herpesvirus 1. Data yang digunakan direpresentasikan ke dalam sebuah graf tak-berarah . Selanjutnya, posisi kunang-kunang pada algoritma firefly akan berperan sebagai parameter penggelembungan. Setiap firefly akan melakukan proses RMCL, sehingga diperoleh beberapa hasil RMCL dengan parameter berbeda. Setiap proses RMCL memberikan nilai global chaos, yang dipilih adalah global chaos minimum yang akan dijadikan best firefly, kemudian akan dilakukan proses perhitungan kembali. Posisi firefly baru ini selanjutnya bertindak sebagai parameter penggelembungan yang baru dan dilakukan proses FRMCL berlanjut hingga diperoleh cluster terbaik. Komputasi paralel akan digunakan saat setiap firefly menjalankan proses FRMCL dengan bahasa pemrograman OpenMP. Berdasarkan hasil simulasi yang dilakukan, diperoleh 14 cluster untuk data Human Herpesvirus 1 dan 4 cluster untuk data HIV-1. Sedangkan proses paralel yang dilakukan pada kedua data PPI tersebut diperoleh running time dan speed up yang menunjukkan komputasi paralel menggunakan 8 thread diperoleh 3,66x dan 4,51x lebih cepat dibandingkan dengan komputasi sekuensial.
ABSTRACT
Regularized Markov Clustering RMCL algorithm is a clustering graph method which is the development of Markov Clustering MCL . The RMCL algorithm still has weaknesses on inflate parameters that are usually always input by the user to get best clustering results. In this research, RMCL combined with the Firefly algorithm to analyze a protein interaction network called the Firefly Regularized Markov Clustering FRMCL algorithm. The Firefly algorithm is an algorithm that is inspired by the behavior of fireflies looking for their colonies. Implementation of the FRMCL algorithm was carried out on the data network of HIV 1 protein interactions and Human Herpesvirus 1. The data used to be represented in an undirected graph G. Then, firefly position on the firefly algorithm will act as an inflate parameter. Every firefly will perform the RMCL process, and then obtained some RMCL results with different parameters. Each RMCL process give generated from global chaos, which will be selected minimum global chaos which will be the best firefly, it will be processed back again. This new firefly position will act as a new inflate parameter and perform the FRMCL process until to produce the best clusters. Parallel computations will be used when each firefly runs the FRMCL process with the programming language using OpenMP. Based on the results of the simulation, 14 clusters are obtained for Human Herpesvirus 1 and 4 cluster data for HIV 1 data. The parallel processing performed on both PPI data is due to running time and speed shows 3,66x and 4,51x parallel computing using 8 thread which faster than sequential computing.
2018
T49488
UI - Tesis Membership  Universitas Indonesia Library
cover
Shirley Aprilia
Abstrak :
ABSTRAK
Protein adalah salah satu biomakromolekul yang mempunyai peran sangat penting dalam organisme hidup. Semua jenis protein terdiri dari serangkaian kombinasi 20 asam amino. Interaksi Protein-Protein Interaksi PPI memainkan peran penting dalam sebagian besar proses biologis sehingga deteksi interaksi protein-protein PPI pada dasarnya penting untuk memahami mekanisme molekuler dalam sistem biologis. Dengan menggunakan proses komputasi dan menerapkan metode pembelajaran mesin, akan lebih efisien daripada metode eksperimental yang membutuhkan waktu lama dan biaya mahal. Dalam tesis ini penulis menggunakan Discrete Cosine Transform sebagai metode fitur ekstraksi barisan asam amino dan Rotation Forest sebagai model klasifikasi untuk mendapatkan kinerja yang lebih baik daripada metode sebelumnya, seperti Support Vector Machine, Random Forest, dan lain-lain. Hal baru dalam tulisan ini terletak pada interaksi protein protein dengan virus HIV yang menyebabkan AIDS. Hasil penelitian menunjukkan bahwa metode yang diusulkan layak dilakukan, kuat dan dapat digunakan untuk prediksi interaksi protein-protein lainnya dengan akurasi hingga 77 dan metode transformasi Rotation Forest yang menggunakan PCA lebih baik dibandingkan metode transformasi Rotation Forest yang menggunakan IPCA. Terdapat 962 protein yang berpotensi berinteraksi pada PCA dari 4529 potein dan 2902 protein pada IPCA dari 7499 protein.
ABSTRACT
Protein is one of the bio macromolecules that have a very important role in living organisms. All types of proteins consist of a series of combinations of 20 amino acids. Interaction of Protein Protein Interactions PPI plays an important role in most biological processes so that the detection of protein protein interactions PPIs is basically important for understanding molecular mechanisms in biological systems. By using computational processes and applying machine learning methods, it will be more efficient than experimental methods that take a long time and costly. In this thesis the author uses Discrete Cosine Transform as a method of extraction of amino acid sequences and Rotation Forest as a prediction model to get better performance than previous methods, such as Support Vector Machine, Random Forest, etc . The novelty in this paper lies in the interaction of protein proteins with the HIV virus that causes AIDS. The results show that the proposed method is feasible, robust and can be used for the classification of other protein interactions with up to 77 accuracy and Rotation Forest transformation methods using PCA better than Rotation Forest transformation methods using IPCA. There are 962 potentially interacting proteins in the PCA of 4529 potein and 2902 proteins in IPCA of 7499 proteins.
2018
T49487
UI - Tesis Membership  Universitas Indonesia Library
cover
Susilo Hartomo
Abstrak :
ABSTRAK
Human Immunodeficiency Virus (virus HIV) adalah virus penyebab penyakit Acquired Immunodeficiency Syndrome (AIDS). Virus HIV merupakan retro virus yang menginfeksi sel-sel sistem kekebalan tubuh manusia. Virus HIV dalam proses menginfeksi tubuh manusia tidak dapat lepas dari terjadinya interaksi antara protein HIV dan protein manusia. Untuk menganalisis jaringan interaksi antar protein dapat menggunakan barisan asam amino penyusun dari suatu protein. Proses analisis dapat dilakukan dengan metode konvensional maupun komputasi. Keunggulan menggunakan metode komputasi yaitu dapat menghemat waktu maupun biaya. Metode rotation forest merupakan sebuah metode ensemble untuk pemprediksian. Dalam pemprediksian interakasi protein menggunakan barisan asam amino rotation forest akan dikombinasikan dengan fitur ekstraksi dalam penelitian ini menggunakna PseudoSMR. Data untuk membuat model prediksi berupa interaksi protein beserta barisan asam amino. Data tersebut dapat diperoleh dari NCBI (National Centre for Biotechnology Information). Fitur ekstraksi menggunakan PseudoSMR akan merubah barisan asam amio berupa barisan alphabet menjadi sebuah vektor ciri. Di dalam fitur ekstraksi PsedoSMR terdapat variabel yang membuat matriks hasil dari fitur ekstraksi PseudoSMR mempunyai ukuran yang bereda. Matriks hasil ektraksi ciri akan dijadikan sebagain data training dan data testing dalam pembuatan model rotation forest, sehingga total data set yang digunakan ada sebanyak 6 data set. Hasil prediksi rotation forest untuk RF(PCA) yang paling bagus pada data dan untuk RF(IPCA) yang paling bagus pada data . Nilai evaluasi performa pada kisaran 0.759436 sampai 0.793178 untuk RF(IPCA) sedangkan untuk RF(PCA) pada kisaran 0.774837 sampai 0.812225. Nilai evaluasi tertinggi didapat pada saat variabel dimana merupakan panjang kolom. Semua perhitungan dan proses membuat model prediksi menggunakan software R.
ABSTRACT
Human Immunodeficiency Virus (HIV virus) is a virus that causes the disease Acquired Immunodeficiency Syndrome (AIDS) which is a retro virus that infects cells of the human immune system. In a process of infecting the human body, HIV virus can not be separated from the interaction between proteins HIV and human. To analyze the interaction tissue between proteins, we can use sequence of amino acids from a protein compound. The process of analysis can be done by conventional and computational methods. The advantages of using computational methods that can save time and cost efficiently. Rotation forest is an ensemble method for the classification to be combined with the PseudoSMR feature extraction. To make predictive model, data is needed in the form of protein interaction along with amino acid sequence that can be obtained from NCBI (National Center for Biotechnology Information). Feature extraction of the amio acid sequence will be transformed into a feature vector using PseudoSMR. The result of PsedoSMR by using paramter lg = {2,3,5,6,8,10}, which will be used as training data and test data in rotation forest, so there are 6 datasets. The best result for RF(PCA) occur when lg = 5 and for RF(IPCA) occur when lg = 8. The value of performance evaluation in the range 0.759436 to 0.793178 for RF(IPCA) while for RF(PCA) in the range 0.774837 to 0.812225. The highest evaluation value is obtained when the variable K = p / 3 where p is the length of the column. All calculations and prediction process using software R.
2018
T49440
UI - Tesis Membership  Universitas Indonesia Library