Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 25307 dokumen yang sesuai dengan query
cover
cover
Yuliana Portti
"Penelitian ini mengusulkan tiga algoritma meta-heuristik berbasis Fuzzy K-modes untuk clustering binary data set. Ada tiga metode metaheuristik diterapkan, yaitu Particle Swarm Optimization (PSO), Genetika Algoritma (GA), dan Artificial Bee Colony (ABC). Ketiga algoritma digabungkan dengan algoritma K-modes. Tujuannya adalah untuk memberikan modes awal yang lebih baik untuk K-modes. Jarak antara data ke modes dihitung dengan menggunakan koefisien Jaccard. Koefisien Jaccard diterapkan karena dataset mengandung banyak nilai nol . Dalam rangka untuk melakukan pengelompokan set data real tentang supplier otomotif di Taiwan, algoritma yang diusulkan diverifikasi menggunakan benchmark set data. Hasil penelitian menunjukkan bahwa PSO K-modes dan GA K-modes lebih baik dari ABC K-modes. Selain itu, dari hasil studi kasus, GA K-modes memberikan SSE terkecil dan juga memiliki waktu komputasi lebih cepat dari PSO K-modes dan ABC K-modes.

This study proposed three meta-heuristic based fuzzy K-modes algorithms for clustering binary dataset. There are three meta-heuristic methods applied, namely Particle Swarm Optimization (PSO) algorithm, Genetic Algorithm (GA) algorithm, and Artificial Bee Colony (ABC) algorithm. These three algorithms are combined with k-modes algorithm. Their aim is to give better initial modes for the k-modes. Herein, the similarity between two instances is calculated using jaccard coefficient. The Jaccard coefficient is applied since the dataset contains many zero values. In order to cluster a real data set about automobile suppliers in Taiwan, the proposed algorithms are verified using benchmark data set. The experiments results show that PSO K-modes and GA K-modes is better than ABC K-modes. Moreover, from case study results, GA fuzzy K-modes gives the smallest SSE and also has faster computational time than PSO fuzzy K-modes and ABC fuzzy K-modes.
"
Depok: Fakultas Teknik Universitas Indonesia, 2015
T44406
UI - Tesis Membership  Universitas Indonesia Library
cover
"Masalah dalam mengimplementasikan metode algoritma k-means adalah menentukan jumlah cluster sebelum melakukan klasifikasi. Untuk mengatasi masalah ini, maka para peneliti mengusulkan suatu variasi dari algoritma k-means, yaitu algoritma adaptif k-means. Dalam penelitian ini, algoritma ini dipakai untuk melakukan pengenalan wajah. Sistem yang dibuat dalam penelitian ini dibagi ke dalam dua bagian utama, yaitu proses pelatihan dan proses pengujian. Dalam proses pelatihan, dibentuk sebuah himpunan eigenface dari himpunan citra latih. Masing-masing citra latih ini diproyeksikan terhadap eigenface untuk memperoleh bobot citra latih. Bobot citra latih akan di-cluster-kan dengan algoritma adaptif k-means. Kontribusi utama penulis dalam penelitian ini adalah dalam proses menemukan jumlah cluster (k) yang tepat pada algoritma adaptif k-means, dimana jumlah cluster akan terus ditambahkan (mulai k = 2) sampai kondisi terdapat ada cluster baru yang tidak memiliki anggota (cluster kosong). Dalam proses pengujian, citra uji akan dicari identitasnya. Pencarian identitas dilakukan dengan mencari jarak euclidean terpendek antara bobot citra uji dengan citra latih dari dalam cluster terdekat. Pengujian dilakukan dengan citra wajah yang terdapat dalam pangkalan data, yang akan disebut citra internal, dan dengan citra wajah bukan bagian dari pangkalan data, yang akan disebut citra eksternal, dimana identitas citra eksternal ini terdapat dalam pangkalan data juga. Dari hasil pengamatan diperoleh bahwa algoritma adaptif k-means dapat mengurangi jumlah proses identifikasi citra uji dengan tetap mempertahankan rate pengenalan dalam batas yang wajar (robust)."
620 JURTEL 16:2 (2011)
Artikel Jurnal  Universitas Indonesia Library
cover
Ika Alfina
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2000
S26949
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Fauzan Akbar Masyhudi
"ABSTRAK
Algoritma Markov Clustering adalah algoritma pengelompokan yang banyak digunakan pada bidang bioinformatik. Operasi utama pada algoritma ini adalah operasi ekspansi. Pada operasi ekspansi dilakukan perkalian dua buah matriks. Karena data pada bidang bioinformatik umumnya berukuran sangat besar dan memiliki tingkat sparsity yang sangat tinggi, diperlukan metode untuk menghemat penggunaan memori dan mempercepat proses komputasi. Sementara itu, Graphics Processing Unit (GPU) berkembang menjadi suatu platform komputasi paralel dengan performa yang lebih baik dari pada Central Processing Unit (CPU). Pada skripsi ini data yang diproses disimpan dalam bentuk sparse matriks ELL-R dan perkalian matriks yang dilakukan menggunakan Sparse Matrix Matrix Product (SpMM) ELL-R. SpMM ELL-R dibuat dengan melakukan Sparse Matrix Vector Product (SpMV) ELL-R beberapa kali. Algoritma MCL yang dibuat menggunakan komputasi paralel dengan GPU.

ABSTRACT
Markov Clustering Algorithm is a clustering algorithm that used often in bioinformatics. The main operation of this algorithm is expand operation. The multiplication of two matrix was done in expand operation. Because data processed in bioinformatics usually have a vast amount of information and have high sparsity, a method to save memory usage and make the computating process faster is needed. Meanwhile, Graphics Processing Unit (GPU) developed into a parallel computing platform with better performance compared to Central Processing Unit (CPU). In this skripsi, processed data stored using ELL-R sparse matrix and matrix multiplication done using Sparse Matrix Matrix Product (SpMM) ELL-R. SpMM ELL-R made by doing Sparse Matrix Vector Product (SpMV) ELL-R several times. MCL Algorithm made using parallel computing with GPU."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2012
S43685
UI - Skripsi Open  Universitas Indonesia Library
cover
Novieka Distiasari
"ABSTRAK
Pengelompokan supplier penting untuk memberikan informasi kepada pembeli. Penelitian ini mengusulkan meta-heuristik berbasis algoritma K-modes untuk mengelompokkan dataset dalam bentuk biner. Ada dua metode metaheuristik yang digunakan dalam penelitian ini, yaitu particle swarm optimization (PSO) dan genetic algorithm (GA). Meta-heuristik yang diterapkan untuk memberikan modes awal yang lebih baik untuk algoritma K-modes. Penelitian ini menggunakan pengukuran Jaccard dalam hal pengukuran similarity dan menggunakan tiga dataset untuk memvalidasi algoritma yang diusulkan. Hasil percobaan dan hasil statistik menunjukkan bahwa PSO berbasis algoritma K-modes lebih baik dari GA berbasis algoritma K-modes. Dalam hasil evaluasi menggunakan data dari sebuah perusahaan automobile di Taiwan, PSO berdasarkan PSO berbasis algoritma K-modes memiliki SSE kecil dari pada GA berbasis algoritma K-modes.

ABSTRACT
Supplier clustering is important for providing more important information for the buyer. This study proposes meta-heuristics based K-modes algorithm for clustering binary dataset. There are two metaheuristic methods applied in this study, namely particle swarm optimization (PSO) and genetic algorithm (GA). The meta-heuristics are applied to give better initial modes for the K-modes algorithm. In terms of similarity measurement, this study uses Jaccard measurement since the real data set consists of higher number of value zero than one. In order to validate the proposed algorithms, three benchmark datasets are employed. The experiments results and statistical results show that PSO based K-modes algorithm is better than GA based K- modes algorithm. The data set from a exisibition company in Taiwan. In model evaluation results, PSO based K- modes algorithm has the SSE lowest than GA based K- modes algorithm."
Depok: Fakultas Teknik Universitas Indonesia, 2015
T44694
UI - Tesis Membership  Universitas Indonesia Library
cover
Sri Hartini
"Talasemia merupakan penyakit genetik dimana terjadi kelainan pada sel darah merah akibat kesalahan produksi hemoglobin. Perkawinan antara sesama pembawa gen talasemia dapat menyebabkan munculnya keturunan yang menderita talasemia mayor. Talasemia mayor merupakan jenis talasemia yang dapat menyebabkan kematian. Oleh karena itu, pendeteksian dini terhadap penyakit talasemia merupakan hal yang penting. Salah satu cara untuk melakukan pendeteksian talasemia adalah dengan menggunakan machine learning. Pada skripsi ini, algoritma KC-Means (KCM) clustering digunakan untuk memprediksi talasemia. Kemudian performa algoritma tersebut dibandingkan dengan algoritma Kernel KC-Means (KKCM) clustering, dimana fungsi kernel yang digunakan adalah kernel Gaussian Radial Basis Function (RBF) dan polinomial. Pengujian kedua algoritma tersebut dilakukan dengan menggunakan hold-out evaluation dan 5-fold cross validation. Data yang digunakan adalah data talasemia yang berasal dari Rumah Sakit Harapan Kita, Jakarta, Indonesia. Data talasemia tersebut terdiri dari 150 sampel dengan komposisi 82 sampel talasemia dan 68 sampel non-talasemia, yang tiap sampelnya memiliki 11 fitur. Berdasarkan percobaan yang dilakukan, algoritma KCM dan KKCM menghasilkan prediksi dengan akurasi, sensitivitas, presisi, spesifisitas, dan F1-Score yang sama, yaitu di atas 96 persen. Namun, waktu komputasi yang dibutuhkan oleh KKCM dapat mencapai hingga 10.25 kali lebih cepat dari waktu komputasi KCM
.
Thalassemia is a genetic disease in which there are abnormalities in red blood cells due to an error in the production of hemoglobin. Marriage between thalassemia carriers can cause the birth of a child suffering from thalassemia major. Thalassemia major is a type of thalassemia that can cause death. Therefore, early detection of thalassemia is essential. One of the techniques to detect thalassemia is to use machine learning. In this thesis, the KC-Means (KCM) clustering algorithm is used to predict thalassemia. Then the performance of the algorithm is compared with the KC-Means Kernel (KKCM) clustering algorithm, where the kernel functions used are the Gaussian Radial Base Function (RBF) and polynomial kernel. Evaluation of those algorithms is carried out using hold-out evaluation and 5-fold cross-validation. The data used is thalassemia data from Harapan Kita Hospital, Jakarta, Indonesia. The data consists of 150 samples with a composition of 82 thalassemia samples and 68 non-thalassemia samples; each has 11 features. Based on the experiments, the KCM and KKCM algorithms make predictions with the same accuracy, sensitivity, precision, specificity, and F1-Score, which is above 96 percent. However, the computing time needed by KKCM can reach up to 10.25 times faster than the KCM computing time.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ida Mujtahidah
"ABSTRAK
Protein memiliki peranan penting dalam mengontrol fungsi enzim, mengatur produksi dan aktivitas di dalam sel. Untuk melakukan hal ini, protein berinteraksi dengan protein-protein lainnya, DNA dan molekul-molekul lainnya. Jaringan interaksi protein-protein ini memiliki ukuran yang sangat besar. Sehingga untuk memudahkan dalam menganalisis jaringan ini diperlukan metode clustering. Pada penelitian ini, algoritma Markov clustering digabungkan dengan algoritma firefly yang disebut sebagai algoritma firefly-Markov clustering FMCL . Pada algoritma FMCL, posisi kunang-kunang akan menggantikan nilai parameter inflate. Kemudian proses clustering akan berlangsung menggunakan algoritma Markov clustering MCL . Selanjutnya posisi kunang-kunang akan terus diperbarui dan proses clustering akan terus dilakukan sampai diperoleh hasil clustering terbaik. Komputasi paralel pada algoritma FMCL menggunakan OpenMP. Setiap thread menjalankan proses pada Markov clustering menggunakan parameter inflate yang ditentukan oleh posisi kunang-kunangnya. Hasil yang diperoleh pada data jaringan interaksi protein HIV ada 4 cluster. Dari 4 cluster ini terdapat satu cluster besar yang saling terhubung dengan 6 pusat cluster lainnya yaitu NEF, GAG, GAG-POL, VPR, VIF dan VPU. Pada 3 cluster lainnya yang menjadi pusat cluster adalah TAT, REV dan ENV. Sedangkan dengan menggunakan data jaringan interaksi protein pada Human Herpesvirus tipe 4 HHV-4 diperoleh 14 cluster. Protein yang menjadi pusat cluster adalah EBNA-LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2-BBLF3, EBNA3B, BRLF1, BGLF4, BYRF1. Selain itu, juga dapat dilihat bahwa ada beberapa cluster yang hanya merupakan interaksi antara dua protein yaitu BBRF1 dengan NFKB2, EBNA3A dengan CHEK2, LMP2A dengan ITCH, dan EBNA3C dengan EP300. Speed up algoritma FMCL yang dijalankan menggunakan OpenMP pada data HIV dan HHV-4 adalah 4.73x dan 3.21x lebih cepat dibandingkan dengan algoritma FMCL yang dijalankan secara sekuensial.

ABSTRACT
Protein plays an important role in controlling enzyme function, regulating production and activity in cell. To do this function, proteins will interact with other protein, DNA and other molecules. Protein interaction network have a very large size. Then to simplify analyzing this network is required clustering method. In this study, Markov clustering algorithm combined with a firefly algorithm called firefly Markov clustering algorithm FMCL . In FMCL algorithm, firefly position will be replace the value of inflate parameter. Then clustering process will take place using Markov clustering algorithm MCL . Futhermore, the firefly position will be updated and clustering process will be continue until its get the best clustering. Parallel computing on FMCL algorithm using OpenMP. Each thread will run the process on Markov clustering by using inflate parameter specified by the position of firefly. The clustering result from protein interaction network on HIV is 4 clusters. From this cluster, there is a large cluster connected with 6 other cluster centers, they are NEF, GAG, GAG POL, VPR, VIF and VPU. In the 3 other clusters that become the center of the cluster are TAT, REV and ENV. While by using protein interaction network on HHV 4 obtained 14 clusters. The proteins that become the center of the clusters are EBNA LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2 BBLF3, EBNA3B, BRLF1, BGLF4 and BYRF1. In addition, it can be seen that there are several clusters that are just interaction between two proteins, BBRF1 with NFKB2, EBNA3A with CHECK2, LMP2A with ITCH and EBNA3C with EP300. The speed up of FMCL algorithm by using OpenMP HIV and HHV 4 data is 4.73x and 3.21x faster than the sequentially executed."
2018
T49526
UI - Tesis Membership  Universitas Indonesia Library
cover
M. Syamsuddin Wisnubroto
"ABSTRAK
Protein memiliki peranan yang sangat penting dalam kehidupan. Setiap protein
berinteraksi dengan protein-protein lain, DNA, dan molekul-molekul lainnya, sehingga
terbentuklah jaringan interaksi protein yang berukuran sangat besar. Untuk memudahkan
dalam menganalisisnya, diperlukan metode clustering. Algoritma Soft Regularized
Markov Clustering (SR-MCL) merupakan pengembangan metode clustering yang
mengurangi kelemahan dari Regularized Markov Clustering dan Markov Clustering.
Namun, SR-MCL masih memiliki kelemahan yaitu parameter inflasi yang selalu
dimasukkan secara manual oleh peneliti. Penelitian ini, SR-MCL digabung dengan
Algoritma Firefly yang selanjutnya disebut Firefly Soft Regularized Markov Clustering,
dimana posisi setiap firefly menggantikan parameter inflasi. Posisi firefly akan terus
diperbaharui dan proses clustering akan terus dilakukan sampai memperoleh global chaos
kurang dari threshold. FSR-MCL akan diterapkan secara paralel menggunakan OpenMP,
yaitu setiap thread menjalankan SR-MCL dengan posisi setiap firefly yang berbeda.
Proses clustering data HIV-1 diperoleh sembilan protein sebagai pusat cluster yang
sangat berpengaruh dalam pembentukan dan penyebaran virus, yaitu TAT, REV, ENV,
GAG, POL, VPU, VPR, NEF, dan VIF, serta didapat parameter inflasi terbaiknya 8,0
dengan speed up 4,66 kali. Proses clustering data SC5314 diperoleh enam protein sebagai
pusat cluster yang merupakan protein penting dalam penyebarannya, yaitu HSP90,
CBK1, MED8, NOP1, CEK1, dan CDC4, serta didapat parameter inflasi terbaiknya 5,5
dengan speed up 3,01 kali.

ABSTRACT
Protein has a very important role in life. Each protein interacts with other proteins, DNA,
and other molecules, resulting in a very large protein-protein interaction. To make it easier
to analyze it, clustering method is needed. Soft Regularized Markov Clustering (SRMCL)
algorithm is a development of clustering method that reduces the weakness of
Regularized Markov Clustering and Markov Clustering. However, SR-MCL still has a
weakness that is the parameter of inflation that is always entered manually by researchers.
This study, SR-MCL combined with Firefly Algorithm, hereinafter called Firefly Soft
Regularized Markov Clustering, where the position of each firefly replace the parameters
of inflation. The firefly position will continue to be updated and the clustering process
will continue until the global chaos is less than the threshold. FSR-MCL will be applied
in parallel using OpenMP, ie each thread runs SR-MCL with the position of each different
firefly. The process of clustering the HIV-1 data obtained by nine proteins as the center
of the cluster is very influential in the formation and spread of the virus, namely TAT,
REV, ENV, GAG, POL, VPU, VPR, NEF, and VIF, and got the best inflation parameter
8.0 with speed up 4.66 times. SC5314 data clustering process obtained six proteins as the
center of the cluster which is an important protein in its spreading, namely HSP90, CBK1,
MED8, NOP1, CEK1, and CDC4, and got the best inflation parameter 5.5 with speed up
3.01 times."
2018
T49442
UI - Tesis Membership  Universitas Indonesia Library
cover
Vira Yustia Nurazmi
"ABSTRAK
Algoritma Regularized Markov Clustering RMCL adalah suatu metode graf clustering yang merupakan pengembangan dari Markov Clustering MCL . Algoritma RMCL masih memiliki kelemahan pada parameter penggelembungan yang biasanya selalu diinputkan oleh pengguna untuk mendapatkan hasil clustering yang baik. Pada penelitian ini, RMCL digabungkan dengan algoritma Firefly untuk menganalisis jaringan interaksi protein yang disebut algoritma Firefly Regularized Markov Clustering FRMCL . Algoritma Firefly merupakan algoritma yang terinspirasi dari perilaku kunang-kunang dalam mencari koloninya. Implementasi algoritma FRMCL dilakukan pada data jaringan interaksi protein HIV-1 dan Human Herpesvirus 1. Data yang digunakan direpresentasikan ke dalam sebuah graf tak-berarah . Selanjutnya, posisi kunang-kunang pada algoritma firefly akan berperan sebagai parameter penggelembungan. Setiap firefly akan melakukan proses RMCL, sehingga diperoleh beberapa hasil RMCL dengan parameter berbeda. Setiap proses RMCL memberikan nilai global chaos, yang dipilih adalah global chaos minimum yang akan dijadikan best firefly, kemudian akan dilakukan proses perhitungan kembali. Posisi firefly baru ini selanjutnya bertindak sebagai parameter penggelembungan yang baru dan dilakukan proses FRMCL berlanjut hingga diperoleh cluster terbaik. Komputasi paralel akan digunakan saat setiap firefly menjalankan proses FRMCL dengan bahasa pemrograman OpenMP. Berdasarkan hasil simulasi yang dilakukan, diperoleh 14 cluster untuk data Human Herpesvirus 1 dan 4 cluster untuk data HIV-1. Sedangkan proses paralel yang dilakukan pada kedua data PPI tersebut diperoleh running time dan speed up yang menunjukkan komputasi paralel menggunakan 8 thread diperoleh 3,66x dan 4,51x lebih cepat dibandingkan dengan komputasi sekuensial.

ABSTRACT
Regularized Markov Clustering RMCL algorithm is a clustering graph method which is the development of Markov Clustering MCL . The RMCL algorithm still has weaknesses on inflate parameters that are usually always input by the user to get best clustering results. In this research, RMCL combined with the Firefly algorithm to analyze a protein interaction network called the Firefly Regularized Markov Clustering FRMCL algorithm. The Firefly algorithm is an algorithm that is inspired by the behavior of fireflies looking for their colonies. Implementation of the FRMCL algorithm was carried out on the data network of HIV 1 protein interactions and Human Herpesvirus 1. The data used to be represented in an undirected graph G. Then, firefly position on the firefly algorithm will act as an inflate parameter. Every firefly will perform the RMCL process, and then obtained some RMCL results with different parameters. Each RMCL process give generated from global chaos, which will be selected minimum global chaos which will be the best firefly, it will be processed back again. This new firefly position will act as a new inflate parameter and perform the FRMCL process until to produce the best clusters. Parallel computations will be used when each firefly runs the FRMCL process with the programming language using OpenMP. Based on the results of the simulation, 14 clusters are obtained for Human Herpesvirus 1 and 4 cluster data for HIV 1 data. The parallel processing performed on both PPI data is due to running time and speed shows 3,66x and 4,51x parallel computing using 8 thread which faster than sequential computing."
2018
T49488
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>