Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Khaola Rachma Adzima
Abstrak :
Penerapan algoritma partisi k-means dalam metode HOPACH clustering dalam penelitian ini dilakukan untuk mengelompokkan barisan DNA virus ebola. Proses dimulai dengan mengumpulkan barisan DNA virus ebola yang diambil dari GenBank, kemudian dilakukan ekstraksi ciri menggunakan n-mers frequency. Hasil ekstraksi ciri barisan DNA tersebut dikumpulkan dalam sebuah matriks dan dilakukan normalisasi menggunakan normalisasi min-max dengan interval [0, 1] yang akan digunakan sebagai data masukan. Hasil pengelompokan barisan DNA virus ebola pada penelitian ini diperoleh 8 kelompok dengan nilai MSS (Mean Split Silhouette) minimum 0,50266. Proses clustering pada penelitian ini menggunakan program open source R.
The implementation of k-means partitioning algorithm in HOPACH clustering method in this thesis is used to clustering DNA sequences of ebola viruses. The clustering process is started with collecting DNA sequences of ebola viruses that are taken from GenBank, then performing the extraction of DNA sequences using n-mers frequency. The extraction results are collected as a matrix and normalized using the min-max normalization with interval [0, 1] which will be used as an input data. As the results, we obtained 8 clusters with minimum MSS (Mean Split Silhouette) 0,50266. The clustering process in this thesis is using the open source program R.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
T44900
UI - Tesis Membership  Universitas Indonesia Library
cover
Ghea Suryawati
Abstrak :
Salah satu cara untuk mengetahui fungsi dari ekpresi gen (DNA/Protein) adalah dengan analisis kelompok (Clustering). Metode pengelompokan HOPACH mengkombinasikan agglomerative dan partisi. Partisi yang dapat digunakan antara lain PAM, SOM, dan K-Means yang termasuk dalam hard clustering. Dalam beberapa kasus karena beberapa hal pengelompokkan objek dengan hard clustering menjadi kurang tepat. Karena itu kemudian muncul teori himpunan fuzzy (kabur, tidak pasti) yang mendasari berkembangnya metode fuzzy clustering. Salah satu metode fuzzy clustering adalah metode Fuzzy c-means (FCM) yang merupakan perkembangan dari k-means. Hasil dari penerapan algoritma partisi fuzzy c-means dalam metode pengelompokan HOPACH adalah algortima pengelompokan dengan langkah-langkah: ekstraksi ciri dengan n-mers frecuency, normalisasi, partisi dengan FCM, menentukan kelompok terbaik dengan mencari nilai MSS minimum, ordering, dan collapsing. Hal ini dilakukan berulang kali sampai kriteria berhenti terpenuhi. Penerapan algoritma ini dilakukan dengan program R. Pada penerapan algoritma partisi dalam metode HOPACH clustering, langkah normalisasi tidak perlu dilakukan, karena FCM sendiri sudah mengatasi masalah adanya outliers. Kekurangan dari penerapan ini adalah running time program yang cukup lama untuk nilai batas toleransi yang kecil.
One of the way to know the function of gene expression by clustering analysis. HOPACH clustering is combine thea agglomerative and partition method. The partition are PAM, SOM, and K-means which is part of hard clustering. In some cases because of the placement object in to a cluster with hard clustering can cause an error. So that is the reason why fuzzy set theory occurs and became the foundation of fuzzy clustering. One of the fuzzy clustering methods is Fuzzy C-means (FCM) which is developed from K-means. The result from the implementation of FCM partitioning algorithm in HOPACH clustering method is the clustering algorithm which the steps are: characteristic extraction, normalization, partition using FCM, choosing the best cluster with the minimum MSS, ordering and collapsing. The process need done by iteration until the stopping criteria has reached. The implementation of this algorithm is use R program. In the implementation of FCM partitioning algorithm in HOPACH clustering method, normalization process can be deleted, because the FCM already sole the outliers problem. This disadvantage of this implementation is the running time program need quite along time for the small tolerance limits.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
T44901
UI - Tesis Membership  Universitas Indonesia Library