Hasil Pencarian

Ditemukan 25307 dokumen yang sesuai dengan query

Aplikasi algoritma clustering untuk klasifikasi lulusan

Artikel Jurnal Universitas Indonesia Library

Yuliana Portti

Aplikasi algoritma metaheuristik basis fuzzy K- modes untuk supplier clustering = Application of metaheuristic based fuzzy K-modes algorithm to supplier clustering

"Penelitian ini mengusulkan tiga algoritma meta-heuristik berbasis Fuzzy K-modes untuk clustering binary data set. Ada tiga metode metaheuristik diterapkan, yaitu Particle Swarm Optimization (PSO), Genetika Algoritma (GA), dan Artificial Bee Colony (ABC). Ketiga algoritma digabungkan dengan algoritma K-modes. Tujuannya adalah untuk memberikan modes awal yang lebih baik untuk K-modes. Jarak antara data ke modes dihitung dengan menggunakan koefisien Jaccard. Koefisien Jaccard diterapkan karena dataset mengandung banyak nilai nol . Dalam rangka untuk melakukan pengelompokan set data real tentang supplier otomotif di Taiwan, algoritma yang diusulkan diverifikasi menggunakan benchmark set data. Hasil penelitian menunjukkan bahwa PSO K-modes dan GA K-modes lebih baik dari ABC K-modes. Selain itu, dari hasil studi kasus, GA K-modes memberikan SSE terkecil dan juga memiliki waktu komputasi lebih cepat dari PSO K-modes dan ABC K-modes.

This study proposed three meta-heuristic based fuzzy K-modes algorithms for clustering binary dataset. There are three meta-heuristic methods applied, namely Particle Swarm Optimization (PSO) algorithm, Genetic Algorithm (GA) algorithm, and Artificial Bee Colony (ABC) algorithm. These three algorithms are combined with k-modes algorithm. Their aim is to give better initial modes for the k-modes. Herein, the similarity between two instances is calculated using jaccard coefficient. The Jaccard coefficient is applied since the dataset contains many zero values. In order to cluster a real data set about automobile suppliers in Taiwan, the proposed algorithms are verified using benchmark data set. The experiments results show that PSO K-modes and GA K-modes is better than ABC K-modes. Moreover, from case study results, GA fuzzy K-modes gives the smallest SSE and also has faster computational time than PSO fuzzy K-modes and ABC fuzzy K-modes."

Depok: Fakultas Teknik Universitas Indonesia, 2015

T44406

UI - Tesis Membership Universitas Indonesia Library

Aplikasi algoritma clustering adptif K-means untuk mengurangi jumlah pencarian pada sistem pengenalan wajah

"Masalah dalam mengimplementasikan metode algoritma k-means adalah menentukan jumlah cluster sebelum melakukan klasifikasi. Untuk mengatasi masalah ini, maka para peneliti mengusulkan suatu variasi dari algoritma k-means, yaitu algoritma adaptif k-means. Dalam penelitian ini, algoritma ini dipakai untuk melakukan pengenalan wajah. Sistem yang dibuat dalam penelitian ini dibagi ke dalam dua bagian utama, yaitu proses pelatihan dan proses pengujian. Dalam proses pelatihan, dibentuk sebuah himpunan eigenface dari himpunan citra latih. Masing-masing citra latih ini diproyeksikan terhadap eigenface untuk memperoleh bobot citra latih. Bobot citra latih akan di-cluster-kan dengan algoritma adaptif k-means. Kontribusi utama penulis dalam penelitian ini adalah dalam proses menemukan jumlah cluster (k) yang tepat pada algoritma adaptif k-means, dimana jumlah cluster akan terus ditambahkan (mulai k = 2) sampai kondisi terdapat ada cluster baru yang tidak memiliki anggota (cluster kosong). Dalam proses pengujian, citra uji akan dicari identitasnya. Pencarian identitas dilakukan dengan mencari jarak euclidean terpendek antara bobot citra uji dengan citra latih dari dalam cluster terdekat. Pengujian dilakukan dengan citra wajah yang terdapat dalam pangkalan data, yang akan disebut citra internal, dan dengan citra wajah bukan bagian dari pangkalan data, yang akan disebut citra eksternal, dimana identitas citra eksternal ini terdapat dalam pangkalan data juga. Dari hasil pengamatan diperoleh bahwa algoritma adaptif k-means dapat mengurangi jumlah proses identifikasi citra uji dengan tetap mempertahankan rate pengenalan dalam batas yang wajar (robust)."

620 JURTEL 16:2 (2011)

Artikel Jurnal Universitas Indonesia Library

Ika Alfina

Sofware agent berbasis algoritma clustering hirarkis untuk personalisasi situs web

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2000

S26949

UI - Skripsi Membership Universitas Indonesia Library

Muhammad Fauzan Akbar Masyhudi

Algoritma markov clustering paralel untuk pengelompokan protein = Parallel algorithm of markov clustering for protein clusterization

"ABSTRAK

Algoritma Markov Clustering adalah algoritma pengelompokan yang banyak digunakan pada bidang bioinformatik. Operasi utama pada algoritma ini adalah operasi ekspansi. Pada operasi ekspansi dilakukan perkalian dua buah matriks. Karena data pada bidang bioinformatik umumnya berukuran sangat besar dan memiliki tingkat sparsity yang sangat tinggi, diperlukan metode untuk menghemat penggunaan memori dan mempercepat proses komputasi. Sementara itu, Graphics Processing Unit (GPU) berkembang menjadi suatu platform komputasi paralel dengan performa yang lebih baik dari pada Central Processing Unit (CPU). Pada skripsi ini data yang diproses disimpan dalam bentuk sparse matriks ELL-R dan perkalian matriks yang dilakukan menggunakan Sparse Matrix Matrix Product (SpMM) ELL-R. SpMM ELL-R dibuat dengan melakukan Sparse Matrix Vector Product (SpMV) ELL-R beberapa kali. Algoritma MCL yang dibuat menggunakan komputasi paralel dengan GPU.

ABSTRACT

Markov Clustering Algorithm is a clustering algorithm that used often in bioinformatics. The main operation of this algorithm is expand operation. The multiplication of two matrix was done in expand operation. Because data processed in bioinformatics usually have a vast amount of information and have high sparsity, a method to save memory usage and make the computating process faster is needed. Meanwhile, Graphics Processing Unit (GPU) developed into a parallel computing platform with better performance compared to Central Processing Unit (CPU). In this skripsi, processed data stored using ELL-R sparse matrix and matrix multiplication done using Sparse Matrix Matrix Product (SpMM) ELL-R. SpMM ELL-R made by doing Sparse Matrix Vector Product (SpMV) ELL-R several times. MCL Algorithm made using parallel computing with GPU."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2012

S43685

UI - Skripsi Open Universitas Indonesia Library

Novieka Distiasari

Aplikasi algoritma metaheuristik berbasis K-modes pada pengelompokan supplier = Application of metaheuristic based K-modes algorithms to supplier clustering

"ABSTRAK

Pengelompokan supplier penting untuk memberikan informasi kepada pembeli. Penelitian ini mengusulkan meta-heuristik berbasis algoritma K-modes untuk mengelompokkan dataset dalam bentuk biner. Ada dua metode metaheuristik yang digunakan dalam penelitian ini, yaitu particle swarm optimization (PSO) dan genetic algorithm (GA). Meta-heuristik yang diterapkan untuk memberikan modes awal yang lebih baik untuk algoritma K-modes. Penelitian ini menggunakan pengukuran Jaccard dalam hal pengukuran similarity dan menggunakan tiga dataset untuk memvalidasi algoritma yang diusulkan. Hasil percobaan dan hasil statistik menunjukkan bahwa PSO berbasis algoritma K-modes lebih baik dari GA berbasis algoritma K-modes. Dalam hasil evaluasi menggunakan data dari sebuah perusahaan automobile di Taiwan, PSO berdasarkan PSO berbasis algoritma K-modes memiliki SSE kecil dari pada GA berbasis algoritma K-modes.

ABSTRACT

Supplier clustering is important for providing more important information for the buyer. This study proposes meta-heuristics based K-modes algorithm for clustering binary dataset. There are two metaheuristic methods applied in this study, namely particle swarm optimization (PSO) and genetic algorithm (GA). The meta-heuristics are applied to give better initial modes for the K-modes algorithm. In terms of similarity measurement, this study uses Jaccard measurement since the real data set consists of higher number of value zero than one. In order to validate the proposed algorithms, three benchmark datasets are employed. The experiments results and statistical results show that PSO based K-modes algorithm is better than GA based K- modes algorithm. The data set from a exisibition company in Taiwan. In model evaluation results, PSO based K- modes algorithm has the SSE lowest than GA based K- modes algorithm."

Depok: Fakultas Teknik Universitas Indonesia, 2015

T44694

UI - Tesis Membership Universitas Indonesia Library

Sri Hartini

Perbandingan Implementasi Algoritma KC-Means Clustering dan Kernel KC-Means Clustering untuk Memprediksi Penyakit Talasemia = The Comparison Between the Implementation of KC-Means Clustering and Kernel KC-Means Clustering Algorithm in Predicting Thalassemia Disease

"Talasemia merupakan penyakit genetik dimana terjadi kelainan pada sel darah merah akibat kesalahan produksi hemoglobin. Perkawinan antara sesama pembawa gen talasemia dapat menyebabkan munculnya keturunan yang menderita talasemia mayor. Talasemia mayor merupakan jenis talasemia yang dapat menyebabkan kematian. Oleh karena itu, pendeteksian dini terhadap penyakit talasemia merupakan hal yang penting. Salah satu cara untuk melakukan pendeteksian talasemia adalah dengan menggunakan machine learning. Pada skripsi ini, algoritma KC-Means (KCM) clustering digunakan untuk memprediksi talasemia. Kemudian performa algoritma tersebut dibandingkan dengan algoritma Kernel KC-Means (KKCM) clustering, dimana fungsi kernel yang digunakan adalah kernel Gaussian Radial Basis Function (RBF) dan polinomial. Pengujian kedua algoritma tersebut dilakukan dengan menggunakan hold-out evaluation dan 5-fold cross validation. Data yang digunakan adalah data talasemia yang berasal dari Rumah Sakit Harapan Kita, Jakarta, Indonesia. Data talasemia tersebut terdiri dari 150 sampel dengan komposisi 82 sampel talasemia dan 68 sampel non-talasemia, yang tiap sampelnya memiliki 11 fitur. Berdasarkan percobaan yang dilakukan, algoritma KCM dan KKCM menghasilkan prediksi dengan akurasi, sensitivitas, presisi, spesifisitas, dan F1-Score yang sama, yaitu di atas 96 persen. Namun, waktu komputasi yang dibutuhkan oleh KKCM dapat mencapai hingga 10.25 kali lebih cepat dari waktu komputasi KCM

.
Thalassemia is a genetic disease in which there are abnormalities in red blood cells due to an error in the production of hemoglobin. Marriage between thalassemia carriers can cause the birth of a child suffering from thalassemia major. Thalassemia major is a type of thalassemia that can cause death. Therefore, early detection of thalassemia is essential. One of the techniques to detect thalassemia is to use machine learning. In this thesis, the KC-Means (KCM) clustering algorithm is used to predict thalassemia. Then the performance of the algorithm is compared with the KC-Means Kernel (KKCM) clustering algorithm, where the kernel functions used are the Gaussian Radial Base Function (RBF) and polynomial kernel. Evaluation of those algorithms is carried out using hold-out evaluation and 5-fold cross-validation. The data used is thalassemia data from Harapan Kita Hospital, Jakarta, Indonesia. The data consists of 150 samples with a composition of 82 thalassemia samples and 68 non-thalassemia samples; each has 11 features. Based on the experiments, the KCM and KKCM algorithms make predictions with the same accuracy, sensitivity, precision, specificity, and F1-Score, which is above 96 percent. However, the computing time needed by KKCM can reach up to 10.25 times faster than the KCM computing time."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Ida Mujtahidah

Penerapan komputasi paralel pada algoritma firefly-markov clustering untuk menganalisis jaringan interaksi protein = Application of parallel computing on firefly markov clustering algorithm for analyzing protein interaction network

"ABSTRAK

Protein memiliki peranan penting dalam mengontrol fungsi enzim, mengatur produksi dan aktivitas di dalam sel. Untuk melakukan hal ini, protein berinteraksi dengan protein-protein lainnya, DNA dan molekul-molekul lainnya. Jaringan interaksi protein-protein ini memiliki ukuran yang sangat besar. Sehingga untuk memudahkan dalam menganalisis jaringan ini diperlukan metode clustering. Pada penelitian ini, algoritma Markov clustering digabungkan dengan algoritma firefly yang disebut sebagai algoritma firefly-Markov clustering FMCL . Pada algoritma FMCL, posisi kunang-kunang akan menggantikan nilai parameter inflate. Kemudian proses clustering akan berlangsung menggunakan algoritma Markov clustering MCL . Selanjutnya posisi kunang-kunang akan terus diperbarui dan proses clustering akan terus dilakukan sampai diperoleh hasil clustering terbaik. Komputasi paralel pada algoritma FMCL menggunakan OpenMP. Setiap thread menjalankan proses pada Markov clustering menggunakan parameter inflate yang ditentukan oleh posisi kunang-kunangnya. Hasil yang diperoleh pada data jaringan interaksi protein HIV ada 4 cluster. Dari 4 cluster ini terdapat satu cluster besar yang saling terhubung dengan 6 pusat cluster lainnya yaitu NEF, GAG, GAG-POL, VPR, VIF dan VPU. Pada 3 cluster lainnya yang menjadi pusat cluster adalah TAT, REV dan ENV. Sedangkan dengan menggunakan data jaringan interaksi protein pada Human Herpesvirus tipe 4 HHV-4 diperoleh 14 cluster. Protein yang menjadi pusat cluster adalah EBNA-LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2-BBLF3, EBNA3B, BRLF1, BGLF4, BYRF1. Selain itu, juga dapat dilihat bahwa ada beberapa cluster yang hanya merupakan interaksi antara dua protein yaitu BBRF1 dengan NFKB2, EBNA3A dengan CHEK2, LMP2A dengan ITCH, dan EBNA3C dengan EP300. Speed up algoritma FMCL yang dijalankan menggunakan OpenMP pada data HIV dan HHV-4 adalah 4.73x dan 3.21x lebih cepat dibandingkan dengan algoritma FMCL yang dijalankan secara sekuensial.

ABSTRACT

Protein plays an important role in controlling enzyme function, regulating production and activity in cell. To do this function, proteins will interact with other protein, DNA and other molecules. Protein interaction network have a very large size. Then to simplify analyzing this network is required clustering method. In this study, Markov clustering algorithm combined with a firefly algorithm called firefly Markov clustering algorithm FMCL . In FMCL algorithm, firefly position will be replace the value of inflate parameter. Then clustering process will take place using Markov clustering algorithm MCL . Futhermore, the firefly position will be updated and clustering process will be continue until its get the best clustering. Parallel computing on FMCL algorithm using OpenMP. Each thread will run the process on Markov clustering by using inflate parameter specified by the position of firefly. The clustering result from protein interaction network on HIV is 4 clusters. From this cluster, there is a large cluster connected with 6 other cluster centers, they are NEF, GAG, GAG POL, VPR, VIF and VPU. In the 3 other clusters that become the center of the cluster are TAT, REV and ENV. While by using protein interaction network on HHV 4 obtained 14 clusters. The proteins that become the center of the clusters are EBNA LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2 BBLF3, EBNA3B, BRLF1, BGLF4 and BYRF1. In addition, it can be seen that there are several clusters that are just interaction between two proteins, BBRF1 with NFKB2, EBNA3A with CHECK2, LMP2A with ITCH and EBNA3C with EP300. The speed up of FMCL algorithm by using OpenMP HIV and HHV 4 data is 4.73x and 3.21x faster than the sequentially executed."

2018

T49526

UI - Tesis Membership Universitas Indonesia Library

M. Syamsuddin Wisnubroto

Penerapan komputasi paralel pada algoritma firefly soft regularized markov clustering untuk menganalisis jaringan interaksi protein = Application of parallel computing on firefly soft regularized markov clustering algorithms for analyzing protein interaction network

"ABSTRAK

Protein memiliki peranan yang sangat penting dalam kehidupan. Setiap protein

berinteraksi dengan protein-protein lain, DNA, dan molekul-molekul lainnya, sehingga

terbentuklah jaringan interaksi protein yang berukuran sangat besar. Untuk memudahkan

dalam menganalisisnya, diperlukan metode clustering. Algoritma Soft Regularized

Markov Clustering (SR-MCL) merupakan pengembangan metode clustering yang

mengurangi kelemahan dari Regularized Markov Clustering dan Markov Clustering.

Namun, SR-MCL masih memiliki kelemahan yaitu parameter inflasi yang selalu

dimasukkan secara manual oleh peneliti. Penelitian ini, SR-MCL digabung dengan

Algoritma Firefly yang selanjutnya disebut Firefly Soft Regularized Markov Clustering,

dimana posisi setiap firefly menggantikan parameter inflasi. Posisi firefly akan terus

diperbaharui dan proses clustering akan terus dilakukan sampai memperoleh global chaos

kurang dari threshold. FSR-MCL akan diterapkan secara paralel menggunakan OpenMP,

yaitu setiap thread menjalankan SR-MCL dengan posisi setiap firefly yang berbeda.

Proses clustering data HIV-1 diperoleh sembilan protein sebagai pusat cluster yang

sangat berpengaruh dalam pembentukan dan penyebaran virus, yaitu TAT, REV, ENV,

GAG, POL, VPU, VPR, NEF, dan VIF, serta didapat parameter inflasi terbaiknya 8,0

dengan speed up 4,66 kali. Proses clustering data SC5314 diperoleh enam protein sebagai

pusat cluster yang merupakan protein penting dalam penyebarannya, yaitu HSP90,

CBK1, MED8, NOP1, CEK1, dan CDC4, serta didapat parameter inflasi terbaiknya 5,5

dengan speed up 3,01 kali.

ABSTRACT

Protein has a very important role in life. Each protein interacts with other proteins, DNA,

and other molecules, resulting in a very large protein-protein interaction. To make it easier

to analyze it, clustering method is needed. Soft Regularized Markov Clustering (SRMCL)

algorithm is a development of clustering method that reduces the weakness of

Regularized Markov Clustering and Markov Clustering. However, SR-MCL still has a

weakness that is the parameter of inflation that is always entered manually by researchers.

This study, SR-MCL combined with Firefly Algorithm, hereinafter called Firefly Soft

Regularized Markov Clustering, where the position of each firefly replace the parameters

of inflation. The firefly position will continue to be updated and the clustering process

will continue until the global chaos is less than the threshold. FSR-MCL will be applied

in parallel using OpenMP, ie each thread runs SR-MCL with the position of each different

firefly. The process of clustering the HIV-1 data obtained by nine proteins as the center

of the cluster is very influential in the formation and spread of the virus, namely TAT,

REV, ENV, GAG, POL, VPU, VPR, NEF, and VIF, and got the best inflation parameter

8.0 with speed up 4.66 times. SC5314 data clustering process obtained six proteins as the

center of the cluster which is an important protein in its spreading, namely HSP90, CBK1,

MED8, NOP1, CEK1, and CDC4, and got the best inflation parameter 5.5 with speed up

3.01 times."

2018

T49442

UI - Tesis Membership Universitas Indonesia Library

Vira Yustia Nurazmi

Penerapan komputasi paralel pada algoritma firefly regularized markov clustering untuk menganalisis jaringan interaksi protein = Application of parallel computing on firefly regularized markov clustering algorithm for analyzing protein interaction networks

"ABSTRAK

Algoritma Regularized Markov Clustering RMCL adalah suatu metode graf clustering yang merupakan pengembangan dari Markov Clustering MCL . Algoritma RMCL masih memiliki kelemahan pada parameter penggelembungan yang biasanya selalu diinputkan oleh pengguna untuk mendapatkan hasil clustering yang baik. Pada penelitian ini, RMCL digabungkan dengan algoritma Firefly untuk menganalisis jaringan interaksi protein yang disebut algoritma Firefly Regularized Markov Clustering FRMCL . Algoritma Firefly merupakan algoritma yang terinspirasi dari perilaku kunang-kunang dalam mencari koloninya. Implementasi algoritma FRMCL dilakukan pada data jaringan interaksi protein HIV-1 dan Human Herpesvirus 1. Data yang digunakan direpresentasikan ke dalam sebuah graf tak-berarah . Selanjutnya, posisi kunang-kunang pada algoritma firefly akan berperan sebagai parameter penggelembungan. Setiap firefly akan melakukan proses RMCL, sehingga diperoleh beberapa hasil RMCL dengan parameter berbeda. Setiap proses RMCL memberikan nilai global chaos, yang dipilih adalah global chaos minimum yang akan dijadikan best firefly, kemudian akan dilakukan proses perhitungan kembali. Posisi firefly baru ini selanjutnya bertindak sebagai parameter penggelembungan yang baru dan dilakukan proses FRMCL berlanjut hingga diperoleh cluster terbaik. Komputasi paralel akan digunakan saat setiap firefly menjalankan proses FRMCL dengan bahasa pemrograman OpenMP. Berdasarkan hasil simulasi yang dilakukan, diperoleh 14 cluster untuk data Human Herpesvirus 1 dan 4 cluster untuk data HIV-1. Sedangkan proses paralel yang dilakukan pada kedua data PPI tersebut diperoleh running time dan speed up yang menunjukkan komputasi paralel menggunakan 8 thread diperoleh 3,66x dan 4,51x lebih cepat dibandingkan dengan komputasi sekuensial.

ABSTRACT

Regularized Markov Clustering RMCL algorithm is a clustering graph method which is the development of Markov Clustering MCL . The RMCL algorithm still has weaknesses on inflate parameters that are usually always input by the user to get best clustering results. In this research, RMCL combined with the Firefly algorithm to analyze a protein interaction network called the Firefly Regularized Markov Clustering FRMCL algorithm. The Firefly algorithm is an algorithm that is inspired by the behavior of fireflies looking for their colonies. Implementation of the FRMCL algorithm was carried out on the data network of HIV 1 protein interactions and Human Herpesvirus 1. The data used to be represented in an undirected graph G. Then, firefly position on the firefly algorithm will act as an inflate parameter. Every firefly will perform the RMCL process, and then obtained some RMCL results with different parameters. Each RMCL process give generated from global chaos, which will be selected minimum global chaos which will be the best firefly, it will be processed back again. This new firefly position will act as a new inflate parameter and perform the FRMCL process until to produce the best clusters. Parallel computations will be used when each firefly runs the FRMCL process with the programming language using OpenMP. Based on the results of the simulation, 14 clusters are obtained for Human Herpesvirus 1 and 4 cluster data for HIV 1 data. The parallel processing performed on both PPI data is due to running time and speed shows 3,66x and 4,51x parallel computing using 8 thread which faster than sequential computing."

2018

T49488

UI - Tesis Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian