Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query
cover
Novieka Distiasari
Abstrak :
ABSTRAK
Pengelompokan supplier penting untuk memberikan informasi kepada pembeli. Penelitian ini mengusulkan meta-heuristik berbasis algoritma K-modes untuk mengelompokkan dataset dalam bentuk biner. Ada dua metode metaheuristik yang digunakan dalam penelitian ini, yaitu particle swarm optimization (PSO) dan genetic algorithm (GA). Meta-heuristik yang diterapkan untuk memberikan modes awal yang lebih baik untuk algoritma K-modes. Penelitian ini menggunakan pengukuran Jaccard dalam hal pengukuran similarity dan menggunakan tiga dataset untuk memvalidasi algoritma yang diusulkan. Hasil percobaan dan hasil statistik menunjukkan bahwa PSO berbasis algoritma K-modes lebih baik dari GA berbasis algoritma K-modes. Dalam hasil evaluasi menggunakan data dari sebuah perusahaan automobile di Taiwan, PSO berdasarkan PSO berbasis algoritma K-modes memiliki SSE kecil dari pada GA berbasis algoritma K-modes.
ABSTRACT
Supplier clustering is important for providing more important information for the buyer. This study proposes meta-heuristics based K-modes algorithm for clustering binary dataset. There are two metaheuristic methods applied in this study, namely particle swarm optimization (PSO) and genetic algorithm (GA). The meta-heuristics are applied to give better initial modes for the K-modes algorithm. In terms of similarity measurement, this study uses Jaccard measurement since the real data set consists of higher number of value zero than one. In order to validate the proposed algorithms, three benchmark datasets are employed. The experiments results and statistical results show that PSO based K-modes algorithm is better than GA based K- modes algorithm. The data set from a exisibition company in Taiwan. In model evaluation results, PSO based K- modes algorithm has the SSE lowest than GA based K- modes algorithm.
Depok: Fakultas Teknik Universitas Indonesia, 2015
T44694
UI - Tesis Membership  Universitas Indonesia Library
cover
M. Misbachul Huda
Abstrak :
Categorical data is a kind of data that is used for computational in computer science. To obtain the information from categorical data input, it needs a clustering algorithm. There are so many clustering algorithms that are given by the researchers. One of the clustering algorithms for categorical data is k-modes. K-modes uses a simple matching approach. This simple matching approach uses similarity va-lues. In K-modes, the two similar objects have similarity value 1, and 0 if it is otherwise. Actually, in each attribute, there are some kinds of different attribute value and each kind of attribute value has different number. The similarity value 0 and 1 is not enough to represent the real semantic distance between a data object and a cluster. Thus in this paper, we generalize a k-modes algorithm for catego-rical data by adding the weight and diversity value of each attribute value to optimize categorical data clustering.
Data Kategorial merupakan suatu jenis data perhitungan di ilmu komputer .Untuk mendapatkan infor-masi dari input data kategorial diperlukan algoritma klastering. Ada berbagai jenis algoritma klas-tering yang dikembangkan peneliti terdahulu. Salah satunya adalah K-modes. K-modes menggunakan pendekatan simple matching. Pendekatan simple matching ini menggunakan nilai similarity. Pada K-modes, jika dua objek data mirip, maka akan diberi nilai. Jika dua objek data tidak mirip, maka diberi nilai 0. Pada kenyataannya, tiap atribut data terdiri dari beberapa jenis nilai atribut dan tiap jenis nilai atribut terdiri dari jumlah yang berbeda. Nilai similarity 0 dan 1 kurang merepresentasi jarak antara sebuah objek data dan klaster secara nyata. Oleh karena itu, pada paper ini, kami mengembangkan algoritma K-modes untuk data kategorial dengan penambahan bobot dan nilai diversity pada setiap atribut untuk mengoptimalkan klastering data kategorial.
Surabaya: Institut Teknologi Sepuluh Nopember, Faculty of Information Technology, Department of Informatics Engineering, 2014
AJ-Pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Yuliana Portti
Abstrak :
Penelitian ini mengusulkan tiga algoritma meta-heuristik berbasis Fuzzy K-modes untuk clustering binary data set. Ada tiga metode metaheuristik diterapkan, yaitu Particle Swarm Optimization (PSO), Genetika Algoritma (GA), dan Artificial Bee Colony (ABC). Ketiga algoritma digabungkan dengan algoritma K-modes. Tujuannya adalah untuk memberikan modes awal yang lebih baik untuk K-modes. Jarak antara data ke modes dihitung dengan menggunakan koefisien Jaccard. Koefisien Jaccard diterapkan karena dataset mengandung banyak nilai nol . Dalam rangka untuk melakukan pengelompokan set data real tentang supplier otomotif di Taiwan, algoritma yang diusulkan diverifikasi menggunakan benchmark set data. Hasil penelitian menunjukkan bahwa PSO K-modes dan GA K-modes lebih baik dari ABC K-modes. Selain itu, dari hasil studi kasus, GA K-modes memberikan SSE terkecil dan juga memiliki waktu komputasi lebih cepat dari PSO K-modes dan ABC K-modes. ...... This study proposed three meta-heuristic based fuzzy K-modes algorithms for clustering binary dataset. There are three meta-heuristic methods applied, namely Particle Swarm Optimization (PSO) algorithm, Genetic Algorithm (GA) algorithm, and Artificial Bee Colony (ABC) algorithm. These three algorithms are combined with k-modes algorithm. Their aim is to give better initial modes for the k-modes. Herein, the similarity between two instances is calculated using jaccard coefficient. The Jaccard coefficient is applied since the dataset contains many zero values. In order to cluster a real data set about automobile suppliers in Taiwan, the proposed algorithms are verified using benchmark data set. The experiments results show that PSO K-modes and GA K-modes is better than ABC K-modes. Moreover, from case study results, GA fuzzy K-modes gives the smallest SSE and also has faster computational time than PSO fuzzy K-modes and ABC fuzzy K-modes.
Depok: Fakultas Teknik Universitas Indonesia, 2015
T44406
UI - Tesis Membership  Universitas Indonesia Library
cover
Sarah Syarofina
Abstrak :
Inhibitor dipeptidil peptidase 4 (DPP-4) baru perlu dikembangkan untuk meminimalkan efek samping merugikan yang diakibatkan oleh obat golongan inhibitor DPP-4 yang telah terdaftar. Penelitian ini bertujuan untuk menghasilkan subset molekul inhibitor DPP-4 yang representatif dengan mengaplikasikan algoritma K-Modes clustering dengan Levenshtein distance pada proses clustering dan melakukan analisis pemilihan molekul inhibitor DPP-4 berdasarkan kriteria nilai logP dari aturan Lipinskis Rule of 5. 2053 molekul inhibitor DPP-4 diperoleh dari situs ChEMBL. Clustering dilakukan terhadap fingerprint molekuler inhibitor DPP-4 yang diperoleh dari fitur SMILES (Simplified Molecular Input Line Entry System). Metode MACCS (Molecular Access System) Keys, ECFP (Extended Connectivity Fingerprint) diameter 4 dan 6, dan FCFP (Functional Class Fingerprint) diameter 4 dan 6, digunakan untuk membangun lima dataset fingerprint untuk proses clustering. Prosedur clustering diawali dengan menentukan jumlah klaster dengan menghitung nilai Koefisien Silhouette sebagai metode evaluasi klaster. Penerapan algoritma K-Modes clustering dengan Levenshtein distance pada 2053 molekul inhibitor DPP-4 menghasilkan nilai Koefisien Silhouette maksimal dari dataset MACCS sebesar 0.3947 dengan jumlah klaster 1258. Pemilihan molekul berdasarkan kriteria nilai logP dan aturan Lipinskis Rule of 5 menghasilkan 778 molekul inhibitor DPP-4 dari semua dataset dengan 298 molekul inaktif dan 480 molekul aktif dan nilai logP berkisar antara -1.67 sampai dengan 4.97.


P value criteria. 2053 DPP-4 inhibitor molecules obtained from the ChEMBL website. Clustering was carried out on the molecular fingerprint obtained from the SMILES feature. The MACCS Keys, ECFP (diameter 4 and 6), and FCFP (diameter 4 and 6) methods were used to construct fingerprint datasets for the clustering process. The clustering procedure begins by determining the number of clusters by calculating the Silhouette Coefficient value. The application of the K-Modes clustering with Levenshtein distance to 2053 DPP-4 inhibitor molecules resulted in the maximum Silhouette Coefficient value of the MACCS dataset of 0.3947 with the number of clusters 1258. Selection of molecules based on logP value criteria and Lipinskis Rule of 5 resulted in 778 DPP-4 inhibitor molecules. of all the datasets with 298 inactive molecules and 480 active molecules and the logP value ranged from -1.67 to 4.97.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library