Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query

Novieka Distiasari

Aplikasi algoritma metaheuristik berbasis K-modes pada pengelompokan supplier = Application of metaheuristic based K-modes algorithms to supplier clustering

"ABSTRAK

Pengelompokan supplier penting untuk memberikan informasi kepada pembeli. Penelitian ini mengusulkan meta-heuristik berbasis algoritma K-modes untuk mengelompokkan dataset dalam bentuk biner. Ada dua metode metaheuristik yang digunakan dalam penelitian ini, yaitu particle swarm optimization (PSO) dan genetic algorithm (GA). Meta-heuristik yang diterapkan untuk memberikan modes awal yang lebih baik untuk algoritma K-modes. Penelitian ini menggunakan pengukuran Jaccard dalam hal pengukuran similarity dan menggunakan tiga dataset untuk memvalidasi algoritma yang diusulkan. Hasil percobaan dan hasil statistik menunjukkan bahwa PSO berbasis algoritma K-modes lebih baik dari GA berbasis algoritma K-modes. Dalam hasil evaluasi menggunakan data dari sebuah perusahaan automobile di Taiwan, PSO berdasarkan PSO berbasis algoritma K-modes memiliki SSE kecil dari pada GA berbasis algoritma K-modes.

ABSTRACT

Supplier clustering is important for providing more important information for the buyer. This study proposes meta-heuristics based K-modes algorithm for clustering binary dataset. There are two metaheuristic methods applied in this study, namely particle swarm optimization (PSO) and genetic algorithm (GA). The meta-heuristics are applied to give better initial modes for the K-modes algorithm. In terms of similarity measurement, this study uses Jaccard measurement since the real data set consists of higher number of value zero than one. In order to validate the proposed algorithms, three benchmark datasets are employed. The experiments results and statistical results show that PSO based K-modes algorithm is better than GA based K- modes algorithm. The data set from a exisibition company in Taiwan. In model evaluation results, PSO based K- modes algorithm has the SSE lowest than GA based K- modes algorithm."

Depok: Fakultas Teknik Universitas Indonesia, 2015

T44694

UI - Tesis Membership Universitas Indonesia Library

M. Misbachul Huda

Diversity-based attribute weighting for k-modes clustering

"Categorical data is a kind of data that is used for computational in computer science. To obtain the information from categorical data input, it needs a clustering algorithm. There are so many clustering algorithms that are given by the researchers. One of the clustering algorithms for categorical data is k-modes. K-modes uses a simple matching approach. This simple matching approach uses similarity va-lues. In K-modes, the two similar objects have similarity value 1, and 0 if it is otherwise. Actually, in each attribute, there are some kinds of different attribute value and each kind of attribute value has different number. The similarity value 0 and 1 is not enough to represent the real semantic distance between a data object and a cluster. Thus in this paper, we generalize a k-modes algorithm for catego-rical data by adding the weight and diversity value of each attribute value to optimize categorical data clustering.

Data Kategorial merupakan suatu jenis data perhitungan di ilmu komputer .Untuk mendapatkan infor-masi dari input data kategorial diperlukan algoritma klastering. Ada berbagai jenis algoritma klas-tering yang dikembangkan peneliti terdahulu. Salah satunya adalah K-modes. K-modes menggunakan pendekatan simple matching. Pendekatan simple matching ini menggunakan nilai similarity. Pada K-modes, jika dua objek data mirip, maka akan diberi nilai. Jika dua objek data tidak mirip, maka diberi nilai 0. Pada kenyataannya, tiap atribut data terdiri dari beberapa jenis nilai atribut dan tiap jenis nilai atribut terdiri dari jumlah yang berbeda. Nilai similarity 0 dan 1 kurang merepresentasi jarak antara sebuah objek data dan klaster secara nyata. Oleh karena itu, pada paper ini, kami mengembangkan algoritma K-modes untuk data kategorial dengan penambahan bobot dan nilai diversity pada setiap atribut untuk mengoptimalkan klastering data kategorial."

Surabaya: Institut Teknologi Sepuluh Nopember, Faculty of Information Technology, Department of Informatics Engineering, 2014

AJ-Pdf

Artikel Jurnal Universitas Indonesia Library

Muhammad Yogi Ilham

Analisis Karakteristik Kecelakaan Jalan Tol Cikopo-Palimanan Dengan Pendekatan Data Mining = Analyzing Road Accident Characteristic in Cikopo-Palimanan Highway Using Data Mining

"ABSTRAK

Kecelakaan lalu lintas adalah peristiwa yang terjadi secara tidak sengaja dan di luar dugaan. Di Indonesia, angka kecelakaan terus mengalami peningkatan setiap tahun dan merugikan lebih dari satu milyar per tahun serta memakan korban lebih dari 800.000 jiwa dalam periode 2014-2018. Jalan Tol Cikopo-Palimanan adalah ruas terpanjang dari jaringan tol Trans-Jawa yang mengkoneksikan pulau Jawa dari Pelabuhan Merak, Banten hingga Pelabuhan Ketapang, Jawa Timur. Dalam langkah pencegahan dan penurunan kecelakaan, diperlukan strategi untuk mengidentifikasi faktor-faktor kecelakaan. Data mining adalah metode pencarian informasi untuk data berjumlah besar. Metode data mining yang digunakan adalah clustering untuk mengurangi heterogenitas data dan association untuk mengidentifikasi hubungan antara faktor kecelakaan. Penelitian ini menemukan ada tiga belas cluster kecelakaan yang kemudian setiap cluster dianalisis menggunakan metode apriori algorithm dengan parameter minimum support 20% dan nilai lift 1.

ABSTRACT
Traffic accidents are events that occur accidentally and unexpectedly. In Indonesia, the number of accidents continues to increase every year and costs more than one billion per year and claimed more than 800,000 lives in the 2014-2018. Cikopo-Palimanan Toll Road is the longest section of the Tol Trans-Jawa road network that connects Pelabuhan Merak, Banten Pelabuhan Ketapang, East Java. In order to prevent and decrease number of accidents, a strategy is needed to identify accident factors. Data mining is a method of finding information from large amounts of data. Data mining methods used in this study are clustering to reduce data heterogeneity and association to identify the relationship between accident factors. This study found thirteen accident clusters and each cluster was analyzed using apriori algorithm method with a minimum support parameter of 20% and a lift value of 1."

2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Yuliana Portti

Aplikasi algoritma metaheuristik basis fuzzy K- modes untuk supplier clustering = Application of metaheuristic based fuzzy K-modes algorithm to supplier clustering

"Penelitian ini mengusulkan tiga algoritma meta-heuristik berbasis Fuzzy K-modes untuk clustering binary data set. Ada tiga metode metaheuristik diterapkan, yaitu Particle Swarm Optimization (PSO), Genetika Algoritma (GA), dan Artificial Bee Colony (ABC). Ketiga algoritma digabungkan dengan algoritma K-modes. Tujuannya adalah untuk memberikan modes awal yang lebih baik untuk K-modes. Jarak antara data ke modes dihitung dengan menggunakan koefisien Jaccard. Koefisien Jaccard diterapkan karena dataset mengandung banyak nilai nol . Dalam rangka untuk melakukan pengelompokan set data real tentang supplier otomotif di Taiwan, algoritma yang diusulkan diverifikasi menggunakan benchmark set data. Hasil penelitian menunjukkan bahwa PSO K-modes dan GA K-modes lebih baik dari ABC K-modes. Selain itu, dari hasil studi kasus, GA K-modes memberikan SSE terkecil dan juga memiliki waktu komputasi lebih cepat dari PSO K-modes dan ABC K-modes.

This study proposed three meta-heuristic based fuzzy K-modes algorithms for clustering binary dataset. There are three meta-heuristic methods applied, namely Particle Swarm Optimization (PSO) algorithm, Genetic Algorithm (GA) algorithm, and Artificial Bee Colony (ABC) algorithm. These three algorithms are combined with k-modes algorithm. Their aim is to give better initial modes for the k-modes. Herein, the similarity between two instances is calculated using jaccard coefficient. The Jaccard coefficient is applied since the dataset contains many zero values. In order to cluster a real data set about automobile suppliers in Taiwan, the proposed algorithms are verified using benchmark data set. The experiments results show that PSO K-modes and GA K-modes is better than ABC K-modes. Moreover, from case study results, GA fuzzy K-modes gives the smallest SSE and also has faster computational time than PSO fuzzy K-modes and ABC fuzzy K-modes."

Depok: Fakultas Teknik Universitas Indonesia, 2015

T44406

UI - Tesis Membership Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Sarah Syarofina

Analisis Pemilihan Molekul Inhibitor Dipeptidil Peptidase 4 pada Perancangan Obat Diabetes Tipe 2 menggunakan Algoritma K-Modes Clustering dengan Levenshtein Distance = Molecular Selection Analysis of Dipeptidyl Peptidase-4 Inhibitors in The Drug Discovery of Type 2 Diabetes using K-Modes Clustering Algorithm with Levenshtein Distance

"Inhibitor dipeptidil peptidase 4 (DPP-4) baru perlu dikembangkan untuk meminimalkan efek samping merugikan yang diakibatkan oleh obat golongan inhibitor DPP-4 yang telah terdaftar. Penelitian ini bertujuan untuk menghasilkan subset molekul inhibitor DPP-4 yang representatif dengan mengaplikasikan algoritma K-Modes clustering dengan Levenshtein distance pada proses clustering dan melakukan analisis pemilihan molekul inhibitor DPP-4 berdasarkan kriteria nilai logP dari aturan Lipinskis Rule of 5. 2053 molekul inhibitor DPP-4 diperoleh dari situs ChEMBL. Clustering dilakukan terhadap fingerprint molekuler inhibitor DPP-4 yang diperoleh dari fitur SMILES (Simplified Molecular Input Line Entry System). Metode MACCS (Molecular Access System) Keys, ECFP (Extended Connectivity Fingerprint) diameter 4 dan 6, dan FCFP (Functional Class Fingerprint) diameter 4 dan 6, digunakan untuk membangun lima dataset fingerprint untuk proses clustering. Prosedur clustering diawali dengan menentukan jumlah klaster dengan menghitung nilai Koefisien Silhouette sebagai metode evaluasi klaster. Penerapan algoritma K-Modes clustering dengan Levenshtein distance pada 2053 molekul inhibitor DPP-4 menghasilkan nilai Koefisien Silhouette maksimal dari dataset MACCS sebesar 0.3947 dengan jumlah klaster 1258. Pemilihan molekul berdasarkan kriteria nilai logP dan aturan Lipinskis Rule of 5 menghasilkan 778 molekul inhibitor DPP-4 dari semua dataset dengan 298 molekul inaktif dan 480 molekul aktif dan nilai logP berkisar antara -1.67 sampai dengan 4.97.
New dipeptidyl peptidase 4 (DPP-4) inhibitors need to be developed to minimize the adverse side effects caused by registered DPP-4 inhibitor drugs. This study aims to produce a representative subset of DPP-4 inhibitor molecules by applying the K-Modes clustering algorithm with Levenshtein distance in the clustering process and analyzing the selection of DPP-4 inhibitor molecules based on the logP value criteria. 2053 DPP-4 inhibitor molecules obtained from the ChEMBL website. Clustering was carried out on the molecular fingerprint obtained from the SMILES feature. The MACCS Keys, ECFP (diameter 4 and 6), and FCFP (diameter 4 and 6) methods were used to construct fingerprint datasets for the clustering process. The clustering procedure begins by determining the number of clusters by calculating the Silhouette Coefficient value. The application of the K-Modes clustering with Levenshtein distance to 2053 DPP-4 inhibitor molecules resulted in the maximum Silhouette Coefficient value of the MACCS dataset of 0.3947 with the number of clusters 1258. Selection of molecules based on logP value criteria and Lipinskis Rule of 5 resulted in 778 DPP-4 inhibitor molecules. of all the datasets with 298 inactive molecules and 480 active molecules and the logP value ranged from -1.67 to 4.97.
"

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian