Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Universitas Indonesia, 1990
S27326
UI - Skripsi Membership  Universitas Indonesia Library
cover
Amyra Aulia Adlina
Abstrak :
Indeks validitas merupakan metode yang mengevaluasi hasil clustering untuk mendapatkan jumlah klaster optimal suatu data. Pada skripsi ini, dilakukan clustering pada data menggunakan algoritma K-Means. Selanjutnya, hasil clustering tersebut dievaluasi oleh empat jenis indeks validitas, yaitu indeks Silhouette, indeks Davies-Bouldin, indeks Sum of Square, dan indeks Calinski-Harabasz. Implementasi keempat jenis indeks validitas dilakukan dengan menggunakan data benchmark yang sudah diketahui jumlah kelasnya. Hasil implementasi tersebut akan dibandingkan untuk mengetahui apakah keempat indeks validitas dapat memprediksi jumlah klaster dengan tepat. Dari hasil simulasi, indeks Silhouette, indeks Davies-Bouldin, dan indeks Calinski-Harabasz dapat memprediksi jumlah klaster optimal lebih tepat dibandingkan dengan indeks Sum of Square. ......The validity index is a method that evaluates the clustering results to get the optimal number of clusters of a data. In this skripsi, data clustered using K Means algorithm. Furthermore, the clustering results are evaluated by four types of validity indices, namely the Silhouette index, the Davies Bouldin index, the Sum of Square index, and the Calinski Harabasz index. The implementation of the four validity indices is done by using the benchmark data which is already known to the number of classes. The results of the implementation will be compared to find out whether the four validity indices can predict the number of clusters appropriately. From the simulation results, the Silhouette index, the Davies Bouldin index, and the Calinski Harabasz index can predict the optimal cluster number is more precise than the Sum of Square index.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aida Fastabiqa Khairati
Abstrak :
ABSTRAK
Clustering merupakan proses pengelompokkan himpunan objek ke dalam cluster-cluster yang berisi objek-objek dengan kemiripan yang tinggi dibandingkan dengan objek-objek pada cluster lain. Algoritma K-means merupakan salah satu metode yang banyak digunakan dalam penyelesaian masalah clustering. Pada algoritma ini titik pusat cluster ditentukan oleh nilai rata-rata objek-objek pada cluster tersebut. Algortima K-means memiliki ketergantungan terhadap pemilihan titik pusat awal cluster yang pemilihannya dilakukan secara acak. Pemilihan ini dapat mempengaruhi hasil clustering. Metode enhanced dan metode MMCA merupakan 2 contoh metode yang dapat diterapkan pada algoritma K-means dalam pemilihan titik pusat awal cluster. Penerapan kedua metode tersebut pada algoritma K-means menghasilkan hasil clustering yang lebih optimal, ditunjukkan dengan jumlah iterasi yang sama pada tiap simulasi untuk mencapai kriteria konvergen serta nilai rata-rata similaritas terhadap data benchmark yang lebih baik.
ABSTRACT
Clustering is the process of grouping the set of objects into clusters that contain objects with a high similarity compared to objects in other clusters. K means algorithm is one of many methods used in solving clustering problems. In this algorithm the center point of the cluster is determined by the average value of the objects in the cluster. The K means algorithm has a dependency on the selection of the cluster 39 s initial center point where the selection is randomly selected. This selection can affect the clustering result. The enhanced method and MMCA method are two examples of methods that can be applied to the K means algorithm in the selection of the cluster 39 s initial center point. The application of both methods to the K means algorithm resulted in a more optimal clustering result, indicated by the same number of iterations in each simulation to achieve convergent criteria as well as the average similarity value to better benchmark data.
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Eny Christiningsih
Depok: Universitas Indonesia, 2009
S27820
UI - Skripsi Open  Universitas Indonesia Library
cover
Sarah Syarofina
Abstrak :
Inhibitor dipeptidil peptidase 4 (DPP-4) baru perlu dikembangkan untuk meminimalkan efek samping merugikan yang diakibatkan oleh obat golongan inhibitor DPP-4 yang telah terdaftar. Penelitian ini bertujuan untuk menghasilkan subset molekul inhibitor DPP-4 yang representatif dengan mengaplikasikan algoritma K-Modes clustering dengan Levenshtein distance pada proses clustering dan melakukan analisis pemilihan molekul inhibitor DPP-4 berdasarkan kriteria nilai logP dari aturan Lipinskis Rule of 5. 2053 molekul inhibitor DPP-4 diperoleh dari situs ChEMBL. Clustering dilakukan terhadap fingerprint molekuler inhibitor DPP-4 yang diperoleh dari fitur SMILES (Simplified Molecular Input Line Entry System). Metode MACCS (Molecular Access System) Keys, ECFP (Extended Connectivity Fingerprint) diameter 4 dan 6, dan FCFP (Functional Class Fingerprint) diameter 4 dan 6, digunakan untuk membangun lima dataset fingerprint untuk proses clustering. Prosedur clustering diawali dengan menentukan jumlah klaster dengan menghitung nilai Koefisien Silhouette sebagai metode evaluasi klaster. Penerapan algoritma K-Modes clustering dengan Levenshtein distance pada 2053 molekul inhibitor DPP-4 menghasilkan nilai Koefisien Silhouette maksimal dari dataset MACCS sebesar 0.3947 dengan jumlah klaster 1258. Pemilihan molekul berdasarkan kriteria nilai logP dan aturan Lipinskis Rule of 5 menghasilkan 778 molekul inhibitor DPP-4 dari semua dataset dengan 298 molekul inaktif dan 480 molekul aktif dan nilai logP berkisar antara -1.67 sampai dengan 4.97.


P value criteria. 2053 DPP-4 inhibitor molecules obtained from the ChEMBL website. Clustering was carried out on the molecular fingerprint obtained from the SMILES feature. The MACCS Keys, ECFP (diameter 4 and 6), and FCFP (diameter 4 and 6) methods were used to construct fingerprint datasets for the clustering process. The clustering procedure begins by determining the number of clusters by calculating the Silhouette Coefficient value. The application of the K-Modes clustering with Levenshtein distance to 2053 DPP-4 inhibitor molecules resulted in the maximum Silhouette Coefficient value of the MACCS dataset of 0.3947 with the number of clusters 1258. Selection of molecules based on logP value criteria and Lipinskis Rule of 5 resulted in 778 DPP-4 inhibitor molecules. of all the datasets with 298 inactive molecules and 480 active molecules and the logP value ranged from -1.67 to 4.97.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library