Hasil Pencarian

Ditemukan 193022 dokumen yang sesuai dengan query

Bayu Permata Negara

Cluster Ensemble pada Data Campuran dalam Pengelompokan Sekolah Menengah Pertama di Provinsi Jawa Barat = Cluster Ensemble Based Mixed Data Clustering of Junior High School in West Java Province

"Analisis kelompok adalah metode multivariat yang bertujuan mengelompokkan pengamatan berdasarkan karakteristiknya. Salah satu metode analisis pengelompokan adalah metode cluster ensembel dengan pengelompokan dilakukan dengan satu metode berulang kali hingga diperoleh hasil yang lebih baik dibandingkan jika dilakukan satu kali. Penelitian ini mencoba menggunakan Cluster Ensemble Based Mixed Data Clustering (CEBMDC), yaitu metode pengelompokan yang biasa dilakukan untuk data dengan variabel campuran yaitu numerik dan kategorik. Tahap awal dalam metode ini yaitu membagi data awal menjadi data dengan hanya variabel-variabel numerik dan data dengan hanya variabel-variabel kategorik. Data yang telah dipisahkan berdasarkan jenis variabelnya kemudian dikelompokan menggunakan metode yang sesuai secara simultan. Hasil pengelompokan ini menjadi data baru dengan dua variabel kategorik yaitu hasil pengelompokan dengan variabel numerik dan hasil pengelompokan dengan variabel kategorik. Data baru dengan dua variabel kategorik ini kemudian dilakukan proses pengelompokan. Metode pengelompokan untuk data dengan variabel numerik adalah metode Hierarchical Agglomerative Clustering. Metode clustering untuk data kategorik adalah ROCK (RObust Clustering using linKs) dan K-medoids/PAM (Partition Around Medoids). Penelitian ini membandingkan hasil pengelompokan ROCK dan K-medoids. Pengelompokan dilakukan pada data mengenai sarana dan prasarana sekolah yang diambil dari 5.094 SMP yang ada di Jawa barat. Metode pengelompokan dengan kinerja terbaik pada penelitian ini adalah Ensemble K-medoids berdasarkan rasio antara simpangan baku di dalam kelompok (Â¬SW) dan simpangan baku antar kelompok (SB) terkecil. Penelitian ini menghasilkan 3 kelompok yang mencerminkan kondisi sekolah-sekolah pada jenjang SMP di Jawa Barat.

Clustering analysis is a multivariate method that aims to classify observations based on their characteristics. One method of clustering analysis is the ensemble clustering method in which the grouping is done using a method repeatedly until better results are obtained than if it is done once. This study uses the Cluster Ensemble Based Mixed Data Clustering (CEBMDC), which is a grouping method that commonly used for data with numerical and categorical variables. The first step in this method is to divide the initial data into two parts, that is data with only numerical variables and data with categorical variables. After data has been separated based on the types of variables, and then clustering using the appropriate method is conducted simultaneously. The results of these two clustering method become a new data with two categorical variables, namely the results of clustering with numeric variables and the results of clustering with categorical variables. The new data with two categorical variables are then carried out the clustering process. The clustering method for data with numerical variables is the Hierarchical Agglomerative Clustering method. Clustering methods for categorical data are ROCK (RObust Clustering using linKs) and K-medoids / PAM (Partition Around Medoids). This study compares the results of ROCK and K-medoids clustering. The study was conducted on data of school facilities and infrastructure taken from 5094 junior high schools in West Java. The best performance grouping method in this study is the Ensemble K-medoids based on the ratio between the standard deviation in the group (SW) and the smallest standard inter-group (SB) deviation. This study produced 3 groups that reflect the condition junior high schools in West Java."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Muhammad Naufal Luthfi

Clustering Daerah Bencana Alam di Indonesia Dengan Menggunakan Metode Hierarchical Clustering dan Fuzzy C-Means = Clustering of Natural Disaster Areas in Indonesia Using Hierarchical Clustering and Fuzzy C-Means Methods

"Peradaban yang terus berkembang telah membuat konflik antara manusia dan lingkungan menjadi semakin parah sehingga menyebabkan banyak terjadinya bencana alam. Banyak negara yang terdampak oleh bencana alam dan salah satunya adalah Indonesia. Kondisi dan letak geografis Indonesia menyebabkan banyak terjadinya bencana alam di Indonesia. Oleh karena itu, perlu dilakukan pengelompokan daerah bencana alam di Indonesia untuk mengetahui daerah yang paling sering terkena bencana alam. Metode clustering dapat digunakan untuk mengetahui daerah tersebut. Dari studi literatur yang telah dilakukan, belum ada penelitian yang menggunakan metode hierarchical clustering dan fuzzy c-means untuk clustering daerah bencana alam di Indonesia. Maka dari itu, tujuan dari penelitian ini adalah mengklasifikasi daerah yang sering mengalami bencana alam di Indonesia dengan menggunakan metode hierarchical clustering dan fuzzy c-means. Data yang digunakan dalam penelitian ini adalah data bencana alam di Indonesia dari tahun 2019 hingga 2023. Variabel yang digunakan adalah jumlah kebakaran hutan dan lahan, banjir, cuaca ekstrem, gelombang pasang, tanah longsor, kekeringan, erupsi gunung api, dan gempa bumi di setiap kabupaten yang terdampak bencana alam. Hasil clustering menunjukan terdapat 66 daerah yang sering mengalami banjir, 45 daerah yang sering mengalami kebakaran hutan dan gelombang pasang, dan 30 daerah yang sering mengalami cuaca ekstrem, tanah longsor, kekeringan, erupsi gunung api, dan gempa bumi.

The continuously evolving civilization has exacerbated the conflict between humans and the environment, leading to increasingly severe natural disasters. Many countries are affected by natural disasters, and one of them is Indonesia. Indonesia's conditions and geographic location contribute to the occurrence of numerous natural disasters in the country. Therefore, it is necessary to classify areas prone to natural disasters in Indonesia to identify the most frequently affected regions. Clustering methods can be used to determine these areas. From the literature review conducted, there has been no research utilizing hierarchical clustering and fuzzy c-means methods for clustering areas prone to natural disasters in Indonesia. Therefore, the aim of this research is to classify areas that frequently experience natural disasters in Indonesia using hierarchical clustering and fuzzy c-means methods. The data used in this research is the natural disaster data in Indonesia from 2019 to 2023. The variables used include the number of forest and land fires, floods, extreme weather events, tidal waves, landslides, droughts, volcanic eruptions, and earthquakes in each disaster-affected district. The clustering results indicate that there are 66 regions frequently experiencing floods, 45 regions often experiencing forest fires and tidal waves, and 30 regions commonly facing extreme weather, landslides, droughts, volcanic eruptions, and earthquakes."

Jakarta: Fakultas Teknik Universitas Indonesia, 2024

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Banjarnahor, Evander

Analisis Kekerabatan pada Barisan DNA SARS-Cov-2 Berdasarkan Pembentukan Pohon Filogenetik dengan Metode Hierarchical dan K-Means Clustering Menggunakan Multiple Encoding Vector dan K-Mer = Implementation of Hierarchical and K-Means Clustering Methods Using Multiple Encoding Vector in Analyzing Kinship in SARS-Cov-2 DNA Sequences

"Berdasarkan data WHO pada pertengahan Juli 2021 lebih dari 185,2 juta orang di seluruh dunia terinfeksi virus corona atau Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2). Virus ini menyerang penapasan manusia yang dapat mengakibatkan infeksi paru-paru pada manusia dan bahkan dapat menyebabkan kematian. Tercatat bahwa lebih dari 4 juta orang di seluruh dunia meninggal akibat terinfeksi virus corona. Di Indonesia sendiri pada pertengahan Juli 2021 tercatat lebih dari 2,4 juta orang ternfeksi virus corona dan lebih dari 65,4 ribu orang meninggal akibat terinfeksi virus corona. Berdasarkan data tersebut, perlu dilakukan analisis kekerabatan virus SARS-CoV-2 untuk mengurangi penyebaran dan memberikan batasan sosial dari negara satu dengan negara lainnya. Identifikasi kekerabatan dari virus covid-19 dan penyebarannya dapat dilakukan dengan cara pembentukan pohon filogenetik dan clustering. Pada penelitian ini pohon filogenetik akan dibangun berdasarkan metode Hierarchical Clustering dengan menggunakan metode Multiple Encoding Vector dan K-Mer berdasarkan translasi DNA kodon menjadi asam amino. Jarak Euclidean akan digunakan untuk menentukan matriks jarak. Penelitian ini selanjutnya menggunakan metode K- Means Clustering untuk melihat penyebarannya, dimana nilai k ditentukan dari jumlah centroid yang dihasilkan dari metode Hierarchical Clustering. Penelitian ini mengambil sampel barisan DNA SARS-CoV-2 dari beberapa negara yang tertular. Dari hasil simulasi, nenek moyang SARS-CoV-2 berasal dari China. Hasil analisis juga menunjukkan bahwa leluhur covid-19 yang paling dekat dengan Indonesia berasal dari India, Australia dan Spanyol. Selain itu dari hasil simulasi dihasilkan bahwa barisan DNA SARS-CoV-2 terdiri dari 9 cluster dan cluster keenam adalah kelompok yang memiliki anggota paling banyak. Hasil analisis juga menunjukkan bahwa metode ini sangat opitimal dalam pengelompokan data dengan nilai 97.4%.

Based on WHO data in middle of July 2021, Coronavirus or Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) is infecting more than 185.2 million people worldwide. The virus attacks human breathing, which can cause lung infections and can even cause death. More than 4 million people worldwide have died due to being infected with the coronavirus. In Indonesia alone, in mid-July 2021, there were more than 2.4 million people infected with the corona virus and more than 65.4 thousand people died from being infected with the corona virus. Based on those covid-19 survivor data, it is necessary to carry out a kinship analysis of the coronavirus to reduce its spreading. Identification of the kinship of the covid- 19 virus and its spread can be done by forming a phylogenetic tree and clustering. This study uses the Multiple Encoding Vector method and K-mer based on translation DNA codon to amino acid in analyzing sequences and Euclidean Distance to determine the distance matrix. This research will then use the Hierarchical Clustering method to determine the number of initial centroids and cluster, which will be used later by the K-Means Clustering method kinship in SARS-CoV-2 DNA sequence. This study took samples of DNA sequences of SARS-CoV-2 from several infected countries. From the simulation results, the ancestors of SARS-CoV-2 came from China. The results of the analysis also show that the closest ancestors of covid-19 to Indonesia came from India, Australia and Spain. In addition, the ancestors of SARS-CoV-2 came from China. The SARS- CoV-2 DNA sequence is also consisted of 9 clusters, and the sixth cluster is the group that has the most members. The results also show that this method is very optimal in a grouping of data with a value of 97.4%."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Alfia Choirun Nisa

Perbandingan antara Hasil Biclustering dan Hasil Cluster-Biplot pada Data 119 Kabupaten/Kota di Pulau Jawa Tahun 2022 Berdasarkan Indikator Kesejahteraan Rakyat = Comparison between Biclustering Results and Cluster-Biplot Results on Data from 119 Regencies/Cities on Java Island in 2022 Based on People's Welfare Indicators

"Keberhasilan pembangunan suatu negara dapat dilihat dari kondisi kesejahteraan rakyatnya. Peningkatan kesejahteraan rakyat menjadi sasaran utama dalam kegiatan pembangunan yang dilaksanakan oleh pemerintah. Agar pembangunan yang dilakukan efektif dan tepat sasaran, perlu dilakukan pengelompokan untuk mengetahui karakteristik wilayah. Penelitian ini membahas mengenai pengelompokan kabupaten/kota di Pulau Jawa berdasarkan indikator kesejahteraan rakyat tahun 2022. Kesejahteraan yang diukur merupakan kesejahteraan materi. Variabel yang digunakan dalam penelitian ini adalah persentase penduduk miskin, PDRB per kapita atas dasar harga berlaku, rata-rata lama sekolah, harapan lama sekolah, persentase pengeluaran per kapita untuk makanan, tingkat pengangguran terbuka, jumlah penduduk, kepadatan penduduk, dan angka harapan hidup. Terdapat dua pendekatan yang digunakan dalam mengelompokkan kabupaten/kota beserta variabel-variabelnya. Pendekatan pertama adalah mengelompokkan kabupaten/kota dan variabel-variabelnya secara simultan dengan menggunakan metode biclustering plaid model. Pendekatan kedua adalah mengelompokkan kabupaten/kota menggunakan clustering metode Ward dan dilanjutkan dengan metode biplot. Tujuan penelitian ini adalah membandingkan hasil kedua pendekatan tersebut, yaitu hasil biclustering dan hasil cluster-biplot pada data 119 kabupaten/kota di Pulau Jawa pada tahun 2022 berdasarkan indikator kesejahteraan rakyat. Berdasarkan hasil penelitian, didapatkan jumlah kelompok dari kedua pendekatan tersebut adalah sebanyak 2 dengan kelompok 1 merupakan wilayah yang lebih sejahtera daripada kelompok 2. Ditinjau dari nilai standar deviasinya, kelompok hasil biclustering plaid model memiliki nilai standar deviasi yang lebih kecil dibanding kelompok hasil cluster-biplot. Dengan demikian, secara umum pendekatan pertama menghasilkan kelompok yang lebih baik karena lebih homogen dibandingkan dengan pendekatan kedua.

The success of a country's development can be known from the well-being of its people. Improving the welfare of the population is the main goal in the development activities carried out by government. To ensure that development is effective and targeted, grouping is needed to understand the characteristics of the region. This study discusses the grouping of regencies/cities in Java based on the people's welfare indicators in 2022. The measured welfare is material well-being. Variables used in this study are the percentage of the poor population, GDP per capita at current prices, average length of schooling, expected length of schooling, percentage of per capita expenditure on food, open unemployment rate, population, population density, and life expectancy. There are two approaches used in grouping regencies/cities along with their variables. The first approach is to group regencies/cities and their variables simultaneously using plaid model biclustering method. The second approach is to group regencies/cities using the Ward clustering method and then followed by the biplot method. The aim of this study is to compare the results of these two approaches, namely the biclustering results and the cluster-biplot results on data from 119 regencies/cities in Java in 2022 based on people's welfare indicators. Based on the results of this study, the number of groups from each approach is 2, with group 1 being more prosperous than group 2. Judging from the standard deviation values, the plaid model biclustering result groups have lower standard deviation values compared to the cluster-biplot result groups. Therefore, in general the first approach produces better groups as they are more homogeneous compared to the second approach."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Eryawan Deise Ulul

Implementasi hierarchical clustering menggunakan k-mer sparse matrix untuk menganalisis kekerabatan virus mers-cov = Implementation of hierarchical clustering using k-mer sparse matrix to analyze mers-cov genetic relationship / Eryawan Deise Ulul

"[ABSTRAK

Hierarchical clustering merupakan metode yang efektif dalam membentuk pohon

filogenetik dengan mengetahui matriks jarak antar barisan DNA. Salah satu cara

untuk membuat matriks jarak yaitu dengan cara menggunakan metode -mer.

Kelebihan dari metode -mer yaitu lebih efisien dalam segi waktu. Langkahlangkah

dalam membuat matriks jarak dengan metode -mer dimulai dengan

membentuk -mer sparse matrix dari masing barisan DNA. Selanjutnya,

membentuk -mer singular value vector. Pada tahap akhir yaitu menghitung jarak

antar vektor. Pada tesis ini akan dilakukan analisis terhadap barisan DNA MERSCoV

dengan mengimplementasi Hierarchical clustering menggunakan -mers

sparse matrix sehingga dapat diketahui leluhur dari masing-masing barisan DNA

MERS-CoV.

ABSTRACT

Hierarchical clustering is an effective method in creating phylogenetic by

knowing the distance matrix between DNA sequence. One of methods to make the

distance matrix use -mer method. -mer is more efficient than others. The steps

to make distance matrix using -mer method starts from creating -mer sparse

matrix. Then, creating -mer singular value vector. The last steps is counting

distance each vectors. This thesis will analyze the sequence of DNA MERS-CoV

by implementing Hierarchical clustering using k-mers sparse matrix so that will

be known the ancestor of each sequence of DNA MERS-CoV., Hierarchical clustering is an effective method in creating phylogenetic by

knowing the distance matrix between DNA sequence. One of methods to make the

distance matrix use -mer method. -mer is more efficient than others. The steps

to make distance matrix using -mer method starts from creating -mer sparse

matrix. Then, creating -mer singular value vector. The last steps is counting

distance each vectors. This thesis will analyze the sequence of DNA MERS-CoV

by implementing Hierarchical clustering using k-mers sparse matrix so that will

be known the ancestor of each sequence of DNA MERS-CoV.]"

2015

T44260

UI - Tesis Membership Universitas Indonesia Library

Anderberg, Michael R.

Cluster Analysis for Applications/Michael R. Anderberg

New York: Academic Press, 1973

519.53 AND c

Buku Teks SO Universitas Indonesia Library

Naufal Ikhwanuddin

Analisis Klaster Kinerja Teknis Teknologi Selular 4G: Studi Kasus Tiga Provinsi = Cluster Analysis of 4G Cellular Technology Technical Performance: Case Study of Three Provinces

"Dalam penelitian ini kami menganalisis lebih dari 1 juta sampel data crowdsource pelanggan jaringan seluler 4G dari tiga provinsi di Indonesia; Daerah Keistimewaan Indonesia (DKI) Jakarta, Jawa Barat, dan Banten. Rata-rata download throughput, rata-rata upload throughput, dan rata-rata kekuatan sinyal kemudian digunakan untuk segmentasi kabupaten ke dalam tiga kategori; Gold, Silver, dan Bronze, masing-masing dengan kelas tertinggi hingga terendah. Lima operator jaringan seluler Indonesia dievaluasi dalam lima minggu yang diambil dari peristiwa penting dari tahun 2020 hingga 2021. Metodologi yang digunakan adalah dengan menggunakan algoritma k-means pada perangkat lunak Tableau 2021.1. Hasil penelitian menunjukkan bahwa semua operator memiliki kinerja yang berimbang, sedangkan wilayah pinggiran kota memiliki kinerja yang lebih rendah dibandingkan dengan wilayah pusat perkotaan, dan pekan hari raya seperti Natal dan Idul Fitri menunjukkan kinerja yang lebih buruk dibandingkan minggu-minggu lainnya. Kebijakan strategis kemudian dapat diambil oleh operator untuk meningkatkan layanan di daerah dengan kualitas rendah seperti Kabupaten Majalengka, Cianjur, dan Kuningan, dan kebijakan marketing khusus untuk kota dengan segmen yang menonjol seperti Kota Bandung dan Kabupaten Banjar.

In this study we analyze more than 1 million crowdsource data samples of 4G Mobile Network subscribers from three provinces in Indonesia; Special Region of Indonesia (Daerah Keistimewaan Indonesia, DKI), West Java, and Banten. Average download throughput, average upload throughput, and average signal strength are then used to clustering the districts into three categories; Gold, Silver, and Bronze, with the highest to lowest class respectively. Five Indonesian mobile network operators evaluated in five weeks each with significant events from 2020 to 2021. The methodology is based on the k-means algorithm as applied in the software of Tableau 2021.1. The result shows that all operators have comparable performance, while the sub-urban area has lower performance compared to the urban district area, and a festive week like Christmas and Ied Muslim days shows worse performance than other weeks. Strategic policies can be taken by operators to improve services in low-quality areas such as Majalengka, Cianjur, and Kuningan Regencies, and special marketing policies for regions with prominent conditions such as Bandung City and Banjar Regency. "

Depok: Fakultas Teknik Universitas Indonesia, 2021

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Asita Darma Irawati

Analisis Pengelompokan Universitas Terbaik Dunia Berdasarkan Komponen Biaya Pendidikan Program Doktor (S3) menggunakan metode K-Means = Clustering Analysis of The World’s Top Universities Based on Tuition Fee Components for Doctoral Program (S3) using K-Means method

"Pertimbangan finansial menjadi salah satu penentu utama apakah seseorang akan melanjutkan

pendidikan ke tingkat yang lebih tinggi atau tidak, sehingga diperlukan beasiswa untuk

membantu mahasiswa dalam menempuh pendidikan tinggi, terutama hingga tingkat doktor.

Besar biaya yang dikeluarkan oleh lembaga penyedia beasiswa kepada penerima beasiswa

tentunya diharapkan sepadan dengan kualitas ilmu yang diperoleh. Oleh karena itu, penelitian

ini bertujuan untuk membahas analisis pengelompokan universitas terbaik dunia berdasarkan

komponen biaya pendidikan program doktor dengan metode K-Means. Universitas pada

penelitian ini diambil dari QS World University Rangkings (WUR) 2022. Analisis eksploratori

data dilakukan dan diperoleh bahwa terdapat 83 dari 472 universitas di dunia memberi bantuan

dana penuh untuk studi program doktor. Nilai Silhouette sebesar 0,72 menunjukkan bahwa tiga

merupakan jumlah kelompok yang optimal bagi data. Sehingga terbentuk kelompok A

sebanyak 328 universitas, kelompok B sebanyak 108 universitas, dan kelompok C sebanyak

36 universitas. Kelompok A terdiri dari universitas dengan SPP dan biaya hidup per bulan

relatif rendah, kelompok B sedang, dan kelompok C tinggi. Untuk biaya transportasi udara,

kelompok B cenderung rendah, sedangkan kelompok A dan C relatif serupa dan lebih mahal

dari kelompok B. Sementara untuk biaya visa, kelompok A cenderung lebih murah, sedangkan

kelompok B dan C cenderung serupa dengan biaya lebih mahal. Berdasarkan analisis ini,

penulis memberikan saran universitas yang bisa dipertimbangkan lembaga pemberi beasiswa

sebagai perguruan tinggi tujuan.

Financial concern has been one of the main reasons why an individual wants to pursue higher
education. That is why scholarship is needed to help students earn an education, especially until
doctoral degree. The amount of money spent by institution who give scholarship must be
equivalent with the quality of knowledge an awardee got. This study aims to do clustering
analysis of the world’s top universities based on tuition fee components for doctoral program
using K-Means method. The object of this study are universities based on QS World University
Rankings 2022. Exploratory data analysis is done and found that there are 83 out of 472
universities in the world who give fully funded program for doctoral study. Based on the
silhouette value of 0.72, three is the best number of clusters for the data. Group A, B, C consists
of 328, 108, and 36 universities in respective order. Group A consists of universities who have
chepear tuition fee and monthly living cost compared to Group B dan C. However, Group B
consists of universities who have cheaper transportation, meanwhile Group A and C are quiet
similar. For visa, Group A is cheaper compared to Group B and C which are similar. Based on
the results, recommendations are given to the institution who provide scholarship about the
objective university for doctoral study."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Iing Fitria

Penerapan agglomerative clustering untuk menganalisa kekerabatan bakteri pada air liur = Application of agglomerative clustering for analyzing phylogenetically on bacterium of saliva / Iing Fitria

"ABSTRAK

Menganalisis populasi bakteri Streptococcus adalah penting karena spesies ini dapat menyebabkan karies gigi, periodental (plak), halitosis (bau mulut) dan masih banyak lagi masalah yang dapat ditimbulkan. Dalam tesis ini akan dibahas hubungan kekerabatan antara bakteri Streptococcus pada air liur dengan menggunakan pohon filogenetik dari metode agglomerative clustering. Dimulai dengan adanya barisan DNA bakteri Streptococcus yang diambil dari pangkalan data gen (GenBank) yang akan disejajarkan, proses pensejajaran yang dilakukan menggunakan Algoritma Needleman-Wuncsh untuk pensejajaran global. Hasil pensejajaran tersebut berupa skor optimal yang merupakan jarak antara dua barisan DNA bakteri Streptococcus. Skor-skor optimal dikumpulkan dalam satu matriks kemudian membuat pohon filogenetik dengan metode agglomerative clustering yang terdiri atas teknik single linkage,complete linkage dan average linkage. Pada setiap teknik, banyaknya kelompok sama dengan banyaknya individu spesies. Spesies yang paling mirip dikelompokkan sampai akhirnya kemiripan berkurang maka terbentuk kelompok tunggal. Hasil dari pengelompokan berupa pohon filogenetik dan cabang-cabang yang bergabung merupakan tingkatan jarak yang terbentuk. Semakin kecil jarak, maka semakin besar kemiripan spesies serta mengimplementasikannya dengan menggunakan perangkat lunak berbasis open source (Oktave).

ABSTRACT

Analyzing population of Streptococcus bacteria is important because these spesies can cause dental caries, periodontal, halitosis (bad breath) and more problems.This paper will discuss the phylogenetically relation between the bacterium Streptococcus in saliva using a phylogenetic tree of agglomerative clustering methods. Starting with the bacterium Streptococcus DNA sequence obtained from the GenBank to be aligned, the alignment is performed using the Neddleman-Wuncsh Algorithm for global alignment. The alignment results in the optimal score or the distance between DNA sequence of the bacterium Streptococcus one another. Optimal scores collected in a single matrix. Agglomerative clustering technique consisting of single linkage, complete linkage and average linkage. In this technique the number of group sequal to the number of individual species. The most similar species is grouped until the similarity decreases and then formed a single group. Results of grouping is a phylogenetic tree and branches that join an established level of distance, that the smaller distance the more the similarity of the larger spesies implementation is using the Octave, an open source program."

2013

T35950

UI - Tesis Membership Universitas Indonesia Library

Athiyyah Fadillah Eriri

Pengelompokan Nagari-nagari di Kabupaten Agam Sumatera Barat Berdasarkan Indikator Pembangunan Keluarga Tahun 2015 dengan Metode K-Means dan Fuzzy C-Means = Clustering of Nagari in Agam District of West Sumatera Province Based on Family Development Indicator 2015 Using K-Means and Fuzzy C-Means Methods

"Pengelompokan atau clustering adalah pengelompokan objek-objek yang dilakukan atas dasar kesamaan atau jarak (perbedaan) di mana tidak ada asumsi yang dibuat mengenai banyaknya cluster atau struktur cluster. Salah satu metode yang banyak digunakan dalam penyelesaian masalah clustering adalah algoritme K-Means. Pada algoritme ini, suatu objek yang telah menjadi anggota cluster tertentu, tidak bisa menjadi anggota cluster yang lainnya. Metode ini dikenal sebagai hard clustering. Pendekatan lain dalam melakukan pengelompokan didasarkan pada teori himpunan fuzzy yang dikenal dengan pengelompokan fuzzy. Teori himpunan fuzzy memiliki nilai kekaburan antara salah atau benar. Jadi, dalam melakukan pengelompokan, setiap objek memiliki peluang menjadi anggota pada setiap cluster. Salah satu metode pengelompokan fuzzy adalah Fuzzy C-Means (FCM). Pada tugas akhir ini, metode K-Means dan FCM digunakan untuk mengelompokkan nagari-nagari di Kabupaten Agam. Nagari-nagari di Kabupaten Agam dikelompokan berdasarkan indikator pembangunan keluarga yang berasal dari Laporan Pendataan Keluarga tahun 2015 yang bersumber dari BKKBN (Badan Kependudukan dan Keluarga Berencana Nasional). Pada penelitian ini diperoleh empat cluster hasil dari indeks xie and beni. Jumlah anggota setiap cluster hasil dari algoritme K-Means adalah 32, 28, 11 dan 11. Sedangkan jumlah anggota setiap cluster hasil dari algoritme Fuzzy C-Means adalah 31, 18, 21, dan 12. Perbedaan jumlah anggota cluster yang dihasilkan algoritme K-Means dan Fuzzy C-Means adalah 14.29%. Karena rasio simpangan baku dalam dan antar cluster pada algoritme K-Means memberikan nilai yang lebih kecil dibandingkan algoritme Fuzzy C-Means maka algoritme K-Means memberikan hasil yang lebih baik dari pada algoritme Fuzzy C-Means dalam pengelompokan nagari-nagari di Kabupaten Agam.

Grouping or clustering is a method to group objects that are carried out on the basis of similarity or distance (difference) where no assumptions are made regarding the number of clusters or cluster structures. One method that is widely used in solving clustering problems is the K-Means algorithm. In this algorithm, if an object has become a member of a particular cluster, then it cannot become a member of another cluster. This method is known as hard clustering. Another approach to grouping is based on fuzzy set theory, known as fuzzy grouping. Fuzzy set theory has a blurring value between right or wrong. So, in grouping process, each object has the opportunity to become a member in each cluster. One of the fuzzy grouping methods is Fuzzy C-Means. In this study, the two methods, K-Means and Fuzzy C-Means, are used to group nagari-nagari in Agam District. Nagari is equivalent to villages in other provinces in Indonesia. The nagari grouping in Kabupaten Agam is based on family development indicators derived from the 2015 Family Data Collection Report sourced from BKKBN (Badan Kependudukan dan Keluarga Berencana Nasional). In this study four clusters were obtained based on xie and beni’s index. The numbers of members of each cluster as the result of the K-Means algorithm are 32, 28, 11 and 11. While the numbers of members of each cluster as the result of the Fuzzy C-Means algorithm are 31, 18, 21, and 12. The different cluster members produced by the K-Means and Fuzzy algorithms C-Means is 14.29%. Because the standard deviation ratio within and between clusters in the K-Means algorithm gives a smaller value than the Fuzzy C-Means algorithm, the K-Means algorithm gives better results than the Fuzzy C-Means algorithm on the nagari grouping in Agam District."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian