Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 190067 dokumen yang sesuai dengan query
cover
Bayu Permata Negara
"Analisis kelompok adalah metode multivariat yang bertujuan mengelompokkan pengamatan berdasarkan karakteristiknya. Salah satu metode analisis pengelompokan adalah metode cluster ensembel dengan pengelompokan dilakukan dengan satu metode berulang kali hingga diperoleh hasil yang lebih baik dibandingkan jika dilakukan satu kali. Penelitian ini mencoba menggunakan Cluster Ensemble Based Mixed Data Clustering (CEBMDC), yaitu metode pengelompokan yang biasa dilakukan untuk data dengan variabel campuran yaitu numerik dan kategorik. Tahap awal dalam metode ini yaitu membagi data awal menjadi data dengan hanya variabel-variabel numerik dan data dengan hanya variabel-variabel kategorik. Data yang telah dipisahkan berdasarkan jenis variabelnya kemudian dikelompokan menggunakan metode yang sesuai secara simultan. Hasil pengelompokan ini menjadi data baru dengan dua variabel kategorik yaitu hasil pengelompokan dengan variabel numerik dan hasil pengelompokan dengan variabel kategorik. Data baru dengan dua variabel kategorik ini kemudian dilakukan proses pengelompokan. Metode pengelompokan untuk data dengan variabel numerik adalah metode Hierarchical Agglomerative Clustering. Metode clustering untuk data kategorik adalah ROCK (RObust Clustering using linKs) dan K-medoids/PAM (Partition Around Medoids). Penelitian ini membandingkan hasil pengelompokan ROCK dan K-medoids. Pengelompokan dilakukan pada data mengenai sarana dan prasarana sekolah yang diambil dari 5.094 SMP yang ada di Jawa barat. Metode pengelompokan dengan kinerja terbaik pada penelitian ini adalah Ensemble K-medoids berdasarkan rasio antara simpangan baku di dalam kelompok (¬SW) dan simpangan baku antar kelompok (SB) terkecil. Penelitian ini menghasilkan 3 kelompok yang mencerminkan kondisi sekolah-sekolah pada jenjang SMP di Jawa Barat.
Clustering analysis is a multivariate method that aims to classify observations based on their characteristics. One method of clustering analysis is the ensemble clustering method in which the grouping is done using a method repeatedly until better results are obtained than if it is done once. This study uses the Cluster Ensemble Based Mixed Data Clustering (CEBMDC), which is a grouping method that commonly used for data with numerical and categorical variables. The first step in this method is to divide the initial data into two parts, that is data with only numerical variables and data with categorical variables. After data has been separated based on the types of variables, and then clustering using the appropriate method is conducted simultaneously. The results of these two clustering method become a new data with two categorical variables, namely the results of clustering with numeric variables and the results of clustering with categorical variables. The new data with two categorical variables are then carried out the clustering process. The clustering method for data with numerical variables is the Hierarchical Agglomerative Clustering method. Clustering methods for categorical data are ROCK (RObust Clustering using linKs) and K-medoids / PAM (Partition Around Medoids). This study compares the results of ROCK and K-medoids clustering. The study was conducted on data of school facilities and infrastructure taken from 5094 junior high schools in West Java. The best performance grouping method in this study is the Ensemble K-medoids based on the ratio between the standard deviation in the group (SW) and the smallest standard inter-group (SB) deviation. This study produced 3 groups that reflect the condition junior high schools in West Java."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Khalishah Ayuningtyas
"Banyak jenis burung perkotaan yang merupakan urban eksploiter, sementara beberapa jenis lain termasuk urban adapters yang merupakan spesies burung yang dapat beradaptasi di daerah urban, serta sedikit yang merupakan urban avoider. Karakter ekologis dari ketiga kelompok burung tersebut dapat digunakan untuk menggambarkan kondisi kualitas habitat. Tujuan dari penelitian ini adalah untuk menentukan faktor toleransi burung terhadap habitat dalam tingkat urbanisasi yang berbeda, dan juga menentukan apakah burung dapat dijadikan sebagai indikator habitat di daerah Perumahan Wisma Cakra dan Padang Golf Pangkalan Jati. Penelitian ini menggunakan metode point count degan jarak antar titik 150-200 meter di wilayah Perumahan Wisma Cakra dan Golf Pangkalan Jati. Untuk menentukan faktor toleransi akan menggunakan atribut menurut McKinney (2000) dan untuk menentukan bahwa burung dapat dijadikan indikator habitat akan dianalisis menggunakan hierarchical cluster. Hasil dari penelitian terdapat tiga kategori Enconter Rates (tidak umum, sering, dan umum) dan dua tingkat toleransi (urban adapters dan urban exploiters). Pada indikator habitat mendapatkan hasil yang tidak sesuai dikarenakan kedua lokasi memiliki kemiripan pada karakteristik vegetasi habitat dan variabel urban.

Many types of urban birds are urban exploiters, while several other types include urban adapters, which are bird species that can adapt to urban areas, and a few are urban avoiders. The ecological character of the three groups of birds can be used to describe the quality of habitat conditions. The purpose of this study was to determine the tolerance factor of birds to habitats in different levels of urbanization, and to determine whether birds can be used as habitat indicators in the Wisma Cakra and Padang Golf Pangkalan Jati areas. This study uses the point count method with a distance between points of 150-200 meters in the Wisma Cakra Housing and Golf Pangkalan Jati areas. To determine the tolerance factor, McKinney (2000) attributes will be used and to determine data that birds can be used as habitat indicators, will be analyzed using hierarchical clusters. The results of this study are three categories of Encounter Rates (uncommon, frequent, and common) and two tolerance levels (urban adapters and urban exploiters). In the indicator, the habitat results are not suitable because both locations have habitat characteristics and urban variables."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Naufal Luthfi
"Peradaban yang terus berkembang telah membuat konflik antara manusia dan lingkungan menjadi semakin parah sehingga menyebabkan banyak terjadinya bencana alam. Banyak negara yang terdampak oleh bencana alam dan salah satunya adalah Indonesia. Kondisi dan letak geografis Indonesia menyebabkan banyak terjadinya bencana alam di Indonesia. Oleh karena itu, perlu dilakukan pengelompokan daerah bencana alam di Indonesia untuk mengetahui daerah yang paling sering terkena bencana alam. Metode clustering dapat digunakan untuk mengetahui daerah tersebut. Dari studi literatur yang telah dilakukan, belum ada penelitian yang menggunakan metode hierarchical clustering dan fuzzy c-means untuk clustering daerah bencana alam di Indonesia. Maka dari itu, tujuan dari penelitian ini adalah mengklasifikasi daerah yang sering mengalami bencana alam di Indonesia dengan menggunakan metode hierarchical clustering dan fuzzy c-means. Data yang digunakan dalam penelitian ini adalah data bencana alam di Indonesia dari tahun 2019 hingga 2023. Variabel yang digunakan adalah jumlah kebakaran hutan dan lahan, banjir, cuaca ekstrem, gelombang pasang, tanah longsor, kekeringan, erupsi gunung api, dan gempa bumi di setiap kabupaten yang terdampak bencana alam. Hasil clustering menunjukan terdapat 66 daerah yang sering mengalami banjir, 45 daerah yang sering mengalami kebakaran hutan dan gelombang pasang, dan 30 daerah yang sering mengalami cuaca ekstrem, tanah longsor, kekeringan, erupsi gunung api, dan gempa bumi.

The continuously evolving civilization has exacerbated the conflict between humans and the environment, leading to increasingly severe natural disasters. Many countries are affected by natural disasters, and one of them is Indonesia. Indonesia's conditions and geographic location contribute to the occurrence of numerous natural disasters in the country. Therefore, it is necessary to classify areas prone to natural disasters in Indonesia to identify the most frequently affected regions. Clustering methods can be used to determine these areas. From the literature review conducted, there has been no research utilizing hierarchical clustering and fuzzy c-means methods for clustering areas prone to natural disasters in Indonesia. Therefore, the aim of this research is to classify areas that frequently experience natural disasters in Indonesia using hierarchical clustering and fuzzy c-means methods. The data used in this research is the natural disaster data in Indonesia from 2019 to 2023. The variables used include the number of forest and land fires, floods, extreme weather events, tidal waves, landslides, droughts, volcanic eruptions, and earthquakes in each disaster-affected district. The clustering results indicate that there are 66 regions frequently experiencing floods, 45 regions often experiencing forest fires and tidal waves, and 30 regions commonly facing extreme weather, landslides, droughts, volcanic eruptions, and earthquakes."
Jakarta: Fakultas Teknik Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Banjarnahor, Evander
"Berdasarkan data WHO pada pertengahan Juli 2021 lebih dari 185,2 juta orang di seluruh dunia terinfeksi virus corona atau Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2). Virus ini menyerang penapasan manusia yang dapat mengakibatkan infeksi paru-paru pada manusia dan bahkan dapat menyebabkan kematian. Tercatat bahwa lebih dari 4 juta orang di seluruh dunia meninggal akibat terinfeksi virus corona. Di Indonesia sendiri pada pertengahan Juli 2021 tercatat lebih dari 2,4 juta orang ternfeksi virus corona dan lebih dari 65,4 ribu orang meninggal akibat terinfeksi virus corona. Berdasarkan data tersebut, perlu dilakukan analisis kekerabatan virus SARS-CoV-2 untuk mengurangi penyebaran dan memberikan batasan sosial dari negara satu dengan negara lainnya. Identifikasi kekerabatan dari virus covid-19 dan penyebarannya dapat dilakukan dengan cara pembentukan pohon filogenetik dan clustering. Pada penelitian ini pohon filogenetik akan dibangun berdasarkan metode Hierarchical Clustering dengan menggunakan metode Multiple Encoding Vector dan K-Mer berdasarkan translasi DNA kodon menjadi asam amino. Jarak Euclidean akan digunakan untuk menentukan matriks jarak. Penelitian ini selanjutnya menggunakan metode K- Means Clustering untuk melihat penyebarannya, dimana nilai k ditentukan dari jumlah centroid yang dihasilkan dari metode Hierarchical Clustering. Penelitian ini mengambil sampel barisan DNA SARS-CoV-2 dari beberapa negara yang tertular. Dari hasil simulasi, nenek moyang SARS-CoV-2 berasal dari China. Hasil analisis juga menunjukkan bahwa leluhur covid-19 yang paling dekat dengan Indonesia berasal dari India, Australia dan Spanyol. Selain itu dari hasil simulasi dihasilkan bahwa barisan DNA SARS-CoV-2 terdiri dari 9 cluster dan cluster keenam adalah kelompok yang memiliki anggota paling banyak. Hasil analisis juga menunjukkan bahwa metode ini sangat opitimal dalam pengelompokan data dengan nilai 97.4%.

Based on WHO data in middle of July 2021, Coronavirus or Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) is infecting more than 185.2 million people worldwide. The virus attacks human breathing, which can cause lung infections and can even cause death. More than 4 million people worldwide have died due to being infected with the coronavirus. In Indonesia alone, in mid-July 2021, there were more than 2.4 million people infected with the corona virus and more than 65.4 thousand people died from being infected with the corona virus. Based on those covid-19 survivor data, it is necessary to carry out a kinship analysis of the coronavirus to reduce its spreading. Identification of the kinship of the covid- 19 virus and its spread can be done by forming a phylogenetic tree and clustering. This study uses the Multiple Encoding Vector method and K-mer based on translation DNA codon to amino acid in analyzing sequences and Euclidean Distance to determine the distance matrix. This research will then use the Hierarchical Clustering method to determine the number of initial centroids and cluster, which will be used later by the K-Means Clustering method kinship in SARS-CoV-2 DNA sequence. This study took samples of DNA sequences of SARS-CoV-2 from several infected countries. From the simulation results, the ancestors of SARS-CoV-2 came from China. The results of the analysis also show that the closest ancestors of covid-19 to Indonesia came from India, Australia and Spain. In addition, the ancestors of SARS-CoV-2 came from China. The SARS- CoV-2 DNA sequence is also consisted of 9 clusters, and the sixth cluster is the group that has the most members. The results also show that this method is very optimal in a grouping of data with a value of 97.4%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Maria Angelica Christabel
"Poverty is still a serious challenge for all countries in the world, including Indonesia. The Central Statistics Agency (BPS) noted that 25.9 million people were still living in poverty as of March 2023. The challenge of inefficient and poorly targeted budget distribution in some programs hampers poverty alleviation efforts. In line with that, the objective of this study is to categorize provinces based on poverty indicators to provide an understanding of the characteristics and patterns of poverty in various Indonesian provinces. This research uses the Link-based Cluster Ensemble method, which combines various solutions from different clustering methods, namely K-medoids and Agglomerative Hierarchical Clustering to obtain more optimal results. The final result of ensemble clustering is obtained through a similarity matrix by applying the Connected-Triple-based Similarity (CTS) algorithm, which utilizes pairwise similarity relationships between all data points. The data for this study comes from BPS regarding Poverty Data in Indonesia in 2023, with the selection of variables that can reveal the characteristics of poverty in Indonesia, such as aspects of education, employment, expenditure, and household facilities. The results showed that the Link-based Cluster Ensemble method, which was formed through a three-member ensemble from the results of K-Medoids and Agglomerative Hierarchical Clustering, successfully outperformed the single clustering method based on cluster evaluation values using Silhouette, Davies-Bouldin, and Dunn Index. The results grouped the provinces into four clusters: Cluster 1 reveals poverty conditions with low education participation and sanitation facilities, Cluster 2 with low education and high expenditure, Cluster 3 with high unemployment, and Cluster 4 with low clean water facilities.

Kemiskinan masih menjadi tantangan serius bagi seluruh negara di dunia, termasuk Indonesia. Badan Pusat Statistik (BPS) mencatat sebanyak 25,9 juta masyarakat masih hidup dalam kemiskinan per Maret 2023. Tantangan dalam penyaluran anggaran yang tidak efisien dan tepat sasaran pada beberapa program menghambat upaya pengentasan kemiskinan. Sejalan dengan hal itu, tujuan dari penelitian ini adalah mengelompokkan provinsi berdasarkan indikator kemiskinan untuk memberikan pemahaman tentang karakteristik dan pola kemiskinan di berbagai provinsi Indonesia. Penelitian ini menggunakan metode Link-based Cluster Ensemble, yang menggabungkan berbagai solusi dari metode pengelompokan berbeda, yaitu K-medoids dan Agglomerative Hierarchical Clustering untuk mendapatkan hasil yang lebih optimal. Hasil akhir pengelompokan ensemble diperoleh melalui similarity matrix dengan menerapkan algoritma Connected-Triple-based Similarity (CTS), yang memanfaatkan hubungan kesamaan berpasangan antara seluruh titik data. Data penelitian ini berasal dari BPS mengenai Data Kemiskinan di Indonesia tahun 2023, dengan pemilihan variabel yang dapat mengungkapkan karakteristik kemiskinan di Indonesia, seperti aspek pendidikan, ketenagakerjaan, pengeluaran konsumsi, dan fasilitas rumah tangga. Hasil penelitian menunjukkan bahwa metode Link-based Cluster Ensemble, yang dibentuk melalui tiga anggota ensemble dari hasil pengelompokan K-Medoids dan Agglomerative Hierarchical Clustering, berhasil mengungguli metode pengelompokan tunggal berdasarkan nilai evaluasi cluster menggunakan Silhouette, Davies-Bouldin, dan Dunn Index. Hasil penelitian mengelompokkan provinsi ke dalam empat cluster: Cluster 1 mengungkapkan kondisi kemiskinan dengan aspek partisipasi pendidikan dan fasilitas sanitasi yang rendah, Cluster 2 dengan kondisi aspek pendidikan yang rendah dan pengeluaran konsumsi yang tinggi, Cluster 3 dengan kondisi pengangguran yang tinggi, dan Cluster 4 dengan kondisi fasilitas air bersih yang rendah."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Alfia Choirun Nisa
"Keberhasilan pembangunan suatu negara dapat dilihat dari kondisi kesejahteraan rakyatnya. Peningkatan kesejahteraan rakyat menjadi sasaran utama dalam kegiatan pembangunan yang dilaksanakan oleh pemerintah. Agar pembangunan yang dilakukan efektif dan tepat sasaran, perlu dilakukan pengelompokan untuk mengetahui karakteristik wilayah. Penelitian ini membahas mengenai pengelompokan kabupaten/kota di Pulau Jawa berdasarkan indikator kesejahteraan rakyat tahun 2022. Kesejahteraan yang diukur merupakan kesejahteraan materi. Variabel yang digunakan dalam penelitian ini adalah persentase penduduk miskin, PDRB per kapita atas dasar harga berlaku, rata-rata lama sekolah, harapan lama sekolah, persentase pengeluaran per kapita untuk makanan, tingkat pengangguran terbuka, jumlah penduduk, kepadatan penduduk, dan angka harapan hidup. Terdapat dua pendekatan yang digunakan dalam mengelompokkan kabupaten/kota beserta variabel-variabelnya. Pendekatan pertama adalah mengelompokkan kabupaten/kota dan variabel-variabelnya secara simultan dengan menggunakan metode biclustering plaid model. Pendekatan kedua adalah mengelompokkan kabupaten/kota menggunakan clustering metode Ward dan dilanjutkan dengan metode biplot. Tujuan penelitian ini adalah membandingkan hasil kedua pendekatan tersebut, yaitu hasil biclustering dan hasil cluster-biplot pada data 119 kabupaten/kota di Pulau Jawa pada tahun 2022 berdasarkan indikator kesejahteraan rakyat. Berdasarkan hasil penelitian, didapatkan jumlah kelompok dari kedua pendekatan tersebut adalah sebanyak 2 dengan kelompok 1 merupakan wilayah yang lebih sejahtera daripada kelompok 2. Ditinjau dari nilai standar deviasinya, kelompok hasil biclustering plaid model memiliki nilai standar deviasi yang lebih kecil dibanding kelompok hasil cluster-biplot. Dengan demikian, secara umum pendekatan pertama menghasilkan kelompok yang lebih baik karena lebih homogen dibandingkan dengan pendekatan kedua.

The success of a country's development can be known from the well-being of its people. Improving the welfare of the population is the main goal in the development activities carried out by government. To ensure that development is effective and targeted, grouping is needed to understand the characteristics of the region. This study discusses the grouping of regencies/cities in Java based on the people's welfare indicators in 2022. The measured welfare is material well-being. Variables used in this study are the percentage of the poor population, GDP per capita at current prices, average length of schooling, expected length of schooling, percentage of per capita expenditure on food, open unemployment rate, population, population density, and life expectancy. There are two approaches used in grouping regencies/cities along with their variables. The first approach is to group regencies/cities and their variables simultaneously using plaid model biclustering method. The second approach is to group regencies/cities using the Ward clustering method and then followed by the biplot method. The aim of this study is to compare the results of these two approaches, namely the biclustering results and the cluster-biplot results on data from 119 regencies/cities in Java in 2022 based on people's welfare indicators. Based on the results of this study, the number of groups from each approach is 2, with group 1 being more prosperous than group 2. Judging from the standard deviation values, the plaid model biclustering result groups have lower standard deviation values compared to the cluster-biplot result groups. Therefore, in general the first approach produces better groups as they are more homogeneous compared to the second approach."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Eryawan Deise Ulul
"[ABSTRAK
Hierarchical clustering merupakan metode yang efektif dalam membentuk pohon
filogenetik dengan mengetahui matriks jarak antar barisan DNA. Salah satu cara
untuk membuat matriks jarak yaitu dengan cara menggunakan metode -mer.
Kelebihan dari metode -mer yaitu lebih efisien dalam segi waktu. Langkahlangkah
dalam membuat matriks jarak dengan metode -mer dimulai dengan
membentuk -mer sparse matrix dari masing barisan DNA. Selanjutnya,
membentuk -mer singular value vector. Pada tahap akhir yaitu menghitung jarak
antar vektor. Pada tesis ini akan dilakukan analisis terhadap barisan DNA MERSCoV
dengan mengimplementasi Hierarchical clustering menggunakan -mers
sparse matrix sehingga dapat diketahui leluhur dari masing-masing barisan DNA
MERS-CoV.

ABSTRACT
Hierarchical clustering is an effective method in creating phylogenetic by
knowing the distance matrix between DNA sequence. One of methods to make the
distance matrix use -mer method. -mer is more efficient than others. The steps
to make distance matrix using -mer method starts from creating -mer sparse
matrix. Then, creating -mer singular value vector. The last steps is counting
distance each vectors. This thesis will analyze the sequence of DNA MERS-CoV
by implementing Hierarchical clustering using k-mers sparse matrix so that will
be known the ancestor of each sequence of DNA MERS-CoV., Hierarchical clustering is an effective method in creating phylogenetic by
knowing the distance matrix between DNA sequence. One of methods to make the
distance matrix use -mer method. -mer is more efficient than others. The steps
to make distance matrix using -mer method starts from creating -mer sparse
matrix. Then, creating -mer singular value vector. The last steps is counting
distance each vectors. This thesis will analyze the sequence of DNA MERS-CoV
by implementing Hierarchical clustering using k-mers sparse matrix so that will
be known the ancestor of each sequence of DNA MERS-CoV.]"
2015
T44260
UI - Tesis Membership  Universitas Indonesia Library
cover
Anderberg, Michael R.
New York: Academic Press, 1973
519.53 AND c
Buku Teks SO  Universitas Indonesia Library
cover
Asita Darma Irawati
"Pertimbangan finansial menjadi salah satu penentu utama apakah seseorang akan melanjutkan
pendidikan ke tingkat yang lebih tinggi atau tidak, sehingga diperlukan beasiswa untuk
membantu mahasiswa dalam menempuh pendidikan tinggi, terutama hingga tingkat doktor.
Besar biaya yang dikeluarkan oleh lembaga penyedia beasiswa kepada penerima beasiswa
tentunya diharapkan sepadan dengan kualitas ilmu yang diperoleh. Oleh karena itu, penelitian
ini bertujuan untuk membahas analisis pengelompokan universitas terbaik dunia berdasarkan
komponen biaya pendidikan program doktor dengan metode K-Means. Universitas pada
penelitian ini diambil dari QS World University Rangkings (WUR) 2022. Analisis eksploratori
data dilakukan dan diperoleh bahwa terdapat 83 dari 472 universitas di dunia memberi bantuan
dana penuh untuk studi program doktor. Nilai Silhouette sebesar 0,72 menunjukkan bahwa tiga
merupakan jumlah kelompok yang optimal bagi data. Sehingga terbentuk kelompok A
sebanyak 328 universitas, kelompok B sebanyak 108 universitas, dan kelompok C sebanyak
36 universitas. Kelompok A terdiri dari universitas dengan SPP dan biaya hidup per bulan
relatif rendah, kelompok B sedang, dan kelompok C tinggi. Untuk biaya transportasi udara,
kelompok B cenderung rendah, sedangkan kelompok A dan C relatif serupa dan lebih mahal
dari kelompok B. Sementara untuk biaya visa, kelompok A cenderung lebih murah, sedangkan
kelompok B dan C cenderung serupa dengan biaya lebih mahal. Berdasarkan analisis ini,
penulis memberikan saran universitas yang bisa dipertimbangkan lembaga pemberi beasiswa
sebagai perguruan tinggi tujuan.

Financial concern has been one of the main reasons why an individual wants to pursue higher
education. That is why scholarship is needed to help students earn an education, especially until
doctoral degree. The amount of money spent by institution who give scholarship must be
equivalent with the quality of knowledge an awardee got. This study aims to do clustering
analysis of the world’s top universities based on tuition fee components for doctoral program
using K-Means method. The object of this study are universities based on QS World University
Rankings 2022. Exploratory data analysis is done and found that there are 83 out of 472
universities in the world who give fully funded program for doctoral study. Based on the
silhouette value of 0.72, three is the best number of clusters for the data. Group A, B, C consists
of 328, 108, and 36 universities in respective order. Group A consists of universities who have
chepear tuition fee and monthly living cost compared to Group B dan C. However, Group B
consists of universities who have cheaper transportation, meanwhile Group A and C are quiet
similar. For visa, Group A is cheaper compared to Group B and C which are similar. Based on
the results, recommendations are given to the institution who provide scholarship about the
objective university for doctoral study.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Iing Fitria
"ABSTRAK
Menganalisis populasi bakteri Streptococcus adalah penting karena spesies ini dapat menyebabkan karies gigi, periodental (plak), halitosis (bau mulut) dan masih banyak lagi masalah yang dapat ditimbulkan. Dalam tesis ini akan dibahas hubungan kekerabatan antara bakteri Streptococcus pada air liur dengan menggunakan pohon filogenetik dari metode agglomerative clustering. Dimulai dengan adanya barisan DNA bakteri Streptococcus yang diambil dari pangkalan data gen (GenBank) yang akan disejajarkan, proses pensejajaran yang dilakukan menggunakan Algoritma Needleman-Wuncsh untuk pensejajaran global. Hasil pensejajaran tersebut berupa skor optimal yang merupakan jarak antara dua barisan DNA bakteri Streptococcus. Skor-skor optimal dikumpulkan dalam satu matriks kemudian membuat pohon filogenetik dengan metode agglomerative clustering yang terdiri atas teknik single linkage,complete linkage dan average linkage. Pada setiap teknik, banyaknya kelompok sama dengan banyaknya individu spesies. Spesies yang paling mirip dikelompokkan sampai akhirnya kemiripan berkurang maka terbentuk kelompok tunggal. Hasil dari pengelompokan berupa pohon filogenetik dan cabang-cabang yang bergabung merupakan tingkatan jarak yang terbentuk. Semakin kecil jarak, maka semakin besar kemiripan spesies serta mengimplementasikannya dengan menggunakan perangkat lunak berbasis open source (Oktave).

ABSTRACT
Analyzing population of Streptococcus bacteria is important because these spesies can cause dental caries, periodontal, halitosis (bad breath) and more problems.This paper will discuss the phylogenetically relation between the bacterium Streptococcus in saliva using a phylogenetic tree of agglomerative clustering methods. Starting with the bacterium Streptococcus DNA sequence obtained from the GenBank to be aligned, the alignment is performed using the Neddleman-Wuncsh Algorithm for global alignment. The alignment results in the optimal score or the distance between DNA sequence of the bacterium Streptococcus one another. Optimal scores collected in a single matrix. Agglomerative clustering technique consisting of single linkage, complete linkage and average linkage. In this technique the number of group sequal to the number of individual species. The most similar species is grouped until the similarity decreases and then formed a single group. Results of grouping is a phylogenetic tree and branches that join an established level of distance, that the smaller distance the more the similarity of the larger spesies implementation is using the Octave, an open source program."
2013
T35950
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>