Hasil Pencarian

Ditemukan 35 dokumen yang sesuai dengan query

Ralind Remarla

Computer aided diagnose (CAD) radiografi paru pasien dewasa dengan metode segmentasi fuzzy C-Means clustering = Computer aided diagnose radiography lung adult patient with segmentation fuzzy C-Means clustering method / Ralind Remarla

"Dalam penelitian Computer Aided Diagnose (CAD) Radiografi Paru pasien dewasa dengan metode Fuzzy C Means (FCM), telah dilakukan dalam keadaan tahap awal. Penelitian ini bertujuan untuk mengetahui apakah metode clustering FCM dapat digunakan untuk membuat perangkat penolong untuk melihat abnormalitas pada paru-paru dari 200 data citra Radiografi sinar-X. Pembuatan perangkat dilakukan dengan menggunakan GUI pada Matlab.

Perancangan di bagi menjadi dua metode menggunakan metode FCM otomatis dan manual kemudian untuk mengetahui perbedaan nilai piksel digunakan metode ambang rata-rata. Kedua metode ini berdasarkan intensitas derajat keabuan 0-256. Metode FCM digunakan untuk melihat visualisasi abnormalitas secara cepat dan mengetahui garis besar posisi yang abnormal. Kemudian diteruskan dengan segmen kotak dari metode ambang rata-rata untuk mengetahui perbedaan nilai pixel citra abnormalitas dan yang normal.

Hasil penelitian nenujukkan bahwa, Kinerja Metode FCM Akurasi 57,7%, sensitifitas 50,0%, spesifikasi 89,5% , Overal Error 42,3% dan Presisi 95,1%. Sedangkan metode Segmen per kotak Akurasi 56,7%, sensitifitas 51,7%, spesifikasi 88,5% , Overal Error 43,3% dan Presisi 96,7%. berdasarkan penelitian dapat disimpulkan bahwa Metode FCM dalam paru hanya bisa menunjukkan visual secara cepat dan garis besar namun tidak memberikan akurasi yang cukup memuaskan, hal ini di karenakan data input yang random tidak dapat dijadikan patokan untuk ukuran keberhasilan.

In the study Computer Aided Diagnose (CAD) Lung Radiography adult patients with Fuzzy C Means (FCM), has been carried out in a state of infancy. This study aims to determine whether the FCM clustering method can be used to make the device helper to see abnormalities in the lungs of 200 image data of X-ray radiography. Making the device is done by using the GUI in Matlab.
The design is divided into two methods using automated and manual methods FCM then to determine differences in pixel value threshold method is used on average. Both methods are based on the intensity of gray 0-256 degrees. FCM method is used for visualizing abnormalities quickly see and know the outline of an abnormal position. Then forwarded to the segment boxes of the average threshold method to determine differences in pixel values abnormalities and normal image.
That research results, performance FCM method Accuracy 57.7%, 50.0% sensitivity, 89.5% specification, Overal Error 42.3% and 95.1% precision. While the method of segment per box Accuracy 56.7%, 51.7% sensitivity, 88.5% specification, Overal Error 43.3% and 96.7% precision. based study concluded that the method of FCM in the lungs can only show rapid visual and outline but does not give a satisfactory accuracy, it is in because random input data can not be used as a benchmark to measure success."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2015

T43858

UI - Tesis Membership Universitas Indonesia Library

Hamimah

Pemodelan topik menggunakan eigenspace-based fuzzy C-means dengan metode inisialisasi non-negative double singular value decomposition (NNDSVD) = Topic modeling using eigenspace-based fuzzy C-means with non-negative double singular value decomposition (NNDSVD) initialization method

"ABSTRAK

Pendeteksian topik adalah proses menemukan topik yang digunakan untuk menganalisis kata dalam suatu kumpulan dokumen. Pendeteksian topik secara manual pada data yang besar sangatlah sulit. Sehingga dibutuhkan metode otomatis yang dikenal dengan pemodelan topik. Salah satu metode pemodelan topik yang sering digunakan adalah metode clustering. Clustering adalah teknik pengelompokan data yang tujuannya adalah untuk mengelompokkan data tersebut sehingga anggota dari grup yang sama lebih homogen atau lebih mirip satu sama lain daripada dengan anggota kelompok yang berbeda. Metode clustering yang sering digunakan adalah Fuzzy C-Means FCM. FCM ini bekerja dengan baik pada data dengan dimensi yang rendah, namun gagal pada data dengan dimensi yang tinggi Winkler, dkk, 2011. Pada data dimensi yang tinggi, algoritma FCM konvergen ke satu pusat centre of gravity, sehingga topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Salah satu pendekatan untuk mengatasi kegagalan metode FCM pada data dimensi tinggi adalah memproyeksikan data pada ruang Eigen dengan dimensi lebih rendah dan metode tersebut dikenal juga dengan Eigenspace-based Fuzzy C-Means EFCM. Pada algoritma EFCM umumnya dilakukan inisialisasi random yang menyebabkan topik yang dihasilkan tidak sama setiap kali algoritma tersebut dijalankan. Untuk mengatasi masalah tersebut dibutuhkan inisialisasi yang tidak random. Untuk itu, pada skripsi ini akan digunakan metode Nonnegative Double Singular Value Decomposition NNDSVD. Algoritma NNDSVD terdiri dari dua proses metode SVD. Hasil dari simulasi ini menunjukkan bahwa nilai akurasi dengan inisialisasi NNDSVD menunjukkan adanya peningkatan lebih baik dibandingkan dengan inisialisasi random dan NNDSVD dapat menyelesaikan masalah EFCM dengan data berdimensi tinggi.

ABSTRACT

Detection Topic is a process of finding the topics used to analyze words in a document that a collection of textual data. Detecting topic for a very large document hardly done manually. The topic detection problem is automatically known as topic modeling. One method of topic modeling that are commonly used is clustering method. Clustering is a data grouping technique which purposes is to group the data so members of each group are more homogeneous and more like each other than with different group members. This research will use fuzzy clustering method with Fuzzy C Means algorithm FCM . FCM works well on low data dimensions but it fails on high data dimensions. One approach to overcome the failure of FCM methods in high dimensional spaces is to project data on lower dimensional Eigen spaces and the method is also known as EigenSpace based FCM EFCM. In the EFCM, the algorithm did random initialization that causes the resulting topic was not same every time the algorithm runs. To solve this problem, it requires to implement non random initialization. In this study, we used the initial Nonnegative Double Singular Value Decomposition NNDSVD. The basis of the NNSVD algorithm is a two processes SVD method. This simulation results show that NNDSVD initialization method can solves the eigenspace based Fuzzy C Means problems in high dimension data and NNDSVD based initialization gives same resulted topic every executed algorithm. "

2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Raden Trivan Sutrisman

Analisis metode inisialisasi pada algortima eigenspace based fuzzy c-means untuk pendeteksian topik berita online Indonesia = Analysis of initialization methods on eigenspace based fuzzy c-means algorithm for Indonesian online news topic detection

"ABSTRAK

Perkembangan berita online di Indonesia saat ini sudah semakin meningkat sehingga kebutuhan dalam melakukan analisis data berita sangat diperlukan untuk mendapatkan intisari informasi yang akurat dan cepat. Topik merupakan komponen dasar yang sering digunakan untuk menganalisis data dalam bentuk teks seperti berita. Dengan menggunakan pemodelan topik, dapat dilakukan pendeteksian topik secara otomatis pada koleksi dokumen berita yang sangat besar dan sulit dilakukan secara manual oleh manusia. Salah satu pemodelan topik yang dapat digunakan adalah metode clustering menggunakan Eigenspace Based Fuzzy C-Means (EFCM). Metode EFCM pada umumnya menggunakan inisialisasi random. Pada penelitian ini akan diimplementasikan metode inisialisasi menggunakan Non-Negative Double Singular Value Decomposition (NNDSVD) dan Fuzzy C-Means++ (FCM++) sebagai alternatif metode inisialisasi pada algoritma EFCM. Hasil simulasi menggunakan inisialisasi NNDSVD dan FCM++ menunjukkan nilai akurasi yang lebih baik dalam hal tingkat interpretabilitas topik daripada metode random.

ABSTRACT
The rapid increasing of online news in Indonesia creates the need for news analysis to obtain information as fast as possible. Topics are basic components that are often used to analyze data in the textual forms, such as the news article. By using topic modeling, topics can be detected automatically on large news documents which are difficult to perform manually. One of the topic modeling that can be used is the clustering-based method, i.e., Eigenspace-based Fuzzy C-Means (EFCM). The common initialization method of EFCM is random. In this research, Non-Negative Double Singular Value Decomposition (NNDSVD) and Fuzzy C-Means++ (FCM++) will be used as initialization methods of EFCM. The simulations show that the NNDSVD and FCM++ methods gives better accuracies in term of interpretability score than the random method."

Depok: Universitas Indonesia, 2018

T50041

UI - Tesis Membership Universitas Indonesia Library

Robertus Agung Pradana

Fuzzy C-Means Clustering dengan Reduksi Dimensi Convolutional Autoencoder pada Pendeteksian Topik = Fuzzy C-Means Clustering with Convolutional Autoencoder Dimensional Reduction for Topic Detection

"Pendeteksian topik adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut, bagaimana hubungan topik-topik tersebut satu sama lainnya, dan bagaimana mereka berubah dari waktu ke waktu. Metod (FCM) merupakan metode yang sering digunakan pada masalah pendeteksian topik. FCM dapat mengelompokkan dataset ke beberapa kelompok dengan baik pada dataset dengan dimensi yang rendah, namun gagal pada dataset yang berdimensi tinggi. Untuk mengatasi permasalahan tersebut, dilakukan reduksi dimensi pada dataset sebelum dilakukan pendeteksian topik. Pada penelitian ini digunakan Convolutional Autoencoder dalam reduksi dimensi pada dataset. Oleh sebab itu, metode yang digunakan pada penelitian ini dalam pendeteksian topik adalah metode Convolutional-based Fuzzy C-Means (CFCM). Data yang digunakan dalam penelitian ini data coherence pada topik antara metode CFCM dengan satu convolutional layer (CFCM-1CL) dan metode CFCM dengan tiga convolutional layer (CFCM-3CL). Hasil penelitian ini menunjukkan bahwa nilai coherence dari metode CFCM-1CL lebih tinggi dibandingkan metode CFCM-3CL.

Topic detection is a process used to analyze words in a collection of textual data to determine the topics in the collection, how they relate to each other, and how they change from time to time. The Fuzzy C-Means (FCM) method is a clustering method that is often used in topic detection problems. Fuzzy C-Means can group dataset into multiple clusters on low-dimensional dataset, but fails on high-dimensional dataset. To overcome this problem, dimension reduction is carried out on the dataset before topic detection is carried out. In this study, Convolutional Autoencoder (CAE) is used in the reduction of dimensions in the dataset. Therefore, the method used in this research in topics detection is the Convolutional-based Fuzzy C-Means (CFCM) method. The data used in this study tweets national news account data on social media Twitter. CFCM method are divided into two stages, namely reducing the dataset dimension to a lower dimension using CAE and then clustering the dataset by using FCM to obtain topics. After the topics are obtained, an evaluation is done by calculating the value of coherence on the topics obtained. The study was conducted by comparing the coherence value on the topic between the CFCM method with one convolutional layer (CFCM-1CL) and the CFCM method with three convolutional layers (CFCM-3CL). The results of this study indicate that the coherence value of the CFCM-1CL method is higher than the CFCM-3CL method"

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Natasha Rosaline

Fuzzy C-Means Clustering dengan Reduksi Dimensi Deep Autoencoders untuk Pendeteksian Topik pada Data Tekstual Twitter = Fuzzy C-Means Clustering with Deep Autoencoders Dimensional Reduction for Topic Detection on Textual Data from Twitter

"Pendeteksian topik merupakan suatu teknik untuk memperoleh informasi dengan cara mengekstrak topik-topik dari kumpulan data yang sangat besar. Salah satu metode yang digunakan untuk pendeteksian topik adalah metode clustering, yaitu Fuzzy C-Means (FCM). Namun, kinerja dari FCM menjadi buruk saat harus melakukan clustering pada data yang berdimensi tinggi. Kelemahan dari FCM tersebut dapat ditanggulangi dengan cara melakukan reduksi dimensi. Pada penelitian ini, digunakan suatu metode deep learning, yaitu Deep Autoencoders (DAE), untuk mereduksi dimensi dari kumpulan data. Metode FCM clustering dengan reduksi dimensi DAE ini disebut Deep Autoencoders-Based Fuzzy C-Means (DFCM). Metode DFCM dibagi menjadi dua tahapan, yakni mereduksi dimensi kumpulan data yang berdimensi tinggi menggunakan Deep Autoencoders, dan melakukan FCM clustering pada data yang telah direduksi. Hasil dari metode DFCM adalah topik-topik. Topik-topik tersebut dievaluasi menggunakan nilai coherence. Pada penelitian ini, dibangun dua metode DFCM, yaitu FCM berbasis DAE dengan satu lapisan tersembunyi (DFCM-single hidden layer) dan FCM berbasis DAE dengan multi lapisan tersembunyi (DFCM-multi hidden layers). Hasil dari kedua metode ini menunjukkan bahwa topik-topik pada DFCM-single hidden layer memiliki nilai coherence lebih tinggi dari topik-topik pada DFCM-multi hidden layers.
Topic detection is a technique to find out information by extracting topics from big data. One method used for topic detection is the clustering method, namely Fuzzy C-Means (FCM). However, the performance of FCM becomes worse when clustering on highdimensional data. That weakness is resolved by dimensional reduction. In this research, deep learning method is used to reduce the dimensions of the data set, namely Deep Autoencoders (DAE). FCM clustering method with DAE dimensional reduction is called Deep Autoencoders-Based Fuzzy C-Means (DFCM). DFCM is divided into two parts. First, reducing the dimensions of high-dimensional data collection using Deep Autoencoders. Second, performing FCM clustering on the reduced data. Results of DFCM are topics. These topics are evaluated using the value of coherence. In this research, two DFCM methods were built, namely DAE with one hidden layer based FCM (DFCM-single hidden layer) and DAE with multi-hidden layers based FCM (DFCMmulti hidden layers). The results of these two methods show that the topics in DFCMsingle hidden layer have a higher coherence value than the topics in DFCM-multi hidden layers."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Ahmad Afif Fauzan

Aplikasi modified fuzzy c-means untuk glioma otak dan infeksi otak = Application of modified fuzzy c-means for brain glioma and brain infection / Ahmad Afif Fauzan

"Magnetic Resonance spectroscopy (MRS) adalah suatu modalitas dari pemeriksaan MRI. MRS digunakan untuk mengetahui kandungan metabolit pada pasien penderita glioma otak Astrocytoma atau infeksi otak. Hasil analisa pada MRS tidak bisa dijadikan sebuah acuan untuk menentukan seorang pasien menderita glioma otak atau infeksi otak. Dalam tugas akhir ini akan dibahas proses klasifikasi terhadap data MRS untuk menentukan penyakit yang diderita oleh seorang pasien. Tujuan akhir dari penulisan akhir ini adalah mentukan keakuratan klasifikasi data MRS dengan menggunakan metode Modified Fuzzy C-Means. Modified Fuzzy C-Means adalah pengembangan dari metode Fuzzy C-Means. Sama seperti metode Fuzzy C-Means, metode Modified Fuzzy C-Means merupakan metode yang mengalokasikan data dengan menggunakan fungsi membership (keanggotaan). Fungsi membership ini digunakan untuk menentukan seberapa besar kemungkinan sebuah data dapat menjadi anggota kedalam sebuah cluster, dengan menggunakan pembobotan pada setiap pusat cluster-nya. Keakuratan klasifikasi sangat bergantung kepada parameter-parameter yang terdapat pada algoritma Modified Fuzzy C-Means.

Magnetic resonance spectroscopy (MRS) is a modality of MRI examination. MRS is used to determine the content of metabolites in patients with Astrocytoma brain glioma or brain infection. An analysis of the MRS could not be used as a reference for determining a patient suffering from a brain glioma or brain infection. In this project will discuss the process of classification of the data MRS to determine the diseases suffered by a patient. The ultimate purpose of writing this final project MRS data classification accuracy by using Modified Fuzzy C-Means. Modified Fuzzy C-Means is the development of methods of Fuzzy C-Means. Just like Fuzzy C-Means method, the method Modified Fuzzy C-Means is a method that allocates data by using the membership function (membership). This membership function is used to determine how likely a member of the data can be added to a cluster, using a weighting on each of its cluster center. Classification accuracy is very dependent on the parameters contained in the Modified algorithm Fuzzy C-Means."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2015

S59393

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Arvan Aulia Rachman

Klasifikasi data kanker menggunakan fuzzy c-means dengan pemilihan fitur menggunakan fisher's ratio = Classification of cancer data using fuzzy c means with feature selection using fisher's ratio

"Klasifikasi data kanker dilakukan untuk menemukan terapi yang tepat yaitu memaksimalkan efektivitas dan meminimalkan toksisitas. Pada umumnya, data kanker terdiri dari banyak fitur. Namun, tidak semua fitur tersebut informatif. Oleh karena itu, fitur-fitur tersebut akan diseleksi menggunakan metode Fisher's Ratio untuk memilih fitur-fitur yang paling informatif. Fitur-fitur terbaik akan dibentuk data baru. Data, sebelum dan setelah dilakukan pemilihan fitur, diklasifikasi menggunakan metode Fuzzy C-Means. Akurasi dari proses klasifikasinya akan dibandingkan. Hasilnya, tanpa melakukan pemilihan fitur, diperoleh rata-rata akurasi sebesar 82.92%. Setelah dilakukan pemilihan fitur, diperoleh akurasi terbaik dengan menggunakan 150 fitur dengan rata-rata akurasi sebesar 89.68%.

Classification of cancer data is done to find the right therapy that maximize efficacy and minimize toxicity. In general, cancer data consists of many features. However, not all of these features are informative. Therefore, these features will be selected using Fisher's Ratio to choose features that are most informative. The best features to be formed new data. Data, before and after feature selection, are classified using Fuzzy C-Means. The accuracy of the classification process will be compared. As a result, without doing feature selection, the accuracy is 82.92%. After doing feature selection, the best accuracy is obtained by using 150 features with the accuracy is 89.68%."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016

S64140

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Triyana Muliawati

Fuzzy c-means pada ruang eigen untuk pendeteksian topik = Fuzzy c means in eigen space for topic detection / Triyana Muliawati

"ABSTRAK
Seiring perkembangan teknologi informasi dan komunikasi, pemenuhan
kebutuhan informasi dapat diperoleh melalui media sosial, seperti Twitter.
Banyaknya pengguna internet telah memicu aliran data yang sangat besar dan
cepat, sehingga membuat analisis secara manual sulit atau bahkan tidak mungkin
dilakukan. Metode otomatis diperlukan untuk menganalisis data tersebut yang
salah satunya yaitu dengan topic detection and tracking (TDT). Suatu metode
alternatif laindari TDT untuk masalah pendeteksian topik selain latent dirichlet
allocation (LDA) adalah fuzzy clustering dengan menggunakan algoritma fuzzy Cmeans
(FCM). FCM pada pendeteksian topik dapat memenuhi asumsi bahwa
suatu dokumen pada Twitter dapat terdiri dari beberapa topik. FCM bekerja cukup
baik di dimensi data yang rendah, akan tetapi gagal dalam dimensi data yang
tinggi. Oleh karena itu, dibutuhkan suatu metode untuk mereduksi dimensi ruang
eigen yang tinggi ke dimensi yang lebih rendah. Salah satu metodenya adalah
singular value decomposition (SVD) dengan menggunakan truncated SVD. Pada
penelitian ini, dilakukan prosestruncated SVD kemudian FCM yang
dinamakanfuzzy C-means pada ruang eigen (Eigen FCM). Hasil akurasi dari
metode ini menunjukkan peningkatan lebih baik dibandingkan FCM dan LDA
pada pendeteksian topik.
ABSTRACT
As the information and communication technology developed, the fulfillment of
information can be obtained through social media, like Twitter. The enormous
number of internet users has triggeredfast and large data flow, thus making the
analysis manually is difficult, or even impossible. The automated methods for
data analysis is needed now, one of which is the topic detection and tracking
(TDT). An alternative method other than TDT fortopic detection problemother
than latent dirichlet allocation (LDA) is a fuzzy clustering algorithms using fuzzy
C-means (FCM). FCM in topic detection meet the assumption that a document on
Twitter can consists of several topics. FCM works pretty well in low-dimensional
data, but fail in high-dimensional data. Therefore, we need a method to reduce the
dimension of the high-dimensional eigenspaceinto lower dimension. One method
to do that is the singular value decomposition (SVD) using truncated SVD. This
papercarried out the truncated SVD process then FCM called fuzzy C-means on
the eigenspace (Eigen FCM). The results of the accuracy of this method shows an
increase is better than FCM and LDA on topic detection."

2016

T45625

UI - Tesis Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Diyah Septi Andryani

Implementasi hybrid clustering menggunakan algoritma fuzzy c-means dan algoritma divisive untuk menganalisis kekerabatan dna human papillomavirus penyebab kanker serviks = The implementation of hybrid clustering using fuzzy c means algorithm and divisive algorithm for analysing dna human papillomavirus cause of cervical cancer

"Clustering bertujuan untuk mengklasifikasikan pola yang berbeda ke dalam kelompok yang disebut cluster. Analisis gen dengan menggunakan metode clustering dinilai lebih akurat dibandingkan analisis nukleotida menggunakan penyejajaran DNA. Hybrid clustering pada tesis ini mengkombinasikan algoritma fuzzy c-means dan algoritma divisive mampu meningkatkan keakurasian jika dibandingkan pendekatan pengelompokan partitional tradisional. Algoritma divisive akan dijalankan pada step kedua setelah hasil clustering yang diperoleh dari pengelompokan partisi fuzzy c-means.
Penentuan jumlah cluster terbaik ditentukan dari nilai Indeks Davies Bauldin yang paling minimum. Sebanyak 1252 barisan DNA HPV Human papillomavirus diperoleh dari Genbank NCBI dengan proses melakukan ekstraksi ciri DNA, selanjutnya dilakukan normalisasi. Proses ekstraksi ciri, normalisasi, dan penerapan algoritma partisi fuzzy c-means dan divisive dalam metode hybrid clustering menggunakan bantuan program open source.
Pada hasil hybrid clustering level awal diperoleh jumlah cluster optimum sebanyak 3 cluster dengan nilai Indeks Davies Bouldin paling minimum adalah 0.9715919. Pada level ke-2 clustering didapatkan cluster ke-1 terbagi atas 9 sub cluster dengan nilai IDB minimum adalah 0.8909797. Cluster ke-2 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.7650508. Cluster 3 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.9112528. Nilai IDB pada level kedua selalu lebih kecil dibanding nilai IDB pada level 1. Hal ini mengindikasikan bahwa hybrid clustering memberikan hasil yang lebih baik terhadap hasil clustering.

Clustering aims to classify the different patterns into groups called clusters. Analysis gene by using clustering method is considered more accurate than analysis of nucleotide using DNA alignment. In this thesis, hybrid clustering algorithm which combines fuzzy c means and algorithm divisive will be improve accuracy when compared to partitional clustering. Divisive algorithms will applied on second level after clustering partition using fuzzy c means.
To find the best number of clusters is determined using the minimum value of Davies Bouldin Index DBI of the cluster results. The data is 1252 sequences of HPV DNA sequences obtained from Gen Bank Database in the National Centre for Biotechnology Information NCBI at http www.ncbi.nlm.nih.gov in FASTA format. The data is converted into numerical form through feature extraction using n mers frequency.
The results on first level hybrid clustering obtained the optimum cluster divided into three clusters with the value of the minimum Davies Bouldin Index is 0.9715919. Morever, DBI values after implementing the second step of clustering are always producing smaller IDB values compare to the results of using first step clustering only. This condition indicates that the hybrid approach in this study produce better performance of the cluster results, in term its DBI values."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017

T47171

UI - Tesis Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

Deo Lahara

Analisis kinerja inisialisasi fuzzy c-means berbasis singular value decomposition untuk masalah pendeteksian topik = Perfomance analysis of singular value decomposition based initalization method in fuzzy c-means for topic detection

"ABSTRAK
Pendeteksian topik topic detection adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut. Pendeteksian topik pada dokumen yang sangat besar sulit dilakukan secara manual sehingga dibutuhkan metode otomatis. Masalah pendeteksian topik secara otomatis dikenal dengan istilah topic detection and tracking TDT . Suatu metode alternatif TDT untuk masalah pendeteksian topik adalah fuzzy C-means FCM. Pada metode fuzzy C-means, umumnya pusat cluster ditentukan secara acak atau inisialisasi random. Namun, terkait dengan masalah dimensi yang tinggi pada inisialisasi random akan menyebabkan algoritma konvergen ke satu pusat. Sehingga, topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Untuk itu, diperlukan metode untuk membuat inisialisasi yang dapat mengatasi masalah tersebut. Salah satu metode inisialisasi yang akan dikembangkan pada penelitian ini adalah metode Singular Value Decomposition SVD . Hasil simulasi menunjukan bahwa metode inisialisasi dapat mengatasi permasalahan fuzzy C-means pada data dimensi yang tinggi sehingga topik-topik yang dihasilkan tidak sama terhadap satu sama lain.
ABSTRAK
Topic detection is a process used to analyze words in a collection of textual data to determine the topics of the collection. Detecting topics on a very large document is hardly done manually so that automatic methods are needed. Automatic method to detect topics in textual documents is known as Topic Detection and Tracking TDT . An alternative method of TDT for topic detection problems is fuzzy C means FCM . In the FCM method, generally the cluster center is random initialization. However, related to the problem of high dimensional random initialization causes the algorithm to converge to one center, it means that all generated topics are similar. For that, a method is needed to create an initialization that resolves the problem. One of the initialization methods that will be developed in this research is Singular Value Decomposition SVD method. The simulation results show that the SVD initialization method can overcome the fuzzy C means problem in the high dimension data so that the resulting topics are not equal to each other. "

2017

S69378

UI - Skripsi Membership  Universitas Indonesia Library

Cari yang mirip

Tambahkan ke Favorit

Metadata PDF

Abstrak PDF

Abstrak

<< 1 2 3 4 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian