Ditemukan 4 dokumen yang sesuai dengan query
Hamimah
Abstrak :
ABSTRAK
Pendeteksian topik adalah proses menemukan topik yang digunakan untuk menganalisis kata dalam suatu kumpulan dokumen. Pendeteksian topik secara manual pada data yang besar sangatlah sulit. Sehingga dibutuhkan metode otomatis yang dikenal dengan pemodelan topik. Salah satu metode pemodelan topik yang sering digunakan adalah metode clustering. Clustering adalah teknik pengelompokan data yang tujuannya adalah untuk mengelompokkan data tersebut sehingga anggota dari grup yang sama lebih homogen atau lebih mirip satu sama lain daripada dengan anggota kelompok yang berbeda. Metode clustering yang sering digunakan adalah Fuzzy C-Means FCM. FCM ini bekerja dengan baik pada data dengan dimensi yang rendah, namun gagal pada data dengan dimensi yang tinggi Winkler, dkk, 2011. Pada data dimensi yang tinggi, algoritma FCM konvergen ke satu pusat centre of gravity, sehingga topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Salah satu pendekatan untuk mengatasi kegagalan metode FCM pada data dimensi tinggi adalah memproyeksikan data pada ruang Eigen dengan dimensi lebih rendah dan metode tersebut dikenal juga dengan Eigenspace-based Fuzzy C-Means EFCM. Pada algoritma EFCM umumnya dilakukan inisialisasi random yang menyebabkan topik yang dihasilkan tidak sama setiap kali algoritma tersebut dijalankan. Untuk mengatasi masalah tersebut dibutuhkan inisialisasi yang tidak random. Untuk itu, pada skripsi ini akan digunakan metode Nonnegative Double Singular Value Decomposition NNDSVD. Algoritma NNDSVD terdiri dari dua proses metode SVD. Hasil dari simulasi ini menunjukkan bahwa nilai akurasi dengan inisialisasi NNDSVD menunjukkan adanya peningkatan lebih baik dibandingkan dengan inisialisasi random dan NNDSVD dapat menyelesaikan masalah EFCM dengan data berdimensi tinggi.
ABSTRACT
Detection Topic is a process of finding the topics used to analyze words in a document that a collection of textual data. Detecting topic for a very large document hardly done manually. The topic detection problem is automatically known as topic modeling. One method of topic modeling that are commonly used is clustering method. Clustering is a data grouping technique which purposes is to group the data so members of each group are more homogeneous and more like each other than with different group members. This research will use fuzzy clustering method with Fuzzy C Means algorithm FCM . FCM works well on low data dimensions but it fails on high data dimensions. One approach to overcome the failure of FCM methods in high dimensional spaces is to project data on lower dimensional Eigen spaces and the method is also known as EigenSpace based FCM EFCM. In the EFCM, the algorithm did random initialization that causes the resulting topic was not same every time the algorithm runs. To solve this problem, it requires to implement non random initialization. In this study, we used the initial Nonnegative Double Singular Value Decomposition NNDSVD. The basis of the NNSVD algorithm is a two processes SVD method. This simulation results show that NNDSVD initialization method can solves the eigenspace based Fuzzy C Means problems in high dimension data and NNDSVD based initialization gives same resulted topic every executed algorithm.
2018
S-Pdf
UI - Skripsi Membership Universitas Indonesia Library
Oke Diliardi
Abstrak :
ABSTRAK
KAL (Kendaraan Angkutan Listrik) merupakan salah satu jenis alternatif
kendaraan penumpang yang sedang dikembangkan oleh Unit Pengabdian Pada
Masyarakat (Unit P2M) Jurusan Mesin FT UI. Oleh karena kendaraan ini menggunakan
motor Iistrik sebagai penggeraknya, maka kendaraan ini tidak menghasilkan emisi gas
buang dan bisa dibilang lebih bersahabat dengan lingkungan.
Untuk dapat mengatasi mobilitas penduduk yang semakin meningkat, maka
kendaraan ini harus dapat diproduksi sesuai dengan persyaratan yang telah ditentukan.
Agar KAL sesuai dengan persyaratan yang telah ditentukan dan juga untuk memudahkan dalam penentuan desain KAL dan penentuan proses manufacturing, maka dilakukan perencanaan awal untuk produksi KAL Perencanaan awal ini menentukan altematif dalam proses pendesainan dan proses manufacturing.
1997
S36602
UI - Skripsi Membership Universitas Indonesia Library
Deo Lahara
Abstrak :
ABSTRAK
Pendeteksian topik topic detection adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut. Pendeteksian topik pada dokumen yang sangat besar sulit dilakukan secara manual sehingga dibutuhkan metode otomatis. Masalah pendeteksian topik secara otomatis dikenal dengan istilah topic detection and tracking TDT . Suatu metode alternatif TDT untuk masalah pendeteksian topik adalah fuzzy C-means FCM. Pada metode fuzzy C-means, umumnya pusat cluster ditentukan secara acak atau inisialisasi random. Namun, terkait dengan masalah dimensi yang tinggi pada inisialisasi random akan menyebabkan algoritma konvergen ke satu pusat. Sehingga, topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Untuk itu, diperlukan metode untuk membuat inisialisasi yang dapat mengatasi masalah tersebut. Salah satu metode inisialisasi yang akan dikembangkan pada penelitian ini adalah metode Singular Value Decomposition SVD . Hasil simulasi menunjukan bahwa metode inisialisasi dapat mengatasi permasalahan fuzzy C-means pada data dimensi yang tinggi sehingga topik-topik yang dihasilkan tidak sama terhadap satu sama lain.
ABSTRAK
Topic detection is a process used to analyze words in a collection of textual data to determine the topics of the collection. Detecting topics on a very large document is hardly done manually so that automatic methods are needed. Automatic method to detect topics in textual documents is known as Topic Detection and Tracking TDT . An alternative method of TDT for topic detection problems is fuzzy C means FCM . In the FCM method, generally the cluster center is random initialization. However, related to the problem of high dimensional random initialization causes the algorithm to converge to one center, it means that all generated topics are similar. For that, a method is needed to create an initialization that resolves the problem. One of the initialization methods that will be developed in this research is Singular Value Decomposition SVD method. The simulation results show that the SVD initialization method can overcome the fuzzy C means problem in the high dimension data so that the resulting topics are not equal to each other.
2017
S69378
UI - Skripsi Membership Universitas Indonesia Library
Ichsani Mursidah
Abstrak :
ABSTRAK
Pendeteksian topik adalah proses untuk menemukan topik atau pokok pembahasan utama dalam suatu kumpulan dokumen. Untuk data yang besar, pendeteksian topik dengan manual sulit atau bahkan tidak mungkin dilakukan. Sehingga, dibutuhkan metode otomatis yang dikenal dengan istilah Topic Detection and Tracking (TDT). Pada penelitian ini metode TDT yang digunakan untuk masalah pendeteksian topik adalah fuzzy C-means (FCM). FCM bekerja cukup baik pada dimensi data yang rendah, tetapi gagal pada dimensi data yang tinggi. Pada metode fuzzy c-means umumnya dilakukan inisialisasi random yang menyebabkan data konvergen ke satu pusat (centre of gravity) sehingga topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Untuk mengatasi masalah tersebut dibutuhkan inisialisasi yang tidak random, yaitu dengan menggunakan inisialisasi berbasis singular value decomposition (SVD). Hasil akurasi dari metode ini menunjukkan adanya peningkatan lebih baik dibandingkan dengan metode FCM dengan inisialisasi random. Dengan nilai akurasi terbaik untuk FA Cup adalah 0,923, untuk US Elections adalah 0,661 dan untuk Super Tuesday adalah 0,727.
ABSTRACT
Topic detection is the process of finding the main topic or topic in a document. For large data, manual topic detection is difficult or even impossible. Thus, it takes an automatic method known as Topic Detection and Tracking (TDT). In this research the TDT method used for topic detection problem is fuzzy C-means (FCM). FCM works reasonably well on low data dimensions, but fails on high data dimensions. In the method of fuzzy c-means is generally done random initialization that causes data convergent to one center (center of gravity) so that the topics generated from one another are equal. To solve this problem requires non-random initialization, ie by using a singular value decomposition (SVD) based initialization. The accuracy of this method shows a better improvement compared to the FCM method with random initialization. With the best accuracy value for the FA Cup is 0.923, for US Elections is 0.661 and for Super Tuesday is 0.727.
2017
T48587
UI - Tesis Membership Universitas Indonesia Library