Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 11 dokumen yang sesuai dengan query
cover
Ika Dwi Novitasari
Abstrak :
ABSTRAK
Pendeteksian topik merupakan suatu proses untuk menemukan topik atau pokok pembahasan utama dalam suatu kumpulan dokumen. Pada penelitian ini, pendeteksian topik diterapkan pada media sosial, yaitu Twitter. Pendeteksian topik pada Twitter secara manual sulit dilakukan karena terlalu banyak tweets. Oleh karena itu, dibutuhkan adanya pendeteksian topik secara otomatis. Salah satu metode otomatis untuk pendeteksian topik adalah metode Separable-Nonnegative Matrix Factorization S-NMF dengan algoritma AGM. S-NMF merupakan model berbasis faktorisasi matriks yang dapat diselesaikan secara langsung dengan menggunakan asumsi bahwa setiap topik memiliki satu kata yang tidak terdapat pada topik lainnya yang disebut kata anchor. S-NMF dengan algoritma AGM terdiri dari tiga tahapan, yaitu pembentukan matriks coocurance, penentuan kata anchor, dan recover. Dalam penelitian ini dilakukan proses penentuan kata anchor berbasis Singular Value Decomposition SVD . Kemudian, hasilnya akan dibandingkan dengan penentuan kata anchor metode Convex Hull berbasis Gram-Schmidt. Penelitian memberikan hasil bahwa dengan memperhatikan semua kata sebagai kandidat kata anchor, SVD memberikan hasil yang lebih baik daripada Convex Hull. Sedangkan, jika menggunakan anchor threshold, Convex Hull masih memberikan hasil yang lebih baik dibandingkan dengan SVD.
ABSTRACT
Topic detection is a process to find main topic or main subject of discussion in a collection of documents. In this research, topic detection is applied to social media, namely Twitter. Manual detection of topics on Twitter is difficult because of too many tweets. Therefore, it is necessary to detect topics automatically. One of the automatic methods for topic detection is the Separable Nonnegative Matrix Factorization S NMF method with the AGM algorithm. S NMF is a matrix factorization based model that can be solved directly using the assumption that each topic has one word that is not present in another topic called anchor words. S NMF with AGM algorithm consists of three stages, namely the formation of coocurance matrix, finding the anchor words, and recover. In this research, the process of finding anchor words was done based on Singular Value Decomposition SVD . Then, the result was compared to anchor word finding by Convex Hull based method. The results has shown that by considering all words as anchor word candidates, SVD gave better results rather than Convex Hull. Meanwhile, when the anchor finding was done by using anchor threshold, Convex Hull still gave better result rather than SVD.
2017
T47592
UI - Tesis Membership  Universitas Indonesia Library
cover
Naufal Khairil Imami
Abstrak :
ABSTRAK
Deteksi topik adalah proses yang digunakan untuk menganalisis kata-kata dalam kumpulan data tekstual untuk ditentukan topik dalam koleksi, bagaimana mereka saling berhubungan, dan bagaimana topik ini berubah dari waktu ke waktu. Salah satu metode yang digunakan untuk mendeteksi topik adalah Nonnegative Matrix Metode Factorization (NMF) berdasarkan metode langsung atau disebut Separable Nonnegative Matriks Faktorisasi (SNMF). Dalam penelitian ini, tweet data diambil dari akun berita nasional pada aplikasi Twitter, dan topik terdeteksi menggunakan metode SNMF. Ada tiga tahap dalam metode SNMF, yaitu, menghasilkan kata co-kejadian matriks, menentukan kata jangkar, dan memulihkan untuk mendapatkan matriks topik-kata. Penentuan dari kata anchor dilakukan dengan menggunakan tiga metode berbeda, yaitu Convex Metode berbasis lambung, metode SVD berdasarkan kata maksimum pada topik, dan SVD metode berdasarkan perbedaan kata pada topik. Dalam deteksi topik, jumlah topik diproduksi bervariasi tergantung pada jumlah kata jangkar yang dihasilkan. Setelah mendapatkan topik, akurasi dihitung menggunakan unit topik word2vec. Hasil yang diperoleh menggunakan tweet data akun berita nasional menunjukkan bahwa metode SVD berdasarkan perbedaan kata pada topik memiliki evaluasi topik yang buruk dibandingkan dengan dua topik lainnya.
ABSTRACT
Topic detection is the process used to analyze words in a textual data set to determine the topics in a collection, how they are related, and how these topics change over time. One method used to change the topic is the Nonnegative Matrix The Factorization (NMF) method is based on the direct method or called Separable Nonnegative Factor Matrix (SNMF). In this study, tweet data is taken from national news accounts on the Twitter application, and topics taken using the SNMF method. There are three methods in SNMF, namely, generating co-occurrence words matrix, determine anchor words, and recover to get a topic-word matrix. Determination of the word anchor is done using three different methods, namely Convex the stomach-based method, the SVD method based on the maximum words on the topic, and SVD method based on differences in words on the topic. In topic detection, the number of topics created varies depending on the number of anchor words produced. After getting the topic, it is calculated using the word2vec topic unit. The results obtained using National news account data tweets show the SVD method based on word differences on the topic has a worse evaluation topic compared to the other two topics.
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Delano Novrilianto
Abstrak :
ABSTRAK
Pendeteksian topik merupakan proses untuk mendapatkan topik dari koleksi data tekstual. Salah satu metode otomatis untuk masalah pendeteksian topik adalah Separable Nonnegative Matrix Factorization SNMF . Terdapat tiga tahap yang dilakukan untuk menyelesaikan SNMF yakni membentuk matriks kookurensi kata-kata, menentukan kata-kata anchor, dan mencari matriks kata-topik. Metode yang umum digunakan untuk menentukan kata-kata anchor pada tahap kedua dari penyelesaian SNMF adalah dengan metode berbasis Convex Hull. Pada penelitian ini digunakan pendekatan lain untuk menentukan kata-kata anchor yaitu dengan memakai metode Singular Value Decomposition SVD . Topik-topik yang dihasilkan dengan kata-kata anchor -nya ditentukan dengan metode SVD dievaluasi tingkat intepretabilitasnya dengan memakai satuan Pointwise Mutual Information PMI dan dibandingkan dengan topik-topik dimana kata-kata anchor -nya ditentukan dengan metode berbasis Convex Hull. Waktu komputasi yang dibutuhkan untuk menentukan kata-kata anchor dengan metode SVD juga dibandingkan dengan waktu komputasi yang dibutuhkan untuk menentukan kata-kata anchor dengan metode berbasis Convex Hull.
ABSTRACT
Topic detection is the process of getting topics from a collection of textual data. One of the methods for detection problems is the Separable Nonnegative Matrix Factorization SNMF . There are three stages done to complete SNMF that is to form the word kookurensi matrix, determine the anchor words, and search for the word topic matrix. The common method used to determine the anchor words in the second stage of SNMF completion is the Convex Hull based method. In this research another approach is used to determine the anchor words, that is using Singular Value Decomposition SVD method. The resulting topics where the anchor words are determined by the SVD method will be evaluated for their interpretability level by using the Pointwise Mutual Information PMI unit and will compare with the topics where the anchor 39 s words are based on the Convex Hull based method. The computational time required to determine the anchor words by the SVD method will also be compared with the computational time required to determine the anchor words by the Convex Hull based method.
2017
S68021
UI - Skripsi Membership  Universitas Indonesia Library
cover
R. Danardono Agus Sumarsono
Abstrak :
Penelitian ini menjelaskan tentang pengaruh pemakaian aditif MEN peningkat kualitas pembakaran terhadap emisi gas buang yang dihasilkan pada pengujian mesin diesel. Hal ini dilakukan untuk mengetahui secara aktual pengaruh emisi gas buang ataupun noise, dan untuk mendapatkan perubahan total rata-rata emisi yang dikeluarkan akibat penambahan aditif tersebut. Namun demikian pengolahan data menjadi suatu hal yang penting dalam menarik kesimpulan dari pengujian tersebut.
This research performed to identify the actual impact of MEN addictive in diesel engine performance based on its gas emission and noise level, and obtain the total's mean of emissions difference caused by adding the additive. However, data processing is an important thing so that we can draw a conclusion from our research.
Depok: Universitas Indonesia, 2003
LP-Pdf
UI - Laporan Penelitian  Universitas Indonesia Library
cover
Ichsani Mursidah
Abstrak :
ABSTRAK
Pendeteksian topik adalah proses untuk menemukan topik atau pokok pembahasan utama dalam suatu kumpulan dokumen. Untuk data yang besar, pendeteksian topik dengan manual sulit atau bahkan tidak mungkin dilakukan. Sehingga, dibutuhkan metode otomatis yang dikenal dengan istilah Topic Detection and Tracking (TDT). Pada penelitian ini metode TDT yang digunakan untuk masalah pendeteksian topik adalah fuzzy C-means (FCM). FCM bekerja cukup baik pada dimensi data yang rendah, tetapi gagal pada dimensi data yang tinggi. Pada metode fuzzy c-means umumnya dilakukan inisialisasi random yang menyebabkan data konvergen ke satu pusat (centre of gravity) sehingga topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Untuk mengatasi masalah tersebut dibutuhkan inisialisasi yang tidak random, yaitu dengan menggunakan inisialisasi berbasis singular value decomposition (SVD). Hasil akurasi dari metode ini menunjukkan adanya peningkatan lebih baik dibandingkan dengan metode FCM dengan inisialisasi random. Dengan nilai akurasi terbaik untuk FA Cup adalah 0,923, untuk US Elections adalah 0,661 dan untuk Super Tuesday adalah 0,727.
ABSTRACT
Topic detection is the process of finding the main topic or topic in a document. For large data, manual topic detection is difficult or even impossible. Thus, it takes an automatic method known as Topic Detection and Tracking (TDT). In this research the TDT method used for topic detection problem is fuzzy C-means (FCM). FCM works reasonably well on low data dimensions, but fails on high data dimensions. In the method of fuzzy c-means is generally done random initialization that causes data convergent to one center (center of gravity) so that the topics generated from one another are equal. To solve this problem requires non-random initialization, ie by using a singular value decomposition (SVD) based initialization. The accuracy of this method shows a better improvement compared to the FCM method with random initialization. With the best accuracy value for the FA Cup is 0.923, for US Elections is 0.661 and for Super Tuesday is 0.727.
2017
T48587
UI - Tesis Membership  Universitas Indonesia Library
cover
Deo Lahara
Abstrak :
ABSTRAK
Pendeteksian topik topic detection adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut. Pendeteksian topik pada dokumen yang sangat besar sulit dilakukan secara manual sehingga dibutuhkan metode otomatis. Masalah pendeteksian topik secara otomatis dikenal dengan istilah topic detection and tracking TDT . Suatu metode alternatif TDT untuk masalah pendeteksian topik adalah fuzzy C-means FCM. Pada metode fuzzy C-means, umumnya pusat cluster ditentukan secara acak atau inisialisasi random. Namun, terkait dengan masalah dimensi yang tinggi pada inisialisasi random akan menyebabkan algoritma konvergen ke satu pusat. Sehingga, topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Untuk itu, diperlukan metode untuk membuat inisialisasi yang dapat mengatasi masalah tersebut. Salah satu metode inisialisasi yang akan dikembangkan pada penelitian ini adalah metode Singular Value Decomposition SVD . Hasil simulasi menunjukan bahwa metode inisialisasi dapat mengatasi permasalahan fuzzy C-means pada data dimensi yang tinggi sehingga topik-topik yang dihasilkan tidak sama terhadap satu sama lain.
ABSTRAK
Topic detection is a process used to analyze words in a collection of textual data to determine the topics of the collection. Detecting topics on a very large document is hardly done manually so that automatic methods are needed. Automatic method to detect topics in textual documents is known as Topic Detection and Tracking TDT . An alternative method of TDT for topic detection problems is fuzzy C means FCM . In the FCM method, generally the cluster center is random initialization. However, related to the problem of high dimensional random initialization causes the algorithm to converge to one center, it means that all generated topics are similar. For that, a method is needed to create an initialization that resolves the problem. One of the initialization methods that will be developed in this research is Singular Value Decomposition SVD method. The simulation results show that the SVD initialization method can overcome the fuzzy C means problem in the high dimension data so that the resulting topics are not equal to each other.
2017
S69378
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hamimah
Abstrak :
ABSTRAK
Pendeteksian topik adalah proses menemukan topik yang digunakan untuk menganalisis kata dalam suatu kumpulan dokumen. Pendeteksian topik secara manual pada data yang besar sangatlah sulit. Sehingga dibutuhkan metode otomatis yang dikenal dengan pemodelan topik. Salah satu metode pemodelan topik yang sering digunakan adalah metode clustering. Clustering adalah teknik pengelompokan data yang tujuannya adalah untuk mengelompokkan data tersebut sehingga anggota dari grup yang sama lebih homogen atau lebih mirip satu sama lain daripada dengan anggota kelompok yang berbeda. Metode clustering yang sering digunakan adalah Fuzzy C-Means FCM. FCM ini bekerja dengan baik pada data dengan dimensi yang rendah, namun gagal pada data dengan dimensi yang tinggi Winkler, dkk, 2011. Pada data dimensi yang tinggi, algoritma FCM konvergen ke satu pusat centre of gravity, sehingga topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Salah satu pendekatan untuk mengatasi kegagalan metode FCM pada data dimensi tinggi adalah memproyeksikan data pada ruang Eigen dengan dimensi lebih rendah dan metode tersebut dikenal juga dengan Eigenspace-based Fuzzy C-Means EFCM. Pada algoritma EFCM umumnya dilakukan inisialisasi random yang menyebabkan topik yang dihasilkan tidak sama setiap kali algoritma tersebut dijalankan. Untuk mengatasi masalah tersebut dibutuhkan inisialisasi yang tidak random. Untuk itu, pada skripsi ini akan digunakan metode Nonnegative Double Singular Value Decomposition NNDSVD. Algoritma NNDSVD terdiri dari dua proses metode SVD. Hasil dari simulasi ini menunjukkan bahwa nilai akurasi dengan inisialisasi NNDSVD menunjukkan adanya peningkatan lebih baik dibandingkan dengan inisialisasi random dan NNDSVD dapat menyelesaikan masalah EFCM dengan data berdimensi tinggi.
ABSTRACT
Detection Topic is a process of finding the topics used to analyze words in a document that a collection of textual data. Detecting topic for a very large document hardly done manually. The topic detection problem is automatically known as topic modeling. One method of topic modeling that are commonly used is clustering method. Clustering is a data grouping technique which purposes is to group the data so members of each group are more homogeneous and more like each other than with different group members. This research will use fuzzy clustering method with Fuzzy C Means algorithm FCM . FCM works well on low data dimensions but it fails on high data dimensions. One approach to overcome the failure of FCM methods in high dimensional spaces is to project data on lower dimensional Eigen spaces and the method is also known as EigenSpace based FCM EFCM. In the EFCM, the algorithm did random initialization that causes the resulting topic was not same every time the algorithm runs. To solve this problem, it requires to implement non random initialization. In this study, we used the initial Nonnegative Double Singular Value Decomposition NNDSVD. The basis of the NNSVD algorithm is a two processes SVD method. This simulation results show that NNDSVD initialization method can solves the eigenspace based Fuzzy C Means problems in high dimension data and NNDSVD based initialization gives same resulted topic every executed algorithm.
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Triyana Muliawati
Abstrak :
ABSTRAK
Seiring perkembangan teknologi informasi dan komunikasi, pemenuhan kebutuhan informasi dapat diperoleh melalui media sosial, seperti Twitter. Banyaknya pengguna internet telah memicu aliran data yang sangat besar dan cepat, sehingga membuat analisis secara manual sulit atau bahkan tidak mungkin dilakukan. Metode otomatis diperlukan untuk menganalisis data tersebut yang salah satunya yaitu dengan topic detection and tracking (TDT). Suatu metode alternatif laindari TDT untuk masalah pendeteksian topik selain latent dirichlet allocation (LDA) adalah fuzzy clustering dengan menggunakan algoritma fuzzy Cmeans (FCM). FCM pada pendeteksian topik dapat memenuhi asumsi bahwa suatu dokumen pada Twitter dapat terdiri dari beberapa topik. FCM bekerja cukup baik di dimensi data yang rendah, akan tetapi gagal dalam dimensi data yang tinggi. Oleh karena itu, dibutuhkan suatu metode untuk mereduksi dimensi ruang eigen yang tinggi ke dimensi yang lebih rendah. Salah satu metodenya adalah singular value decomposition (SVD) dengan menggunakan truncated SVD. Pada penelitian ini, dilakukan prosestruncated SVD kemudian FCM yang dinamakanfuzzy C-means pada ruang eigen (Eigen FCM). Hasil akurasi dari metode ini menunjukkan peningkatan lebih baik dibandingkan FCM dan LDA pada pendeteksian topik.
ABSTRACT
As the information and communication technology developed, the fulfillment of information can be obtained through social media, like Twitter. The enormous number of internet users has triggeredfast and large data flow, thus making the analysis manually is difficult, or even impossible. The automated methods for data analysis is needed now, one of which is the topic detection and tracking (TDT). An alternative method other than TDT fortopic detection problemother than latent dirichlet allocation (LDA) is a fuzzy clustering algorithms using fuzzy C-means (FCM). FCM in topic detection meet the assumption that a document on Twitter can consists of several topics. FCM works pretty well in low-dimensional data, but fail in high-dimensional data. Therefore, we need a method to reduce the dimension of the high-dimensional eigenspaceinto lower dimension. One method to do that is the singular value decomposition (SVD) using truncated SVD. This papercarried out the truncated SVD process then FCM called fuzzy C-means on the eigenspace (Eigen FCM). The results of the accuracy of this method shows an increase is better than FCM and LDA on topic detection.
2016
T45625
UI - Tesis Membership  Universitas Indonesia Library
cover
Ihsan Ibrahim
Abstrak :
Di Indonesia yang mayoritas karya tulis di dunia akademiknya masih menggunakan bahasa Indonesia dan referensi yang digunakan mayoritas berbahasa Inggris, memudahkan terjadinya tindak plagiarisme daripada penggunaan bahasa yang sama. Departemen Teknik Elektro telah mengembangkan sistem pendeteksi plagiarisme dwibahasa berbasis Latent Semantic Analysis LSA . Lamanya eksekusi, membuat paralelisme menjadi solusi untuk mengurangi waktu eksekusi dari sistem. Pada penelitian ini dilakukan pengembangan dengan pemrosesan paralel terhadap sistem dengan menggunakan OpenMP. Proses yang diparalelkan adalah, yaitu Singular Value Decomposition SVD, operasi-operasi matriks, dan proses Learning Vector Quantization LVQ dengan melakukan pada pendekatan loop-loop-nya. Pada pengujian yang dilakukan, akurasi dari proses paralel memiliki konsistensi yang baik karena hasil yang sama dengan proses serial dan didapatkan peningkatan kecepatan eksekusi sistem sebesar 4-7,9 . Dengan fenomena pemrosesan paralel dengan menggunakan 1 thread memiliki waktu eksekusi yang lebih lambat daripada proses serial. Sedangkan saat menggunakan 2 thread dan 4 thread, didapatkan hasil yang lebih cepat daripada proses serial meskipun penggunaan 4 thread hanya berbeda sedikit atau cenderung sama dengan 2 thread. Hal ini disebabkan adanya overhead OpenMP yang terjadi saat pemrosesan paralel berjalan sebesar 20 , dan overhead MySQL yang membuat proses menjadi sangat lama karena besarnya yang mencapai 70 saat proses serial dan 50 pada proses paralel.
Majority of academic environment in Indonesia is still using Indonesian language and its references are in English. This condition led to ease the plagiarism acts when compared to same language environment. Due to this problem, Department of Electrical Engineering has developed bilingual plagiarism detection system based on Latent Semantic Analysis LSA . Parallelism becomes a solution to duration of execution problem. Development of parallel processing on the system with using OpenMP was conducted in this research. The parallelized processes were Singular Value Decomposition SVD , matrices operations, and Learning Vector Quantization LVQ with approach on loops. In the testing process, accuracy of the parallel process had the same accuracy with the serial process. It is mean that the parallel process has good consistency. Then, the result of execution time has 4 7.9 of improvement compared to the serial one. There was a phenomenon that 1 thread of parallel process had worse performance than the serial process. Furthermore, use of 2 threads and 4 threads in the parallel process had a better execution time, even 4 threads is only slightly better or tend to be the same with 2 threads. These happened due to overhead presences. OpenMP overhead appeared at 20 when parallel executed and MySQL had more with 70 of system computation process in serial and 50 when executed in parallel.
Depok: Fakultas Teknik Universitas Indonesia, 2018
T50881
UI - Tesis Membership  Universitas Indonesia Library
cover
Rico Setiawan
Abstrak :
Simple-O merupakan sebuah sistem penilaian esai otomatis (essay grading) yang meggunakan metode Latent Semantic Analysis (LSA). Prinsip kerja sistem ini adalah dengan melakukan konversi jawaban ke dalam bentuk matriks yang kemudian secara statistik dan matematis dihitung intensitas atau frekuensi keberadaan kata. Metode LSA mengaplikasikan teori Singular Value Decomposition (SVD), yaitu teknik yang digunakan untuk melakukan estimasi terhadap rank dan matriks. Melalui SVD akan dilakukan peleburan atau reduksi dari matriks berukuran besar menjadi matriks kecil. Kemiripian antara kalimat dihitung dengan melakukan penghitungan nilai kosinus dari sudut atau membandingkan norma sudut Frobenius antara dua vector. Pada skripsi ini, ditambahkan program pengenalan kata frasa dan negasi dari sistem Simple-O sebelumnya yang kemudian dibandingkan dengan penilaian secara manual (human raters). Untuk menghitung nilai korelasi antar sistem dan human raters, maka digunakan teknik penghitung korelasi Pearson Product Moment. Nilai korelasi yang didapatkan antara sistem baru dan manual adalah 0.53155. ......Simple-O is an automated essay scoring system (essay grading) that applies Latent Semantic Analysis (LSA) method. The working principle of this system is by converting the answers into the form of a matrix which is then statistically and mathematically calculated the intensity or frequency of the existence of the word. LSA method applying Singular Value Decomposition theory (SVD), which is a technique used to estimate the rank and matrix. SVD will be done through reduction of a large matrix into smaller matrices. The similarity between the sentence is calculated by calculating the value of the cosine of the angle or comparing Frobenius angles norm between two vectors. In this paper, the program added phrases and negation words identification of Simple-O system and will be compared with Original Simple-O and human raters. To calculate the value of the correlation between the system and human raters, we used the technique Pearson Product Moment. Correlation values obtained between the new system and the manual at about 0.53155
Depok: Fakultas Teknik Universitas Indonesia, 2014
S55163
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2   >>