Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Vincent Sanjaya
Abstrak :
Penelitian ini membahas tentang pengembangan sistem Chatbot pada customer service bengkel motor dengan menggunakan algoritma cosine similarity. Cosine Similarity merupakan algoritma dengan basis dua vektor yang dihitung persamaannya berdasarkan sudut kedua vektor tersebut untuk mengukur tingkat kemiripan teks. Masukan sistem berupa percakapan teks yang pada proses selanjutnya diubah menjadi vektor dengan besar nilai vektor mengikuti dataset yang ada menggunakan metode Bag Of Words dengan dataset untuk membalas percakapan tersebut. Kemiripan suatu teks menggunakan akurasi dari perhitungan cosine similarity dengan akurasi sebesar 82.7%. Diamati faktor-faktor yang mempengaruhi akurasi setiap pengguna. Dalam penelitian ini, sistem menggunakan dataset sebesar 472 data katalog sepeda motor.
This paper discusses the development of a chatbot system in a motorcycle garage using the cosine similarity algorithm. Cosine similarity is an algorithm to calculate the degree of similarity of two vectors based on the value of the angle between the two vectors. The chatbot receives an input consisting of a sentence which is then converted into a vector using the Bag of Words algorithm. Using the cosine similarity algorithm, an accuracy of 82.7% is achieved. This paper utilizes 472 motorcycle catalogues as a dataset to perform the calculation and prediction previously mentioned.
Depok: Fakultas Teknik Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Arman
Abstrak :
ABSTRAK
Ekstraksi topik merupakan tugas utama dalam penambangan teks sebagai upaya mengeluarkan informasi yang terpendam dalam teks secara heuristik. Proses ini dilakukan lewat pemodelan topik yakni sebuah proses mengidentifikasi topik- topik yang ada dalam sebuah objek teks atau menurunkan pola-pola tersembunyi dalam sebuah korpus teks. Dalam penelitian ini pemodelan topik diaplikasikan pada data teks berbahasa Indonesia menggunakan modul program bernama Gensim dalam bahasa pemrograman Python. Dataset terdiri dari 93 dokumen berita daring Kompas dengan beragam klasifikasi. Jumlah topik optimal yang diperoleh diuji menggunakan machine learning clustering k-means. Dalam proses penelitian ini ternyata diperlukan suatu mekanisma umpanbalik manual untuk mereduksi noise agar diperoleh pemodelan topik yang lebih baik. Hasil uji memperlihatkan teknik Latent Dirichlet Allocation LDA yang telah ditingkatkan / dimodifikasi LDA as LSI memiliki koherensi topik yang jauh lebih baik dibanding teknik LDA saja dalam penelitian ini: 0.94 dibanding 0.34 . Koherensi yang tinggi mengindikasikan bahwa topik hasil pemodelan ini merupakan topik yang dapat dijelaskan dengan sedikit label.
ABSTRACT
Topic extraction is main task in text mining as an effort to dig buried information within text heuristically. This process is done through topic modeling, a process to identify topics within text object or to derive hidden patterns in a text corpus. In this research, topic modeling is applied to Indonesian language texts using Gensim module in Python programming language. The dataset consists of 93 online news documents from Indonesian national newspaper, Kompas, with several different classifications. The identified optimum number of topics k is visualized using clustering machine learning k means. In the process of this research turned out to need a mechanism of manual feedback for noise reduction in order to get better topic modeling. The test results show that enhanced modified Latent Dirichlet Allocation LDA as LSI has a much better topic coherence than LDA technique alone in this study 0.94 compared to 0.34 . High coherence indicates that topics resulting from this topic modeling is a topic that can be explained with few labels.
2017
T47943
UI - Tesis Membership  Universitas Indonesia Library