Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 7 dokumen yang sesuai dengan query
cover
Dennis Febri Dien
Abstrak :
Penyakit jantung menjadi permasalahan utama di dunia medis. Hal ini dikarenakan sulitnya mendeteksi gejala awal dari penyakit tersebut. Pendeteksian gejala ini dapat dilakukan dengan memonitori sinyal elektrokardiogram pasien untuk mendeteksi jenis aritmia yang diderita. Penelitian klasifikasi aritmia mengunakan pemrosesan komputer telah berhasil mengidentifikasi tipe aritimia satu dengan lainnya. Namun dalam permasalahan dunia nyata, pasien dapat menderita jenis aritmia yang merupakan gabungan dari jenis aritmia lainnya. Penelitian ini bertujuan untuk melakukan klasifikasi aritmia secara multi-label pada data elektrokardiogram. Data yang digunakan adalah data yang berasal dari The China Physiological Signal Challenge 2018. Eksperimen yang dilakukan terbagi menjadi dua proses, yaitu pemilihan dan pemelajaran data. Teknik yang digunakan untuk pemilihan data dengan memotong data berdasarkan letak QRS sinyal menggunakan Combined Adaptive Threshold. Kemudian hasil data segmentasi sinyal dipelajari menggunakan 1DCNN dan LSTM dengan Attention. Penelitian ini berhasil melakukan klasifikasi multi-label pada data aritmia dan memperoleh rata-rata F1-Score sebesar 81.7% berdasarkan hasil evaluasi terbaik menggunakan K-Cross Validation. ......Heart Disease is the main problem in medical world. One of the reasons is because the disease is still hard to detect it earlier. The main method to detect the heart disease is monitoring electrocardiogram signal and try to identify arrhythmia of the patient. The latest research has succeeded to classify the arrhythmia using deep learning. But in the real-world problem, patient can be having a multiple arrhythmia at the same time. This research focus on to classify multiple arrhythmia with electrocardiogram data. The data that had been used for this research is from The China Physiological Signal Challenge 2018. The experiment had two step process, there are sampling step, and learning step. Technique that had been used for sampling is based on slicing the data using QRS detection based on Combined Adaptive Threshold. Then the result of the segmentation is used for training data in 1DCNN and LSTM with attention This research has succeeded to get average of F1- Score 81.7% based on the best evaluation result using K-Cross Validation.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Okky Ibrohim
Abstrak :
ABSTRAK
Penyebaran ujaran kebencian dan ujaran kasar di media sosial merupakan hal yang harus diidentifikasi secara otomatis untuk mencegah terjadinya konflik masyarakat. Selain itu, ujaran kebencian mempunyai target, golongan, dan tingkat tersendiri yang juga perlu diidentifikasi untuk membantu pihak berwenang dalam memprioritaskan kasus ujaran kebencian yang harus segera ditangani. Tesis ini membahas klasifikasi teks multi label untuk mengidentifikasi ujaran kasar dan ujaran kebencian disertai identifikasi target, golongan, dan tingkatan ujaran kebencian pada Twitter berbahasa Indonesia. Permasalahan ini diselesaikan menggunakan pendekatan machine learning menggunakan algoritma klasifikasi Support Vector Machine (SVM), Naïve Bayes (NB), dan Random Forest Decision Tree (RFDT) dengan metode transformasi data Binary Relevance (BR), Label Power-set (LP), dan Classifier Chains (CC). Jenis fitur yang digunakan antara lain fitur frekuensi term (word n-grams dan character n-grams), fitur ortografi (tanda seru, tanda tanya, huruf besar/kapital, dan huruf kecil), dan fitur leksikon (leksikon sentimen negatif, leksikon sentimen positif, dan leksikon kasar). Hasil eksperimen menunjukkan bahwa secara umum algoritma klasifikasi RFDT dengan metode transformasi LP memberikan akurasi yang terbaik dengan waktu komputasi yang cepat. Algoritma klasifikasi RFDT dengan metode transformasi LP menggunakan fitur word unigram memberikan akurasi sebesar 66,16%. Jika hanya mengidentifikasi ujaran kasar dan ujaran kebencian (tanpa disertai identifikasi target, golongan, dan tingkatan ujaran kebencian), algoritma klasifikasi RFDT dengan metode transformasi LP menggunakan gabungan fitur word unigram, character quadgrams, leksikon sentimen positif, dan leksikon kasar mampu memberikan akurasi sebesar 77,36%.


Hate speech and abusive language spreading on social media needs to be identified automatically to avoid conflict between citizen. Moreover, hate speech has target, criteria, and level that also needs to be identified to help the authority in prioritizing hate speech which must be addressed immediately. This thesis discusses multi-label text classification to identify abusive and hate speech including the target, category, and level of hate speech in Indonesian Twitter. This problem was done using machine learning approach with Support Vector Machine (SVM), Naïve Bayes (NB), and Random Forest Decision Tree (RFDT) classifier and Binary Relevance (BR), Label Power-set (LP), and Classifier Chains (CC) as data transformation method. The features that used are term frequency (word n-grams and character n-grams), ortography (exclamation mark, question mark, uppercase, lowercase), and lexicon features (negative sentiment lexicon, positif sentiment lexicon, and abusive lexicon). The experiment results show that in general RFDT classifier using LP as the transformation method gives the best accuracy with fast computational time. RFDT classifier with LP transformation using word unigram feature give 66.16% of accuracy. If only for identifying abusive language and hate speech (without identifying the target, criteria, and level of hate speech), RFDT classifier with LP transformation using combined fitur word unigram, character quadgrams, positive sentiment lexicon, and abusive lexicon can gives 77,36% of accuracy.

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
T52442
UI - Tesis Membership  Universitas Indonesia Library
cover
Andi Suciati
Abstrak :
Ulasan dapat mempengaruhi orang-orang dalam mengambil keputusan karena orang-orang dapat mengetahui ulasan yang diberikan merupakan ulasan positif atau negatif. Namun, sentimen positif, negatif, atau netral, tanpa mempertimbangkan emosi yang ada dianggap kurang, karena emosi dapat memperkuat hasil sentimen. Tesis ini membahas perbandingan antara machine learning dan deep learning dalam mengklasifikasikan sentimen dan emosi pada ulasan dengan metode klasifikasi multi-label. Pada perbandingan machine learning, digunakan metode transformasi masalah Label Powerset (LP), Binary Relevance (BR), dan Classifier Chain (CC), serta algoritma Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), dan Extra Tree Classifier (ET). Fitur yang dibandingkan yaitu n-gram language model (unigram, bigram, unigram-bigram). Untuk deep learning, algoritma yang dibandingkan yaitu Gated Recurrent Unit (GRU) dan Bidirectional Long Short-Term Memory (BiLSTM), menggunakan word embedding yang dibangun sendiri. Hasil perbandingan menunjukkan bahwa RF unggul dengan nilai F1-score 88.4% dan 89.54% dengan metode CC untuk aspek makanan, dan LP untuk harga. Untuk aspek pelayanan dan suasana, ET memimpin dengan 92.65% dan 87.1% dengan metode LP dan CC berturut-turut. Sedangkan pada perbandingan deep learning, GRU dan BiLSTM mendapatkan nilai F1-score yang sama untuk aspek makanan, 88.16%. Pada aspek harga, GRU memimpin dengan 83.01%. Namun untuk pelayanan, dan suasana, BiLSTM mendapatkan nilai lebih tinggi dengan F1-score. ......Review can affect the decision making from people because people can know whether the review is positive, or negative. However, the sentimen positive, neagtive, and neutral, without considering the emotion is considered not enough because emotion can strenghten the sentimen result. This thesis explaining about the comparison of machine learning and deep learning in sentiment as well as emotion classification with multi-label classification. In machine learning comparion, the problem transformation that were used are Label Powerset (LP), Binary Relevance (BR), and Classifier Chain (CC), with Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), and Extra Tree Classifier (ET) as algorithms. The features that compared are yaitu n-gram language model (unigram, bigram, unigram-bigram). For deep learning, algorithms that were compared are Gated Recurrent Unit (GRU) and Bidirectional Long Short-Term Memory (BiLSTM), using self-developed word embedding. The comparion results RF dominates with F1-score 88.4% and 89.54% with CC method for food aspect, and LP for price. For service and ambience aspect, ET leads with 92.65% and 87.1% with LP and CC methods, respectively. On the other hand, in deep learning comparison, GRU and BiLSTM obtained similar F1- score for food aspect, 88.16%. On price aspect, GRU leads 83.01%. However, for service and ambience BiLSTM obtained higher F1-score 89.03% and 84.78%
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Nadina Adelia Indrawan
Abstrak :
Platform digital, termasuk aplikasi mobile, mempunyai peran penting dalam gig economy, yaitu sebagai media gig worker dalam berinteraksi dengan penyedia layanan tenaga kerja. Aplikasi mobile berbasis gig economy semakin diminati masyarakat. Peningkatan jumlah pengguna mengakibatkan meningkatnya jumlah unduhan dan ulasan yang diberikan. Namun, semakin banyak ulasan menyulitkan pengembang dalam memahami informasi yang terdapat dalam ulasan. Selain itu, satu ulasan dapat memiliki berbagai informasi. Untuk mengatasi masalah tersebut, penelitian ini mengusulkan model yang dapat mengkategorikan konten dan sentimen ulasan menggunakan teknik pembelajaran mesin. Algoritme Support Vector Machine (SVM), Multinomial Naïve Bayes, Complement Naïve Bayes, Binary Relevance, Classifier Chain, dan Label power set digunakan pada penelitian ini. Hasil dari penelitian didapatkan algoritme SVM sebagai algoritme terbaik, baik pada klasifikasi sentimen ulasan maupun kategorisasi ulasan. ......Digital platforms, including mobile applications, have an important role in gig economy, as a gig worker platform in interacting with labor service providers. Gig economy based mobile applications are increasingly in demand by the public. An increase in the number of users results in an increase in the number of downloads and reviews provided. However, the number of reviews makes it difficult for developers to understand the information contained in reviews. In addition, one review can have a variety of information. To overcome this problem, this study proposes a model that can categorize content and sentiment reviews using machine learning techniques. Support Vector Machine (SVM), Multinomial Naïve Bayes, Complement Naïve Bayes, Binary Relevance, Classifier Chain, and Label power sets were used in this study. The results of the study obtained the SVM algorithm as the best algorithm, both in the classification of sentiment reviews and review categorization.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Fairuz Astari Devianty
Abstrak :
Dengan tumbuh dan berkembangnya platform media sosial, komunikasi bisa menjadi lebih mudah dilakukan. Namun, hal tersebut dapat disalahgunakan, seperti penyebaran hate speech melalui media sosial yang semakin marak terjadi. Meski kebebasan berekspresi adalah hak setiap orang di Indonesia, namun karena dampak negatifnya konten kebencian harus dihilangkan. Salah satu solusinya adalah dengan membangun sebuah model yang dapat mendeteksi hate speech secara otomatis. Untuk membangun model pendeteksian hate speech yang baik, dibutuhkan data beranotasi dengan jumlah yang besar untuk melatih model. Selain itu perlu juga diperhatikan target dan kategori dari hate speech tersebut. Namun, saat ini hanya ada satu multi-label hate speech dataset Bahasa Indonesia yang tersedia dan memiliki kekurangan proposi data dari setiap label yang tidak seimbang. Untuk mengatasi masalah kekurangan data ini, penulis mengusulkan sebuah metode yaitu Forward-Backward Translation untuk menghasilkan data secara otomatis. Metode ini merupakan gabungan dari forward translation dan back-translation. Forward translation dilakukan pada dataset dari high-resource language dan back-translation dilakukan pada dataset dari low-resource language. Dengan digabungkannya kedua proses ini dataset yang dihasilkan akan memiliki jumlah yang besar dan memiliki kualitas terjemahan yang baik. Metode ini digunakan untuk menambahkan data pada deteksi multi-label hate speech Bahasa Indonesia dengan tambahan data dari Bahasa Inggris. Performa pendeteksian multi-label hate speech pada dataset baru hasil penelitian ini berhasil meningkat bila dibandingkan dengan pada dataset hate speech Bahasa Indonesia yang sudah ada. Dataset ini mendapatkan F1-score sebesar 0.76 saat melakukan multi-label classification dan F1-score sebesar 0.78 saat melakukan hierarchical classification. ......The growth and development of social media platforms make communication easier. However, this can be misused. For example, the spread of hate speech via social media is increasing. Freedom of speech is everyone's right in Indonesia, but malicious content must be eliminated due to its negative impact. One solution is to build a model that can automatically detect hate speech. Building a good hate speech detection model requires a large amount of annotated data to train the model. It is also necessary to pay attention to the target, category, and level of hate speech. However, there is currently only one multi-label hate speech dataset in Bahasa Indonesia available and the proportion of data for each label is unequal. To overcome this data scarcity problem, we propose a forward-backward translation method to generate data automatically. This method combines forward and backward translation. A forward translation is performed for dataset in high-resource languages and a backward translation is performed for dataset in low-resource languages. By combining these two processes, the resulting dataset will have a large amount of data and good translation quality. This method will be used to add data on multi-label hate speech detection in Bahasa Indonesia with additional data from English. As a result of this study, the performance of multi-label hate speech detection in the new dataset improved compared to the existing Bahasa Indonesia hate speech dataset. This dataset gets an F1-score of 0.76 for multi-label classification and an F1-score of 0.78 for hierarchical classification.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Nadhira Tasya
Abstrak :
Seiring dengan perkembangan teknologi yang semakin pesat, semakin berkembang pula tingkat kebutuhan manuasia akan berita terkini, sehinga muncullah sebuah tren baru yaitu mempublikasi dan mengakses berita melalui media daring atau jurnalisme daring. Selain itu, jumlah masyarakat yang melakukan jual beli daring juga terus meningkat dan peluang ini dimanfaatkan oleh perusahaan dan pihak pengiklan dengan menerapkan strategi Targeted Web Advertising. Namun tingginya jumlah artikel yang telah di publikasi dan diakses membuka peluang yang besar untuk terjadinya kesalahan dalam penentuan tempat peletakan iklan. Oleh karena itu, dibutuhkan sistem yang dapat mengkategorisasikan artikel yang diakses pengguna sebagai basis penempatan iklan oleh perusahaan dan sistem pengklasifikasian ini dapat dilakukan dengan menerapkan metode Data Mining dan Text Mining. Penelitian ini menggunakan dokumen data berupa konten artikel yang akan dikategorikan ke dalam dua puluh kategori kelas iklan dengan menggunakan teknik Text Mining dengan algoritma Support Vector Machine. Hasil dari penelitian ini dapat digunakan oleh perusahaan atau pihak pengiklan sebagai basis penempatan iklan di situs media daring yang dipilih.
Rapid increase development in technological aspect resulting in growing level of human needs for the latest news, so that emerged a new trend of publishing and accessing news through online media or called online journalism. In addition, the number of people who sell and purchase through online sites also continues to increase and this opportunity is utilized by the company and the advertiser by implementing targeted web advertising. However, the high number of articles that have been published and accessed leads to great opportunities for errors in determining where to place the ads. Therefore, it needs a system that can categorize articles accessed by users as the basis of advertisement placement by the company and this classification system can be done by applying the method of Data Mining and Text Mining. This research uses document data in the form of article content that will be categorized into twenty categories of the class of advertisement by using Text Mining technique with Support Vector Machine algorithm. The results of this study may be used by companies or advertisers as a basis for placement of ads on selected online media sites.
Depok: Universitas Indonesia, 2017
S67209
UI - Skripsi Membership  Universitas Indonesia Library
cover
Surya Yehezki
Abstrak :
Meningkatnya penggunaan internet di Indonesia memberikan dampak positif bagi perkembangan e-commerce di Indonesia dengan jumlah pengguna internet telah melakukan transaksi elektronik sebesar 63,5 . Dengan meningkatnya jumlah e-commerce B2C di Indonesia, diperlukannya strategi promosi yang tepat untuk mengetahui preferensi dan potensi pembelian untuk setiap konsumen sehingga dapat meningkatkan transaksi e-commerce tersebut. Web usage mining merupakan salah satu metode yang dapat mengolah data web log pengguna situs web e-commerce B2C menjadi informasi yang dapat digunakan untuk mengklasifikasi keputusan pembelian pengguna situs web. Kombinasi kategori produk pembelian yang tinggi oleh pengguna situs web e-commerce memerlukan teknik klasifikasi multi label yang dapat mengklasifikasi kombinasi pembelian secara bersamaan. Metode Label Powerset dengan algoritme Support Vector Machine SVM digunakan untuk mengklasifikasi keputusan pembelian pengguna situs web e-commerce. Seleksi fitur menggunakan Information Gain dan pemilihan parameter dengan menggunakan Grid Search terbukti dapat meningkatkan akurasi klasifikasi.
The advance of internet usage in Indonesia has a positive impact on the development of e commerce in Indonesia where 63.5 of internet users have made online transactions. Along with e commerce B2C growth in Indonesia, it is necessary for an effective promotional strategy to know the preferences and potential purchases for each consumer with the result that to increase transactions. Web usage mining is a method having an ability to convert web log data into information used for purchase classification. The high combination of purchasing product categories by users of e commerce website required a multi label classification technique that could classify those combinations. Label Powerset method with Support Vector Machine SVM algorithm was applied to classify e commerce users purchases decision. The proposed feature selection with Information Gain and parameter selection using Grid Search could prove that they had an ability to enhance classification accuracy.
Depok: Fakultas Teknik Universitas Indonesia, 2017
S67081
UI - Skripsi Membership  Universitas Indonesia Library