Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 76602 dokumen yang sesuai dengan query
cover
Inigo Ramli
"Model bahasa dapat mempelajari struktur suatu bahasa manusia menggunakan korpus yang tidak terstruktur. Namun, model bahasa secara umum belum dapat mempelajari pengetahuan faktual yang direpresentasikan oleh knowledge graph. Terdapat beberapa usaha untuk membuat model bahasa yang dapat mempelajari pengetahuan faktual seperti KEPLER. Sayangnya, belum terdapat penelitian yang komprehensif mengenai integrasi pengetahuan faktual terhadap pelatihan model bahasa Indonesia. Penelitian ini mengajukan model bahasa Indonesia baru bernama IndoKEPLER yang melatih model bahasa Indonesia yang sudah ada dengan korpus Wikipedia Bahasa Indonesia dan memanfaatkan pengetahuan faktual dari Wikidata. Selain itu, penelitian ini juga mengajukan metode knowledge probing baru untuk menguji pemahaman faktual suatu model bahasa Indonesia. Hasil eksperimen penelitian ini menunjukkan bahwa pelatihan model IndoKEPLER dapat meningkatkan pemahaman faktual suatu model bahasa Indonesia.

Pretrained language models have the ability to learn the structural representation of a natural language by processing unstructured textual data. However, the current language model design lacks the ability to learn factual knowledge from knowledge graphs. Several attempts have been made to address this issue, such as the development of KEPLER. Unfortunately, such knowledge enhanced language model is not yet available for the Indonesian language. In this experiment, we propose IndoKEPLER: a pretrained language model trained using Wikipedia Bahasa Indonesia and Wikidata. We also create a new knowledge probing benchmark named IndoLAMA to test the ability of a language model to recall factual knowledge. This experiment shows that IndoKEPLER has a higher ability to recall factual knowledge compared to the text encoder it’s based on."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Galangkangin Gotera
"Singlish adalah sebuah bahasa informal yang sering digunakan warga Singapura. Karena informal, bahasa Singlish jarang ditemukan di media umum seperti majalah, koran, dan artikel internet. Meski demikian, bahasa ini sangat sering digunakan oleh warga Singapu- ra pada percakapan sehari-hari, baik daring maupun luring. Banyak campuran bahasa lain (code-mixing) merupakan tantangan lain dari Singlish. Keterbatasan GPU juga menjadi tantangan dalam mendapatkan model yang baik. Mempertimbangkan semua tantangan ini, penulis telah melatih sebuah model Efficiently Learning an Encoder that Classifies Token Replacements Accurately (ELECTRA) pada data berbahasa Singlish. ELECTRA merupakan sebuah model baru yang menawarkan waktu training lebih cepat sehingga menjadi pilihan baik jika memiliki keterbatasan GPU. Data Singlish didapatkan melalui web scraping pada reddit dan hardwarezone. Penulis membuat sebuah dataset benchmark pada dua buah permasalahan yaitu sentiment analysis dan singlish identification dengan anotasi manual sebagai metode untuk mengukur kemampuan model dalam Singlish. Penulis melakukan benchmarking pada model yang dilatih dengan beberapa model yang tersedia secara terbuka dan menemukan bahwa model ELECTRA yang dilatih memiliki perbedaan akurasi paling besar 2% dari model SINGBERT yang dilatih lebih lama dengan data yang lebih banyak.

Singlish is an informal language frequently used by citizens of Singapore (Singaporeans). Due to the informal nature, Singlish is rarely found on mainstream media such as magazines, news paper, or internet articles. However, the language is commonly used on daily conversation, whether it be online or offline. The frequent code-mixing occuring in the language is another tough challenge of Singlish. Considering all of these challenges, we trained an Efficiently Learning an Encoder that Classifies Token Replacements Accurately (ELECTRA) model on a Singlish corpus. Getting Singlish data is hard, so we have built our own Singlish data for pre-training and fine-tuning by web scraping reddit and hardwarezone. We also created a human-annotated Singlish benchmarking dataset of two downstream tasks, sentiment analysis and singlish identification. We tested our models on these benchmarks and found out that the accuracy of our ELECTRA model which is trained for a short time differ at most 2% from SINGBERT, an open source pre-trained model on Singlish which is trained with much more data."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Putri Nur Saraswati
"Gilir tutur atau pergantian pembicara dalam percakapan dapat menunjukkan kompleksitas dari percakapan dan gilir tutur menjadi salah satu aspek dalam kemahiran berbicara seseorang. Penelitian ini berfokus pada penyusunan model gilir tutur yang dilakukan oleh penutur asing. Pertanyaan penelitian ini adalah menganalisis model gilir tutur bahasa Jerman yang dilakukan oleh pemelajar Indonesia dan menganalisis pemarkah linguistik yang digunakan dalam percakapan berbahasa Jerman oleh pemelajar Indonesia tersebut. Dengan menggunakan metode kualitatif, penelitian ini merupakan penelitian dengan pendekatan analisis percakapan. Data penelitian ini mencakup 20 percakapan berbahasa Jerman yang dilakukan oleh 43 mahasiswa dari kelas bahasa Jerman tingkat 5 di sebuah universitas. Penelitian ini menemukan 15 model gilir tutur dalam bahasa Jerman yang dilakukan oleh pemelajar Indonesia. Tiga dari lima belas model tersebut, yakni repetisi, kilir lidah dan kekeliruan tata bahasa, merupakan model baru dalam model gilir tutur yang ditemukan. Kemunculan model baru ini dipengaruhi oleh responden sebagai penutur asing bahasa Jerman. Sementara itu, sisanya merupakan pemutakhiran model gilir tutur Sacks et al. (1974). Sementara itu, hasil dari penelitian ini juga membuktikan bahwa tidak hanya dipengaruhi oleh peran penutur bahasa responden, tetapi juga dipengaruhi oleh konteks percakapannya, dalam penelitian ini konteks ujian percakapan.

Turn-taking or switching speakers in a conversation is able to show the complexity of a conversation and it becomes one of the aspects of someone's speaking skills. This research focuses on drafting a model of turn-taking by non-native speakers. The questions of this research are analyzing a model of turn-taking in the German language performed by Indonesian learners and analyzing the implementation of linguistic units that are used in the conversation. By using a qualitative method, this research uses a conversational analysis approach. The data research includes 20 conversations performed by 43 Indonesian students of level 5 German language classes in a university. This research found 15 turn-taking models in the German language performed by Indonesian learners. Three of those 15 turn-taking models, which are repetition, slips of tongue, and grammatical errors are counted as new turn-taking models. Those new models appeared because the respondents were non-native German speakers. Meanwhile, the rest of the models come from the updated turn-taking models by Sacks et al. (1974). In addition, the result of this research also proves that the speaker’s role as native or non-native speaker and the context of the conversation are able to determine the turn-taking models."
Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Tulus Setiawan
"Indonesia merupakan salah satu negara yang sempat terimbas COVID-19. Hal itu berdampak pada sektor pariwisata, khususnya industri perhotelan di Indonesia. Meskipun begitu, sekarang sektor pariwisata di Indonesia mulai pulih kembali, khususnya untuk industri perhotelan. Badan Pusat Statistik (BPS) mencatat bahwa pada tahun 2023, tingkat penghunian kamar (TPK) hotel bintang bahkan mengalami kenaikan dibandingkan dengan tahun 2022, kenaikan hotel bintang mencapai 51,12%. Dengan meningkatnya permintaan terhadap tingkat hunian hotel, ulasan yang diberikan oleh pelanggan terhadap hotel menjadi hal yang penting untuk dianalisis. Salah satu jenis analisis yang dapat dilakukan terhadap ulasan-ulasan tersebut adalah analisis sentimen untuk mengklasifikasi sentimen yang terkandung dalam ulasan ke dalam kelompok-kelompok sentimen tertentu. Walaupun model-model deep learning seperti Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU) atau bahkan model hybrid dan fully-connected layer neural network dengan representasi Bidirectional Encoder Representations from Transformers (BERT) terbukti menghasilkan kinerja yang baik dalam melakukan analisis sentimen, tetapi beberapa masalah yang umumnya dihadapi adalah fleksibilitas, efisiensi waktu, dan sumber daya yang dibutuhkan dalam penggunaannya. Oleh sebab itu, metode GPT berbasis prompt dapat menjadi salah satu solusi untuk permasalahan tersebut. Dengan menggunakan GPT berbasis prompt, pengguna dapat langsung memanfaatkan pengetahuan dan pemahaman bahasa yang telah diperoleh model GPT selama proses pelatihan pada korpus teks yang sangat besar. Hal ini memungkinkan model untuk menghasilkan prediksi sentimen yang akurat tanpa perlu melalui proses pelatihan yang panjang dan kompleks. Penelitian ini menganalisis dan membandingkan kinerja Large Language Model BERT dan GPT sebagai metode untuk analisis sentimen berbahasa Indonesia. Hasil Penelitian menunjukkan bahwa rata-rata kinerja model GPT secara keseluruhan lebih unggul dibandingkan model BERT dengan fully-connected layer neural network (BERT-NN) untuk dataset tiket.com, PegiPegi, dan Traveloka. Secara spesifik, model GPT dengan pendekatan zero-shot memiliki rata-rata kinerja yang paling unggul dibandingkan dengan pendekatan one-shot dan few-shot. Untuk rata-rata kinerja terhadap ketiga dataset tersebut, GPT dengan pendekatan zero-shot memberikan peningkatan sebesar 1,28%, 1,45%, dan 6,2% untuk metrik akurasi, F1-score, dan sensitivity secara berurutan terhadap kinerja BERT-NN. Hasil ini menunjukkan potensi metode GPT berbasis prompt sebagai alternatif yang efisien dan fleksibel secara penggunaan untuk analisis sentimen pada ulasan hotel berbahasa Indonesia.

Indonesia was one of the countries affected by COVID-19. This impacted the tourism sector, particularly the hotel industry in Indonesia. However, the tourism sector in Indonesia is now beginning to recover, especially for the hotel industry. The Central Statistics Agency (BPS) recorded that in 2023, the occupancy rate of star-rated hotels even increased compared to 2022, with the increase reaching 51.12%. With the rising demand for hotel occupancy rates, customer reviews of hotels have become important to analyze. One type of analysis that can be performed on these reviews is sentiment analysis to classify the sentiments contained in the reviews into specific sentiment groups. Although deep learning models such as Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU), or even hybrid models and fully-connected layer neural networks with Bidirectional Encoder Representations from Transformers (BERT) representation have been proven to produce good performance in sentiment analysis, some common problems faced are flexibility, time efficiency, and resources required for their use. Therefore, prompt-based GPT methods can be a solution to these problems. By using prompt-based GPT, users can directly leverage the knowledge and language understanding that the GPT model has acquired during training on a vast text corpus. This allows the model to generate accurate sentiment predictions without going through a long and complex training process. This study analyzes and compares the performance of BERT and GPT Large Language Models as methods for Indonesian language sentiment analysis. The results show that the average overall performance of the GPT model is superior to the BERTmodel with a fully-connected layer neural network (BERT-NN) for datasets from tiket.com, PegiPegi, and Traveloka. Specifically, the GPT model with a zero-shot approach has the most superior average performance compared to the one-shot and few-shot approaches. For the average performance across these three datasets, GPT with a zero-shot approach provides improvements of 1.28%, 1.45%, and 6.2% for accuracy, F1-score, and sensitivity metrics, respectively, compared to BERT-NN performance. These results demonstrate the potential of prompt-based GPT methods as an efficient and flexible alternative for sentiment analysis on Indonesian language hotel reviews."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Moh. Faisal
"Bahasa Isyarat Indonesia (BISINDO) merupakan salah satu bahasa isyarat yang banyak digunakan kaum Tuli di Indonesia karena dianggap lebih alami sehingga lebih mudah digunakan. BISINDO digunakan kaum Tuli untuk berkomunikasi dengan orang lain dalam kegiatan sehari-harinya. Namun, pada kenyataannya, masih banyak orang yang belum mengerti bahasa isyarat. Hal tersebut menjadi kendala bagi orang Tuli untuk berkomunikasi dengan orang dengar dan sebaliknya. Perkembangan teknologi yang semakin maju memberikan suatu solusi untuk masalah tersebut. Pada penelitian ini akan dikembangkan model untuk mengenali gerakan isyarat BISINDO dengan menggunakan MobileNetV2 dan Long Short-Term Memory (LSTM). MobileNetV2 digunakan pada tahap feature extraction sedangkan LSTM digunakan pada tahap klasifikasi gerakan isyarat. Dataset yang digunakan pada penelitian ini berupa video 40 kalimat yang direkam dengan menggunakan kamera smartphone dan diperagakan oleh empat orang Tuli dari Laboratorium Riset Bahasa Isyarat FIB UI (LRBI FIB UI). Terdapat tahapan preprocessing untuk mendapatkan bagian tangan dan wajah yang merupakan fitur penting untuk membedakan gerakan isyarat. Penelitian ini menghasilkan model LSTM 1-layer bidirectional sebagai model terbaik dengan akurasi tertinggi sebesar 91,53%.

Indonesian Sign Language (BISINDO) is a sign language that is widely used by deaf people in Indonesia because it is a natural language and therefore it is easier to use. BISINDO is used by deaf people to communicate in their daily activities. However, in reality, there are many people who do not understand sign language. This becomes a problem for deaf people to communicate with hearing people and vice versa. Nowadays, the development of technology is more advanced give a solution to this problem. In this research, a model will be developed to recognize BISINDO gestures using MobileNetV2 and Long Short-Term Memory (LSTM). MobileNetV2 will be used in a feature extraction stage while LSTM will be used in the gesture classification stage. The dataset used in this study is a video recording of 40 sentences recorded using a smartphone camera and it was demonstrated by four deaf people from the research laboratory of sign language FIB UI (LRBI FIB UI). There is a preprocessing stage to get the hand and facial parts which are important features for distinguishing the gesture of sign language. Then, the result of this study is a model LSTM 1-Layer Bidirectional as the best model with the highest accuracy is 91,53%."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Pardede, Maria Angel Margareth
"Bahasa isyarat umumnya dilakukan oleh tuna rungu dan tuna wicara yang menimbulkan kesenjangan dalam berkomunikasi khususnya saat melamar pekerjaan. Ada hambatan komunikasi yang dirasakan saat proses pencarian kerja dimana pada tahun 2020 menyebutkan bahwa penyandang disabilitas yang bekerja sebanyak 7,67 juta orang (5,98% dari total pekerja di Indonesia) dibandingkan dengan jumlah pekerja dengan disabilitas di Indonesia mencapai 720.748 orang (0,53% dari total pekerja di Indonesia) pada tahun 2022 menurut BPS (Badan Pusat Statistik). Penurunan persentase dalam lapangan kerja sebagian besar disebabkan oleh praktik perekrutan yang diskriminatif oleh banyak perusahaan. Jadi, dibutuhkan sistem deteksi bahasa isyarat yang dapat mempermudah dalam penerjemahan bahasa isyarat supaya kesempatan pengguna bahasa isyarat sama dengan semua orang dalam proses pelamaran kerja dan mendapatkan pekerjaan yang layak. Skenario pengambilan data adalah dengan 2 skenario, yaitu data non augmented dan augmented. Proses training dengan dataset yang terdiri atas 348 citra training yang lalu diaugmentasi sehingga berjumlah 1.044 citra training. Hasil pengujian dengan real-time testing dilakukan dengan evaluasi model menggunakan parameter akurasi sistem (confidence score), precision, recall, dan F1 Score untuk setiap model dimana nilai confidence score model Faster R-CNN dan RetinaNet adalah 96,67% : 93,33%. Selain itu, perbandingan nilai F1 Score untuk model Faster R-CNN dan RetinaNet adalah 0,98 : 0,97, tingkat akurasi mAP Faster R-CNN dan RetinaNet yang non augmented adalah 95,3% : 90,6%, sedangkan mAP Faster R-CNN dan RetinaNet yang augmented adalah 92,1% : 88,2%. Melalui hasil tersebut diperoleh bahwa kedua model memiliki presisi yang lebih rendah saat sudah diaugmentasi. Maka dari itu, algoritma Faster R-CNN memiliki hasil presisi lebih akurat dibandingkan algoritma RetinaNet.

Sign language is generally used by the deaf and speech impaired which causes errors in communication, especially when applying for jobs. There are communication barriers that are felt during the job search process where in 2020 it is stated that 7,67 million people with disabilities work (5,98% of total workers in Indonesia) compared to the number of workers with disabilities in Indonesia reaching 720,748 people (0,53% of total workers in Indonesia) in 2022 according to BPS (Badan Pusat Statistik). The percentage decline in employment is largely due to discriminatory hiring practices by many companies. So, a sign language detection system is needed that can make it easier to translate sign language so that sign language users have the same opportunities as everyone else in the job application process and getting a decent job. The data collection scenario is with 2 scenarios, namely non-augmented and augmented data. The training process uses a dataset consisting of 348 training images which are then augmented so that the total is 1.044 training images. Test results using real-time testing were carried out by evaluating the model using system accuracy parameters (confidence score), precision, recall, and F1 Score for each model where the Confidence Score value for the Faster R-CNN and RetinaNet models was 96,67% : 93,33%. In addition, the comparison of the F1 Score values​​for the Faster R-CNN and RetinaNet models is 0,98 : 0,97, the accuracy level of the non-augmented mAP Faster R-CNN and RetinaNet is 95,3% : 90,6%, while the mAP Faster R-CNN and augmented RetinaNet are 92,1% : 88,2%. From these results, it was found that the two models had lower precision when they were augmented. Therefore, the Faster R-CNN algorithm has more accurate precision results than the RetinaNet algorithm."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Yogi Lesmana Sulestio
"Penelitian Part-of-Speech tagger (POS tagger) untuk bahasa Indonesia telah banyak dikembangkan. Sayangnya, sejauh ini baru Polyglot yang menggunakan POS tag menurut pedoman anotasi Universal Dependencies (UD). Namun, Polyglot sendiri masih mempunyai kekurangan karena belum dapat mengatasi klitik dan kata ulang yang terdapat dalam bahasa Indonesia. Tujuan penelitian ini adalah mengembangkan POS tagger untuk bahasa Indonesia yang tidak hanya sesuai dengan ketentuan anotasi UD, tapi juga sudah mengatasi kekurangan Polyglot. POS tagger ini akan dikembangkan dengan metode deep learning menggunakan arsitektur yang merupakan versi modifikasi dari Recurrent Neural Network (RNN), yaitu Bidirectional Long Short-Term Memory (Bi-LSTM). Dataset yang digunakan untuk mengembangkan POS tagger adalah sebuah dependency treebank bahasa Indonesia yang terdiri dari 1.000 kalimat dan 19.401 token. Hasil eksperimen dengan menggunakan Polyglot sebagai pembanding menunjukkan bahwa POS tagger yang dikembangkan lebih baik dengan tingkat akurasi POS tagging yang meningkat sebesar 6,69% dari 84,82% menjadi 91,51%.

There have been many studies that have developed Part-of-Speech tagger (POS tagger) for Indonesian language. Unfortunately, so far only Polyglot that has used POS tag according to Universal Dependencies (UD) annotation guidelines. However, Polyglot itself still has shortcomings since it has not been able to overcome clitics and reduplicated words in Indonesian language. The purpose of this study is to develop POS tagger for Indonesian language which is not only in accordance with UD annotation guidelines, but also has overcome Polyglot’s shortcomings. This POS tagger will be developed under deep learning method by using modified version of Recurrent Neural Network (RNN) architecture, Bidirectional Long Short-Term Memory (Bi-LSTM). The dataset used to develop POS tagger is an Indonesian dependency treebank consisting of 1.000 sentences and 19.401 tokens. Result of experiment using Polyglot as baseline shows that the developed POS tagger is better. This is indicated by increased accuracy POS tagging by 6,69% from 84,82% to 91,51%."
Depok: Fakultas Ilmu Kompter Universitas Indonesia, 2020
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Mochammad Shaffa Prawiranegara
"Skripsi ini bertujuan untuk mengembangkan model klasifikasi teks berbasis Convolutional Neural Network (CNN) dan BERT Language Model untuk mendeteksi SQL Injection pada Apache Web Server. Skripsi ini melibatkan pengumpulan dan pemrosesan dataset, literasi teori dasar, perancangan sistem, implementasi sistem, dan evaluasi kinerja model deep learning. Dengan menggunakan dataset publik dari Kaggle, model yang dikembangkan berhasil mendeteksi SQL Injection dengan akurasi yang tinggi. Hasil eksperimen menunjukkan bahwa model BERT memberikan performa yang lebih baik dibandingkan dengan CNN dalam hal accuracy, precision, recall, dan F1-score. Implementasi teknik deep learning pada sistem SQL Injection Detection juga mempermudah log file analysis pada Apache Web Server. Kesimpulan dari skripsi ini adalah berhasilnya pengembangan sistem SQL Injection Detection berbasis Convolutional Neural Network (CNN) dan BERT Language Model dengan akurasi masing-masing sebesar 95.99% dan 99.84%.

This undergraduate thesis aims to develop a text classification model based on Convolutional Neural Network (CNN) and BERT Language Model to detect SQL Injection on the Apache Web Server. The research involves data collection and preprocessing, basic theory literature review, system design, system implementation, and evaluation of deep learning model performance. By using a public dataset from Kaggle, the developed model successfully detects SQL Injection with high accuracy. The experimental results show that the BERT model outperforms CNN in terms of accuracy, precision, recall, and F1-score. The implementation of deep learning techniques in the SQL Injection Detection system also simplifies log file analysis on the Apache Web Server. The conclusion of this undergraduate thesis is the successful development of an SQL Injection detection system based on Convolutional Neural Network (CNN) and BERT Language Model with accuracies of 95.99% and 99.84% respectively."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Arman
"ABSTRAK
Ekstraksi topik merupakan tugas utama dalam penambangan teks sebagai upaya mengeluarkan informasi yang terpendam dalam teks secara heuristik. Proses ini dilakukan lewat pemodelan topik yakni sebuah proses mengidentifikasi topik- topik yang ada dalam sebuah objek teks atau menurunkan pola-pola tersembunyi dalam sebuah korpus teks. Dalam penelitian ini pemodelan topik diaplikasikan pada data teks berbahasa Indonesia menggunakan modul program bernama Gensim dalam bahasa pemrograman Python. Dataset terdiri dari 93 dokumen berita daring Kompas dengan beragam klasifikasi. Jumlah topik optimal yang diperoleh diuji menggunakan machine learning clustering k-means. Dalam proses penelitian ini ternyata diperlukan suatu mekanisma umpanbalik manual untuk mereduksi noise agar diperoleh pemodelan topik yang lebih baik. Hasil uji memperlihatkan teknik Latent Dirichlet Allocation LDA yang telah ditingkatkan / dimodifikasi LDA as LSI memiliki koherensi topik yang jauh lebih baik dibanding teknik LDA saja dalam penelitian ini: 0.94 dibanding 0.34 . Koherensi yang tinggi mengindikasikan bahwa topik hasil pemodelan ini merupakan topik yang dapat dijelaskan dengan sedikit label.

ABSTRACT
Topic extraction is main task in text mining as an effort to dig buried information within text heuristically. This process is done through topic modeling, a process to identify topics within text object or to derive hidden patterns in a text corpus. In this research, topic modeling is applied to Indonesian language texts using Gensim module in Python programming language. The dataset consists of 93 online news documents from Indonesian national newspaper, Kompas, with several different classifications. The identified optimum number of topics k is visualized using clustering machine learning k means. In the process of this research turned out to need a mechanism of manual feedback for noise reduction in order to get better topic modeling. The test results show that enhanced modified Latent Dirichlet Allocation LDA as LSI has a much better topic coherence than LDA technique alone in this study 0.94 compared to 0.34 . High coherence indicates that topics resulting from this topic modeling is a topic that can be explained with few labels. "
2017
T47943
UI - Tesis Membership  Universitas Indonesia Library
cover
Sianipar, Igor Lestin author
"Sebagai bentuk interaksi sosial, komunikasi menjadi salah satu hal yang tidak dapat dihindari. Komunikasi menjadi metode yang paling mudah untuk diterapkan oleh setiap orang untuk saling bertukar informasi. Informasi yang diperoleh akan sangat bergantung pada proses komunikasi yang berlangsung. Bagi teman tuli, komunikasi menjadi hal yang cukup sulit dilakukan apabila hendak berinteraksi dengan teman dengar. Begitu juga sebaliknya, teman dengar akan kesulitan apabila melakukan hal yang serupa. Terdapat salah satu aplikasi yang dapat mengatasi kesulitan interaksi bagi teman tuli, yaitu sistem aplikasi SIBI. Sistem aplikasi SIBI mampu membantu penggunanya untuk berkomunikasi kepada sesama pengguna dengan menerjemahkan bahasa isyarat SIBI menjadi teks bahasa Indonesia begitu juga sebaliknya. Namun ternyata sistem aplikasi ini dirasa belum cukup membantu penggunanya ditinjau dari sisi desain interaksinya. Melalui permasalahan tersebut, penelitian ini hadir untuk meningkatkan kualitas desain interaksi sistem aplikasi SIBI yang diharapkan kan berdampak pada meningkatnya kualitas komunikasi bagi teman tuli. Penulis merancang suatu alternatif desain untuk menjawab permasalahan yang ada dengan menerapkan user centered design. Hasil dari desain alternatif tersebut akan ditinjau ulang hingga akhirnya menghasilkan suatu rekomendasi desain sistem aplikasi SIBI yang merupakan hasil akhir dari penelitian ini.

As a one of many forms of social interaction, communication is something that cannot be replaced. Communication is the easiest method for everyone to use to take and give the information. The information that obtained will be very useful based on the ongoing communication process before. For deaf peoples, communication becomes a difficult thing to do when they want to interact with a normal people and also a normal people will find it difficult to do the same thing. There is one application that can solve the difficulties, named SIBI application system. SIBI application system able to help the users to communicate with other users by translating the SIBI language into Indonesian text and vice versa. However, it turns out that this application system is not helpful enough to use in an interaction design point of view. Through this problem, this research is to improve the quality of the interaction design of the SIBI application system which is expected to have an impact on the quality of communication for deaf friends. The author will design an alternative design to answer the existing problems by implementing a user-centered design. The results of the alternative designs will be reviewed to finally produce a recommendation for the SIBI application system design which is the final result of this research."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>