Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 3 dokumen yang sesuai dengan query
cover
Alif Iqbal Hazairin
Abstrak :
Bahasa daerah adalah bahasa yang digunakan sebagai penghubung pada masyarakat suatu daerah atau suatu kelompok masyarakat tertentu di samping bahasa utama, yaitu bahasa Indonesia. Keragaman bahasa daerah di Indonesia merupakan kekayaan budaya yang harus dipertahankan sepanjang zaman. Sayangnya, penggunaan bahasa daerah yang berkurang serta minimnya perhatian masyarakat pada digitalisasi bahasa daerah membuat bahasa daerah semakin terpinggirkan. Tak terkecuali pada bidang NLP, belum ada perkembangan signifikan dalam puluhan tahun terakhir yang melibatkan bahasa daerah sebagai subjek penelitian. Oleh karena itu, penelitian ini mencoba memberikan salah satu cara untuk meningkatkan kembali pelibatan bahasa daerah dalam penelitian khususnya NLP. Penelitian ini mencoba membangun korpus teks untuk sebanyak mungkin bahasa daerah di Indonesia menggunakan metode web crawling. Sistem melakukan crawling untuk mengumpulkan web berbahasa daerah sebanyak-banyaknya dan kontennya diambil dengan melakukan web scraping. Teks hasil scraping selanjutnya dinormalisasikan dan dilakukan language identification pada tiap kalimatnya. Kalimat dengan bahasa mayor seperti Indonesia dan Inggris dibuang, dan kalimat yang berbahasa daerah dipertahankan. Hasilnya adalah korpus teks untuk ratusan bahasa daerah di Indonesia. Harapannya hasil penelitian ini dapat menjadi batu loncatan penelitian bahasa daerah NLP di Indonesia selanjutnya. ......Regional languages are languages used as a means of communication within a specific region or community, in addition to the main language, which is Indonesian. The diversity of regional languages in Indonesia is a cultural wealth that should be preserved throughout time. Unfortunately, the diminishing use of regional languages and the lack of attention given by society to the digitization of these languages have led to their marginalization. This holds true even in the field of Natural Language Processing (NLP), where there has been little significant development involving regional languages as research subjects in recent decades. Therefore, this study aims to provide a method to re-engage regional languages, particularly in NLP research. The research attempts to build a text corpus for as many regional languages in Indonesia as possible using web crawling methods. The system will crawl the web to collect regional language websites and extract their content through web scraping. The scraped texts will then undergo a normalization process and language identification process for each sentence. Sentences in major languages such as Indonesian and English will be discarded, while sentences in regional languages will be retained. The outcome of this research will be a text corpus for hundreds of regional languages in Indonesia. The hope is that the results of this study can serve as a stepping stone for the next NLP research on regional languages in Indonesia.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hendrico Kristiawan
Abstrak :
Pertanyaan konsultasi pada sebuah forum daring perlu dijawab oleh dokter spesialis yang tepat agar jawaban yang diberikan akurat dan bermanfaat bagi pengguna yang bertanya. Terkait hal tersebut, penelitian ini membahas tentang pengembangan model yang dapat secara otomatis mengarahkan sebuah pertanyaan konsultasi kesehatan ke dokter dengan spesialisasi yang sesuai. Lebih jauh lagi, model yang dibangun merupakan model klasifikasi multi-label karena sebuah pertanyaan dapat terasosiasi dengan lebih dari satu spesialisasi. Penelitian ini dimulai dengan mengevaluasi keefektifan metode pemetaan berbasis aturan dalam memprediksi data yang dianotasi oleh pakar, dan diperoleh hasil yang menunjukkan tingkat keberhasilan yang cukup. Selanjutnya, dikembangkan sebuah model machine learning yang melakukan klasifikasi domain spesialis dokter. Pelatihan model dilakukan dengan berbagai metode, termasuk supervised, unsupervised, serta semi-supervised learning. Model terbaik ditemukan melalui metode domain adaptive pre-training dengan IndoBERT-large sebagai model acuan dan melibatkan unsupervised learning. Selain itu, model supervised learning juga digunakan dengan menggunakan model konvensional, dan hasilnya digunakan untuk analisis kontribusi dari fitur-fitur yang digunakan dalam klasifikasi. Terakhir, penelitian ini mengevaluasi kembali anotasi yang dilakukan oleh manusia dengan menggunakan kata kunci sebagai pendekatan untuk mengurangi kesalahan dalam dataset. Dengan pendekatan ini, berhasil ditemukan beberapa kesalahan anotasi pada dataset yang dianotasi oleh manusia. ...... The consultation questions on an online forum need to be answered by the appropriate specialist doctors to provide accurate and beneficial answers to the users asking the questions. In relation to this, this study discusses the development of a model that can automatically direct a health consultation question to a doctor with the corresponding specialization. Furthermore, the constructed model is a multi-label classification model because a question can be associated with more than one specialization. There are several issues addressed in this work. This research begins by evaluating the effectiveness of rule-based mapping methods in predicting data annotated by experts, and the results show a satisfactory level of success. Furthermore, a multi-label classification model is developed to classify the specialist domains of doctors. The model training is performed using various methods, including supervised learning, unsupervised learning, and semi-supervised learning. The best model is found through domain adaptive pre-training using IndoBERT-large as the reference model and involving unsupervised learning. Additionally, the supervised learning model is also used with a conventional model, and the results are used to analyze the contribution of the features used in the classification. Lastly, this research re-evaluates the annotations made by humans using keyword-based approaches to reduce errors in the dataset. With this approach, several annotation errors were successfully identified in the dataset annotated by humans.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Achmad Ghifari Taufiqurrochman
Abstrak :
Pejabat pengelola informasi dan dokumentasi atau PPID adalah sistem layanan informasi publik yang dimiliki oleh Kementerian Luar Negeri RI atau Kemlu RI. PPID bertugas melaksanakan kegiatan penyimpanan, pendokumentasian, penyediaan, dan pelayanan informasi publik. PPID merupakan implementasi Undang-Undang No. 14 Tahun 2008 tentang Keterbukaan Informasi Publik (UU KIP). Website PPID Kementerian Luar Negeri dapat diakses melalui tautan berikut https://e-ppid.kemlu.go.id/. Tetapi berdasarkan evaluasi singkat terhadap desain antarmuka website PPID Kemlu RI masih terdapat kekurangan pada aspek user experience. Berdasarkan landasan desain yang kami pakai yaitu Shneiderman's Eight Golden Rules of Interface Design masih terdapat kekurangan dalam poin offer informative feedback, cater to universal usability, strive for consistency. Adanya penelitian ini ditujukan untuk memperdalam pemahaman mengenai permasalahan yang dirasakan oleh pengguna. Dari pemahaman tersebut akan diberikan output berupa desain alternatif website PPID Kemlu RI yang di desain dengan pendekatan User Centered Design (UCD). Selain itu, terdapat pula evaluasi desain antarmuka atau User Interface (UI) dan usability dengan metode usability testing dan contextual interview. Penelitian ini menghasilkan rancangan desain antarmuka yang memiliki skor evaluasi yang baik, dengan rata-rata success rate pada usability testing sebesar 97,8%. Penelitian ini kemudian ditutup dengan saran yang dapat diterapkan pada penelitian selanjutnya. ......The information and documentation management officer or PPID is a public information service system owned by the Indonesian Ministry of Foreign Affairs or the Indonesian Ministry of Foreign Affairs. PPID is tasked with carrying out storage, documentation, provision and service of public information. PPID is an implementation of Law no. 14 of 2008 concerning Openness of Public Information (UU KIP). The PPID Ministry of Foreign Affairs website can be accessed via the following link https://e- ppid.kemlu.go.id/. However, based on a brief evaluation of the interface design of the Indonesian Ministry of Foreign Affairs' PPID website, there are still deficiencies in the user experience aspect. Based on the design basis that we use, namely Shneiderman's Eight Golden Rules of Interface Design, there are still deficiencies in the points of offering informative feedback, catering to universal usability, striving for consistency. This research is aimed at deepening understanding of the problems felt by users. From this understanding, output will be provided in the form of an alternative design for the Indonesian Ministry of Foreign Affairs' PPID website which is designed using a User Centered Design (UCD) approach. Apart from that, there is also an evaluation of the interface design or User Interface (UI) and usability using the usability testing and contextual interview methods. This research produced an interface design that had a good evaluation score, with an average success rate in usability testing of 97.8%. This research then closes with suggestions that can be applied in further research.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library