Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 64682 dokumen yang sesuai dengan query
cover
Eko Julianto Salim
"Pembangkitan komentar dari data terstruktur adalah tugas yang menantang dalam bidang pembangkitan bahasa alami dengan berbagai potensi aplikasi dalam bidang olahraga dan esports. Penelitian-penelitian sebelumnya sering berfokus pada penyesuaian model datake-teks khusus, namun eksperimen awal penulis menemukan bahwa pretrained language model menunjukkan performa yang lebih baik dalam pembangkitan komentar. Penelitian ini berfokus pada bagaimana pretrained language model dapat diadaptasi untuk menghasilkan performa yang lebih baik pada permasalahan pembangkitan komentar menggunakan data replay Counter-Strike. Penulis menemukan bahwa penyesuaian pretrained language model dapat meningkatkan kualitas semantik dan alami dari pembangkitan komentar. Namun, penulis juga menemukan bahwa peningkatan kualitas semantik dan alami ini didampingi dengan penurunan pada kualitas leksikal akibat tantangan intrinsik yang ada dalam pembangkitan komentar.

Generating commentary from structured data poses a significant challenge in natural language generation, with extensive applications in sports and esports domains. Previous research has predominantly centered on tailoring specialized data-to-text models for this task. However, our preliminary investigation indicates that pretrained language models exhibit superior performance in commentary generation. This study focuses on further adapting pretrained language models to enhance their suitability for esports commentary generation, specifically utilizing Counter-Strike replay data. Our findings reveal that through this adaptation, pretrained language models can augment the semantic quality and naturalness of generated commentary. Nevertheless, we observed a trade-off, as the improvement in semantic quality and naturalness was accompanied by a decline in lexical quality, owing to the inherent complexities involved in commentary generation."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Inigo Ramli
"Model bahasa dapat mempelajari struktur suatu bahasa manusia menggunakan korpus yang tidak terstruktur. Namun, model bahasa secara umum belum dapat mempelajari pengetahuan faktual yang direpresentasikan oleh knowledge graph. Terdapat beberapa usaha untuk membuat model bahasa yang dapat mempelajari pengetahuan faktual seperti KEPLER. Sayangnya, belum terdapat penelitian yang komprehensif mengenai integrasi pengetahuan faktual terhadap pelatihan model bahasa Indonesia. Penelitian ini mengajukan model bahasa Indonesia baru bernama IndoKEPLER yang melatih model bahasa Indonesia yang sudah ada dengan korpus Wikipedia Bahasa Indonesia dan memanfaatkan pengetahuan faktual dari Wikidata. Selain itu, penelitian ini juga mengajukan metode knowledge probing baru untuk menguji pemahaman faktual suatu model bahasa Indonesia. Hasil eksperimen penelitian ini menunjukkan bahwa pelatihan model IndoKEPLER dapat meningkatkan pemahaman faktual suatu model bahasa Indonesia.

Pretrained language models have the ability to learn the structural representation of a natural language by processing unstructured textual data. However, the current language model design lacks the ability to learn factual knowledge from knowledge graphs. Several attempts have been made to address this issue, such as the development of KEPLER. Unfortunately, such knowledge enhanced language model is not yet available for the Indonesian language. In this experiment, we propose IndoKEPLER: a pretrained language model trained using Wikipedia Bahasa Indonesia and Wikidata. We also create a new knowledge probing benchmark named IndoLAMA to test the ability of a language model to recall factual knowledge. This experiment shows that IndoKEPLER has a higher ability to recall factual knowledge compared to the text encoder it’s based on."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Krulee, Gilbert K.
Englewood Cliffs, NJ: Prentice-Hall, 1991
004.3 KRU c
Buku Teks SO  Universitas Indonesia Library
cover
Petrov, Slav
"This book develops a general coarse-to-fine framework for learning and inference in large statistical models for natural language processing.
Coarse-to-fine approaches exploit a sequence of models which introduce complexity gradually. At the top of the sequence is a trivial model in which learning and inference are both cheap. Each subsequent model refines the previous one, until a final, full-complexity model is reached. Applications of this framework to syntactic parsing, speech recognition and machine translation are presented, demonstrating the effectiveness of the approach in terms of accuracy and speed. "
Berlin: Springer, 2012
e20399710
eBooks  Universitas Indonesia Library
cover
Heninggar Septiantri
"Ambiguitas adalah masalah yang seringkali ditemui dalam pemrosesan bahasa alami oleh komputer. Word Sense Disambiguation (WSD) adalah upaya untuk menentukan makna yang tepat dari sebuah kata yang ambigu. Berbagai penelitian tentang WSD telah banyak dikerjakan, namun penelitian WSD untuk bahasa Indonesia belum banyak dilakukan. Ketersediaan korpus paralel berbahasa Inggris-Indonesia dan sumber pengetahuan bahasa berupa WordNet bahasa Inggris dan bahasa Indonesia dapat dimanfaatkan untuk menyediakan data pelatihan untuk WSD dengan metode Cross-Lingual WSD (CLWSD). Data pelatihan ini kemudian dijadikan input untuk klasifikasi dengan algoritma Naive Bayes, sehingga model klasifikasinya dapat digunakan untuk melakukan monolingual WSD untuk bahasa Indonesia.
Evaluasi klasifikasi menunjukkan rata-rata akurasi hasil klasifikasi lebih tinggi dari baseline. Penelitian ini juga menggunakan stemming dan stopwords removal untuk mengetahui bagaimana efeknya terhadap klasifikasi. Penggunaan stemming menaikkan rata-rata akurasi, sedangkan penerapan stopwords removal menurunkan rata-rata akurasi. Namun pada kata yang memiliki dua makna dalam konteks yang cukup jelas berbeda, stemming dan stopwords removal dapat menaikkan rata-rata akurasi.

Ambiguity is a problem we frequently face in natural languange processing. Word Sense Disambiguation (WSD) is an attempt to decide the correct sense of an ambiguous word. Various research in WSD have been conducted, but research in WSD for Indonesian Language is still rare to find. The availability of parallel corpora in English and Indonesian language and WordNet for both language can be used to provide training data for WSD with Cross-Lingual WSD (CLWSD) method. This training data can be used as input to the classification process using Naive Bayes classifier.
The model resulted by the classification process is then used to do monolingual WSD for Indonesian language. The whole process in this research results in higher accuracy compared to baseline. This research also includes the use of stemming and stopwords removal. The effect of stemming is increasing the average accuracy, whereas stopwords removal is decreasing average accuracy. Nevertheless, for ambiguous words that have distinct context of usage, the use of stemming and stopwords removal can increase average accuracy."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2013
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ricky Nauvaldy Ruliputra
"ABSTRAK
Banyaknya pengguna internet di Indonesia berkontribusi pada potensi pertumbuhan Indonesia secara umum terutama dalam sisi ekonomi digital. Pesatnya pertumbuhan ini mendorong pemerintah untuk merencanakan revolusi industri 4.0. Pada praktisnya, landasan dalam membangun sistem yang diperlukan dalam revolusi industri 4.0 adalah teknologi artificial intelligence (AI). Inovasi dalam bidang AI banyak datang dari perusahaan startup. Meskipun pemanfaatan AI membawa banyak manfaat, 60% dari perusahaan belum memanfaatkan teknologi tersebut pada area fungsional seperti layanan chatbot, robot layanan pelanggan, otomasi proses robotik, monitoring media, dan pengamatan sosial. Celah ini perlu disikapi melihat bahwa 89% dari pengguna internet di Indonesia memanfaatkan layanan chatting, dan 87% lebih untuk media sosial. Pemanfaatan AI dapat dilakukan salah satu caranya adalah dengan menggunakan jasa perusahaan yang bergerak di bidang AI, namun pemetaan dari startup yang bergerak di bidang AI belum tersedia. Selain itu, dampak praktis dari penerapan AI di Indonesia perlu untuk dilakukan sebagai motivasi dan juga pengetahuan bagi pihak yang belum menerapkan AI sebagai bagian dari proses bisnis perusahaan. Penelitian ini melakukan pemetaan terhadap perusahaan startup di Indonesia yang bergerak di bidang AI, dan didapatkan 68 perusahaan startup yang terpetakan. Selain itu, penelitian ini juga melakukan identifikasi dampak dari penerapan AI bagi perusahaan dari perspektif startup penyedia layanan dengan melakukan wawancara kepada level-C dan manajer produk perusahaan penyedia layanan, dan mendapatkan bahwa dampak yang terjadi dapat dikategorikan ke dalam delapan aspek, yaitu motivasi, keuntungan, kepentingan, perubahan strategi, tantangan, kepuasan, kepercayaan, dan etika. Rekomendasi yang dapat diberikan kepada perusahaan klien terkait dengan penerapan NLP meliputi otomasi, kolaborasi, pengembangan berlanjut, humanisasi, melihat pasar, melihat peluang, tahu tujuan, siap secara teknis, dan berani mencoba.

ABSTRACT
The large number of internet users in Indonesia contributes to Indonesia's growth potential in general, especially in the digital economy. This rapid growth urged the government to plan for the industrial 4.0 revolution. In practice, the basis for building industrial 4.0 system is artificial intelligence (AI) technology. Innovations in the field of AI come from many startup companies. Despite of many benefits obtained from the use of AI, 60% of the companies have not utilized the technology in functional areas such as chatbot services, customer service robots, automation of robotic processes, media monitoring, and social observation. This gap needs to be addressed considering that more than 89% of internet users in Indonesia utilize chat services, and more than 87% of them use it for social media. The use of AI can be done one way is to use the services of companies engaged in AI. However, startup mapping from AI-based startups is not yet available. In addition, the practical impact of implementing AI in Indonesia needs to be done as motivation and knowledge for those who have not implemented AI as part of the company's business processes. This research mapped the startups in Indonesia who are engaged in AI, and obtained 68 mapped startup companies. In addition, this study also evaluates the implementation of AI for companies from the perspective of the implementor by conducting interviews with C-Levels and product managers of the service provider, and found that the impacts can be categorized into eight categories, namely motivation, profit, interest, change in strategy, competition, satisfaction, trust, and ethics. Recommendations is given to companies related to NLP related to automation, collaboration, accepted development, humanization, looking at the market, seeing opportunities, knowing goals, preparing technically, and dare to try.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Fakultas Teknik Universitas Indonesia, 1993
S38343
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Ravi Shulthan Habibi
"Sistem tanya jawab merupakan salah satu tugas dalam domain natural language processing (NLP) yang sederhananya bertugas untuk menjawab pertanyaan sesuai konteks yang pengguna berikan ke sistem tanya jawab tersebut. Sistem tanya jawab berbahasa Indonesia sebenarnya sudah ada, namun masih memiliki performa yang terbilang kurang baik. Penelitian ini bereksperimen untuk mencoba meningkatkan performa dari sistem tanya jawab berbahasa Indonesia dengan memanfaatkan natural language inference (NLI). Eksperimen untuk meningkatkan sistem tanya jawab berbahasa Indonesia, penulis menggunakan dua metode, yaitu: intermediate-task transfer learning dan task recasting sebagai verifikator. Dengan metode intermediate-task transfer learning, performa sistem tanya jawab berbahasa Indonesia meningkat, hingga skor F1-nya naik sekitar 5.69 dibandingkan tanpa menggunakan pemanfaatan NLI sama sekali, dan berhasil mendapatkan skor F1 tertinggi sebesar 85.14, namun, peningkatan performa dengan metode intermediate-task transfer learning cenderung tidak signifikan, kecuali pada beberapa kasus khusus model tertentu. Sedangkan dengan metode task recasting sebagai verifikator dengan parameter tipe filtering dan tipe perubahan format kalimat, performa sistem tanya jawab berbahasa Indonesia cenderung menurun, penurunan performa ini bervariasi signifikansinya. Pada penelitian ini juga dilakukan analisis karakteristik pasangan konteks-pertanyaan-jawaban seperti apa yang bisa dijawab dengan lebih baik oleh sistem tanya jawab dengan memanfaatkan NLI, dan didapatkan kesimpulan bahwa: performa sistem tanya jawab meningkat dibandingkan hasil baseline-nya pada berbagai karakteristik, antara lain: pada tipe pertanyaan apa, dimana, kapan, siapa, bagaimana, dan lainnya; kemudian pada panjang konteks ≤ 100 dan 101 ≤ 150; lalu pada panjang pertanyaan ≤ 5 dan 6 ≤ 10; kemudian pada panjang jawaban golden truth ≤ 5 dan 6 ≤ 10; lalu pada keseluruhan answer type selain law dan time; terakhir pada reasoning type WM, SSR, dan MSR.

The question-answering system is one of the tasks within the domain of natural language processing (NLP) that, in simple terms, aims to answer questions based on the context provided by the user to the question-answering system. While there is an existing Indonesian question-answering system, its performance is considered somewhat inadequate. This research conducts experiments to improve the performance of the Indonesian question answering system by utilizing natural language inference (NLI). In order to enhance the Indonesian question-answering system, the author employs two methods: intermediate task transfer learning and task recasting as verifiers. Using the intermediate-task transfer learning method, the performance of the Indonesian question-answering system improves significantly, with an increase of approximately 5.69 in F1 score compared to not utilizing NLI at all, achieving the highest F1 score of 85.14. However, the performance improvement with the intermediate-task transfer learning method tends to be non-significant, except in certain specific cases and particular models. On the other hand, employing the task recasting method as a verifier with filtering parameter type and sentence format change type leads to a decline in the performance of the Indonesian question-answering system, with the significance of this performance decrease varying. Additionally, this research conducts an analysis on the characteristics of context-question-answer pairs that can be better answered by the question-answering system utilizing NLI. The findings conclude that the question-answering system’s performance improves compared to its baseline across various characteristics, including different question types such as what, where, when, who, how, and others. Furthermore, it improves with context lengths ≤ 100 and 101 ≤ 150, question lengths ≤ 5 and 6 ≤ 10, as well as answer lengths (golden truth) ≤ 5 and 6 ≤ 10. Additionally, it performs better in overall answer types excluding law and time, and lastly, in reasoning types WM, SSR, and MSR.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dickinson, Markus
Chichester: Wiley-Blackwell, 2013
410.285 DIC l
Buku Teks  Universitas Indonesia Library
cover
Christian Chiarcos, editor
"The contributions assembled in this volume illustrate the band-width of applications of the Linked Data paradigm for representative types of language resources. They cover lexical-semantic resources, annotated corpora, typological databases as well as terminology and metadata repositories. The book includes representative applications from diverse fields, ranging from academic linguistics (e.g., typology and corpus linguistics) over applied linguistics (e.g., lexicography and translation studies) to technical applications (in computational linguistics, natural language processing and information technology).
This volume accompanies the Workshop on Linked Data in Linguistics 2012 (LDL-2012) in Frankfurt/M., Germany, organized by the Open Linguistics Working Group (OWLG) of the Open Knowledge Foundation (OKFN). It assembles contributions of the workshop participants and, beyond this, it summarizes initial steps in the formation of a Linked Open Data cloud of linguistic resources, the Linguistic Linked Open Data cloud (LLOD).
"
Berlin : [, Springer-Verlag], 2012
e20410615
eBooks  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>