Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 3 dokumen yang sesuai dengan query
cover
Jaycent Gunawan Ongris
"The rise of large language models (LLMs) has advanced information retrieval, but issues like limited knowledge updating, lack of openness, and hallucinations persist. Retrieval-Augmented Generation (RAG) addresses these, though it lacks interpretability due to reliance on vector-based representations. Our research presents a RAG framework using a knowledge graph (KG) as the primary knowledge base, with only open-source components to allow for user customization. The main pipeline consists of entity linking, retrieval using verbalized sentences or SPARQL query generation, and answer generation, integrated with ontology (properties and classes) retrieval via a vector database. The pipeline is tested on Wikidata, DBpedia, and a local domain-specific KG, achieving accuracies of 0.458, 0.517, and 0.805, respectively. An ablation study further reveals that ontology retrieval is the most critical component in providing context to the LLM for generating accurate SPARQL queries.

Munculnya large language models (LLMs) telah memajukan bidang information retrieval, tetapi masalah seperti keterbatasan pembaruan pengetahuan, kurangnya keterbukaan, dan halusinasi masih ada. Retrieval-Augmented Generation (RAG) membantu mengatasi beberapa tantangan ini tetapi memiliki keterbatasan dalam interpretabilitas karena bergantung pada representasi berbasis vektor. Penelitian ini memperkenalkan sebuah kerangka kerja RAG yang menggunakan graf pengetahuan (KG) sebagai basis pengetahuan utama, dengan hanya menggunakan komponen open-source untuk memungkinkan kustomisasi pengguna. Pipeline utama terdiri dari penghubungan entitas, retrieval menggunakan kalimat hasil verbalisasi atau pembuatan kueri SPARQL, dan pembangkitan jawaban, yang terintegrasi dengan retrieval ontologi (properti dan kelas) melalui basis data vektor. Kerangka kerja ini diuji pada Wikidata, DBpedia, dan KG dengan domain spesifik lokal, dengan akurasi masing-masing 0,458, 0,517, dan 0,805. Studi ablasi lebih lanjut mengungkapkan bahwa retrieval ontologi adalah komponen yang paling utama dalam memberikan konteks kepada LLM untuk bisa membangkitkan kueri SPARQL yang akurat."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Eduardus Tjitrahardja
"The rise of large language models (LLMs) has advanced information retrieval, but issues like limited knowledge updating, lack of openness, and hallucinations persist. Retrieval-Augmented Generation (RAG) addresses these, though it lacks interpretability due to reliance on vector-based representations. Our research presents a RAG framework using a knowledge graph (KG) as the primary knowledge base, with only open-source components to allow for user customization. The main pipeline consists of entity linking, retrieval using verbalized sentences or SPARQL query generation, and answer generation, integrated with ontology (properties and classes) retrieval via a vector database. The pipeline is tested on Wikidata, DBpedia, and a local domain-specific KG, achieving accuracies of 0.458, 0.517, and 0.805, respectively. An ablation study further reveals that ontology retrieval is the most critical component in providing context to the LLM for generating accurate SPARQL queries.

Munculnya large language models (LLMs) telah memajukan bidang information retrieval, tetapi masalah seperti keterbatasan pembaruan pengetahuan, kurangnya keterbukaan, dan halusinasi masih ada. Retrieval-Augmented Generation (RAG) membantu mengatasi beberapa tantangan ini tetapi memiliki keterbatasan dalam interpretabilitas karena bergantung pada representasi berbasis vektor. Penelitian ini memperkenalkan sebuah kerangka kerja RAG yang menggunakan graf pengetahuan (KG) sebagai basis pengetahuan utama, dengan hanya menggunakan komponen open-source untuk memungkinkan kustomisasi pengguna. Pipeline utama terdiri dari penghubungan entitas, retrieval menggunakan kalimat hasil verbalisasi atau pembuatan kueri SPARQL, dan pembangkitan jawaban, yang terintegrasi dengan retrieval ontologi (properti dan kelas) melalui basis data vektor. Kerangka kerja ini diuji pada Wikidata, DBpedia, dan KG dengan domain spesifik lokal, dengan akurasi masing-masing 0,458, 0,517, dan 0,805. Studi ablasi lebih lanjut mengungkapkan bahwa retrieval ontologi adalah komponen yang paling utama dalam memberikan konteks kepada LLM untuk bisa membangkitkan kueri SPARQL yang akurat."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2025
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Faraya Agatha Putri
"

Karya sastra merupakan hal yang perlu dilestarikan, karena melestarikan karya sastra juga berarti melestarikan bahasa. Upaya pelestarian dapat dilakukan dengan berbagai cara, salah satunya dengan memanfaatkan teknologi. Implementasi upaya yang dapat dilakukan dengan memanfaatkan teknologi adalah dengan melakukan ekstraksi entitas karya sastra secara otomatis. Dari data ekstraksi tersebut dapat dibangun knowledge base agar informasi menjadi lebih terstruktur dan dapat diatur dengan mudah. Penelitian ini menggunakan sumber data dari 435 halaman sastrawan Indonesia pada Wikipedia berbahasa Indonesia. Terdapat dua proses ekstraksi pada penelitian ini, yaitu ekstraksi daftar dan ekstraksi tabel. Pada akhir penelitian ini, diperoleh 4953 entitas karya sastra yang terpetakan ke dalam 14 kategori karya sastra. Kualitas hasil ekstraksi pada penelitian ini diukur dengan nilai precision dan recall. Nilai precision dan recall didapatkan dari hasil perbandingan data hasil ekstraksi dengan data golden result yang merupakan data yang disusun secara manual dari halaman-halaman sastrawan Indonesia. Nilai precision dan recall pada penelitian ini adalah 0.608 untuk precision dan 0.571 untuk recall.


Literature work needs to be preserved because it also means preserving a language. There are many preserving methods, one of them is using technology. The implementation of using technology as a preserving method is by automatically extracting the literature work entities. From that data extraction, a knowledge base can be built to make the information more structured and easy to manage. This research used 435 Wikipedia pages about Indonesian litterateur as a source of data extraction. Two extraction processes have been implemented, which are list extraction and table extraction. At the end of this research, 4953 literature work entities that mapped into 14 literature work categories were obtained. The quality of the data extraction results in this research was measured by precision and recall value. The precision and recall value was obtained from comparing the data extraction result with the golden result which is data that was organized manually from Wikipedia pages about Indonesian litterateur. The precision and recall value of this research are 0.608 for precision value and 0.571 for recall value.

"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library