UI - Skripsi Membership :: Kembali

UI - Skripsi Membership :: Kembali

FrOG: Framework of Open GraphRAG = FrOG: Framework of Open GraphRAG

Jaycent Gunawan Ongris; Eduardus Tjitrahardja; Fariz Darari, supervisor; Fajar Juang Ekaputra, supervisor; Amril Syalim, examiner; Muhammad Febrian Rachmadi, examiner (Fakultas Ilmu Komputer Universitas Indonesia, 2024)

 Abstrak

The rise of large language models (LLMs) has advanced information retrieval, but issues like limited knowledge updating, lack of openness, and hallucinations persist. Retrieval-Augmented Generation (RAG) addresses these, though it lacks interpretability due to reliance on vector-based representations. Our research presents a RAG framework using a knowledge graph (KG) as the primary knowledge base, with only open-source components to allow for user customization. The main pipeline consists of entity linking, retrieval using verbalized sentences or SPARQL query generation, and answer generation, integrated with ontology (properties and classes) retrieval via a vector database. The pipeline is tested on Wikidata, DBpedia, and a local domain-specific KG, achieving accuracies of 0.458, 0.517, and 0.805, respectively. An ablation study further reveals that ontology retrieval is the most critical component in providing context to the LLM for generating accurate SPARQL queries.

Munculnya large language models (LLMs) telah memajukan bidang information retrieval, tetapi masalah seperti keterbatasan pembaruan pengetahuan, kurangnya keterbukaan, dan halusinasi masih ada. Retrieval-Augmented Generation (RAG) membantu mengatasi beberapa tantangan ini tetapi memiliki keterbatasan dalam interpretabilitas karena bergantung pada representasi berbasis vektor. Penelitian ini memperkenalkan sebuah kerangka kerja RAG yang menggunakan graf pengetahuan (KG) sebagai basis pengetahuan utama, dengan hanya menggunakan komponen open-source untuk memungkinkan kustomisasi pengguna. Pipeline utama terdiri dari penghubungan entitas, retrieval menggunakan kalimat hasil verbalisasi atau pembuatan kueri SPARQL, dan pembangkitan jawaban, yang terintegrasi dengan retrieval ontologi (properti dan kelas) melalui basis data vektor. Kerangka kerja ini diuji pada Wikidata, DBpedia, dan KG dengan domain spesifik lokal, dengan akurasi masing-masing 0,458, 0,517, dan 0,805. Studi ablasi lebih lanjut mengungkapkan bahwa retrieval ontologi adalah komponen yang paling utama dalam memberikan konteks kepada LLM untuk bisa membangkitkan kueri SPARQL yang akurat.

 File Digital: 1

Shelf
 S-Eduardus Tjitrahardja.pdf :: Unduh

LOGIN required

 Metadata

Jenis Koleksi : UI - Skripsi Membership
No. Panggil : S-pdf
Entri utama-Nama orang :
Entri tambahan-Nama orang :
Entri tambahan-Nama badan :
Program Studi :
Subjek :
Penerbitan : Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
Bahasa : eng
Sumber Pengatalogan : LibUI eng rda
Tipe Konten : text
Tipe Media : computer
Tipe Carrier : online resource
Deskripsi Fisik : xvi, 125 pages : illustration + appendix
Naskah Ringkas :
Lembaga Pemilik : Universitas Indonesia
Lokasi : Perpustakaan UI
  • Ketersediaan
  • Ulasan
  • Sampul
No. Panggil No. Barkod Ketersediaan
S-pdf 14-25-32259106 TERSEDIA
Ulasan:
Tidak ada ulasan pada koleksi ini: 9999920568537
Cover