Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 75375 dokumen yang sesuai dengan query
cover
Muhamad Abdurahman
"Dokumen peraturan perundang-undangan pada umumnya tersedia dalam bentuk PDF
yang bersifat tidak machine-readable, sehingga data tidak dapat diproses secara otoma-tis dan dalam skala besar oleh komputer untuk dimanfaatkan dalam berbagai teknologi digital. Oleh karena itu diperlukan struktur data yang dapat memuat informasi peraturan perundang-undangan, beserta sistem yang melakukan konversi dari PDF menjadi struk-tur data tersebut. Dengan alasan tersebut, pada penelitian ini penulis mengembangkan Lex2KG, framework untuk mengonversi dokumen PDF peraturan perundang-undangan di Indonesia (Lex berasal dari Bahasa Latin yang berarti hukum) menjadi knowledge gra-ph. Knowledge graph (KG) adalah graph yang menggambarkan entitas dunia nyata be-serta keterkaitannya dan memberikan informasi terstruktur yang machine-readable. Pada penelitian ini KG dipilih dari berbagai struktur data yang tersedia karena KG terkate-gori sebagai 5-star data menurut 5-star deployment scheme for Open Data, yaitu data dengan jenis informasi paling bermanfaat, memberikan data dalam bentuk open license,terstruktur, tersedia dalam open format, menggunakan URI sebagai notasi data, dan dapat dihubungkan (linked) dengan data lain. KG peraturan perundang-undangan mengandung berbagai data terstruktur konten tekstual, struktur dokumen, seperti metadata, serta relasi antara peraturan seperti amendemen dan rujukan. Lex2KG memungkinkan pemanfaatan data peraturan perundang-undangan secara advanced, otomatis, dan dalam skala besar pada berbagai lingkup digital terutama pada industrsi hukum dan pengacara. Contoh pemanfaatan data dapat berupa search engine, sistem question answering, dan analisis statistik peraturan perundang-undangan. Menggunakan Lex2KG, penulis berhasil meng-onversi 784 undang-undang menjadi KG dengan ukuran total lebih dari 1,1 juta triple.
Salah satu peraturan yang berhasil dikonversi adalah UU 11/2020 tentang Cipta Kerja
yang kontennya bersifat relatif kompleks dan berukuran besar. Penulis juga menunjuk-
an use case dari KG peraturan perundang-undangan yaitu chat bot sederhana, SPARQL
query, dan visualisasi peraturan perundang-undangan

Most of the legal documents are available as PDF which is not machine-readable, which
means the data could not be processed automatically and in large scale by a computer
to be utilized in various digital technology. Therefore, we need a data structure that can
contain a legal information, and also a system which converts PDF into that structure. For
that reason, in this research, author developed Lex2KG, a framework wh converting legal
PDF documents in Indonesia (Lex comes from Latin which means law) into a Knowledge
Graph. A knowledge graph (KG) is a graph that describes real-world entities and their
relationships as machine-readable and structured information, and linkable to another KG
on different domain. In this research KG is choosen from various data structure available
because KG it categorized as 5-star data according to 5-star deployment scheme for Open
Data, which data comes with most beneficial information, available under an open licen-
se, structured, open format, uses URI to denote things, and linkable to other data. The
legal KG contains various kinds of structured data such as textual content, document stru-
ctures, metadata, and relations between law such as amendments and citations. Lex2KG
enables the advanced and automatic utilization of legal data on a large scale on a various
digital scope especially on legal industry and lawyer. The utilization could be in form
of search engine, question answering system, and statistics analytics for legals. Through
Lex2KG, author have successfully converted 784 Indonesian laws into a KG with a total
size of over 1.1 million triples. One of the regulation that was successfully converted was
Law 11/2020 on Job Creation, which the content is relatively complex and large. Author
also shows use cases of the legal KG for simple chatbots, SPARQL querying, and legal
visualizations.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Siti Muninggar
"Sebagai penganut Teori Fiksi Hukum, pemerintah Indonesia memiliki konsekuensi untuk memastikan dokumen peraturan perundang-undangan mudah diakses publik. Salah satu cara yang ditempuh adalah menyediakan akses dokumen peraturan perundang-undangan secara gratis melalui situs online. Namun, sistem pencarian yang dimiliki oleh situs tersebut, tidak memberikan hasil yang relevan untuk pencarian dokumen yang berelasi dengan dokumen lain seperti peraturan amandemen. Hal ini disebabkan oleh sistem pencarian yang hanya berbasis teks dan tidak dapat menangkap relasi yang ada baik di dalam dokumen maupun relasi yang dimilikinya ke dokumen lain. Penelitian ini mengusulkan konstruksi sebuah knowledge graph (KG), yang dinamai LexID, yang merepresentasikan peraturan perundang-undangan Indonesia yang dapat digunakan untuk meningkatkan sistem pencarian hukum yang telah dimiliki. Penelitian ini juga memperkenalkan LexID-S, sebuah ontologi hukum yang berperan sebagai skema LexiD KG tersebut dan mencakup representasi metadata dan struktur dokumen peraturan, serta representasi semantik klausa hukum. Konstruksi KG yang dilakukan dalam penelitian menggunakan metode rule-based. Kemampuan KG hasil konstruksi untuk menjawab kebutuhan informasi pengguna dievaluasi melalui ketepatan jawaban dari kueri SPARQL yang merepresentasikan kebutuhan informasi kepada semua informasi yang telah diekspresikan dalam ontologi LexID-S dan KG LexID. Dari hasil uji diperoleh bahwa KG LexID berhasil menjawab kebutuhan informasi dengan nilai rerata makro F1 adalah 0.91.

The Indonesian government needs to ensure the accessibility of its legal documents. Because of that, the government provides free access to legal documents through an online site. Unfortunately, there is a challenge while looking for a legal document that relates to another. The site does not give the relevant results because its text-based search system can not capture the relationship within or between the legal documents. In this research, we propose the construction of a knowledge graph (KG), named LexID, to represent the Indonesian legal documents which aim to be used to improve the existing legal search system. We construct the KG using the rule-based method. In this research, we also introduce the legal ontology we use, named LexID-S, as the basis of the construction. The ontology includes a legal document's metadata and structure representation and the semantic representation of legal clauses. In addition, we give some examples to show how to retrieve the information of our KG using SPARQL. We evaluate the ability of our KG to answer the user's information needs using SPARQL and get the macro average of F1 of our KG is about 0.91."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Valentino Vito
"Teori graf adalah sebuah bidang studi interdisipliner yang memiliki berbagai aplikasi dalam pemodelan matematika dan ilmu komputer. Penelitian dalam teori graf tidak hanya bergantung pada teorema baru, namun juga pada konjektura baru. Algoritma penyanggah konjektura dapat digunakan untuk menyanggah suatu konjektura dengan cara mencari sebuah counterexample, seringnya dengan cara memaksimumkan suatu fungsi skor pada graf. Penelitian ini mengusulkan sebuah algoritma penyanggah konjektura baru, disebut sebagai algoritma adaptive Monte Carlo search (AMCS), yang diperoleh dari hasil modifikasi algoritma Monte Carlo tree search. Setelah dievaluasikan berdasarkan keberhasilannya dalam menemukan counterexample untuk beberapa konjektura teori graf, ditemukan bahwa AMCS mengungguli algoritma-algoritma penyanggah konjektura yang sudah ada. Algoritma tersebut kemudian digunakan untuk menyanggah enam konjektura terbuka, dua di antaranya merupakan konjektura teori graf kimia yang diformulasikan oleh Liu et al. pada 2021 dan empat di antaranya diformulasikan menggunakan sistem komputer AutoGraphiX pada 2006. Akhirnya, empat dari enam konjektura terbuka tersebut disanggah secara kuat dengan cara memperumum konjektura yang telah diperoleh menggunakan AMCS untuk menghasilkan keluarga graf yang mengandung banyak counterexample. Algoritma ini diharapkan dapat membantu para peneliti menguji konjektura-konjektura yang berkaitan dengan teori graf secara lebih efektif.

Graph theory is an interdisciplinary field of study that has various applications in mathematical modeling and computer science. Research in graph theory depends on the creation of not only theorems but also conjectures. Conjecture-refuting algorithms attempt to refute conjectures by searching for counterexamples to those conjectures, often by maximizing certain score functions on graphs. This study proposes a novel conjecture-refuting algorithm, referred to as the adaptive Monte Carlo search (AMCS) algorithm, obtained by modifying the Monte Carlo tree search algorithm. Evaluated based on its success in finding counterexamples to several graph theory conjectures, AMCS outperforms existing conjecture-refuting algorithms. The algorithm is further utilized to refute six open conjectures, two of which were chemical graph theory conjectures formulated by Liu et al. in 2021 and four of which were formulated by the AutoGraphiX computer system in 2006. Finally, four of the open conjectures are strongly refuted by generalizing the counterexamples obtained by AMCS to produce a family of counterexamples. It is expected that the algorithm can help researchers test graph-theoretic conjectures more effectively"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Nadilah Tyassistha
"ABSTRAK
Mengolah data dalam bentuk graf dapat dilakukan dengan cara clustering graf, yaitu mengelompokkan graf ke dalam cluster-cluster dimana data pada satu cluster memiliki karakter yang relatif sama. Two way spectral clustering adalah salah satu cara clustering graf yang menggunakan informasi dari dua nilai eigen untuk mendapatkan dua cluster setiap melakukan proses clustering. Pada skripsi ini akan dibahas bagaimana cara clustering graf dengan metode two way spectral clustering berdasarkan kriteria partisi graf dan akan dilakukan simulasi untuk melihat hasil clustering menggunakan graf terhubung dan graf tidak terhubung.

ABSTRACT
Data processing of graph data can be done by graph clustering, where data are grouped into clusters which data on each cluster have the similar characteristic. Two way spectral clustering is one of a graph clustering which using the smallest two eigenvalues to obtain two clusters. This skripsi will discuss how to clustering graph with two way spectral clustering method based on graph partitioning criteria and moreover data simulations will be conducted to see the results of clustering using a connected and disconnected graphs.
"
2015
S61798
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rostika Listyaningrum
"Misalkan 𝐺 adalah graf berarah asiklik. Matriks adjacency dari graf berarah 𝐺 dengan 𝑉 𝐺 = 𝑣1, 𝑣2, ? , 𝑣𝑛 adalah matriks 𝐴 = 𝑎𝑖𝑗 berukuran 𝑛 × 𝑛 di mana 𝑎𝑖𝑗 = 1, untuk 𝑖 ≠ 𝑗 jika terdapat busur berarah dari 𝑣𝑖 ke 𝑣𝑗 , 𝑎𝑖𝑗 = 0 untuk yang lainnya. Matriks antiadjacency dari graf berarah G adalah matriks 𝐵 = 𝐽 − 𝐴 dengan 𝐽 adalah matriks berukuran n × n yang semua entrinya adalah 1. Pada tesis ini diberikan kaitan nilai eigen terbesar matriks antiadjacency dengan derajat terkecil, derajat terbesar graf berarah asiklik yaitu graf bipartit lengkap berarah 𝐾 𝑟,𝑠 dengan 𝑟, 𝑠 ≥ 1, graf lintasan lengkap berarah 𝐶 𝑃 𝑛 dengan 𝑛 ≥ 3, graf lingkaran berarah asiklik 𝐶𝑛 , dan graf lintasan berarah 𝑃 𝑛. Selain hal tersebut juga diberikan relasi nilai eigen terbesar matriks antiadjacency dengan operasi maksimum dari dua graf berarah asiklik.

Let 𝐺 be a directed acyclic graph. The adjacency matrix of directed graph 𝐺 with 𝑉 𝐺 = 𝑣1, 𝑣2, ? , 𝑣𝑛 is a matrix 𝐴 = 𝑎𝑖𝑗 of order 𝑛 × 𝑛, where 𝑎𝑖𝑗 = 1 for 𝑖 ≠ 𝑗 if there is an arc from 𝑣𝑖 to 𝑣𝑗 , otherwise 𝑎𝑖𝑗 = 0. Antiadjacency matrix of directed graph 𝐺 is a matrix 𝐵 = 𝐽 − 𝐴, with 𝐽 is a matrix of order 𝑛 × 𝑛 with all entries are 1. In this thesis is given relation between the largest eigen value of antiadjacency matrix with degree minimum and degree maximum of directed acyclic graphs that are complete bipartite directed graph 𝐾 𝑟 ,𝑠 with 𝑟, 𝑠 ≥ 1, complete path directed graph 𝐶 𝑃 𝑛 with 𝑛 ≥ 3, acyclic cycle directed graph with 𝑛 ≥ 4 and path directed graph with 𝑛 ≥ 3. In addition, here are also given relation between the largest eigen value of antiadjacency matrix and maximum operation of two directed acyclic graph."
Depok: Universitas Indonesia, 2015
T43809
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aulia Nur Fadhilah
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Halif
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
Unggah3  Universitas Indonesia Library
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
Unggah3  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>