Hasil Pencarian

Ditemukan 138318 dokumen yang sesuai dengan query

Rani Aulia Hidayat

Sistem temu balik entitas makanan pada korpus dokumen berbahasa Indonesia = On retrieving food entities from Indonesian corpus

"Makanan merupakan salah satu kebutuhan penting bagi masyarakat, sehingga pencarian mengenai informasi yang berkaitan dengan makanan banyak dilakukan. Sering kali informasi yang dibutuhkan adalah informasi spesifik yang dapat direpresentasikan sebagai entitas. Sehingga saat seseorang melakukan pencarian menggunakan suatu kueri, hasil yang diharapkan dari proses pencarian tersebut berupa entitas yang relevan. Sistem yang dapat menangani tugas tersebut disebut sebagai sistem temu balik entitas.

Penelitian ini bertujuan untuk membangun sistem temu balik entitas makanan dengan memanfaatkan informasi relasi antar entitas, teknik ekstraksi entitas, document retrieval, dan word embedding pada korpus dokumen berbahasa Indonesia. Dokumen yang digunakan pada penelitian ini adalah dokumen resep, artikel terkait informasi kuliner, dan Wikipedia berbahasa Indonesia. Sebanyak tujuh kategori entitas terkait makanan didapatkan dari proses ekstraksi entitas.

Pendekatan rule-based dan lexicon-based digunakan untuk mengekstrak entitas dari dokumen. Aturan-aturan untuk pendekatan rule-based dibangun untuk masing-masing jenis dokumen berdasarkan sampel dokumen yang dipilih secara acak. Sebanyak tiga skenario eksperimen diujikan terhadap 14 kueri yang dikelompokkan ke dalam tujuh kategori. Setiap skenario dievaluasi menggunakan nilai rata-rata precision berdasarkan k entitas yang dikembalikan (AP@k).

Berdasarkan hasil evaluasi menggunakan seluruh kueri uji, skenario ketiga dengan menggunakan informasi relasi entitas menunjukkan performa terbaik dibandingkan dengan skenario lainnya. Nilai AP@15 tertinggi yang didapatkan menggunakan skenario eksperimen ketiga ini adalah sebesar 76,67% untuk kategori kueri hidangan dengan bahan dasar tertentu.

Food is known as one of the most important needs so that many people search for food-related information. The information that is needed is often specific information that can be represented as an entity. So that when someone performs a search from a certain query, the expected results are entities that are considered relevant. The task to solve this problem is known as entity retrieval.
This research aims to build a food entity retrieval model by utilizing information on relationships between entities, entity extraction techniques, document retrieval, and word embedding in the Indonesian document corpus. The documents used in this research are recipes, food-related articles, and articles of Wikipedia in Indonesian. A total of seven food-related categories of entities were obtained from the entity extraction process.
The approaches that are used in this study to extract entities from the documents are the rule-based and lexicon-based approaches. The rules in the rule-based approach are developed for each document category based on the sample documents that have been chosen randomly. The three experiments that were conducted were tested against 14 queries which were grouped into seven categories. Each scenario is evaluated using the average precision score based on k entities given as the result of entity retrieval (AP@k).
Based on the evaluation results using all the test queries, the third scenario that used entity-relationship information shows the best performance compared to other scenarios. The highest AP@15 value obtained when using this third experimental scenario is 76.67% for the query category dish based on certain ingredients."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Heidi Renata Halim

Deteksi Pertanyaan Duplikat Pada Forum Kesehatan Berbahasa Indonesia Dengan Ekspansi Kata = Duplicate Question Detection in Indonesian Health Forum With the Help of Term Expansion

"Seiring dengan majunya teknologi di Indonesia, banyak layanan kesehatan online yang bermunculan. Pengguna bisa bertanya langsung pada tenaga medis profesional tiap mereka memiliki masalah kesehatan ringan yang tidak membutuhkan janji temu langsung dengan dokter. Sebagai pengguna, tentunya mereka mengharapkan respon yang cepat dari situs yang mereka gunakan, hal ini kedengarannya mustahil dilakukan karena tidak semua tenaga medis profesional yang bekerja pada layanan medis tersebut ada setiap saat memantau semua pertanyaan yang masuk. Namun, hal ini bisa dilakukan dengan cara mencocokan pertanyaan yang baru dimasukkan dan mencari pertanyaan yang sudah pernah ditanyakan di masa lalu yang memiliki persamaan dengan pertanyaan yang baru dimasukkan. Secara singkat, kita bisa mencari duplikat dari pertanyaan yang ditanyakan oleh pengguna dan mengembalikan jawaban dari pertanyaan duplikat tersebut daripada menunggu jawaban langsung dari dokter. Penelitian ini akan menggunakan pendekatan temu balik informasi dalam mendeteksi pertanyaan duplikat yang pernah ditanyakan di masa lalu. Selain itu, penelitian ini juga akan mengkombinasikan ekspansi kata yang dilakukan kepada kueri, dokumen, serta filter kata-kata stopword untuk meningkatkan skor reciprocal-rank dan recall dari model yang digunakan. Hasil penelitian ini menyimpulkan bahwa ekspansi kata yang dilakukan pada kueri serta dokumen tidak menghasilkan skor reciprocal rank dan recall yang lebih baik. Penggunaan word embedding untuk memperbanyak kata stopword yang dihapus dari data mampu menghasilkan skor reciprocal rank yang lebih tinggi meskipun nilainya belum signifikan.

With the advancement of technology and internet in Indonesia, many online healthcare services have emerged where users can directly consult with medical professionals if they have minor health issues that do not require an in-person appointment with a doctor. As users, they naturally expect quick responses from the sites they use. This seems impossible to do as not all medical professionals working who are working on these services are always available to monitor every incoming question. However, this can be achieved by matching newly submitted questions with previously asked questions that have similarities. In short, we can search for duplicates of the questions asked by users and return answers from those duplicate questions instead of waiting for a direct response from a doctor. This research will use an information retrieval approach to detect duplicate questions that have been asked in the past. Additionally, this study will combine query expansion, document expansion, and stopwords filtering to improve the reciprocal-rank and recall scores of the model used. This research concludes that query and document expansion do not yield better reciprocal rank and recall scores. On the other hand, using

word embedding to expand the stopwords list removed from the data can help achieve higher reciprocal rank scores, although the improvement displays are still not significant enough to be categorized as a major change."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Joshua Kurniawan Djafar

Pengolahan Bahasa Alami dalam Pemrosesan Kalimat Query Bahasa Indonesia

"Penerapan dari pengolahan bahasa alami ini telah banyak dilaksanakan dengan tujuan tertentu. Salah satu tujuannya adalah aplikasi basis data yang dikembangkan oleh program ini. Pada dasarnya program ini akan mengolah bentuk dari kalimat-kalimat query dalam bahasa Indonesia dan merubahnya menjadi bentuk SQL standar. SQL standar inilah yang akan diinterpretasikan oleh suatu RDBMS (Oracle, Informix,dan sebagainya). Kelemahan utama dari pengolahan bahasa alami ini adalah keterbatasan dari semantik kalimat yang disebabkan oleh keterbatasan yang ada pada SQL ini sendiri. Suatu kalimat membutuhkan suatu bentuk tata bahasa. Bagaimanapun alaminya suatu kalimat bahasa, kalimat tersebut pasti akan mengikuti kaidah umum yang ada pada suatu struktur tata bahasa. Penyusunan dari tata bahasa inilah yang merupakan hal yang terpenting dalam pengolahan bahasa alami. Tata bahasa semantik adalah tata bahasa yang disusun bukan berdasarkan pada sintak kalimat, tetapi disusun berdasarkan pada arti kata penyusun kalimat. Kebutuhan akan pembentukan tata bahasa semantic ini membutuhkan penelitian tersendiri untuk memperoleh struktur umum dari kalimat-kalimat yang akan digunakan oleh pemakai."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 1992

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Syandra Sari

Perolehan informasi lintas bahasa indonesia-inggris berdasarkan korpus paralel dengan menggunakan metoda mutual information dan metoda similarity thesaurus

"Perolehan informasi lintas bahasa adalah bidang perolehan informasi yang semakin berkembang seiring dengan pesatnya perkembangan Internet di seluruh dunia. Perolehan informasi lintas bahasa adalah sistem perolehan informasi yang memungkinkan pengguna memberikan query dalam bahasa yang berbeda dengan bahasa dokumen. Dalam perolehan informasi lintas bahasa, masalah perbedaan bahasa diatasi dengan proses penerjemahan dokumen atau penerjemahan query. Sumber daya bahasa yang digunakan untuk proses penerjemahan pada perolehan informasi lintas bahasa dapat berupa kamus dwi bahasa, mesin penerjemah atau korpus paralel. Penelitian ini mengembangkan sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel. Padanan kata dalam bahasa Indonesia-Inggris diperoleh dengan menggunakan dua metoda yaitu informasi mutual dan similarity thesaurus. Selanjutnya untuk meningkatkan hasil perolehan dokumen berdasarkan korpus paralel, maka diterapkan teknik perluasan query yaitu pseudo-relevance feedback. Kinerja terbaik dari metoda informasi mutual dan penerapan teknik perluasan query mencapai 41,86 % dari kinerja perolehan informasi lintas bahasa monolingual; 80,5 % dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan kamus; serta mencapai 54% dari kinerja sistem perolehan informasi lintas bahasa Indonesia-Inggris menggunakan mesin penerjemah Transtool. Sedangkan kinerja terbaik dari metoda similarity thesaurus dan penerapan teknik perluasan query mencapai 55,61 % dari kinerja perolehan informasi lintas bahasa monolingual; mencapai 107% dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan kamus; serta mencapai 71% dari kinerja perolehan informasi lintas bahasa Indonesia-Inggris dengan menggunakan mesin penerjemah Transtool. Berdasarkan hasil tersebut diatas, terlihat bahwa perluasan query dengan teknik pseudo-relevance feedback yang diterapkan pada sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel dengan metoda informasi mutual dan similarity thesaurus dapat meningkatkan kinerja sampai dengan 25 % dibanding tanpa proses perluasan query. Kemudian, dari hasil tersebut diatas juga dapat diambil kesimpulan umum bahwa sistem perolehan informasi lintas bahasa Indonesia-Inggris berdasarkan korpus paralel dapat menjadi alternatif bagi pengembangan sistem perolehan informasi lintas bahasa Indonesia-Inggris. Dan penelitian lebih lanjut mengenai metoda berdasarkan korpus paralel yang lebih baik serta usaha perbaikan kualitas korpus paralel perlu terus dilakukan bagi peningkatan kinerja sistem perolehan informasi lintas bahasa Indonesia-Inggris di masa yang akan datang."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Ade Melani

Peringkas otomatis untuk dokumen dalam bahasa indonesia menggunakan metode statis dan metode query-biased

"Perolehan informasi merupakan suatu bidang yang berusaha mengatasi permasalahan yang dihadapi pencari informasi dalam upaya memperoleh informasi yang dibutuhkan. Ketersediaan informasi dalam jumlah besar menyebabkan pencari informasi kesulitan dalam mendapatkan informasi yang diinginkannya. Hal itu juga menyebabkan pencari informasi harus meluangkan banyak waktu untuk membaca dokumen yang diperoleh. Oleh karena itu, salah satu pendekatan yang digunakan dalam bidang perolehan informasi untuk mempermudah dan mempersingkat waktu adalah dengan menggunakan ringkasan yang dihasilkan secara otomatis. Metode yang digunakan dalam menghasilkan ringkasan secara otomatis adalah metode query-biased. Sebab ringkasan yang dihasilkan dengan metode ini dapat merefleksikan informasi yang dibutuhkan oleh pencari informasi, yaitu ringkasan yang hasilnya sesuai dengan query yang diberikan. Dengan demikian, pencari informasi dapat menggunakan ringkasan tersebut untuk menentukan apakah suatu dokumen memuat informasi yang dicarinya. Dalam penerapannya, metode ini digunakan untuk meringkas dokumen dalam Bahasa Indonesia. Penulis melakukan evaluasi untuk mengetahui manfaat ringkasan yang dihasilkan dengan metode query-biased. Evaluasi tersebut dilaksanakan dengan membandingkan manfaat antara ringkasan yang dihasilkan dengan metode query-biased dengan ringkasan yang dihasilkan dengan metode statis, yaitu metode yang menggunakan beberapa kalimat di awal dokumen sebagai ringkasan. Dari hasil evaluasi diketahui bahwa ringkasan yang dihasilkan dengan metode query‐biased lebih bermanfaat dalam proses pencarian dokumen yang sesuai dengan query bila dibandingkan dengan ringkasan yang dihasilkan melalui metode statis."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2007

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Framadhana Arnely

Sistem perolehan gambar lintas bahasa berdasarkan isi dan teks yang terkait dari gambar

"Sistem perolehan gambar merupakan sistem untuk memperoleh dokumen gambar dari suatu koleksi dokumen gambar berdasarkan query tertentu. Sistem perolehan gambar yang dikembangkan merupakan sistem satu bahasa dan lintas bahasa. Sistem satu bahasa merupakan sistem yang menerima query, dimana bahasa query sama dengan bahasa koleksi dokumen. Sedangkan sistem lintas bahasa merupakan sistem yang menerima query, dimana bahasa query berbeda dengan bahasa koleksi dokumen. Sistem satu bahasa menggunakan query dalam bahasa Inggris, sedangkan sistem lintas bahasa menggunakan query dalam bahasa Indonesia yang digunakan untuk mencari dokumen dalam bahasa Inggris. Sistem perolehan gambar yang dikembangkan untuk penelitian ini menggunakan koleksi dokumen gambar yang disertai dengan teks yang berisi informasi tentang gambar tersebut (text caption). Query yang digunakan terdiri dari query gambar dan query teks. Query teks terdiri dari dua bentuk, yaitu judul dan narasi. Untuk mengolah data yang berupa teks, digunakan sistem IR Lucene, sedangkan untuk mengolah data yang berupa gambar, digunakan sistem CBIR GIFT dan VSMImage. Penelitian ini merupakan bagian dari kegiatan Image Cross Language Evaluation Forum (ImageCLEF) tahun 2005. Data-data berupa query, koleksi dokumen, dan hasil penilaian (relevance judgment) menggunakan data yang diberikan oleh ImageCLEF. Penelitian ini juga ingin mempelajari perbaikan hasil perolehan gambar dengan menggunakan query teks yang diterjemahkan dari bahasa Indonesia ke bahasa Inggris. Metode-metode yang digunakan dalam perbaikan hasil terjemahan query teks ini menggunakan perluasan query dan menggabungkan hasil pencarian query gambar dengan hasil pencarian query teks. Penggunaan query teks yang diterjemahkan terlihat menurunkan precision dengan rata-rata penurunan sebesar 44.97% terhadap query teks yang tidak diterjemahkan. Dari hasil eksperimen, penggunaan perluasan query memperburuk hasil pencarian query teks yang diterjemahkan dengan rata-rata penurunan precision sebesar 16.42%. Penggabungan hasil perolehan sistem CBIR GIFT dengan hasil query teks yang diterjemahkan dapat memperbaiki hasil pencarian query teks yang diterjemahkan dengan kenaikan precision rata-rata sebesar 8.70%. Penggabungan hasil pencarian sistem CBIR VSMImage dengan hasil query teks yang tidak diterjemahkan, belum dapat memperbaiki hasil pencarian query yang diterjemahkan."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Romi Nur Ismanto

Implementasi teknik obfuskasi pada PHP extension code menggunakan algoritma enkripsi AES (Advanced Encryption Standard) = Implementation of obfuscation technique in PHP extension code using aes encryption algorithm (Advanced Encryption Standard)

"PHP adalah bahasa pemrograman server-side scripting yang banyak digunakan untuk mengembangkan layanan website. Namun, aplikasi PHP berbasis web didistribusikan dalam bentuk source code sehingga sisi keamanannya rentan dan lemah karena baris source code mudah disalin, dimodifikasi, atau digunakan pada aplikasi lainnya. Penelitian bertujuan untuk mengimplementasikan rancangan teknis obfuskasi pada PHP extension code dengan menggunakan algoritma AES. Algoritma AES dipilih karena direkomendasikan NIST (National Institute of Standard and Technology) untuk melindungi sistem keamanan informasi nasional pemerintah Amerika Serikat. Melalui teknik obfuskasi menggunakan enkripsi diharapkan pemrogram memiliki opsi untuk melindungi source code PHP sehingga hak cipta atau kekayaan intelektual atas program dapat terproteksi.

PHP is a server-side scripting programming language that is widely used to develop website services. However, web-based PHP applications are distributed in source code so that the security is vulnerable and weak because the lines of source code can be easily copied, modified, or used in other applications. The research aims to implement obfuscation technique design in PHP extension code using AES algorithm. The AES algorithm recommended by NIST (National Institute of Standards and Technology) to protect the US government's national information security system. Through obfuscation technique using encryption, it is expected that programmers have an option to protect the PHP source code so that the copyright or intellectual property of the program can be protected."

Depok: Fakultas Teknik Universitas Indonesia, 2017

T47970

UI - Tesis Membership Universitas Indonesia Library

RDF database systems : triples storage and SPARQL query processing

"RDF database systems is a cutting-edge guide that distills everything you need to know to effectively use or design an RDF database. This book starts with the basics of linked open data and covers the most recent research, practice, and technologies to help you leverage semantic technology. With an approach that combines technical detail with theoretical background, this book shows how to design and develop semantic web applications, data models, indexing and query processing solutions.

Waltham, MA: Morgan Kaufmann, 2015

e20427683

eBooks Universitas Indonesia Library

Ilhan Firka Najia

Temu-Balik pertanyaan duplikat pada Forum Kesehatan Berbahasa Indonesia dengan Rank Fusion = Duplicate question retrieval in Indonesian Language Health Forum with Rank Fusion

"Penelitian ini mengeksplorasi efektivitas penggunaan neural rerankers yang telah dilatih sebelumnya dalam meningkatkan kinerja model berbasis text matching seperti BM25 untuk digunakan dalam deteksi pertanyaan duplikat pada consumer health forum. Studi ini juga meneliti metode agregasi hasil reranking dari berbagai neural rerankers untuk menghasilkan performa yang lebih baik dibandingkan penggunaan reranker individual. Metode reranking pertama menggunakan BM25, diikuti oleh reranking kedua menggunakan model neural seperti cross-encoder/ms-marco-MiniLM-L-12-v2, paraphrase-MiniLM-L6-v2, dan lainnya. Tahap ketiga melibatkan teknik rank fusion seperti Borda Fuse, Condorcet, dan Weighted Combsum. Hasil menunjukkan bahwa kombinasi reranking dengan neural reranker secara signi kan meningkatkan efektivitas model BM25, terutama saat menggunakan teknik rank fusion yang lebih canggih seperti Weighted Combsum. Studi ini menyarankan bahwa agregasi hasil reranking dapat mengatasi kelemahan individual reranker dan memberikan hasil yang lebih konsisten dan efektif. Penelitian ini membuka jalan untuk eksplorasi lebih lanjut dalam optimisasi kombinasi model untuk pencarian informasi yang lebih akurat dan e sien.

This study explores the effectiveness of using pre-trained neural rerankers in improving the performance of text matching based models such as BM25 for use in duplicate question detection in textitconsumer health forum. This study also examines the method of aggregating reranking results from various neural rerankers to produce better performance than using individual rerankers. The rst reranking method used BM25, followed by the second reranking using neural models such as cross-encoder/ms-marco-MiniLM-L-12-v2, paraphrase-MiniLM-L6-v2, and others. The third stage involves rank fusion techniques such as BordaFUSE, Condorcet, and Weighted COMBSUM. Results show that the combination of reranking with neural rerankers signi cantly improves the effectiveness of the BM25 model, especially when using more advanced rank fusion techniques such as Weighted COMBSUM. This study suggests that aggregation of reranking results can overcome the weaknesses of individual rerankers and provide more consistent and effective results. This research paves the way for further exploration in model combination optimization for more accurate and ef cient information retrieval."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Perancangan dan implementasi modul chatting manager pada pengajaran melalui komputer (PMK) Universitas Indonesia

"Universitas Indonesia saat ini sedang mengembangkan konsep pembelajaran melalui komputer (PMK) atau Computer Mediated Learning dalam rangka peningkatan mutu pendidikan yang diberikan. Proyek ini diharapkan akan memberikan dukungan yang kuat terhadap PROGRAM DASAR PERGURUAN TINGGI (PDPT) karena dapat meningkatkan efisiensi waktu dan sumber daya yang ada serta mengorganisasikan kegiatan yang lebih teratur. PMK akan dibangun menjadi suatu sistem terpadu yang untuk tahap awal pengembangannnya terdiri dari 5 modul utama yaitu : Course Manager, Resource Manager, Discussion Manager, Chatting Manager dan Content Manager. Kelompok Student Project selaku penyusun laporan ini berada pada ruang lingkup pengembangan modul Chatting Manager, yaitu sumber daya yang mengelola diskusi secara synchronous. Pengembangan modul Chatting Manager diharapkan dapat melengkapi program PMK pada proses yang berhubungan dengan belajar-mengajar dengan diskusi langsung (chatting). Analisa dan perancangan modul ini dilakukan berdasarkan Object Oriented Methodology dengan notasi Unified Modelling Language. Modul Chatting Manager merupakan salah satu elemen dari PMK yang dirancang untuk membantu, mengelola dan mengatur proses pelaksanaan diskusi langsung dengan memanfaatkan teknologi informasi untuk mendukung efektifitas dan efisiensi. Dengan berfungsinya modul Chatting Manager, proses belajarmengajar yang membutuhkan waktu tambahan untuk melakukan diskusi langsung dapat terakomodasi dengan penggunaan aplikasi chatting yang ada di modul ini. Dan pemilihan tempat dalam proses diskusi menjadi mudah karena aplikasi dapat dijalankan pada setiap PC yang terhubung dengan Local Area Network (LAN)."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2003

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian