Hasil Pencarian

Ditemukan 151593 dokumen yang sesuai dengan query

Abdul Rahman

Sistem Temu-Balik Pengetahuan untuk Helpdesk PDDikti dengan Reranking dan Ekspansi Dokumen = Knowledge Retrieval System for The PDDikti Helpdesk with Reranking and Document Expansion

"Website Helpdesk PDDikti memiliki sekumpulan knowledge yang belum didukung oleh sistem pencarian yang efektif. Penelitian ini bertujuan untuk membangun system temu-balik informasi yang efektif dengan skor metrik yang tinggi terhadap knowledge Helpdesk PDDikti. Metode yang digunakan dalam penelitian ini adalah penerapan model temu-balik informasi berbasis text matching pada berbagai model, yang kemudian disempurnakan dengan dua metode perbaikan ranking dokumen: (1) metode eskpansi istilah pada dokumen menggunakan prediksi kueri dari model doc2query, dan (2) metode reranking dokumen menggunakan model LambdaMART. Hasil penelitian menunjukkan bahwa di antara beberapa model temu-balik informasi berbasis text matching, model BM25 memberikan kinerja terbaik dengan skor MRR 0,781. Selanjutnya, hasil ranking dokumen dari model BM25 dapat ditingkatkan akurasinya melalui metode ekspansi istilah dengan lima kueri menggunakan pemilihan kandidat random sampling, yang meningkatkan skor MRR menjadi 0,799. Namun, penggunaan metode reranking dengan model LambdaMART untuk meningkatkan akurasi hasil ranking dokumen belum memberikan hasil yang lebih baik dibandingkan metode ekspansi istilah. Meskipun demikian, terdapat varian model reranking LambdaMART yang menggunakan fitur semantic similarity dan fitur skor agregat, yang mampu mengalahkan model BM25 tanpa ekspansi istilah, dengan skor MRR terbaik masing-masing 0,782 dan 0,787. Meskipun begitu, peningkatan ini masih belum cukup signifikan.

The PDDikti Helpdesk website has a collection of knowledge that is not yet supported by an effective search system. This study aims to develop an effective information retrieval system with high metric scores for the PDDikti Helpdesk knowledge base. The method used in this research involves applying text matching-based information retrieval models across various models, which are then refined using two document ranking improvement methods: (1) term expansion in documents using query predictions from the doc2query model, and (2) document reranking using the LambdaMART model.The research results indicate that among several text matching-based information retrieval models, the BM25 model provides the best performance with an MRR score of 0.781. Furthermore, the document ranking results from the BM25 model can be improved in accuracy through the term expansion method with five queries using random sampling for candidate selection, which increases the MRR score to 0.799.However, the use of the reranking method with the LambdaMART model to improve document ranking accuracy did not yield better results compared to the term expansion method. Nevertheless, there are variants of the LambdaMART reranking model that use semantic similarity features and aggregate score features, which managed to outperform the BM25 model without term expansion, with the best MRR scores of 0.782 and 0.787, respectively. However, these improvements are still not significant enough."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Yans Sukma Pratama

Pengembangan sistem perolehan informasi untuk dokumen legal Indonesia

"Dokumen legal Indonesia memiliki karakteristik yang membedakannya dengan dokumen umum. Karakteristik tersebut ada yang kasat mata seperti struktur penulisan dan ada pula yang tidak kasat mata seperti frekuensi kata dan sebaran kata dalam dokumen. Adanya karakteristik tersebut membuat perolehan informasi pada dokumen legal berbeda dengan dokumen teks biasa, misalnya isu pemanfaatan struktur dokumen legal sebagai unit perolehan informasi dan penggunaan stopwords khusus dokumen legal. Dalam penelitian tugas akhir ini, dikembangkan sistem perolehan informasi untuk dokumen legal Indonesia. Sistem yang dikembangkan mencakup tiga komponen utama dalam perolehan informasi, yakni pengindeksan, pencarian, dan pemeringkatan hasil. Pengindeksan dilakukan dengan menggunakan dua buah pendekatan: pengindeksan elemen terbesar dan pengindeksan elemen yang dianggap berharga sebagai unit perolehan informasi, yaitu elemen bab dan elemen pasal. Pendekatan ini diambil dengan tujuan memanfaatkan struktur penulisan pada dokumen legal. Untuk itu, dalam penelitian ini digunakan koleksi dokumen legal yang sudah ditandai dengan tag XML. Isu penggunaan stopwords khusus dokumen legal tidak ditangani dalam penelitian ini, mengingat kata-kata yang umum muncul dalam dokumen legal direpresentasikan dengan tag-tag XML. Sejumlah ujicoba dilakukan untuk mengevaluasi sejauh mana kinerja setiap jenis pendekatan. Data yang digunakan sebagai ujicoba adalah undang-undang Republik Indonesia yang diundangkan mulai tahun 1983 hingga 2009. Hasil ujicoba menunjukkan bahwa elemen terbesar, yakni elemen undang-undang merupakan unit perolehan informasi terbaik dibanding elemen bab dan elemen pasal. Sementara itu, elemen pasal merupakan elemen yang memiliki dokumen relevan terbanyak dalam hasil pencarian.

Indonesian legal documents have some characteristics that differs it from general documents. The characteristics can be classified into two types: characteristic that can be seen clearly and characteristic that can be detected only by using statistical linguistic methods. The structural writing of legal document is a subset of the first type characteristic while words frequency and words distribution among collection can be included into the second type. Existence of those characteristics made information retrieval in legal document has differences compare to retrieval in general text collection, such as using document structure as a retrieval unit and using special stopwords for legal document. In this undergraduate thesis, we developed information retrieval system for Indonesian legal document. The system employed three information retrieval main components: indexing, searching, and ranking. We used two approaches in indexing step: made biggest element and valuable element (chapter and article) as an indexing unit. The approaches taken have a purpose to exploit the structural writing of legal document. We used legal document which has been tagged with XML syntax to make it easier to afford the purpose. The issue of using special stopwords for document legal were omitted in this research because it has been replaced by XML syntax. Finally, we conducted some experiments to evaluate performance of each indexing types. We used Indonesian law documents which released from 1983 until 2009 as experiments data. We conclude that the biggest element is the best indexing unit among others. Beside that, we found that article element is the most frequent element which occur in search result lists."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Mustangimah

Efektivitas sistem temu-kembali informasi dan analisis bibliometrik: Aplikasi pada dokumen bidang nuklir berbahasa Indonesia

"ABSTRAK

Penelitian ini bertujuan untuk mengetahui efektivitas sistem temu-kembali informasi yang diaplikasikan pada dokumen bidang nuklir berbahasa Indonesia, dan untuk mengetahui dokumen yang ditemukan mempunyai hubungan bibliografi. Penelitian dilakukan dengan menggunakan Sistem Temu Kembali Informasi yang dikembangkan di Fakultas Ilmu Komputer, Universitas Indonesia.

Penelitian dilakukan dengan menggunakan dokumen bidang nuklir sebanyak 630 cantuman dalam basis data bibliografi. Pertanyaan (query) yang digunakan berasal dari pemakai (user) berupa judul penelitian dalam bidang nuklir. Pertanyaan terdiri dari 10 pertanyaan sederhana dan 10 pertanyaan kompleks. Pencarian dilakukan dengan pembangunan faset dari istilah yang terkandung dalam pertanyaan dengan memanfaatkan operator Boolean, dan penilaian relevansi terhadap dokumen yang ditemukan dilakukan oleh pakar subjek dalam masing-masing pertanyaan. Hipotesis yang diuji dalam penelitian ini yaitu : ada perbedaan efektivitas temu-kembali informasi pada pertanyaan sederhana dan pertanyaan kompleks, dan semakin tinggi kekuatan pasangan bibliografi semakin tinggi tingkat relevansi dua dokumen. Pengujian hipotesis menggunakan uji Mann-Whitney dengan paket program statistik Kwikstat.

Hasil penelitian menunjukkan bahwa sistem temu-kembali informasi mempunyai ketepatan temu-kembali di atas 50%, dan tidak menunjukkan perbedaan yang nyata antara pertanyaan sederhana dengan pertanyaan kompleks. Analisis pasangan bibliografi (bibliographic coupling) terhadap dokumen yang ditemukan menunjukkan bahwa bibliografi memberikan kontribusi yang lemah (0,15) terhadap pemasangan dokumen. Bila dokumen relevan dipasangkan dengan dokumen lain, kekuatan pasangan bibliografi tidak berpengaruh terhadap tingkat relevansi dokumen kedua. Akan tetapi bila dokumen relevan mar]inal dipasangkan dengan dokumen lain, kekuatan pasangan bibliografi dapat meningkatkan tingkat relevansi dokumen kedua. Hal ini menunjukkan adanya keterhubungan dokumen walaupun bukan keterhubungan subjek yang diindikasikan oleh pasangan bibliografi. Berdasarkan hasil tersebut, bibliografi dapat dimanfaatkan untuk meningkatkan efektivitas sistem temu-kembali informasi yaitu untuk meningkatkan penemuan dokumen yang berguna (pertinent document) dengan penggabungan pencarian berdasarkan istilah dan pencarian berdasarkan sitasi.

ABSTRACT
The objectives of this research are to determine to what extent the information retrieval system effectiveness which applied to nuclear documents collection in Indonesian language, and to determine to what extent the documents retrieved have bibliographic relationship to one another. This research is using the Information Retrieval System developed by Computer Science Faculty, University of Indonesia.
This investigation is using 630 documents in the bibliographic database. The queries come from the real user, consist of 10 simple queries and 10 complex queries. The searching was performed by building facet and combined using Boolean operators, then the subject experts determine relevance judgement of document retrieved for each query. Hypothesis are tested: there exists a difference of information retrieval effectiveness between simple and complex queries, and the higher bibliographic coupling strength between two documents more relevant the two documents. The hypothesis are tested using Mann-Whitney procedure using Kwikstat program package.
The results show that the information retrieval system yielded precision result more than 50% and there is no significance difference between simple and complex queries. Bibliographic coupling analysis shows that the bibliography made a weak contribution to the pairing of documents. If the relevant documents have paired with the other documents, bibliographic strength has not effected the second document relevance level. but if the marginally relevant documents have paired with the other documents, bibliographic strength can increase the second document relevance level. These characteristic shows that there exist document relatedness although there are not subject relatedness. Based on this result, bibliography can be used to improve the information retrieval effectiveness by increasing the pertinent document retrieved using citation-based searching as a complement to term-based searching."

Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 1998

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Toward a national information system: second annual national colloquium on information retrieval

Washington : Spartan Books , 1965

025.04 TOW

Buku Teks Universitas Indonesia Library

Baeza-Yates, Ricardo

Modern Information retrieval

Harlow: Addison-Wesley , 1999

025.524 BAE m

Buku Teks Universitas Indonesia Library

Williams, William F.

Principles of automated information retrieval

Elmhurst: Business Press, 1968

029.7 WIL p

Buku Teks Universitas Indonesia Library

Lancaster, F. Wilfrid

Information retrieval systems

New York: John Wiley & Sons, 1979

025.04 LAN i (1);025.04 LAN i (2)

Buku Teks Universitas Indonesia Library

Denny Zulkasi

Perancangan sistem informasi berbasis internet untuk laporan fisik dan keuangan

"Perancangan Sistem Informasi Berbasis Internet untuk Laporan Fisik dan Keuangan dilatar belakangi oleh kondisi wilayah timur Indonesia yang secara geografis sulit dijangkau, padahal wilayah itu juga terdapat proyek proyek-pengembangan pedesaan yang harus pantau dari pusat.

Kondisi diatas menimbulkan permasalahan dalam hal pelaporan proyek yang masih manual sehingga sering timbul distorsi dalam pengiriman data yang berakibat ketidak akuratan pelaporan proyek.

Oleh karena itu perlu dibangun suatu sistem informasi untuk mengatasi masalah tersebut. Sistem informasi yang dikembangkan ini terdiri dari pengembangan perangkat lunak, perangkat keras, perangkat data dan perangkat otak (SDM) yang merupakan komponen dari sistern informasi, selain itu juga dibuat rencana untuk implementasi sistem dan perawatan sistem.

Kerangka-Kerangka teori yang digunakan dalam perancangan un adalah prespektif mengenai informasi itu sendiri bagaimana informasi digunakan untuk mengurangi ketidak pastian, konsep mengenai jaringan komputer, Internet dan fasilitas-fasilitasnya, Konsep Dynamic Web yang memungkinkan basis data terpusat melalui Internet, Definisi dan klasifikasi sistem informasi, strata SIM berdasarkan kegiatan manajemen, System Development Life cycle Software Quality Assurance serta Kelembagaan di Departemen Pemukiman dan Pengembangan Wilayah.

Metodologi yang digunakan untuk perancangan ini ialah System Development Lifecycle yang menerangkan tahapan dari pengembangan sistem, identifikasi dari kegiatan sistem informasi dalam konteks model sistem informasi, Identifikasi data yang diperlukan, Identifikasi komponen sistem informasi, rancangan global solusi permasalaban dan rencana implementasi dari sistem yang sudah dikembangkan.

Perancangan sistem mengikuti alur dari system developmen lifecycle suatu investigasi sistem yang sudah ada, analisa sistem dan perancangan sistem yang terdiri dan perancangan perangkat keras, perangkat lunak, perangkat data dan perangkat otak.

Rencana implementasi dan sistem yang sudah dikembangkan adalah dengan menggunakan metode pilot project danpararel, berarti akan ditunjuk satu daerah untuk mengimplementasikan sistem yang baru dan saat sistem yang baru berjalan sistem yang lama juga ikut berjalan sampai akhirnya diambil alih oleh sistem yang baru. Rencana perawatan sistem direncanakan secara menyeluruh pada seluruh komponen sistem informasi yaitu perangkat lunak, keras, data dan otak.

Kesimpulan dari perancangan ini ialah sistem yang dirancang secara sistimatis dan menyeluruh dengan memperhatikan komponen-komponen sistem informasi diharapkan dapat menjawab permasalahan yang timbul dari pemakaian sistem manual dan kemungkinan pengembangan lebih lanjut tetap terbuka.

Saran dari perancangan ini ialah Teknologi internet dapat digunakan sebagai pilihan untuk pengembangan sistem informasi yang lain, oleh karena itu pengetahuan mengenai teknologi internet perlu disosialisasikan terutama pada para perancang proyek, disamping itu dukungan dari pihak manajemen puncak juga sangat diperlukan untuk menjamin keberhasilan suatu sistem informasi."

Depok: Fakultas Ilmu Sosial dan Ilmu Politik Universitas Indonesia, 2000

T10541

UI - Tesis Membership Universitas Indonesia Library

Andy

Penyimpanan dan penataan dokumen gambar teknik di Pusat Arsip Development Department PT PAM Lyonnaise Jaya (PALYJA)

"Penelitian ini dilatarbelakangi oleh kurang efektifnya penanganan dokumen gambar teknik pada pusat arsip development department PT PAM LYONNAISE JAYA ( PALYJA ). Masalah bentuk fisik dokumen gambar teknik yang berbeda dengan dokumen lain yang berbasis bahan kertas merupakan masalah utama yang harus dicari solusinya dalam konteks penyimpanan, penataan dan temu kembali dokumen tersebut. Tujuan penelitian ini diarahkan untuk membuat sistem kearsipan secara menyeluruh khususnya mengenai sistem penyimpanan dan penataan dokumen gambar teknik di tempat tersebut. Penelitian ini merupakan penelitian yang bersifat studi kasus sehingga tidak perlu digeneralisasikan ke konteks lain. Pendekatan penelitian ini bersifat deskriptif dengan menggunakan metode pengumpulan data secara kualitatif. Dokumen gambar teknik dengan berbagai macam bentuk fisik dan isinya merupakan obyek dari peneltian ini. Pembahasan dalarn penelitian ini merupakan suatu analisis untuk mencari solusi dari permasalahan yang merupakan hasil penggabungan dari ketiga model pengumpulan data yaitu observasi lapangan, wawancara, dan studi kepustakaan. Pembahasan tersebut menyimpulkan bahwa dokumen gambar teknik memerlukan suatu teknik tersendiri dalam penyimpanannya seperti digulung, mendatar, ataupun vertikal. Tempat penyimpanan dokumen jenis ini pun harus mempunyai tempat khusus terpisah dari jenis dokumen lain seperti drawer cabinets, vertical cabinets, dan gulungan. Begitu pula dengan masalah penataan harus disesuaikan dengan kaidah-_kaidah kearsipan yang berlaku. Dengan memperhatikan hal-hal tersebut maka proses temu kembali dengan menggunakan sarana temu kembali akan berjalan dengan efektif. Semua itu tentunya hams disesuaikan juga dengan keadaan di pusat arsip yang bersangkutan."

Depok: Universitas Indonesia, 2003

S14888

UI - Skripsi Membership Universitas Indonesia Library

Knowledge dictionary for information extraction on the Arabic text data = Knowledge dictionary untuk ekstraksi informasi pada data teks Arab

"Ekstraksi informasi merupakan sebuah tahap awal dari proses analisis data tekstual. Ekstraksi informasi diperlukan untuk mendapatkan informasi dari data tekstual sehingga dapat digunakan untuk proses analisis seperti misalnya klasifikasi dan kategorisasi. Data tekstual

sangat dipengaruhi oleh bahasa, jika sebuah data tekstual berbahasa Arab maka karakter yang digunakan adalah karakter arab.

Knowledge dictionary merupakan sebuah kamus yang dapat digunakan untuk mengekstraksi informasi dari data tekstual. Informasi yang diekstraksi menggunakan knowledge dictionary adalah konsep.

Knowledge dictionary biasanya dibangun secara manual oleh seorang pakar yang tentunya membutuhkan waktu yang lama dan spesifik untuk

setiap masalah. Pada penelitian ini diusulkan sebuah metode untuk membangun knowledge dictionary secara otomatis. Pembentukan

knowledge dictionary dilakukan dengan cara mengelompokkan kalimat yang memiliki konsep yang sama, dengan asumsi kalimat yang memiliki konsep yang sama akan memiliki nilai simi laritas yang tinggi. Konsep yang telah diekstraksi dapat digunakan sebagai fitur untuk proses komputasi berikutnya misalnya klasifikasi ataupun kategorisasi.

Dataset yang digunakan dalam penelitian ini adalah dataset teks Arab. Hasil ekstraksi diuji dengan menggunakan mesin klasifikasi

decision tree dan didapatkan nilai presisi tertinggi 71,0% dan nilai recall tertinggi 75,0%.

Abstract

Information extraction is an early stage of a process of textual data analysis. Information extraction is required to get information from textual data that can be used for process analysis, such as classification and categorization. A textual data is strongly influenced by the language. Arabic is gaining a significant attention in

many studies because Arabic language is very different from others, and in contrast to other languages, tools and research on the Arabic language is still lacking. The information extracted using the knowledge

dictionary is a concept of expression. A knowledge dictionary is usually constructed manually by an expert and this would take a long time and is specific to a problem only. This paper proposed a method for automatically building a knowledge dictionary. Dictionary knowledge is formed by classifying sentences having the same concept, assuming that they will have a high similarity value. The concept that has been extracted can be used as features for subsequent computational process such as classification or categorization. Dataset used in this paper was the Arabic text dataset. Extraction result was tested by using a decision tree classification engine and the highest precision value obtained was 71.0% while the highest recall value was 75.0%. "

[Direktorat Riset dan Pengabdian Masyarakat Universitas Indonesia, Institut Teknologi Sepuluh Nopember. Fakultas Teknologi Informasi], 2012

pdf

Artikel Jurnal Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian