Hasil Pencarian

Ditemukan 32188 dokumen yang sesuai dengan query

Sutanto Sugii Joji

Evaluasi teknik pengindeksan untuk perolehan informasi pembicaraan

"Semakin banyaknya dokumen pembicaraan menimbulkan kebutuhan untuk melakukan pencarian terhadap dokumen pembicaraan. Akan tetapi, metode perolehan informasi untuk dokumen teks tidak dapat langsung diterapkan pada dokumen pembicaraan. Isi dari dokumen pembicaraan adalah sinyal suara. Sinyal suara ini harus diproses terlebih dahulu agar didapat isi dari pembicaraan. Proses ini dinamakan pengenalan pembicaraan. Sistem perolehan informasi pembicaraan adalah sebuah sistem yang mengimplementasi teknik-teknik perolehan informasi dan menerapkannya kepada dokumen pembicaraan. Sinyal suara yang ada pada dokumen pembicaraan diproses terlebih dahulu dengan proses pengenalan pembicaraan agar didapat teks transkripsi pembicaraan. Sistem perolehan informasi pembicaraan melakukan pembuatan indeks berdasarkan teks pembicaraan hasil pengenalan pembicaraan.

Penelitian ini menggunakan tiga koleksi dokumen. Koleksi pertama berisi 250 dokumen pembicaraan yang didapat dari pembicaraan telepon. Koleksi ini telah dibersihkan dari noise. Koleksi kedua berisi 100 dokumen pembicaraan yang didapat dari pembicaraan radio Pro3 Radio Republik Indonesia. Koleksi ketiga berisi 29.575 dokumen yang berasal dari pembicaraan telepon. Koleksi ketiga tidak dibersihkan dari noise. Word Error Rate dari tiap-tiap koleksi adalah 26.50%, 28.40%, dan 74.20%. Teknik-teknik yang diujicobakan adalah pembuatan indeks dengan masukan hasil pengenalan pembicaraan (Transkripsi), lima alternatif kata hasil pengenalan (Transkripsi-5), alternatif kata hasil pengenalan dengan probabilitas tinggi (Transkripsi-AB), pemetaan kata hasil pengenalan terhadap kamus pengucapan untuk mendapatkan rangkaian fonem (Transkripsi-Fonem), dan rangkaian fonem 3-gram (Transkripsi-3-gram). Selain dengan pengenalan pembicaraan, penelitian ini juga mencoba memberikan variasi pembuatan indeks dengan masukan dari hasil pengenalan pembicaraan yang telah dimodifikasi agar dapat mengenali fonem (Fonem). Setelah mendapatkan hasil fonem, rangkaian 3-gram juga dibuat dari hasil fonem yang didapat (Fonem-3-gram). Penelitian ini juga melakukan eksperimen dengan cara penggabungan indeks kata dan indeks."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Dwi Astuti Aprijani

Pengindeksan berdasarkan maximal frequences dalam sistem temu kembali informasi teks berbasiskan Indonesia

"Penelitian ini mengkaji penggunaan Maximal Frequent Sequences (MFS) sebagai indeks dalam koleksi dokumen untuk Sistem Temu-kembali Informasi teks berbahasa Indonesia. Indeks, sebagai representasi dokumen, harus menggambarkan informasi keseluruhan yang terkandung dalam dokumen. MFS sebagai salah satu cara untuk mengekspresikan multi kata (frase) dapat digunakan sebagai indeks dalam koleksi dokumen untuk merepresentasikan isi dokumen. Kekuatan utama MFS dapat membentuk indeks yang sangat solid karena menoleransi adanya kata-kata pemisah di antara suatu pasangan kata dan jumlah istilah yang digunakan sebagai indeks sedikit. Hasil uji coba terhadap 1162 dokumen ilmiah dan 2999 dokumen berita menunjukkan bahwa jumlah istilah pada pengindeksan berdasarkan MFS jauh lebih sedikit dibandingkan jumlah istilah pada pengindeksan berdasarkan frekuensi kata (term frequency), yaitu 31% untuk koleksi dokumen ilmiah non-stemming, 48% untuk koleksi dokumen ilmiah stemming, 30% untuk koleksi dokumen berita non-stemming, dan 59% untuk koleksi dokumen berita stemming. Pada koleksi dokumen ilmiah, MFS dengan nilai threshold yang lebih kecil relatif mampu memperbaiki nilai presisi, baik presisi rata-rata sesudah memproses 20 dokumen maupun presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan. Pada koleksi dokumen berita, MFS dengan nilai threshold yang kecil relatif memperbaiki nilai presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan, namun threshold yang lebih besar justru memperbaiki presisi rata-rata sesudah memproses 10 dokumen. Efek stemming meningkatkan presisi rata-rata sesudah memproses 10 dokumen dan presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan pada sistem temu-kembali informasi ini."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Armando Yonathan

Perolehan informasi dokumen suara pembicaraan berdasarkan hasil dari sistem pengenalan suara untuk bahasa indonesia

"Informasi yang terdapat saat ini tidak hanya terbatas disimpan dalam bentuk dokumen teks saja, tetapi banyak juga dalam bentuk dokumen suara. Banyaknya informasi yang disimpan dalam bentuk dokumen suara menyebabkan diperlukannya teknik perolehan informasi yang dapat diterapkan kepada koleksi dokumen tersebut. Pendekatan yang banyak dilakukan adalah dengan menggunakan hasil pengenalan suara oleh Sistem Pengenalan Suara Otomatis (SPSO). Tetapi, hasil pengenalan suara oleh SPSO tidak sepenuhnya benar sehingga menurunkan tingkat akurasi perolehan informasi dokumen suara. Pada penelitian ini penulis mencoba empat jenis hasil pengenalan suara untuk melakukan perolehan informasi dokumen suara, yaitu 1-best output, n-best word output, n-best pronounciation output, word posterior lattice. Selain itu, penulis juga mencoba tiga jenis kueri pada penelitian ini, yaitu kueri satu kata, kueri frase dua kata dan kueri kalimat. Hasil yang didapat pada penelitian ini menyimpulkan bahwa penggunaan 1-best output pada perolehan informasi dokumen suara menghasilkan kinerja yang lebih baik dibandingkan penggunaan hasil pengenalan suara yang lain. Mean Average Precision (MAP) hasil eksperimen dengan 1-best output lebih besar 0.64% dibandingkan penggunaan n-best output , 8,88% lebih besar dibandingkan penggunaan word posterior lattice dan lebih besar 92.68% dibandingkan penggunaan n-best pronounciation output. Pada eksperimen dengan kueri frase, sistem dengan akurasi terbaik adalah sistem yang menggunakan word posterior lattice. Pada eksperimen dengan kueri satu kata dan kueri kalimat, sistem yang menggunakan n-best word output menghasilkan kinerja terbaik.

The information today is not only limited in the form of text documents, but also in the form of spoken documents. The growing number of those spoken documents requires the information retrieval techniques to make the retrieval process easier. The approach for spoken documents retrieval is using automatic speech recognition (ASR). However, the results of the speech recognition by ASR are not entirely correct, so reduce the level of accuracy of information retrieval of spoken documents. This experiment uses four types results of the speech recognition by ASR, the 1-best output, n-best output, n-best pronunciation output, word posterior lattice. In addition, this experiment also investigates the effect of the use of query types (phrase, single word and sentence). Results obtained from this experiment concluded that the use of 1-best output on spoken document retrieval produces better performance results than the use of other results of the speech recognition. Mean Average Precision (MAP) results of experiments with 1-best output is 0.64% higher than the use of n-best output, 8.88% higher than the use of word posterior lattice and 92.68% higher than the use of n-best pronunciation output. In phrase based query experiment, the best accuracy is word posterior lattice while the best accuracy in single word query and sentence query is n-best word output."

Depok: Universitas Indonesia, 2009

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Riama Flora L.M.

Pengindeksan di search engine Google pada halaman web di bidang pembangunan ekonomi sosial

"Penelitian mengenai pengindeksan pada Google telah dilakukan dari bulan Januari hingga Agustus 2003. Tujuannya adalah untuk mengetahui cara Google mengindeks halaman web yang muncul pada pencarian dengan menggunakan kata kunci bidang pembangunan ekonomi dan sosial.Pengumpulan data dilakukan dengan menggunakan teknik eksperimen dan observasi. Eksperimen dilakukan dengan mengadakan pengujian bertingkat terhadap hasil pencarian di Google. Eksperimen dilakukan untuk mengetahui bahasa indeks dan sistem pengindeksan yang diterapkan pada search engine Google.Hasil penelitian menunjukkan bahwa Google menggunakan bahasa indeks alamiah dan sistem pengindeksan pasca-koordinasi. Hasil ini menunjukkan beberapa kelemahan pada pencarian di Google. Penulis mencoba memberikan beberapa solusi untuk memperbaiki kelemahan tersebut."

Depok: Universitas Indonesia, 2003

S15559

UI - Skripsi Membership Universitas Indonesia Library

Ratna Sufiatin

Pemanfaatan indeks tercetak, CD-ROM, dan online searching untuk memenuhi kebutuhan informasi bagi pemakai di PDII-LIPI dan perpustakaan BPPT

"Tujuan penelitian ini adalah untuk mengetahui perbandingan pemanfaatan antara alat bantu penelusuran yang berupa Indeks tercetak, CD-ROM, dan Online searching oleh pemakai di PDII-LIPI dan Perpustakaan BPPT dalam mencari informasi yang dibutuhkan.

Subyek penelitian ini adalah pemakai perpustakaan yang menggunakan Indeks tercetak, CD-ROM, dan Online searching di PDll-LIPI dan Perpustakaan BPPT. Sampel penelitian ditetapkan sebanyak 364 responden. Pengambilan sampel dilakukan secara aksidental. Pengumpulan data dilakukan dengan cara menyebarkan kuesioner.

Hasil penelitian adalah (1) alat bantu penelusuran yang paling banyak dimanfaatkan oleh pemakai adalah Online searching, (2) pemakai tidak hanya memanfaatkan satu jenis alat bantu penelusuran saja, tetapi ada yang menggunakan lebih dari satu, sehingga terdapat kombinasi pemakaian dengan persentase perbandingan sbb: CD-ROM dan Online searching 39,83 %, Indeks tercetak dan CD-ROM 18,41 %, Online searching 16,48 %, Indeks tercetak dan Online searching 14,84 %, CD-ROM 6,04 %, dan Indeks tercetak 4,40 %; (3) Secara keseluruhan profil pemakai yang terbanyak adalah Mahasiswa, berusia 17-25 tahun dengan pendidikan terakhir SMTA; Secara khusus pemakai Indeks tercetak yang terbanyak adalah Peneliti dengan frekuensi pemanfaatan I kali dalam satu bulan dan mencari informasi melalui subyek tertentu: pemakai CD-ROM yang terbanyak adalah Mahasiswa dengan frekuensi pemanfaaan 2-3 kali dalam satu bulan dan mencari informasi melalui subyek tertentu; pemakai Online searching yang terbanyak adalah Mahasiswa dengan frekuensi pemanfatan 2-3 kali dalam satu bulan dan mencari informasi melalui subyek tertentu. (4) Faktor-faktor yang mempengaruhi pemanfaatan Online searching adalah: penggunaannya lebih mudah dan penelusurannya lebih cepat dibandingkan dengan CD-ROM dan Indeks tercetak, perolehan informasi lebih tepat dibandingkan dengan Indeks tercetak, biayanya lebih murah daripada CD-ROM.

The objective of this study is to know comparative use of searching tools, i.e. Printed Index, CD-ROM, and Online searching by users of the PDII-LIPI and BPPT Library searching for information.
The subject of this is users who use the library Printed Index, CD-ROM, and Online searching in PDII-LIPI and BPPT Library. The sample is 364 respondents and taken accidentally. Data for this study is gathered through questionaire.
The outcomes of this study are: (1) The searching tools most frequently used is Online searching, (2) Some users use multiple searching tools, such as: CD-ROM and Online searching 39,83 %, Printed Index and CD-ROM 18,41 %, Printed Index and Online searching 14,84 %. The others use just one searching tools such as Online searching 16,48 %, CD-ROM 6,04 %, and Printed Index 4,40 %; (3) Generally users dominated by students with 17-25 year old and the background study from High school; spesifically the user of Printed Index are researchers to search information through specific subject once a month; CD-ROM and Online searching users are dominated by students of 2-3 times usage and search information through specific subject; (4) factors affected the use of Online searching are: easier to use and faster to search than CD-ROM and Printed Index, appropriate to obtain of the information than Printed Index, and relatively cheaper than CD-ROM."

Depok: Fakultas Ilmu Pengetahuan dan Budaya Universitas Indonesia, 1999

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Wessel, Andrew E.

Computer-aided information retrieval

Los Angeles: California Melville Publishing , 1975

029.7 WES c

Buku Teks Universitas Indonesia Library

Ananda Budi Prasetya

Evaluasi teknik perolehan informasi pada dokumen web multibahasa

"Perolehan informasi Web adalah cabang perolehan informasi yang mengkhususkan pencarian informasi terhadap dokumen Web. Dokumen yang terdapat pada lingkungan Web memiliki struktur yang berbeda dengan dokumen teks biasa, sehingga menyebabkan pendekatan perolehan informasi pada dokumen Web berbeda dengan dokumen biasa. Pada penelitian ini digunakan koleksi dokumen EuroGOV yangmerupakan koleksi dokumen Web multibahasa yang digunakan pada WebCLEF, dan kueri atau topik yang digunakan adalah kueri yang diberikan pihak WebCLEF. Koleksi dokumen dan kueri yang digunakan terdiri dari 15 bahasa Eropa. Pada penelitian ini dipelajari pengaruh berbagai teknik perolehan informasi, yaitu operator kedekatan kata, umpan balik relevan semu, pendeteksian bahasa, analisis pranala, PageRank, dan pengelompokan dokumen, terhadap hasil perolehan informasi Web multi bahasa yang dihasilkan teknik-teknik tersebut. Selain itu pada penelitian ini juga dipelajari kemampuan dari sistem perolehan informasi Indri Search Engine dalam mencari dan memperoleh dokumen Web multibahasa.

Penelitian ini menemukan bahwa dengan melakukan evaluasi secara umum tanpa melihat bahasa, kenaikan nilai perolehan hanya didapatkan dengan menggunakan teknik pendeteksian bahasa sebesar 0.72% dan teknik umpan balik relevan semu sebesar 1.02% - 1.61%. Sedangkan pada teknik analisis pranala, PageRank, dan pengelompokan dokumen, nilai perolehan informasi yang didapatkan menurun sebesar -46.3431% - -0.60%. Dengan melakukan evaluasi berdasarkan bahasa, didapatkan bahwa setiap teknik yang diteliti dan dipelajari memiliki keunggulan masing-masing berdasarkan bahasa. Untuk teknik pengurutan ulang pendeteksian bahasa, peningkatan nilai perolehan informasi terdapat pada 6 bahasa sebesar 0.1478% - 27.1431%, dan penurunan terdapat pada 10 bahasa sebesar -0.7066% - -0.0156%. Untuk teknik analisis pranala dalam, peningkatan nilai perolehan informasi terdapat pada 4 bahasa sebesar 6.5585% - 77.1804%, dan penurunan terdapat pada 4 bahasa sebesar -60.9202% - -0.3339%, dan untuk analisis pranala luar terdapat kenaikan pada 9 bahasa sebesar 0.7151% - 134.9881%, dan penurunan terdapat pada 6 bahasa sebesar -23.2941% - -1.6330%, sedangkan untuk kombinasi analisis pranala dalam dan luar terdapat pada 5 bahasa sebesar 0.2809% - 100%, dan penurunan terdapat pada 10 bahasa sebesar -92.0830% - -3.1030%. Untuk teknik PageRank, peningkatan nilai informasi masi terdapat pada 4 bahasa sebesar 5.1083% - 77.1804%,dan penurunan terdapat pada 10 bahasa sebesar -96.4844% - -2.6968%. Dan untuk pengelompokan berdasarkan bahasa, peningkatan nilai informasi terdapat pada 3 bahasa sebesar 3.6440% - 38.7337%, dan penurunan terdapat pada 9 bahasa sebesar -53.6322% - -1.6715%. Untuk pengelompokan berdasarkan topik, peningkatan tertinggi terdapat pada satu bahasa, yaitu Spanyol sebesar 12.4754% dan penurunan terdapat pada 5 bahasa sebesar -97.5600% - -35.6133%. Untuk teknik umpan balik relevan semu, peningkatan nilai perolehan informasi terdapat pada 7 bahasa sebesar 0.0472% - 5.1523%, penurunan hanya terdapat pada dua bahasa sebesar -4.2597% - -0.2760%. Berdasarkan penelitian ini disimpulkan bahwa sistem perolehan in- formasi Indri Search Engine dapat mencari dan memperoleh dokumen Web multibahasa dengan baik, dan teknik perolehan Web standar dapat diterapkan juga pada koleksi dokumen Web multibahasa."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Etty Andriaty

Peran teknologi informasi dalam pengindeksan, penyimpanan dan penyebaran informasi

"This article analyse the function of information technology (IT) in the library, in particularly indexing, storage, and dissemination of information. Indexing function of IT in the library as well as copy cataloguing, original cataloguing, bibliographic monitoring, labeling, book card and its properties. IT function in information storage spread used in the CD, diskette, microform, etc. In dissemination of information IT used in diskette, audio visual and network. Dissemination of information through network like internet, LAN, WAn, Expert System, electronic group discussion, scientific group based computer"

1998

JIIP-1-1-Sept1998-70

Artikel Jurnal Universitas Indonesia Library

Moh. Ibrahim

Pengindeksan berdasarkan lokasi pada perolehan informasi geografis

"Perkembangan proses penyimpanan informasi dari bentuk fisik ke bentuk dijital membuat pertumbuhan jumlah data membesar sedemikian pesatnya. Dalam informasi yang besar ini dibutuhkan mekanisme pencarian untuk memudahkan mencari informasi yang diinginkan. Sistem perolehan infomasi memungkinkan pengguna untuk mencari infromasi yang diinginkannya dari sejumlah kumpulan dokumen. Pencarian ini dilakukan dengan memasukkan informasi yang ingin didapat (disebut kueri) pada sistem pencarian. Namun seiring semakin besarnya jumlah dokumen, jumlah informasi yang didapat pun menjadi semakin besar. Fakta bahwa pada dokumen dan kueri banyak terkandung informasi mengenai lokasi membuat dikembangkannya perolehan infromasi dengan tambahan aspek geografis kedalamnya. Sistem ini dikenal dengan nama sistem Perolehan Informasi Geografis (PIG). Penelitian PIG dalam dokumen berbahasa Indonesia ditujukan agar sistem dapat mengolah data dalam bentuk artikel berbahasa Indonesia. penelitian yang dijabarkan pada laporan ini merupakan lanjutan dari penelitian PIG sebelumnya yang telah dilakukan oleh Monica Paramita. Penambahan aspek geografis pada perolehan informasi membutuhkan lokasi representatif yang dijelaskan pada setiap dokumen. Karena itu penelitian ini berusaha membandingkan 3 metode penentuan lokasi representatif pada dokumen. Yaitu penentuan 1 lokasi representatif pada setiap dokumen, penentuan semua lokasi dalam dokumen sebagi lokasi representatif, dan pemilihan beberapa lokasi dalam dokumen sebagai lokasi representatif. Selain itu, dibandingkan juga 2 metode dalam prosespencarian dokumen. Yaitu metode pencarian langsung terhadap dokumen dan metode pengelompokan dokumen sebelum proses pencarian dilakukan. Hasil eksperimen menunjukkan bahwa penambahan aspek geografis pada dokumen dapat meningkatkan proses pencarian informasi yang sesuai dengan kueri. Dari nilai evaluasi pada metode penelitian, didapatkan bahwa metode pemilihan beberapa lokasi representatif pada dokumen memperoleh nilai evaluasi paling tinggi baik dalam metode pencarian langsung terhadap dokumen maupun metode pengelompokan dokumen sebelum pencarian dilakukan. Sedangkan untuk metode lain, nilai evaluasi yang didapat bervariasi tergantung dari metode pencarian dokumen yang dipilih."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Yans Sukma Pratama

Pengembangan sistem perolehan informasi untuk dokumen legal Indonesia

"Dokumen legal Indonesia memiliki karakteristik yang membedakannya dengan dokumen umum. Karakteristik tersebut ada yang kasat mata seperti struktur penulisan dan ada pula yang tidak kasat mata seperti frekuensi kata dan sebaran kata dalam dokumen. Adanya karakteristik tersebut membuat perolehan informasi pada dokumen legal berbeda dengan dokumen teks biasa, misalnya isu pemanfaatan struktur dokumen legal sebagai unit perolehan informasi dan penggunaan stopwords khusus dokumen legal. Dalam penelitian tugas akhir ini, dikembangkan sistem perolehan informasi untuk dokumen legal Indonesia. Sistem yang dikembangkan mencakup tiga komponen utama dalam perolehan informasi, yakni pengindeksan, pencarian, dan pemeringkatan hasil. Pengindeksan dilakukan dengan menggunakan dua buah pendekatan: pengindeksan elemen terbesar dan pengindeksan elemen yang dianggap berharga sebagai unit perolehan informasi, yaitu elemen bab dan elemen pasal. Pendekatan ini diambil dengan tujuan memanfaatkan struktur penulisan pada dokumen legal. Untuk itu, dalam penelitian ini digunakan koleksi dokumen legal yang sudah ditandai dengan tag XML. Isu penggunaan stopwords khusus dokumen legal tidak ditangani dalam penelitian ini, mengingat kata-kata yang umum muncul dalam dokumen legal direpresentasikan dengan tag-tag XML. Sejumlah ujicoba dilakukan untuk mengevaluasi sejauh mana kinerja setiap jenis pendekatan. Data yang digunakan sebagai ujicoba adalah undang-undang Republik Indonesia yang diundangkan mulai tahun 1983 hingga 2009. Hasil ujicoba menunjukkan bahwa elemen terbesar, yakni elemen undang-undang merupakan unit perolehan informasi terbaik dibanding elemen bab dan elemen pasal. Sementara itu, elemen pasal merupakan elemen yang memiliki dokumen relevan terbanyak dalam hasil pencarian.

Indonesian legal documents have some characteristics that differs it from general documents. The characteristics can be classified into two types: characteristic that can be seen clearly and characteristic that can be detected only by using statistical linguistic methods. The structural writing of legal document is a subset of the first type characteristic while words frequency and words distribution among collection can be included into the second type. Existence of those characteristics made information retrieval in legal document has differences compare to retrieval in general text collection, such as using document structure as a retrieval unit and using special stopwords for legal document. In this undergraduate thesis, we developed information retrieval system for Indonesian legal document. The system employed three information retrieval main components: indexing, searching, and ranking. We used two approaches in indexing step: made biggest element and valuable element (chapter and article) as an indexing unit. The approaches taken have a purpose to exploit the structural writing of legal document. We used legal document which has been tagged with XML syntax to make it easier to afford the purpose. The issue of using special stopwords for document legal were omitted in this research because it has been replaced by XML syntax. Finally, we conducted some experiments to evaluate performance of each indexing types. We used Indonesian law documents which released from 1983 until 2009 as experiments data. We conclude that the biggest element is the best indexing unit among others. Beside that, we found that article element is the most frequent element which occur in search result lists."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian