Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 99142 dokumen yang sesuai dengan query
cover
Rama Rizki
"Tema sentral dari penelitian ini adalah ?Perolehan Informasi Lintas Bahasa? yang merupakan salah satu cabang dari perolehan informasi yang berhubungan dengan masalah dalam menyajikan suatu kueri dari satu bahasa dan memperoleh dokumen dalam satu bahasa ataupun beberapa bahasa yang lain. Penelitian ini mempelajari pengaruh teknik-teknik perolehan informasi lintas bahasa pada proses penerjemahan kueri. Teknik tersebut digunakan untuk mengurangi keambiguan pada kueri terjemahan sehingga dapat mendekati proses perolehan informasi satu bahasa. Teknik yang digunakan terdiri dari teknik perbaikan kueri sebelum penerjemahan, perbaikan terjemahan oleh kamus, dan pengelompokan dokumen, serta teknik perbaikan kueri dengan melakukan perluasan. Teknik perbaikan kueri sebelum penerjemahan menggunakan teknik pengelompokan kata. Teknik perbaikan terjemahan kamus terdiri dari penerjemahan langsung, penerjemahan dengan menggunakan terjemahan yang muncul berulangkali pada setiap kamus, dan teknik pengelompokan dokumen. Teknik perluasan kueri menggunakan umpan balik relevan semu. Teknik-teknik tersebut berbasiskan teknik perolehan informasi lintas bahasa Inggris-Indonesia menggunakan kamus dwi-bahasa. Teknik-teknik yang diterapkan untuk perolehan informasi lintas bahasa Inggris-Indonesia tidak dapat mendekati hasil perolehan informasi satu bahasa (Indonesia). Secara keseluruhan, hasil yang dicapai pada teknik untuk mengurangi keambiguan terjemahan mencapai hanya 63.84% terhadap perolehan informasi satu bahasa. Sedangkan penerapan teknik perluasan kueri hanya mencapai 47.56% terhadap perolehan informasi satu bahasa. Penerapan teknik perbaikan terjemahan mempergunakan kamus dwi-bahasa Inggris-Indonesia hanya dapat menghasilkan nilai hasil perolehan informasi tertinggi sebesar 60.80% terhadap hasil perolehan informasi satu bahasa (Indonesia). Pada penerapan teknik perbaikan kueri sebelum penerjemahan yang dikombinasikan dengan teknik perbaikan terjemahan oleh kamus, dapat ditemukan peningkatan nilai hasil perolehan informasi antara 2.63% - 2.84% bila dibandingkan dengan hasil perolehan informasi untuk teknik perbaikan terjemahan oleh kamus. Pada penerapan perluasan kueri menggunakan teknik umpan balik relevan semu terhadap hasil penerjemahan dengan teknik-teknik lain, dapat ditemukan bahwa teknik ini tidak dapat menaikkan hasil perolehan informasi. Hasil terbaik yang diperoleh pada perluasan kueri adalah pada teknik yang menggunakan kombinasi perluasan kueri pada perbaikan kueri sebelum penerjemahan dan perluasan kueri pada perbaikan hasil penerjemahan yang mencapai hasil perolehan informasi sebesar 47.56% terhadap perolehan informasi satu bahasa."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Ananda Budi Prasetya
"Perolehan informasi Web adalah cabang perolehan informasi yang mengkhususkan pencarian informasi terhadap dokumen Web. Dokumen yang terdapat pada lingkungan Web memiliki struktur yang berbeda dengan dokumen teks biasa, sehingga menyebabkan pendekatan perolehan informasi pada dokumen Web berbeda dengan dokumen biasa. Pada penelitian ini digunakan koleksi dokumen EuroGOV yangmerupakan koleksi dokumen Web multibahasa yang digunakan pada WebCLEF, dan kueri atau topik yang digunakan adalah kueri yang diberikan pihak WebCLEF. Koleksi dokumen dan kueri yang digunakan terdiri dari 15 bahasa Eropa. Pada penelitian ini dipelajari pengaruh berbagai teknik perolehan informasi, yaitu operator kedekatan kata, umpan balik relevan semu, pendeteksian bahasa, analisis pranala, PageRank, dan pengelompokan dokumen, terhadap hasil perolehan informasi Web multi bahasa yang dihasilkan teknik-teknik tersebut. Selain itu pada penelitian ini juga dipelajari kemampuan dari sistem perolehan informasi Indri Search Engine dalam mencari dan memperoleh dokumen Web multibahasa.
Penelitian ini menemukan bahwa dengan melakukan evaluasi secara umum tanpa melihat bahasa, kenaikan nilai perolehan hanya didapatkan dengan menggunakan teknik pendeteksian bahasa sebesar 0.72% dan teknik umpan balik relevan semu sebesar 1.02% - 1.61%. Sedangkan pada teknik analisis pranala, PageRank, dan pengelompokan dokumen, nilai perolehan informasi yang didapatkan menurun sebesar -46.3431% - -0.60%. Dengan melakukan evaluasi berdasarkan bahasa, didapatkan bahwa setiap teknik yang diteliti dan dipelajari memiliki keunggulan masing-masing berdasarkan bahasa. Untuk teknik pengurutan ulang pendeteksian bahasa, peningkatan nilai perolehan informasi terdapat pada 6 bahasa sebesar 0.1478% - 27.1431%, dan penurunan terdapat pada 10 bahasa sebesar -0.7066% - -0.0156%. Untuk teknik analisis pranala dalam, peningkatan nilai perolehan informasi terdapat pada 4 bahasa sebesar 6.5585% - 77.1804%, dan penurunan terdapat pada 4 bahasa sebesar -60.9202% - -0.3339%, dan untuk analisis pranala luar terdapat kenaikan pada 9 bahasa sebesar 0.7151% - 134.9881%, dan penurunan terdapat pada 6 bahasa sebesar -23.2941% - -1.6330%, sedangkan untuk kombinasi analisis pranala dalam dan luar terdapat pada 5 bahasa sebesar 0.2809% - 100%, dan penurunan terdapat pada 10 bahasa sebesar -92.0830% - -3.1030%. Untuk teknik PageRank, peningkatan nilai informasi masi terdapat pada 4 bahasa sebesar 5.1083% - 77.1804%,dan penurunan terdapat pada 10 bahasa sebesar -96.4844% - -2.6968%. Dan untuk pengelompokan berdasarkan bahasa, peningkatan nilai informasi terdapat pada 3 bahasa sebesar 3.6440% - 38.7337%, dan penurunan terdapat pada 9 bahasa sebesar -53.6322% - -1.6715%. Untuk pengelompokan berdasarkan topik, peningkatan tertinggi terdapat pada satu bahasa, yaitu Spanyol sebesar 12.4754% dan penurunan terdapat pada 5 bahasa sebesar -97.5600% - -35.6133%. Untuk teknik umpan balik relevan semu, peningkatan nilai perolehan informasi terdapat pada 7 bahasa sebesar 0.0472% - 5.1523%, penurunan hanya terdapat pada dua bahasa sebesar -4.2597% - -0.2760%. Berdasarkan penelitian ini disimpulkan bahwa sistem perolehan in- formasi Indri Search Engine dapat mencari dan memperoleh dokumen Web multibahasa dengan baik, dan teknik perolehan Web standar dapat diterapkan juga pada koleksi dokumen Web multibahasa."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Anisa Hasna Nabila
"Manajemen Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI) memiliki kebutuhan akan data alumni dalam jumlah yang cukup besar. Data yang dibutuhkan juga beragam dan ditujukan untuk berbagai kepentingan, diantaranya adalah kepentingan akreditasi akademik serta kerja sama akademik. Sayangnya, data alumni yang tersimpan pada Sistem Informasi Akademik NextGeneration (SIAKNG) sebagai sumber data utama sudah tidak lagi up-to-date dan tidak dapat diperbarui secara mandiri oleh alumni terkait. Untuk mengatasi masalah tersebut, sebuah sistem alumni berbasis website bernama ILUNI12 Channel dikembangkan. Akan tetapi, berdasarkan wawancara yang dilakukan kepada Manajemen Fasilkom UI, saat ini sistem masih memiliki kekurangan dan belum dapat memenuhi kebutuhan mereka. Selain Manajemen Fasilkom UI, pengurus ILUNI Fasilkom UI dan para alumni sendiri juga mengalami kesulitan dalam memperoleh data alumni untuk kebutuhan mereka. Penelitian ini ditujukan untuk mengembangkan solusi atas permasalahan yang dialami dengan menggunakan agile methodology sebagai metodologi penelitian. Penelitian ini mengidentifikasi masalah dan kebutuhan menggunakan metode kualitatif. Masalah yang diidentifikasi dikelompokkan menjadi dua masalah utama, yaitu masalah terkait data gathering dan data retrieval. Berdasarkan masalah-masalah tersebut, penelitian ini mengajukan proposal solusi serta rancangan solusi dari aspek teknis. Melalui rancangan solusi tersebut, penelitian ini berhasil mengimplementasi solusi berupa fitur-fitur data gathering dan data retrieval pada sistem ILUNI12 Channel. Penelitian ini kemudian mengevaluasi solusi dengan melakukan usability testing serta user acceptance testing kepada satu pihak manajemen dan lima orang alumni. Hasil kuesioner system usability scale memiliki nilai rata-rata 85.83 dengan grade scale B. Grade ini menunjukkan bahwa desain dari fitur-fitur yang diimplementasi sudah dapat diterima dengan baik oleh pengguna. Selain itu, responden penelitian juga menyatakan bahwa fitur-fitur yang diimplementasi sudah dapat memenuhi kebutuhan dan menyelesaikan masalah yang dihadapi.

The Management of the Faculty of Computer Science, University of Indonesia (Fasilkom UI) has a need for a large amount of alumni data. The data required are varied and are intended for various purposes, including the interests of academic accreditation and academic cooperation. Unfortunately, the alumni data stored in the NextGeneration Academic Information System (SIAK-NG) as the main data source are no longer up-to-date and cannot be updated independently by the alumni. To solve this problem, a website-based alumni system called ILUNI12 Channel was developed. However, based on interviews conducted with Management of Fasilkom UI, the current system still has shortcomings and has not been able to meet their needs. Apart from Management of Fasilkom UI, ILUNI Fasilkom UI administrators and alumni themselves also experienced difficulties in obtaining alumni data for their needs. This research is aimed at developing solutions to the problems experienced by using agile methodology as a research methodology. This study identifies problems and needs using qualitative methods. The identified problems are grouped into two main problems, namely problems related to data gathering and data retrieval. Based on these problems, this research proposes a solution proposal as well as a solution design from the technical aspect. Through this solution design, this research succeeded in implementing a solution in the form of data gathering and data retrieval features on the ILUNI12 Channel system. This research then evaluates the solution by conducting usability testing and user acceptance testing on one management and five alumni. The results of the system usability scale questionnaire have an average score of 85.83 with a B grade scale. This grade indicates that the design of the implemented features has been well received by users. In addition, research respondents also stated that the features that were implemented were able to solve the problems at hand."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anisa Hasna Nabila
"Manajemen Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI) memiliki kebutuhan akan data alumni dalam jumlah yang cukup besar. Data yang dibutuhkan juga beragam dan ditujukan untuk berbagai kepentingan, diantaranya adalah kepentingan akreditasi akademik serta kerja sama akademik. Sayangnya, data alumni yang tersimpan pada Sistem Informasi Akademik NextGeneration (SIAKNG) sebagai sumber data utama sudah tidak lagi up-to-date dan tidak dapat diperbarui secara mandiri oleh alumni terkait. Untuk mengatasi masalah tersebut, sebuah sistem alumni berbasis website bernama ILUNI12 Channel dikembangkan. Akan tetapi, berdasarkan wawancara yang dilakukan kepada Manajemen Fasilkom UI, saat ini sistem masih memiliki kekurangan dan belum dapat memenuhi kebutuhan mereka. Selain Manajemen Fasilkom UI, pengurus ILUNI Fasilkom UI dan para alumni sendiri juga mengalami kesulitan dalam memperoleh data alumni untuk kebutuhan mereka. Penelitian ini ditujukan untuk mengembangkan solusi atas permasalahan yang dialami dengan menggunakan agile methodology sebagai metodologi penelitian. Penelitian ini mengidentifikasi masalah dan kebutuhan menggunakan metode kualitatif. Masalah yang diidentifikasi dikelompokkan menjadi dua masalah utama, yaitu masalah terkait data gathering dan data retrieval. Berdasarkan masalah-masalah tersebut, penelitian ini mengajukan proposal solusi serta rancangan solusi dari aspek teknis. Melalui rancangan solusi tersebut, penelitian ini berhasil mengimplementasi solusi berupa fitur-fitur data gathering dan data retrieval pada sistem ILUNI12 Channel. Penelitian ini kemudian mengevaluasi solusi dengan melakukan usability testing serta user acceptance testing kepada satu pihak manajemen dan lima orang alumni. Hasil kuesioner system usability scale memiliki nilai rata-rata 85.83 dengan grade scale B. Grade ini menunjukkan bahwa desain dari fitur-fitur yang diimplementasi sudah dapat diterima dengan baik oleh pengguna. Selain itu, responden penelitian juga menyatakan bahwa fitur-fitur yang diimplementasi sudah dapat memenuhi kebutuhan dan menyelesaikan masalah yang dihadapi.

The Management of the Faculty of Computer Science, University of Indonesia (Fasilkom UI) has a need for a large amount of alumni data. The data required are varied and are intended for various purposes, including the interests of academic accreditation and academic cooperation. Unfortunately, the alumni data stored in the NextGeneration Academic Information System (SIAK-NG) as the main data source are no longer up-to-date and cannot be updated independently by the alumni. To solve this problem, a website-based alumni system called ILUNI12 Channel was developed. However, based on interviews conducted with Management of Fasilkom UI, the current system still has shortcomings and has not been able to meet their needs. Apart from Management of Fasilkom UI, ILUNI Fasilkom UI administrators and alumni themselves also experienced difficulties in obtaining alumni data for their needs. This research is aimed at developing solutions to the problems experienced by using agile methodology as a research methodology. This study identifies problems and needs using qualitative methods. The identified problems are grouped into two main problems, namely problems related to data gathering and data retrieval. Based on these problems, this research proposes a solution proposal as well as a solution design from the technical aspect. Through this solution design, this research succeeded in implementing a solution in the form of data gathering and data retrieval features on the ILUNI12 Channel system. This research then evaluates the solution by conducting usability testing and user acceptance testing on one management and five alumni. The results of the system usability scale questionnaire have an average score of 85.83 with a B grade scale. This grade indicates that the design of the implemented features has been well received by users. In addition, research respondents also stated that the features that were implemented were able to solve the problems at hand."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Anisa Hasna Nabila
"Manajemen Fakultas Ilmu Komputer Universitas Indonesia (Fasilkom UI) memiliki kebutuhan akan data alumni dalam jumlah yang cukup besar. Data yang dibutuhkan juga beragam dan ditujukan untuk berbagai kepentingan, diantaranya adalah kepentingan akreditasi akademik serta kerja sama akademik. Sayangnya, data alumni yang tersimpan pada Sistem Informasi Akademik NextGeneration (SIAK-NG) sebagai sumber data utama sudah tidak lagi up-to-date dan tidak dapat diperbarui secara mandiri oleh alumni terkait. Untuk mengatasi masalah tersebut, sebuah sistem alumni berbasis website bernama ILUNI12 Channel dikembangkan. Akan tetapi, berdasarkan wawancara yang dilakukan kepada Manajemen Fasilkom UI, saat ini sistem masih memiliki kekurangan dan belum dapat memenuhi kebutuhan mereka. Selain Manajemen Fasilkom UI, pengurus ILUNI Fasilkom UI dan para alumni sendiri juga mengalami kesulitan dalam memperoleh data alumni untuk kebutuhan mereka. Penelitian ini ditujukan untuk mengembangkan solusi atas permasalahan yang dialami dengan menggunakan agile methodology sebagai metodologi penelitian. Penelitian ini mengidentifikasi masalah dan kebutuhan menggunakan metode kualitatif. Masalah yang diidentifikasi dikelompokkan menjadi dua masalah utama, yaitu masalah terkait data gathering dan data retrieval. Berdasarkan masalah-masalah tersebut, penelitian ini mengajukan proposal solusi serta rancangan solusi dari aspek teknis. Melalui rancangan solusi tersebut, penelitian ini berhasil mengimplementasi solusi berupa fitur-fitur data gathering dan data retrieval pada sistem ILUNI12 Channel. Penelitian ini kemudian mengevaluasi solusi dengan melakukan usability testing serta user acceptance testing kepada satu pihak manajemen dan lima orang alumni. Hasil kuesioner system usability scale memiliki nilai rata-rata 85.83 dengan grade scale B. Grade ini menunjukkan bahwa desain dari fitur-fitur yang diimplementasi sudah dapat diterima dengan baik oleh pengguna. Selain itu, responden penelitian juga menyatakan bahwa fitur-fitur yang diimplementasi sudah dapat memenuhi kebutuhan dan menyelesaikan masalah yang dihadapi.

The Management of the Faculty of Computer Science, University of Indonesia (Fasilkom UI) has a need for a large amount of alumni data. The data required are varied and are intended for various purposes, including the interests of academic accreditation and academic cooperation. Unfortunately, the alumni data stored in the NextGeneration Academic Information System (SIAK-NG) as the main data source are no longer up-to-date and cannot be updated independently by the alumni. To solve this problem, a website-based alumni system called ILUNI12 Channel was developed. However, based on interviews conducted with Management of Fasilkom UI, the current system still has shortcomings and has not been able to meet their needs. Apart from Management of Fasilkom UI, ILUNI Fasilkom UI administrators and alumni themselves also experienced difficulties in obtaining alumni data for their needs. This research is aimed at developing solutions to the problems experienced by using agile methodology as a research methodology. This study identifies problems and needs using qualitative methods. The identified problems are grouped into two main problems, namely problems related to data gathering and data retrieval. Based on these problems, this research proposes a solution proposal as well as a solution design from the technical aspect. Through this solution design, this research succeeded in implementing a solution in the form of data gathering and data retrieval features on the ILUNI12 Channel system. This research then evaluates the solution by conducting usability testing and user acceptance testing on one management and five alumni. The results of the system usability scale questionnaire have an average score of 85.83 with a B grade scale. This grade indicates that the design of the implemented features has been well received by users. In addition, research respondents also stated that the features that were implemented were able to solve the problems at hand."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Armando Yonathan
"Informasi yang terdapat saat ini tidak hanya terbatas disimpan dalam bentuk dokumen teks saja, tetapi banyak juga dalam bentuk dokumen suara. Banyaknya informasi yang disimpan dalam bentuk dokumen suara menyebabkan diperlukannya teknik perolehan informasi yang dapat diterapkan kepada koleksi dokumen tersebut. Pendekatan yang banyak dilakukan adalah dengan menggunakan hasil pengenalan suara oleh Sistem Pengenalan Suara Otomatis (SPSO). Tetapi, hasil pengenalan suara oleh SPSO tidak sepenuhnya benar sehingga menurunkan tingkat akurasi perolehan informasi dokumen suara. Pada penelitian ini penulis mencoba empat jenis hasil pengenalan suara untuk melakukan perolehan informasi dokumen suara, yaitu 1-best output, n-best word output, n-best pronounciation output, word posterior lattice. Selain itu, penulis juga mencoba tiga jenis kueri pada penelitian ini, yaitu kueri satu kata, kueri frase dua kata dan kueri kalimat. Hasil yang didapat pada penelitian ini menyimpulkan bahwa penggunaan 1-best output pada perolehan informasi dokumen suara menghasilkan kinerja yang lebih baik dibandingkan penggunaan hasil pengenalan suara yang lain. Mean Average Precision (MAP) hasil eksperimen dengan 1-best output lebih besar 0.64% dibandingkan penggunaan n-best output , 8,88% lebih besar dibandingkan penggunaan word posterior lattice dan lebih besar 92.68% dibandingkan penggunaan n-best pronounciation output. Pada eksperimen dengan kueri frase, sistem dengan akurasi terbaik adalah sistem yang menggunakan word posterior lattice. Pada eksperimen dengan kueri satu kata dan kueri kalimat, sistem yang menggunakan n-best word output menghasilkan kinerja terbaik.

The information today is not only limited in the form of text documents, but also in the form of spoken documents. The growing number of those spoken documents requires the information retrieval techniques to make the retrieval process easier. The approach for spoken documents retrieval is using automatic speech recognition (ASR). However, the results of the speech recognition by ASR are not entirely correct, so reduce the level of accuracy of information retrieval of spoken documents. This experiment uses four types results of the speech recognition by ASR, the 1-best output, n-best output, n-best pronunciation output, word posterior lattice. In addition, this experiment also investigates the effect of the use of query types (phrase, single word and sentence). Results obtained from this experiment concluded that the use of 1-best output on spoken document retrieval produces better performance results than the use of other results of the speech recognition. Mean Average Precision (MAP) results of experiments with 1-best output is 0.64% higher than the use of n-best output, 8.88% higher than the use of word posterior lattice and 92.68% higher than the use of n-best pronunciation output. In phrase based query experiment, the best accuracy is word posterior lattice while the best accuracy in single word query and sentence query is n-best word output."
Depok: Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Yans Sukma Pratama
"Dokumen legal Indonesia memiliki karakteristik yang membedakannya dengan dokumen umum. Karakteristik tersebut ada yang kasat mata seperti struktur penulisan dan ada pula yang tidak kasat mata seperti frekuensi kata dan sebaran kata dalam dokumen. Adanya karakteristik tersebut membuat perolehan informasi pada dokumen legal berbeda dengan dokumen teks biasa, misalnya isu pemanfaatan struktur dokumen legal sebagai unit perolehan informasi dan penggunaan stopwords khusus dokumen legal. Dalam penelitian tugas akhir ini, dikembangkan sistem perolehan informasi untuk dokumen legal Indonesia. Sistem yang dikembangkan mencakup tiga komponen utama dalam perolehan informasi, yakni pengindeksan, pencarian, dan pemeringkatan hasil. Pengindeksan dilakukan dengan menggunakan dua buah pendekatan: pengindeksan elemen terbesar dan pengindeksan elemen yang dianggap berharga sebagai unit perolehan informasi, yaitu elemen bab dan elemen pasal. Pendekatan ini diambil dengan tujuan memanfaatkan struktur penulisan pada dokumen legal. Untuk itu, dalam penelitian ini digunakan koleksi dokumen legal yang sudah ditandai dengan tag XML. Isu penggunaan stopwords khusus dokumen legal tidak ditangani dalam penelitian ini, mengingat kata-kata yang umum muncul dalam dokumen legal direpresentasikan dengan tag-tag XML. Sejumlah ujicoba dilakukan untuk mengevaluasi sejauh mana kinerja setiap jenis pendekatan. Data yang digunakan sebagai ujicoba adalah undang-undang Republik Indonesia yang diundangkan mulai tahun 1983 hingga 2009. Hasil ujicoba menunjukkan bahwa elemen terbesar, yakni elemen undang-undang merupakan unit perolehan informasi terbaik dibanding elemen bab dan elemen pasal. Sementara itu, elemen pasal merupakan elemen yang memiliki dokumen relevan terbanyak dalam hasil pencarian.

Indonesian legal documents have some characteristics that differs it from general documents. The characteristics can be classified into two types: characteristic that can be seen clearly and characteristic that can be detected only by using statistical linguistic methods. The structural writing of legal document is a subset of the first type characteristic while words frequency and words distribution among collection can be included into the second type. Existence of those characteristics made information retrieval in legal document has differences compare to retrieval in general text collection, such as using document structure as a retrieval unit and using special stopwords for legal document. In this undergraduate thesis, we developed information retrieval system for Indonesian legal document. The system employed three information retrieval main components: indexing, searching, and ranking. We used two approaches in indexing step: made biggest element and valuable element (chapter and article) as an indexing unit. The approaches taken have a purpose to exploit the structural writing of legal document. We used legal document which has been tagged with XML syntax to make it easier to afford the purpose. The issue of using special stopwords for document legal were omitted in this research because it has been replaced by XML syntax. Finally, we conducted some experiments to evaluate performance of each indexing types. We used Indonesian law documents which released from 1983 until 2009 as experiments data. We conclude that the biggest element is the best indexing unit among others. Beside that, we found that article element is the most frequent element which occur in search result lists."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Aprilia
"Untuk memenuhi kebutuhan manusia dalam mendapatkan informasi yang banyak dalam waktu yang singkat, teknologi informasi terus menerus dikembangkan. Saat ini informasi menjadi lebih mudah didapat melalui internet. Pengguna internet terdiri dari berbagai macam orang dengan berbagai macam suku bangsa dan bahasa. Dokumen yang dapat diakses melalui internet juga terdiri dari berbagai bahasa.
Untuk memudahkan pencari informasi mendapatkan informasi yang mereka inginkan tanpa terhalangi faktor bahasa, maka dikembangkan teknologi perolehan informasi lintas bahasa. Perolehan informasi lintas bahasa adalah perolehan informasi atau dokumen yang ditulis dalam bahasa yang berbeda dari bahasa kueri. Teknologi perolehan informasi lintas bahasa yang berkembang saat ini antara lain adalah dengan menggunakan mesin penerjemah, dengan kamus dwibahasa, dan berdasarkan korpus. Teknologi perolehan informasi lintas bahasa berdasarkan korpus dapat menggunakan korpus paralel atau korpus yang sebanding. Pada penelitian kali ini, dicoba teknik perolehan informasi berdasarkan korpus yang sebanding dengan menggunakan penghitungan statistik phi square dan koefisien korelasi Pearson.
Hasil dari eksperimen yang dilakukan dalam penelitian ini menunjukkan bahwa kinerja dari perolehan dokumen lintas bahasa dengan menggunakan teknik phi square dapat mencapai 494% dari kinerja kamus dwi-bahasa, sedangkan kinerja korelasi Pearson dapat mencapai 510% dari kinerja kamus dwi-bahasa. Kinerja dari perolehan dokumen lintas bahasa dengan menggunakan teknik phi square dapat mencapai 117% dari kinerja mesin penerjemah Transtool, sedangkan kinerja korelasi Pearson dapat mencapai 121%."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Dwi Astuti Aprijani
"Penelitian ini mengkaji penggunaan Maximal Frequent Sequences (MFS) sebagai indeks dalam koleksi dokumen untuk Sistem Temu-kembali Informasi teks berbahasa Indonesia. Indeks, sebagai representasi dokumen, harus menggambarkan informasi keseluruhan yang terkandung dalam dokumen. MFS sebagai salah satu cara untuk mengekspresikan multi kata (frase) dapat digunakan sebagai indeks dalam koleksi dokumen untuk merepresentasikan isi dokumen. Kekuatan utama MFS dapat membentuk indeks yang sangat solid karena menoleransi adanya kata-kata pemisah di antara suatu pasangan kata dan jumlah istilah yang digunakan sebagai indeks sedikit. Hasil uji coba terhadap 1162 dokumen ilmiah dan 2999 dokumen berita menunjukkan bahwa jumlah istilah pada pengindeksan berdasarkan MFS jauh lebih sedikit dibandingkan jumlah istilah pada pengindeksan berdasarkan frekuensi kata (term frequency), yaitu 31% untuk koleksi dokumen ilmiah non-stemming, 48% untuk koleksi dokumen ilmiah stemming, 30% untuk koleksi dokumen berita non-stemming, dan 59% untuk koleksi dokumen berita stemming. Pada koleksi dokumen ilmiah, MFS dengan nilai threshold yang lebih kecil relatif mampu memperbaiki nilai presisi, baik presisi rata-rata sesudah memproses 20 dokumen maupun presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan. Pada koleksi dokumen berita, MFS dengan nilai threshold yang kecil relatif memperbaiki nilai presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan, namun threshold yang lebih besar justru memperbaiki presisi rata-rata sesudah memproses 10 dokumen. Efek stemming meningkatkan presisi rata-rata sesudah memproses 10 dokumen dan presisi rata-rata sesudah memproses dokumen dengan jumlah yang sesuai dengan jumlah dokumen relevan pada sistem temu-kembali informasi ini."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Wisnu Linggakusuma Wardhana
"Tersedianya sumber informasi yang tidak terbatas pada saat ini, menjadikan perolehan informasi melibatkan banyak sumber informasi. Hal-hal tersebut memicu penelitian mengenai metode peringkasan dokumen yang semula ditujukan untuk membuat sebuah ringkasan dari sebuah dokumen menjadi metode peringkasan yang ditujukan untuk menghasilkan ringkasan dari banyak dokumen. Peringkasan multi-dokumen merupakan suatu metode yang ditujukan untuk menyampaikan informasi-informasi utama dari banyak dokumen dalam ringkasan. Penelitian yang dilakukan oleh penulis ini merupakan penelitian dengan topik peringkasan multi-dokumen untuk dokumen berbahasa Indonesia. Pada penelitian ini, penulis menggunakan dua buah teknik peringkasan multi-dokumen yaitu centroidbased summarization dan k-means-based summarization. Pada penelitian ini penulis mencoba untuk mengaplikasikan kedua teknik tersebut untuk membuat ringkasan dari dokumen berbahasa Indonesia.
Untuk mengukur kualitas ringkasan yang dihasilkan oleh kedua teknik tersebut, penulis membuat ringkasan referensi untuk masing-masing sumber dokumen yang dibuat secara manual sebagai perbandingan. Hasilnya adalah pada teknik centroidbased summarization, kualitas ringkasan yang dihasilkan akan semakin bagus jika kelompok dokumen yang digunakan sebagai masukan berisi dokumen-dokumen yang relevan terhadap topik. Sedangkan pada teknik k-means-based summarization, kualitas ringkasan yang dihasilkan akan semakin bagus jika kelompok dokumen yang digunakan sebagai masukan merupakan kelompok dokumen yang besar (lebih banyak mengandung dokumen/kalimat). Evaluasi terhadap kualitas ringkasan juga dilakukan dengan menggunakan juri/penilai manusia. Hasilnya adalah pada teknik centroid-based summarization, para juri menilai ringkasan yang dihasilkan sudah bagus. Pada teknik k-means-based summarization dengan 10% compression rate, para juri menilai bahwa ringkasan."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>