Ditemukan 9521 dokumen yang sesuai dengan query
Volker Margner, editor
"Topics and features presents a detailed overview of Arabic character recognition technology, covering a range of different aspects of pre-processing and feature extraction, reviews a broad selection of varying approaches, including HMM-based methods and a recognition system based on multidimensional recurrent neural networks, examines the evaluation of Arabic script recognition systems, discussing data collection and annotation, benchmarking strategies, and handwriting recognition competitions, describes numerous applications of Arabic script recognition technology, from historical Arabic manuscripts to online Arabic recognition."
London: Springer, 2012
e20407620
eBooks Universitas Indonesia Library
Searfoss, Glenn
New York: Van Nosttrand Reinhold , 1994
495.6 SEA j
Buku Teks SO Universitas Indonesia Library
Elmahdy, Mohamed
"Novel techniques for dialectal Arabic speech describes approaches to improve automatic speech recognition for dialectal Arabic. Since speech resources for dialectal Arabic speech recognition are very sparse, the authors describe how existing Modern Standard Arabic (MSA) speech data can be applied to dialectal Arabic speech recognition, while assuming that MSA is always a second language for all Arabic speakers. "
New York: [, Springer], 2012
e20418294
eBooks Universitas Indonesia Library
"Telah dibuat sistem pendataan pengunjung perpustakaan dengan cara membaca Nomor Pokok Mahasiswa (NPM) yang tertera pada image kartu mahasiswa (KTM). Penangkapan image KTM dilakukan dengan menggunakan webcam Prolink PCC 900. Sistem ini meliputi modul image processing untuk mengekstraksi NPM dari image KTM dan mengsegmentasi untuk setiap karakternya; dan modul artificial neural network untuk pengenalan karakter. Modul image processing melibatkan profil proyeksi, operator dilatasi, graying, adaptive thresholding, dan filter median. Neural network feed-forward dua layer digunakan untuk mengenali pola piksel satu dan nol pada image karakter yang telah disegmentasi dari image NPM. Network ini dilatih dengan menggunakan metode dasar back-propagation. Beberapa ukuran network diuji dan kemudian dipilih salah satu yang memberikan nilai error terkecil pada sampel pengujian."
Universitas Indonesia, 2006
S28855
UI - Skripsi Membership Universitas Indonesia Library
Parluhutan, Matthew Tumbur
"Pandemi COVID-19 mengubah pola kehidupan manusia, termasuk sistem perkuliahan yang berubah ke metode daring. Video perkuliahan dengan salindia menjadi salah satu pilihan sarana penyampaian materi kuliah secara daring. Penelitian ini bermaksud menguji keabsahan rancangan sistem yang mampu melakukan segmentasi temporal sesuai topik secara otomatis pada video perkuliahan. Sistem yang diajukan dibagi menjadi tiga sub-sistem yang memanfaatkan teknologi keyframe extraction, optical character recognition (OCR), dan topic modelling. Pertama, video perkuliahan akan diubah menjadi kumpulan keyframe dengan memanfaatkan metode Slide Detector yang dimodifikasi. Selanjutnya, akan dilakukan ekstraksi teks dari frame-frame tersebut menggunakan Tesseract OCR dengan preprocessing tambahan. Akhirnya, BERTopic dengan beragam algoritma clustering dan LDA diuji kemampuannya dalam topic modelling yang berguna untuk mengambil topik yang koheren dari teks tersebut. Penelitian pada tahap keyframe extraction menunjukkan bahwa terdapat peningkatan recall sebesar 0,235-025 dari 0 dan precision sebesar 0,619-0,75 dari 0 pada beberapa video pada Slide Detector termodifikasi. Sebaliknya, penelitian pada tahap OCR menunjukkan bahwa tambahan preprocessing belum bisa membantu meningkatkan performa Tesseract OCR. Pada tahap terakhir, ditemukan bahwa BERTopic lebih unggul daripada LDA dalam menarik topik yang koheren untuk use case penelitian ini. Agglomerative dan KMeans clustering ditemukan lebih optimal untuk kasus video perkuliahan jika dibandingkan dengan metode density-based. Augmentasi data dengan takaran yang sesuai diperlukan untuk mendapatkan hasil sedemikian rupa pada tahap ini. Secara umum, sistem dengan tiga bagian yang diusulkan pada penelitian ini sudah mampu melakukan segmentasi video perkuliahan sesuai tujuan, namun, video perkuliahan bersalindia merupakan dataset yang sangat heterogen dan merancang sebuah sistem yang mampu memanfaatkan dataset tersebut adalah tantangan tersendiri.
The COVID-19 pandemic changed the lifestyle of many people, including university lectures that moved to online delivery. Lecture videos with slides became an option to deliver lecture materials online. This work attempts to show a proof of concept for a system design that is able to automatically segment a lecture video temporally based on the topic. The proposed system is divided into three subsystems that make use of keyframe extraction, optical character recognition (OCR), and topic modelling techniques. First, a lecture video will be converted to a collection of keyframes using a modified Slide Detector technique. Next, those frames will be processed using Tesseract OCR with some additional preprocessing steps to extract text. Lastly, BERTopic with various clustering techniques and LDA will be used for topic modelling to obtain a coherent topic from the text extracted earlier. The research in the keyframe extraction step shows that there is an increase of 0.235-0,5 points from 0 for recall and 0,619-0,75 points from 0 for precision for certain videos using the modified Slide Detector. On the other hand, the research in the OCR step shows that the additional preprocessing is not yet able to help increase the performance of Tesseract OCR. At the last step, BERTopic proves to be better than LDA to obtain the coherent topic for this system's use case. Agglomerative and KMeans clustering is better for lecture videos compared to density-based methods. Appropriate amounts of data augmentation is needed to obtain the best results at this step. Overall, the three-part system in this research is able to segment lecture videos as intended, however, lecture videos with slides is a dataset that is very heterogeneous and designing a system to handle all types of videos is a large challenge."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir Universitas Indonesia Library
AbuZeina, Dia
"Cross-word modeling for Arabic speech recognition utilizes phonological rules in order to model the cross-word problem, a merging of adjacent words in speech caused by continuous speech, to enhance the performance of continuous speech recognition systems. The author aims to provide an understanding of the cross-word problem and how it can be avoided, specifically focusing on Arabic phonology using an HHM-based classifier."
New York: [, Springer], 2012
e20418404
eBooks Universitas Indonesia Library
Puja Romulus
"
ABSTRAKSkripsi ini bertujuan untuk mendukung pemeliharaan aset budaya bangsa, terkhusus dalam hal sistem penulisan atau aksara kuno. Implementasinya akan membahas aspek teknologi yaitu pengolahan citra. Pada penelitian kali ini objek yang dikhususkan adalah aksara kuno dari suku Batak. Implementasi dari ide ini akan berbentuk program yang dapat mendeteksi karakter-karakter pada citra dari sebuah dokumen aksara Batak yang bebas dari noise. Program akan memproses citra dari tahapan segmentasi, preprocessing, ekstraksi fitur hingga tahapan klasifikasi. Secara khusus pada ekstraksi fitur dan juga klasifikasi akan ada dua metode yang digunakan yaitu Geometric Moment Invariant dan juga K-Nearest Neighbor. Hasil dari uji coba terdiri dari dua yaitu akurasi atau ketepatan pembacaan, dan juga waktu pemrosesan. Jangkauan hasil pada akurasi berada pada 42% - 96% sementara waktu pemrosesan berada pada 1.9 – 34 detik.
ABSTRACTThis undergraduate thesis is intended to support the preservation of national cultural asset, especially for the ancient characters. The implentation uses technological approach in image processing field. The researched object for this thesis is Batak ancient character. The implementation of the idea will result an application program that will detect the characters in a sample image of a Batak’s document which is still free from any noise. The application program will process the image through several phases. The phases are segmentation, preprocessing, feature extraction, and classification. There is a special method used in each feature extraction and classification. Feature extraction uses Geometric Moment Invariant whereas classification phases uses K-Nearest Neighbour. There will be two results for this test, the first is accuration of the detection and second is the procesing time. The range for the accuration is 42% - 96% and the processing time ranged from 1.9 – 34 seconds."
Fakultas Teknik Universitas Indonesia, 2014
S56323
UI - Skripsi Membership Universitas Indonesia Library
Muhammad Irfan Junaidi
"Pandemi COVID-19 mengubah pola kehidupan manusia, termasuk sistem perkuliahan yang berubah ke metode daring. Video perkuliahan dengan salindia menjadi salah satu pilihan sarana penyampaian materi kuliah secara daring. Penelitian ini bermaksud menguji keabsahan rancangan sistem yang mampu melakukan segmentasi temporal sesuai topik secara otomatis pada video perkuliahan. Sistem yang diajukan dibagi menjadi tiga sub-sistem yang memanfaatkan teknologi keyframe extraction, optical character recognition (OCR), dan topic modelling. Pertama, video perkuliahan akan diubah menjadi kumpulan keyframe dengan memanfaatkan metode Slide Detector yang dimodifikasi. Selanjutnya, akan dilakukan ekstraksi teks dari frame-frame tersebut menggunakan Tesseract OCR dengan preprocessing tambahan. Akhirnya, BERTopic dengan beragam algoritma clustering dan LDA diuji kemampuannya dalam topic modelling yang berguna untuk mengambil topik yang koheren dari teks tersebut. Penelitian pada tahap keyframe extraction menunjukkan bahwa terdapat peningkatan recall sebesar 0,235-025 dari 0 dan precision sebesar 0,619-0,75 dari 0 pada beberapa video pada Slide Detector termodifikasi. Sebaliknya, penelitian pada tahap OCR menunjukkan bahwa tambahan preprocessing belum bisa membantu meningkatkan performa Tesseract OCR. Pada tahap terakhir, ditemukan bahwa BERTopic lebih unggul daripada LDA dalam menarik topik yang koheren untuk use case penelitian ini. Agglomerative dan KMeans clustering ditemukan lebih optimal untuk kasus video perkuliahan jika dibandingkan dengan metode density-based. Augmentasi data dengan takaran yang sesuai diperlukan untuk mendapatkan hasil sedemikian rupa pada tahap ini. Secara umum, sistem dengan tiga bagian yang diusulkan pada penelitian ini sudah mampu melakukan segmentasi video perkuliahan sesuai tujuan, namun, video perkuliahan bersalindia merupakan dataset yang sangat heterogen dan merancang sebuah sistem yang mampu memanfaatkan dataset tersebut adalah tantangan tersendiri.
The COVID-19 pandemic changed the lifestyle of many people, including university lectures that moved to online delivery. Lecture videos with slides became an option to deliver lecture materials online. This work attempts to show a proof of concept for a system design that is able to automatically segment a lecture video temporally based on the topic. The proposed system is divided into three subsystems that make use of keyframe extraction, optical character recognition (OCR), and topic modelling techniques. First, a lecture video will be converted to a collection of keyframes using a modified Slide Detector technique. Next, those frames will be processed using Tesseract OCR with some additional preprocessing steps to extract text. Lastly, BERTopic with various clustering techniques and LDA will be used for topic modelling to obtain a coherent topic from the text extracted earlier. The research in the keyframe extraction step shows that there is an increase of 0.235-0,5 points from 0 for recall and 0,619-0,75 points from 0 for precision for certain videos using the modified Slide Detector. On the other hand, the research in the OCR step shows that the additional preprocessing is not yet able to help increase the performance of Tesseract OCR. At the last step, BERTopic proves to be better than LDA to obtain the coherent topic for this system's use case. Agglomerative and KMeans clustering is better for lecture videos compared to density-based methods. Appropriate amounts of data augmentation is needed to obtain the best results at this step. Overall, the three-part system in this research is able to segment lecture videos as intended, however, lecture videos with slides is a dataset that is very heterogeneous and designing a system to handle all types of videos is a large challenge."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir Universitas Indonesia Library
Dib, Mohammed
"This book presents a contrastive linguistics study of Arabic and English for the dual purposes of improved language teaching and speech processing of Arabic via spectral analysis and neural networks. Contrastive linguistics is a field of linguistics which aims to compare the linguistic systems of two or more languages in order to ease the tasks of teaching, learning, and translation. The main focus of the present study is to treat the Arabic minimal syllable automatically to facilitate automatic speech processing in Arabic. It represents important reading for language learners and for linguists with an interest in Arabic and computational approaches."
Switzerland: Springer Nature, 2019
e20506958
eBooks Universitas Indonesia Library
Gita Anisa Nurfitri
"Skripsi ini membahas unsur intrinsik novel Najib Kailani "عذراء جاكرتا". Fokus penelitian adalah pada karakter dan penokohan, terutama pada tokoh utama, Fatimah. Penelitian ini merupakan penelitian kualitatif dengan menggunakan metode struktural. Pendekatan metode ini adalah pendekatan deskriptif dan analitis.
Tujuan dari penelitian ini adalah untuk menganalisis unsur-unsur intrinsik baru dan untuk menganalisis karakter dan penokohan, terutama karakter utama dalam novel. Hasil dari penelitian ini adalah Najib Kailani menggambarkan sisi lain dari karakter wanita melalui setiap karakter wanita dalam novel.
This thesis discusses the intrinsic element of Najib Kailani's novel "عذراء جاكرتا". The focus of the research is on character and characterization, especially on the main character, Fatimah. This research is a qualitative research using structural method. The approach of this method is descriptive and analytical approach. The purpose of this study was to analyze new intrinsic elements and to analyze characters and characterizations, especially the main characters in the novel. The result of this study is Najib Kailani describes the other side of the female character through every female character in the novel."
Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2017
S70067
UI - Skripsi Membership Universitas Indonesia Library