Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5088 dokumen yang sesuai dengan query
cover
"Pengenalan karakter pada sebuah dokumen citra yang diambil menggunakan kamera digital membutuhkan citra yang terbinerisasi dengan baik untuk memisahkan antara teks dengan background.Metode binarisasi global tidak memberikan hasil pemisahan yang bagus karena
permasalahan tingkat pencahayaan yang tidak seimbang pada citra hasil kamera digital. Metode binarisasi lokal dapat mengatasi permasalahan tersebut namun metode tersebut membutuhkan metode untuk membagi citra ke dalam bagian - bagian window lokal. Pada paper ini diusulkan sebuah metode binarisasi lokal dengan pembagian citra secara dinamis menggunakan integral image dan decision tree untuk keputusan binarisasi lokalnya.Integral image digunakan untuk mengestimasi jumlah baris teks dalam dokumen citra. Jumlah baris tersebut kemudian digunakan untuk membagi citra dokumen ke dalam window lokal. Keputusan nilai threshold untuk setiap window lokal ditentukan dengan
decision tree. Hasilnya menunjukkan metode yang diusulkan dapat memisahkan teks dari dokumen citra lebih baik dari binarisasi global dengan tingkat pengenalan OCR hingga 99.4%.

Abstract
Character recognition in a document image captured by a digital camera requires a good binary image as the input for the separation the text from the background. Global binarization method does not provide such good separation because of the problem of uneven levels of lighting in images captured by cameras. Local binarization method overcomes the problem but requires a method to partition the large image into local windows properly. In this paper, we propose a local binariation method with dynamic image partitioning using integral image and decision tree for the binarization decision. The integral image is used to estimate the number of line in the document image. The number of line in the document image is used to devide the document into local windows. The decision tree makes a decision for threshold in every local window. The result shows that the proposed method can separate the text from the background better than using global thresholding with the best OCR result of the binarized image is 99.4%. Pengenalan karakter pada sebuah dokumen citra yang diambil menggunakan kamera digital membutuhkan citra yang terbinerisasi dengan baik untuk memisahkan antara teks dengan background. Metode binarisasi global tidak memberikan hasil pemisahan yang bagus karena permasalahan tingkat pencahayaan yang tidak seimbang pada citra hasil kamera digital. Metode binarisasi lokal dapat mengatasi permasalahan tersebut namun metode tersebut membutuhkan metode untuk membagi citra ke dalam bagian-bagian window lokal. Pada paper ini diusulkan sebuah metode binarisasi lokal dengan pembagian citra secara dinamis menggunakan integral image dan decision tree untuk keputusan binarisasi lokalnya. Integral image digunakan untuk mengestimasi jumlah baris teks dalam dokumen citra. Jumlah baris tersebut kemudian digunakan untuk membagi citra dokumen ke dalam window lokal. Keputusan nilai threshold untuk setiap window lokal ditentukan dengan decisiontree. Hasilnya menunjukkan metode yang diusulkan dapat memisahkan teks dari dokumen citra lebih baik dari binarisasi global dengan tingkat pengenalan OCR hingga 99.4%."
[Fakultas Ilmu Komputer Universitas Indonesia, Institut Teknologi Sepuluh Nopember. Fakultas Teknologi Informasi], 2012
pdf
Artikel Jurnal  Universitas Indonesia Library
cover
s l. : s n. 2006,
333.79 CHI d
Buku Teks  Universitas Indonesia Library
cover
London: Curzon Press, 2001
305.42 IMA (1)
Buku Teks SO  Universitas Indonesia Library
cover
Bembi Prima
Depok: Universitas Indonesia, 2009
S27880
UI - Skripsi Open  Universitas Indonesia Library
cover
Devina Christianti
"ABSTRACT
Klasifikasi adalah proses menugaskan satu set data ke dalam kelas yang ada berdasarkan nilai setiap atribut. Pengklasifikasi pohon keputusan diklaim lebih cepat dan berproduksi akurasi yang lebih baik. Namun, ia memiliki beberapa kelemahan di mana pengklasifikasi rentan untuk overfitting. Overfitting adalah suatu kondisi di mana model tidak mampu menarik kesimpulan data baru dengan cara yang benar. Overfitting di pohon keputusan dapat dihindari dengan memotong subtree pengaruh kecil dalam melakukan klasifikasi ketika pohon ditanam, disebut post-pruning, yang bertujuan untuk meningkatkan kinerja model dalam memprediksi data. Tesis ini mengusulkan metode pasca pemangkasan dengan menerapkan Risiko Bayes, di mana estimasi risiko setiap simpul induk dibandingkan dengan simpul daunnya. Sebagai perbandingan, pemangkasan pasca lainnya Metode yang diterapkan, yaitu Reduced Error Pruning (REP). Kedua metode tersebut diterapkan
untuk tiga dataset klasifikasi churn pelanggan dari situs Kaggle dan IBM Datasets. Untuk hasilnya, Bayes Risk Post-Pruning dapat meningkatkan kinerja Decision Tree lebih baik dari Reduced Error Pruning dengan meningkatkan nilai akurasi, presisi, dan daya ingat. Kedua metode juga diterapkan pada tiga proporsi berbeda untuk data pelatihan (60%, 70% dan 80%). Hasilnya menunjukkan bahwa semakin besar ukuran dataset pelatihan dikaitkan akurasi, presisi, dan daya ingat model yang lebih tinggi.

ABSTRACT
Classification is the process of assigning a set of data to an existing class based on the value of each attribute. Decision tree classifiers are claimed to be faster and produce better accuracy. However, it has several disadvantages where the classifier is prone to overfitting. Overfitting is a condition in which the model is unable to draw new data conclusions in the right way. Overfitting in the decision tree can be avoided by cutting the subtree of small influence in classifying when the tree is planted, called post-pruning, which aims to improve the performance of the model in predicting data. This thesis propose a post-pruning method by applying Bayes Risk, where the estimated risk of each parent node is compared to the leaf node. As a comparison, other post pruning methods are applied, namely Reduced Error Pruning (REP). Both methods are applied for three customer churn classification datasets from the Kaggle site and IBM Datasets. For the results, Bayes Risk Post-Pruning can improve Decision Tree performance better than Reduced Error Pruning by increasing the value of accuracy, precision, and memory. Both methods are also applied to three different proportions for training data (60%, 70% and 80%). The results show that the greater the size of the training dataset is associated with higher model accuracy, precision, and recall.
"
2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Arif Luqman Hakim
"Badan Meteorologi Klimatologi dan Geofisika (BMKG) memiliki tugas untuk memberikan informasi cuaca termasuk curah hujan. Cuaca merupakan seluruh fenomena yang terjadi di atmosfer bumi. Kondisi cuaca baik hujan atau cerah sangat mempengaruhi aktivitas masyarakat dalam kehidupan sehari-hari, terutama untuk aktivitas di luar ruangan. Kondisi hujan yang terjadi dapat ditentukan dengan adanya curah hujan. BMKG memiliki beberapa jenis alat pengukur curah hujan, dengan jumlah yang belum merata di seluruh wilayah. Harga peralatan itu relative mahal. Solusi yang bisa dilakukan untuk menambah kerapatan pengamatan curah hujan yaitu dengan memanfaatkan sumber yang sudah ada untuk mendapatkan informasi cuaca.
Penelitian ini akan memanfaatkan CCTV yang tersebar di wilayah Jakarta untuk diolah sehingga menghasilkan informasi kondisi hujan. Metode yang digunakan yaitu melakukan image processing menggunakan metode Convolutional Neural Network (CNN). Gambar CCTV akan diambil dari internet secara otomatis dengan metode crawling untuk mendapatkan data citra digital. Gambar yang telah tersedia selanjutnya akan dilakukan proses pelatihan dan pengujian model untuk mendapatkan model dengan akurasi terbaik.
Hasil dari model ini akan digunakan untuk deteksi hujan pada citra digital CCTV. Proses deteksi hujan akan dilakukan secara otomatis dan real time. Hasil proses deteksi hujan akan ditampilkan ke dalam peta sesuai dengan lokasi terpasangnya CCTV. Penelitian ini telah membuat model CNN untuk deteksi hujan secara otomatis dengan akurasi training 98,8% dan akurasi testing sebesar 96,4% serta telah dilakukan evaluasi dengan data pengamatan BMKG sehingga memiliki akurasi evaluasi sebesar 96,7%.

Meteorology Climatology and Geophysics Agency (BMKG) has the duty to provide weather information including rainfall. Weather is a whole phenomenon that occurs in the Earth's atmosphere. Rainy or sunny weather conditions greatly affect community activities in daily life, especially for outdoor activities. Rainfall conditions that occur can be determined by the presence of rainfall. BMKG has several types of rainfall gauges, with a number that has not been evenly distributed throughout the region. The price of the equipment is relatively expensive. The solution that can be done to increase the density of rainfall observations is to utilize existing sources to obtain weather information.
This research will utilize CCTV that is spread in the Jakarta area to be processed so as to produce information on rain conditions. The method used is to do image processing using the Convolutional Neural Network (CNN) method. CCTV images will be taken from the internet automatically by the crawling method to get digital image data. The available images will then be carried out a training process and model testing to get the model with the best accuracy. The results of this model will be used for rain detection on digital CCTV images. The rain detection process will be done automatically and in real time.
The results of the rain detection process will be displayed on the map according to the location of the installed CCTV. This research has made a CNN model for automatic rain detection with 98.8% training accuracy and 96.4% testing accuracy and has been evaluated with BMKG observation data so that it has an evaluation accuracy of 96.7%.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T55081
UI - Tesis Membership  Universitas Indonesia Library
cover
Martha Christina
"Bank yang menyelenggarakan program keuangan inklusif cenderung tidak melakukan diferensiasi pelayanan bagi para pelanggannya yang berasal dari populasi masyarakat unbanked. Banyak organisasi mengganggap segmen keuangan inklusif sebagai ladang yang kurang populer dalam mendapatkan keuntungan, karena kecilnya pemasukan dan besarnya biaya operasional yang dibutuhkan. Namun, beberapa studi sebelumnya tentang keuangan inklusif dan segmentasi pelanggan telah menentang gagasan ini dan menyatakan bahwa klasifikasi lebih lanjut terhadap kategori pelanggan khusus ini dapat membawa keuntungan bagi pihak bank. Segmentasi pelanggan sering dilakukan menggunakan model Recency, Frequency, dan Monetary (RFM) untuk mendapatkan nilai pelanggan bagi perusahaan.
Penelitian ini bertujuan untuk membuat model prediksi segmen pelanggan dalam konteks keuangan inklusif, dengan menerapkan penggunaan dua teknik data mining Self-Organizing Map (SOM) dan C5.0 decision tree (DT) secara hybrid. Analisa sosioekonomi, regional, dan pengeluaran digunakan untuk menilai pelanggan, alih-alih menggunakan RFM. Penelitian ini juga mempelajari pengaruh SOM terhadap kinerja klasifikasi keseluruhan, yang dievaluasi menggunakan confusion matrix. Dataset yang digunakan memiliki struktur generik sehingga model ini diharapkan dapat membantu pengembangan program keuangan inklusif pada institusi keuangan penyelenggara keuangan inklusif lainnya.

Banks adopting financial inclusion program often exclude differentiation in their services towards the target customers. Many organizations consider financial inclusion inflicts huge operational costs hence it is deemed infamous for profit gain. Previous studies in financial inclusion and customer segmentation have challenged this notion, concluding that further classification of this particular customer class could indeed bring profit for the bank and such that maintaining existing profiting customers induce less cost than the effort of acquiring new customers. Customer segmentation is often done using the Recency, Frequency and Monetary (RFM) model to assess a customer's value for the company.
This study aims to model customer segment predictions in the context of financial inclusion, using socioeconomic, regional, and expenditure analyses to assess customer values. Two data mining techniques Self-Organizing Map (SOM) and C5.0 decision tree (DT) are used in a hybrid setting. This study also observes the effect of SOM on overall classification performance, which is evaluated using confusion matrix. Due to the generality of the input dataset, the prediction model is expected to be usable, with minimal adjustments, by other financial inclusion institutions in need of customer segmentation.
"
Depok: Fakultas Teknik Universitas Indonesia, 2019
T54216
UI - Tesis Membership  Universitas Indonesia Library
cover
Riara Novita
"Sebagai negara kepulauan terbesar di dunia, galangan kapal menjadi salah satu industri yang sangat strategis dan potensial untuk dikembangkan di Indonesia. Hal inilah yang menjadikan persaingan antar galangan kapal di Indonesia semakin meningkat. Untuk dapat bersaing, setiap galangan harus meningkatkan kualitas pelayanannya, yang salah satunya dapat dilakukan dengan menghasilkan estimasi durasi pemeliharaan yang lebih akurat. Pada penelitian sebelumnya, telah dihasilkan model estimasi dengan menggunakan CART (Classification And Regression Tree). Akan tetapi, estimasi yang dihasilkan tidak begitu akurat. Oleh karena itu, penelitian ini bertujuan untuk mengembangkan model estimasi tersebut dengan menggunakan nACDT (Numerical Ant Colony Decision Tree), yaitu suatu metode induksi decision tree dengan algoritma ant colony, untuk menghasilkan estimasi yang lebih akurat. Berdasarkan hasil estimasi yang didapatkan, diketahui bahwa estimasi yang dihasilkan nACDT lebih akurat dibandingkan CART.

As the largest archipelago in the world, shipyards became one of the most strategic and potential industries to be developed in Indonesia. It makes the competition among shipyards in Indonesia has increased. To compete with the others, each shipyard must improve its service quality, one of which can be done by generating an estimated duration of maintenance with higher accuracy. In the previous study, estimation model have been produced by using CART (Classification And Regression Tree). However, its estimates are not very accurate. Therefore, this study aims to develop the previous estimation model by using nACDT (Numerical Ant Colony Decision Tree), a method where decision tree is induced by ant colony algorithm, in order to produce estimates with higher accuracy. Based on the results obtained, it is known that the estimates resulted by nACDT are more accurate than CART
"
Depok: Fakultas Teknik Universitas Indonesia, 2013
T35237
UI - Tesis Membership  Universitas Indonesia Library
cover
Danita Astriatmi Kusuma
"ABSTRACT
Osteoartritis adalah penyakit sendi kronis pada tulang rawan yang sering terjadi pada orang berusia lanjut. Penyaki ini umumnya terjadi pada tulang rawan sendi lutut Orang berusia lanjut sering menyepelekan perasaan sakit di sekitar sendi mereka atau tidak menyadari bahwa mereka telah terkena osteoartritis lutut, sehingga penyakit osteoartritis lutut yang mereka alami menjadi semakin kronis. Menurut beberapa penelitian, melakukan tindakan sejak stadium dini dapat mencegah penyakit. Salah satu tindakan untuk mencegah osteoartritis lutut agar tidak semakin kronis adalah mendeteksi penyakit tersebut sejak dini, sehingga pasien osteoartritis lutut dapat mendapatkan pengobatan yang tepat dan dapat memperbaiki kehidupan mereka di masa yang akan datang. Pada penelitian ini, osteoartritis lutut dideteksi dengan mengklasifikasikan stadium pasien osteoartritis lutut menggunakan AdaBoost Support Vector Machine dan AdaBoost Decision Tree. Klasifikasi osteoartritis lutut menggunakan AdaBoost Support Vector Machine dibandingkan dengan klasifikasi oteoartritis lutut menggunakan AdaBoost Decision Tree berdasarkan nilai akurasi klasifikasi yang dihasilkan dari kedua metode tersebut.

ABSTRACT
Osteoarthritis is a chronic joint disease of cartilage that often occurs in elderly people. One of the joints that can be infected is the knee. Older people often underestimate painful feeling around their joint or do not realize that they have been affected by knee osteoarthritis, so the knee osteoarthritis disease becomes more chronic. According to some studies, preventive measure from an early stage are very crucial to overcome the disease. One of the preventive measure to overcome knee osteoarthritis is to detect the current stage of the disease, so the knee osteoarthritis patient can have the right treatment and can improve their lives in the future. In this research, knee osteoarthritis was detected by classifying the stage of knee osteoarthritis patients by using AdaBoost Support Vector Machine and AdaBoost Decision Tree. The classification of knee osteoarthritis using AdaBoost Support Vector Machine was compared with the classification of knee osteoarthritis using AdaBoost Decision Tree based on the classification accuracy value generated from both methods."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Andre Nurrohman
"ABSTRACT
Penyakit Parkinson terbagi dalam dua subtipe, yaitu Tremor Dominant (TD) dan Postural Instability/Gait Dominant (PIGD). Tiap subtipe memiliki perbedaan dalam penanganan klinis, sehingga perlu dilakukan klasifikasi subtipe penyakit Parkinson. Dalam Statistika, ada beberapa model yang membahas klasifikasi diantaranya adalah decision tree, regresi logistik, dan logit leaf model (LLM). LLM merupakan model campuran dari decision tree dan regresi logistik yang diusulkan oleh De Caigny et al. (2018). Penulisan ini membahas klasifikasi subtipe penyakit Parkinson menggunakan model klasifikasi statistika beserta penanganan masalah imbalanced data yang terjadi pada data penyakit Parkinson. Diperoleh model klasifikasi regresi logistik dengan melakukan proses SMOTE ± = 600, = 200 untuk menangani masalah imbalanced data. Model tersebut memberikan akurasi sebesar 98,83%, sensitivitas sebesar 98,41%, dan spesifisitas sebesar 99,07%.

ABSTRACT
Parkinsons Disease has two sub-types which are Tremor Dominant (TD) and Postural Instability/Gait Difficulty (PIGD). Each subtype has the difference in clinical treatment, so it is necessary to classify Parkinsons Disease subtypes. In Statistics, there are statistical models for classifying such as decision tree, logistic regression, and logit leaf model (LLM). LLM is a hybrid model from decision tree and logistic regression that proposed by (De Caigny et al., 2018). In this thesis discuss Parkinsons Disease Classification using statistical models with imbalanced data problem handling happen in Parkinson`s Disease data. For the result, logistic regression by processing SMOTE ± = 600, = 200 to handle data imbalanced problem. The model provides an accuracy of 98,83%, sensitivity of 98.41%, and specificity of 99.07%."
[, ]: 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>