Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 134360 dokumen yang sesuai dengan query
cover
Akhiyar Waladi
"Dalam negara yang demokratis, Pemilihan Umum (Pemilu) adalah prosedur untuk memilih kepala daerah yang diatur dalam Pasal 1 ayat 3 UUD 1945. KPU (Komisi Pemilihan Umum) adalah lembaga negara yang menyelenggarakan dengan memprioritaskan transparansi dan akuntabilitas dalam setiap tahap pemilihan umum di Indonesia. Salah satu bentuk keterbukaan yang selalu menjadi sorotan media adalah proses penghitungan suara. Proses perhitungan manual yang dilakukan oleh Komisi Pemilihan Umum (KPU) pada formulir C1 memakan waktu dan banyak akal karena melibatkan sukarelawan berbayar. Dalam penelitian ini, penulis menggunakan metode yang diusulkan untuk membangun sistem pengenalan tulisan tangan numerik pada formulir C1 KPU. Metode yang diusulkan adalah aliran pengenalan termasuk deteksi tabel dengan teknik kontur kandidat, pencocokan fitur, segmentasi angka, dan klasifikasi digit dengan jaringan saraf convolutional (CNN). Kumpulan data yang digunakan berasal dari situs web resmi KPU pada 2014 dan 2019. Kami menggunakan capsnet untuk mengklasifikasikan setiap digit tersegmentasi dengan akurasi 95,65\%. Model yang dilatih diuji menggunakan formulir validasi dan mencapai 80,73\% akurasi dokumen menggunakan formulir pemilihan 2019.

In a democratic state, General Election (Pemilu) is a procedure for selecting regional heads regulated in Article 1 paragraph 3 of the 1945 Constitution. KPU (Komisi Pemilihan Umum) is a state institution that organizes by prioritize transparency and accountability in each stage of general elections in Indonesia. One form of openness that has always been in the media spotlight is the vote counting process. The manual calculation process carried out by the General Election Commissions (KPU) on form C1 is time-consuming and resourceful because it involves paid volunteers. In this study, the authors used the proposed method to build a numerical handwriting recognition system on the C1 KPU form. Method proposed is a recognition flow including table detection with candidate contour techniques, feature matching, number segmentation, and digit classification with the convolutional neural network (CNN). The datasets used are from the official KPU election websites in 2014 and 2019. We use capsnet to classify each segmented digit with 95.65\% accuracy. The trained model was tested using validation form and reach 80.73\% document accuracy using 2019 election form."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Wahyu Hutomo Nugroho
"Proses segmentasi organ secara manual memakan waktu dan hasilnya subyektif terhadap definisi batas-batas kontur. Pemanfaatan teknologi Machine Learning (ML) berjenis 3D convolutional neural network (3D CNN) untuk mensegmentasi organ secara otomatis dapat mempercepat dan menstandarisasi hasil segmentasi organ. Penelitian ini mengimplementasilan network ML berbasis VoxResNet dan memanfaatkan 60 dataset CT Scan toraks dari Grand Callenge AAPM 2017 untuk melatih, memvalidasi, dan menguji model-model ML dengan berbagai variasi hyperparameter. Pengaruh variasi hyperparameter terhadap hasil segmentasi model juga dipelajari. Dataset dibagi menjadi 3 yaitu, 36 untuk perlatihan, 12 untuk validasi, dan 12 untuk pengujian. Dalam penelitian ini paru-paru kiri dan paru-paru kanan dijadikan satu jenis OAR bernama paru-paru, esophagus dan spinal cord dijadikan satu OAR bernama ESP, sedangkan jantung tetap OAR tersendiri. Variasi hyperparameter adalah variasi ukuran patch, jumlah batch, dan weight class. Hasil segmentasi model-model dievaluasi dan diperbandingkan untuk mencari model terbaik dengan hyperparameter-nya yang mampu menghasilkan kualitas hasil segmentasi organ terbaik. Kemampuan network dalam proses perlatihan dan validasi dievaluasi menggunakan kurva pembelajaran. Kualitas hasil segmentasi model organ dievaluasi menggunakan boxplot distribusi populasi nilai metrik Dice Similiarity Coefficient (DSC) dan Housdorf Distance (HD) setiap slice. Peningkatan atau penurunan kinerja model akibat variasi hyperparameter dinilai menggunakan skor peningkatan metrik. Terakhir, metrik DSC dan HD95 secara 3D hasil segmentasi model terbaik dibandingkan dengan hasil segmentasi oleh interrater variability AAPM 2017 dan hasil segmentasi team virginia. Hasil kurva pembelajaran tidak mengalami underfitting menunjukkan bahwa network mampu mempelajari data perlatihan dengan baik. Overfitting terjadi pada model organ jantung dan ESP. Hasil eksperimen variasi ukuran patch menunjukkan bahwa besar ukuran patch tidak selalu linier dengan kinerja moukuran patch menunjukkan bahwa besar ukuran patch tidak selalu linier dengan kinerja model. Model ukuran patch tengah memberikan kualitas distribusi metrik dan skor paling baik dibandingkan model ukuran patch terkecil dan terbesar pada semua OAR dengan skor 11, 13, dan 13 dari 16. Hasil eksperimen variasi jumlah batch menunjukkan bahwa peningkatan jumlah batch tidak selalu berdampak positif terhadap kinerja model. Untuk model jantung ukuran patch terbesar, peningkatan batch dapat meningkatkan skor dari 2 menjadi 12. Untuk model ESP ukuran patch terbesar, peningkatan batch menurunkan skor dari 13 menjadi 2. Hasil eksperimen variasi weight class (W) menunjukkan bahwa baik model jantung maupun ESP cenderung memberikan distribusi metrik dan skor terbaik di sekitar W = [1,3.67] atau W = [1, C1 < 11]. Dibandingkan dengan interrater variability AAPM, model jantung terbaik menghasilkan nilai metrik yang comparable, yaitu untuk DSC 3D 0.932 ± 0.016 = 0.931 ± 0.015 dan untuk HD95 4.00 ± 0.25 < 6.42 ± 1.82. Sedangkan untuk model paru-paru memberikan metrik lebih baik, yaitu 0.964 ± 0.025 > 0.956 ± 0,019 dan 4,72± 0,21 < 6.71 ± 3,91. Dibandingkan dengan team virginia, model jantung terbaik berhasil memberikan nilai metrik yang lebih baik. yaitu 0.932 ± 0.016 > 0.925 ± 0.015 dan 4.00 ± 0.25 < 6.57 ± 1.50, sedangkan model ESP terbaik menghasilkan metrik yang comparable, yaitu 0.815 ± 0.049 = 0,810 ± 0,069 dan 4,68 ± 0,17 < 8,71 ± 10,59. Dari hasil-hasil ini memberikan potensi adanya perpaduan ukuran patch, jumlah batch, dan weight class tertentu yang dapat menyebabkan hasil segmentasi model ukuran patch lebih kecil dapat mengimbangi hasil segmentasi model ukuran patch lebih besar sehingga tuntutan akan perangkat dengan spesifikasi tinggi dan mahal dapat berkurang.

The process of manual organ segmentation is time consuming and the results are subjective in term of definition of contour boundaries. The utilization of Machine Learning (ML) technology using 3D convolutional neural network (3D CNN) to segment organs automatically can speed up the procces as well as standardizing the results of organ segmentation. This study implements a VoxResNet-based ML network and utilizes 60 thoracic CT scan datasets obtained from Grand Callenge AAPM 2017 to train, validate, and test ML models with various hyperparameter variations. The effects of hyperparameter variations on the segmentation results of models are also studied. The dataset is divided into 3 parts, namely 36 for training, 12 for validation, and 12 for testing. In this study the left lung and right lung were combined into one type of OAR called the lung, the esophagus and spinal cord were combined into one OAR called ESP, while the heart remained a separate OAR. Hyperparameter variations are variations in patch size, number of batches, and weight loss. The segmentation results of the models are evaluated and compared each other to find the best model and it’s hyperparameters which is able to produce the best segmentation’s quality. The ability of the network in training and validation procceses is evaluated using learning curve. The quality of the organ model’s segmentation results is evaluated using boxplot of population’s distribution of the Dice Similiarity Coefficient (DSC) and Housdorf Distance (HD) metrics for each slice. The increases or decreases in model performance due to variations in hyperparameters are assessed using the metric improvement score. Finally, the 3D DSC and HD95 metrics of the best model’s segmentation results are compared to the results of segmentation by the AAPM 2017’s interrater variability and to the segmentation results by team virginia. There is no underfitting of learning curve indicates that the network is able to learn the training data. Overfitting occurs in the heart and ESP models. The experimental results from patch size variations show that the size of the patch is not always linear with the performance of the model. The middle patch sized models give the best metric distribution’s quality as well as scores compared to the smallest and largest patch sized models for all OARs with scores of 11, 13, and 13 out of 16. The experimental results from batch number variations show that an increase in batch does not always have a positive impact on model performance. For the largest patch sized heart’s model, the increase increases the score from 2 to 12. For the largest patch sized ESP's model, the increase reduces the score from 13 to 2. The results from variations in weight loss (W) experiment show that both heart’s and ESP's models tend to provide the best distributions in term of metrics and scores around W = [1, 3.67] or W = [1, C1 < 11]. By comparing with AAPM's interrater’s variability, the best heart model produces comparable metric's result, that is 0.932 ± 0.016 = 0.931 ± 0.015 for DSC 3D and 4.00 ± 0.25 < 6.42 ± 1.82 for HD95. The best lungs model produces better metrics, that is 0.964 ± 0.025 > 0.956 ± 0,019 and 4,72 ± 0,21 < 6.71 ± 3,91. By comparing with team virginia's results, the best heart model produces better results that is 0.932 ± 0.016 > 0.925 ± 0.015 and 4.00 ± 0.25 < 6.57 ± 1.50. Meanwhile the best ESP model produces comparable results that is 0.815 ± 0.049 = 0,810 ± 0,069 and 4,68 ± 0,17 < 8,71 ± 10,59. The results of this study suggests that there is a certain combination of patch size, batch, and weight class by which enables smaller patch sized model to produce comparable metric's result produced by larger patch sized model thus decreasing the need to use higher specificationed and expensive computer."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hasbullah
"Survei Kesehatan Indonesia (SKI) tahun 2023 yang dilakukan oleh Kementerian Kesehatan (Kemenkes) ada sekitar 70 juta perokok aktif di Indonesia. Apabila dihitung dari populasi penduduk Indonesia ada 28,62% penduduk yang merokok di tahun 2023 dan persentase ini meningkat dari tahun sebelumnya sebanyak 0,36%. Perilaku merokok ini menyebabkan berbagai penyakit seperti penyakit paru-paru kronis, kerusakan gigi, penyakit mulut, stroke, serangan jantung, kanker rahim, gangguan mata, dan kerusakan pada rambut. Untuk menekan jumlah perokok di Indonesia, diperlukan sistem untuk deteksi perokok. Deteksi perokok saat ini memakan biaya yang mahal, bantuan ahli, dan sistem yang kompleks. Oleh karena itu, deep learning dengan algoritma Convolutional Neural Network hadir sebagai solusi untuk mengatasi masalah tersebut. Skripsi ini membahas bagaimana merancang sistem deep learning dengan Convolutional Neural Network (CNN) untuk keperluan deteksi wajah perokok. Skripsi ini juga membahas bagaimana pengaruh berbagai skenario jumlah data pelatihan dan data pengujian serta penambahan ekstraksi fitur wajah terhadap metrik evaluasi . Hasil dari rancangan dievaluasi dengan metrik evaluasi kalkulasi loss function, akurasi, dan F1 score. Hasil simulasi menunjukan skenario data pelatihan 70% dan data pengujian 30% adalah skenario terbaik dengan nilai metrik evaluasi pengujian pada skenario ini sebesar 2.236 untuk loss, 54.5% untuk akurasi, dan 34.9% untuk F1 score. Skenario ini diimprovisasi dengan adanya penambahan ekstraksi fitur perokok pada awal preprocessing yang ditandai dari penurunan loss sebesar 65.65%, peningkatan akurasi sebesar 19%, dan peningkatan F1 score sebesar 24.08%.

The 2023 Indonesian Health Survey (SKI) conducted by the Ministry of Health (Kemenkes) reported that there are approximately 70 million active smokers in Indonesia. This accounts for 28.62% of the Indonesian population in 2023, representing a 0.36% increase from the previous year. Smoking behavior leads to various diseases such as chronic lung disease, tooth damage, oral diseases, stroke, heart attacks, uterine cancer, eye disorders, and hair damage. To reduce the number of smokers in Indonesia, a smoker detection system is necessary. Current smoker detection methods are expensive, require expert assistance, and involve complex systems. Therefore, deep learning with Convolutional Neural Network (CNN) algorithms presents a solution to address these issues. This thesis discusses how to design a deep learning system using Convolutional Neural Networks (CNN) for smoker face detection. It also examines the impact of different training and testing data scenarios and the addition of facial feature extraction on evaluation metrics. The designed system is evaluated using metrics such as loss function calculation, accuracy, and F1 score. The simulation results show that a scenario with 70% training data and 30% testing data is the best scenario, yielding evaluation metric values of 2.236 for loss, 54.5% for accuracy, and 34.9% for F1 score. This scenario was improved with the addition of smoker feature extraction in the preprocessing stage, resulting in a 65.65% reduction in loss, a 19% increase in accuracy, and a 24.08% increase in F1 score."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Agung Santosa
"Pesatnya perkembangan Deep Learning akhir-akhir ini juga menyentuh ASR berbasis HMM, sehingga memunculkan teknik hibrid HMM-ANN. Salah satu teknik Deep Learning yang cukup menjanjikan adalah penggunaan arsitektur CNN. CNN yang memiliki kemampuan mendeteksi local correlation sesuai untuk digunakan pada data spectrum suara. Spectrogram memiliki karakteristik local correlation yang nampak secara visual. Penelitian ini adalah eksperimen penggunaan spectrogram sebagai fitur untuk HMM-CNN untuk meningkatkan kinerja ASR berbasis HMM. Penelitian menyimpulkan spectogram dapat digunakan sebagai fitur untuk HMM-CNN untuk meningkatkan kinerja ASR berbasis HMM.

The latest surge in Deep Learning affecting HMM based ASR, which give birth to hybrid HMM-ANN technique. One of the promising Deep Learning technique is the implementation of CNN architecture. The ability of CNN to detect local correlation make it suitable to be used for speech spectral data. Spectrogram as a speech spectral data has local correlation characteristic which is visually observable. This research is an experiment to use spectrogram as a feature for HMM-CNN to add to the performance of HMM based ASR. This research found that spectrogram is indeed can be used as a feature for CNN to add to the performance of HMM based ASR.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2015
T43862
UI - Tesis Membership  Universitas Indonesia Library
cover
Chelvian Aroef
"ABSTRAK
Pada era modern ini, semakin banyak jenis penyakit yang baru dengan gejala yang berbeda beda juga. Teknologi dituntut bisa memainkan peran untuk membantu penelitian pada bidang kesehatan. Stroke merupakan salah satu penyakit yang memiliki angka kematian tertinggi di dunia. Stroke terjadi karena terganggunya pasokan darah menuju otak sehingga otak mengalami kekurangan oksigen dan nutrisi. Stroke bisa dibagi menjadi berdasarkan bagaimana stroke terjadi, stroke hemoragik dan stroke iskemik. Stroke hemoragik terjadi karena pecahnya pembuluh darah yang menuju otak, sedangkan stroke iskemik terjadi karena terjadinya penyumbatan yang mengganggu pasokan darah ke otak. Jika penyumbatan terjadi pada daerah otak, maka disebut infark serebri. Dalam studi ini digunakan metode Convolutional Neural Network untuk mengklasifikasikan data gambar infark serebri yang nantinya akan dibandingkan dengan metode Neural Network. Didapatkan dari hasil performa metode Convolutional Neural Network lebih baik jika dibandingkan dengan metode Neural Network untuk pengklasifikasian data gambar infark serebri."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
I Gusti Agung Agastya Tarumawijaya
"Berbagai metode pengembangan rekognisi citra wajah telah banyak dilakukan, berbagai metode seperti Deep Learning, Multilayer Perceptron sudah dilakukan. Metode Convolutional Neural Network juga sudah banyak dikembangkan untuk melakukan klasifikasi citra seperti rekognisi jenis bunga, hewan, hingga pendeteksian kecacatan sel. Convolutional Neural Network diharapkan mampu melakukan rekognisi citra wajah secara tiga dimensi. Operasi konvolusi sebagai bagian ekstraksi fitur pada Convolutional Neural Network, diharapkan dapat membantu bagian klasifikasi untuk melakukan tugasnya dengan lebih baik. Rekognisi citra wajah secara tiga dimensi ini sangat dibutuhkan, karena ketika kita ingin mendeteksi seseorang tanpa diketahui orang tersebut, maka dengan berbagai macam sudut hadap wajahnya sistem harus dapat mengidentifikasi orang tersebut. Untuk penelitian kali ini saya akan menggunakan dataset gambar wajah tiga dimensi yang akan digunakan sebagai klasifikasi parameter biometrik seseorang. Pada penelitian ini akan menganalisa tiap-tiap lapisan pada Convolutional Neural Network, serta melakukan perbandingan dengan Backpropagation Neural Network. Dan juga akan melakukan analisa dengan menggunakan citra wajah berderau.

Various methods of developing facial image recognition have been carried out, various methods such as Deep Learning and Radial Basis Function Neural Network have been carried out. Convolutional Neural Network methods have also been developed to carry out image classifications such as recognition of types of flowers, animals, and detection of cell defects. Convolutional Neural Network is expected to be able to recognize facial images in three dimensions. Convolution operations as a feature extraction part of the Convolutional Neural Network are expected to help the classification section to do their job better. Three-dimensional face image recognition is needed, because when we want to detect someone without knowing by the person, then with a variety of face angles, the system must be able to identify that person. For this research I will use a three-dimensional face image dataset that will be used as a classification of a persons biometric parameters. In this study, we will analyze each layer in the Convolutional Neural Network, do a comparison with Backpropagation Neural Network. And also will do the analysis by using a noisy face image.
"
Depok: Fakultas Teknik Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Amanda Nur Oktaviani
"Skripsi ini membahas mengenai rancangan untuk pengembangan sistem penilaian esai otomatis (SIMPLE-O) menggunakan Convolutional Neural Network dan Manhattan Distance sebagai penilaian pada ujian esai Bahasa Jepang yang sedang dikembangkan oleh Departemen Teknik Elektro Universitas Indonesia. Sistem ini menggunakan Convolutional Neural Network (CNN) untuk memberikan nilai pada esai Bahasa Jepang. Dari beberapa variasi yang diuji, model yang paling stabil adalam model yang memiliki layer CNN, Manhattan Distance, dan dropout dengan dropout rate sebesar 0.1, di-train selama 32 epochs dengan loss function cross-categorical entropy dan optimizer RMSprop dengan input model ditokenisasi per karakter dengan rata-rata akurasi sebesar 59.48%.

This thesis discusses the design for the development of an automatic essay scoring system (SIMPLE-O) using the Convolutional Neural Network and Manhattan Distance as an assessment of the Japanese essay exam which is being developed by the Department of Electrical Engineering, University of Indonesia. This system uses Convolutional Neural Network (CNN) to score Japanese essays. Of the several variations tested, the most stable model is a model that has CNN, Manhattan Distance, and dropout layers with a dropout rate of 0.1, trained for 32 epochs with a loss function cross-categorical entropy and an RMSprop optimizer with model input tokenized per character on average. the average accuracy is 59.48%."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Emmanuel Rieno Bobba Pratama
"Estimasi usia memainkan peran penting dalam analisis forensik, diagnosis klinis, dan investigasi kriminal. Metode tradisional untuk memperkirakan usia pada anak-anak dan remaja sering melibatkan pengamatan perkembangan gigi. Penelitian ini mengeksplorasi penggunaan deep learning untuk estimasi usia kronologis menggunakan 668 citra panorama gigi (OPG) dari usia 5 hingga 15 tahun dengan metode Convolutional Neural Networks (CNN). Penelitian ini menentukan model CNN terbaik dengan menggunakan augmentasi dan penyempurnaan parameter model VGGNet dan DenseNet. Teknik validasi silang k-fold, oversampling SMOTE, dan augmentasi gambar dengan ImageDataGenerator digunakan untuk mengatasi ketidakseimbangan kelas dan ukuran data sampel yang kecil. Tiga model berbeda dibandingkan (VGG16, VGG19, dan DenseNet-201), masing-masing menggunakan dua jenis augmentasi yang berbeda. Model terbaik, VGG16 dengan ImageDataGenerator, mencapai RMSE sebesar 0,98 tahun (10,85%), MAE sebesar 0,67 tahun, dan nilai R 2 sebesar 0,88 pada set pengujian, menunjukkan error yang rendah.

Age estimation plays a crucial role in forensic analysis, clinical diagnosis, and criminal investigation. Traditional methods for estimating age in children and adolescents often involve observing dental development. This study explores the use of deep learning for chronological age estimation using 668 panoramic dental images (OPG) from ages 5 to 15 years with Convolutional Neural Networks (CNN). The study determines the best CNN model by using augmentation and fine-tuning parameters of VGGNet and DenseNet models. Cross-validation technique k-fold, SMOTE oversampling, and image augmentation with ImageDataGenerator are used to address class imbalance and small sample sizes. Three different models (VGG16, VGG19, and DenseNet-201) are compared, each using two different types of augmentation. The best model, VGG16 with ImageDataGenerator, achieved an RMSE of 0.98 years (10.85%), an MAE of 0.67 years, and an R 2 value of 0.88 on the test set, indicating relatively low error."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Durrabida Zahras
"Untuk memenuhi tantangan dalam hal meningkatnya jenis penyakit di era modern ini, teknologi memainkan peran yang sangat penting dalam penelitian kesehatan. Kesehatan wanita telah menjadi perhatian utama karena meningkatnya angka kanker serviks yang  dapat menjadi penyakit mematikan. Dalam studi ini, kami akan menggunakan Deep Convolutional Neural Network untuk menemukan akurasi dalam mengklasifikasikan data kanker serviks pada empat jenis metode. Data kanker serviks diwakili oleh 32 faktor risiko dan empat variabel target: Hinselmann, Schiller, Cytology, dan Biopsy. Presentase akurasi metode Deep Convolutional Neural Network cukup baik jika dibandingkan dengan Neural Network dalam hal pengklasifikasian data faktor risiko kanker serviks, kita dapat melihat bahwa setiap data diklasifikasikan dengan benar dengan total akurasi mencapai hampir 90% untuk setiap target.

To meet the challenge of the increasing types of disease in this modern era, technology plays a very important role in health research. Womens health has become a major concern because of the increasing rates of cervical cancer because it can be a deadly disease. In this study, we will use deep Convolutional Neural Networks to find the accuracy in classifying cervical cancer data on four different types of methods. The cervical cancer data are represented by 32 risk factors and four target variables: Hinselmann, Schiller, Cytology, and Biopsy. The result with deep learning method is quite encouraging compare to the original neural network in classyfying cervical risk dataset, we can see that each data were correctly classified with the total accuracy reach almost 90% for each target."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Yumna Pratista Tastaftian
"Speech Emotion Recognition adalah teknologi yang mampu bisa mendeteksi emosi lewat data suara yang diproses oleh sebuah mesin. Media yang sering digunakan untuk menjadi media interaksi antara 2 orang atau lebih yang saat ini sedang digunakan oleh banyak orang adalah Podcast, dan Talkshow. Seiring berkembangya SER, penelitian terakhir menunjukkan bahwa penggunaan metode Deep Learning dapat memberikan hasil yang memuaskan terhadap sistem SER. Pada penelitian ini akan diimplementasikan model Deep Learning yaitu dengan Recurrent Neural Network (RNN) variasi Long Short Term Memory (LSTM) untuk mengenali 4 kelas emosi (marah, netral, sedih, senang). Penelitian ini menguji model yang digunakan untuk mengenali emosi dari fitur akustik pada data secara sekuensial. Skenario training dan testing dilakukan dengan metode one-against-all dan mendapatkan hasil (1) Dataset talkshow mengungguli dataset podcast untuk tipe 1 dan 2 dan untuk semua emosi yang dibandingkan; (2) Untuk dataset podcast pada emosi marah, senang, dan sedih didapatkan akurasi optimal pada dataset tipe 1 yaitu 67.67%, 71.43%, dan 68,29%, sedangkan untuk emosi netral didapatkan akurasi terbaik pada dataset tipe 2 dengan 77.91%; (3) Untuk dataset talkshow pada emosi marah, netral, dan sedih didapatkan akurasi terbaik pada dataset tipe 2 yaitu 78.13%, 92.0%, dan 100%. Dapat disimpulkan bahwa dataset talkshow secara garis besar memberikan hasil yang lebih optimal namun memiliki variasi data yang lebih sedikit dari dataset podcast. Dari sisi panjang data, pada penelitian ini didapatkan akurasi yang lebih optimum pada dataset dengan tipe 2.

Speech Emotion Recognition is a technology that is able to detect emotions through voice data that is processed by a machine. Media that is often used to be a medium of interaction between two or more people who are currently being used by many people are Podcasts, and Talkshows. As SER develops, recent research shows that the use of the Deep Learning method can provide satisfactory results on the SER system. In this study a Deep Learning model will be implemented, this study uses Long Short Term Memory (LSTM) as one of the variation of Recurrent Neural Network (RNN) to recognize 4 classes of emotions (angry, neutral, sad, happy). This study examines the model used to recognize emotions from acoustic features in sequential data. Training and testing scenarios are conducted using the one-against-all method and get results (1) The talkshow dataset outperforms the podcast dataset for types 1 and 2 and for all emotions compared; (2) For the podcast dataset on angry, happy, and sad emotions, the optimal accuracy in type 1 dataset is 67.67%, 71.43%, and 68.29%, while for neutral emotions the best accuracy is obtained in type 2 dataset with 77.91%; (3) For the talkshow dataset on angry, neutral, and sad emotions the best accuracy is obtained for type 2 datasets, namely 78.13%, 92.0%, and 100%. It can be concluded that the talkshow dataset in general gives more optimal results but has fewer data variations than the podcast dataset. In terms of data length, this study found more optimum accuracy in dataset with type 2."
Depok: Fakultas Ilmu Kompter Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>