Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 41285 dokumen yang sesuai dengan query
cover
Angelica Octavia Kunardi
"Kualitas air Sungai Bengawan Solo saat ini tidak memenuhi baku mutu yang berlaku sehingga berpotensi menimbulkan dampak kesehatan dan ekonomi bagi masyarakat. Untuk mengantisipasi hal tersebut, penelitian ini bertujuan membangun model prediksi terhadap delapan parameter utama kualitas air, yaitu total fosfat, pH, DO, COD, BOD, TSS, nitrat, dan bakteri koli tinja. Dua metode yang digunakan adalah Random Forest dan XGBoost, dengan dua skenario: skenario awal menggunakan seluruh parameter sebagai input, dan skenario kedua menggunakan parameter terpilih berdasarkan analisis interpretabilitas SHAP. Hasil evaluasi menunjukkan bahwa model dengan parameter terpilih menghasilkan prediksi yang lebih akurat. Secara umum, Random Forest menunjukkan performa lebih baik dibandingkan XGBoost, kecuali pada parameter total fosfat dan bakteri koli tinja. XGBoost lebih mampu menangkap pola interaksi kompleks, namun Random Forest memberikan hasil yang lebih stabil dan akurat secara keseluruhan. Temuan ini mendukung literatur sebelumnya yang menekankan pentingnya pemilihan fitur dalam meningkatkan kinerja model prediksi kualitas air secara jangka panjang. Selain itu, analisis SHAP juga mengungkap bahwa total fosfat merupakan parameter kunci yang memengaruhi banyak parameter lainnya sehingga perlu mendapat perhatian lebih dalam pengelolaan kualitas air sungai.

The water quality of the Bengawan Solo River currently does not meet established quality standards, potentially leading to adverse health and economic impacts for local communities. To address this issue, this study aims to develop a predictive model for eight key water quality parameters: total phosphate, pH, DO, COD, BOD, TSS, nitrate, and fecal coliform bacteria. Two methods are employed: Random Forest and XGBoost, under two scenarios. The first utilizing all parameters as input, and the second using selected parameters based on SHAP interpretability analysis. The evaluation results indicate that the model using selected parameters yields more accurate predictions. Overall, Random Forest outperforms XGBoost, except in predicting total phosphate and fecal coliform, where XGBoost shows better results. While XGBoost is more effective in capturing complex interaction patterns, Random Forest delivers more stable and accurate predictions overall. These findings reinforce previous literature emphasizing the importance of feature selection in enhancing the long-term performance of water quality prediction models. Furthermore, the SHAP analysis highlights total phosphate as a key parameter influencing several others, underscoring the need for greater attention to its management in river water quality monitoring.
"
Depok: Fakultas Teknik Universitas Indonesia, 2025
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Mohammad Haekal
"Penelitian ini memprediksi kualitas air Sungai Ciliwung berdasarkan parameter pH hasil pemantauan Online Monitoring menggunakan dua model Deep Learning yaitu Convolutional Neural Network (CNN) dan Long Short-Term Memory (LSTM). Parameter input adalah pH dengan tiga skenario kombinasi yaitu waktu ganjil (t, t-1, t-3, t-5), genap (t, t+2, t-4, t-6) dan waktu berurutan (t, t-1, t-2, t-3) dengan target pH pada t+1, t+2 dan t+3. Parameter model adalah Optimizer dengan Adaptive Moment (Adam) sebagai Optimizer, aktivasi menggunakan Rectified Linear Unit (ReLU) dengan jumlah Epoch 500, dan Loss menggunakan Mean Squared Error (MSE). Kriteria Evaluasi menggunakan Coefficient of Determination (R2 ), Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), dan Mean Absolute Percentage Error (MAPE). Hasil pemodelan menunjukkan selisih terendah antara pH riil dengan pH prediksi adalah 0 dan tertinggi 0,79. Pada model CNN, dari 9 nilai R2 ada 7 yang mendekati nilai 1, artinya persamaan regresi sesuai antara nilai variabel dependen dengan variabel independen, dan 2 mendekati nilai 0 yang artinya persamaan regresi tidak sesuai antara nilai variabel dependen dengan variabel independen. Selanjutnya, dari 9 nilai MAPE terdapat 5 nilai yang menunjukkan model prediksi baik, sisanya berada dalam rentang model prediksi cukup. Pada model LSTM, ada 8 dari 9 R2 yang memiliki nilai mendekati 1 dan hanya 1 yang mendekati 0. Selanjutnya, 6 dari 9 MAPE berada dalam rentang model prediksi baik, sisanya berada dalam rentang model prediksi cukup. Dari hasil penelitian diketahui bahwa semakin jauh titik prediksi yang di tuju maka relasi antara pH riil dengan pH prediksi semakin lemah. Ini ditunjukan oleh nilai R2 semakin kecil pada t+3 untuk semua parameter input. Dari hasil di atas disimpul bahwa Model LSTM dan CNN dapat digunakan untuk memprediksi kualitas air sungai Ciliwung berdasarkan parameter pH karena mayoritas nilai R2 mendekati 1, MAPE sebagian besar berada dalam model prediksi kelompok baik. Di antara dua model yang digunakan, model LSTM lebih baik dari pada model CNN karena memiliki nilai R2 yang mendekati 1 dan MAPE pada model prediksi baik lebih banyak.

This research predicts the water quality of the Ciliwung River based on pH parameters from Online Monitoring using two Deep Learning models, namely Convolutional Neural Network (CNN) and Long Short-Term Memory (LSTM). The input parameter is pH with three combination scenarios, namely odd times (t, t-1, t-3, t-5), even (t, t+2, t-4, t-6) and sequential times (t, t -1, t-2, t-3) with pH targets at t+1, t+2 and t+3. The model parameters are Optimizer with Adaptive Moment (Adam) as Optimizer, activation uses Rectified Linear Unit (ReLU) with a number of Epochs of 500, and Loss uses Mean Squared Error (MSE). Evaluation criteria use Coefficient of Determination (R2), Root Mean Squared Error (RMSE), Mean Absolute Error (MAE), and Mean Absolute Percentage Error (MAPE). The modeling results show that the lowest difference between real pH and predicted pH is 0 and the highest is 0.79. In the CNN model, of the 9 R2 values there are 7 that are close to 1, meaning that the regression equation matches the value of the dependent variable and the independent variable, and 2 are close to 0, which means that the regression equation does not match the value of the dependent variable and the independent variable. Furthermore, of the 9 MAPE values, there are 5 values that indicate a good prediction model, the rest are in the range of a sufficient prediction model. In the LSTM model, there are 8 out of 9 R2 which have values close to 1 and only 1 which is close to 0. Furthermore, 6 out of 9 MAPEs are in the good prediction model range, the rest are in the fair prediction model range. From the research results, it is known that the further away the prediction point is, the weaker the relationship between real pH and predicted pH. This is shown by the R2 value getting smaller at t+3 for all input parameters. From the results above, it can be concluded that the LSTM and CNN models can be used to predict the water quality of the Ciliwung River based on the pH parameter because the majority of R2 values are close to 1, the MAPE is mostly in the good group prediction model. Between the two models used, the LSTM model is better than the CNN model because it has an R2 value that is close to 1 and the MAPE in the good prediction model is higher."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Watulingas, Benedicto Matthew
"Indonesia, sebagai salah satu negara pengekspor ikan terbesar di dunia, menghadapi tantangan serius dalam sektor perikanan akibat illegal, unreported, unregulated (IUU) fishing. Meskipun telah ada pengawas yang ditugaskan, namun praktik ini masih ditemukan, sehingga perlu teknologi pengawasan di atas kapal. Telah dikembangkan model yang dapat mengklasifikasikan jenis ikan di kapal melalui video CCTV namun masih perlu dilengkapi dengan kemampuan memprediksi berat ikan. Dengan metode ensemble learning yang dipilih karena memiliki kinerja yang lebih baik dibanding model individual, penelitian ini bertujuan untuk membangun model prediksi berat melalui citra dari sistem CCTV. Kemampuan untuk memprediksi berat ikan akan memberikan metode bagi pemerintah untuk melakukan pengecekan apakah hasil tangkapan yang dilaporkan sesuai dengan tangkapan yang terjadi di lapangan. Dari pengujian yang dilakukan, algoritma Catboost Regression menunjukkan kinerja terbaik di antara semua model yang diuji. Pada dataset gabungan, dengan rasio data split 90:10, CatBoost mencapai  score 0.986, MAE 9.794, MSE 293.493, dan RMSE 17.132. Untuk dataset cumi dengan rasio 90:10, nilai metrik yang diperoleh adalah  0.025, MAE 18.451, MSE 660.629, dan RMSE 25.702. Sementara pada dataset ikan dengan rasio 90:10, CatBoost menunjukkan kinerja sangat baik dengan  0.980, MAE 5.825, MSE 146.713, dan RMSE 10.129. Model yang dipilih dengan kinerja yang paling baik adalah model dengan dataset ikan dengan MAE 5.825, yang berarti nilai error dari rata-rata berat ikan yang ditimbang adalah 1.29%. Hasil ini menunjukkan bahwa Catboost Regression mampu memprediksi berat ikan dengan akurasi yang tinggi dibandingkan model regresi lainnya pada dataset yang digunakan, dengan pemilihan rasio data split yang optimal.

Indonesia, as one of the largest fish-exporting countries in the world, faces serious challenges in its fisheries sector due to illegal, unreported, and unregulated (IUU) fishing. Despite having monitoring officers assigned, these practices are still found, necessitating the use of surveillance technology on vessels. A model has been developed that can classify fish species on ships using CCTV footage, but it still needs to be enhanced with the ability to predict the weight of the fish. Ensemble learning methods, chosen for their superior performance compared to individual models, are being used in this research to build a weight prediction model using images from the CCTV system. The ability to predict fish weight will provide the government with a method to verify whether the reported catches match what is caught at sea. From the tests conducted, the Catboost Regression algorithm demonstrated the best performance among all tested models. On the combined dataset with a 90:10 train-test split ratio, CatBoost achieved an  score of 0.986, MAE of 9.794, MSE of 293.493, and RMSE of 17.132. For the squid dataset with a 90:10 ratio, the metrics obtained were an  of 0.025, MAE of 18.451, MSE of 660.629, and RMSE of 25.702. Meanwhile, for the fish dataset with the same ratio, CatBoost showed excellent performance with an  of 0.980, MAE of 5.825, MSE of 146.713, and RMSE of 10.129. The best-performing model is the one with the fish dataset, achieving an MAE of 5.825, which translates to an error rate of 1.29% in the average weight of the fish weighed. These results indicate that Catboost Regression can predict fish weight with high accuracy compared to other regression models used on the dataset, with optimal data split ratio."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dewa Ferrouzi Diaz Zhah Pahlevi
"Pasar modal berkembang pesat di Indonesia dengan peningkatan 79 jumlah emiten saham baru dan peningkatan 17,9% jumlah investor baru. Perkembangan ini dipacu oleh Otoritas Jasa Keuangan yang meyakinkan bahwa setiap perusahaan terbuka selalu diawasi dengan cara mewajibkan perusahaan terbuka untuk menyampaikan laporan keuangan secara berkala. Akan tetapi pada kenyataannya, tindakan kecurangan laporan keuangan bukan menjadi hal yang langka. Association of Certified Fraud Examiner melaporkan bahwa 9,2% kecurangan di Indonesia merupakan kecurangan laporan keuangan dengan total kerugian hingga Rp242.260.000.000. Sementara, proses audit konvensional serta laporan yang menjadi 72% dari media deteksi saat ini membutuhkan 12 bulan untuk mendeteksi kasus kecurangan. Penelitian ini akan menggunakan metode ensemble learning berbasis optimasi metaheuristik untuk mengembangkan model deteksi kecurangan pada laporan keuangan. Beberapa metode klasifikasi digunakan untuk mengembangkan model, yaitu Random Forest dan XGBoost. Optimasi metaheuristik dengan metode Genetic Algorithm kemudian digunakan sebagai dasar dari proses hyperparameter tuning pada model tersebut. Hasil deteksi terbaik pada penelitian ini adalah model XGBoost dengan parameter teroptimasi yang menghasilkan akurasi sebesar 98,04% dan sensitivitas 99.02%.

The capital market is growing rapidly in Indonesia, gaining 79 new stock issuers and a 17.9% increase in the number of new investors in 2023. This development is driven by Otoritas Jasa Keuangan, which ensures that every public company is always monitored by requiring them to submit financial statements regularly. However, financial statement fraud is not uncommon. The Association of Certified Fraud Examiners reports that 9.2% of fraud cases in Indonesia involve financial statement fraud, with total losses amounting to Rp242,260,000,000. Meanwhile, conventional audit processes and reports, which account for 72% of current detection methods, take 12 months to detect fraud cases. This study will use an ensemble learning method based on metaheuristic optimization to develop a fraud detection model for financial statements. Several classification methods, namely Random Forest and XGBoost, are used to develop the model. Metaheuristic optimization using the Genetic Algorithm method is then applied as the basis for hyperparameter tuning in this model. The best detection result in this study is achieved by the XGBoost model with optimized parameters, yielding an accuracy of 98.04% and a sensitivity of 99.02%."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kinanthy Dwi Pangesty
"Manajemen rumah sakit yang baik dapat meningkatkan kualitas pelayanan medis. Rumah sakit merupakan institusi pelayanan kesehatan yang menyelenggarakan pelayanan kesehatan perorangan secara paripurna yang menyediakan pelayanan rawat inap, rawat jalan, dan gawat darurat. Rumah sakit diharuskan untuk mengelola berbagai jenis sumber daya untuk meningkatkan efisiensi manajemen secara keseluruhan, seperti mengelola jadwal tim dan staf medis, manajemen tempat tidur, dan jalur perawatan. Penyakit jantung merupakan penyakit penyebab kematian tertinggi di dunia yang sangat membutuhkan penanganan medis dengan segera. Penyakit jantung membutuhkan salah satu pelayanan pada rumah sakit yaitu pelayanan rawat inap. Pelayanan rawat inap melibatkan sumber daya yang berkaitan dengan biaya dan waktu. Dengan adanya prediksi durasi rawat inap pada pasien penyakit jantung akan membantu pihak pasien dalam menyiapkan kebutuhan yang diperlukan serta pihak rumah sakit dalam manajemen tempat tidur rawat inap pasien penyakit jantung. Pada penelitian ini, dilakukan prediksi durasi rawat inap pasien penyakit jantung dengan menggunakan pendekatan ensemble machine learning dengan tujuan untuk mendapatkan metode terbaik dalam memprediksi dengan membandingkan dua metode ensemble machine learning yaitu random forest dan extreme gradient boosting, serta metode logistic regression sebagai baseline. Kemudian tujuan lainnya yaitu untuk mengetahui faktor yang paling berpengaruh terhadap durasi rawat inap. Ketiga metode yang digunakan merupakan bagian dari supervised machine learning. Selain itu, dilakukan optimasi hyperparameter untuk meningkatkan performa dari hasil model prediksi. Setelah membuat model prediksi dan melakukan evaluasi terhadap model, didapatkan metode terbaik yaitu random forest dengan optimasi hyperparameter yang mendapat hasil akurasi sebesar 83,9% dan nilai AUROC sebesar 92,86% serta faktor-faktor yang paling berpengaruh terhadap durasi rawat inap antara lain jumlah limfosit total, urea, trombosit, hemoglobin, glukosa, usia, kreatinin, peptida natriuretik otak, fraksi ejeksi dan hipertensi.

Good hospital management can improve the quality of medical services. The hospital is a health service institution that provides complete individual health services in inpatient, outpatient, and emergency services. Hospitals are required to manage various types of resources to improve overall management efficiency, such as managing medical team and staff schedules, bed management, and clinical pathways. Heart disease is the leading cause of death in the world and requires immediate medical treatment. Heart disease requires one of the services at the hospital, namely inpatient services. Inpatient services involve resources related to cost and time. Predicting the duration of hospitalization in heart disease patients will help the patient prepare for the necessary needs and the hospital in managing inpatient beds for heart disease patients. In this study, the prediction of the duration of hospitalization for heart disease patients using an ensemble machine learning approach was carried out with the aim of getting the best method of predicting by comparing two ensemble machine learning methods, namely random forest and extreme gradient boosting, as well as the logistic regression method as a baseline. Then another goal is to find out the most influential factors on the duration of hospitalization. The three methods used are part of supervised machine learning. In addition, hyperparameter optimization is carried out to improve the performance of the prediction model results. After making a predictive model and evaluating the model, the best method was obtained, namely random forest with hyperparameter optimization which obtained an accuracy of 83.9% and an AUROC value of 92.86% and the factors that most influence the duration of hospitalization include the number of total lymphocytes, urea, platelets, hemoglobin, glucose, age, creatinine, brain natriuretic peptide, ejection fraction and hypertension.
"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Wartini Fakultas
"Air bersih merupakan kebutuhan dasar bagi manusia sehingga menjadi hal yang
wajar jika sektor air bersih mendapat prioritas dalam penanganan dan pemenuhannya. PT
Medco E&P Indonesia Rimau Asset sebagai perusahaan Oil and Gas Nasional dalam
memenuhi kebutuhan air bersih untuk pekerja telah didirikan sebuah Instalasi Pengolahan
Air Bersi Water Treatment Process (WTP-Kaji) sejak tahun 2000. Tujuan penelitian ini
untuk mengetahui kinerja jaringan distribusi WTP-Kaji terutama dalam memenuhi
kebutuhan air bersih di lingkungan perumahan karyawan berdasarkan data pemakaian debit
air setiap bulan.Metode yang digunakan adalah denganmenganalisa kinerja sistem distribusi
terhadap keandalan (reliability), kelentingan (resiliency) dan kerawanan (vulnerability),
serta kepuasan pelanggan dianalisa dengan penyebaran kuesioner terhadap pekerja penghuni
perumahan. Berdasarkan analisa terhadap debit pemakaian air selama periode September
2012 â?? Agustus 2013 menunjukkan bahwa kinerja sistem distribusi air bersih WTP - Kaji
PT Medco E&P Indonesia Rimau Asset sudah optimal dalam memenuhi kebutuhan air
bersih pekerja khususnya di areal perumahan dengan tingkat kehandalan (reliability) dari
sistem kinerja pelayanan pada kondisi kebutuhan air maksimum mencapai 91.67% dan
pada kondisi kebutuhan air minimum mencapai 100%, nilai kelentingan (relisiency) pada
kondisi kebutuhan air maksimum adalah 1 sedangkan kondisi minimum tidak ada (0) dan
nilai kerawanan (vurnability) hanya 2.96 % pada kondisi kebutuhan air maksimum.
Berdasarkan hasil kuisioner tingkat kepuasan pelanggan dalam hal ini pekerja penghuni
areal perumahan terkait pelayanan penyediaan air bersih oleh WTP - Kaji PT Medco E&P
Indonesia RimauAsset dari segi kualitas (warna, bau, rasa), kuantitas (debit) dan kontinuitas
(mengalir selama 24 jam)menyatakan puas atas pelayanan air bersih dengan tingkat kepuasan
52.6% terhadap pelayanan secara keseluruhan yaitu 46.4% responden menyatakan puas
dan 6.2% responden menyatakan sangat puas."
Palembang: Fakultas teknik Universitas tridinanti palembang, 2015
691 JDT 3:1 (2015)
Artikel Jurnal  Universitas Indonesia Library
cover
"Buku yang berjudul "Examination of water for pollution control : a reference book" ini merupakan sebuah buku referensi mengenai pemeriksaan air dan pengendalian polusi. "
Oxford: Pergamon Press, 1982
R 628.168 EXA II
Buku Referensi  Universitas Indonesia Library
cover
"Sungai Cikaniki merupakan anak Sungai Cisadane yang memiliki peran penting bagi sektor pertanian maupun sektor lainnya. Adanya aktivitas antropogenik (pertanian, domestik, dan penambangan emas) yang terjadi di Sungai Cikaniki ditengarai dapat mengganggu keseimbangan ekologi dari komunitas fauna makrobentik yang hidup di dalamya. Tujuan dari penelitian ini adalah mengkaji dampak aktivitas antropogenik yang terjadi di sekitar Sungai Cikaniki terhadap kondisi ekologi pada komunitas fauna makrobentik. Penelitian telah dilakukan selama 3 tahun dimulai bulan Mei 2006 hingga Agustus 2008. Pengambilan fauna makrobentik dengan menggunakan alai D-frame kick net dan renumerasi sampel menggunakan metode fix count 100 individu. Dari penelitian ini menunjukkan adanya aktivitas antropogenik yang terjadi di Sungai Cikaniki dapat mempengaruhi jumlah taxa, komposisi, dan kelimpahan dari fauna makrobentik. Di samping itu, penggunaan metrik biologi seperti EPT, kekayaan taxa, dan indek diversitas Shannon-Wiener relatif sensitif dalam mendeteksi tingginya kontaminasi logam merkuri di sedimen, konduktivitas, oksigen terlarut, dan suhu air. Dari ordinasi canonical correspondence analysis (CCA) menunjukkan larvae Trichoptera Glossosoma sp., Coleoptera Berosus sp., Nympha Odonata Diplebia coerulescens, Plecoptera Nemoura sp., Amphinemoura sp., Ephemeroptera Atalophlebia sp., Larva Diptera Hexatoma sp. dan Glutops sp. relatif sensitif dicirikan oleh rendahnya suhu, konduktivitas, debit, dan konsentrasi merkuri di air, dan sedimen. Larva Coleoptera Notriolus sp, Diptera Chironomidae Krenopelopia sp., Polypedilum flavum, Eukiefferiella sp., Cricotopus politus, Trichoptera Ceratopsyche sp., Lepidoptera Nymphulinae dan nympha Ephemeroptera Platybaetis sp relatif toleran terhadap peningkatan variabel suhu air, konduktivitas, debit air, konsentrasi merkuri di air dan sedimen yang relatif tinggi."
551 LIMNO 16:2 (2009)
Artikel Jurnal  Universitas Indonesia Library
cover
Beti Cahyaninng Astuti
"Air merupakan salah satu kebutuhan dasar bagi kehidupan manusia, sehingga kualitas air menjadi suatu perhatian yang sungguh-sungguh. Pencemaran dalam kadar sangat sedikit pada air tidak diperbolehkan sama sekali. Penelitian ini bertujuan untuk mengkaji kondisi kualitas air sumur di desa bantaran Sungai Bengawan Solo Kecamatan Masaran Kabupaten Sragen Propinsi Jawa Tengah, dan mengkaji pengetahuan masyarakat tentang air bersih. Kualitas air sumur dikaji berdasarkan pengetahuan masyarakat dan dianalisis dengan parameter fisika, kimia, dan mikrobiologi, berdasarkan Peraturan Menteri Kesehatan Republik Indonesia Nomor 416/Menkes/ Per/IX/1990 tentang Syarat-syarat dan Pengawasan Kualitas Air Bersih. Hasil penelitian menunjukkan bahwa kualitas air sumur enam desa di bantaran Sungai Bengawan Solo Kecamatan Masaran Kabupaten Sragen Propinsi Jawa Tengah tidak memenuhi syarat baku mutu untuk air bersih."
Tanggerang: Lembaga penelitian dan pengabdian kepada masyarakat Universitas Terbuka, 2015
520 JMSTUT 16:1 (2015)
Artikel Jurnal  Universitas Indonesia Library
cover
Jauzak Hussaini Windiatmaja
"Sumber informasi di jejaring berita daring adalah instrumen yang memungkinkan individu membaca berita, menerbitkan berita, dan berkomunikasi. Hal ini sudah menjadi tren dalam masyarakat yang sangat mobile. Oleh karena itu, proses verifikasi fakta suatu pemberitaan menjadi sangat penting. Dengan pertimbangan tersebut, sebuah tools berbasis web service untuk verifikasi fakta menggunakan metode deep learning dengan teknik ensemble dibangun. Penggunaan teknik ensemble pada model deep learning adalah proses beberapa model pembelajaran mesin digabungkan secara strategis untuk menyelesaikan masalah menggunakan lebih dari satu model. Untuk melatih model, dibangun sebuah dataset. Dataset berisi pasangan klaim dan label. Klaim dibangun dengan data crawling di kanal berita berbahasa Indonesia. Tiga model deep learning dibangun dan dilatih menggunakan dataset yang dibuat, dengan arsitektur jaringan dan hyperparameter yang berbeda. Setelah model dilatih menggunakan dataset, ketiga model diagregasikan untuk membentuk sebuah model baru. Untuk memastikan bahwa model agregat berfungsi lebih baik daripada model tunggal, performa model deep learning ensemble dibandingkan dengan model deep learning dasar. Hasil penelitian menunjukkan bahwa model ensemble memiliki akurasi 85,18% sedangkan model tunggal memiliki akurasi 83,9%, 83,19%, dan 81,94%. Hasil ini menunjukkan bahwa model ensemble yang dibangun meningkatkan kinerja verifikasi fakta dari tiga model tunggal. Hasil penelitian juga menunjukkan bahwa metode deep learning mengungguli performa metode machine learning lain seperti naive bayes dan random forest. Untuk memvalidasi kinerja tools yang dibangun, response time dari web service diukur. Hasil pengukuran menunjukkan rata-rata response time 6.447,9 milidetik.

Information sources on social networks are instruments that allow individuals to read news, publish news, and communicate. This is a trend in a highly mobile society. Therefore, the process of verifying facts is very important. With these considerations, we built a web service-based tool for fact verification using deep learning methods with ensemble technique. The use of ensemble techniques in deep learning models is a process in which several machine learning models are combined to solve problems. To train the model, we created a dataset. Our dataset of Indonesian news contains pairs of claims along with labels. Claims are built by crawling data on Indonesian news channels. Three deep learning models have been built and trained using the previously created dataset with different network architectures and hyperparameters. After the model is trained, three models are aggregated to form a new model. To ensure that the aggregated model performs better than the single model, the deep learning ensemble model is compared to the single models. The results showed that the ensemble model has an accuracy of 85.18% while the single models have an accuracy of 83.9%, 83.19%, and 81.94% consecutively. These results indicate that the ensemble model built improves the fact-verification performance of the three single models. The results also show that by using the same dataset, deep learning methods outperform other machine learning methods such as naive bayes and random forest. To validate the performance of the tools we created, the response time of the web service is measured. The measurement result shows an average response time of 6447.9 milliseconds."
Depok: Fakultas Teknik Universitas Indonesia, 2021
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>