Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 153995 dokumen yang sesuai dengan query
cover
Siti Shafa Adilah
"Moda transportasi udara sangat bergantung pada keadaan dan perubahan cuaca, baik saat lepas landas, mengudara, maupun saat pendaratan, dengan lebih dari 50% kecelakaan pesawat diakibatkan oleh cuaca. Curah hujan yang tinggi dapat mengganggu aktivitas penerbangan dengan menurunkan visibilitas, meningkatkan massa pesawat, mengurangi akurasi instrumen pengukuran, serta menyebabkan turbulensi. Oleh karena itu, penting bagi manajemen bandara untuk memastikan kondisi cuaca aman bagi operasi pesawat. Penelitian ini bertujuan untuk mengembangkan model prediksi kategori hujan berdasarkan curah hujan untuk 1 jam, 3 jam, dan 9 jam ke depan, menggunakan data dari AWOS di Bandara Jenderal Ahmad Yani, Semarang. Algoritma yang digunakan adalah Random Forest dengan 100 pohon dan K-Nearest Neighbor (KNN) dengan k sebesar 5. Hasil analisis menunjukkan bahwa model KNN dan Random Forest memiliki performa yang cukup baik, dengan prediksi terbaik untuk periode 1 jam ke depan. Model KNN memiliki performa terbaik dengan akurasi 0,86, presisi 086, recall 0,86, F1-score 0,85, dan MCC 0,83.

Air transportation is highly dependent on weather conditions and changes, both during takeoff, flight, and landing, with more than 50% of aircraft accidents caused by weather. Heavy rainfall can disrupt flight activities by reducing visibility, increasing aircraft mass, decreasing the accuracy of onboard measurement instruments, and causing turbulence. Therefore, it is crucial for airport management to ensure that weather conditions are safe for aircraft operations. This study aims to develop a model to predict rain categories based on rainfall for 1 hour, 3 hours, and 9 hours ahead, using data from AWOS at Jenderal Ahmad Yani Airport, Semarang. The algorithms used are Random Forest with 100 trees and K-Nearest Neighbor (KNN) with k set to 5. The analysis results show that the KNN and Random Forest models perform reasonably well, with the best predictions made for the 1-hour ahead period. The KNN model demonstrated the best performance with an accuracy of 0.86, precision of 0.86, recall of 0.86, F1-score of 0.86, and MCC of 0.86."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rashifa Khairani Setianegara
"Curah hujan mempunyai dampak yang signifikan terhadap berbagai sektor kehidupan dan lingkungan. Misalnya, curah hujan membantu meningkatkan produktivitas pertanian, menjamin cadangan pangan dan air. Selain itu, curah hujan juga mempengaruhi kekeringan dan siklus air tanah. Oleh karena itu, mengetahui cara memperkirakan curah hujan di suatu daerah secara akurat sangat penting. Salah satu cara memperkirakan curah hujan adalah dengan menggunakan radar cuaca yang mengukur nilai reflektivitas, kemudian menggunakan persamaan Z-R untuk menghitung curah hujan yang terjadi. Namun, beberapa penelitian sebelumnya telah menggunakan model estimasi curah hujan kuantitatif dengan machine learning dari data radar hujan karena dapat memberikan prediksi yang lebih akurat dibandingkan persamaan Z-R. penelitian lain menyatakan bahwa gradient boosting menghasilkan estimasi curah hujan yang lebih akurat dibandingkan beberapa algoritma lainnya. Pada penelitian ini, estimasi curah hujan dilakukan pada satu wilayah dengan tipe curah hujan lokal di Kota Gorontalo. Estimasi ini dilakukan dengan membandingkan keakuratan dua metode: persamaan Z-R dan algoritma machine learning. Persamaan Z-R yang digunakan adalah persamaan Z-R oleh Marshall-Palmer (𝐴 = 200, 𝑏 = 1.6) dan Rosenfeld (𝐴 = 250, 𝑏 = 1.2), sedangkan algoritma machine learning yang digunakan adalah gradient boosting. Hasil perbandingan menunjukkan bahwa gradient boosting memberikan estimasi yang lebih akurat dibandingkan dengan kedua persamaan Z-R tersebut. Hasil estimasi algoritma gradient boosting memberikan nilai RMSE, MAE, dan R 2 masing-masing sebesar 0,61, 0,17, dan 0,86. Persamaan Marshall-Palmer Z-R menghasilkan nilai RMSE, MAE, dan R 2 sebesar 8,14, 3,66, dan -0,19. Estimasi persamaan Z-R Rosenfeld menghasilkan nilai RMSE, MAE, dan R 2 sebesar 8,18, 3,71, dan -0,20. Dari ketiga metrik tersebut, dapat disimpulkan bahwa gradient boosting memberikan estimasi yang paling akurat untuk curah hujan di wilayah dengan tipe hujan lokal di Kota Gorontalo.

Rainfall has a significant impact on various sectors of life and the environment. For example, rainfall helps increase productivity in agriculture, ensuring food reserves and water. In addition, rainfall also affects drought and the soil water cycle. Therefore, knowing how to estimate rainfall in an area accurately is essential. One way to estimate rainfall is to use a weather radar that measures reflectivity values, then use the Z-R equation to calculate the rainfall that occurs. However, Several previous studies have used machine learning quantitative rainfall estimation models from rain radar data because it can provide more accurate predictions than the Z-R equation. Another study state that gradient boosting provides more accurate rainfall estimation than several other algorithms. In this study, rainfall estimation was carried out in an area with local rainfall types in Gorontalo City. This estimation is done by comparing the accuracy of two methods: the Z-R equation and machine learning algorithms. The Z-R equation used is the Z-R Equation by Marshall-Palmer (𝐴 = 200, 𝑏 = 1.6) and Rosenfeld (𝐴 = 250, 𝑏 = 1.2), while the machine learning algorithm used is gradient boosting. The comparison results show that gradient boosting provides a more accurate estimation than the two ZR equations. The gradient boosting algorithm estimation results provide RMSE, MAE, and R 2 values of 0.61, 0.17 and 0.86, respectively. The Marshall-Palmer Z-R equation obtained RMSE, MAE, and R 2 values of 8.14, 3.66, and -0.19. The estimation of Rosenfeld's Z-R equation resulted in RMSE, MAE, and R 2 values of 8.18, 3.71, and - 0.20. From these three metrics, it is concluded that gradient boosting provides the most accurate estimate for rainfall in areas with localized rainfall types in Gorontalo City."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rr. Dea Annisayanti Putri
"Dalam era digital yang terus berkembang, aktivitas sosial dan bisnis semakin banyak beralih ke media sosial dan digitalisasi melalui e-commerce. Tidak hanya pada sektor jual beli masyarakat, terjadi digitalisasi di bidang pengadaan barang/jasa pemerintah dengan dibangunnya sistem e-katalog. Sistem e-katalog memungkinkan pemerintah dan masyarakat untuk mengawasi dan memastikan bahwa pengadaan barang dan jasa pemerintah dilakukan secara adil dan transparan. Namun, sistem e-katalog mengalami keterbatasan dalam hal jumlah dan jenis produk, sehingga upaya terus dilakukan untuk menambah vendor dan memperluas kesepakatan dengan penjual lokal. Meskipun begitu, masih terdapat banyak produk impor yang tercatat pada daftar produk di e-katalog. Dengan memanfaatkan teknologi Machine Learning, klasifikasi produk ke lokal dan pemetaannya ke kategori di e-katalog dapat membantu menyelesaikan permasalahan yang dihadapi oleh sistem e-katalog ini.
Desain penelitian yang digunakan pada penelitian ini adalah Experimental research, dimana klasifikasi produk dan pemetaan kategori yang dilakukan pada penelitian ini menggunakan metode Machine Learning. Pemetaan kategori dilakukan dengan 2 pendekatan, produk ke kategori dan kategori ke kategori. Klasifikasi produk dibagi menjadi 2 kelas yaitu lokal dan impor. Data yang diolah adalah produk dari e-commerce dari rentang November 2022 hingga April 2023.
Metode yang digunakan pada penelitian ini untuk klasifikasi produk lokal dan kategori adalah Random Forest (RF), Support Vector Machine (SVM), Neural Network (NN), dan Transformers. Dari eksperimen klasifikasi produk lokal dan kategori, keduanya mendapatkan hasil evaluasi terbaik dari model transformers, yang digunakan sebagai model ekstraksi fitur hingga klasifikasi. Performa model klasifikasi produk lokal mendapat f1-score 97,24% dan akurasi 97,25%. Sedangkan model klasifikasi kategori, performa model f1-score 63,74% dan akurasi 64,14%.

In the ever-evolving digital era, social and business activities are increasingly turning to social media and digitalization through e-commerce. Not only in the public buying and selling sector, digitization happen in the field of government goods/services procurement with the construction of an e-catalog system. The e-catalog system enables the government and the public to monitor and ensure that government procurement of goods and services is carried out in a fair and transparent manner. However, the e-catalog system suffers from limitations in terms of the number and types of products, so efforts are being made to add more vendors and expand agreements with local sellers. Even so, there are still many imported products listed on the product list in the e-catalog. By utilizing Machine Learning technology, classifying products to local and mapping them to categories in the e-catalog can help solve the problems faced by this e-catalog system.
The research design used in this study is Experimental research, where product classification and category mapping are carried out in this study using Machine Learning methods. Category mapping is done with 2 approaches, product to category and category to category. Product classification is divided into 2 classes, namely local and imported. The processed data are products from e-commerce from November 2022 to April 2023.
The methods used in this study for local product classification and categories are Random Forest (RF), Support Vector Machine (SVM), Neural Network (NN), and Transformers. From the local and category product classification experiments, both obtained the best evaluation results from the Transformers model, which was used as a feature extraction model for classification. The performance of the local product classification model gets an f1-score of 97,24% and accuracy 97,25%. While the category classification model, the performance of the f1-score model is 63,74% and accuracy 64,14%.
"
Depok: 2023
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Raden David Febriminanto
"In line with rapid business process digitalization in the Directorate General of Taxes, the size of the data stored in the institution has grown exponentially. However, there is a problem with generating value out of the valuable data assets. Correspondingly, this research provides machine-learning-based predictive analytics as a solution to the question of how to use taxpayers' trigger data as a decision support system to discover and realize unexplored tax potential. More specifically, this research presents predictive analytics models that can accurately predict which potential taxpayers are likely to pay their due. We developed three machine learning models: logistic regression, random forest, and decision tree. We analyzed 5,562 tax revenue potential data samples with eight predictors: trigger data nominal value, distance to tax office, type of taxpayer, media of tax report, type of tax, report status, registered year of taxpayer, and area coverage. Our study shows that the random forest model provided the best prediction performance. The resultant weight of each attribute indicated that the status of the tax report was the top tier of variable importance in predicting tax revenue potential. The analytics can help tax officers determine potential taxpayers with the highest likelihood to pay their due. Given the size of the data records, this approach can provide tax administrators with a powerful tool to increase work efficiency, combat tax evasion, and provide better customer service."
Jakarta: Direktorat Jenderal Pembendaharaan Kementerian Keuangan Republik Indonesia, 2022
336 ITR 7:3 (2022)
Artikel Jurnal  Universitas Indonesia Library
cover
Balqis Az Zahra
"Memprediksi niat kunjungan kembali memainkan peran penting dalam kebangkitan kembali waktu pandemi yang akan menguntungkan keunggulan kompetitif jangka pendek dan jangka panjang. Penelitian ini mengkaji faktor-faktor penentu niat berkunjung kembali dari analisis sentimen berbasis aspek dan pembelajaran mesin. Pendekatan big data diterapkan pada empat set data atraksi, hotel bintang 4&5, hotel bintang 3, dan motel dengan 49.399 ulasan dari TripAdvisor. Kami menerapkan metode pemodelan topik untuk mengekstrak aspek dan atribut, menghasilkan 10 aspek untuk kategorisasi hotel 4&5 dan kumpulan data atraksi, 6 aspek pada kumpulan data hotel bintang 3 dan Motel. Hasil analisis sentimen menunjukkan bahwa sentimen wisatawan secara positif dan negatif juga mempengaruhi kemungkinan niat berkunjung kembali. Peneliti menerapkan metode Logistic Regression, Random Forest Classifier, Decision Tree, k-NN, dan XGBoost untuk memprediksi niat berkunjung kembali yang menghasilkan tiga topik utama yang mendominasi probabilitas niat berkunjung kembali untuk masing-masing dataset. Aspek Properti pada hotel bintang 4&5 dan hotel bintang 3 mengindikasikan memiliki kemungkinan tinggi untuk niat berkunjung kembali. Sedangkan aspek Motels pada Atmosfir, Aktivitas Wisata, dan Durasi cenderung memiliki probabilitas niat berkunjung kembali. Aspek atraksi pada Harga, Layanan, Suasana meningkatkan kemungkinan niat berkunjung kembali. Studi ini berkontribusi pada pemanfaatan data besar dan pembelajaran mesin di industri pariwisata dan perhotelan dengan berfokus pada strategi inovatif sebagai pengurangan biaya untuk mempertahankan niat kunjungan kembali di kebangkitan kembali dari pandemi.

Predicting revisit intention plays a crucial role in the reawakening time of pandemic that will benefit short-term and long-term competitive advantage. This study examines the determiner factors of revisit intention from aspect-based sentiment analysis and machine learning. A big data approach was applied on four datasets of attractions, hotel 4&5 stars, hotel 3 stars, and motels with 49,399 reviews from TripAdvisor. We applied a topic modeling method to extract aspects and attributes, resulting in 10 aspects for hotel 4&5 categorization and attractions dataset, 6 aspects on hotel 3 stars and Motels dataset. Results on sentiment analysis show that tourists’ sentiment in positives and negatives also affect probability of revisit intention. Researchers applied methods of Logistic Regression, Random Forest Classifier, Decision Tree, k-NN, andXGBoost to predict revisit intention resulting in three main topics that have dominated probability on revisit intention for each dataset respectively. Aspect Properties on hotels 4&5 stars and hotel 3 stars indicate to have a high probability of revisit intention. Meanwhile, Motels' aspects on Atmosphere, Tourist Activities, and Duration tend to have a probability of revisit intention. Attraction’s aspects on Price, Services, Ambience increase probability of revisit intention. This study contributes to the utilization of big data and machine learning in tourism and hospitality industry by focusing on an innovative strategy as cost reduction to maintain revisit intention in the reawakening from pandemic."
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Bernadeta Nafirsta Ayu Nareswari
"Curah hujan merupakan unsur iklim yang memiliki keragaman dan fluktuasi yang tinggi di Indonesia. Hal ini membuat curah hujan merupakan unsur iklim yang paling dominan untuk mencirikan iklim di Indonesia. Berdasarkan gerakan udara naik untuk membentuk awan, terdapat tiga tipe hujan yaitu konvektif, orografik, dan gangguan. Pengukuran terhadap curah hujan dapat dilakukan dalam berbagai metode, salah satunya dengan menggunakan pengukuran jarak jauh yaitu radar (Radio Detecting and Ranging). Pada studi ini dilakukan perhitungan radar cuaca dengan menggunakan machine learninguntuk mengkaji keakuratan perhitungan data radar cuaca terhadap estimasi curah hujan di Pulau Biak, Indonesia. Produk dari radar cuaca merupakan data reflektifitas (Z). Penggunaan machine learning ini diterapkan pada data reflektifitas radar cuaca dimana data yang digunakan adalah C-MAX atau Column Maximum. Data curah hujan pada periode Desember 2021 sampai Februari 2022 di Kabupaten Biak diolah menggunakan algoritma yang berbeda, yaitu Decision Tree, Random Forest, Adaptive Boosting, Gradient Boosting Extreme Gradient Boosting. Hasil dari studi ini akan menunjukkan algoritma terbaik yang dapat digunakan untuk memprediksi estimasi curah hujan konvektif di Pulau Biak, Indonesia. Berdasarkan penelitian yang sudah dilakukan, didapatkan hasil R2 pada algoritma Decision Tree sebesar 0,70; Random Forest 0,60; Adaptive Boosting sebesar 0,42; Gradient Boosting sebesar 0,71 dan Extreme Gradient Boosting sebesar 0,73. Hasil analisis menunjukkan bahwa algoritma Extreme Gradient Boosting dapat memberikan estimasi curah hujan paling baik di Pulau Biak, Indonesia.

Rainfall is an element of climate with high diversity and fluctuation in Indonesia. This makes rainfall the most dominant climate element to characterize the climate in Indonesia. Based on the movement of rising air to form clouds, there are three types of rain: convective, orographic, and disturbance. Rainfall can be measured in various methods, one of which is by using remote measurement, namely radar (Radio Detecting and Ranging). In this study, weather radar calculations were carried out using machine learning to assess the accuracy of weather radar data calculations on the estimated rainfall value on Biak Island, Indonesia. The product of weather radar is reflectivity (Z) data. The use of machine learning is applied to weather radar reflectivity data where the data used is C-MAX or Column Maximum. Rainfall data from December 2021 to February 2022 in Biak Regency is processed using five different algorithms: Decision Tree, Random Forest, Adaptive Boosting, Gradient Boosting, and Extreme Gradient Boosting. The result of this study will show the best algorithm that can be used to predict convective rainfall estimation in Biak Island, Indonesia. Based on the research that has been done, the R2 results obtained on the Decision Tree algorithm of 0.70; Random Forest 0.60; Adaptive Boosting of 0.42; Gradient Boosting of 0.71 and Extreme Gradient Boosting of 0.73. The analysis shows that the Extreme Gradient Boosting algorithm can estimate the best rainfall in Biak Island, Indonesia."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dea Amrializzia
"Pipa transmisi adalah cara teraman dan paling efektif untuk mengangkut gas alam dalam jumlah besar dalam jarak jauh. Meskipun transportasi menggunakan pipa adalah yang paling aman, kegagalan pipa transmisi dapat menyebabkan kerusakan, kerugian finansial, dan cedera. Kegagalan pipa perlu diprediksi untuk untuk menentukan prioritas pemeliharaan pipa sebagai salah satu strategi membuat jadwal pemeliharaan prefentif yang tepat sasaran dan efisien agar pipa dapat diperbarui atau direhabilitasi pipa sebelum terjadi kegagalan. Metode yang ditawarkan pada studi ini adalah machine learning, dimana metode merupakan bagian dari insiatif transformasi digital (Hajisadeh, 2019). Model dikembangkan berdasarkan data kegagalan historis dari jaringan pipa transmisi gas darat sekitar 2010-2020 yang dirilis oleh Departemen Transportasi AS dengan karakteristik data yang tidak terstruktur dan kompleks. Proses pembelajaran mesin dapat dibagi menjadi beberapa langkah: pra-pemrosesan data, pelatihan model, pengujian model, pengukuran kinerja, dan prediksi kegagalan. Pengembangan model pada studi ini dilakukan menggunakan dua algoritma yaitu regresi logistik dan random forest. Pola perilaku dari faktor-faktor yang paling berpengaruh adalah usia dan panjang segmen pipa meiliki korelasi positif terhadap kegagalan pipa. Kedalaman pipa, ketebalan, dan diameter pipa memiliki korelasi negatif. Kegagalan pipa paling sering terjadi pada pipa dengan class location 1 dan class location 4, pipa yang ditempatkan di bawah tanah, serta pipa dengan tipe pelapis coal tar. Hasil pengembangan model menggunakan machine learning menunjukan hasil performa model akurasi prediksi 0.949 dan AUC 0.950 untuk model dengan algoritma regresi logistik. Sedangkan akurasi prediksi 0.913 dan AUC 0.916 untuk model dengan algoritma random forest. Berdasrkan hasil uji performa kita dapat menyimpulkan bahwa machine learning adalah metode yang efektif untuk memprediksi kegagalan pipa. Berdasarkan model yang dilatih pada dataset nyata pipa transmisi gas, hasil prediksi pada studi kasus dapat menghindari 29% dari kegagalan pipa pada 2025, 53% kegagalan pipa pada tahun 2030, dan 64% pada tahun 2035.

Transmission pipe is the safest and most effective way to transport large amounts of natural gas over long distances. Although transportation using pipelines is the safest, transmission pipeline failures can cause damage, financial losses, and injuries. Pipeline failures need to be predicted to determine the priority of pipeline maintenance as one of the strategies to create a schedule of maintenance targets that is right on target and efficient so that the pipeline can be rehabilitated before a failure occur. The method offered in this study is machine learning, where the method is part of the digital transformation initiative (Hajisadeh, 2019). The model was developed based on historical failure data from the onshore gas transmission pipeline around 2010-2020 released by the US Department of Transportation with unstructured and complex data characteristics. The machine learning process can be divided into several steps: data pre-processing, model training, model testing, performance measurement, and failure prediction. The development of the model in this study was carried out using two algorithms namely logistic regression and random forest. The correaltion of the factors that most influence the failure of an onshore gas transmission pipeline is the age and length of the pipe segment has a positive correlation with pipe failure. Depth of cover, thickness, and diameter of pipes have a negative correlation with pipe failures. Pipe failures most often occur in pipes with class location 1 and class location 4, undersoil, and pipes with coal tar coating types. The results of the development of the model using machine learning showed the results of the model performance prediction accuracy is 0.949 and AUC is 0.950 for models with logistic regression algorithms. Whereas the accuracy of prediction is 0.913 and AUC is 0.916 for models using the random forest algorithm. Based on the results of performance tests we can conclude that machine learning is an effective method for predicting pipe failures. Based on the model trained on a real dataset of gas transmission pipelines, the prediction results in case studies can avoid 29% of pipe failures in 2025, 53% of pipe failures in 2030, and 64% in 2035. "
Depok: Fakultas Teknik Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Diva Tristika Mughni
"Tingkat kemacetan di Jakarta saat ini tergolong tinggi dan memiliki tren yang meningkat setiap tahu. Terdapat berbagai upaya yang dilakukan oleh pihak manajemen kemacetan untuk mengurangi kemacetan. Salah satu komponen yang perlu diperhatikan pada perencanaan upaya dalam mengurangi kemacetan adalah penemuan atribut yang memiliki pengaruh kepada tingkat kemacetan. Pendekatan machine learning (ML) pada beberapa tahun terakhir memberi hasil yang baik berdasarkan nilai metrik performa model. Maka, penelitian ini menggunakan algoritma ML, yaitu support vector machine (SVM), k-nearest neighbors (KNN), dan random forest (RF) untuk membangun model dalam memprediksi kemacetan serta menemukan faktor yang memiliki pengaruh terhadap kemacetan di ruas jalan. Variabel independen yang digunakan pada penelitian ini adalah jam, hari kerja, tanggal merah, curah hujan, ada tidaknya event, jam ganjil genap, volume motor, volume mobil, serta volume bus dan truk. Variabel dependen yang digunakan adalah tingkat kemacetan yang mewakili kecepatan rata-rata kendaraan di ruas jalan. Model dijalankan pada dua data, yakni pada data dengan variabel volume kendaraan dan data tanpa variabel kendaraan. Hasil penelitian menunjukkan model SVM, KNN, dan RF memberikan nilai akurasi, precision, recall, dan F1 score di atas 80% pada kedua data. Adapun faktor yang memiliki pengaruh kuat terhadap tingkat kemacetan terdiri dari jam dan jam ganjil genap pada data tanpa volume kendaraan serta volume motor, volume mobil, volume bus dan truk, jam, dan jam ganjil genap pada data dengan volume kendaraan.

The level of congestion in Jakarta is currently high and has an increasing trend every year. There are various efforts made by congestion management to reduce congestion. One component that needs to be considered in planning efforts to reduce congestion is the discovery of attributes that have an influence on the level of congestion. Machine learning (ML) approaches in recent years have provided good results based on the value of model performance metrics. So, this study uses ML algorithms, namely support vector machine (SVM), k-nearest neighbors (KNN), and random forest (RF) to build a model to predict congestion and find factors that have an influence on congestion on road sections. The independent variables used in this study are hours, weekdays, red dates, rainfall, presence or absence of events, even odd hours, motorcycle volume, car volume, and bus and truck volume. The dependent variable used is the level of congestion, which represents the average speed of vehicles on the road. The model was run on two data, namely on data with vehicle volume variables and data without vehicle variables. The results showed that the SVM, KNN, and RF models provided accuracy, precision, recall, and f1 score values above 80% on both data. The factors that have a strong influence on the level of congestion consist of hours and even odd hours on data without vehicle volume and motorcycle volume, car volume, bus and truck volume, hours, and even odd hours on data with vehicle volume."
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ajeng Dwi Asti
"Ujaran kebencian dapat menyebabkan terjadinya konflik dan pembantaian di masyarakat sehingga harus segera ditangani. Indonesia memiliki lebih dari 700 bahasa daerah dengan karakteristik masing-masing. Ujaran kebencian yang ada di Indonesia juga pernah dilakukan menggunakan bahasa daerah. Media sosial Twitter paling sering digunakan dalam menyebarkan ujaran kebencian. Identifikasi target, kategori, serta level ujaran kebencian dapat membantu Polri dan Kemenkominfo dalam menentukan prioritas penanganan ujaran kebencian sehingga dapat meminimalisir dampaknya. Penelitian ini melakukan identifikasi ujaran kasar dan ujaran kebencian beserta target, kategori, dan level ujaran kebencian pada data Twitter berbahasa daerah menggunakan algoritma classical machine learning dan deep learning. Penelitian ini menggunakan data lima bahasa daerah di Indonesia dengan penutur terbanyak yaitu Jawa, Sunda, Madura, Minang, dan Musi. Pada data Bahasa Jawa performa terbaik diperoleh menggunakan algoritma Support Vector Machine (SVM) dengan transformasi data Classifier Chains (CC) serta kombinasi fitur word unigram, bigram, dan trigram dengan F1-score 70,43%. Algoritma SVM dengan transformasi data CC serta kombinasi fitur word unigram dan bigram memberikan performa terbaik pada data Bahasa Sunda dan Madura dengan masing-masing F1-score 68,79% dan 78,81%. Sementara itu, pada data Bahasa Minang dan Musi hasil terbaik diperoleh menggunakan algoritma SVM dengan transformasi data CC serta fitur word unigram dengan F1-score 83,57% dan 80,72%. Penelitian ini diharapkan dapat digunakan sebagai masukan bagi Polri dan Kemenkominfo dalam pembangunan sistem identifikasi ujaran kasar, ujaran kebencian serta target, kategori, dan level ujaran kebencian pada media sosial.

Hate speech can lead to conflict and massacres in society so it must be dealt immediately. Indonesia has more than 700 regional languages with their own characteristics. Hate speech in Indonesia has also been carried out using regional languages. Twitter is the most frequently used social media to spread hate speech. Identification of targets, categories, and levels of hate speech can help the National Police and the Ministry of Communication and Information to determine priorities for handling hate speech to minimize its impact. This study identifies abusive speech and hate speech along with the target, category, and level of hate speech on regional language Twitter data using classical machine learning and deep learning algorithms. This study uses data from five regional languages in Indonesia with the most speakers, namely Javanese, Sundanese, Madurese, Minang, and Musi. In Java language data, the best performance is obtained using the Support Vector Machine (SVM) algorithm with Classifier Chains (CC) data transformation and a combination of unigram, bigram, and trigram word features with an F1-score of 70.43%. The SVM algorithm with CC data transformation and the combination of unigram and bigram word features provides the best performance on Sundanese and Madurese data with F1-scores of 68.79% and 78.81%, respectively. Meanwhile, in Minang and Musi language data, the best results were obtained using the SVM algorithm with CC data transformation and word unigram features with F1-scores of 83.57% and 80.72%, respectively. This research is expected to be used as input for the National Police and the Ministry of Communication and Information in developing a system for identifying harsh speech, hate speech and the target, category, and level of hate speech on social media."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Helmi Qosim
"ABSTRAK
Synthesis loop merupakan salah satu sistem kritis di pabrik amoniak. Oleh karena itu, ada urgensi untuk menjaga reliability dan availability pada sistem ini. Sebagian besar peristiwa shutdown di pabrik amoniak terjadi tiba-tiba setelah alarm tercapai. Jadi, perlu ada sistem deteksi dini untuk memastikan masalah anomali ditangkap oleh operator sebelum menyentuh set point alarm. Implementasi algoritma machine learning dalam membuat model deteksi potensi kegagalan telah digunakan di berbagai industri dan objek sebagai penelitian. Algoritma yang digunakan adalah classifier dasar dan ensemble untuk membandingkan algoritma mana yang menghasilkan hasil klasifikasi terbaik. Penelitian ini dapat memberikan ide dan perspektif baru ke dalam industri pabrik amoniak untuk mencegah terjadinya shutdown yang tidak terjadwal dengan memanfaatkan data menggunakan algoritma machine learning.

ABSTRACT
Synthesis loop is one of the critical systems in ammonia plant. Therefore, there is urgency for maintaining the reliability and availability of this system. Most of the shutdown events occur suddenly after the alarm is reached. So, there needs to be an early detection system to ensure anomaly problem captured by the operator before
touching the alarm settings. The implementation of machine learning algorithms in making fault detection models has been used in various industries and objects. The algorithm used is the basic and ensemble classifier to compare which algorithms generate the best classification results. This research can provide a new idea and perspective into ammonia plant industry to prevent unscheduled shutdown by utilizing
data using machine learning algorithm."
Depok: Fakultas Teknik Universitas Indonesia , 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>