Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 7 dokumen yang sesuai dengan query
cover
Risa Annisa
"Seismometer adalah instrumen penting dalam memantau gempa bumi dan aktivitas seismik lainnya. Namun, kinerjanya dapat menurun seiring waktu karena berbagai faktor, seperti kondisi lingkungan, komponen yang menua, dan gangguan eksternal. Hal ini dapat menyebabkan pengumpulan data yang tidak akurat. Saat ini belum ada metode yang dapat digunakan untuk mengevaluasi kinerja seismometer. Dalam penelitian ini, mengembangkan metode diagnosis kesehatan seismometer yang berbasis pada analisis sinyal seismik.  Metode yang dikembangkan mengunakan model machine learning SVM dan random forest  berdasarkan feature korelasi silang dan  rasio amplitudo,  Metode ini menghasil kan 4 indikator kesehatan yaitu Excellent, Good, Fair dan Poor, Nilai korelasi silang dan rasio amplitudo di dapatkan  melalui korelasi antara 2 jenis sinyal seismik yaitu sinyal seismik target dan beberapa sinyal seismik referensi sehingga dapat diketahui bahwa seismometer yang dalam kondisi sangat bagus memiliki nilai korelasi silang dan rasio amplitudo ± 0.9 – 1. Metode yang digunakan sudah dievaluasi dengan mengunakan 6 event gempa teleseismik : Jepang 2024, Alaska Peninsula 2023, New Caledonia 2023, Turkey 2023, Tongga 2023 dan Solomon 2022 dengan model SVM dan Random Forest untuk mengklasifikasikan kesehatan seismometer didapatkan akurasi 95 % dna 88 %.

Seismometers are crucial instruments for monitoring earthquakes and other seismic activities. However, their performance can degrade over time due to various factors such as environmental conditions, aging components, and external disturbances. This can lead to inaccurate data collection. Currently, there is no method available to evaluate the performance of seismometers. In this study, we developed a seismometer health diagnosis method based on seismic signal analysis. The developed method uses SVM and random forest machine learning models based on cross-correlation features and amplitude ratios. This method produces four health indicators: Excellent, Good, Fair, and Poor. The cross-correlation values and amplitude ratios are obtained through the correlation between two types of seismic signals, namely the target seismic signal and several reference seismic signals. It can be known that seismometers in excellent condition have cross-correlation values and amplitude ratios of approximately 0.9 – 1. The method used has been evaluated using six teleseismic earthquake events: Japan 2024, Alaska Peninsula 2023, New Caledonia 2023, Turkey 2023, Tonga 2023, and Solomon 2022. Using SVM and Random Forest machine learning models to classify seismometer health, accuracies of 95% and 88% were obtained respectively."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Fiftitah Repfian Aszhari
"

Stroke merupakan salah satu penyakit dengan risiko kematian dan kecacatan yang tinggi. Secara umum, stroke diklasifikasikan menjadi dua jenis, yaitu stroke iskemik dan stroke hemoragik. Klasifikasi jenis stroke secara cepat dan tepat diperlukan untuk menentukan jenis pengobatan dan tindakan yang tepat guna mencegah terjadinya dampak yang lebih fatal pada pasien stroke. Pada penelitian ini, klasifikasi stroke dilakukan menggunakan pendekatan machine learning. Adapun data penelitian yang digunakan adalah data stroke yang terdiri atas pemeriksaan laboratorium. Pada data penelitian tersebut, terdapat berbagai komponen pemeriksaan laboratorium yang dicatat serta memungkinkan adanya suatu pemeriksaan yang kurang relevan atau informatif dalam mengklasifikasi stroke. Apabila data tersebut tidak ditangani, akan mempengaruhi kinerja serta waktu komputasi model dalam mengklasifikasi stroke. Oleh karena itu, pada penelitian ini, Random Forest (RF) dengan seleksi fitur Recursive Feature Elimination (RFE) digunakan dalam mengklasifikasi data stroke. Dengan menerapkan metode tersebut, diperoleh kinerja model yang lebih baik saat melakukan klasifikasi menggunakan sejumlah fitur yang diperoleh dari hasil seleksi fitur, dibandingkan menggunakan keseluruhan fitur dalam data stroke. Selain itu, pada penerapan metode tersebut, diperoleh kinerja model yang baik dalam mengklasifikasi data kelas stroke iskemik, akan tetapi tidak cukup baik dalam mengklasifikasi data kelas stroke hemoragik. Hal ini dikarenakan proporsi jumlah data pada kelas stroke iskemik lebih banyak dibandingkan stroke hemoragik. Dalam hal ini dibutuhkan suatu metode penanganan agar kinerja model tetap optimal dalam mengklasifikasi data kelas stroke iskemik dan stroke hemoragik. Pada penelitian ini, Synthetic Minority Oversampling Technique (SMOTE) digunakan untuk menyeimbangkan kedua kelas data stroke guna memperoleh kinerja model yang optimal dalam mengklasifikasi kedua kelas data stroke. Berdasarkan penerapan metode RF dengan RFE serta SMOTE dalam mengklasifikasi data stroke, diperoleh kinerja model yang lebih baik dibandingkan melakukan klasifikasi pada data stroke yang tidak diseimbangkan dengan SMOTE.


Stroke is one of the diseases with the high risk of death and disability. Stroke generally can be classified into two types, namely ischemic stroke and hemorrhagic stroke. A quick and accurate stroke classification is needed to find the right treatment to prevent a dangerous effect on the stroke patients. In this study, the stroke classification was applied using a machine learning approach. The data used in this study is stroke data that consists of laboratory examinations. The data consists of various laboratory examination components, therefore, it might be possible that some of the components are less relevant and has less informative related in classifying stroke. If the data is not well handled, it might affect the performance and computation time of the model in classifying stroke. Therefore, in this study, Random Forest (RF) with Recursive Feature Elimination (RFE) method is used to classify the stroke data. The result showed that by applying the method in classifying several amounts of features obtained from the feature selection results has better performance rather than classifying the method using all features in stroke data. Moreover, based on applying this method, the result showed that the model has better performance in classifying ischemic stoke class data but not good enough in classifying hemorrhagic stroke class data. This result might occur because the proportion of numbers the ischemic stroke more than hemorrhagic stroke class data. Therefore, the handling method is needed to obtain optimal model performance in classifying ischemic stroke and hemorrhagic stroke class data. In this study, Synthetic Minority Oversampling Technique (SMOTE) is applied to balance the two classes of stroke data so optimal performance of the classification model can be obtained. Based on the application of the RF with RFE methods and SMOTE in the classification of stroke data, better model performance is obtained compared to classifying the stroke data that is not balanced with SMOTE.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fariz Muhammad Putra Fajar
"

Polusi udara merupakan permasalahan krusial di Jakarta yang dapat berdampak pada berbagai sektor. Karena itu, penelitian ini mengembangkan model spasial-temporal kualitas udara di Jakarta menggunakan machine learning sebagai upaya manajemen kualitas udara yang efektif. Penelitian ini menggunakan PM2.5 sebagai variabel dependen dan kondisi meteorologi sebagai prediktor. Data PM2.5 diekstrak dari laman Jakarta Rendah Emisi sedangkan data meteorologi diekstrak dari laman Open Weather Map menggunakan API. Data yang terkumpul akan dirata-ratakan berdasarkan 4 interval waktu (00:00–05:00, 06:00–11:00, 12:00–17:00, dan 18:00–23:00) dan dua musim (kemarau dan hujan). Kemudian, data akan diinterpolasi dengan menggunakan Kriging interpolation. Hasil interpolasi akan digunakan sebagai input untuk model machine learning dengan menggunakan algoritma Random Forest (RF) dan XGBoost. Secara umum, algoritma RF memberikan performa yang lebih baik dilihat dari rendahnya nilai RMSE, MAE, dan MAPE yang dihasilkan. Selanjutnya, output machine learning digunakan untuk memetakan konsentrasi PM2.5 di Jakarta. Pemetaan tersebut menunjukan konsentrasi PM2.5 pada musim kemarau cenderung lebih tinggi daripada musim hujan yang disebabkan oleh proses washing out. Pada musim kemarau, konsentrasi PM2.5 pada malam hingga pagi bernilai lebih tinggi daripada siang hari yang disebabkan oleh rendahnya tinggi lapisan pencampuran udara yang membatasi pergerakan polutan udara. Sedangkan pada musim hujan, konsentrasi PM2.5 yang tinggi dipengaruhi oleh curah hujan yang rendah dan kelembapan yang tinggi. Selain itu, Kota Administrasi Jakarta Utara memiliki konsentrasi yang relatif lebih rendah dibandingkan kota administrasi lainnya akibat angin laut yang memicu dispersi polusi udara.


Air pollution is a crucial issue in Jakarta that can have impacts on various sectors. Therefore, this research develops a spatial-temporal model of air quality in Jakarta using machine learning as an effort for effective air quality management. This study uses PM2.5 as the dependent variable and meteorological conditions as predictors. PM2.5 data is extracted from the Jakarta Rendah Emisi website, while meteorological data is extracted from the Open Weather Map using an API. The collected data will be averaged based on four time intervals (00:00–05:00 a.m.; 6:00–11:00 a.m; 12:00–5:00 p.m; 6:00pm–11:00pm) and two seasons (dry and rainy). Then, the data will be interpolated using Kriging interpolation. The interpolation results will be used as input for the machine learning model using the Random Forest (RF) and XGBoost algorithms. The RF algorithm provides better performance with low values of RMSE, MAE, and MAPE. Furthermore, the output of the machine learning model is used to map the PM2.5 concentrations in Jakarta. The mapping shows that PM2.5 concentrations during the dry season tend to be higher than during the rainy season, due to the washing out process. During the dry season, PM2.5 concentrations are higher at night, due to low mixing layer height that restricts pollutants movement. During the rainy season, high PM2.5 concentrations are influenced by low rainfall and high humidity. In addition, the North Jakarta area has a relatively lower concentration compared to other area due to wind induced by the coastline which trigger the spread of air pollution.

"
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aurel Salsabila Shofy
"Popularitas K-pop tidak hanya di negaranya sendiri, namun juga di luar negeri. Beberapa penelitian tentang karakter musik telah dilakukan untuk melihat bagaimana karakter lagu-lagu populer, namun belum ada yang membahas mengenai K-pop. Karakter musik dapat diketahui dengan menggunakan pendekatan music mining, seperti dengan Random Forest yang dianggap sebagai metode klasifikasi paling akurat dibandingkan dengan metode lainnya. Oleh karena itu, penelitian ini bertujuan untuk menemukan karakter lagu-lagu K-pop populer dengan memanfaatkan hasil ekstraksi fitur audio dan ekstraksi lirik lagu sebagai input untuk membangun model klasifikasi Random Forest. Lagu-lagu K-pop yang dikumpulkan sebanyak 195 lagu dari daftar putar “K-Pop ON! (온)” dibagi menjadi 117 data untuk training dan 68 data untuk testing. Fitur audio yang diekstraksi dalam penelitian ini terdiri dari danceability, energy, loudness, mode, acoustic, instrumental, liveness, dan valence. Selain itu, lirik diekstraksi dan dikelompokkan menjadi 8 kelompok topik yang juga dijadikan sebagai input model. Model yang dihasilkan menunjukkan bahwa karakter lagu-lagu K-pop populer cenderung membawakan perasaan bahagia dan energi yang tinggi, cocok untuk digunakan menari, serta membahas mengenai interaksi antar individu atau tindakan seseorang. Evaluasi model menunjukkan akurasi model yang cukup baik dengan nilai accuracy sebesar 61,53% dan ketepatan model yang cukup baik dengan nilai precision 63,82%, serta sensitivitas model yang cukup baik dengan nilai recall 69,76%. Fitur yang paling banyak berkontribusi dalam model adalah valence, sedangkan fitur yang paling sedikit berkontribusi adalah topic 3.

The popularity of K-pop is not only happening in its own country, but also abroad. Some research on music character has been done to see how the character of popular songs is, but no one has studied K-pop’s character. Music character can be known by using music mining approaches, such as Random Forest which is considered the most accurate classification method compared to other methods. Therefore, this research aims to find the character of popular K-pop songs by utilizing the results of audio feature extraction and song lyrics extraction as input to build a Random Forest classification model. The 195 K-pop songs collected from the “K-Pop ON! (온)” playlist are divided, where 117 data for training and 68 data for testing. The audio features extracted in this study consist of danceability, energy, loudness, mode, acoustic, instrumental, liveness, and valence. In addition, the lyrics are extracted and clustered into 8 topic groups which were also used as model input. The resulting model shows that the characters of popular K-pop songs tend to bring feelings of happiness and high energy, are suitable for dancing, and describe the interaction between individuals or actions of a person. The model’s evaluation shows that the model’s accuracy is quite good with an accuracy value of 61.53%, the model’s precision is quite good with a precision value of 63.82%, and the model’s sensitivity is quite good with a recall value of 69.76%. The most contributing feature in the model is valence, while the least contributing feature is topic 3."
Depok: Fakultas Teknik Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Hafizh As Ad
"Program pemerintah perihal produksi satu juta barel minyak pada tahun 2030 harus didukung oleh berbagai sarana yang menunjang peningkatan, seperti contohnya kapal AHTS (Anchor Handling Tug & Supply) yang banyak membantu berbagai operasi di hulu migas. Bahan bakar mendapati persentase 50%-70% dari keseluruhan biaya operasional harian, maka dari itu diperlukan upaya untuk memprediksi konsumsi bahan bakar sebagai langkah untuk penghematan biaya. Metode statistik konvensional kurang akurat untuk memprediksi faktor eksternal dalam konsumsi bahan bakar seperti tinggi gelombang dan kecepatan angin saat berlayar. Black box model digunakan untuk memprediksi hal tersebut dan dipilih tiga algoritma machine learning yang banyak digunakan untuk dibandingkan, yaitu Artificial Neural Network (ANN), Extreme Gradient Boost (XGB), Random Forest (RF). Uji Ordinary Least Square (OLS) digunakan untuk mengetahui apakah setiap variabel independen memiliki signifikansi terhadap variabel dependen setelah itu dilakukan normalisasi data dengan metode min max. Data dibagi menjadi data training dan data testing dengan pembagian 70% dan 30%. Dilakukan evaluasi dengan empat matriks evaluasi diantaranya MSE,RMSE,MAE, dan MAPE. Didapati hasil terbaik dari Algoritma Random Forest dengan hasil evaluasi berturut-turut pada data training 0.04; 0.21 ;0.04; dan 0.03%. Sedangkan pada prediksi data testing, yaitu 0.41; 0.64; 0.04; dan 0.11%. Selanjutnya dibuat prototipe program sederhana berbasis Google Spreadsheet untuk memudahkan pengguna memprediksi data.

The Indonesia government's program to achieve one million barrels of oil production by 2030 requires support from various facilities that contribute to the enhancement, such as AHTS (Anchor Handling Tug & Supply) essels that play a significant role in various upstream oil and gas operations. As fuel accounts for 50%-70% of the total daily operational costs, efforts are needed to predict fuel consumption as a cost-saving measure. Conventional statistical methods are less accurate in predicting external factors affecting fuel consumption, such as wave height and wind speed during sailing. A black-box model is employed to predict these factors, and three widely used machine learning algorithms, namely Artificial Neural Network (ANN), Extreme Gradient Boost (XGB), and Random Forest (RF), are selected for comparison.Ordinary Least Squares (OLS) test is utilized to determine the significance of each independent variable on the dependent variable, followed by data normalization using the min-max method. The data is divided into training and testing sets, with a distribution of 70% and 30%, respectively. Evaluation is performed using four evaluation metrics: MSE, RMSE, MAE, and MAPE. The best results are obtained from the Random Forest algorithm, with consecutive evaluation results on the training data being 0.04, 0.21, 0.04, and 0.03%. For the testing data prediction, the results are 0.41, 0.64, 0.04, and 0.11%. Subsequently, a simple program prototype based on Google Spreadsheet is developed to facilitate users in predicting data.
"
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anugrah Indah Lestari
"Kebakaran hutan dan lahan merupakan bencana yang memiliki dampak negatif dalam berbagai sektor. Identifikasi area bekas terbakar diperlukan dengan cepat untuk mengendalikan kebakaran hutan dan lahan. Penginderaan jauh merupakan teknologi yang umum digunakan untuk identifikasi area bekas terbakar, namun tidak banyak penelitian terkait kombinasi data penginderaan jauh optis dan SAR untuk identifikasi area bekas terbakar. Di samping itu, data penginderaan jauh SAR memiliki keunggulan sebagai teknologi yang dapat digunakan dalam berbagai kondisi cuaca. Penelitian ini bertujuan untuk mengevaluasi model area bekas terbakar menggunakan integrasi convolutional neural network (CNN) sebagai feature extractor dan random forest (RF) sebagai pengklasifikasi dengan pendekatan feature learning pada data Sentinel-1 dan Sentinel-2. Penelitian ini menguji lima skema yaitu: (1) hanya menggunakan data penginderaan jauh optis; (2) hanya menggunakan data penginderaan jauh SAR; (3) kombinasi data penginderaan jauh optis dan SAR hanya pada polarisasi VH; (4) kombinasi data penginderaan jauh optis dan SAR hanya pada polarisasi VV; serta (5) kombinasi data penginderaan jauh optis dan SAR dual polarisasi VH dan VV. Pengujian juga dilakukan terhadap pengklasifikasi CNN, pengklasifikasi RF, dan pengklasifikasi neural network (NN). Berdasarkan hasil overall accuracy pada lokasi penelitian, metode integrasi CNN dan RF memberikan hasil terbaik pada lima skema yang diujikan dengan overall accuracy tertinggi mencapai 92%. Hal ini menunjukan potensi metode integrasi CNN dan RF untuk digunakan dalam mengidentifikasi area bekas terbakar. Hasil estimasi luas area bekas terbakar pada lokasi penelitian dengan metode integrasi CNN dan RF pada model terbaik diperoleh seluas 57.899,91 hektar

Forest and land fires are disasters that have large impacts in various sectors. Burned area identification is needed to control forest and land fires. Remote sensing is used as common technology for rapid burned area identification. However, there are not many studies related to the combination of optical and SAR remote sensing data for burned area. In addition, SAR remote sensing data has the advantage of being a technology that can be used in various weather conditions. This study aims to evaluate burned area model using the integration of Convolutional Neural Network (CNN) as a feature extractor and Random Forest (RF) as classifiers on Sentinel-1 and Sentinel-2 data. This study tests five schemes: (1) using optical remote sensing data; (2) using SAR remote sensing data; (3) combination of optical and SAR data with VH polarization only; (4) combination of optical and SAR data with VV polarization only; and (5) combination of optical and SAR data with dual VH + VV polarization. The studies were also carried out on CNN classifier, RF classifier, and neural network (NN) classifier. Based on the results of the overall accuracy at the research site, the integration of CNN and RF method gave the best results in the five schemes tested with the highest overall accuracy reaching 92%. This shows the potential of the CNN and RF integration method to be used in identifying burned areas. The estimation result of the burned area at the research site using the best model of CNN and RF integration method is ​​57,899.91 hectares"
Depok: Fakultas Teknik Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Anindito Izdihardian Wibisono
"Pada tahun 2020, nilai customer satisfaction index (CSI) PT XYZ yang mempresentasi- kan kepuasan konsumen XYZ berjumlah 83.9. Angka ini gagal mencapai target PT XYZ di tahun tersebut yaitu 87, dan turun dari tahun sebelumnya yaitu 86,5 di tahun 2019. Berdasarkan pengambilan data, diketahui bahwa XYZ mengelola aduan konsumen hanya melalui Twitter. Dari ribuan tweet yang diterima akun resmi customer care PT XYZ (@XYZCares) tiap bulan di Twitter, diperkirakan hanya 1-2% yang dideteksi sebagai aduan dengan proses pengawasan manual. Penelitian ini merancang solusi dua langkah berupa implementasi social media listening dalam bentuk sentiment analysis dan topic modelling, untuk mengetahui isu dalam tweet aduan kepada XYZ. Dataset berupa kum- pulan tweet yang menyebutkan @XYZCares pada kurun waktu 1 Januari 2020 - 31 Desember 2020. Data di-scrape dari Twitter menggunakan script Python. Hasil evaluasi secara cross-validation menunjukkan akurasi rerata sentiment analysis dengan algoritme SVM lebih akurat (77%) untuk kasus ini dibandingkan algoritme RF (75%). Untuk task pemodelan topik, algoritme LDA menghasilkan klaster topik sejumlah 4 dengan rerata TPC sebesar 80%. Diketahui bahwa topik yang dominan adalah isu korupsi dan suap di badan PT XYZ. Dengan mempertimbangkan penemuan tersebut, saran yang dapat diberi- kan berdasarkan penelitian ini adalah memberhentikan staf yang diduga terlibat dalam isu-isu tersebut, serta menerapkan good corporate governance berupa aspek pengawasan dan pencegahan korupsi.

The customer satisfaction index (CSI) for the year 2020 is calculated at 83.9. This value fails to reach the company’s target for the year at 87 and is lower than the CSI value for 2019 at 86.5. Data acquired from the company shows that consumer complaints are ac- cepted and processed only through Twitter. It is estimated that of the thousands of tweets processed by PT XYZ’s official customer care account (@XYZCares) each month, only 1-2% of the tweets are considered complaints based on manual searching and classifica- tion. This research proposes a two-step solution by implementing social media listening in the form of sentiment analysis and topic modelling, to detect the most frequent issues addressed to XYZ. The dataset consists of tweets created from January 1st, 2020, to De- cember 31st, 2020 which mentioned @XYZCares. The tweets were scraped from Twitter using Python scripts. The results of cross-validation show that for the task of sentiment analysis, SVM is a more accurate algorithm on average (77%) compared to Random For- est (75%). For the following task of topic modelling, the LDA algorithm model produced 4 topic clusters with an average TPC of 80%. The most dominant topic detected relate to allegations of bribery and corruption within PT XYZ. Taking these finds into considera- tion, this research suggests that PT XYZ immediately dismiss all staff implicated in the aforementioned cases, as well as implementing good corporate governance in the form of tighter supervision and prevention of corrupt dealings."
Jakarta: Fakultas Ilmu Komputer Universitas Indonesia, 2021
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library