Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 76 dokumen yang sesuai dengan query
cover
Harahap, Kemala Dewi
Abstrak :
Latar Belakang: Ameloblastoma merupakan tumor jinak yang berkembang lambat, bertambah besar dan bersifat invasif secara lokal pada rahang. Angka rekurensi setelah tindakan pembedahan definitif dapat mencapat 50-90% dengan tatalaksana bedah konservatif dan 17% dengan tatalaksana bedah radikal. Penelitian dilakukan menggunakan machine learning Random Forest algorithm untuk memprediksi rekurensi ameloblastoma. Tujuan Penelitian: Menganalisis faktor risiko terjadinya rekurensi ameloblastoma pasca tatalaksana bedah. Metode Penelitian: Studi retrospektif Januari 2015 – Juni 2022 pada subjek yang memenuhi kriteria inklusi. Data diambil dari rekam medis pasien baik tertulis maupun digital. Analisis variabel kategorik dengan Uji Chi-Square dan Random Forest Classification and Regression menggunakan software R dalam menentukan faktor risiko terjadinya rekurensi ameloblastoma. Faktor risiko yang paling berperan dinilai dengan Mean Decrese Gini value (MDG). Hasil: Dari 97 subjek penelitian, 36 subyek (37%) mengalami rekurensi. Hasil uji Chi-square menunjukkan 4 faktor risiko memiliki hubungan secara signifikan secara statistik, antara lain faktor risiko usia, gambaran radiografis ameloblastoma, ukuran dan perluasan ameloblastoma serta modalitas perawatan terhadap ameloblastoma. Analisis multivariat menggunakan Random Forest Algorithm dengan akurasi sebesar 90,72%. Kesimpulan: Modalitas perawatan merupakan faktor risiko dominan rekurensi ameloblastoma pada penelitian ini, diikuti oleh faktor risiko ukuran dan perluasan ameloblastoma yang disimpulkan dari nilai Mean Decrese Gini (MDG). ......Background : Ameloblastoma is one of benign tumor of jaw, slow growing characteristic, able to gain enermous size of tumor and locally invasive. Considering high rate ameloblastoma recurrance 50-90% in conservative and 17% radical surgery, research conducted to predict risk factors of ameloblastoma recurrence using Random Forest algorithm, a machine learning. Objective: To evaluate risk factors for recurrence of ameloblastoma after jaw surgical treatment. Methods: Retrospective study conducted on subjects who met the inclusion criteria in term of January 2015 - June 2022. Data collected from medical record both written and digital. Cathegorical variables taken to be analyzed using Chi-Square, Random Forest to reach the risk factors of ameloblastoma recurrence. The importance of value was defined by means Mean Decrese Gini value (MDG). Result: Subjects were 97 with 36 respondents (37%) experienced recurrence. Significant correlation between the four risk factors and recurrence of ameloblastoma analyzed using Chi-Square The risk factors were age, radiographic characteristic of ameloblastoma, size and invasion of ameloblastoma to cortical bone and soft tissue, and treatment modalities. Random Forest algorithm used to evaluate multivariate analysis with 90.72% accuracy. Conclusion: This research using Mean Decrease Gini (MDG) showed the dominant importance of treatment modality as risk factor in ameloblastoma recurrence, followed by size and its invasiveness to soft tissue surrounding.
Jakarta: Fakultas Kedokteran Gigi Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Esti Latifah
Abstrak :
ABSTRAK
Klasifikasi merupakan proses pengelompokan suatu himpunan data ke kelas-kelas yang sudah ada sebelumnya. Pada umumnya, himpunan data dibagi menjadi dua bagian, yaitu training data dan testing data. Dibutuhkan suatu metode klasifikasi yang dapat mengelompokkan training data dan testing data ke dalam suatu kelas dengan tepat. Sering kali metode klasifikasi hanya dapat mengelompokkan training data dengan tepat saja, namun tidak demikian untuk testing data. Artinya, model yang terbentuk tidak cukup stabil atau model tersebut mengalami overfitting. Secara umum, overfitting merupakan kondisi saat akurasi yang dihasilkan pada training data cukup tinggi, namun cenderung tidak mampu memprediksi testing data. Penentuan metode klasifikasi yang rentan terhadap overfitting perlu dipertimbangkan. Random forest merupakan salah satu metode klasifikasi yang rentan terhadap masalah overfitting. Hal tersebut sekaligus menjadi salah satu kelebihan dari metode random forest. Oleh karena itu, pada tugas akhir ini akan dibahas metode random forest serta mengaplikasikannya pada data penderita penyakit Parkinson yang dibagi berdasarkan 2 sub-tipe, yaitu tremor dominant TD dan postural instability gait difficulty PIGD dominant. Selanjutnya, dari data tersebut diperoleh hasil akurasi model yang dihasilkan dalam mengklasifikasi training data, yaitu sekitar 94,25 . Sementara itu, akurasi metode ini dalam melakukan klasifikasi pada data yang tidak terkandung dalam membentuk model sebesar 94,26.
ABSTRACT
Classification is the process of grouping a set of data into pre existing classes. In general, the data set is divided into two parts. There are training data and testing data. It takes a classification method that can classify both training data and testing data of its class appropriately. However, some of the classification methods only fit in training data, but it can not apply in testing data. It means that the model is unstable or the model occurs overfitting. In general, overfitting is a condition when the model too fit in training, but unable to predict testing data. In other words, the accuracy of predicting the testing data is decreasing. Therefore, the determination of classification methods that are vulnerable to overfitting need to be considered. Random forest is one of the classification methods that is vulnerable to overfitting. It is also one of the advantages of the random forest method. Therefore, in this final project will be discussed random forest method and applying it to the data of Parkinson 39 s disease patients that is divided by 2 sub types. There are dominant tremor TD and postural instability gait difficulty PIGD dominant. Furthermore, from the data obtained the results of model accuracy in classifying the training data is about 94.25 . Meanwhile, the accuracy of this method in classifying the data not contained in forming a model is about 94.26.
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aziz Setia Aji
Abstrak :
ABSTRAK
Badan Meteorologi Klimatologi dan Geofisika (BMKG) memiliki tugas pengamatan terhadap magnet bumi yang tersebar di Indonesia. Sensor magnetik bumi BMKG menghasilkan output data real-time. Penelitian ini berfokus pada model predictive maintenance pada sensor magnetik bumi berdasarkan output data sensor. Output data yang dihasilkan adalah dalam bentuk format delimited-space sehingga mudah untuk diproses. Komponen magnetik yang digunakan dalam penelitian ini adalah data komponen total magnet bumi (F) dari sensor. Pemrosesan data menggunakan bahasa pemograman python dan algoritma yang digunakan adalah metode random forest regression dengan membandingkan perbedaan nilai yang dihasilkan dengan data Indoesian Geomagnetic Maps for Epoch 2015.0 untuk kemudian dibuatkan model prediksi terhadap waktu. Proses tersebut digunakan untuk mengetahui apakah data yang dihasilkan masih dalam toleransi atau tidak. Tahapan dalam penelitian ini mulai dari pengumpulan data, pre-processing data, pembuatan model, hingga pengujian model dan validasi terhadap model. Penelitian ini menghasilkan estimasi waktu pemeliharan sebesar 14 hari pada data baseline nilai F dan sebesar 3 hari pada data delta F (ΔF).
ABSTRACT
The Meteorological, Climatological, and Geophysical Agency (BMKG) has the task of observing the earth magnets spread across Indonesia. Earth magnetic sensor of BMKG delivers real-time data output. The study focuses on the predictive maintenance model on the earth's magnetic sensor based on sensor data output. The resulting data output is in the form of delimited-space format so it is easy to process. The magnetic component used in this study is data on the earth's total magnetic component (F) from the sensor. Data processing uses python programming language and the algorithm used is a random forest regression method by comparing the value difference generated with the Indoesian Geomagnetic Maps for Epoch 2015.0 data for later created predictive models against time. The process is used to determine whether the resulting data is still in tolerance or not. The stages in this study range from data collection, pre-processing data, create model, model testing, and model validation. The study resulted in a 14-day maintenance time estimate of the baseline data F-value and 3-day in the delta F (ΔF) data.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Iqbal
Abstrak :
Penelitian ini bertujuan untuk menganalisis faktor mana yang paling penting dalam memprediksi freelancer berkualitas tinggi. Krisis dan pandemi covid memaksa perusahaan melakukan efisiensi biaya sehingga merekrut freelancer online menjadi solusi yang bisa dipertimbangkan. Rekrut freelancer online cukup mudah, kamu tinggal masuk ke website freelance marketplace, lalu pilih freelancer dan pekerjaan yang kamu inginkan, lalu ajukan penawaran. Namun, perusahaan perlu merekrut pekerja lepas berkualitas tinggi tetapi berbiaya rendah untuk efisiensi biaya. Artinya, perusahaan perlu merekrut freelancer yang memiliki kualitas top-rated tapi belum top-rated. Berbeda dengan penelitian sebelumnya, penulis menggunakan variabel Top Rated sebagai dependen yang mencerminkan kualitas tinggi dan menganalisisnya menggunakan algoritma Random Forest dan Logistic Regression. Dataset tersebut berisi 5.825 sample size yang diunduh dari Kaggle.com. Dari penelitian sebelumnya, Similar-Job-Experience dan Past-Rating merupakan faktor terpenting yang mencerminkan kualitas. Sementara itu, dalam penelitian ini, atribut totalRevenue, BilledAssignments, dan totalHourlyJobs masing-masing menjadi variabel terpenting yang berhasil memprediksi 30 freelancer Top Rated di masa depan. Temuan ini berguna bagi perusahaan untuk mempertimbangkan faktor-faktor ini dalam merekrut pekerja lepas. Sepengetahuan penulis, saat ini penelitian yang membahas tentang kriteria freelancer yang menggunakan machine learning masih terbatas ......This study aims to analyze which factors are most important in predicting high-quality freelancer. The crisis and the covid pandemic forced companies to make cost efficiency so that recruiting online freelancers was a solution that could be considered. Online recruitment is quite easy, you just have to go to the freelance marketplace website, then select the freelancer and job you want, then offer freelance. However, companies need to hire high-quality but low-cost freelancers for cost efficiency. This means that companies need to recruit freelancers who are top-rated but not yet top-rated. In contrast to previous studies, the author uses the Top Rated variable as the dependent which reflects high quality and analyzes it using the Random Forest and Logistic Regression algorithms. The dataset contains 5,825 samples downloaded from Kaggle.com. From previous research, Similar-Job-Experience and Past-Rating are the most important factors that reflect quality. Meanwhile, this study, the attributes of totalRevenue, BilledAssignments, and totalHourlyJobs became the most important variables that succeeded in predicting the 30 Top Rated freelancers in the future. This finding is useful for companies to consider these factors in recruiting freelancers. To the author's knowledge, currently researching the criteria for freelancers who use machine learning is still limited.
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ramlah
Abstrak :
Prediksi dengan model mesin learning regresi telah banyak digunakan untuk penelitian. Salah satu model mesin learning yang digunakan untuk prediksi adalah random forest regressor. Mesin learning membutuhkan data training untuk mempelajari pola dan hubungan antar data. Model regressor yang sedangkan dikembangkan dalam bidang medis saat ini adalah model yang dapat memprediksi dosis pada perencanaan IMRT. Data perencanaan dalam format DICOM (format asli data) dieksport ke bentuk CVS (Comma Separated Values). Kemudian data dibagi menjadi data training dan testing yang dipilih secara random. Algoritma yang digunakan untuk memprediksi adalah random forest yang akan di training menggunakan 7-fold validation dan kemudian model akan di uji dengan data baru yaitu data testing yang belum pernah dilihat oleh model. Data yang dievaluasi yaitu parameter untuk mendapat HI (Homogenety Index) untuk organ target, dan dosis mean dan max untuk OAR (Organ At Risk). Random forest mampu memprediksi nilai sebenarnya dengan kesalahan dievaluasi menggunakan MAE pada fitur PTV D2 (0,012), D50 (0,015) dan D98 (0,018) serta pada fitur OAR (mean dan  max) paru kanan (0,104 dan 0,228), paru kiri (0,094 dan 0,27), jantung (0,088 dan 0,267), spinal cord (0,069 dan 0,121) dan (V95) Body (0,094). ...... Predictions with machine learning regression models have been widely used for research. One of the machine learning models used for prediction is the random forest regressor. Machine learning requires training data to determine patterns and relationships between data. Nowadays, the regressor model that being developed in the medical field is able to predict dose in IMRT planning. Planning data in DICOM format (original data format) was exported to CVS (Comma Separated Values) format. Then, the data was divided into training and testing data which were selected randomly. The algorithm used to predict is a random forest that was trained using 7-fold validation and the model was evaluated with new data, namely testing data that have not been seen by the model. The evaluated data are parameters to obtain HI (Homogenety Index) for target organs, and mean and max doses for OAR (Organ At Risk). Random forest was able to predict the true value with errors and it was evaluated using MAE for PTV D2 (0,012), D50 (0,015) and D98 (0,018), for OAR (mean and  max) right lung (0,104 and 0,228), left lung (0,094 and 0,27), heart (0,088 and 0,267), spinal cord (0,069 and 0,121) and (V95) Body (0,094).
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Elok Lestari Paramita
Abstrak :
Kawasan permukiman yang dibangun perlu diminimalkan di kawasan rawan bencana untuk menghindari resiko tinggi terhadap bencana. Pada Kecamatan Cugenang, Kabupaten Cianjur telah terjadi gempabumi pada 21 November 2022. Bencana gempabumi dapat menghasilkan dampak sekunder lainya seperti longsor. Bencana gempabumi dan dampak sekunder lainnya seperti longsor dapat berdampak pada perubahan lahan permukiman dan kesesuaian permukiman. Gempabumi dengan sumber patahan Cugenang menjadi parameter baru dalam aspek kesesuaian permukiman, dimana sebelumnya tidak ada faktor bahaya gempabumi pada wilayah patahan tersebut. Penelitian ini bertujuan menganalisis perubahan lahan permukiman sebelum dan setelah gempabumi di Kecamatan Cugenang. Serta menganalisis perubahan spasial tutupan lahan permukiman tahun 2008, 2013, 2018, 2022 serta prediksi di tahun 2031. Lalu mensintesa kesesuaian lahan permukiman pasca gempabumi sehubungan lahan permukiman prediksi pada tahun 2031 di Kecamatan Cugenang. Klasifikasi peta tututupan lahan untuk melihat perubahan tahun 2008, 2013, 2018, 2022 dan 2023 menggunakan platform GEE dengan metode klasifikasi terbimbing Random Forest. OA pada klasifikasi tutupan lahan untuk tahun 2008-2023 di atas 90%. Prediksi tutupan lahan dibuat menggunakan metode CAMC. Pada proses pengolahan pemodelan prediksi, didapatkan Kappa 85% untuk tutupan lahan 2018 simulasi dan aktual dan Kappa 88% untuk tutupan lahan 2023 simulasi dan aktual. Driving factor yang digunakan untuk pemodelan prediksi yaitu variabel jarak dari jalan, jarak dari sungai, jarak dari POI dan lereng. Peta kesesuaian permukiman dibuat dengan variabel jarak dari sungai, jarak dari jalan, lereng, jenis tanah, kawasan potensi longsor, dan peta bahaya gempabumi. Untuk constraint dalam pengolahan kesesuaian lahan menggunakan zona terlarang dari peta bahaya gempabumi, sempadan sungai dan kawasan fungsi lindung. Untuk menghasilkan peta kawasan potensi longsor dilakukan pengolahan menggunakan metode indeks storie. Permukiman tahun 2023 dan 2031 di seluruh desa masih ada permukiman yang masuk di wilayah sangat tidak sesuai dan juga kurang sesuai. Tutupan lahan permukiman sebelum dan setelah gempa Cugenang, yaitu tutupan lahan tahun 2022 dan tahun 2023 terjadi peningkatan sebesar 43,863 hektar, atau sebesar 7,011%. lahan terbangun/permukiman mengalami peningkatan dari tahun 2008 hingga 2023, sehingga prediksi di tahun 2031 juga mengalami peningkatan pada lahan terbangun/permukiman. Wilayah kesesuaian permukiman dengan 5 variabel terhadap wilayah kesesuaian dengan 6 variabel yang menggunakan variabel zona bahaya gempabumi terlihat terdapat perbedaan. Wilayah kesesuaian permukiman dengan variabel gempabumi mengalami kenaikan persentase pada wilayah N (Tidak Sesuai) dan S2 (Cukup Sesuai), serta terjadi penurunan pada S1 (Sangat Sesuai) dan S3 (Sesuai Marjinal). Hal itupun selaras dengan lahan permukiman di tahun 2023 dan 2031 terhadap wilayah kesesuaian permukiman. ......Settlement areas that are built need to be minimized in disaster-prone areas to avoid high risk of disasters. In Cugenang Sub-district, Cianjur Regency, an earthquake occurred on November 21, 2022. Earthquake disasters can lead to other secondary impacts such as landslides. Earthquake disasters and other secondary impacts such as landslides can have an impact on changes in settlement land and settlement suitability. The earthquake with the origin of the Cugenang fault becomes a new parameter in the aspect of settlement suitability, where previously there was no earthquake hazard factor in the fault area. This research aims to analyze changes in settlement areas before and after the earthquake in Cugenang Sub-district. As well as analyzing spatial changes in residential land cover in 2008, 2013, 2018, 2022 and predictions in 2031. Then synthesize the suitability of post-earthquake settlement areas in relation to the predicted settlement areas in 2031 in Cugenang Sub-district. Classification of land cover maps to identify changes in 2008, 2013, 2018, 2022 and 2023 using the GEE platform with the Random Forest supervised classification method. OA on land cover classification for 2008 - 2023 is above 90%. Land cover predictions were made using the CAMC method. In the prediction modeling processing, 85% Kappa was obtained for 2018 simulated and actual land cover and 88% Kappa for 2023 simulated and actual land cover. Driving factors used for prediction modeling are variables of distance from road, distance from river, distance from POI and slope. Settlement suitability map is made with variables of distance from river, distance from road, slope, soil type, landslide potential area, and earthquake hazard map. For constraint in land suitability utilizes, forbidden zone from earthquake hazard map, river border and protected function area. To produce a map of potential landslide areas, processing is done using the storie index method. Settlements in 2023 and 2031 in all villages still have settlements that are included in very unsuitable areas and also less suitable. Settlement land cover before and after the Cugenang earthquake, namely land cover in 2022 and 2023 increased by 43.863 hectares, or by 7.011%. Built-up land/settlement increased from 2008 to 2023, so the prediction in 2031 also increased in built-up land/settlement. The area of suitability of settlements with 5 variables compared to the area of suitability with 6 variables using the earthquake hazard zone variable shows a difference. The area of settlement suitability with the earthquake variable increased in percentage in areas N (Unsuitable) and S2 (Moderately Suitable), and decreased in S1 (Very Suitable) and S3 (Marginally Suitable). This is in line with the settlement land in 2023 and 2031 towards the area of settlement suitability.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Saragih, Glori Stephani
Abstrak :
ABSTRAK
Pada tahun 1994, Turki mengalami krisis keuangan yang sangat berpengaruh negatif terhadap sektor perbankan, sehingga banyak bank yang dinyatakan bangkrut. Kebangkrutan bank memiliki dampak yang besar pada sektor riil dan rumah tangga. Oleh karena itu, penting untuk memprediksi kebangkrutan bank. Tahun 2009, Boyacioglu, Kara dan Baykan telah memprediksi kebangkrutan bank di Turki pada periode 1994-2004 dengan menggunakan CAMELS sebagai variabel prediktor dan Artificial Neural Network, Support V ector Machine serta metode statistik peubah ganda sebagai metode klasifikasi. Namun, pada penelitian ini akan dibuat pembaruan dengan menggunakan random forest. Dari hasil yang didapat, random forest memiliki akurasi 100 performa training dan 94 performa testing dengan mengunakan 20 rasio. Salah satu kelebihan random forest adalah perhitungan variabel penting, apabila dibentuk model dengan menggunakan variabel prediktor terpilih didapat hasil 100 performa training dan 96 performa testing dengan menggunakan 6 rasio. Jika dibandingkan dengan model yang digunakan pada makalah Boyaciaglu, Kara dan Baykan 2009, meskipun pada performa testing random forest tidak memiliki akurasi yang lebih tinggi dari Learning Vector Quantization dengan performa testing 100, namun tingkat akurasinya tidak terlalu berbeda jauh dan random forest tidak memerlukan normalisasi. Pada penelitian ini didapat enam variabel yang paling penting, yaitu: CA2, E1, CA3, SMR1, SMR2 dan E2.
ABSTRACT
In 1994, there was a financial crisis in Turkey. Many banks were declared failed because of the negative impact from the crisis. The failure of individual banks has a huge impact on the real sector and households. Therefore, it is important to predict bank failure. The 2009, Boyacioglu, Kara, and Baykan had predicted bank failures in Turkey, during the period 1994 2004 using CAMELS as a predictor variable and Artificial Neural Network, Support Vector Machine, multivariate statistical methods as classifier method. However, in this research we will make novelty by using random forest. Based on our results, random forest has accuracy 100 training performance and 94 testing performance with used 20 ratios. One of advantage in random forest is variable importance measure, if we build model again with variable predictor selection, the result are accuracy 100 training performance and 96 testing performance with used 6 ratios. If we compare with Boyacioglu, et.al 2009, even random forest does not have accuracy more than Learning Vector Quantization with 100 testing performance, but its accuracy is not far away and doesn rsquo t need normalization. In this research we got CA2, E1, CA3, SMR1, SMR2 and E2 are six most important variables.
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fajar Restu Illahi
Abstrak :
Metode well-logging merupakan salah satu metode yang digunakan oleh geofisikawan dalam mendelineasi zona prospek hidrokarbon yang meliputi informasi lapisan dan zona penyebaran hidrokarbon. Akan tetapi dalam data well-logging acapkali nilai well-logging hilang atau tidak lengkap pada interval kedalaman tertentu akibat masalah operasional dalam proses pengeboran. Sehingga untuk mengatasi hal ini diperlukan suatu pendekatan yang dapat dilakukan dengan cepat dan tepat dengan menggunakan metode data mining. Berdasarkan komponen log yang lengkap, nilai log yang hilang dapat diprediksi dengan salah satu algoritma, yaitu regresi random forest. Algoritma ini bekerja dengan cara membuat ensemble pohon keputusan yang dimodelkan dan dilatih dengan parameter yang disesuaikan dan dikombinasikan dengan antarmuka pengguna grafis. Pengombinasian antarmuka grafis dilakukan dalam mempermudah pengguna dalam mengoperasikan dan menginterpretasikan hasil prediksi. Adapun log yang diprediksi merupakan log gamma ray (GR), log bulk density (RHOB), log neutron (NPHI), log sonic (DT), dan log deep resistivity (ILD) pada wilayah kerja Cekungan Sengkang dengan divariasikan prediksi antara per formasi dan blind well. Hasil prediksi yang dihasilkan regresi random forest dalam metode data mining menunjukkan hasil yang akurat untuk log porositas (densitas, sonic, dan neutron) dengan rentang akurasi dari 89% hingga 94%. Sedangkan untuk log lainnya seperti log gamma ray dan resistivitas diperlukan penyusunan parameter dan data latih kembali. ......Well-logging method is one of the methods used by geophysicists in delineating the hydrocarbon prospect zone which includes information about layer and distribution zone of hydrocarbons. However, in well-logging data, some values ​​are often missing or incomplete at certain depth intervals due to operational problems in the drilling process. To overcome this we need an approach that can be done quickly and precisely by data mining methods. Based on the complete log component, the missing log value can be predicted using one of the algorithms, namely random forest regression. This algorithm works by creating an ensemble of modeled and trained decision trees with adjusted parameters and combined with a graphical user interface. The combination of a graphical interface is done to make it easier for users to operate and interpret the predicted results. The predicted logs are gamma ray log (GR), bulk density log (RHOB), neutron log (NPHI), sonic log (DT), and deep resistivity log (ILD) in the Sengkang Basin area with varied predictions between formation and blind well. Prediction results generated by random forest regression in the data mining method show accurate results for porosity logs with an accuracy range from 89% to 94%. Meanwhile, for other logs such as gamma ray and resistivity logs, it is necessary to compile parameters and data train.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anatasya Oktaviani Handriati
Abstrak :
Stunting merupakan kondisi yang terjadi pada balita yang mengakibatkan gagal tumbuh akibat dari kurangnya pemenuhan gizi yang diterima di masa kandungan dan setelah bayi lahir. Prevalensi stunting adalah persentase balita yang mengalami kasus stunting dibandingkan dengan jumlah anak balita di daerah tersebut. WHO mengkategorikan prevalensi stunting menjadi 4 kategori yaitu low untuk prevalensi stunting < 20, medium untuk 20 ≤ prevalensi stunting < 30, high untuk 30 ≤ prevalensi stunting < 40 dan very high, untuk prevalensi stunting ≥ 40. Klasifikasi prevalensi stunting dilakukan untuk melihat faktor-faktor apa saja yang mempengaruhi tinggi rendahnya prevalensi stunting pada daerah tersebut. Random forest dan TabNet digunakan sebagai model klasifikasi. Sebelum melakukan klasifikasi, data dinormalisasikan terlebih dahulu jika menggunakan model random forest dan tidak dinormalisasikan jika menggunakan model TabNet. Kemudian pada data training dilakukan SMOTE dampak dari imbalance data. Hyperparameter pada random forest menggunakan Optuna. Model yang sudah dibuat, dievaluasi menggunakan confusion matrix dengan melihat nilai precision, recall, F1- Score, dan accuracy. Model dibandingkan dengan nilai rata-rata akurasi berdasarkan pembagian data training dan data testing di 70:30, 80:20 dan 90:10. Selain itu, dibandingkan hasil klasifikasi antara model random forest dan TabNet. Nilai rata-rata akurasi yang paling tinggi untuk random forest adalah 51% dan TabNet adalah 44,7% saat kedua model di proporsi data 70:30. Model yang paling terbaik adalah TabNet dengan akurasi 53% dibandingankan dengan random forest ketika random state sama dengan nol. Model TabNet memiliki bekerja optimal pada precision, recall dan F1-Score untuk target kelas low. Sedangkan model random forest bekerja optimal pada recall dan F1-Score untuk target kelas medium. Kedua model tidak bekerja dengan optimal di kelas target high dan very high. ......Stunting is a condition that occurs in toddlers, resulting in failure to grow due to insufficient nutrition during pregnancy and after birth. The prevalence of stunting is the percentage of children under five who experience stunting compared to the total number of children in that area. The World Health Organization (WHO) categorizes the prevalence of stunting into four categories: low for prevalence < 20, medium for 20 ≤ prevalence < 30, high for 30 ≤ prevalence < 40, and very high for prevalence ≥ 40. The classification of stunting prevalence is done to identify factors that influence the high or low prevalence of stunting. Random forest and TabNet are used as classification models. Before performing the classification, the data is normalized, and SMOTE is applied to the training data. The hyperparameters of models are tuned using Optuna is used. The models are evaluated using a confusion matrix by examining precision, recall, F1-Score, and accuracy. The model are compared with the average accuracy value based on the distribution of training data and testing data at 70:30, 80:20 and 90:10. In addition, classification results will be compared between random forest and TabNet models. The highest average accuracy value for random forest is 51% and TabNet is 44.7% when the two models are in the proportion of data 70:30. The best model is TabNet with 53% accuracy compared to the random forest when the random state is zero. The TabNet model has optimal work on precision, recall and F1-Score for low class targets. While the random forest model works optimally on recall and F1-Score for medium class targets. The two models do not work optimally in the high and very high target classes.
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aldyth Ardiyanto
Abstrak :
Penelitian ini membandingkan kinerja metode SARIMAX dan Random Forest dalam memprediksi harga bahan pokok di DKI Jakarta, menggunakan data harga bulanan Bawang Merah, Cabai Merah Keriting, dan Cabai Rawit Merah dari April 2021 hingga Maret 2024. Hasil penelitian menunjukkan bahwa Random Forest memiliki nilai Mean Absolute Percentage Error (MAPE) yang lebih rendah dibandingkan SARIMAX, dengan MAPE masing-masing sebesar 2,18% dan 13,43% untuk Bawang Merah, 16,59% dan 23,79% untuk Cabai Merah Keriting, serta 17,07% dan 37,38% untuk Cabai Rawit Merah. Temuan ini menunjukkan bahwa Random Forest lebih efektif dalam menangani fluktuasi harga bahan pokok, memberikan kontribusi praktis bagi pengambilan keputusan dalam manajemen rantai pasok dan kebijakan harga bahan pokok. ......This study compares the performance of the SARIMAX and Random Forest methods in forecasting commodity prices in DKI Jakarta, using monthly price data for Shallots, Red Curly Chili, and Red Cayenne Pepper from April 2021 to March 2024. The results show that Random Forest has a lower Mean Absolute Percentage Error (MAPE) compared to SARIMAX, with MAPE values of 2.18% and 13.43% for Shallots, 16.59% and 23.79% for Red Curly Chili, and 17.07% and 37.38% for Red Cayenne Pepper, respectively. These findings indicate that Random Forest is more effective in handling commodity price fluctuations, providing practical contributions to decision-making in supply chain management and commodity pricing policies.
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8   >>