Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 9 dokumen yang sesuai dengan query
Rizkiani Febrianti
Abstrak :
Estimasi parameter pada model regresi logistik pada umumnya menggunakan metode maximum likelihood dengan iterasi Newton Raphson. Pada model regresi logistik, estimasi parameter menggunakan metode maximum likelihood tidak dapat digunakan apabila ukuran sampel kecil dan proporsi kejadian sukses kecil. Permasalahan yang muncul saat ukuran sampel kecil dan proporsi sukses kecil, jika menggunakan metode maximum likelihood adalah proses iterasi yang tidak konvergen. Oleh sebab itu dalam kondisi tersebut, metode maximum likelihood tidak dapat digunakan untuk estimasi parameter. Salah satu cara untuk mengatasi ketidakkonvergenan pada iterasi tersebut adalah menggunakan modifikasi score function. Modifikasi score function dapat digunakan untuk mendapatkan estimasi parameter model regresi logistik dengan melakukan modifikasi pada fungsi likelihood. Contoh aplikasi diberikan untuk menunjukkan bahwa kemungkinan estimasi parameter model regresi logistik dengan ukuran sampel kecil dan proporsi sukses kecil menggunakan metode maximum likelihood dengan iterasi Newton Raphson memberikan hasil yang tidak konvergen dan hal ini dapat diselesaikan dengan menggunakan modifikasi score function. ......The maximum likelihood method with Newton Raphson iteration is used in general to estimate the parameter on logistic regression model. This parameter estimation using the maximum likelihood method cannot be used if the size of the sample and proportion of successful events are small. It is because the iteration process will not convergent to some point. Therefore, the maximum likelihood method cannot be used to estimate the parameter. One of the ways to resolve this convergent problem is using the score function modification. This modification is used to obtain the parameter estimation on logistic regression model by doing some modification on the likelihood function. The example of parameter estimation, using maximum likelihood method with small size of sample and proportion of successful events, is given to show may be the iteration process is not convergent and this can be solved with modification score function.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
UI - Skripsi Membership  Universitas Indonesia Library
Nur Fitriana Taslim
Abstrak :
Kejadian berulang atau kekambuhan kanker payudara bukan hanya menyerang kembali fisik, namun juga kondisi psikis pasien kanker payudara. Serangkaian pemeriksaan untuk memprediksi kemungkinan kambuh kanker payudara sangat dibutuhkan untuk mencegah terjadinya kekambuhan kanker payudara. Pemeriksaan darah lengkap merupakan salah satu rangkaian peme iksaan awal pasien kanker payudara yang relatif murah dan mudah. Belum ada penelitian sebelumnya mengenai perhitungan inter rasio pada pemeriksaan darah lengkap untuk mendiagnosis penyakit kanker, khususnya kemungkinan kambuh kanker payudara. Hasil penelitian ini diharapkan dapat membantu tenaga medis dalam memprediksi kemungkinan pasien kambuh berdasarkan klasifikasi dari hasil perhitungan inter rasio pemeriksaan darah lengkap. Data dalam penelitian ini diambil dari rumah sakit XYZ di Jakarta dengan 47 pasien. Algoritma klasifikasi yang digunakan dalam penelitian ini yaitu Classification and Regression Tree (CART) untuk mengetahui variabel yang berpengaruh dalam klasifikasi pasien kambuh dan tidak kambuh. Pada penelitian ini digunakan teknik SMOTE untuk mengatasi permasalahan data tidak seimbang. Variabel inter rasio pemeriksaan darah lengkap antara rasio dari neutrofil terhadap limfosit dan rasio dari platelet terhadap sel darah putih, inter rasio pemeriksaan darah lengkap antara rasio dari limfosit terhadap monosit dan rasio dari limfosit terhadap sel darah putih, inter rasio pemeriksaan darah lengkap antara rasio dari hemoglobin terhadap platelet dan rasio dari platelet terhadap sel darah putih, inter rasio pemeriksaan darah lengkap antara rasio dari platelet terhadap limfosit dan rasio dari hemoglobin terhadap platelet merupakan variabel yang berpengaruh dalam mendiagnosis kekambuhan dengan tingkat akurasi 93.7%, sensitivity 100%, specificity 87.5% pada training data yang sudah seimbang dengan teknik SMOTE. Selanjutnya hasil klasifikasi tersebut dikuantifikasi menggunakan metode regresi logistik untuk mengetahui seberapa besar peran masingmasing variabel dalam memprediksi kekambuhan pasien. ......Repeated events or recurrences of breast cancer not only re-attack the condition of breast cancer patients physically, but also psychologically. Diagnostics checking to predict the relapse possibility of breast cancer patients is needed to prevent the recurrence of breast cancer. Complete blood count are one of the diagnostic checking of early breast cancer patients that relatively cheap and easy. There has been no previous research on the calculation of inter-ratios for complete blood count to diagnose cancer, especially possibility relapse of breast cancer. The results of this study are expected to help medical personnel in predicting the relapse possibility of breast cancer patients based on the classification of the results of the inter ratio calculation of complete blood count. The data in this study were taken from XYZ hospital in Jakarta with 47 patients. The classification algorithm used in this study is Classification and Regression Tree (CART) to determine the effect of the variables in the classification of relapse and non-relapse patients. In this study, the SMOTE technique was used in handling imbalanced data problems. Inter ratio of complete blood tests between the ratio of neutrophils to lymphocytes and the ratio of platelets to white blood cells, inter ratio of complete blood tests between the ratio of lymphocytes to monocyte and the ratio of lymphocytes to white blood cells, inter ratio of complete blood tests between the ratio of hemoglobin to platelet and the ratio of platelet to white blood cells, and inter ratio of complete blood tests between the ratio of platelet to lymphocytes and the ratio of hemoglobin to platelet are the variables that influence in diagnosing recurrence with 93.7% accuracy rate, 100% sensitivity, and 87.5% specificity on training data that balanced using SMOTE technique. Furthermore, the results of the classification are quantified using the logistic regression method to determine how substantial the role of each variable in predicting patients relapse.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
UI - Skripsi Membership  Universitas Indonesia Library
Yumna Aqila Kaltsum
Abstrak :
Perusahaan Daerah Air Minum (PDAM) merupakan salah satu perusahaan yang berstatus Badan Usaha Milik Daerah (BUMD). BUMD adalah perusahaan milik pemerintah daerah dengan status badan hukum organisasi yang independen, yang dipimpin oleh dewan direksi yang ditunjuk oleh pejabat pemerintah daerah dengan kepemilikan mayoritas publik. Modal dari perusahaan tersebut sebagian atau sepenuhnya berasal dari pemerintah. Selain menjadi penyelenggara layanan air bersih, PDAM juga berperan dalam menyokong Pendapatan Asli Daerah (PAD), maka dalam penilaiannya, PDAM sebagai suatu perusahaan, tidak hanya dinilai dari kualitas produksi air, namun juga bagaimana kualitas pelayanan serta keuntungan yang didapatkan dari kegiatannya. Untuk mengetahui faktor-faktor apa saja yang memiliki keterkaitan dengan kinerja PDAM di Indonesia Tahun 2019, metode statistik yang dapat digunakan adalah Metode Classification and Regression Trees (CART). CART adalah suatu metode eksplorasi statistika nonparametrik untuk mengelompokkan pengamatan-pengamatan dalam data dengan kriteria yang sama berdasarkan urutan signifikansi terkait variabel prediktor dalam pembentukan kelompok kategori. Pada penilaian Status kinerja, variabel Return of Equity (ROE), Jam Oprasional Pelayanan, Tingkat Kehilangan Air, Efektivitas Penagihan, serta Tingkat Pelayanan merupakan variabel-variabel yang cukup signifikan. Selanjutnya dilakukan Analisis menggunakan Metode Regresi Logistik. Regresi Logistik digunakan untuk mengetahui seberapa besar keterkaitan variabel-variabel prediktor (X) terhadap variabel respon (Y) yang bersifat dikotomi. Analisis ini menghasilkan model Regresi Logistik. ......Regional Water Use Company (Perusahaan Daerah Air Minum/PDAM) is one of the companies with the status of Regional Owned Enterprises (Badan Usaha Milik Daerah/ BUMD). BUMD is a local government-owned company with the status of an independent legal entity, led by a board of directors appointed by local government officials with majority public ownership. The capital of the company comes partly or wholly from the government. In addition to being a clean water service provider, PDAM also plays a role in supporting Regional Original Revenue (Pendapatan Asli Daerah/PAD), so in its assessment, PDAM as a company is not only judged by the quality of water production, but also how the quality of service and the benefits it gets from its activities. To find out what factors affect the performance of PDAMs in Indonesia in 2019, a statistical method that can be used is the Classification and Regression Trees (CART) Method. CART is a nonparametric statistical exploration method to classify observations in the data with the same criteria based on the order of significance of the influence of the predictor variables in the formation of category groups. In the assessment of performance status, the variable Return of Equity (ROE), Service Operational Hours, Water Loss Levels, Billing Effectiveness, and Service Level are quite significant variables. The analysis is carried out using the Logistic Regression Method. Logistic regression is used to determine how much influence the predictor variables (X) have on the dichotomous response variable (Y). This analysis produces a Logistic Regression model.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
UI - Skripsi Membership  Universitas Indonesia Library
Paramita Ayu Pawestri
Abstrak :
Partial Least Squares Regression adalah salah satu teknik regresi yang memerhatikan pola hubungan antara variabel respon dan variabel prediktor. Teknik tersebut dapat digunakan saat terdapat korelasi tinggi antara variabel prediktor, banyaknya variabel prediktor yang melebihi jumlah observasi dan efek random pada variabel prediktor. PLSR dengan menggunakan algoritma NIPALS, membentuk komponen yang merupakan kombinasi linier berbobot dari variabel prediktor yang digunakan untuk memprediksi variabel respon dengan metode Ordinary Least Squares, dimana komponen yang terbentuk ortogonal atau tidak saling berkorelasi dan banyaknya komponen yang terbentuk akan lebih sedikit dari banyaknya variabel prediktor. ......Partial Least Squares Regression is one of technique that takes into account the pattern of relationship between response variable and predictor variables. The technique can be used when there is high correlation between predictors variables, the number of predictors variables exceed the number of observation and random effects on predictor variables. PLS using NIPALS algorithm, which is component forming a weigthed linear combination of predictor variables use to predict response variable by the method of Ordinary Least Squares, in which the component are formed orthogonal or not correlated each other and the number will be fewer than the number of predictor variables.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2012
UI - Skripsi Open  Universitas Indonesia Library
Dimas Bayu Ichsandya
Abstrak :
Tanah longsor merupakan salah satu kejadian alam paling merugikan yang terjadi setiap tahun di Kabupaten Pacitan. Penelitian ini bertujuan untuk menganalisis aspek fisik yang berperan sebagai faktor penyebab tanah longsor serta membuat analisis tingkat kerawanan tanah longsor menggunakan metode regresi logistik di Kabupaten Pacitan. Digunakan 468 titik longsor hasil inventarisasi BPBD Kabupaten Pacitan, survei lapang, dan interpretasi citra satelit yang kemudian dibagi menjadi 80% sebagai basis data uji dan 20% sebagai validasi model. Analisis probabilitas kejadian tanah longsor menggunakan nilai koefisien 14 aspek fisik menghasilkan bahwa aspek fisik berupa lereng, aspek/arah hadap lereng, curah hujan, penggunaan tanah, jenis tanah, dan litologi memiliki nilai koefisien positif. Sedangkan pada aspek fisik berupa ketinggian, topographic wetness index (TWI), profile curvature, plan curvature, jarak dari patahan, jarak dari jalan, jarak dari jalan, dan normalized difference vegetation index (NDVI) yang memiliki nilai koefisien negatif. Dihasilkan lima tingkat kerawanan tanah longsor di Kabupaten Pacitan, yaitu; sangat rendah (43,219.8 Ha), rendah (32,256.9 Ha), sedang (24,133.8 Ha), tinggi (20,590.7 Ha), dan sangat tinggi (18,787.6 Ha). Tingkat kerawanan longsor sangat tinggi mendominasi wilayah bagian tengah sampai Timur Kabupaten Pacitan di Kecamatan Kebonagung, Arjosari, Tulakan, dan Pacitan dengan ciri wilayah memiliki rata-rata lereng 23.2°, tersusun atas batuan dalam Formasi Arjosari dengan jenis tanah aluvial dan penggunaan tanah semak belukar, curah hujan rata-rata 2,384.64 mm/tahun, jarak dari patahan rata-rata 693.4 m, jarak dari sungai rata-rata 499.87 m, nilai topographic wetness index (TWI) rata-rata 4.79, dan profile curvature sebesar -0.04 atau cembung. Sementara itu, tingkat kerawanan longsor sangat rendah dominan berada pada pada bagian Barat Kabupaten Pacitan di Kecamatan Donorojo, Punung, dan Pringkuku dengan ciri wilayah memiliki rata-rata lereng 11.05°, tersusun atas batuan sedimen gamping dari Formasi Wonosari dengan jenis tanah litosol dan penggunaan tanah tegalan/ladang, curah hujan rata-rata 2,042.63 mm/tahun, jarak dari patahan 3,222.57 m, jarak dari sungai rata-rata 2,216.60 m, nilai topographic wetness index (TWI) rata-rata 5.5, dan profile curvature 0.06 atau cekung. Validasi model menggunakan data uji dengan AUROC bernilai 0.876. Dihasilkan validasi tingkat kerawanan menggunakan data validasi dengan akurasi sebesar 0.781 dan presisi sebesar 0.755. ......Landslides are one of the most detrimental natural events that occur every year in the Pacitan Regency. This study analyzes the physical aspects that act as factors causing landslides and the level of landslide susceptibility using the logistic regression method in Pacitan Regency. Four hundred sixty-eight landslide points were used from the BPBD inventory in Pacitan Regency, field surveys, and interpretation of satellite imagery and separated with 80% as test data and 20% as model validation. The probability analysis of landslides using 14 physical aspects coefficient results that slopes, aspects/directions towards the slopes, rainfall, land use, soil types, and lithology have positive coefficients values. Meanwhile, the physical aspects include elevation, topographic wetness index (TWI), profile curvature, plan curvature, distance from fault, distance from road, distance from road, and normalized difference vegetation index (NDVI), have negative coefficients values. Five levels of landslide susceptibility were generated in Pacitan Regency, namely, very low (43.219.8 Ha), low (32.256.9 Ha), medium (24.133.8 Ha), high (20.590.7 Ha), and very high (18.787.6 Ha). Very high level of landslide susceptibility dominates the central to the eastern part of Pacitan Regency in Kebonagung, Arjosari, Tulakan, and Pacitan Districts with regional characteristics having an average slope of 23.2°, composed of rocks in the Arjosari Formation with alluvial soil types, and shrub land use, rainfall the average rainfall is 2,384.64 mm/year, the distance from the fault is 693.4 m, the distance from the river is 499.87 m, the topographic wetness index (TWI) value is 4.79, and the curvature profile is -0.04 or convex. Meanwhile, the very low level of landslide susceptibility is dominated in the western part of Pacitan Regency in Donorojo, Punung, and Pringkuku Subdistricts, with regional characteristics having an average slope of 11.05°, composed of limestone sedimentary rocks from the Wonosari Formation with litosol soil types and dry farming land use. /field, the average rainfall is 2,042.63 mm/year, the distance from the fault is 3,222.57 m, the distance from the river is 2,216.60 m on average, the topographic wetness index (TWI) value is 5.5 on average, and the curvature profile is 0.06 or concave. Validation of the model using test data with AUROC worth 0.876. Vulnerability validation using validation data resulted in an accuracy of 0.781 and a precision of 0.755.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
UI - Skripsi Membership  Universitas Indonesia Library
Ivan Antonio Yoshua
Abstrak :
Gerakan tanah merupakan sebuah kejadian bahaya geologi yang memiliki dampak buruk bahkan memakan korban jiwa. Indonesia sendiri memiliki frekuensi kejadian yang tinggi dalam bencana gerakan tanah di mana pada tahun 2021 sebanyak 1506 peristiwa terjadi di wilayah Indonesia. Banyak faktor yang memengaruhi kejadian gerakan tanah di mana umumnya faktor geologi seperti litologi, kemiringan lereng, dan vegetasi sebagai faktor pengontrol terhadap kerentanan gerakan tanah. Selain itu, faktor iklim merupakan faktor yang cukup memengaruhi kejadian gerakan tanah. Terjadinya perubahan iklim menjadi perhatian tentang bagaimana dampak yang dihasilkan terhadap kerentanan gerakan tanah. Penelitian ini melakukan analisis faktor-faktor pengontrol kerentanan gerakan tanah termasuk pengaruh perubahan iklim terhadap kejadian gerakan tanah menggunakan metode logistic regression dengan menghubungkan variabel bebas berupa faktor-faktor pemicu gerakan tanah dan variabel terikat berupa kejadian gerakan tanah. Faktor iklim juga dianalisis menggunakan proyeksi data iklim masa depan dengan skenario shared socioeconomic pathways (SSPs) untuk memperlihatkan seberapa pengaruh perubahan iklim yang terjadi terhadap kejadian gerakan tanah. Penelitian ini menjelaskan adanya pengaruh dari faktor elevasi, kemiringan lereng, aspek, plan curvature, profile curvature, litologi, vegetasi, jarak terhadap struktur, jarak terhadap jalan, jarak terhadap sungai, curah hujan, dan temperatur terhadap kerentanan gerakan tanah. Penelitian ini juga menghasilkan 5 peta kerentanan gerakan tanah berdasarkan perbedaan kondisi masa sekarang, kondisi tahun 2021-2040, dan kondisi tahun 2040-2060. Berdasarkan hasil tersebut, adanya kenaikan luas wilayah zona kerentanan tinggi pada skenario peningkatan iklim. ......Landslides are geological hazards that have severe consequences, including fatalities. Indonesia has experienced frequent landslide events, with 1,506 incidents occurring in the country in 2021 alone. Various factors influence landslide occurrences, predominantly geological factors such as lithology, slope angle, and vegetation, which act as controlling factors for landslide susceptibility. Additionally, climate factors significantly affect landslide events. Climate change raises concerns about the resulting impacts on landslide susceptibility. This study analyzes the controlling factors of landslide susceptibility, including the influence of climate change on landslide occurrences, using logistic regression to establish a connection between independent variables representing landslide triggers and the dependent variable representing landslide occurrences. Climate factors are also examined using future climate data projections based on Shared Socio-economic Pathways (SSPs) scenarios to illustrate the extent of climate change impact on landslide events. This study explained the influence of elevation, slope, aspect, plan curvature, profile curvature, lithology, vegetation, distance to structures, distance to roads, distance to rivers, rainfall, and temperature on the susceptibility of soil movement. The study also generated five landslide vulnerability maps based on the current conditions, the conditions between 2021 and 2040 and the conditions between 2040 and 2060. The results showed that there is an increase in the area of high susceptibility zones under the climate change scenario.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
UI - Skripsi Membership  Universitas Indonesia Library
Assyifa Ulhusna
Abstrak :
Credit scoring adalah sebuah sistem yang digunakan kreditor seperti bank dan perusahaan asuransi untuk menentukan apakah pemohon kredit termasuk dalam grup good credit yakni grup yang kemungkinan besar akan membayar utangnya tepat waktu atau bad credit yang merupakan grup dengan kemungkinan besar tidak membayar utangnya tepat waktu. Salah satu metode yang paling sering digunakan dalam pembuatan model credit scoring adalah binary logistic regression.  Namun, seiring dengan kemajuan komputasi, banyak metode lain yang berkembang saat ini untuk dipakai dalam pembuatan model credit scoring yakni, metode gradient boosting. Pada skripsi ini dilakukan implementasi metode binary logistic regression dan gradient boosting dalam pemodelan credit scoring. Hasil yang didapatkan dengan menggunakan data 537.667 debitur dengan rincian 535.705 good credits dan 1.962 bad credits adalah pada data train penggunaan gradient boosting memberikan nilai tingkat akurasi 79,65%, uji KS 0,5389 dan AUROC/AUC 0,8393. Sementara pada data test penggunaan gradient boosting memberikan nilai tingkat akurasi 79,92%, uji KS 0,5345 dan AUROC/AUC 0,8313.  Nilai-nilai tersebut lebih tinggi dibandingkan dengan penggunaan binary logistic regression baik pada data train maupun data test. Berdasarkan nilai uji AUC, metode gradient boosting tergolong klasifikasi yang baik, sedangkan metode binary logistic regression> tergolong klasifikasi yang cukup. Hasil simulasi ini menunjukkan untuk data yang digunakan, metode gradient boosting memberikan hasil yang lebih baik dari sisi akurasi, uji KS, dan AUROC/AUC daripada binary logistic regression. Dengan kata lain, metode gradient boosting dapat meningkatkan discriminant power, yakni kemampuan untuk membandingkan target yang lebih baik dibandingkan dengan metode binary logistic regression. ......Credit scoring is a system used by creditors such as banks and insurance companies to determine whether credit applicants are included in the good credit group, namely the group that is most likely to pay its debts on time or the bad credit group which is the group that is most likely to not pay its debts on time. One of the most frequently used methods in making credit scoring models is binary logistic regression. However, along with the progress of computation, many other methods are currently being developed to be used in making credit scoring models, namely, the gradient boosting method. In this thesis, we will compare the binary logistic regression and gradient boosting methods in credit scoring model. The results obtained using data from 537,667 debtors with details of 535,705 good credits and 1,962 bad credits are the train data using gradient boosting gives an accuracy rate of 79.65%, KS test 0.5389 and AUROC/AUC 0.8393. Meanwhile, the test data using gradient boosting gives an accuracy rate of 79.92%, KS test 0.5345, and AUROC/AUC 0.8313. These values ​​are higher than the use of binary logistic regression in both the train and test data. Based on the AUC test value, the gradient boosting method is a good classifier, while the binary logistic regression method is an acceptable classifier. The results of this simulation show that for the data used, the gradient boosting method gives better results in terms of accuracy, KS test, and AUROC/AUC than binary logistic regression. In other words, the gradient boosting method can increase discriminant power or the ability to compare targets better than the binary logistic regression method.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
UI - Skripsi Membership  Universitas Indonesia Library
Onyiah, Leonard C.
Boca Raton: CRC Press, Taylor & Francis Group, 2009
519.536 ONY d
Buku Teks  Universitas Indonesia Library
Abstrak :
This handbook focuses on the analysis of lifetime data arising from the biological and medical sciences. It deals with semiparametric and nonparametric methods. For investigators new to this field, the book provides an overview of the topic along with examples of the methods discussed. It presents both classical methods and modern Bayesian approaches to the analysis of data"-- "Preface This volume examines modern techniques and research problems in the analysis of life time data analysis. This area of statistics deals with time to event data which is complicated not only by the dynamic nature of events occurring in time but by censoring where some events are not observed directly but rather they are known to fall in some interval or range. Historically survival analysis is one of the oldest areas of statistics dating its origin to classic life table construction begun in the 1600's. Much of the early work in this area involved constructing better life tables and long tedious extensions of non-censored nonparametric estimators. Modern survival analysis began in the late 1980's with pioneering work by Odd Aalen on adapting classical Martingale theory to these more applied problems. Theory based on these counting process martingales made the development of techniques for censored and truncated data in most cases easier and opened the door to both Bayesian and classical statistics for a wide range of problems and applications. In this volume we present a series of papers which provide an introduction to the advances in survival analysis techniques in the past thirty years. These papers can serve four complimentary purposes. First, they provide an introduction to various areas in survival analysis for graduates students and other new researchers to this eld. Second, they provide a reference to more established investigators in this area of modern investigations into survival analysis. Third, with a bit of supplementation on counting process theory this volume is useful as a text for a second or advanced course in survival analysis. We have found that the instructor of such a course can pick and chose papers in areas he/​she deem most useful to the
Boca Raton: CRC press, 2014
610.7 HAN
Buku Teks SO  Universitas Indonesia Library