Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 162250 dokumen yang sesuai dengan query
cover
Assyifa Ulhusna
"Credit scoring adalah sebuah sistem yang digunakan kreditor seperti bank dan perusahaan asuransi untuk menentukan apakah pemohon kredit termasuk dalam grup good credit yakni grup yang kemungkinan besar akan membayar utangnya tepat waktu atau bad credit yang merupakan grup dengan kemungkinan besar tidak membayar utangnya tepat waktu. Salah satu metode yang paling sering digunakan dalam pembuatan model credit scoring adalah binary logistic regression.  Namun, seiring dengan kemajuan komputasi, banyak metode lain yang berkembang saat ini untuk dipakai dalam pembuatan model credit scoring yakni, metode gradient boosting. Pada skripsi ini dilakukan implementasi metode binary logistic regression dan gradient boosting dalam pemodelan credit scoring. Hasil yang didapatkan dengan menggunakan data 537.667 debitur dengan rincian 535.705 good credits dan 1.962 bad credits adalah pada data train penggunaan gradient boosting memberikan nilai tingkat akurasi 79,65%, uji KS 0,5389 dan AUROC/AUC 0,8393. Sementara pada data test penggunaan gradient boosting memberikan nilai tingkat akurasi 79,92%, uji KS 0,5345 dan AUROC/AUC 0,8313.  Nilai-nilai tersebut lebih tinggi dibandingkan dengan penggunaan binary logistic regression baik pada data train maupun data test. Berdasarkan nilai uji AUC, metode gradient boosting tergolong klasifikasi yang baik, sedangkan metode binary logistic regression> tergolong klasifikasi yang cukup. Hasil simulasi ini menunjukkan untuk data yang digunakan, metode gradient boosting memberikan hasil yang lebih baik dari sisi akurasi, uji KS, dan AUROC/AUC daripada binary logistic regression. Dengan kata lain, metode gradient boosting dapat meningkatkan discriminant power, yakni kemampuan untuk membandingkan target yang lebih baik dibandingkan dengan metode binary logistic regression.

Credit scoring is a system used by creditors such as banks and insurance companies to determine whether credit applicants are included in the good credit group, namely the group that is most likely to pay its debts on time or the bad credit group which is the group that is most likely to not pay its debts on time. One of the most frequently used methods in making credit scoring models is binary logistic regression. However, along with the progress of computation, many other methods are currently being developed to be used in making credit scoring models, namely, the gradient boosting method. In this thesis, we will compare the binary logistic regression and gradient boosting methods in credit scoring model. The results obtained using data from 537,667 debtors with details of 535,705 good credits and 1,962 bad credits are the train data using gradient boosting gives an accuracy rate of 79.65%, KS test 0.5389 and AUROC/AUC 0.8393. Meanwhile, the test data using gradient boosting gives an accuracy rate of 79.92%, KS test 0.5345, and AUROC/AUC 0.8313. These values ​​are higher than the use of binary logistic regression in both the train and test data. Based on the AUC test value, the gradient boosting method is a good classifier, while the binary logistic regression method is an acceptable classifier. The results of this simulation show that for the data used, the gradient boosting method gives better results in terms of accuracy, KS test, and AUROC/AUC than binary logistic regression. In other words, the gradient boosting method can increase discriminant power or the ability to compare targets better than the binary logistic regression method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ulfa Fauziah
"ABSTRAK
Kredit merupakan salah satu bentuk penyaluran dana yang dilakukan oleh lembaga keuangan perbankan. Berbagai jenis kredit ditawarkan oleh pihak-pihak yang memberikan pinjaman, salah satu jenis kredit yang paling diminati adalah kredit uang. Dalam memberikan kredit, pihak bank tidak akan begitu saja dalam memberikan kredit. Model teknologi credit scoring dapat dimanfaatkan untuk menyaring peminjam. Model logistic regression dapat digunakan untuk menghubungkan probabilitas kegagalan pinjaman kredit macet dengan menggunakan data calon peminjam yang diperlukan seperti besar pendapatan perbulan, besar pinjaman, usia calon peminjam, klasifikasi pekerjaan, jenis tempat tinggal dan kepemilikan jaminan. Atribut-atribut tersebut akan dievaluasi oleh bilangan fuzzy. Sehingga diharapkan metode fuzzy logistic regression dapat digunakan untuk menentukan probabilitas kredit macet dimana dengan probabilitas tersebut dapat diketahui apakah pinjaman yang diajukan calon peminjam akan masuk kedalam kategori kredit macet atau kredit lancar.

ABSTRACT
Credit is one form of distribution of funds by financial institutions banking. Various types of loans offered by the parties are on loan, one type of credit the most popular is credit money. In providing credit, the bank will not just provide credit. Model of credit scoring technology can be used to screen borrowers. Logistic regression models can be used to connect the probability of failure of loans bad loans using data from the prospective borrower required such a large monthly income, loan size, the age of prospective borrowers, job classification, type of dwelling and ownership guarantee. The attributes will be evaluated by fuzzy numbers. So expect fuzzy logistic regression method can be used to determine the probability of bad loans in which the probability can be known whether the proposed loan to potential borrowers will be entered into the category of bad credit or good credit."
2017
S68422
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kayla Calista Ayal
"Usia biologis mengukur penuaan individu berdasarkan kondisi fisik dan fungsi organ. Meskipun banyak penelitian telah dilakukan untuk memprediksi usia biologis dengan berbagai metode, penerapan metode machine learning masih memiliki ruang untuk penelitian lebih lanjut. Penelitian ini mengimplementasikan dua metode machine learning dengan pendekatan yang berbeda, yaitu metode Support Vector Regression (SVR) dan Light Gradient Boosting Machine (LGBM) dalam memprediksi usia biologis menggunakan data pemeriksaan medis Kementerian Kesehatan tahun 2011 yang mencakup 5960 subjek dan 41 fitur. Proses preprocessing meliputi penyaringan usia kronologis > 30 tahun, pemisahan data berdasarkan jenis kelamin, penanganan missing values dan outlier, serta data encoding. Feature selection menggunakan koefisien korelasi Spearman menghasilkan 8 fitur berbeda untuk setiap jenis kelamin. Data dibagi dengan 90% untuk pelatihan dan 10% untuk pengujian, serta dilakukan tuning hyperparameter menggunakan GridSearchCV. Penelitian ini menggunakan metrik RMSE dan adjusted R-squared, yang dipilih berdasarkan relevansinya dengan tujuan penelitian. Hasil menunjukkan LGBM lebih unggul dari SVR dengan RMSE 7,2064 tahun dan adjusted R-squared 33,36% pada pria, serta RMSE 7,1475 tahun dan adjusted R-squared 22,16% pada wanita. Analisis korelasi menunjukkan hubungan yang wajar antara usia biologis dan usia kronologis serta korelasi yang cukup antara usia biologis dengan biomarker tekanan sistolik dan status hipertensi pada pria, serta tekanan sistolik dan kolesterol pada wanita. Analisis korelasi menunjukkan hubungan signifikan antara usia biologis dengan usia kronologis dan beberapa biomarker. Secara keseluruhan, LGBM lebih efektif dalam memprediksi usia biologis dibandingkan SVR. Hasil dari penelitian diharapkan dapat diaplikasikan dalam kehidupan sehari-hari, seperti membantu perusahaan asuransi menilai kelayakan klaim berdasarkan prediksi usia biologis, serta mendukung keputusan di bidang kesehatan preventif.

Biological age measures an individual's aging based on physical condition and organ function. Although numerous studies have been conducted to predict biological age using various methods, there is still room for further research in the application of machine learning techniques. This study implements two machine learning methods with different approaches, namely Support Vector Regression (SVR) and Light Gradient Boosting Machine (LGBM), to predict biological age using medical examination data from the Ministry of Health in 2011, covering 5960 subjects and 41 features. The preprocessing steps include filtering chronological age > 30 years, segregating data by gender, handling missing values and outliers, and data encoding. Feature selection using Spearman correlation coefficients resulted in 8 different features for each gender. The data was split into 90% for training and 10% for testing, with hyperparameter tuning performed using GridSearchCV. This study used RMSE and adjusted R-squared metrics, selected based on their relevance to the research objectives. The results show that LGBM outperformed SVR with an RMSE of 7.2064 years and an adjusted R-squared of 33.36% for men, and an RMSE of 7.1475 years and an adjusted R-squared of 22.16% for women. Correlation analysis revealed a significant relationship between biological age and chronological age, as well as a reasonable correlation between biological age and biomarkers such as systolic blood pressure and hypertension status in men, and systolic blood pressure and cholesterol in women. Overall, LGBM proved to be more effective in predicting biological age compared to SVR. The results of this study are expected to be applicable in everyday life, such as assisting insurance companies in evaluating claim eligibility based on biological age predictions, as well as supporting decision-making in preventive healthcare."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kheisya Amanda
"Dalam industri perbankan, penilaian kredit yang akurat merupakan kunci dalam mengelola risiko kredit. Perkembangan ekonomi digital telah membawa inovasi dalam proses pemberian kredit yang ditandai dengan munculnya Layanan Jasa Pinjam Meminjam Uang Berbasis Teknologi Informasi. Hal ini membuat bank dihadapkan pada tantangan penilaian kredit yang lebih kompleks. Seiring perkembangan ilmu pengetahuan dan teknologi, algoritma machine learning telah terbukti memiliki kinerja yang unggul dalam proses penilaian kelayakan kredit. Penelitian ini menggunakan dua algoritma boosting, yaitu AdaBoost dan XGBoost dalam klasifikasi kinerja pembayaran pinjaman kredit. Kinerja pembayaran pinjaman kredit dibedakan menjadi dua kelas, yaitu Good dan Bad dengan kriteria Good adalah debitur yang melakukan pembayaran pinjaman kredit tidak lebih dari 3 bulan dari batas jatuh tempo dan Bad adalah debitur yang melakukan pembayaran pinjaman kredit lebih dari 3 bulan dari batas jatuh tempo. Dalam implementasi metode, digunakan data riwayat pembayaran pinjaman kredit khususnya untuk produk Kredit Usaha Mikro (KUM) digital yang diperoleh dari PT Bank X Tbk. dengan jumlah data berjumlah 2190 observasi. Jumlah observasi yang termasuk dalam kelas Good mencapai 89,36% dari total keseluruhan observasi, menyisakan 10,64% yang termasuk dalam kelas Bad. Pada penelitian ini digunakan metode Syntetic Minority Oversampling Technique (SMOTE) untuk mengatasi dataset yang tidak seimbang. Kinerja metode dievaluasi menggunakan nilai metrik accuracy, sensitivity, specificity, dan AUC-ROC dengan mempertimbangkan proporsi data training yang berbeda, mulai dari 50% sampai dengan 90%. Untuk meningkatkan keandalan hasil, simulasi metode dilakukan sebanyak lima kali. Hasil penelitian ini menunjukkan bahwa XGBoost mengungguli AdaBoost dalam klasifikasi kinerja pembayaran pinjaman kredit, terbukti dari perolehan kinerja yang lebih baik pada mayoritas metrik evaluasi dan kelima simulasi yang dilakukan, dengan rata-rata accuracy sebesar 87,71%, sensitivity sebesar 92,29%, specificity sebesar 44,21%, dan AUC-ROC sebesar 81,16%.

In the banking industry, accurate credit assessment is key to managing credit risk. The development of the digital economy has brought innovations in the credit granting process, marked by the emergence of Financial Technology-Based Money Lending Services. This presents banks with more complex credit assessment challenges. With the advancement of science and technology, machine learning algorithms have proven to be superior in the process of creditworthiness assessment. This research utilizes two boosting algorithms, namely AdaBoost and XGBoost, in classifying credit loan payment performance. The performance of credit loan payments is divided into two classes: Good and Bad, where Good refers to debtors who make credit loan payments no more than 3 months past the due date, and Bad refers to those making payments more than 3 months past the due date. In the implementation of the method, data on credit loan payment history, specifically for digital Micro Business Credit (KUM) products obtained from PT Bank X Tbk., were used, totaling 2190 observations. The number of observations classified as Good accounted for 89.36% of the total, leaving 10.64% in the Bad category. This study employed the Synthetic Minority Oversampling Technique (SMOTE) to address the imbalanced dataset. The performance of the method was evaluated using the metrics of accuracy, sensitivity, specificity and AUC-ROC, considering different proportions of training data, ranging from 50% to 90%. To enhance the reliability of the results, the method simulation was conducted five times. The findings indicate that XGBoost outperforms AdaBoost in classifying credit loan payment performance, as evidenced by its superior performance across all evaluation metrics and all five simulations, achieving an average accuracy of 87.71%, sensitivity of 92.29%, specificity of 44,12%, and AUC-ROC of 81.16%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fatma Irmadani
"

Credit Scoring adalah metode yang digunakan untuk memprediksi kemungkinan adanya risiko calon peminjam akan gagal bayar atau menunggak. Credit scoring digunakan oleh penyedia jasa pinjaman ketika calon peminjam dana mengajukan pinjaman. Salah satu perusahaan yang menggunakan credit scoring terhadap peminjamnya adalah Lending Club. Lending Club adalah salah satu penyedia jasa pinjam meminjam online Peer-to-Peer (P2P) di Amerika Serikat. Pada penelitian ini, dilakukan klasifikasi multikelas credit scoring berdasarkan status pinjaman (Loan Status) dari dataset Lending Club. Status pinjaman memiliki 3 kelas, yaitu default, fully paid, dan late. Dengan menggunakan pendekatan machine learning, yaitu supervised learning, klasifikasi multikelas credit scoring dapat dilakukan dengan menggunakan Multinomial Logistic Regression (MLR). MLR merupakan pengembangan dari Logistic Regression yang mampu menangani klasifikasi multikelas. Pada implementasi model MLR, digunakan 3 skenario sampling strategy pada SMOTE yang berbeda dalam mengklasifikasikan multikelas. Hasil klasifikasi multikelas dievaluasi dengan menggunakan metrik accuracy, precision, recall, F1-Score dan AUC (Area Under the Curve) One versus All. Hasil implementasi dengan evaluasi terbaik adalah model MLR dengan nilai accuracy sebesar 0,67 dan nilai rata-rata AUC One versus All sebesar 0,724932. Sedangkan evaluasi pada setiap kelas, kelas default memiliki nilai precision sebesar 0,47,recall sebesar 0,02 dan F1-Score sebesar 0,04; kelas fully paid memiliki nilai precision sebesar 0,85, recall sebesar 0,83 dan F1-Score sebesar 0,84; dan kelas late memiliki nilai precision sebesar 0,02, recall sebesar 0,84 dan F1-Score sebesar 0,04. Hasil tersebut menunjukkan bahwa kelas default memiliki hasil evaluasi yang kurang baik untuk setiap metrik evaluasi, kelas fully paid memiliki hasil evaluasi yang baik untuk setiap metrik evaluasi, sedangkan kelas late memiliki nilai yang cukup baik hanya pada nilai recall (0,84). Hasil yang kurang baik diduga dipengaruhi oleh adanya data yang tidak seimbang dan kelas yang saling tumpang tindih.


Credit Scoring is a method used to predict the possible risk that a prospective borrower will default or delinquency. Credit scoring is used by loan service providers when prospective borrowers apply for loans. One company that uses credit scoring for its borrowers is the Lending Club. Lending Club is a Peer-to-Peer (P2P) online lending and borrowing service provider in the United States. In this study, a multiclass credit scoring classification was carried out based on loan status from the Lending Club dataset. Loan status has 3 classes, namely default, fully paid, and late. By using a machine learning approach, namely supervised learning, multiclass classification of credit scoring can be done using Multinomial Logistic Regression (MLR). MLR is a development of Logistic Regression which is able to handle multiclass classification. In the implementation of the MLR model, 3 different sampling strategy scenarios are used in SMOTE in classifying multiclasses. The multiclass classification results are evaluated using accuracy, precision, recall, F1-Score and AUC (Area Under the Curve) One versus All metrics. The result of the implementation with the best evaluation is the MLR model with an accuracy value of 0.67 and an average value of AUC One versus All of 0.724932. While the evaluation for each class, the default class has a precision value of 0.47, a recall of 0.02 and an F1-Score of 0.04; the fully paid class has a precision value of 0.85, a recall of 0.83 and an F1-Score of 0.84; and the late class has a precision value of 0.02, a recall of 0.84 and an F1-Score of 0.04. These results show that the default class has poor evaluation results for each evaluation metric, the fully paid class has good evaluation results for each evaluation metric, while the late class has a fairly good value only on the recall value (0.84). Unfavorable results are thought to be influenced by the presence of unbalanced data and overlapping classes.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Salma Mazaya Fasya
"Penuaan merupakan kumpulan perubahan biologis pada tubuh manusia yang terjadi secara bertahap dan dapat meningkatkan risiko terjadinya penyakit bahkan kematian. Hingga saat ini, usia kronologis menjadi indikator penuaan yang paling umum digunakan dalam dunia kesehatan. Akan tetapi, munculnya konsep usia biologis diyakini mampu memberikan pengukuran yang lebih akurat terkait penuaan pada manusia dibandingkan dengan usia kronologis. Usia biologis dipengaruhi oleh berbagai faktor yang disebut biomarker. Penelitian ini berfokus pada prediksi usia biologis berdasarkan usia kronologis dan fitur (biomarker) lainnya dengan memanfaatkan metode machine learning Extreme Gradient Boosting (XGBoost) dan Support Vector Regression (SVR). Dataset yang digunakan berupa data pemeriksaan medis oleh Kementerian Kesehatan RI. Pada dataset tersebut dilakukan data preprocessing, seleksi fitur menggunakan Spearman’s Rank Correlation Coefficient, dan pembangunan model. Model dievaluasi menggunakan metrik evaluasi pada model regresi yaitu Root Mean Square Error (RMSE), Coefficient of Determination , dan Adjusted . Ketiga metrik ini masing-masing menghitung selisih nilai prediksi dengan nilai aktual dan menunjukkan seberapa baik variabel dependen dapat dijelaskan oleh variabel independen pada model. Dengan metode XGBoost diperoleh nilai RMSE 8,0560, 0,2894, dan Adjusted 0,2006 untuk data pria, serta RMSE 6,3851, 0,4252, dan Adjusted 0,3938 untuk data wanita. Dengan metode SVR, diperoleh RMSE 8,0697, 0,2870, dan Adjusted 0,1979 untuk data pria, serta RMSE 6,7147, 0,3643, dan Adjusted sebesar 0,3296. Metode XGBoost lebih unggul dalam memprediksi usia biologis baik pada model pria maupun wanita dibandingkan metode SVR. Usia kronologis dan biomarker (fitur) lainnya terkait kesehatan juga ditemukan berpengaruh positif terhadap usia biologis seorang individu.

Aging is a collection of biological changes in the human body that occur gradually and can increase the risk of disease and even death. Until now, chronological age is the most commonly used indicator of aging in the medical sector. However, the emergence of the concept of biological age is believed to be able to provide a more accurate measurement of aging in humans compared to chronological age. Biological age is influenced by various factors called biomarkers. This research focuses on predicting biological age based on chronological age and other features (biomarkers) by utilizing the Extreme Gradient Boosting (XGBoost) and Support Vector Regression (SVR) machine learning methods. The dataset used is medical examination data by the Indonesian Ministry of Health. Data preprocessing was performed on this dataset, followed by feature selection using the Spearman Rank Correlation Coefficient, and subsequent model development. The model is evaluated using evaluation metrics in the regression model, namely Root Mean Square Error (RMSE), Coefficient of Determination , and Adjusted . These three metrics each calculate the difference between the predicted and actual values and indicate how well the dependent variable can be explained by the independent variables in the model. Using the XGBoost method, RMSE values were obtained of 8,0560, 0,2894, and Adjusted 0,2006 for male data, as well as RMSE 6,3851, 0,4252, dan Adjusted 0,3938 for female's data. Using the SVR method, RMSE 8,0697, 0,2870, and Adjusted 0,1979 were obtained for male data, as well as RMSE 6.7147, 0.3643, and Adjusted of 0,3296 for female's data. The XGBoost method demonstrates better performance in predicting biological age for both male and female models compared to the SVR method. Chronological age and other health-related biomarkers (features) were also found to have a positive impact on an individual's biological age."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Naufal Ghani Putra
"Beberapa jurnal statistik menunjukkan bahwa pergerakan harga saham dapat diprediksi dengan menggunakan pergerakan harga masa lalu, namun cara ini ditentang oleh Eugene Fama dalam tesisnya yang berjudul Random Walk in Stock Market. Hal tersebut didukung oleh Burton G. Malkiel dalam bukunya yang berjudul Random Walk in Wall Street. Berdasarkan hal tersebut harus dicari cara lain yaitu dengan menggunakan rasio keuangan. Dutta tahun 2012 menunjukkan cara memprediksi pergerakan saham menggunakan Binary Logistic Regression (BLR) dengan rasio keuangan sebagai prediktornya. Model BLR-nya terlibat dalam algoritma klasifikasi biner yang menggunakan nilai cut off dalam aturan klasifikasinya untuk mengklasifikasikan perusahaan mana yang harga sahamnya akan naik atau tidak. Metode ini diterapkan dalam penelitian ini untuk memprediksi pergerakan saham di Indonesia. Sebuah penelitian menunjukkan bahwa keputusan investor dipengaruhi oleh lokasi perusahaan. Oleh karena itu, BLR belum tentu menjadi model yang tepat untuk memprediksi pergerakan saham karena tidak memperhatikan unsur regional (spasial) sehingga dalam penelitian ini digunakan model regresi logistik biner yang mempertimbangkan elemen spasial yang disebut dengan Geographically Weighted Logistic Regression (GWLR) model dan membandingkan kinerja model. dengan model BLR dalam memprediksi pergerakan saham dengan menggunakan rasio keuangan sebagai prediktor. Penelitian diawali dengan mencari model BLR terbaik yang dibuat dari data latih tahun 2013. Model terbaik dengan prediktor rasio keuangan adalah DER (Debt to Equity Ratio). Kemudian dibuat model GWLR dengan prediktor yang sama. BLR dan GWLR dilibatkan vii Universitas Indonesia dalam algoritma klasifikasi biner. Kemudian dilakukan pengujian algoritma masing-masing menggunakan data latih 2013, dan data pengujian tahun 2014 menghasilkan AUC masing-masing sebesar 0,6252723 dan 0,6666667, untuk algoritma klasifikasi biner yang melibatkan GWLR, dan untuk algoritma klasifikasi biner yang melibatkan BLR diperoleh 0,6176471, dan 0,627381. Hal ini menunjukkan bahwa kinerja model GWLR lebih baik dari pada BLR.
Several statistical journals show that stock price movements can be predicted using past price movements, but this method is opposed by Eugene Fama in his thesis entitled Random Walk in Stock Market. This is supported by Burton G. Malkiel in his book entitled Random Walk in Wall Street. Based on this, another way must be sought, namely by using financial ratios. Dutta 2012 shows how to predict stock movements using Binary Logistic Regression (BLR) with financial ratios as predictors. The BLR model is involved in a binary classification algorithm that uses the cut off value in its classification rules to classify which companies will increase their share price or not. This method is applied in this study to predict stock movements in Indonesia. A study shows that investors' decisions are influenced by the location of the company. Therefore, BLR is not necessarily the right model for predicting stock movements because it does not pay attention to regional (spatial) elements so in this study a binary logistic regression model is used that considers spatial elements called the Geographically Weighted Logistic Regression (GWLR) model and compares performance. model. with the BLR model in predicting stock movements using financial ratios as predictors. The research begins with finding the best BLR model made from training data in 2013. The best model with a predictor of financial ratios is DER (Debt to Equity Ratio). Then a GWLR model was made with the same predictors. BLR and GWLR were involved vii University of Indonesia in the binary classification algorithm. Then each algorithm was tested using the 2013 training data, and the 2014 test data resulted in an AUC of 0.6252723 and 0.6666667, respectively, for the binary classification algorithm involving GWLR, and for the binary classification algorithm involving BLR it was obtained 0, 6176471, and 0.627381. This shows that the performance of the GWLR model is better than the BLR."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Rizky Adha
"ABSTRACT
Pemodelan regresi telah diterapkan dalam perbankan ritel karena kemampuannya dalam menganalisis data kontinu maupun diskrit. Hal tersebut merupakan alat yang penting dalam penilaian risiko kredit, stress testing, serta evaluasi aset kredit. Pada tugas akhir ini, pendekatan yang digunakan adalah dengan menggunakan model regresi logistik multinomial untuk mengetahui faktor-faktor yang memengaruhi terjadinya default dan attrition pada suatu kredit. Selain itu, pada tugas akhir ini juga akan diperkenalkan pendekatan regresi spline dengan menggunakan truncated power basis untuk memodelkan fungsi hazard. Fleksibilitas dari fungsi spline memberikan kemampuan untuk memodelkan fungsi hazard yang berbentuk nonlinier dan tidak beraturan. Kemudian, dengan menggunakan regresi spline dan regresi logistik multinomial, akan diperoleh sebuah hasil dan interpretasi yang lebih baik. Terdapat beberapa kelebihan dari penggunaan kedua model tersebut. Pertama, dengan menggunakan fungsi regresi spline yang fleksibel, dapat dimodelkan fungsi hazard yang berbentuk nonlinier dan tidak beraturan. Kedua, mudah dipahami dan diterapkan, dan bentuk parametrik model regresi logistik multinomial yang sederhana dapat memudahkan dalam interpretasi model. Ketiga, memiliki kemampuan untuk prediksi. Pada akhir pembahasan, dengan menggunakan sebuah data kartu kredit akan dilakukan pengaplikasian dari model regresi logistik multinomial dan regresi spline, dilengkapi dengan penjelasan secara statistika dan akurasi prediksi.

ABSTRACT
Regression modeling has been adapted in retail banking because of its capability to analyze the continuous and discrete data. It is an important tool for credit risk scoring, stress testing and credit asset evaluation. In this thesis, the approach used is multinomial logistic regression model to gain the information regarding the factors that affect the occurrence of default and attrition. In addition, this thesis will also introduce spline regression approach using truncated power basis to model the hazard function. The flexibility of spline function allows us to model the nonlinear and irregular shapes of the hazard functions. Then, by using spline regression and multinomial logistic regression model, there will be a better result and interpretation. There are several advantages by using those both models. First, by using the flexible spline regression function, it can model nonlinear and irregular shapes of the hazard functions. Second, it is easy to understand and implement, and its simple parametric form from multinomial logistic regression model can make it easy in model interpretation. Third, the model has the ability to do prediction. Furthermore, by using a credit card dataset, we will demonstrate how to build these model, and we also provide statistical explanatory and prediction accuracy."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Valida Herianty
"Seiring dengan berkembangnya industri kredit, resiko kredit telah menjadi hal yang penting bagi instansi keuangan. Sehingga, penggunaan metode yang tepat dalam menilai resiko dari setiap permohonan kredit perlu dilakukan. Credit scoring merupakan salah satu metode penilaian resiko kredit yang sering digunakan dan sudah banyak dibuat dengan menggunakan berbagai metode data mining. Penelitian ini akan mengaplikasikan metode CART dalam membuat model credit scoring dengan menggunakan kasus di Koperasi. Model credit scoring hasil penelitian ini memiliki tingkat akurasi yang cukup tinggi (83,62%) dan Type I Error yang rendah (4,04%). Namun, model ini memiliki Type II Error yang cukup tinggi yaitu, 53,23%.
With the rapid growth of credit industry, credit risk has become critical for financial institutions. Thus, using the best methods of assessing risk for credit applicants are needed. Credit scoring is one of the method of credit risk measurement, and has been widely developed by using various data mining techniques. This study will implement CART for constructing credit scoring model using data of microfinance institution. As the results, the credit scoring model has high accuracy (83,62%) and low Type I Error (4,04%). While its Type II Error is high (53,23%)."
Depok: Fakultas Teknik Universitas Indonesia, 2015
S60194
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gamar Aseffa
"Penelitian ini bertujuan untuk merumuskan model credit scoring untuk kredit mikro dengan menggunakan metode Multivariate Adaptive Regression Splines (MARS). Metode MARS merupakan pendekatan regresi nonparametrik yang memiliki kemampuan untuk memodelkan hubungan yang kompleks antar variabel tanpa asumsi model yang kuat dan menghasilkan model dengan akurasi tinggi yang melebihi model credit scoring lainnya dan mampu mengolah data berdimensi tinggi. Dalam beberapa tahun terakhir, MARS telah banyak diterapkan untuk memodelkan berbagai data, namun belum ditemukan penggunaanya untuk credit scoring kredit mikro. Secara umum metode credit scoring yang umum digunakan adalah analisis diskriminan dan regresi logistik. Namun kedua metode tersebut memiliki keterbatasan yaitu perlunya asumsi parametrik antara variabel respon dan prediktor. Penelitian menggunakan studi kasus data kredit mikro PT. Bank ABC yang merupakan market leader kredit UMKM di Indonesia. Hasil penelitian ini menunjukkan bahwa model penilaian kredit mikro dengan menggunakan MARS memiliki akurasi prediksi yang lebih tinggi dengan tingkat kesalahan terkecil, kesalahan tipe I dan II dibandingkan dengan Metode Regresi Logistik. Sehingga hasil penelitian ini dapat digunakan sebagai bahan pertimbangan bagi bank dalam menerapkan metode MARS dalam credit scoring dalam rangka pengendalian Risiko Non Performing Loan Kredit Mikro.

This paper aim to formulate the credit scoring model for micro loan using the Multivariate Adaptive Regression Splines (MARS) method. The MARS method is a nonparametric regression approach that has the ability to model complex relationships between variables without strong model assumptions and produce a model with high accuracy that exceeds other credit scoring models and is able to process high-dimensional data. In recent years, MARS has been widely applied to model various data, but its use for micro loan credit scoring has not yet been found. Generally, the credit scoring methods commonly used are discriminant analysis and logistic regression. However, there are limitations to both methods, namely the need for parametric assumptions between the response variables and predictors. This study use a case study of micro loan data from PT. Bank ABC, which is the market leader for MSME loans in Indonesia.The results of this study indicate that the microcredit credit scoring model using MARS has a higher predictive accuracy with the smallest error rate, type I and II errors compared to the Logistics Regression Method. So the results of this study can be used as considerations for banks in applying the MARS method in credit scoring in order to control the Non-Performing Loan Risk of Micro Loan."
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>