Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 178299 dokumen yang sesuai dengan query
cover
Andie Setiyoko
"Penelitian ini bertujuan untuk menganalisis pendekatan aproksimasi minimax, LS-SVM, dan GPR untuk proses pemodelan semivariogram pada metode kriging. Proses ini adalah bagian tahap dalam operasi kriging yang biasanya dilakukan untuk proses interpolasi dan fusi. Kriging sendiri telah banyak digunakan untuk memprediksi nilai spasial yang terbukti lebih baik dalam memprediksi proses dibandingkan dengan metode deterministik, di mana kriging dikategorikan sebagai pada metode interpolasi stokastik. Pendekatan konvensional untuk proses pemodelan semivariogram menggunakan metode weighted least square dengan menggunakan fungsi tertentu. Fungsi yang tersedia untuk metode ini antar lain stable, exponential, spherical, dan lain-lain. Beberapa pembaharuan untuk kasus pemodelan semivariogram saat ini telah dibuat dengan menggunakan teknik regresi seperti LS-SVM. Selain itu sebagai bagian dari kebaruan, pendekatan aproksimasi minimax, LS-SVM, dan GPR yang diusulkan untuk kasus ini dapat meningkatkan akurasi pada hasil interpolasi, dalam hal ini diimplementasikan pada metode ordinary kriging. Pendekatan baru, yang dapat disebut sebagai minimax kriging ini dapat mengurangi eror. Minimax berkontribusi pada prediksi bobot nilai semivariogram lebih baik daripada weighted least square dan proses komputasi yang lebih cepat daripada metode berbasis SVM dan GPR.

This study aims to analyze the approach of Minimax, LS-SVM, and GPR approximation for the semivariogram modeling process in the kriging method. This process is part of the stage in kriging operations that are usually carried out for interpolation and fusion processes. Kriging itself has been widely used to predict spatial values which are proven to be better in predicting processes compared to deterministic methods, where kriging is categorized as a stochastic interpolation method. The conventional approach to the semivariogram modeling process uses the weighted least square method using certain functions. Functions available for this method include stable, exponential, spherical, and others. Several updates to the case of semivariogram modeling have now been made using regression techniques such as LS-SVM. Apart from that as part of the novelty, the proposed Minimax, LS-SVM, and GPR approximation approaches for this case can improve the accuracy of the interpolation results, in this case implemented in the ordinary kriging method. This new approach, which can be called minimax kriging, can reduce errors. Minimax contributes to the predicted weighting of semivariogram values better than weighted least square and faster computing processes than SVM and GPR-based methods."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
D-Pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
"Many kinds of classification method are able to diagnose a patient who suffered Hepatitis disease. One of classification methods that can be used was Least Squares Support Vector Machines (LSSVM). There are two parameters that very influence to improve the classification accuracy on LSSVM, they are kernel parameter and regularization parameter. Determining the optimal parameters must be considered to obtain a high classification accuracy on LSSVM. This paper proposed an optimization method based on Improved Ant Colony Algorithm (IACA) in determining the optimal parameters of LSSVM for diagnosing Hepatitis disease. IACA create a storage solution to keep the whole route of the ants. The solutions that have been stored were the value of the parameter LSSVM. There are three main stages in this study. Firstly, the dimension of Hepatitis dataset will be reduced by Local Fisher Discriminant Analysis (LFDA). Secondly, search the optimal parameter LSSVM with IACA optimization using the data training, And the last, classify the data testing using optimal parameters of LSSVM. Experimental results have demonstrated that the proposed method produces high accuracy value (93.7%) for the 80-20% training-testing partition
Banyak metode klasifikasi yang mampu mendiagnosa seorang pasien mengidap penyakit Hepatitis, salah satunya adalah menggunakan metode klasifikasi Least Squares Support Vector Machines (LSSVM). Terdapat dua parameter yang sangat berpengaruh pada LSSVM yaitu parameter kernel dan parameter regularisasi. Penentuan parameter optimal tersebut harus diperhatikan untuk mendapatkan akurasi klasifikasi yang tinggi pada LSSVM. Penelitian ini mengusulkan metode optimasi Improved Ant Colony Algorithm (IACA) dalam penentuan parameter optimal LSSVM untuk mendiagnosa penyakit Hepatitis. IACA membuat penyimpanan solusi untuk menjaga rute dari keseluruhan semut. Solusi yang disimpan adalah nilai parameter LSSVM. Ada 3 tahapan utama pada penelitian ini yaitu, dimensi dataset Hepatitis direduksi menggunakan metode Local Fisher Discriminant Analysis (LFDA), kemudian parameter optimal LSSVM dicari dengan metode optimasi IACA menggunakan data training, setelah itu data testing diklasifikasikan menggunakan parameter optimal LSSVM. Hasil uji coba menunjukkan bahwa metode yang diusulkan menghasilkan nilai akurasi yang tinggi (93,7%) pada partisi 80-20% training dan testing."
Surabaya: Institut Teknologi Sepuluh Nopember, Faculty of Information and Technology, Department of Informatics, 2017
AJ-Pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Kayla Calista Ayal
"Usia biologis mengukur penuaan individu berdasarkan kondisi fisik dan fungsi organ. Meskipun banyak penelitian telah dilakukan untuk memprediksi usia biologis dengan berbagai metode, penerapan metode machine learning masih memiliki ruang untuk penelitian lebih lanjut. Penelitian ini mengimplementasikan dua metode machine learning dengan pendekatan yang berbeda, yaitu metode Support Vector Regression (SVR) dan Light Gradient Boosting Machine (LGBM) dalam memprediksi usia biologis menggunakan data pemeriksaan medis Kementerian Kesehatan tahun 2011 yang mencakup 5960 subjek dan 41 fitur. Proses preprocessing meliputi penyaringan usia kronologis > 30 tahun, pemisahan data berdasarkan jenis kelamin, penanganan missing values dan outlier, serta data encoding. Feature selection menggunakan koefisien korelasi Spearman menghasilkan 8 fitur berbeda untuk setiap jenis kelamin. Data dibagi dengan 90% untuk pelatihan dan 10% untuk pengujian, serta dilakukan tuning hyperparameter menggunakan GridSearchCV. Penelitian ini menggunakan metrik RMSE dan adjusted R-squared, yang dipilih berdasarkan relevansinya dengan tujuan penelitian. Hasil menunjukkan LGBM lebih unggul dari SVR dengan RMSE 7,2064 tahun dan adjusted R-squared 33,36% pada pria, serta RMSE 7,1475 tahun dan adjusted R-squared 22,16% pada wanita. Analisis korelasi menunjukkan hubungan yang wajar antara usia biologis dan usia kronologis serta korelasi yang cukup antara usia biologis dengan biomarker tekanan sistolik dan status hipertensi pada pria, serta tekanan sistolik dan kolesterol pada wanita. Analisis korelasi menunjukkan hubungan signifikan antara usia biologis dengan usia kronologis dan beberapa biomarker. Secara keseluruhan, LGBM lebih efektif dalam memprediksi usia biologis dibandingkan SVR. Hasil dari penelitian diharapkan dapat diaplikasikan dalam kehidupan sehari-hari, seperti membantu perusahaan asuransi menilai kelayakan klaim berdasarkan prediksi usia biologis, serta mendukung keputusan di bidang kesehatan preventif.

Biological age measures an individual's aging based on physical condition and organ function. Although numerous studies have been conducted to predict biological age using various methods, there is still room for further research in the application of machine learning techniques. This study implements two machine learning methods with different approaches, namely Support Vector Regression (SVR) and Light Gradient Boosting Machine (LGBM), to predict biological age using medical examination data from the Ministry of Health in 2011, covering 5960 subjects and 41 features. The preprocessing steps include filtering chronological age > 30 years, segregating data by gender, handling missing values and outliers, and data encoding. Feature selection using Spearman correlation coefficients resulted in 8 different features for each gender. The data was split into 90% for training and 10% for testing, with hyperparameter tuning performed using GridSearchCV. This study used RMSE and adjusted R-squared metrics, selected based on their relevance to the research objectives. The results show that LGBM outperformed SVR with an RMSE of 7.2064 years and an adjusted R-squared of 33.36% for men, and an RMSE of 7.1475 years and an adjusted R-squared of 22.16% for women. Correlation analysis revealed a significant relationship between biological age and chronological age, as well as a reasonable correlation between biological age and biomarkers such as systolic blood pressure and hypertension status in men, and systolic blood pressure and cholesterol in women. Overall, LGBM proved to be more effective in predicting biological age compared to SVR. The results of this study are expected to be applicable in everyday life, such as assisting insurance companies in evaluating claim eligibility based on biological age predictions, as well as supporting decision-making in preventive healthcare."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ricco Yhandy Fernando
"Penyakit pada paru-paru merupakan gangguan yang cukup serius dimana dapat menyerang sistem pernapasan manusia dan bisa berakibat fatal jika tidak ditangani dengan serius. Pada saat ini deteksi penyakit pada paru-paru masih dilakukan secara manual oleh para dokter ahli, namun proses secara manual memakan waktu lama. Oleh karena itu, dalam penelitian ini dibuat sistem yang dapat mendeteksi dan mengklasifikasi penyakit paru-paru dengan otomatis. Dalam penelitian ini akan digunakan dua metode yaitu Support Vector Machine dan Ensemble Bagging Gaussian Naïve Bayes . Data yang digunakan dalam penelitian ini adalah data screening yang berjumlah seratus data pasien, data di dapatkan dari salah satu sumber yang memiliki data primer yaitu salah satu rumah sakit di Yogyakarta. Penelitian ini menggunakan dua belas gejala paru-paru dan diklasifikasikan kedalam lima kelas penyakit paru-paru yaitu tuberkulosis, penyakit paru obstruktif kronis, pneumonia, asma bronkial, kanker paru. Sistem klasifikasi akan di implementasikan menggunakan bahasa pemrograman PHP. Pengujian kinerja klasifikasi menggunakan Confusion Matrix dan aplikasi diuji dengan menggunakan System Usability Scale. Penelitian ini menghasilkan sistem klasifikasi penyakit paru-paru dengan menggunakan metode Support Vector Machine dan Ensemble Bagging Gaussian Naïve Bayes, dari hasil pengujian akurasi Confusion Matrix pada algoritma Support Vector Machine mendapatkan hasil akurasi 93,9% , recall 92%, precison 79%, dan f1 score 54%, sedangkan pada Ensemble Bagging Gausian Naïve Bayes mendapatkan hasil akurasi 88,9 % recall 92%, precision 79%, f1 score 54%, serta pengujian sistem menggunakan metode System Usability Scale nilai yang diperolah sebesar 73 atau mendapatkan grade B.

Lung disease is a serious disorder that can attack the human respiratory system and can be fatal if not treated seriously. Currently, lung disease detection is still done manually by expert doctors, but the manual process takes a long time. Therefore, in this research a system was created that can detect and classify lung diseases automatically. In this research, two methods will be used, namely Support Vector Machine and Ensemble Bagging Gaussian Naïve Bayes. The data used in this research is screening data consisting of one hundred patient data, the data was obtained from one source that has primary data, namely one of the hospitals in Yogyakarta. This study used twelve lung symptoms and classified them into five classes of lung disease, namely tuberculosis, chronic obstructive pulmonary disease, pneumonia, bronchial asthma, lung cancer. The classification system will be implemented using the PHP programming language. Classification performance testing uses the Confusion Matrix and the application is tested using the System Usability Scale. This research produces a lung disease classification system using the Support Vector Machine method and Ensemble Bagging Gaussian Naïve Bayes, from the results of Confusion Matrix accuracy testing on the Support Vector Machine algorithm, the results are 93.9% accuracy, 92% recall, 79% precision, and f1 score was 54%, while Ensemble Bagging Gausian Naïve Bayes obtained accuracy results of 88.9%, recall 92%, precision 79%, f1 score 54%, and system testing using the System Usability Scale method obtained a score of 73 or got grade B.  "
Depok: Fakultas Teknik Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Dilla Fadlillah Salma
"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional Naïve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.

Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nadia Hartini Kusumawijaya
"Penuaan adalah salah satu faktor utama resiko terjadinya penyakit dan kematian. Laju
penuaan individu dengan usia kronologis yang sama terbukti bervariasi. Maka dari
itu, muncul kebutuhan untuk alat pengukuran penuaan yang lebih akurat, robust, dan
dapat diandalkan dibandingkan usia kronologis, yakni usia biologis. Pada penelitian
ini, penulis membangun model menggunakan Metode Random Forest Regression (RF)
dan Metode Support Vector Regression (SVR) untuk memprediksi umur biologis pada
data pemeriksaan medis, menilai dan mengevaluasi hasil kinerjanya, serta melakukan
komparasi kinerja kedua metode. Terkait metode yang digunakan, Metode RF adalah
metode yang mengaplikasikan Teknik Ensemble Learning dengan cara menggabungkan
beberapa decision tree untuk menghasilkan prediksi. Sedangkan, Metode SVR adalah
metode yang berkerja dengan cara membangun hyperplane atau kumpulan hyperplane
dalam ruang berdimensi tinggi yang dapat digunakan untuk regresi linier atau nonlinier.
Dataset yang digunakan adalah data medis yang berasal dari Kementrian Kesehatan
Republik Indonesia. Pada dataset dilakukan data preprocessing, yakni data diproses pada
aspek missing values handling, encoding, dan outliers detection and outliers handling.
Kemudian, dilakukan feature selection menggunakan Spearman’s Rank Correlation
Coefficient. Setelah itu, dilakukan pembangunan model dengan Metode RF dan model
dengan Metode SVR secara terpisah untuk masing - masing jenis kelamin. Terakhir,
performa model dievaluasi dan dibandingkan kinerjanya menggunakan metrik evaluasi
Root Mean Square Error (RMSE), Coefficient of Determination (R2), Adjusted R2, dan
running time. Metode RF menggunakan hyperparameter terbaik {’max depth’: 15,
’n estimators’: 1150} untuk dataset pria, dan {’max depth’: 15, ’n estimators’: 1250}
untuk dataset wanita. Sedangkan, Metode SVR menggunakan hyperparameter terbaik
{’C’: 2,’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset pria,
dan {’C’: 3, ’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset
wanita. Metode RF memiliki kinerja yang cukup baik, dengan nilai RMSE = 7,532; R2
= 0,403; Adjusted R2 = 0,351; running time = 0,154 untuk pria dan RMSE = 6,889;
R2 = 0,340; Adjusted R2 = 0,264; running time = 0,179 untuk wanita. Selain itu, SVR
juga memiliki performa yang cenderung sama namun sedikit lebih buruk, dengan nilai
RMSE = 7,692; R2 = 0,376; Adjusted R2 = 0,321; running time = 0,035 untuk pria dan
RMSE = 6,905; R2 = 0,337; Adjusted R2 = 0,306; running time = 0,080 untuk wanita.
Berdasarkan analisis kinerja model yang dilakukan pada penelitian ini model yang
dibangun dengan Metode Random Forest Regression lebih unggul dalam memprediksi
usia biologis dibandingkan dengan Metode Support Vector Regression.

Aging is one of the main risk factors for disease and death. The aging rate of individ- uals of the same chronological age has been shown to vary. So therefore, a need arises for a more accurate, robust, and reliable aging measurement tool than chronological age, namely biological age. In this research, the author build a model using the Random For- est Regression (RF) Method and the Support Vector Regression (SVR) Method to predict biological age from patient clinical data, assess and evaluate the performance results, and compare the performance of the two models. Regarding the method used, the Random Forest Regression Method is a method that applies the Ensemble Learning Technique by combining several decision trees to produce predictions. Meanwhile, the Support Vector Regression Method is a method that works by building a hyperplane or collection of hy- perplane in high-dimensional space which can be used for linear or nonlinear regression. The dataset used is medical data originating from the Ministry of Health of the Republic of Indonesia. On the dataset, data preprocessing is carried out, namely the data is processed in the aspects of missing values handling, encoding, and outliers detection and outliers handling. Then, feature selection is carried out using Spearman’s Rank Correlation Co- efficient. After that, machine learning model using RF Method and machine learning model using SVR Method were created separately for each gender. Finally, the model performance is evaluated and its performance compared using evaluation metrics, namely Root Mean Square Error (RMSE), Coefficient of Determination (R2), and Adjusted R2, as well as running time. The RF Method used best hyperparameters {’max depth’: 15, ’n estimators’: 1150} for the male dataset, and {’max depth’: 15, ’n estimators’: 1250 } for the female dataset. Meanwhile, the SVR Method used best hyperparameters {’C’: 2, ’epsilon’: 0.2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for the male dataset, and {’C’: 3, ’epsilon’: 0, 2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for female dataset. The result is that the model built using the RF Method has quite good performance, with an RMSE value of = 7.532; R2 = 0.403; Adjusted R2 = 0.351; running time = 0.154 for men and RMSE = 6.889; R2 = 0.340; Adjusted R2 = 0.264; running time = 0.179 for women. Apart from that, SVR also has performance that tends to be the same but slightly worse, with an RMSE value of = 7,692; R2 = 0.376; Adjusted R2 = 0.321; running time = 0.035 for men and RMSE = 6.905; R2 = 0.337; Adjusted R2 = 0.306; running time = 0.080 for women. Based on the model performance analysis carried out in this research, the model built using the Random Forest Regression Method is superior in predicting biological age compared to the Support Vector Regression Method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahri Alamsyah
"Dunia digital khususnya image processing berkembang seiring waktu berjalan dikarenakan kebutuhan masyarakat dan pentingnya keamanan sistem berbasis digital. Salah satu teknologi yang sangat mengalami kemajuan pesat adalah pengenalan wajah (face recognition) menggunakan artificial intelligence. Wajah seseorang yang sudah terdaftar di dalam database akan dikenali oleh sistem untuk keperluan validasi atau verifikasi. Di dalam penelitian ini dirancang sistem pengenalan wajah (face recognition) menggunakan algoritma machine learning dan Principal Component Analysis (PCA) sebagai pereduksi dimensi. Pengujian dilakukan dengan menggunakan beberapa metode, yakni: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K- NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) dan Convolutional Neural network (CNN). CNN berfokus pada layer dan tidak memerlukan reduksi dimensi, sehingga hasilnya lebih akurat. Model machine learning yang digunakan untuk classifier selain CNN adalah standar/default, sedangkan CNN menggunakan arsitektur LeNet-5, dengan dropout rate sebesar 0.25. Training dilakukan selama 60 epoch dengan loss function crosscategorical entropy, optimizer Adam, dan batch size sebesar 20. Data masukan adalah citra wajah berukuran 64 × 64 × 1 yang diperoleh dari dataset olivetti faces. Akurasi tertinggi metode PCA, SVM, maupun LR sebesar 91.25%, sementara akurasi terbaik CNN mencapai 98.75%. Selain akurasi, pemakaian confusion matrix dan classification report digunakan untuk menguji performa metode yang ada melalui evaluasi model klasifikasi.

The digital world, especially image processing, is evolving due to the needs of society and the importance of digital-based system security. One of the technologies that are rapidly progressing is face recognition using artificial intelligence. The system will recognize a person's face already registered in the database for validation or verification purposes. A face recognition system was designed using machine learning algorithms and Principal Component Analysis (PCA) as dimension reduction in this study. Testing is conducted using several methods: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K-NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) and Convolutional Neural network (CNN). CNN focuses on layers and does not require dimensional reduction to increase the accuracy of the result. The machine learning model used for classifiers other than CNN is standard/default settings, while CNN uses the LeNet-5 architecture, with a dropout rate of 0.25. The training was conducted for 60 epochs with loss function cross-categorical entropy, optimizer Adam, and batch size of 20. Input data is a 64 × 64 × 1 facial image obtained from the Olivetti faces database. The highest accuracy of PCA, SVM and LR methods was 91.25%, while CNN's best accuracy reached 98.75%. In addition to accuracy, the use of confusion matrix and classification report is used to test the performance of existing methods through the evaluation of classification models."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Angelica Patricia Djaya Saputra
"Penuaan biologis mencerminkan kondisi kesehatan fisik yang sebenarnya karena menilai fungsi organ dan sistem tubuh yang sebenarnya pada setiap individu, berbeda dengan usia kronologis. Penelitian ini mengeksplorasi prediksi usia biologis menggunakan metode Support Vector Regression (SVR) dan Klemera-and-Doubal Method (KDM), yang berfokus pada pengaruh biomarker dan faktor eksternal pada proses penuaan. Pembangunan model memanfaatkan data pemeriksaan medis dari Kementerian Kesehatan Indonesia pada tahun 2011 dimana keterbaharuan dari penelitian ini adalah melibatkan semua fitur yang berperngaruh terhadap usia biologis, termasuk faktor eksternal, tidak hanya biomarker saja. Kemudian, dilakukan pemanfaatan seluruh dataset tanpa membedakan subjek sehat dan tidak sehat. Pada dataset dilakukan data preprocessing agar dataset siap digunakan dengan melakukan filtering usia di atas 30 tahun, pemisahan dataset pria dan wanita, menghapus fitur yang tidak relevan, mengubah tipe data yang tidak sesuai, mengidentifikasi dan melakukan penanganan missing value serta outliers, dan melakukan encoding untuk data beripe kategorikal. Kemudian, dilakukan feature selection dengan menggunakan Spearman’s rank Coefficient Corelation dan pembangunan model SVR dan KDM. Hasil penelitian menunjukkan bahwa terpilih 5 fitur untuk pria dan 6 fitur untuk wanita yang digunakan untuk membangun model SVR dan KDM. KDM menunjukkan performa evaluasi yang cukup baik dalam interpretasi variasi data dengan skor performa RMSE 1,39; R2 0,97; dan Adjusted R2 0,97 untuk pria dan RMSE 1,00; R2 0,99; dan Adjusted R2 0,99 untuk wanita. Metode ini lebih unggul daripada SVR yang cenderung menunjukkan performa yang kurang memuaskan dimana memiliki skor performa RMSE 6,36; R2 0,44; dan Adjusted R2 0,36 untuk pria dan RMSE 5,90; R2 0,57; dan Adjusted R2 0,53 untuk wanita. Berdasarkan hasil analisis dari berbagai teknik analisis yang dilakukan (analisis evaluasi performa, analisis hubungan usia kronologis dengan usia biologis, dan analisis evaluasi dengan melihat pola hasil estimasi) terlihat bahwa metode KDM lebih unggul dalam memprediksi usia biologis dibandingkan dengan SVR, terutama dalam hal konsistensi dan akurasi. Selain itu, analisis hubungan setiap fitur dengan usia biologis untuk tiap model menggambarkan pengaruh fitur-fitur tersebut terhadap fungsi organ tubuh seseorang.

The biological aging reflects the actual physical health condition as it assesses the real function of organs and body systems in each individual, different from chronological age. This research explores the prediction of biological age using the Support Vector Regression (SVR) method and the Klemera-and-Doubal Method (KDM), focusing on the influence of biomarkers and external factors on the aging process. The model development utilized medical examination data from the Indonesian Ministry of Health in 2011, where the novelty of this research is involving all features that affect biological age, including external factors, not just biomarkers. Then, the entire dataset was utilized without distinguishing between healthy and unhealthy subjects. In the dataset, data preprocessing was performed to make the dataset ready to use by filtering ages above 30 years, separating datasets for men and women, removing irrelevant features, changing inappropriate data types, identifying and handling missing values and outliers, and encoding for categorical data. Subsequently, feature selection was conducted using Spearman's Rank Coefficient Correlation, and then the SVR and KDM models were built. The research results showed that 5 features for men and 6 features for women were selected to build the SVR and KDM models. KDM showed fairly good evaluation performance in interpreting data variations with performance scores of RMSE 1.39, R^2 0.97, and Adjusted R^2 0.97 for men and RMSE 1.00, R^2 0.99, and Adjusted R^2 0.99 for women. This method outperformed SVR, which tended to show less satisfactory performance with performance scores of RMSE 6.36, R^2 0.44, and Adjusted R^2 0.36 for men and RMSE 5.90, R^2 0.57, and Adjusted R^2 0.53 for women. Based on the analysis results from various techniques performed (performance evaluation analysis, analysis of the relationship between chronological age and biological age, and evaluation analysis by looking at the pattern of estimation results), it appears that the KDM method is superior in predicting biological age compared to SVR, especially in terms of consistency and accuracy. In addition, the analysis of the relationship of each feature with biological age for each model illustrates the influence of these features on the organ function of an individual."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Faisa Maulidina
"Kanker merupakan pertumbuhan sel abnormal di dalam tubuh yang tidak terkendali. Ketika kanker dimulai di paru-paru, hal ini dinamakan sebagai kanker paru-paru. Terdapat faktor-faktor tertentu yang meningkatkan risiko seseorang yang mengidap penyakit ini, yaitu dengan merokok (termasuk perokok pasif), riwayat kanker paru-paru dalam keluarga, terpapar radiasi, dan infeksi HIV. Penyakit ini dapat didiagnosis melalui image tests, diantaranya yaitu chest x-ray, CT scan, MRI scan, PET scan, dan bone scan. Meskipun diagnosa telah dilakukan dengan banyak cara, namun masih terdapat banyak kesalahan dalam mendiagnosa penyakit tersebut. Untuk mengatasi dan membantu hal tersebut, klasifikasi penyakit kanker paru-paru dapat dilakukan dengan menggunakan metode machine learning. Dataset yang akan digunakan untuk mengklasifikasikan penyakit ini berupa CT Scan yang didapatkan dari Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Metode klasifikasi yang digunakan adalah Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), dimana Particle Swarm Optimization-Genetic Algorithm (PSO-GA) digunakan untuk mengoptimisasi parameter pada Support Vector Machine (SVM). Untuk mengevaluasi hasil kinerja metode tersebut, akan dilihat nilai akurasi, presisi, recall, dan f1-score dan dibandingkan dengan metode SVM tanpa optimisasi. Dari hasil yang didapat, klasifikasi dengan menggunakan Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM) menghasilkan performa yang lebih baik jika dibandingkan dengan Support Vector Machine (SVM) tanpa optimisasi parameter.

Cancer is an uncontrolled growth of abnormal cells in the body. When cancer starts in the lungs, it is referred as lung cancer. There are certain factors that increase a person's risk of this disease, such as smoking (including passive smoker), a family history of lung cancer, exposure to radiation, and HIV infection. This disease can be diagnosed through image tests, including chest x-ray, CT scan, MRI scan, PET scan, and bone scan. Although diagnosis has been made in many ways, there are still many errors in diagnosing the disease. To overcome and help this problem, the classification of lung cancer can be done by using machine learning method. The dataset that used to classify this disease is CT Scan obtained from Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The classification method that will be used is Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), where Particle Swarm Optimization-Genetic Algorithm (PSO-GA) was used to optimize the parameters of the Support Vector Machine (SVM). To evaluate the results of the performance of the method, values of accuracy, precision, recall, and f1-score will be seen and it will be compared with SVM without the optimization. From the results obtained, classification using Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO- GA-SVM) produces better performance compared to Support Vector Machine (SVM) without parameter optimization."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Faisa Maulidina
"Kanker merupakan pertumbuhan sel abnormal di dalam tubuh yang tidak terkendali. Ketika kanker dimulai di paru-paru, hal ini dinamakan sebagai kanker paru-paru. Terdapat faktor-faktor tertentu yang meningkatkan risiko seseorang yang mengidap penyakit ini, yaitu dengan merokok (termasuk perokok pasif), riwayat kanker paru-paru dalam keluarga, terpapar radiasi, dan infeksi HIV. Penyakit ini dapat didiagnosis melalui image tests, diantaranya yaitu chest x-ray, CT scan, MRI scan, PET scan, dan bone scan. Meskipun diagnosa telah dilakukan dengan banyak cara, namun masih terdapat banyak kesalahan dalam mendiagnosa penyakit tersebut. Untuk mengatasi dan membantu hal tersebut, klasifikasi penyakit kanker paru-paru dapat dilakukan dengan menggunakan metode machine learning. Dataset yang akan digunakan untuk mengklasifikasikan penyakit ini berupa CT Scan yang didapatkan dari Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Metode klasifikasi yang digunakan adalah Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), dimana Particle Swarm Optimization-Genetic Algorithm (PSO-GA) digunakan untuk mengoptimisasi parameter pada Support Vector Machine (SVM). Untuk mengevaluasi hasil kinerja metode tersebut, akan dilihat nilai akurasi, presisi, recall, dan f1-score dan dibandingkan dengan metode SVM tanpa optimisasi. Dari hasil yang didapat, klasifikasi dengan menggunakan Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM) menghasilkan performa yang lebih baik jika dibandingkan dengan Support Vector Machine (SVM) tanpa optimisasi parameter.

Cancer is an uncontrolled growth of abnormal cells in the body. When cancer starts in the lungs, it is referred as lung cancer. There are certain factors that increase a person's risk of this disease, such as smoking (including passive smoker), a family history of lung cancer, exposure to radiation, and HIV infection. This disease can be diagnosed through image tests, including chest x-ray, CT scan, MRI scan, PET scan, and bone scan. Although diagnosis has been made in many ways, there are still many errors in diagnosing the disease. To overcome and help this problem, the classification of lung cancer can be done by using machine learning method. The dataset that used to classify this disease is CT Scan obtained from Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The classification method that will be used is Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), where Particle Swarm Optimization-Genetic Algorithm (PSO-GA) was used to optimize the parameters of the Support Vector Machine (SVM). To evaluate the results of the performance of the method, values of accuracy, precision, recall, and f1-score will be seen and it will be compared with SVM without the optimization. From the results obtained, classification using Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO- GA-SVM) produces better performance compared to Support Vector Machine (SVM) without parameter optimization."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>