Tryan Aditya Putra
Studi literatur yang dilakukan pada Tesis ini adalah untuk merancang, menguji, dan menganalisa algoritma identifikasi manusia berdasarkan analisa gait menggunakan deterministic learning. Pelatihan dan pengujian pada algoritma akan dilakukan dengan menggunakan basis data CASIA. Basis data tersebut merupakan basis data gambar dan video yang berisi beberapa orang yang berjalan. Variasi kondisi objek berjalan akan menjadi variable yang diukur keberhasilanya. Hasil literatur pada tesis ini menunjukan bahwa pengenalan identitas manusia akan dapat dilakukan dengan baik. Tujuan pengidentifikasian manusia ini akan digunakan dalam sistem keamanan yang dapat dengan aktif mengidentifikasi siapapun yang dilihat kamera. Dengan metode deterministic learning identifikasi manusia dapat dilakukan hingga mencapai 91,25% dengan pengujian menggunakan cross validation.
Literature study has done on this tesis to design, test, and analyze human identification algorithm based on gait analysis using deterministic learning. Algorithm will be trained and tested using database CASIA. The database is a database of images and videos that contains some people walking. Variations walking object conditions will be variable being measured its successfulness. Results of the literatur on this tesis showed that the intification of human identity can be done well. Human identification purposes will be used in a security system that can actively identify anyone who visits the camera. Deterministic learning method can identified human with accuration up to 91.25% and tested by cross validation method.
Glorya Khoirunnissa
Kategori email dapat diklasifikasikan dengan menggunakan pemrosesan bahasa alami (natural language processing) dan machine learning untuk mempelajari pola kata pada email. Model yang digunakan adalah support vector machine, multinomial naïve bayes, dan random forest dan digunakan teknik oversampling berupa random oversampling, synthetic minority over-sampling (SMOTE), dan adaptive synthetic sampling (ADASYN) untuk menyeimbangkan distribusi kelas dan meningkatkan performa pada model. Hasil yang diperoleh bahwa teknik ADASYN menghasilkan performa terbaik dalam klasifikasi email yang divalidasi dengan k-fold cross-validation (k=7) dibandingkan dua teknik lainnya. Rata-rata akurasi mencapai 97.87% pada support vector machine, sedangkan multinomial naive bayes 77.97% , dan random forest 95.94% dengan menggunakan teknik ADASYN. ......Email categories can be classified using natural language processing (NLP) and machine learning to learn word patterns in emails. The models used are support vector machine, multinomial naïve Bayes, and random forest. Oversampling techniques such as random oversampling, synthetic minority over-sampling (SMOTE), and adaptive synthetic sampling (ADASYN) are employed to balance the class distribution and improve model performance. The results show that the ADASYN technique achieves the best performance in email classification validated with k-fold cross-validation (k=7) compared to the other two techniques. The average accuracy reaches 97.87% for support vector machine, 77.97% for multinomial naïve Bayes, and 95.94% for random forest when using the ADASYN technique.
Depok: Fakultas Teknik Universitas Indonesia, 2023
Yogi Kurnia
Tingginya jumlah peserta seleksi beasiswa yang tidak lulus, menyebabkan tidak efisiennya penyelenggaraan kegiatan seleksi beasiswa di LPDP. Berdasarkan data hasil seleksi beasiswa, terlihat bahwa persentase kelulusan peserta sangat rendah tiap tahunnya. Pada tahun 2013 proporsi yang tidak lulus seleksi sebesar 54%, sedangkan pada tahun 2014 dan tahun 2015 meningkat menjadi 85% dan 71%. Secara keseluruhan, terdapat 74% pendaftar beasiswa LPDP yang tidak lulus seleksi beasiswa dari tahun 2013 hingga tahun 2015. Hal ini menyebabkan tingginya biaya yang dikeluarkan untuk pelaksanaan seleksi. Jika LPDP bisa memprediksi peluang kelulusan peserta, maka biaya tersebut bisa dikurangi. Teknik klasifikasi pada data mining merupakan teknik yang tepat untuk permasalahan ini. Metodologi yang digunakan dalam penelitian ini adalah knowledge discovery in databases (KDD). Metodologi ini terdiri dari 5 (lima) langkah, yaitu selection, preprocessing, transformation, data mining, dan interpretation / evaluation. Dataset bersumber dari data formulir pendaftaran beasiswa dan hasil wawancara. Proses pemodelan menggunakan software Rapid Miner dan algoritma decision tree. Model yang dihasilkan dievaluasi menggunakan k-fold cross validation. Hasil penelitian ini yaitu LPDP dapat memprediksi peluang kelulusan peserta seleksi. ......The high number of participants who did not pass the scholarship selection, leading to inefficient operation of the selection of scholarship in the LPDP. Based on data from scholarship selection results, it appears that a very low percentage of graduation of each year. In 2013 the proportion who were not selected by 54%, whereas in 2014 and 2015 increased to 85% and 71%. Overall, there is a 74% LPDP scholarship applicants who did not pass the selection of scholarship from 2013 to 2015. This led to high costs incurred for the implementation of the selection. If LPDP can predict the chances of graduation participants, the cost can be reduced. Classification techniques in data mining is a technique that is appropriate for this problem. The methodology used in this study is a knowledge discovery in databases (KDD). This methodology consists of five (5) steps, namely selection, preprocessing, transformation, data mining, and interpretation / evaluation. Dataset data sourced from the scholarship application form and interview. Process modeling using software Rapid Miner and decision tree algorithm. The resulting model was evaluated using the k-fold cross validation. Results of this study are LPDP can predict the chances of graduation of the selection.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2016
Desti Fitriati
Penelitian ini melakukan klasifikasi stadium penyakit Diabetik Retinopati (DR) menjadi 2 hirarki, yaitu Global dan Lokal. Hirarki Global hanya terdiri dari normal (0) dan abnormal (1). Sedangkan klasifikasi lokal terdiri dari 4 kategori yaitu kategori normal (R0), early NPDR (R1), advanced NPDR (R3), dan PDR (R4). Kategori early NPDR adalah stadium mild NPDR, sedangkan advanced NPDR adalah gabungan dari moderate dan severe NPDR. Secara umum penelitian ini dilakukan untuk menyelesaikan masalah yang timbul akibat adanya kemiripan citra per kenaikan stadium yang tidak bisa dinilai secara kasat mata. Sehingga membutuhkan sebuah penanganan dimana citra retina dapat digolongkan ke dalam kategori yang tepat. Berdasarkan masalah tersebut, dilakukan 2 mekanisme percobaan untuk setiap hirarki, yaitu melalui pendekatan computer vision yang hanya fokus untuk mengolah citra secara keseluruhan dan pendekatan yang dilakukan oleh medis dimana sebelum menentukan kategori citra, terlebih dahulu dilakukan deteksi fitur penanda DR seperti eksudat, mikroaneurisma, dan pembuluh darah. Data yang digunakan ada 2 jenis yaitu data citra dari RSCM Jakarta dan database publik Diaretdb0. Metode klasifikasi ELM yang diusulkan mampu memberikan performansi yang cukup baik dari sisi waktu dan akurasi, dimana rata-rata klasifikasi menggunakan cross validation mencapai 50% untuk data RSCM dan 60% untuk data DB0. Sedangkan untuk klasifikasi lokal mencapai 50% untuk data RSCM dan 40% untuk data DB0. ......This study determined the classification of the stage of disease Diabetic retinopathy (DR) into two hierarchies , namely the Global and the Local . Global hierarchy consisting only of normal (0) and abnormal (1). While local classification consists of 4 categories: normal category (R0), early NPDR (R1), advanced NPDR (R3), and PDR (R4). Categories early stages of NPDR is Mild NPDR, whereas advanced NPDR is a combination of moderate and severe NPDR. In general, this study was conducted to resolve the problems arising from the similarity image that stage increments can not be assessed by naked eye . Thus require a treatment in which the retinal image can be classified into appropriate categories . Based on these issues, conducted 2 experiments for each hierarchy mechanism, namely through the computer vision approach that only focuses on the image of the overall process and the approach taken by a medical before determining which image category , first detection of features such as bookmarks DR exudates, microaneurysms, and blood vessels . The data used there are 2 types of image data from public databases RSCM Jakarta and Diaretdb0. The proposed classification method ELM is able to provide good enough performance in terms of time and accuracy , where the average classification using cross validation to achieve 50 % for data RSCM and 60 % for data DB0. Whereas for the local classification, data RSCM achieve 50 % and 40 % for data DB0.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2014
Akhmad Syafaat
Universitas XYZ sebagai institusi Perguruan Tinggi Terbuka Jarak Jauh (PTTJJ), senantiasa menjaga kualitas layanannya agar tetap berkualitas. Salah satu layanan yang senantiasa dijaga adalah layanan Bahan Ajar. Layanan Bahan Ajar didukung dengan manajemen stok bahan ajar dari mulai perencanaan dengan melakukan estimasi kebutuhan bahan ajar, gudang bahan ajar untuk menyimpan persediaan bahan ajar dan Student Record System (SRS). Bahan Ajar disiapkan dalam dua program yaitu melalui Sistem Paket Semester (Paket) dan non-paket. Mahasiswa yang mengikuti program nonpaket tidak diwajibkan membayar tagihan biaya bahan ajar. Untuk menjaga kualitas layanan bahan ajar, Universitas XYZ melakukan estimasi kebutuhan bahan ajar. Estimasi dilakukan secara manual dengan menggunakan formula yang berbeda pada setiap tahunnya. Estimasi dilakukan sebelum dan sesudah masa registrasi mata kuliah. Kenyataannya, kebutuhan bahan ajar masih mengalami kekurangan. Hal ini diketahui pada akhir tahun terdapat perbedaan antara hasil estimasi dan realisasi, sehingga tidak sedikit mahasiswa mendapatkan bahan ajar ketika memasuki akhir semester bahkan ketika memasuki awal semester baru. Penelitian ini bertujuan untuk menentukan berapa banyak bahan ajar yang harus disiapkan dengan cara mempelajari profil mahasiswa melalui data history mahasiswa menggunakan teknik classification. Metode yang digunakan Naïve Bayes, Decision Tree dan Support Vector Machine. Evaluasi menggunakan metode cross validation dengan nilai k 2, 3, 5 dan 10. Hasil percobaan menunjukkan bahwa metode Decision Tree memiliki accuracy tertinggi dibanding dengan yang lain. ......XYZ University as an institution of Distance Learning Higher Education (PTTJJ), always maintains the quality of its services to remain qualified. One service that is always maintained is the Teaching Materials service. Teaching Material Services are supported by the management of teaching material stocks from the start of planning by estimating teaching material requirements, warehouse of teaching materials to store supplies of teaching materials and Student Record System (SRS). Teaching Materials are prepared in two programs, namely through the Semester Package System (Package) and nonpackage. Students who take non-package programs are not required to pay bills for teaching materials. To maintain the quality of teaching material services, XYZ University estimates the need for teaching materials. Estimates are done manually by using a different formula each year. Estimates are made before and after the registration period of the course. In fact, the need for teaching materials is still lacking. This is known at the end of the year there is a difference between the results of estimation and realization, so that not a few students get teaching materials when entering the end of the semester even when entering the beginning of the new semester. This study aims to determine how much teaching material must be prepared by studying student profiles through student history data using classification techniques. The method used is Naïve Bayes, Decision Tree and Support Vector Machine. The evaluation uses the cross validation method with values k 2, 3, 5 and 10. The experimental results show that the Decision Tree method has the highest accuracy compared to the others.
Jakarta: Fakultas Ilmu Komputer Universitas Indonesia, 2019
Alfina Wijaya
Premi adalah sejumlah uang yang ditetapkan oleh perusahaan asuransi atau perusahaan reasuransi dan disetujui oleh pemegang polis untuk dibayarkan. Hal tersebut sesuai dengan perjanjian asuransi atau perjanjian reasuransi. Dalam penetapan tarif premi asuransi kendaraan bermotor, perusahaan asuransi memperhitungkan eksposur risiko yang diterima kendaraan bermotor untuk mengestimasi jumlah klaim. Pada umumnya, perusahaan asuransi kendaraan bermotor hanya memperhitungkan faktor durasi kontrak asuransi dalam memperhitungkan eksposur risiko. Namun, pada kenyataannya terdapat faktor lain yang memengaruhi risiko terjadinya kecelakaan, salah satunya adalah jarak tempuh kendaraan. Faktor risiko jarak tempuh telah dipertimbangkan pada asuransi Pay-As-You-Drive (PAYD). Pada penelitian ini, dilakukan penghitungan eksposur risiko pada kendaraan bermotor dengan memperhitungkan jarak tempuh kendaraan dan durasi kontrak asuransi. Tujuannya adalah untuk melihat efek simultan yang dihasilkan oleh jarak tempuh dan durasi kontrak asuransi sebagai kovariat terhadap variabel respons jumlah klaim menggunakan Generalized Additive Model (GAM). GAM digunakan untuk menangkap kemungkinan adanya hubungan non-linear antara kovariat dengan variabel respons. Dalam penelitian ini, GAM dikonstruksi dengan cubic splines dan untuk mengestimasi koefisien model, digunakan metode Penalized Iteratively Reweighted Least Squares (PIRLS). Setelah koefisien model diestimasi, GAM dapat digunakan untuk memprediksi nilai frekuensi klaim. Nilai frekuensi tersebut dapat dimanfaatkan untuk menentukan relativitas harga premi terhadap reference premium. Reference premium adalah nilai premi yang diterapkan ketika diasumsikan tidak ada pengaruh dari kovariat. Selanjutnya, GAM diimplementasikan pada data klaim asuransi kendaraan bermotor untuk menentukan tarif premi. ......Premium is an amount of money set by an insurance company or reinsurance company and agreed upon by the policyholder to be paid based on an insurance or reinsurance policy. In establishing premium rates for motor vehicle insurance, insurance companies consider the risk exposure associated with motor vehicles to calculate the estimated number of claims. Generally, motor vehicle insurance companies only consider the duration of the insurance contract when calculating risk exposure. However, there are other factors that influence the risk of accidents, one of which is the distance traveled by the vehicle. The mileage risk factor has been considered in Pay-As-You-Drive (PAYD) insurance. In this study, risk exposure in motorized vehicles was calculated by considering the distance traveled by the vehicle and the duration of the insurance contract. The objective is to examine the simultaneous effects of mileage and insurance contract duration as covariates on the response variable of claim amount using the Generalized Additive Model (GAM). GAM is used to capture the possibility of a non-linear relationship between the covariates and the response variable. In this study, GAM is constructed with cubic splines and to estimate the model coefficients, the Penalized Iteratively Reweighted Least Squares (PIRLS) method is used. Once the model coefficients are estimated, the GAM can be used to predict claim frequency values. The frequency value can be used to determine the relativity of the premium price to the reference premium. The reference premium is the premium value that is applied when it is assumed that there is no influence from covariates. Furthermore, GAM is implemented on motor vehicle insurance claim data to determine premium rates.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
Zalfa Nurfadhilah Haris
Kemiskinan merupakan salah satu masalah sosial yang masih menjadi perhatian pemerintah. Hampir seluruh negara berkembang memiliki standar hidup yang masih rendah. Salah satu cara untuk mengurangi kemiskinan adalah dengan menganalisis faktor-faktor yang memengaruhi Salah satu metode yang cocok dalam menganalisis tingkat kemiskinan adalah dengan menggunakan Geographically Weighted Regression (GWR). Hal ini dikarenakan dalam model GWR dipertimbangkan aspek spasial yang berbeda-beda untuk masing-masing lokasi pengamatan. Dalam model GWR dilakukan pendekatan analisis regresi yang digunakan untuk memahami hubungan spasial antara variabel-variabel dalam konteks geografi. Hal ini dikarenakan model GWR mempertimbangkan jarak lokasi pengamatan dengan lokasi sekitarnya, model GWR juga mempertimbangkan pembobot pada masing-masing lokasi pengamatan. Daerah yang dekat dengan lokasi pengamatakan mendapatkan pembobot yang lebih besar daripada daerah yang jauh dengan lokasi pengamatan, dalam hal ini penentuan pembobot dalam model GWR bergantung pada bandwidth. Dalam penelitian ini dilakukan analisis dengan mempertimbangkan empat pembobot spasial yaitu fixed gaussian kernel, fixed bisquare kernel, fixed tricube kernel, dan fixed exponential kernel yang diterapkan pada dua bandwidth yaitu bandwidth CV dan bandwidth AIC. Variabel dependen yang digunakan adalah tingkat kemiskinan dan variabel independen yang digunakan adalah rata-rata lama sekolah, upah minimum, tingkat pengangguran, indeks pembangunan manusia, angka harapan hidup dan jumlah penduduk. Hasil dari penelitian ini menunjukkan bahwa pada 118 Kabupaten/Kota di Pulau Jawa memiliki model GWR yang berbeda-beda. Untuk model GWR menggunakan bandwidth CV diperoleh model terbaik dengan menggunakan fixed exponential kernel dengan sembilan kelompok variabel yang signifikan, untuk model GWR menggunakan bandwidth AIC diperoleh model terbaik dengan menggunakan fixed bisquare kernel dengan enam kelompok variabel yang signifikan. ...... Poverty is one of the social issues that continues to be a concern for the government. Almost all developing countries have low living standards. One way to reduce poverty is by analyzing the factors that influence it. One suitable method for analyzing poverty levels is by using Geographically Weighted Regression (GWR). This is because the GWR model considers different spatial aspects for each observation location. In the GWR model, a regression analysis approach is used to understand the spatial relationship between variables in a geographical context. This is because the GWR model considers the distance between the observation location and its surrounding locations. The GWR model also considers weighting for each observation location. Areas close to the observation location are given a higher weight than areas far from the observation location. In this case, the determination of the weight in the GWR model depends on the bandwidth. This research analyzes four spatial weights, namely fixed Gaussian kernel, fixed bisquare kernel, fixed tricube kernel, and fixed exponential kernel, applied to two bandwidths: CV bandwidth and AIC bandwidth. The dependent variable used is the poverty rate, and the independent variables used are average length of schooling, minimum wage, unemployment rate, human development index, life expectancy, and population. The results of this study show that the 118 districts in Java Island have different GWR models. For the GWR model using the CV bandwidth, the best model is obtained using the fixed exponential kernel with nine significant variable groups. For the GWR model using the AIC bandwidth, the best model is obtained using the fixed bisquare kernel with six significant variable groups.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
Siti Khadijah
Penyakit stroke adalah penyebab kematian terbesar kedua di dunia. Pasien stroke harus menjalani perawatan berupa latihan rehabilitasi secara rutin untuk memulihkan fungsi motorik mereka. Sering kali pasien stroke kesulitan mendapatkan perawatan karena keterbatasan ekonomi dan mobilisasi. Selain itu, kondisi pandemi COVID-19 sekarang ini membuat pasien takut untuk pergi ke rumah sakit. Telehealth sebagai pelayanan kesehatan jarak jauh merupakan salah satu solusi untuk kondisi tersebut. Aplikasi telehealth untuk rehabilitasi stroke dapat dikembangkan dikombinasikan dengan teknologi human motion detection. Penelitian ini bertujuan untuk mengetahui model human motion detection yang dapat mendeteksi gerakan secara stabil serta untuk mengetahui model klasifikasi yang dapat mengklasifikasi gerakan stroke dan non stroke secara akurat. Penelitian dilakukan menggunakan data video gerakan pasien stroke dan orang sehat sebagai input model human motion detection. Keypoints hasil ekstraksi dari model human motion detection kemudian ditransformasi menjadi gambar RGB dan digunakan sebagai input model klasifikasi. Penelitian ini membandingkan tiga model human motion detection, yaitu PoseNet, BlazePose, dan MoveNet, serta dua model klasifikasi gambar, yaitu AlexNet dan SqueezeNet. Beberapa eksperimen dilakukan untuk mengklasifikasi gerakan stroke dan non stroke. Terdapat eksperimen dengan pembagian data tanpa 3-Fold Cross Validation, eksperimen dengan pembagian data 3-Fold Cross Validation, eksperimen menggunakan semua keypoints hasil ekstraksi model human motion detection, dan eksperimen menggunakan beberapa keypoints yang relevan. Model human motion detection dan model klasifikasi terbaik dari hasil penelitian ini diharapkan dapat berkontribusi kepada para pihak yang ingin mengembangkan aplikasi telehealth sebagai sarana rehabilitasi stroke. Berdasarkan hasil penelitian ini, didapatkan bahwa MoveNet adalah model human motion detection yang paling stabil dalam memantau pergerakan pasien dan AlexNet adalah model klasifikasi terbaik untuk mengklasifikasikan pasien stroke dan non stroke berdasarkan gerakan upper body dan gerakan lower body.

Stroke is the second biggest cause of death in the world. Stroke patients must undergo rehabilitation on regular basis to exercise and restore their motor functions. Oftentimes, stroke patients find it difficult to get their treatment because of economic and mobility limitations. In addition, the current state of the COVID-19 pandemic makes patients afraid to go to the hospital. Telehealth as a long-distance health service is one of the solution for this condition. Telehealth applications for stroke rehabilitation can be developed in combination with human motion detection technology. This study aims to determine the human motion detection model that can detect movement steadily and determine the classification model that can classify stroke and non-stroke motions accurately. The study was conducted using video data of stroke patients and healthy people as input for the human motion detection model. Keypoints extracted from the human motion detection model are then transformed into RGB images and used as input for the classification model. This study compares three models of human motion detection, namely PoseNet, BlazePose, and MoveNet and two image classification models, namely AlexNet and SqueezeNet. Several experiments were conducted to classify stroke and non-stroke motions. There are experiments without data splitting 3-Fold Cross Validation, experiments with data splitting 3-Fold Cross Validation, experiments using all keypoints extracted from the human motion detection model, and experiments using several relevant keypoints. The most steady human motion detection model and the best classification model from the results of this study are expected to contribute to those who want to develop telehealth applications as a means of stroke rehabilitation. Based on the results of this study, it was found that MoveNet is the most steady human motion detection model for monitoring the patients motions and AlexNet is the best classification model for classifying stroke and non stroke patients based on upper body and lower body movements.

Jakarta: Fakultas Ilmu Komputer Universitas Indonesia, 2022
Carisa Putri Salsabila Purnamasari
Pengangguran merupakan fenomena sosial yang menjadi salah satu masalah utama yang dihadapi setiap daerah di Indonesia. Salah satu cara yang dapat dilakukan untuk mengurangi angka pengangguran adalah dengan melakukan analisis terhadap faktor-faktor yang mempengaruhi tingkat pengangguran terbuka (TPT). Dibandingkan dengan metode analisis regresi linier, metode Geographically Weighted Regression (GWR) lebih diunggulkan karena dapat menangani masalah ketidakstasioneran spasial yang biasanya terjadi pada data fenomena sosial. Ketidakstasioneran spasial adalah situasi dimana hubungan antar variabel berbeda-beda secara signifikan di setiap lokasi pengamatan. Ketidakstasioneran spasial ini sering disebut juga dengan heterogen spasial. Heterogenitas spasial mengakibatkan hasil analisis regresi linier menjadi tidak akurat di beberapa lokasi. GWR menangani masalah tersebut dengan membangun model regresi di setiap lokasi pengamatan sehingga memungkinkan parameter regresi menjadi berbeda di setiap lokasi pengamatan. Pendugaan parameter pada model GWR menggunakan pembobot berdasarkan lokasi setiap pengamatan sehingga model yang diperoleh berlaku hanya untuk lokasi tersebut. Penentuan pembobot bergantung pada nilai bandwidth. Bandwidth merupakan lingkaran dengan radius ℎ dari titik pusat lokasi pengamatan yang digunakan sebagai dasar penentuan pembobot setiap lokasi pengamatan. Nilai bandwidth yang sangat kecil akan mengakibatkan variansi yang besar. Hal tersebut disebabkan karena jika nilai bandwidth sangat kecil maka jumlah pengamatan yang berada pada radius h menjadi sedikit, sehingga menyebabkan model yang diperoleh sangat kasar (undersmoothing) karena menggunakan sedikit pengamatan, dan sebaliknya. Oleh karena itu, pemilihan bandwidth optimum sangat penting dalam menentukan pembobot karena dapat mempengaruhi ketepatan model yang terbentuk. Penelitian ini bertujuan untuk mengetahui perbandingan performa model GWR yang menggunakan metode bandwidth CV, AICc, dan BIC dalam pembentukan fungsi pembobot Fixed Gaussian Kernel yang diterapkan pada data pengangguran di kabupaten/kota di Pulau Jawa. Variabel dependen yang digunakan dalam penelitian ini adalah tingkat pengangguran terbuka kabupaten/kota di Pulau Jawa, dan variabel independen yang digunakan adalah kepadatan penduduk, indeks pembangunan manusia, tingkat partisipasi angkatan kerja, upah minimum kabupaten/kota, rata-rata upah sebulan pekerja formal, dan rata-rata pendapatan bersih sebulan pekerja informal. Hasil penelitian menunjukkan bahwa setiap kabupaten/kota memiliki model GWR yang berbeda-beda. Model GWR bandwidth CV lebih baik dalam menjelaskan data pengangguran kabupaten/kota di Pulau Jawa tahun 2020 karena memiliki nilai RMSE paling kecil, yaitu 1,0904 serta nilai R2 dan Adjusted-R2 paling besar, yaitu 0,8539011 dan 0,7937159. ......Unemployment is a social phenomenon, a problem faced by every region in Indonesia. One way that can be carried out to reduce the unemployment rate is analyzing the factors that affect the open unemployment rate (TPT). Rather than using linear regression analysis, Geographically Weighted Regression (GWR) was preferable since it gave a better representative model by effectively resolve spatial non-stationary problem which is generally exist in spatial data of social phenomenon. Spatial non-stationary is a situation when the relationship between variables are significantly different in each location of observation point. This spatial non-stationary is often refer to spatial heterogeneity. Spatial heterogeneity show that linear regression analysis will give a misleading interpretation results in some locations. GWR solve this problem by generating a single model in each observation location so the regression parameters can be different at each observation location. Parameter estimation in the GWR model uses weights based on the location of each observation so that the estimate model applies only to this location. The weighting determination depends on the bandwidth value. Bandwidth is a circle with radius ℎ from the center point of the observation location which is used as the basis for determining the weight of each observation location. Smaller bandwidth value will result a large variance. It can happen because when the bandwidth is very small, there will be a small number observations in the radius h, which can makes the estimate model is very rough (undersmoothing) because it uses few observations, and vice versa. Therefore, choosing the optimum bandwidth is very important in determining the weights where it can affect the accuracy of the model formed. This study aims to compare the performance of the GWR model using the CV, AICc, and BIC bandwidth methods in the formation of Fixed Gaussian Kernel weighted function which is applied to unemployment data in districts/cities in Java. The dependent variable used in this study is the district/city open unemployment rate in Java, and the independent variables are population density, human development index, labor force participation rate, district/city minimum wage, the average monthly wage of formal workers, and the average monthly net income of informal workers. The results show that each district/city has a different GWR model. The GWR model with CV bandwidth is better at explaining district/city unemployment data on Java Island in 2020 which it has the smallest RMSE value, 1.0904, and the largest R2 and Adjusted-R2 values, namely 0.8539011 and 0.7937159, respectively.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
Zafira Binta Feliandra
Penyakit stroke adalah penyebab kematian terbesar kedua di dunia. Pasien stroke harus menjalani perawatan berupa latihan rehabilitasi secara rutin untuk memulihkan fungsi motorik mereka. Sering kali pasien stroke kesulitan mendapatkan perawatan karena keterbatasan ekonomi dan mobilisasi. Selain itu, kondisi pandemi COVID-19 sekarang ini membuat pasien takut untuk pergi ke rumah sakit. Telehealth sebagai pelayanan kesehatan jarak jauh merupakan salah satu solusi untuk kondisi tersebut. Aplikasi telehealth untuk rehabilitasi stroke dapat dikembangkan dikombinasikan dengan teknologi human motion detection. Penelitian ini bertujuan untuk mengetahui model human motion detection yang dapat mendeteksi gerakan secara stabil serta untuk mengetahui model klasifikasi yang dapat mengklasifikasi gerakan stroke dan non stroke secara akurat. Penelitian dilakukan menggunakan data video gerakan pasien stroke dan orang sehat sebagai input model human motion detection. Keypoints hasil ekstraksi dari model human motion detection kemudian ditransformasi menjadi gambar RGB dan digunakan sebagai input model klasifikasi. Penelitian ini membandingkan tiga model human motion detection, yaitu PoseNet, BlazePose, dan MoveNet, serta dua model klasifikasi gambar, yaitu AlexNet dan SqueezeNet. Beberapa eksperimen dilakukan untuk mengklasifikasi gerakan stroke dan non stroke. Terdapat eksperimen dengan pembagian data tanpa 3-Fold Cross Validation, eksperimen dengan pembagian data 3-Fold Cross Validation, eksperimen menggunakan semua keypoints hasil ekstraksi model human motion detection, dan eksperimen menggunakan beberapa keypoints yang relevan. Model human motion detection dan model klasifikasi terbaik dari hasil penelitian ini diharapkan dapat berkontribusi kepada para pihak yang ingin mengembangkan aplikasi telehealth sebagai sarana rehabilitasi stroke. Berdasarkan hasil penelitian ini, didapatkan bahwa MoveNet adalah model human motion detection yang paling stabil dalam memantau pergerakan pasien dan AlexNet adalah model klasifikasi terbaik untuk mengklasifikasikan pasien stroke dan non stroke berdasarkan gerakan upper body dan gerakan lower body. ......Stroke is the second biggest cause of death in the world. Stroke patients must undergo rehabilitation on regular basis to exercise and restore their motor functions. Oftentimes, stroke patients find it difficult to get their treatment because of economic and mobility limitations. In addition, the current state of the COVID-19 pandemic makes patients afraid to go to the hospital. Telehealth as a long-distance health service is one of the solution for this condition. Telehealth applications for stroke rehabilitation can be developed in combination with human motion detection technology. This study aims to determine the human motion detection model that can detect movement steadily and determine the classification model that can classify stroke and non-stroke motions accurately. The study was conducted using video data of stroke patients and healthy people as input for the human motion detection model. Keypoints extracted from the human motion detection model are then transformed into RGB images and used as input for the classification model. This study compares three models of human motion detection, namely PoseNet, BlazePose, and MoveNet and two image classification models, namely AlexNet and SqueezeNet. Several experiments were conducted to classify stroke and non-stroke motions. There are experiments without data splitting 3-Fold Cross Validation, experiments with data splitting 3-Fold Cross Validation, experiments using all keypoints extracted from the human motion detection model, and experiments using several relevant keypoints. The most steady human motion detection model and the best classification model from the results of this study are expected to contribute to those who want to develop telehealth applications as a means of stroke rehabilitation. Based on the results of this study, it was found that MoveNet is the most steady human motion detection model for monitoring the patients motions and AlexNet is the best classification model for classifying stroke and non stroke patients based on upper body and lower body movements.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
