Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 98 dokumen yang sesuai dengan query
cover
Abyoso Hapsoro Nurhadi
"Berdasarkan data World Health Organization (WHO) hingga 6 Januari 2022, terdapat 4.264.669 kasus terkonfirmasi COVID-19 dengan jumlah kematian sebanyak 144.116 pasien di Indonesia. Figur ini meningkat drastis saat dibandingkan data WHO hingga 25 April 2021 sebesar 1.636.792 kasus terkonfirmasi dengan jumlah kematian sebanyak 44.500 pasien. Varian B.1.617.2 atau lebih umum dikenal sebagai Delta dinyatakan hadir di Indonesia pada 3 Mei 2021 dengan dua kasus positif terdeteksi di Jakarta. Varian ini memiliki daya tular yang lebih tinggi dan mengakibatkan gejala COVID-19 lebih parah sehingga menjadi varian yang mendominasi persebaran COVID-19 di Indonesia. Menurut revisi protokol tatalaksana COVID-19 edisi ketiga, seorang pasien COVID-19 dapat dibedakan menjadi lima kategori berdasarkan severitas kasus yang diderita dengan tingkat risiko tertinggi yaitu kritis. Pasien COVID-19 yang digolongkan kategori kritis menunjukkan gejala Acute Respiratory Distress Syndrome (ARDS), sepsis, dan syok sepsis. Dengan menganalisisis berbagai faktor yang terkait dengan gejala-gejala tersebut, dapat dibangun sebuah pemahaman berbentuk model Machine Learning untuk mengestimasi tingkat risiko kasus seorang pasien COVID-19. Model Machine Learning yang dibangun mencakup berbagai model, seperti model berbasis tree maupun berbasis ensemble. Dalam penelitian ini, tingkat risiko disimplikasi menjadi dua, yaitu severe dan non-severe berdasarkan urgensi perawatan khusus di rumah sakit. Untuk menentukan model optimal, digunakan metrik evaluasi Recall guna memberi perhatian kepentingan pasien tergolong kasus severe berhasil dideteksi severe dengan benar. Digunakan data pasien positif COVID-19 pada salah satu rumah sakit di Jakarta dari Januari 2020 hingga Agustus 2021 yang dibagi menjadi dua periode, sebelum dan sesudah adanya varian Delta. Dengan pembagian data ini, dapat dibangun tiga model Machine Learning yaitu model sebelum Delta, model setelah Delta, dan model keseluruhan. Dari ketiga model yang terbangun, akan diperiksa apakah ada perbedaan yang signifikan. Lebih lanjut, model-model Machine Learning yang terbentuk akan diuji tingkat kepercayaan terhadap prediksinya menggunakan metode Conformal. Diperoleh model Random Forest berhasil mengklasifikasikan data COVID-19 dengan lebih baik dibanding model-model lainnya. Model Random Forest pada seluruh variabel respon mencapai Recall 86,49%. Dengan identifikasi 4 variabel terpenting, model mencapai Recall 80,18%. Mendukung hasil ini, model percaya 90% dengan prediksi yang dihasilkan.

According to World Health Organization (WHO) data to 6 January 2022, there have been 4.264.669 confirmed cases of COVID-19 with 144.116 patient deaths in Indonesia. This figure has significantly increased when compared with WHO data to 25 April 2021, where there were 1.636.792 confirmed cases with 44.500 patient deaths. The B.1.617.2 variant or more commonly known as Delta was announced to be present in Indonesia on 3 May 2021 with two positive cases detected in Jakarta. This variant is more contagious and causes worse COVID-19 symptoms which made it the dominating variant of COVID-19 distribution in Indonesia. According to the revision of COVID-19 governance protocol third edition, a patient of COVID-19 can be differentiated to five categories depending on the severity of their case with the highest risk being critical. A patient of COVID-19 that is categorized as critical will show symptoms of Acute Respiratory Distress Syndrome (ARDS), sepsis, and sepsis shock. Through analyzing the factors that are related to these symptoms, we can build an understanding in the form of Machine Learning to estimate a COVID-19 patient’s degree of severity. The Machine Learning model that will built encompasses many models, such as tree-based models and ensemble-based models. In this research, this degree is simplified into two, which are severe and non-severe with accordance to the urgency of special care in hospitals. To determine optimal models, the Recall evaluation metric is used as a means to give better attention to making sure severe patient cases are properly classified as severe. The data used will be positive COVID-19 patients in a Jakarta-based hospital from January 2020 until August 2021 which is split into two periods of before and after the presence of Delta variant. With this division, we can build three Machine Learning models which has it learn before Delta, after Delta, and overall. From each of these built models, we will then determine if there exists a significant difference between them. Furthermore, the Machine Learning models that are built will be tested in its confidence on their own prediction using the Conformal method. We procure that Random Forest model classifies COVID-19 data better than all other models. Random Forest built on all response variables achieve 86,49% Recall. With the identification of 4 most important variables, the model achieves 80,18%. Supporting this result, the model has 90% faith in its prediction."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fathia Amira Nuramalia
"Twitter adalah platform media sosial microblogging yang memungkinkan komunikasi dua arah untuk mengutarakan opini dan komentar. Komentar-komentar yang beragam ini dapat memperlihatkan sentimen-sentimen masyarakat apabila dilakukan analisis sentimen. Analisis sentimen adalah studi yang menganalisis opini orang terhadap suatu produk, organisasi, individu, atau jasa tertentu. Machine learning merupakan metode yang dapat mempermudah proses klasifikasi sentimen. Penelitian ini dilakukan pada cuitan berbahasa Indonesia terkait Kampus Merdeka yang diambil dari Twitter menggunakan package tweepy sebanyak 1.651 cuitan terhitung dari tanggal 5 Maret 2022 hingga 13 Maret 2022. Model machine learning yang digunakan pada penelitian ini adalah Bidirectional Long Short-Term Memory (BiLSTM), dengan dua model hybrid LSTM-based, yaitu CNN-LSTM dan LSTM-CNN sebagai pembanding. Kinerja model diukur dengan metrik kinerja accuracy, precision, recall, dan F1-score. Implementasi dilakukan pada data yang telah dilakukan oversampling untuk mendapatkan hasil yang optimal. Penelitian menunjukkan bahwa model BiLSTM memiliki kinerja yang lebih unggul dibandingkan dengan dua model pembanding lainnya pada seluruh metrik dengan besar metrik, yaitu: accuracy dan recall sebesar 79,577%; precision sebesar 73,097%; dan F1-score sebesar 75,634%.

Twitter is a microblogging social media platform that allows two-way communication to express opinion and comments. These various comments can show us sentiment of the public when we perform a sentiment analysis. Sentiment analysis is a study that analyze the opinion of people towards a specific product, organization, individual, or service. Machine learning is a method that will help perform sentiment classification easier. This study performs analysis on 1.651 data tweets about Kampus Merdeka taken from Twitter using a package called tweepy since March 5th 2022 until March 13th 2022. The machine learning model used in this study is Bidirectional Long Short-Term Memory (BiLSTM), with two LSTM-based hybrid model, CNN-LSTM and LSTM-CNN as comparison models. Model performance is measured by performance metrics accuracy, precision, recall, and F1-score. Implementation was done on data that has been going through oversampling to achieve the best result. The study shows that BiLSTM performs better than the other two comparison models for all the metrics with the percentage of the each metric being: 79.577% for accuracy and recall; 73,097% for precision; and 75,634% for F1-score."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rizqa Fatika Fajrianti
"Prinsip parsimoni adalah prinsip yang menyatakan bahwa jika terdapat beberapa penjelasan untuk suatu fenomena, maka penjelasan paling sederhanalah yang harus dipilih. Prinsip ini digunakan dalam analisis data untuk memilih model yang paling efisien dalam menjelaskan variabilitas data dengan parameter seminimal mungkin. Namun pada beberapa kondisi, data bisa saja melibatkan pengukuran atau variabel yang cukup banyak. Data berdimensi tinggi dapat menyebabkan kompleksitas dan kesulitan dalam analisis, sehingga reduksi dimensi pada data penting untuk dilakukan. Principal Component Analysis (PCA) adalah salah satu metode yang dapat digunakan untuk melakukan reduksi dimensi, dengan mengekstraksi variabel baru dan mengurangi pengaruh dari variabel yang tidak relevan. Namun, metode PCA tidak toleran terhadap missing value, sehingga algoritma Nonlinear Iterative Partial Least Squares (NIPALS) dapat digunakan dalam mengatasi data yang mengandung missing value. Performa dari algoritma NIPALS dievaluasi menggunakan nilai normalized root mean square error (NRMSE) dan koefisien korelasi Pearson. Kemudian, performa dari algoritma ini dibandingkan dengan dua metode lain, meliputi Probabilistic Principal Component Analysis (PPCA) dan SVDImpute. Setelah dilakukan percobaan sebanyak seratus kali pada data survei COVIDiSTRESS, didapatkan hasil bahwa algoritma NIPALS memiliki performa yang lebih baik dan stabil dalam melakukan reduksi dimensi dibandingkan SVDImpute dan PPCA pada data dengan missing value sebesar 1% hingga 15%.

The principle of parsimony, states that if there are multiple explanations for a phenomenon, the simplest explanation should be chosen. This principle is applied in data analysis to select the most efficient model that explains the variability of the data with minimal parameters. However, in some cases, the data may involve a large number of measurements or variables. High-dimensional data can lead to complexity and difficulties in analysis, therefore dimensionality reduction is important. Principal Component Analysis (PCA) is one method that can be used for dimensionality reduction by extracting new variables and reducing the influence of irrelevant variables. However, PCA is not tolerant to missing values, so the Nonlinear Iterative Partial Least Squares (NIPALS) algorithm can be used to handle data with missing values. The performance of the NIPALS algorithm is evaluated using the normalized root mean square error (NRMSE) and Pearson correlation coefficient. Subsequently, the performance of this algorithm is compared with two other methods, including Probabilistic Principal Component Analysis (PPCA) and SVDImpute. After conducting a hundred trials on the COVIDiSTRESS survey data, it was found that the NIPALS algorithm performed better and was more stable in dimension reduction compared to SVDImpute and PPCA algorithms on data with missing values ranging from 1% to 15%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Mohammad Lanang Syeikha
"Coronavirus disease 2019 atau COVID-19 merupakan suatu penyakit menular yang
disebabkan oleh virus bernama SARS-CoV-2 dan menginfeksi sistem pernapasan
manusia. Untuk mengendalikan penyebaran COVID-19 selama masa pandemi,
pemerintah di berbagai negara telah menerapkan berbagai jenis modifikasi dalam
kehidupan sehari-hari, contohnya dengan menerapkan sistem lockdown. Tetapi, adanya
modifikasi gaya hidup tersebut dapat meninggalkan beberapa dampak, salah satunya
adalah konsekuensi sosial psikologis yang meliputi masalah stres psikologis. Stres
psikologis yang dirasakan oleh seseorang dapat dijelaskan oleh beberapa faktor.
Penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang dapat menjelaskan
tingkat stres seseorang selama masa awal pandemi COVID-19 tahun 2020, baik secara
global maupun untuk beberapa negara secara terpisah serta menganalisis karakteristik
individu di beberapa negara selama masa awal pandemi COVID-19 tahun 2020.
Penelitian ini akan menggunakan data sekunder berupa data survei global yang
diselenggarakan oleh COVIDiSTRESS. Adapun metode yang digunakan untuk
menganalisis karakteristik individu di beberapa negara selama masa awal pandemi
COVID-19 tahun 2020 adalah exploratory data analysis (EDA) dan metode untuk
mengidentifikasi faktor-faktor yang dapat menjelaskan tingkat stres seseorang selama
masa awal pandemi COVID-19 tahun 2020, baik secara global maupun untuk beberapa
negara secara terpisah adalah analisis regresi berganda. Hasil dari penelitian ini
menunjukkan bahwa terdapat adanya kecenderungan perbedaan karakteristik individu di
beberapa negara selama masa awal pandemi COVID-19 tahun 2020 jika dilihat
berdasarkan informasi demografi serta pengukuran psikologis berupa variabel-variabel
pertanyaan di dalam survei. Selain itu, secara global didapatkan beberapa faktor penting
yang dapat menjelaskan tingkat stres seseorang selama masa awal pandemi COVID-19
tahun 2020, contohnya seperti tingkat kesepian, usia, dan tipe kepribadian neuroticism.
Kemudian untuk beberapa negara yang diamati, mayoritas faktor penting yang dapat
menjelaskan tingkat stres seseorang selama masa awal pandemi COVID-19 tahun 2020
contohnya meliputi tingkat kesepian, seberapa bervariasi sumber pemicu stres, dan usia.

Coronavirus disease 2019 or COVID-19 is an infectious disease caused by a virus called
SARS-CoV-2 and infects the human respiratory system. To control the spread of COVID-
19 during the pandemic, governments in various countries have implemented various
types of modifications in daily life, for example by implementing a lockdown system.
However, these lifestyle modifications can leave several impacts, one of which is socio-
psychological consequences which include psychological stress problems. The
psychological stress felt by a person can be explained by several factors. This study aims
to identify factors that can explain a person's stress level during the early days of the
COVID-19 pandemic in 2020, both globally and for several countries separately and
analyze the characteristics of individuals in several countries during the early days of the
COVID-19 pandemic in 2020. This research will use secondary data in the form of global
survey data organized by COVIDiSTRESS. The method used to analyze the
characteristics of individuals in several countries during the early days of the COVID-19
pandemic in 2020 is exploratory data analysis (EDA) and the method to identify factors
that can explain a person's stress level during the early days of the COVID-19 pandemic
in 2020, both globally and for several countries separately is multiple regression analysis.
The results of this study show that there is a tendency for differences in individual
characteristics in several countries during the early days of the COVID-19 pandemic in
2020 when viewed based on demographic information and psychological measurements
in the form of question variables in the survey. In addition, globally, there are several
important factors that can explain a person's stress level during the initial period of the
COVID-19 pandemic in 2020, such as the level of loneliness, age, and neuroticism
personality type. Then for some countries observed, the majority of important factors that
can explain a person's stress level during the early days of the COVID-19 pandemic in
2020 include the level of loneliness, how varied the sources of stress triggers are, and age
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hunaiva Kintan Dahlan
"Pandemi COVID-19 telah memberikan dampak negatif pada aspek-aspek kehidupan masyarakat, salah satunya kesehatan mental. Dampak negatif pada kesehatan mental secara global ditandai dengan meningkatnya tingkat stres masyarakat selama masa pandemi. Berdasarkan hal tersebut, penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang dapat menjelaskan tingkat stres masyarakat pada masa pandemi COVID-19. Pada penelitian ini, data yang digunakan berasal dari hasil survei global COVIDiSTRESS yang dilakukan untuk menganalisis keadaan individu dan tanggapan psikologis terhadap pandemi beserta kebijakan yang berlaku selama masa pandemi. Tingkat stres pada survei ditinjau dengan pengukuran perceived stress scale (PSS-10). Metode yang digunakan adalah analisis regresi multilevel yang merupakan salah satu bentuk spesifikasi dari linear mixed model. Analisis ini dinilai lebih baik daripada regresi biasa karena dapat mengatasi masalah dependensi pada data hierarki. Besarnya dependensi pada regresi multilevel dapat dinyatakan sebagai intraclass correlation coefficient. Model regresi multilevel terbaik yang didapatkan dari hasil penelitian ini adalah model koefisien acak. Hasil penelitian ini menunjukkan bahwa terdapat beragam faktor yang dapat menjelaskan tingkat stres pada masa pandemi COVID-19. Tingkat kesendirian (loneliness) dan intoleransi terhadap ketidakpastiaan (uncertainty) memiliki dampak yang berbeda dalam menjelaskan tingkat stres di berbagai negara. Selain itu, dukungan sosial juga dapat menjelaskan tingkat stres masyarakat pada tingkat negara selama masa pandemi COVID-19.

The COVID-19 pandemic has had a negative impact on aspects of people's lives, one of which is mental health problem. The negative impact on mental health globally is marked by the increasing level of stress in society during the pandemic. Based on this, this study aims to identify factors that can explain the level of community stress during the COVID- 19 pandemic. This study used the result data of the COVIDiSTRESS global survey which was conducted to analyze individual circumstances and psychological responses to the pandemic and the policies that were in effect during the pandemic. The stress level in the survey was reviewed by measuring the perceived stress scale (PSS-10). The method used is multilevel regression analysis which is a specification form of the linear mixed model. This analysis is considered better than ordinary regression because it can overcome the problem of dependency on hierarchical data. The dependency on multilevel regression can be expressed as the intraclass correlation coefficient. The best multilevel regression model obtained from the results of this study is the random coefficient model. The results of this study indicate that there are various factors that can explain stress levels during the COVID-19 pandemic. The level of loneliness and intolerance to uncertainty have different effects on explaining stress levels in different countries. In addition, social support can also explain the stress level at the country level during the COVID-19 pandemic.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Daniel Roberto
"Tren cyber-attack atau serangan siber terus bertambah banyak setiap tahunnya. Menurut data dari patrolisiber.id, terdapat 61 laporan penipuan melalui e-mail dengan jumlah kerugian mencapai lebih dari 144 miliar rupiah dan merupakan modus penipuan dengan kerugian terbesar pada tahun 2019. Teknik machine learning telah diadaptasi pada algoritma deteksi dalam Intrusion Detection System (IDS) sebagai perangkat untuk memeriksa semua traffic jaringan karena dapat membawa manfaat dalam pengembangan performanya yang berskala besar dalam meningkatkan detection rate dan pengurangan processing time. Salah satu metode machine learning pada IDS adalah decision tree, yaitu metode yang dapat bekerja dengan cepat, menghasilkan akurasi yang baik, dan mudah untuk diinterpretasi. Penelitian ini bertujuan untuk melakukan klasifikasi jenis serangan cyber-attack terhadap jaringan Wi-Fi dan Internet of Things melalui penerapan teknik machine learning dengan metode decision tree. Untuk menghindari overfitting pada model, akan digunakan teknik lanjutan yaitu post-pruning dengan menggunakan algoritma reduced error pruning. Hasil yang diperoleh dari penelitian ini adalah pengembangan performa model decision tree setelah dilakukan metode reduced error pruning dibanding model yang tidak dilakukan pruning. Evaluasi kinerja model yang sudah dilakukan pruning dengan ukuran nilai metrik accuracy, F1 score, recall, dan precision pada data testing masing-masing adalah sebesar 94.67%, 94.79%, 94.9%, dan 94.69%.

The trend of cyber-attacks continues to increase every year. According to data from patrolsiber.id, there are 61 reports of fraud via e-mail with a total loss of more than 144 billion rupiahs and is the mode of fraud with the biggest losses in 2019. Machine learning techniques have been adapted to the detection algorithms in the Intrusion Detection System (IDS) as a tool to examine all network traffic because they can bring benefits in the development of large-scale performance in increasing the detection rate and reducing processing time. One of the machine learning methods in the IDS is the decision tree, which is a method that works quickly, produces good accuracy, and is easy to interpret. This study aims to classify types of cyber-attacks against Wi-Fi networks and the Internet of Things through the application of machine learning techniques with the decision tree method. To avoid overfitting on the model, an advanced technique will be used, namely post-pruning using the reduced error pruning algorithm. The results obtained from this study are the development of the performance of the decision tree model after the reduced error pruning method is used compared to the model without pruning. Evaluation of the performance of the model that has been pruned with the metrics measurement of accuracy, F1 score, recall, and precision in data testing is 94.67%, 94.79%, 94.9%, and 94.69%, respectively."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ihsan Izzuddin
"Uji PCR swab adalah salah satu jenis pemeriksaan untuk seluruh pasien yang terduga COVID-19. Hingga saat ini, tes PCR swab merupakan tes yang paling direkomendasikan oleh WHO untuk mendiagnostik COVID-19. Namun tes ini memiliki kerumitan proses dan harga alat yang lebih tinggi sehingga banyak orang enggan untuk melakukan PCR Swab, walaupun sudah ada gejala terpapar COVID-19 atau lebih memilih jenis tes pemeriksaan yang lain. Penelitian ini merupakan studi kasus yang diambil di FMIPA UI. Tujuan dari penelitian ini adalah menganalisis faktor-faktor apa saja yang signifikan menjelaskan keengganan mahasiswa FMIPA UI melakukan PCR swab seandainya memiliki gejala terpapar COVID-19. Metode analisis yang digunakan untuk mencapai tujuan tersebut yaitu metode analisis regresi logistik. Penelitian ini menggunakan data primer yang didapat menggunakan metode purposive sampling dengan cara menyebar survey online ke grup online departemen di MIPA UI dan responden yang dilibatkan adalah mahasiswa FMIPA UI yang aktif. Hasil yang diperoleh yaitu faktor-faktor yang memengaruhi keengganan melakukan uji PCR Swab pada mahasiswa FMIPA UI adalah tingkat pendidikan orang tua, penghasilan orang tua, dan melakukan protokol kesehatan.

The PCR swab test is one type of examination for all patients suspected of COVID-19. Until now, the PCR swab test is the most recommended test by WHO to diagnose COVID-19. However, this test has the complexity of the process, and the cost of the equipment is higher, so many people are reluctant to do a COVID-19 swab even though there are already symptoms of being exposed to Covid-19 or prefer other types of examination tests. This research is a case study taken at FMIPA UI. This study aims to analyze the factors that significantly explain the reluctance of FMIPA UI students to carry out PCR swabs if symptoms of being exposed to COVID-19 have appeared. The analytical method used is the method of logistic regression analysis. This study used primary data obtained using the purposive sampling method by distributing online surveys to each department’s online groups at FMIPA UI and the respondents involved were active FMIPA UI students. The results obtained are the factors that influence the reluctance to do the PCR Swab test on FMIPA UI students: the level of education of parents, parents' income, and health protocols.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Ilham Randi
"Dalam melakukan klasifikasi, tidak jarang terdapat data dengan jumlah anggota kategori yang tidak seimbang. Khususnya dalam dunia kesehatan dimana kategori yang diamati umumnya lebih jarang terjadi. Jika ketidakseimbangan ini tidak ditangani terlebih dahulu maka dapat memberikan hasil klasifikasi yang bias dan kurang akurat. Terdapat beberapa metode rebalancing konvensional untuk menanganinya seperti random oversampling dan random undersampling, namun keduanya diklaim memiliki beberapa kelemahan sehingga beberapa metode yang lebih kompleks dikembangkan. Namun jumlah metode yang dapat digunakan untuk menangani data kategorik selain metode konvensional tersebut masih minim. Salah satu metode yang dapat menangani data kategorik adalah synthetic minority over sampling-technique nominal continuous atau SMOTE-NC yang merupakan ekstensi dari SMOTE yang dikembangkan untuk menangani dataset dengan variabel campuran. Skripsi ini membahas perbandingan dari metode random oversampling dan SMOTE-NC juga metode gabungannya dengan undersampling yaitu random oversampling + undersampling dan SMOTE-NC + undersampling untuk menangani ketidakseimbangan data. Masing-masing metode tersebut akan diterapkan untuk klasifikasi tingkat keparahan COVID-19 berdasarkan urgensi perawatan rumah sakit dengan menggunakan metode random forest dimana selanjutnya dapat dilihat kombinasi metode yang menghasilkan performa terbaik. Penelitian ini juga bertujuan untuk melihat faktor-faktor manakah yang paling penting dalam memprediksi tingkat keparahan COVID-19 berdasarkan urgensi rumah sakit. Digunakan metode Leave-One-Out Cross-Validation untuk mengukur konsistensi model. Diperoleh hasil bahwa metode SMOTE-NC dengan undersampling memberikan performa terbaik dengan komorbid paru-paru, kadar c-reactive protein dan prokalsitonin merupakan variabel terpenting dalam model. Selain itu diperoleh kesimpulan bahwa pemilihan metode rebalancing yang tepat bergantung pada karakteristik data yang dimiliki.

In conducting classification, it is not uncommon for data with an unbalanced number of category members. Especially in the world of health where the categories we observe are generally less common. If this imbalance is not handled first, it can give biased and less accurate classification results. There are several conventional rebalancing methods to handle it, such as random oversampling and random undersampling, but both are claimed to have several weaknesses so that several more complex methods were developed. However, the number of methods that can be used to handle categorical data other than the conventional methods is still minimal. One method that can handle categorical data is synthetic minority over sampling-technique nominal continuous or SMOTE-NC which is an extension of SMOTE which was developed to handle datasets with mixed variables. This thesis discusses the comparison of random oversampling and SMOTE-NC methods as well as their combined methods with undersampling, namely random oversampling + undersampling and SMOTE-NC + undersampling to handle data imbalances. These methods will be applied to the classification of the severity of COVID-19 based on the urgency of hospital care using the random forest method, wherein the combination of methods that produces the best performance will be seen. This study also aims to see which factors are the most important in predicting the severity of COVID-19 based on hospital urgency. The Leave-One-Out Cross-Validation method is used to measure the consistency of the model. It was found that the SMOTE-NC method with undersampling gave the best performance with lung comorbidities, c-reactive protein and procalcitonin levels were the most important variables in the model. In addition, it can be concluded that the selection of the right rebalancing method depends on the characteristics of the data held.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Yoshua Yosia
"Sebagai penyakit yang disebabkan oleh virus, obat antivirus banyak digunakan sebagai salah satu pengobatan COVID-19. Obat antivirus yang resmi digunakan di Indonesia, yaitu oseltamivir, avigan, dan remdesivir, tanpa adanya pertimbangan obat mana yang lebih efektif dalam menangani pasien COVID-19. Obat antivirus dapat dikatakan lebih efektif daripada obat antivirus lainnya jika dapat mengurangi infeksi virus pada pasien dan membuat kondisinya membaik lebih cepat. Penelitian ini bertujuan untuk membandingkan efektivitas dari ketiga jenis obat antivirus tersebut secara umum dan berdasarkan ciri pasien, yang meliputi jenis kelamin, kelompok usia, dan penyakit penyerta, dalam menghasilkan perbaikan kondisi bagi pasien COVID-19. Data yang digunakan dalam penelitian ini terdiri atas 142 pasien COVID-19 di Rumah Sakit ABC Jakarta pada tanggal 4 Juni 2020 hingga 31 Januari 2021 yang mengonsumsi salah satu jenis obat antivirus. Model Cox proportional hazard digunakan untuk mengukur hazard ratio pasien COVID-19 berdasarkan jenis obat antivirus yang dikonsumsi dan ciri pasien. Hasil penelitian menunjukkan bahwa oseltamivir memberikan efektivitas terbesar dan remdesivir memberikan efektivitas terkecil terhadap perbaikan kondisi pasien COVID-19 secara umum. Oseltamivir memberikan efektivitas yang besar untuk hampir semua ciri pasien yang meliputi pria, wanita, lansia, memiliki penyakit penyerta, dan tidak memiliki penyakit penyerta. Avigan memberikan efektivitas yang besar untuk pasien pria dan bukan lansia, sedangkan obat remdesivir dapat dikatakan efektif pada pasien wanita.

As a disease caused by a virus, antiviral drug is widely used as a treatment for COVID-19. The allowed antiviral drugs used in Indonesia are oseltamivir, avigan, and remdesivir, without any consideration which drug is more effective in treating COVID-19 patients. An antiviral drug can be said to be more effective than other antiviral drugs if it can reduce the viral infection in patients and make their condition improves faster. This study aims to compare the effectiveness of the three types of antiviral drugs in general and based on patient characteristics, which include gender, age group, and comorbidity presence, in resulting condition improvement for COVID-19 patients. The data used consists of 142 COVID-19 patients from ABC Hospital in Jakarta, who took one of three types of antiviral drugs. Cox proportional hazard model was used to measure the hazard ratio of COVID-19 patients based on the antiviral drug consumed and characteristics. The results showed that oseltamivir provided the greatest and remdesivir gave the least effectiveness in improving the condition of COVID-19 patients in general. Oseltamivir provides great effectiveness for almost all patient characteristics, including male, female, elders, and patients with and without comorbidity. Avigan provides high effectiveness for male and non-elderly patients. Meanwhile remdesivir can be said to be effective in female patients."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gabriela Patricia Winny Gracia
"Clustering merupakan metode untuk mengidentifikasi kelompok natural pada data berdasarkan ukuran kemiripan seperti jarak Eucledian. Clustering bertujuan untuk mengelompokkan data, dengan kriteria observasi yang berada dalam satu klaster memiliki tingkat kemiripan yang sangat signifikan, sedangkan observasi yang berada dalam cluster yang berbeda, memiliki perbedaan yang sangat signifikan. Pada tahun 2021, Chowdhury, Bhattacharyya, & Kalita mengembangkan metode User-Input-Free Density-Based Clustering (UIFDBC) berdasarkan dari metode density-based clustering yang telah ada sebelumnya. Seperti namanya, metode UIFDBC ini tidak memerlukan input dari pengguna untuk menemukan cluster. Maka dari itu, metode UIFDBC ini berhasil menjawab permasalahan metode clustering sebelumnya yang bergantung pada input dari pengguna. Tujuan dari penelitian ini adalah untuk membahas lebih dalam terkait metode User-Input-Free Density-Based Clustering (UIFDBC), menerapkan metode UIFDBC pada data real, yaitu data konsumen kartu kredit untuk melakukan segmentasi konsumen, serta mengkaji performa metode ini pada data yang mengandung missing values di dalamnya. Dari hasil penelitian, metode UIFDBC berhasil diterapkan pada data konsumen kartu kredit, dan diperoleh sebanyak delapan cluster pengguna, dimana setiap cluster memiliki karakteristik masing-masing. Selain itu, dari hasil pengkajian metode UIFDBC terhadap data dengan missing values diketahui bahwa performa metode UIFDBC dinilai cukup baik untuk proporsi missing values ≤ 5%. Namun perlu menjadi catatan bahwa data hasil dari setiap iterasi akan bersifat acak, dikarenakan metode UIFDBC sangat bergantung pada densitas data, sedangkan densitas data bergantung pada missing values yang mana dibangkitkan secara acak sepenuhnya.

Clustering is a method to identify natural groups in data based on similarity measures such as Eucledian distance. Clustering aims to group data, with the criteria for observations in one cluster having a very significant level of similarity, while observations in different clusters have very significant differences. In 2021, Chowdhury, Bhattacharyya, & Kalita developed the User-Input-Free Density-Based Clustering (UIFDBC) method based on the previous density-based clustering method. As the name suggests, this UIFDBC method does not require input from the user to find the cluster. Therefore, this UIFDBC method has succeeded in answering the problems of the previous clustering method which depended on input from the user. The purpose of this study is to discuss more deeply the User-Input-Free Density-Based Clustering (UIFDBC) method, to apply the UIFDBC method to real data, namely credit card consumer data to segment consumers, and to examine the performance of this method on data containing missing values in it. From the results of the study, the UIFDBC method was successfully applied to credit card consumer data, and obtained as many as eight user clusters, where each cluster has its own characteristics. In addition, from the results of the study of the UIFDBC method on data with missing values, it is known that the performance of the UIFDBC method is considered quite good for the proportion of missing values ≤ 5%. However, it should be noted that the resulting data from each iteration will be random, because the UIFDBC method is very dependent on data density, while data density depends on missing values which are generated completely randomly."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   3 4 5 6 7 8 9 10   >>