Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 132272 dokumen yang sesuai dengan query
cover
Ryan Fathurrachman
"ISPA atau infeksi saluran pernapasan akut adalah infeksi yang menyerang saluran pernapasan, baik saluran pernapasan atas maupun bawah. Salah satu penyakit yang termasuk dalam ISPA adalah pneumonia. Pneumonia merupakan infeksi paru-paru yang dapat memengaruhi kesehatan manusia secara serius. Pneumonia memengaruhi paru-paru bagian bawah dan menjadi penyebab area tersebut dipenuhi cairan lendir atau nanah. Pneumonia dikarenakan oleh berbagai agen patogen seperti virus, bakteri, dan jamur. Bakteri yang paling sering menyebabkan pneumonia adalah Streptococcus pneumoniae. Selain itu, Mycobacterium tuberculosis juga merupakan bakteri penyebab pneumonia di beberapa negara Asia. Berdasarkan hasil radiologi, pneumonia mirip dengan pneumonia tuberkulosis. Diagnosis dini sangat berperan penting dalam pengelolaan dan pengobatan efektif untuk penyakit ini. Dengan adanya kemajuan di bidang bioinformatika, sekuens protein menjadi salah satu pendekatan yang potensial untuk mendeteksi pneumonia secara cepat dan akurat. Oleh karena itu, penelitian ini adalah pendeteksian penyakit pneumonia dengan sekuens protein. Ekstraksi fitur untuk menjadi data numerik dibutuhkan pada penelitian ini dengan metode discere Penelitian ini menggunakan metode ensemble dari model Random Forest dan Support Vector Machine (SVM) dengan weighted majority algorithm (WMA) untuk mendeteksi penyakit pneumonia menggunakan sekuens protein Streptococcus pneumoniae dan Mycobacterium tuberculosis sebagai pembanding yang didapatkan melalui situs UniProt. Hasil penelitian ini menunjukkan bahwa metode ensemble model Random Forest dan model SVM dengan metode WMA memiliki kinerja terbaik dengan perbandingan data training dan data testing sebesar 80:20 didapat nilai akurasi sebesar 99,17%, nilai sensitivitas sebesar 99,65%, nilai spesifisitas sebesar 97,56%, dan nilai ROC-AUC sebesar 98,61%.

Infection of Acute Respiratory (ARI) is an infection that attacks the respiratory tract, affecting both the upper and lower respiratory tracts. One of the diseases included in ARI is pneumonia. Pneumonia is a lung infection that can seriously impact human health. It affects the lower part of the lungs and causes the area to fill with mucus or pus. Pneumonia can be caused by various pathogens such as viruses, bacteria, and fungi. The bacterium most commonly causing pneumonia is Streptococcus pneumoniae. Additionally, Mycobacterium tuberculosis is also a bacterial cause of pneumonia in several Asian countries. Based on radiological results, pneumonia is similar to tuberculosis pneumonia. Early diagnosis is crucial in the management and effective treatment of this desease. With advancements in bioinformatics, protein sequence has become a potential approach for the rapid and accurate detection of pneumonia. Therefore, this research focuses on the detection of pneumonia using protein sequences. Feature extraction is required to convert the data into numerical form using discere method. This research uses an ensemble method combining Random Forest and Support Vector Machine (SVM) models with the weighted majority algorithm (WMA) to detect pneumonia using protein sequences of Streptococcus pneumoniae and Mycobacterium tuberculosis for comparison. This protein sequences obtained from the UniProt website. The results of this research indicate that the ensemble method of Random Forest and SVM with WMA achieved the best performance with a training to testing data ratio of 80:20 with 99,17% accuracy, 99,65% sensitivity, 97,56% specificity, and 98,61% ROC-AUC score."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dian Puspita Sari
"Coronavirus yaitu kelompok virus yang menginfeksi sistem pernapasan yang dapat menyebabkan infeksi pernapasan ringan maupun berat. Salah satu virus yang termasuk ke dalam coronavirus adalah SARS-CoV-2. Penyakit yang disebabkan oleh virus SARS-CoV-2 disebut COVID-19. COVID-19 pertama kali terdeteksi pada tahun 2019 di Wuhan, China. Penyebaran COVID-19 sangat cepat dengan tingkat kematian yang tinggi terus terjadi di berbagai negara sehingga penyakit ini berstatus pandemi. Skripsi ini menyelesaikan masalah klasifikasi virus SARS-CoV-2 dengan menggunakan data sekuens protein coronavirus. Seleksi fitur pada data sekuens protein coronavirus menggunakan metode seleksi fitur Random Forest-Recurisive Feature Elimination (RF-RFE). Setelah dilakukan seleksi fitur, dilakukan klasifikasi menggunakan pendekatan machine learning dengan metode Support Vector Machine (SVM) dan Particle Swarm Optimization-Support Vector Machine (PSO-SVM). Hasil terbaik performa rata-rata akurasi, spesifisitas, dan sensitivitas untuk metode SVM berturut-turut adalah 93,43%, 98,06%, dan 88,84% pada data pelatihan sebesar 80%. Untuk metode PSO-SVM, hasil terbaik rata-rata akurasi dan spesifisitas adalah 98,48% dan 98,57% pada data pelatihan sebesar 80%, sedangkan hasil terbaik rata-rata sensitivitas adalah 98,96% pada data pelatihan sebesar 90%. Oleh karena itu, pada penelitian ini dapat disimpulkan bahwa metode PSO-SVM menghasilkan performa yang lebih baik dibandingkan dengan metode SVM.

Coronaviruses are a group of viruses that infect the respiratory system that can cause mild or severe respiratory infections. One of the viruses that belongs to the coronavirus is SARS-CoV-2. The disease caused by the SARS-CoV-2 virus is called COVID-19. COVID-19 was first detected in 2019 in Wuhan, China. The spread of COVID-19 is very fast with a high mortality rate that continues to occur in various countries so that this disease has a pandemic status. This thesis solves the problem of classifying the SARS-CoV-2 virus using coronavirus protein sequence data. Feature selection on coronavirus protein sequence data used the Random Forest-Recursive Feature Elimination (RF-RFE) feature selection method. After feature selection, classification is carried out using a machine learning approach with the Support Vector Machine (SVM) and Particle Swarm Optimization-Support Vector Machine (PSO-SVM) methods. The best results of the average performance of accuracy, specificity, and sensitivity for the SVM method are 93.43%, 98.06%, and 88.84%, respectively, for training data of 80%. For the PSO-SVM method, the best results on average accuracy and specificity are 98.48% and 98.57% on training data of 80%, while the best results on average sensitivity are 98.96% on training data of 90%. Therefore, in this study it can be concluded that the PSO-SVM method produces better performance than the SVM method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dilla Fadlillah Salma
"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional Naïve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.

Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Afifah Rofi Laeli
"Tuberkulosis (TB) merupakan suatu penyakit menular yang sebagian besar menyerang paru-paru manusia. Penularan penyakit ini terjadi ketika pasien tuberkulosis paru mengeluarkan percikan dahak yang mengandung kuman tuberkulosis ke udara. Penularannya yang mudah menjadikan tuberkulosis sebagai masalah kesehatan masyarakat, baik di Indonesia maupun internasional. Deteksi dini tuberkulosis paru dapat mencegah penularan serta menyembuhkan pasien. Namun, adanya pandemi COVID-19 saat ini dapat menurunkan angka kasus tuberkulosis yang berhasil terdeteksi. Hal ini menunjukkan perlu adanya kemajuan dalam metode pendeteksian penyakit tuberkulosis paru. Kini, perkembangan teknologi dapat dimanfaatkan untuk membantu bidang kesehatan, salah satunya dengan machine learning. Machine learning dapat digunakan untuk mendeteksi adanya suatu penyakit berdasarkan data citra. Dalam penelitian ini, model machine learning, Convolutional Neural Network-Random Forest (CNN-Random Forest) dan Convolutional Neural Network-XGBoost (CNN-XGBoost), diimplementasikan untuk mendeteksi tuberkulosis paru berdasarkan citra radiografi toraks. Selanjutnya, kedua model tersebut dievaluasi dan dibandingkan kinerjanya berdasarkan nilai akurasi dan nilai luas wilayah di bawah kurva ROC, atau biasa disebut dengan area under the curve (AUC). Data yang digunakan sebanyak 6000 yang terdiri dari 3000 citra radiografi toraks tuberkulosis paru dan 3000 citra radiografi toraks normal. Berdasarkan hasil yang diperoleh, model CNN-Random Forest dan CNN-XGBoost memberikan kinerja yang baik dan dapat diterapkan untuk mendeteksi tuberkulosis paru, dimana CNN digunakan untuk mengekstraksi fitur pada citra, kemudian hasil ekstraksi fitur tersebut menjadi input bagi pengklasifikasi Random Forest dan XGBoost. Evaluasi kinerja berdasarkan rata-rata nilai akurasi dan rata-rata nilai AUC pada model CNN-Random Forest memberikan hasil terbaik masing-masing sebesar 98.667% dan 99.933%, sementara pada model CNN-XGBoost memberikan hasil terbaik masing-masing sebesar 98.367% dan 99.866%. Kemudian berdasarkan perbandingan kinerja yang dilakukan, model CNN-Random Forest memberikan kinerja yang lebih baik dalam mendeteksi tuberkulosis paru dibandingkan dengan model CNN-XGBoost.

Tuberculosis (TB) is an infectious disease that in most cases attacks the human lungs. Transmission of this disease occurs when a patient with pulmonary tuberculosis expels phlegm containing tuberculosis germs into the air. Its easy transmission makes tuberculosis a public health problem, both in Indonesia and internationally. Early detection of pulmonary tuberculosis can prevent transmission and cure patients. However, the current COVID-19 pandemic can reduce the number of successfully detected tuberculosis cases. This shows the need for progress in the detection method of pulmonary tuberculosis. Now, technological developments can be used to help the health sector, one of which is machine learning. Machine learning can be used to detect the presence of a disease based on image data. In this study, machine learning models, Convolutional Neural Network-Random Forest (CNN-Random Forest) and Convolutional Neural Network-XGBoost (CNN-XGBoost), were implemented to detect pulmonary tuberculosis based on thorax radiography images. Furthermore, the performances of the two models were evaluated and compared based on the values of accuracy and area under the ROC curve, or commonly called the area under the curve (AUC). The data used were 6000 consisting of 3000 thorax radiography images of pulmonary tuberculosis and 3000 normal thorax radiography images. Based on the results obtained, the CNN-Random Forest and CNN-XGBoost models provided good performances and can be applied to detect pulmonary tuberculosis, where CNN was used to extract features in the image, then the results of the feature extraction became input for the Random Forest and XGBoost classifiers. Performance evaluation based on the average values of accuracy and AUC in the CNN-Random Forest model gave the best results of 98.667% and 99.933%, respectively, while the CNN-XGBoost model gave the best results of 98.367% and 99.866, respectively. Then based on the performance comparison, the CNN-Random Forest model provided a better performance in detecting pulmonary tuberculosis compared to the CNN-XGBoost model."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gregorius Vidy Prasetyo
"ABSTRAK
Pada permasalahan seperti kesehatan atau dunia retail banyak dijumpai data-data yang memiliki kategori yang tidak seimbang. Sebagai contoh jumlah penderita penyakit tertentu relatif langka pada suatu studi atau jumlah transaksi yang terkadang merupakan transaksi palsu (fraud) jumlahnya secara signifikan lebih sedikit ketimbang transaksi normal. Kondisi ini biasa disebut sebagai kondisi data tidak seimbang dan menyebabkan permasalahan pada performa model, terutama pada kelas minoritas. Beberapa metode telah dikembangkan untuk mengatasi permasalahan data tidak seimbang, salah satu metode terkini untuk menanganinya adalah Easy Ensemble. Easy Ensemble diklaim dapat mengatasi efek negatif dari pendekatan konvensional seperti random-under sampling dan mampu meningkatkan performa model dalam memprediksi kelas minoritas. Skripsi ini membahas metode Easy Ensemble dan penerapannya dengan model Random Forest dalam mengatasi masalah data tidak seimbang. Dua buah studi empiris dilakukan berdasarkan kasus nyata dari situs kompetisi hacks.id dan kaggle.com. Proporsi kategori antara kelas mayoritas dan minoritas pada dua data di kasus ini adalah 70:30 dan 94:6. Hasil penelitian menunjukkan bahwa metode Easy Ensemble, dapat meningkatkan performa model klasifikasi Random Forest terhadap kelas minoritas dengan signifikan. Sebelum dilakukan resampling pada data (nhacks.id), nilairecall minority hanya sebesar 0.47, sedangkan setelah dilakukan resampling, nilainya naik menjadi 0.82. Begitu pula pada data kedua (kaggle.com), sebelum resampling nilai recall minority hanya sebesar 0.14, sedangkan setelah dilakukan resampling, nilai naik secara signifikan menjadi 0.71.

ABSTRACT
In the real world problem, there is a lot case of imbalanced data. As an example in medical case, total patients who suffering from cancer is much less than healthy patients. These condition might cause some issues in problem definition level, algorithm level, and data level. Some of the methods have been developed to overcome this issues, one of state-of-the-art method is Easy Ensemble. Easy Ensemble was claimed can improve model performance to classify minority class moreover can overcome the deï¬?ciency of random under-sampling. In this thesis discussed the implementation of Easy Ensemble with Random Forest Classifers to handle imbalance problem in a credit scoring case. This combination method is implemented in two datasets which taken from data science competition website, nhacks.id and kaggle.com with class proportion within majority and minority is 70:30 and 94:6. The results show that resampling with Easy Ensemble can improve Random Forest classifier performance upon minority class. This been shown by value of recall on minority before and after resampling which increasing significantly. Before resampling on the first dataset (nhacks.id), value of recall on minority is just 0.49, but then after resampling, the value of recall on minority is increasing to 0.82. Same with the second dataset (kaggle.com), before the resampling, value of recall on minority is just 0.14, but then after resampling, the value of recall on minority is increasing significantly to 0.71."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hamidah
"

Klasifikasi stroke merupakan masalah yang harus diselesaikan dengan cepat dan tepat untuk menentukan pengobatan awal yang tepat bagi penderita stroke. Jika pengobatan awal yang tepat terlambat untuk dilakukan, maka hal ini dapat menyebabkan kecacatan bahkan kematian. Penelitian ini menyelesaikan masalah klasifikasi stroke menggunakan pendekatan machine learning dengan metode Minimally Spanned Support Vector Machine (MSSVM). Metode ini merupakan pengembangan dari metode Support Vector Machine (SVM) dimana metode ini mengaplikasikan algoritma Minimum Spanning Tree (MST) untuk mereduksi jumlah support vector pada SVM. Hal ini bertujuan untuk mempercepat waktu komputasi yang dibutuhkan oleh SVM dan meningkatkan kinerja SVM. Hal ini dikarenakan waktu komputasi yang dibutuhkan oleh SVM bergantung pada jumlah support vector dimana jumlah support vector yang semakin banyak memberikan waktu komputasi yang dibutuhkan semakin lama. Selain itu, pereduksian jumlah support vector dapat memberikan kesalahan generalisasi yang lebih kecil sehingga memberikan kinerja yang lebih baik. Pada penelitian ini, kinerja dari MSSVM dievaluasi dengan membandingkan beberapa parameter dengan kinerja SVM. Hasil yang diperoleh adalah bahwa MSSVM berhasil mereduksi jumlah support vector pada SVM sedemikian sehingga mempercepat waktu komputasi yang dibutuhkan oleh SVM dalam mengklasifikasikan data stroke tanpa mengurangi kinerja dari SVM.  


Stroke classification is a problem that must be solved quickly and precisely to determine the right initial treatment for stroke sufferers. If the right initial treatment is too late to do so, this can cause disability and even death. This study solves the problem of stroke classification using a machine learning approach with Minimally Spanned Support Vector Machine (MSSVM) method. This method is a development of Support Vector Machine (SVM) method where this method applies the Minimum Spanning Tree (MST) algorithm to reduce the number of support vectors in SVM. This aims to speed up the computation time required by SVM and improve the performance of SVM. This is because the computation time required by SVM depends on the number of support vectors where the more support vectors give the required computation time longer. In addition, reducing the number of support vectors can provide smaller generalization errors, thus providing better performance. In this study, the performance of MSSVM was evaluated by comparing several parameters with the performance of SVM. The results obtained are that MSSVM has succeeded in reducing the number of support vectors in SVM thus accelerating the computational time needed by SVM in classifying stroke data without reducing SVM performance.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ajeng Maharani Putri
"Stroke adalah tanda-tanda klinis gangguan fungsi otak yang penyebabnya berasal dari pembuluh darah. Hal tersebut dapat terjadi karena bagian otak tidak menerima aliran darah yang dibutuhkan karena suatu alasan, baik suplai darah ke bagian otak terganggu, atau karena pembuluh darah di otak pecah dan darah menyebar ke daerah sekitarnya. Sejumlah tes klinis telah dikembangkan selama bertahun-tahun untuk membantu menentukan keberadaan stroke. Salah satunya dengan brain imaging, yaitu menggunakan CT (Computed Tomography) scan dan MRI (Magnetic Resonance Imaging). Pemeriksaan ini dilakukan oleh dokter guna melakukan diagnosa pasien terhadap jenis stroke yang diderita. Dua jenis utama dari penyakit stroke ini ada dua, yaitu stroke iskemik dan stroke hemoragik. Sebagai tes pencitraan untuk mendiagnosa stroke, CT scan dan MRI memiliki kelebihan dan kekurangannya masing-masing. Kemudian selain tes pecintraan, terhadap pasien stroke juga dilakukan pemeriksaan laboratorium yang berisi fitur-fitur dari pemeriksaan laboratorium tersebut. Oleh karena itu, dalam penelitian akan dilakukan pengklasifikasian dengan pendekatan menggunakan machine learning menggunakan data pemeriksaan laboratorium pasien stroke. Metode klasifikasi yang digunakan adalah Grey Wolf Optimization-Support Vector Machine (GWO-SVM), dimana Grey Wolf Optimization (GWO) digunakan sebagai optimisasi parameter yang akan digunakan pada Support Vector Machine (SVM). Untuk mengukur performa GWO-SVM, hasil akurasi, spesifisitas, dan sensitivitas dari klasifikasi dengan GWO-SVM akan dibandingkan dengan SVM. Data stroke yang digunakan dalam penelitian ini diperoleh dari Departemen Medik Penyakit Syaraf, Rumah Sakit Umum Pusat Nasional (RSUPN) Dr. Cipto Mangunkusumo. Hasil menujukan bahwa klasifikasi dengan menggunakan Grey Wolf Optimization-Support Vector Machine (GWO-SVM) menghasilkan performa yang lebih baik jika dibandingkan dengan Support Vector Machine (SVM) tanpa optimisasi parameter.

Stroke is clinical signs of impaired brain function whose causes originate from vascular. It occurs when part of the brain does not receive the needed blood flow for a reason, either the blood supply to the brain is disrupted, or because a blood vessel in the brain burst and blood spreads to the surrounding area. Several clinical tests have been developed over the years to help determine the presence of a stroke. One of them is by brain imaging, which uses CT (Computed Tomography) scan and MRI (Magnetic Resonance Imaging). This examination is carried out by the doctor to diagnose the patient for the type of stroke suffered. There are two main types of stroke, namely ischemic stroke and hemorrhagic stroke. As an imaging test to diagnose stroke, CT scan and MRI have their respective advantages and disadvantages. Then, in addition to the imaging test, the stroke patient has also carried out a laboratory examination that contains the features of the laboratory examination. Therefore, in this research a classification approach using machine learning will be carried out using laboratory examination data of stroke patients. The classification method that will be used is Grey Wolf Optimization-Support Vector Machine (GWO-SVM), where Grey Wolf Optimization (GWO) is used as an optimization parameter to be used in Support Vector Machine (SVM). To measure the performance of GWO-SVM, the results of accuracy, specificity, and sensitivity of the classification with GWO-SVM will be compared with SVM. Stroke data used in this study were obtained from the Department of Neurology, National Center General Hospital Dr. Cipto Mangunkusumo. The results showed that the classification using GWO-SVM produces better performance when compared to SVM without parameter optimization.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Wahyu Nuryaningrum
"Pesatnya perkembangan ekonomi menyebabkan kebutuhan manusia menjadi tidak terbatas. Usaha yang dapat dilakukan untuk pemenuhan kebutuhan hidup di masa yang akan datang adalah dengan melakukan investasi. Saham merupakan salah satu instrumen investasi dengan tingkat keuntungan yang menarik, namun memiliki risiko kerugian yang tinggi. Hal ini disebabkan oleh adanya pergerakan harga saham yang cenderung tak menentu selama periode waktu tertentu. Untuk meminimalkan risiko kerugian, perlu dilakukan prediksi pergerakan harga saham. Prediksi yang akurat akan membantu para investor dalam menentukan nilai saham di masa yang akan datang. Pada penelitian ini, dilakukan perbandingan untuk memprediksi pergerakan harga saham menggunakan tiga algoritma supervised machine learning yaitu Random Forest, Support Vector Regression (SVR) dan K- Nearest Neighbor (KNN) berdasarkan tingkat akurasinya. Sutau model dikatakan akurat jika memiliki nilai Root Mean Square Error (RMSE) dan Mean Absolute Error (MAE) yang lebih rendah. Pada penelitian ini, diperoleh hasil prediksi harga penutupan saham terbaik menggunakan metode Support Vector Regression dengan melihat rendahnya nilai RMSE dan MAE yang dihasilkan dibandingkan dengan dua metode lain. Dalam perhitungannya, penelitian ini menggunakan histori data harian dari website investing.com. periode Maret 2017 hingga Februari 2020 dari tiga perusahaan di Indonesia yang terdaftar dalam IDX30.

The fast growth of economic development causes human needs to be immeasurable. One of the efforts that could be done to fulfill life needs in the future was Investation. Stock is one of the Investation instruments with interesting benefits but has high- risk loss caused by the unstable stock market trend between some period. For minimalizing the risky loss, the literati need to predicting the stock rate trend. The accurate prediction will help the investor in choosing a stock value in the future. In this study, the literati make a comparison to predict stock market trend with three kinds of algorithms supervised machine learning that are Randon Forest, Support Vector Regression (SVR), and K-Nearest Neighbor (KNN) based on their accurate level. A model could be said accurate just if they have a lower value of Root Mean Square Error (RMSE) and Mean Absolute Error (MAE). The best Stock Closing Price prediction will be obtained by the Support Vector Regression method and see how low the result of RMSE and MAE value is compared with another method. To calculate, the study uses a daily data history from investing.com website between March 2017 to February 2020 period. The object data is a three big company in Indonesia which listed in IDX30."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aziz Setia Aji
"ABSTRAK
Badan Meteorologi Klimatologi dan Geofisika (BMKG) memiliki tugas pengamatan terhadap magnet bumi yang tersebar di Indonesia. Sensor magnetik bumi BMKG menghasilkan output data real-time. Penelitian ini berfokus pada model predictive maintenance pada sensor magnetik bumi berdasarkan output data sensor. Output data yang dihasilkan adalah dalam bentuk format delimited-space sehingga mudah untuk diproses. Komponen magnetik yang digunakan dalam penelitian ini adalah data komponen total magnet bumi (F) dari sensor. Pemrosesan data menggunakan bahasa pemograman python dan algoritma yang digunakan adalah metode random forest regression dengan membandingkan perbedaan nilai yang dihasilkan dengan data Indoesian Geomagnetic Maps for Epoch 2015.0 untuk kemudian dibuatkan model prediksi terhadap waktu. Proses tersebut digunakan untuk mengetahui apakah data yang dihasilkan masih dalam toleransi atau tidak. Tahapan dalam penelitian ini mulai dari pengumpulan data, pre-processing data, pembuatan model, hingga pengujian model dan validasi terhadap model. Penelitian ini menghasilkan estimasi waktu pemeliharan sebesar 14 hari pada data baseline nilai F dan sebesar 3 hari pada data delta F (ΔF).

ABSTRACT
The Meteorological, Climatological, and Geophysical Agency (BMKG) has the task of observing the earth magnets spread across Indonesia. Earth magnetic sensor of BMKG delivers real-time data output. The study focuses on the predictive maintenance model on the earth's magnetic sensor based on sensor data output. The resulting data output is in the form of delimited-space format so it is easy to process. The magnetic component used in this study is data on the earth's total magnetic component (F) from the sensor. Data processing uses python programming language and the algorithm used is a random forest regression method by comparing the value difference generated with the Indoesian Geomagnetic Maps for Epoch 2015.0 data for later created predictive models against time. The process is used to determine whether the resulting data is still in tolerance or not. The stages in this study range from data collection, pre-processing data, create model, model testing, and model validation. The study resulted in a 14-day maintenance time estimate of the baseline data F-value and 3-day in the delta F (ΔF) data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Nathanael Matthew
"Smartphone telah dikembangkan sebagai alat deteksi pothole oleh berbagai penelitian karena potensinya dalam memberikan manfaat pengumpulan data secara crowdsourcing tanpa memerlukan suatu infrastruktur khusus dan mahal. Namun, metode deteksi pothole berbasis smartphone memiliki tantangan dalam menghadapi berbagai ketidakpastian intrinsik dalam mengukur sinyal yang dihasilkan oleh perangkat smartphone berbeda. Ketangguhan metode dalam menghadapi ketidakpastian intrinsik tersebut diperlukan agar potensi pengumpulan data secara crowdsourcing dapat tercapai. Meskipun telah banyak penelitian yang menghasilkan kinerja deteksi yang memuaskan, berbagai macam faktor ketidakpastian masih mencegah ketangguhan penuh dari metode deteksi pothole tersebut. Penelitian menanggapi faktor-faktor ketidakpastian potensial sebagai faktor prediktor dalam mengembangkan model deteksi berbasis algoritma Random Forest dengan memanfaatan sudut Euler untuk menyelaraskan percepatan akselerometer terhadap percepatan vektor gravitasi; menerapan profil matriks untuk mengurangi kesalahan pelabelan pothole dan memberikan apriori untuk klasifikasi secara efisien; dan diskritisasi temporal pada data sensor dengan penghalusan data tersegmentasi berdasarkan jarak roda platform deteksi (Zona Deteksi). Ketangguhan metode dibuktikan dengan eksperimen faktorial bertingkat dengan variasi spesifikasi perangkat sensor, variasi rute dan tingkatan pothole, serta variasi ketersediaan sensor. Eksperimen membuktikan bahwa faktor-faktor ketidakpastian memiliki efek signifikan secara statistik, namun tidak mempengaruhi kinerja model-model yang dihasilkan. Selain tangguh, kinerja model klasifikasi yang dihasilkan menunjukkan hasil serupa atau bahkan lebih baik dari metode lain yang ada saat ini.

Smartphones have been developed as a pothole detection tool by various studies due to their potential in providing crowdsourced data collection without the need for special and expensive infrastructure. However, a reliable smartphone-based pothole detection method is challenging to develop due to various uncertainties in measuring the signal generated by different smartphone devices. A robust method is needed to deal with said uncertainties so crowdsourced data collection potential can be achieved. Although many studies have yielded satisfactory performance, various uncertainty factors still prevent the full robustness of the existing pothole detection methods. This study endeavors to address the potential uncertainty factors as predictors in developing a pothole detection model with Random Forest algorithm. This is done by incorporating Euler angles to align the relevant sensor data to gravitational vector acceleration; matrix profile to reduce pothole labeling errors and provide a priori for efficient classification; and temporal discretization of sensor data with data segment-smoothing based on detection platform wheelbase (Detection Zone). The robustness of the proposed method is proven using multilevel factorial experiment with variations of sensor device specifications, variations in routes and levels of potholes, and variations in sensor availability. The conducted experiment proves the statistical significance of the simulated uncertainty factors does not affect the performance of the resulting models. Besides showing robustness, the performance of the resulting classification models shows promising results that are comparable to or better than other currently available smartphone-based pothole methods."
Depok: Fakultas Teknik Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>