Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 119356 dokumen yang sesuai dengan query
cover
Wahyu Nuryaningrum
"Pesatnya perkembangan ekonomi menyebabkan kebutuhan manusia menjadi tidak terbatas. Usaha yang dapat dilakukan untuk pemenuhan kebutuhan hidup di masa yang akan datang adalah dengan melakukan investasi. Saham merupakan salah satu instrumen investasi dengan tingkat keuntungan yang menarik, namun memiliki risiko kerugian yang tinggi. Hal ini disebabkan oleh adanya pergerakan harga saham yang cenderung tak menentu selama periode waktu tertentu. Untuk meminimalkan risiko kerugian, perlu dilakukan prediksi pergerakan harga saham. Prediksi yang akurat akan membantu para investor dalam menentukan nilai saham di masa yang akan datang. Pada penelitian ini, dilakukan perbandingan untuk memprediksi pergerakan harga saham menggunakan tiga algoritma supervised machine learning yaitu Random Forest, Support Vector Regression (SVR) dan K- Nearest Neighbor (KNN) berdasarkan tingkat akurasinya. Sutau model dikatakan akurat jika memiliki nilai Root Mean Square Error (RMSE) dan Mean Absolute Error (MAE) yang lebih rendah. Pada penelitian ini, diperoleh hasil prediksi harga penutupan saham terbaik menggunakan metode Support Vector Regression dengan melihat rendahnya nilai RMSE dan MAE yang dihasilkan dibandingkan dengan dua metode lain. Dalam perhitungannya, penelitian ini menggunakan histori data harian dari website investing.com. periode Maret 2017 hingga Februari 2020 dari tiga perusahaan di Indonesia yang terdaftar dalam IDX30.

The fast growth of economic development causes human needs to be immeasurable. One of the efforts that could be done to fulfill life needs in the future was Investation. Stock is one of the Investation instruments with interesting benefits but has high- risk loss caused by the unstable stock market trend between some period. For minimalizing the risky loss, the literati need to predicting the stock rate trend. The accurate prediction will help the investor in choosing a stock value in the future. In this study, the literati make a comparison to predict stock market trend with three kinds of algorithms supervised machine learning that are Randon Forest, Support Vector Regression (SVR), and K-Nearest Neighbor (KNN) based on their accurate level. A model could be said accurate just if they have a lower value of Root Mean Square Error (RMSE) and Mean Absolute Error (MAE). The best Stock Closing Price prediction will be obtained by the Support Vector Regression method and see how low the result of RMSE and MAE value is compared with another method. To calculate, the study uses a daily data history from investing.com website between March 2017 to February 2020 period. The object data is a three big company in Indonesia which listed in IDX30."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Diva Arum Puspitasari
"Prediksi trend harga saham dapat berguna bagi trader untuk menentukan nilai saham dimasa yang akan datang. Untuk memprediksi trend dengan analisis teknikal adalah melakukan prediksi harga penutupan saham. Seiring dengan waktu, meningkatnya harga saham setara dengan diperolehnya return saham yang profit. Pada skripsi ini, dilakukan analisis dan prediksi harga penutupan saham selama sebulan menggunakan metode Support Vector Machines ndash; K Nearest Neighbor SVM-KNN . Pertama, terlebih dahulu dilakukan pemilihan indikator teknikal yang berpengaruh terhadap saham perusahaan yang dianalisis menggunakan Support Vector Regression SVR . Kedua, klasifikasi return saham yang terdiri dari profit dan loss dengan SVM. Hasil prediksi label kelas dapat membantu mencari tetangga terdekat dalam memprediksi harga penutupan saham dengan KNN. Percobaan dilakukan menggunakan 3, 4, dan 5 indikator teknikal yang terpilih dan tanpa pemilihan fitur dengan 13 indikator teknikal.

Stock price trend prediction is important for trader to determine whether the stock price is rising up or not. To predict the trend using technical stock analysis is by predicting the close prices. Along the time, when the price is rising up then it can indicate profit return. This undergraduate thesis will study how to analysis and prediction of stock closing prices one month ahead with Support Vector Machines ndash K Nearest Neighbor SVM KNN method. First, feature selection method is applied to select the important technical indicators using Support Vector Regression SVR . Second, classify the stock rsquo s return which consist of profit and loss using SVM. The output of class label is used to help find the nearest neighbor. Next, stock prices are forecasted using KNN. This study will be experimented with 3, 4, and 5 selected indicators and compared with 13 technical indicators."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
S69143
UI - Skripsi Membership  Universitas Indonesia Library
cover
Restu Eka Firdaus
"Sistem pengenalan wajah telah banyak diaplikasikan dengan menggunakan berbagai metode, diantaranya: metode PCA, metode ICA, metode LDA, metode EP, metode EBGM, metode Kernel, metode 3-D Morphable, metode 3-D Face Recognition, metode Bayesian Framework, metode HMM, metode SVM, dan sebagainya.
Pada penelitian ini digunakan metode Local Binary Pattern LBP untuk melakukan ekstraksi fitur citra wajah, serta metode SVM dan KNN untuk mengukur tingkat akurasi sistem pengenalan wajah. Data yang digunakan pada penelitian ini yaitu citra wajah 25 mahasiswa Matematika Universitas Indonesia, masing-masing individu diambil 10 citra wajah yang berbeda terdiri dari 5 citra wajah menggunakan kacamata dan 5 citra lainnya tidak menggunakan kacamata, serta diambil dari sudut yang berlainan.
Berdasarkan pengujian yang telah dilakukan, metode KNN dengan memperoleh tingkat akurasi terbaik yaitu sebesar 96.20 pada iterasi 100 dan 90 data training. Hal ini menunjukkan metode KNN lebih baik dibandingkan dengan metode SVM yang hanya memperoleh tingkat akurasi sebesar 94.80 pada iterasi 100 dan 90 data training.

Face recognition has been widely applied using various methods, that is PCA, ICA, LDA, EP, EBGM, Kernel, 3 D Morphable, 3 D Face Recognition, Bayesian Framework, HMM, SVM, etc.
In this research, the Local Binary Pattern LBP method is used to perform feature extraction of a facial image, and to measure the accuracy level of face recognition used SVM and knn method. The data used in this research are face images of 25 mathematics students of University of Indonesia, each individual took 10 different facial images consisting of 5 face images are using glasses with 5 different angles and 5 other images aren 39 t using glasses that also taken from the same 5 different angles.
Based on the tests, KNN method with K 1 obtained the best accuracy of 96.20 at 100 iterations and 90 training data. This result shows the KNN method is better than the SVM method which only obtained 94.80 at 100 iterations and 90 of training data.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Revan Dzaky Fahrezi
"Penelitian ini bertujuan untuk mengintegrasikan analisis sentimen dan teknik pengelompokan teks (text clustering) dalam mengevaluasi kualitas layanan berdasarkan model SERVQUAL, yang mencakup lima dimensi utama: Tangibility, Responsiveness, Reliability, Assurance, dan Empathy. Metode yang digunakan meliputi Naïve Bayes, Support Vector Machine, dan K-Nearest Neighbor untuk melakukan klasterisasi sentimen yang bervariasi di setiap dimensi SERVQUAL. Hasil analisis menunjukkan bahwa sentimen pelanggan berbeda di setiap dimensi, dengan beberapa area menonjol dalam sentimen negatif atau positif. Teknik clustering teks membantu mengidentifikasi tema-tema umum dan masalah yang sering dihadapi pelanggan. Kesimpulan dari penelitian ini adalah pendekatan analisis sentimen dan text clustering memberikan wawasan yang lebih detail dan mendalam mengenai kualitas layanan, yang memungkinkan perusahaan untuk mengambil tindakan yang lebih tepat dalam meningkatkan setiap dimensi SERVQUAL untuk meningkatkan kepuasan dan loyalitas pelanggan secara keseluruhan

This study aims to integrate sentimen analysis and text clustering techniques to evaluate service quality based on the SERVQUAL model, which includes five main dimensions: Tangibility, Responsiveness, Reliability, Assurance, and Empathy. The methods used include Naïve Bayes, Support Vector Machine, and K-Nearest Neighbor to perform sentimen clustering that varies across each SERVQUAL dimension. The analysis results show that customer sentimens differ across each dimension, with certain areas standing out in either negatif or positive sentimens. Text clustering techniques help identify common themes and issues frequently faced by customers. The conclusion of this study is that the sentimen analysis and text clustering approach provides more detailed and in-depth insights into service quality, enabling companies to take more precise actions in enhancing each SERVQUAL dimension to increase overall customer satisfaction and loyalty."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anggoro Gagah Nugroho
"Plat nomor merupakan suatu jenis identifikasi kendaraan bermotor. Setiap kendaraan bermotor yang beroperasi dijalanan diwajibkan untuk melengkapi kendaraannya dengan plat nomor atau Tanda Nomor Kendaraan Bermotor (TNKB) yang sesuai dengan kode wilayah, nomor registrasi dan masa berlaku. Plat nomor di Indonesia terdapat 3 warna yang dipakai yaitu hitam, merah dan kuning dengan masing masing warna untuk fungsi yang berbeda. Dengan jumlah kendaraan di Indonesia, sistem pengenalan plat nomor dibuat secara otomatis bisa di implementasikan untuk memudahkan berbagai hal dalam pendataan plat nomor diantaranya pengecekan plat nomor ketika di area parkir, menemukan kendaraan yang dicuri ataupun mobil yang melanggar lampu merah. Pada penelitian ini terdapat 2 metode yang sering digunakan untuk pengenalan plat nomor otomatis yaitu KNN (K-Nearest Neighbour) dan NN (Neural Network). Setelah dilakukan pengujian menggunakan 3 analisis uji yang sudah dilakukan oleh penulis, akurasi metode neural network berhasil mencapai 88,8% sedangkan pada K-Nearest Neighbor akurasinya mencapai 72,2%. Metode NN lebih baik daripada KNN pada pengujian kali ini disebabkan adanya modifikasi pada variable yang dapat membuat akurasi NN lebih baik daripada KNN. Sedangkan pada metode KNN tidak dapat merubah akurasi yang telah didapatkan.

Number plate is a type of motor vehicle identification. Every motorized vehicle operating on the road is required to complete the vehicle with a license plate or Motor Vehicle Number (TNKB) that matches the area code, registration number and validity period. Number plates in Indonesia there are 3 colors used, namely black, red and yellow with each color for different functions. With the number of vehicles in Indonesia, the number plate recognition system is made automatically can be implemented to facilitate various things in number plate registration including checking license plates when in the parking area, finding stolen vehicles or cars that violate red lights. In this study there are 2 methods that are often used for automatic number plate recognition, namely K-Nearest Neighbor and NN (Neural Network). After testing using 3 test analyzes carried out by the author, the accuracy of the neural network method reached 88.8% while the K-Nearest Neighbor accuracy was 72.2%. The NN method is better than KNN in this test due to a modification in the variable that can make the accuracy of NN better than KNN. While the KNN method cannot change the accuracy that has been obtained."
Depok: Fakultas Teknik Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahri Alamsyah
"Dunia digital khususnya image processing berkembang seiring waktu berjalan dikarenakan kebutuhan masyarakat dan pentingnya keamanan sistem berbasis digital. Salah satu teknologi yang sangat mengalami kemajuan pesat adalah pengenalan wajah (face recognition) menggunakan artificial intelligence. Wajah seseorang yang sudah terdaftar di dalam database akan dikenali oleh sistem untuk keperluan validasi atau verifikasi. Di dalam penelitian ini dirancang sistem pengenalan wajah (face recognition) menggunakan algoritma machine learning dan Principal Component Analysis (PCA) sebagai pereduksi dimensi. Pengujian dilakukan dengan menggunakan beberapa metode, yakni: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K- NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) dan Convolutional Neural network (CNN). CNN berfokus pada layer dan tidak memerlukan reduksi dimensi, sehingga hasilnya lebih akurat. Model machine learning yang digunakan untuk classifier selain CNN adalah standar/default, sedangkan CNN menggunakan arsitektur LeNet-5, dengan dropout rate sebesar 0.25. Training dilakukan selama 60 epoch dengan loss function crosscategorical entropy, optimizer Adam, dan batch size sebesar 20. Data masukan adalah citra wajah berukuran 64 × 64 × 1 yang diperoleh dari dataset olivetti faces. Akurasi tertinggi metode PCA, SVM, maupun LR sebesar 91.25%, sementara akurasi terbaik CNN mencapai 98.75%. Selain akurasi, pemakaian confusion matrix dan classification report digunakan untuk menguji performa metode yang ada melalui evaluasi model klasifikasi.

The digital world, especially image processing, is evolving due to the needs of society and the importance of digital-based system security. One of the technologies that are rapidly progressing is face recognition using artificial intelligence. The system will recognize a person's face already registered in the database for validation or verification purposes. A face recognition system was designed using machine learning algorithms and Principal Component Analysis (PCA) as dimension reduction in this study. Testing is conducted using several methods: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K-NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) and Convolutional Neural network (CNN). CNN focuses on layers and does not require dimensional reduction to increase the accuracy of the result. The machine learning model used for classifiers other than CNN is standard/default settings, while CNN uses the LeNet-5 architecture, with a dropout rate of 0.25. The training was conducted for 60 epochs with loss function cross-categorical entropy, optimizer Adam, and batch size of 20. Input data is a 64 × 64 × 1 facial image obtained from the Olivetti faces database. The highest accuracy of PCA, SVM and LR methods was 91.25%, while CNN's best accuracy reached 98.75%. In addition to accuracy, the use of confusion matrix and classification report is used to test the performance of existing methods through the evaluation of classification models."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rany Dwi Cahyaningtyas
"Produk susu bubuk balita yang beragam membuat konsumen memiliki banyak pilihan sehingga penting bagi produsen menjaga loyalitas pelanggan yang telah ada dengan memahami perilaku churn pelanggan. Churn pelanggan didefinisikan sebagai kecenderungan pelanggan untuk berhenti melakukan bisnis dengan sebuah perusahaan. Penelitian ini berfokus memprediksi pola churn pelanggan sehingga perusahaan dapat menentukan strategi untuk mengurangi churn. Penelitian ini membahas mengenai prediksi churn pelanggan berdasarkan segmen produk susu bubuk balita menggunakan model Length, Recency, Frequency, Monetary (LRFM). Responden penelitian ini adalah pelanggan PT. XYZ yang pernah bertransaksi untuk produk susu bubuk balita kelas premium (susu A) dan segmen biasa (susu B) selama periode tahun 2021. Variabel pada penelitian ini meliputi variabel LRFM dan CLV yang dibentuk dengan pembobotan variabel LRFM. Pertama metode Fuzzy C-Means Clustering digunakan untuk melakukan pelabelan target pelanggan selanjutnya metode klasifikasi K-Nearest Neighbor (KNN) digunakan untuk memprediksi churn. Hasilnya terdapat tiga kelompok pelanggan untuk masing-masing susu A dan susu B. Pelabelan yang dihasilkan yaitu pelanggan churn dengan nilai CLV rendah, potential to churn dengan nilai CLV menengah, dan loyal dengan nilai CLV tinggi. Susu B menunjukkan jumlah pelanggan churn sebesar 43,4% lebih banyak dibandingkan susu A sebanyak 34%. Tahapan akhir penelitian ini adalah menganalisis kinerja metode KNN berdasarkan nilai akurasi, recall, dan f1-score terhadap kedua susu A dan susu B. Hasil dari tugas akhir ini menunjukkan bahwa kinerja metode KNN bergantung pada pemilihan jumlah tetangga terdekat dan proporsi pemisahan data.

The variety of powdered toddler milk products gives consumers many choices, so producers need to maintain the loyalty of existing customers by understanding customer churn behaviour. Customer churn is defined as the tendency of a customer to stop doing business with a company. This study focuses on predicting customer churn patterns so companies can determine strategies to reduce churn. This study discusses the prediction of customer churn based on the segment of toddler powdered milk products using the Length, Recency, Frequency, Monetary (LRFM) model. The respondent of this research are the customers of PT. XYZ who have transacted for premium segment powdered milk products for toddlers (milk A) and ordinary segment (milk B) during 2021. Variables in the data include LRFM and CLV variables which are formed by weighting the LRFM variable. At first, Fuzzy C-Means Clustering algorithm was applied for labelling target customer and then, K-Nearest Neighbor (KNN) Classifier as churn prediction was used. As a result, there are three groups of customers for each milk A and milk B. The resulting labels are the churn customer group with low CLV value, potential to churn group with medium CLV, and loyal customer group with high CLV value. Milk B shows the number of customers churn by 43,4% more than milk A as much as 34%. In the final stage of this research, the author analyze the performance of the KNN method based on the value of accuracy, recall, and f1-score for both milk A and milk B. The results of this final project show that the performance of the KNN method depends on the selection of the number of nearest neighbors and the proportion of data splitting used."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Annisa Kamalia
"ABSTRACT
Talasemia adalah penyakit yang disebabkan oleh adanya kelainan dalam hemoglobin. Penyakit talasemia merupakan penyakit herediter atau penyakit keturunan dimana pembawa gen talasemia adalah orang tua dari penderita. Di Indonesia, pada tahun 2015 diketahui jumlah kasus talasemia mencapai 7.029 kasus. Sampai saat ini talasemia belum dapat disembuhkan namun dapat dikenali sifat pembawanya dengan skrining. Dalam tugas akhir ini, akan dibandingkan performa dari dua metode yang digunakan untuk mengklasifikasikan data talasemia, yaitu K-Nearest Neighbor dan Naive Bayes. Data yang digunakan adalah 82 data pasien talasemia dan 68 data pasien non-talasemia dari Rumah Sakit Anak dan Bunda Harapan Kita, Jakarta Barat. Hasil akhir menunjukkan bahwa metode Naive Bayes memberikan nilai akurasi yang lebih besar dari K-Nearest Neighbor dalam mengklasifikasikan talasemia. Rata-rata akurasi Naive Bayes sebesar 99.775% dengan rata-rata waktu running 0.0554 detik dan rata-rata akurasi K-Nearest Neighbor adalah 97.142% dengan rata-rata waktu running 0.081 detik. Untuk nilai spesifikasi, keduanya memberikan performa yang sama, yaitu dari K-Nearest Neighbor diperoleh ketika K=3 yaitu sebesar 100% dan dari Naive Bayes sebesar 100%. Hasil rata-rata sensitivitas tertingi diberikan oleh Naive Bayes yaitu sebesar 99.59%, sedangkan K-Nearest Neighbor sebesar 96.25% untuk K=1.

ABSTRACT
Thalassemia is a disease caused by abnormalities in the hemoglobin. Thalassemia is a hereditary disease which the thalassemia gene carriers are parents of sufferers. In Indonesia, in 2015 it was found that the number of thalassemia cases reached 7,029 cases. Until now thalassemia has not been cured, but it can be recognized the nature of its carrier by screening. In this final project, the performance of the two methods will be compared to classify thalassemia data, namely K-Nearest Neighbor and Naive Bayes. The data used were 82 data on thalassemia patients and 68 data on non-thalassemia patients from Harapan Kita Children and Womans Hospital, West Jakarta. The final results show that the Naive Bayes method provides greater accuracy value than K-Nearest Neighbor in classifying thalassemia. The average accuracy of Naive Bayes is 99.775% with an average running time of 0.0554 seconds and the average accuracy of K-Nearest Neighbor is 97.142% with an average running time of 0.081 seconds. For specification values, both give the same performance. The result of specification values using K-Nearest Neighbor yield when K = 3 that is 100% and from Naive Bayes that is 100%. The highest average sensitivity results are given by Naive Bayes is 99.59%, while K-Nearest Neighbor is 96.25% for K = 1."
2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Puteri Kintandani
"Investasi saham merupakan salah satu jenis investasi yang paling populer karena saham memberikan tingkat keuntungan yang tinggi dibandingkan dengan jenis investasi lainnya, tetapi saham juga memiliki tingkat risiko yang tinggi. Fluktuasi harga saham memberikan peluang bagi investor untuk mendapatkan keuntungan yang tinggi. Dibutuhkan sebuah model prediksi harga saham untuk melihat pergerakan harga saham di masa yang akan datang, sehingga investor dapat menentukan waktu yang tepat untuk membeli, menahan, dan menjual saham mereka. Dengan demikian, mereka terlepas dari risiko kerugian dan memperoleh keuntungan yang besar. Terdapat beberapa studi yang membahas tentang prediksi harga saham menggunakan machine learning. Salah satunya yaitu menggunakan Support Vector Regression (SVR). Oleh karena itu, pada skripsi ini akan diuji penerapan SVR menggunakan Particle Swarm Optimization (PSO) sebagai seleksi fitur dalam memprediksi harga saham di Indonesia. Pada skripsi ini digunakan data historis saham harian dari Jakarta Stock Index dan beberapa saham pada sektor real estate dan properti. Beberapa indikator teknikal digunakan sebagai fitur dalam memprediksi harga saham. Studi ini menunjukkan bahwa prediksi harga saham menggunakan SVR dengan PSO sebagai seleksi fitur memiliki kinerja yang baik untuk semua data, fitur, dan jumlah data training yang digunakan pada skripsi ini memiliki nilai error yang kecil. Oleh karena itu, diperoleh model yang akurat untuk memprediksi harga saham di Indonesia.

Stock investing is one of the most popular types of investments since it provides the highest return among all investment types, although it is associated with considerable risk. Fluctuating stock prices provide an opportunity for investors to make a high profit. A stock price prediction model is needed to see future stock price movements, so investors can decide the right time to buy, hold, and sell their stocks which regardless of the risk of loss and gain a big profit. Several studies have focused on the prediction of stock prices using machine learning. One of them is Support Vector Regression (SVR). Therefore, this study examines the application of SVR using Particle Swarm Optimization (PSO) as feature selection in predicting Indonesian stock price. This thesis used historical daily stock data from Jakarta Stock Index (JKSE) and several real estates and property stock sectors. Some technical indicators are used as a feature in predicting stock price. The study found that stock price prediction using SVR with PSO as feature selection showed good performances for all data, features and the amount of training data used by the study have relatively low error probabilities. Therefore, an accurate model is obtained to predict stock price in Indonesia."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Valentinus Paramarta
"Semakin tinggi penetrasi penggunaan Internet seseorang, maka akan semakin berpotensi terkena Gangguan Adiksi Internet (GAI) yang dapat berdampak buruk pada status kesehatan mental penggunanya. Mayoritas penduduk Indonesia telah menggunakan layanan Internet selama 2 sampai 3 tahun dengan penggunaan rata-rata di atas 8 jam
perhari. Hal tersebut menunjukkan penggunaan Internet dan potensi dampaknya pada kesehatan mental di Indonesia penting untuk diperhatikan sedini mungkin. Penelitian lain menunjukkan bahwa tingkat kesehatan mental yang dialami seseorang dapat mempengaruhi perilaku penggunaan Internetnya, sehingga menyebabkan munculnya keinginan yang tidak terkendali dan berlebihan dalam pengaksesan Internet. Secara tidak langsung, hal tersebut menyatakan bahwa kesehatan mental seseorang juga dapat diamati melalui tingkah laku serta kebiasaan seseorang dalam menggunakan Internet. Prediksi GAI dan gangguan kesehatan mental mahasiswa UI dilakukan dengan menggunakan algoritma pemelajaran mesin Support Vector Machine (SVM) berdasarkan perilaku penggunaan Internet yang dilakukan. Sampel diambil dari mahasiswa UI rumpun Ilmu Saintek (Ilmu Komputer, Teknik, dan MIPA). Data yang diambil adalah riwayat penulusuran halaman website yang diakses oleh mahasiswa dan hasil kuesioner Internet addiction test (IAT) dan General Health Questionnaire (GHQ-12). Riwayat penelusuran website dijadikan himpunan fitur yang merepresentasikan perilaku penggunaan Internet responden, sedangkan hasil skor kuesioner IAT dan GHQ-12 digunakan untuk menjadi ground truth atau label pada dataset. Tahapan preprocessing yang dilakukan adalah metode Synthetic Minority Over-Sampling Technique (SMOTE) untuk mengatasi ketidak seimbangan persebaran data pada kelas data yang digunakan. Metode SVM selanjutnya dibandingkan dengan performa lainnya seperti Decision Tree dan k-Nearest Neighbor (kNN). Untuk meningkatkan performa akurasinya, peneliti menggunakan metode grid search untuk mendapatkan parameter terbaik. Proses validasi dilakukan menggunakan cross-validation pada metode grid search. Hasil yang didapatkan menunjukkan bahwa performa akurasi tertinggi pada SVM untuk memprediksi GAI adalah 88% pada dataset kedua. Saat dilakukan perbandingan hasil dengan metode pemelajaran mesin Decision Tree dan kNN, didapatkan performa nilai akurasi tertinggi dicapai pada metode Decision Tree dengan nilai akurasi sebesar 96%. Sedangkan untuk prediksi gangguan kesehatan mental, metode SVM mendapatkan nilai performa akurasi tertinggi sebesar 71% pada dataset gabungan. Saat dilakukan perbandingan hasil performa akurasi dengan Decision
Tree dan kNN, didapatkan nilai performa akurasi tertinggi dicapai pada metode kNN sebesar 72%. Hasil penelitian ini menunjukkan bahwa metode grid search meningkatkan performa SVM, Decision Tree, dan kNN karena adanya perubahan nilai parameter.

Excessive internet usage lead to potential Internet Addiction Disorders (IAD) which affect user`s mental health. The mayority of Indonesian people have been used Internet services for 2 until 3 years in their lives with an average use of above 8 hours per day. It shows that an increase of internet usage has a positive potential impact to an increase in mental disorder. Other research shows that the level of mental health experienced by a person can influence his Internet usage behavior, thus causing an uncontrolled and excessive desire to access the Internet. It could be concluded that the mental health can also be observed through one`s behavior and habits in using the Internet. This study predicts the internet addiction disorder (IAD) and mental health disorder status of UI students by using machine learning based on Support vector Machine (SVM) algorithm. This study used behaviour of internet usage for the input. Samples used in this study were taken from Universitas Indonesia`s students with Science and Technology background. The data collection period was set before and after the exam period. Data collected in this study included history of website accessed by students and questionnaires based on Internet addiction test (IAT) and General Health Questionnaire (GHQ-12). Student`s website history would be used as feature data set that represent user internet usage behavior, while the IAT and GHQ-12 questionnaires results were used as the label. The preprocessing stage was carried out using Synthetic Minority Over-Sampling Technique (SMOTE) method to overcome the imbalance of data distribution in class used. Then, student`s website history would be analyzed using machine learning based on SVM algorithm to predict IAT and mental health status. This study also compared other algorithms such as Decision Tree and k-Nearest Neighbor (kNN). The optimization of machine learning model was conducted using grid search method to obtain the best
parameters. The validation of the model would be carried out using the cross-validation obtained from grid search method. Based on the results obtained, it shows that the highest accuracy for predicting internet addiction was obtained from SVM algorithm with 88% accuracy for the second dataset. Comparison with other models showed that Decision Tree obtained the highest accuracy value of 96% for predicting internet addiction. For the prediction of mental health disorder, SVM algorithm obtained the highest accuracy than Decision Tree or kNN. The SVM algorithm can predict with accuracy of 71% with combined dataset. When comparing the accuracy result with the accuracy of Decision Tree and kNN, the highest accuracy value of 72% was achieved by kNN method. The optimal value of accuracy is obtained when the grid search method is performed. The results of this study indicate that the grid search method has succeeded in improving the performance of SVM, Decision Tree, and kNN due to parameter value changes.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>