Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 117277 dokumen yang sesuai dengan query
Adhimas Yudha Prawira
"Twitter merupakan salah satu media sosial yang digunakan secara massive di Indonesia. Para pengguna Twitter ini membicarakan berbagai macam hal, salah satunya terkait pencalonan presiden. Perbincangan para pengguna Twitter ini memiliki nilai sentimen baik positif maupun negatif. Dukungan masyarakat terhadap masing-masing kandidat calon presiden dapat diketahui dengan melihat sentimen masyarakat melalui perbincangan mereka di Twitter, hal ini sering disebut juga sebagai analisis sentimen. Namun, jumlah pengguna dan obrolan para pengguna Twitter yang sangat banyak mengakibatkan data yang akan diproses membutuhkan waktu yang cukup lama. Untuk melakukan proses analisis sentimen para pengguna Twitter secara cepat dan otomatis dapat digunakan bantuan mesin. Salah satu metode yang digunakan untuk melakukan proses analisis sentimen adalah Support Vector Machine (SVM). Pada dasarnya, semakin banyak data yang digunakan sebagai data training dalam pemilihan model fungsi klasifikator maka akan memberikan generalisasi akurasi analisis sentimen untuk data testing yang tinggi pula. Namun di sisi lain, semakin banyaknya data training juga akan menyebabkan besarnya dimensi ruang fitur. Hal ini membuat mesin membutuhkan waktu yang cukup lama dalam melakukan pembentukan fungsi klasifikator. Untuk menanggulangi hal ini, akan dilakukan metode optimasi fitur sehingga mesin dapat tetap membentuk fungsi klasifikator dengan akurasi yang tinggi namun dengan dimensi ruang fitur yang rendah.

Twitter is a social media that used in Indonesia massively. Twitter users talk (tweet) about various things, one of them is about presidential nomination. Twitter user conversations have a positive or negative sentiment. Community support for each presidential candidate can be determined by looking at the public sentiment through their conversations on Twitter, this is often referred to sentiment analysis. However, the number of users and tweets cause the data to be processed requires quite a long time. Machine can be used to make the process of Twitter sentiment analysis quickly and automatically. One method that used to perform the sentiment analysis process is a Support Vector Machine (SVM). Basically, the more data that used as data training in the model selection function will give a high accuracy generalization sentiment analysis on data testing. On the other hand, the increasing number of training data will also cause large dimensional feature space. This makes the machine takes a long time to perform model selection. To overcome this problem, feature optimization will be performed. Feature optimization will preserve the high accuracy of the model, but with a low dimensional feature space."
Universitas Indonesia, 2014
UI - Skripsi Membership  Universitas Indonesia Library
"Dalam perkembangan teknologi saat ini, perlindungan jaringan komputer sangat diperlukan, maka kita membutuhkan sebuah sistem untuk melindunginya jaringan dari serangan, salah satu serangan paling sering di jaringan Komputer adalah DDoS. Proteksi DDoS ini dapat dilakukan dengan cara: menggunakan Supervised Learning atau Unsupervised Learning. Diawasi Pembelajaran adalah suatu metode dimana sistem diberi label data sehingga mampu mengklasifikasikan data uji yang diberikan, dan pembelajaran tanpa pengawasan maka jika data tidak berlabel diberikan, maka sistem harus klasifikasi tanpa bantuan label, keuntungan dari sistem tanpa label apakah sistem mampu mengidentifikasi serangan yang tidak sistem pembelajaran yang aktif. Sistem untuk mendeteksi ini membutuhkan efisiensi
agar dapat merespon dengan cepat terhadap serangan yang dilakukan.
Maka dimungkinkan untuk membuat suatu sistem yang dapat menghilangkan data tersebut tidak ada kemampuan serangan, sistem ini dapat dikonfigurasi dengan menggunakan LSTM. Studi ini mencoba keefektifan Sistem pembelajaran tanpa pengawasan melalui implementasi sistem penghapusan data, eksperimen pada sistem kepunahan data untuk menentukan arsitektur terbaik, dan melakukan modifikasi pada sistem pembelajaran tanpa pengawasan. Hasil penelitian ini menunjukkan efek sistem data terhadap sistem deteksi DDoS dan
potensi keuntungan dan kerugian dari penerapan sistem dilakukan pada kemampuan deteksi sistem DDoS

In today's technological developments, computer network protection
indispensable, then we need a system to protect it network from attacks, one of the most frequent attacks on the network Computers are DDoS. This DDoS protection can be done by: using Supervised Learning or Unsupervised Learning. Supervised Learning is a method in which the system is labeled data so that able to classify the test data given, and unsupervised learning then if unlabeled data is given, then the system must labelless classification, the advantages of the labelless system whether the system is able to identify attacks that are not active learning system. The system to detect this requires efficiency in order to be able to respond quickly to attacks carried out.Then it is possible to create a system that can eliminate data no attack capability, this system can be configured with using LSTM. This study tested the effectiveness Unsupervised learning system through system implementation data deletion, experiment on extinction system data to determine the best architecture, and make modifications to unsupervised learning system. The results of this study indicate the effect of data system against DDoS detection system and potential advantages and disadvantages of implementing the system performed on the DDoS detection capability. system
Depok: Fakultas Teknik Universitas Indonesia, 2019
UI - Skripsi Membership  Universitas Indonesia Library
Mayang Nurul Aulia
"Performa akademik adalah bagian penting dari suatu sekolah. Saat ini, sebagian besar sekolah di Indonesia masih jarang melakukan klasifikasi performa akademik siswa, sehingga diperlukan metode yang tepat untuk mengklasifikasikan siswa berdasarkan perfroma akademiknya.  Pada peneltian ini digunakan metode Nave Bayes Classifier (NBC) dan metode Support Vector Machine (SVM) untuk mengklasifikasikan performa akademik siswa SMAN 38 Jakarta. Metode NBC menghasilkan tingkat akurasi tertinggi sebesar 96%, recall 100%, precision 92.68% dan %. Sedangkan metode SVM dengan kernel linier menghasilkan tingkat akurasi tertinggi sebesar 98%, recall 100%, precision 96.42% dan f1-score.

Academic performance is an important part of a school. At present, most schools in Indonesia rarely classify students’ academic performance, so we need the right method to classify students based on their academic performance. In this research, the Nave Bayes Classifier (NBC) and Support Vector Machine (SVM) methods are used to classify academic performance of SMAN 38 Jakarta students’. The NBC method produces the highest accuracy 96%, recall 100%, precision 92.68% and f1-score  While the SVM method produces the highest accuracy 98%, recall 100%, precision 96.42% and f1-score  on linear kernels."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
UI - Skripsi Membership  Universitas Indonesia Library
Raden Arfanto Chalawathal Iman
"Dalam perkembangan teknologi saat ini, kemampuan mesin untuk dapat belajar memiliki peranan yang sangat penting. Berbagai upaya telah dilakukan untuk mengembangkan kecerdasan buatan terhadap mesin sehingga mesin dapat melakukan pembelajaran. Salah satu macam pembelajaran mesin (machine learning) adalah dengan Brain Emotional Learning (BEL). BEL merupakan metode pembelajaran mesin yang terinspirasi dari fungsi kerja sistem limbik mamalia yang memiliki kemampuan untuk menyimpan memori, membuat keputusan dan memberi respon emosi. Dalam penerapannya, BEL telah terbukti dapat menyelesaikan berbagai masalah pembelajaran, seperti dalam masalah klasisfikasi, masalah prediksi, dan pengendalian. Pada skripsi ini, akan dilakukan perancangan dengan BEL untuk dapat mengkategorikan data melalui metode pembelajaran supervised learning dan diuji dengan data iris.
Hasil pengujian menunjukkan bahwa BEL dapat digunakan untuk klasifikasi beberapa macam kelas, terdapat hubungan yang tidak linear dari faktor-faktor yang mempengaruhi proses pembelajaran terhadap hasil, konstanta β dan konstanta γ memberikan hasil akurasi rendah ketika keduanya bernilai besar, dan hasil akurasi terbaik sebesar 93,33% untuk jenis data iris. Selain itu, perbandingan dengan paper rujukan menunjukkan bahwa hasil rancangan memberikan hasil yang lebih baik daripada algoritma GDBP MLP pada epoch rendah meskipun hasil rancangan belum sebaik rujukan.

In todays technological development, the ability of machines to be able to learn has a very important role. Various efforts have been made to develop artificial intelligence on the machine so that the machine can do learning. One type of machine learning is with Brain Emotional Learning (BEL). BEL is a machine learning method inspired by the work function of the limbic system of mammals that has the ability to store memory, make decisions and give emotional responses. In its application, BEL has been proven to be able to solve various learning problems, such as problems in classification, prediction problems, and control. In this thesis, BEL will be designed to be able to categorize data through supervised learning methods and tested with iris data.
The test results show that BEL can be used to classify several types of classes, there is a non-linear relationship of the factors that influence the learning process to results, constants and constants give low accuracy results when both are of great value, and the best accuracy results are 93, 33% for iris data types. In addition, the comparison with the reference paper shows that the design results have better results than the MLP GDBP algorithm at the lower epoch even though the design results have not been as good as the references."
Depok: Fakultas Teknik Universitas Indonesia, 2019
UI - Skripsi Membership  Universitas Indonesia Library
Adhitya Dwi Nugraha
"Ledakan batu merupakan kecelakaan destruktif yang cukup sering terjadi pada tambang bawah tanah. Seiring dengan berkembangnya teknologi, machine learning hadir sebagai alternatif solusi yang dapat dimanfaatkan dalam langkah preventif atas kasus ledakan batu. Penelitian ini menggunakan GWO-SVM dan XGBoost sebagai model machine learning dalam klasifikasi ledakan batu dan intensitasnya pada tambang bawah tanah. Grey Wolf Optimization (GWO) digunakan sebagai optimizer dari parameter SVM. Intensitas ledakan batu dibedakan atas tidak ada ledakan batu, lemah, sedang dan kuat. Dalam implementasi model, digunakan 467 kasus ledakan batu yang dikumpulkan dari berbagai sumber. Fitur yang digunakan pada penelitian ini meliputi tegangan maksimal tangensial, kekuatan tekan uniaksial, kekuatan tarik uniaksial, koefisien tegangan, koefisien kerapuhan batuan, dan indeks regangan elastis. Sebelum implementasi model dilakukan data preprocessing yang meliputi imputasi missing values, menghapus outlier, normalisasi fitur dan resampling data. Kinerja model dievaluasi berdasarkan nilai metrik accuracy, precision, recall, dan f1-score dengan memerhatikan running time dan proporsi data training berkisar dari 50% hingga 90%. Hasil penelitian menunjukkan bahwa GWO-SVM mengungguli XGBoost baik dalam klasifikasi ledakan batu dengan accuracy 98.0392%, precision 97.8495%, recall 98.2609%, dan f1-score 98.0161% serta klasifikasi intensitas ledakannya dengan accuracy 75.8242%, precision 75.1473%, recall 75.3115%, dan f1-score 75.2150%.

Rockburst is a destructive accident that frequently occurs in underground mines. With the advancement of technology, machine learning has emerged as an alternative solution that can be utilized to measures against rockbursts. This research employs GWO-SVM and XGBoost as machine learning models for the classification of rockburst and its intensity in underground mines. Grey Wolf Optimization (GWO) is used as an optimizer for SVM parameters. The intensity of a rockburst is classified into four categories: no rockburst, weak, moderate, and strong. The implementation of the model utilizes 476 cases of rockburst collected from various sources. The features used in this study include maximum tangential stress, uniaxial compressive strength, uniaxial tensile strength, stress coefficient, rock brittleness coefficient, and elastic strain index. Before implementing the model, data preprocessing is conducted, which includes imputing missing values, removing outliers, feature normalization, and data resampling. The performance of the model is evaluated based on metrics such as accuracy, precision, recall, and f1-score with various training data proportions ranging from 50% to 90%. The research results indicate that GWO-SVM outperforms XGBoost in both the classification of rockburst with 98.0392% accuracy, 97.8495% precision, 98.2609% recall, and 98.0161% f1-score as well as intensity with 75.8242% accuracy, 75.1473% precision, 75.3115% recall, and 75.2150% f1-score.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
UI - Skripsi Membership  Universitas Indonesia Library
Nadya Asanul Husna
"Inhibitor DPP-4 adalah pendekatan baru yang menjanjikan untuk pengobatan diabetes tipe-2 dengan risiko rendah hipoglikemia. Pemodelan hubungan kuantitatif struktur-aktivitas (QSAR) adalah pemodelan yang digunakan untuk menyaring basis data besar suatu senyawa untuk menentukan sifat biologis molekul kimia berdasarkan struktur kimianya. Pada tesis ini pemodelan QSAR yang digunakan adalah QSAR klasifikasi dan QSAR regresi. Sebelum membuat model QSAR akan melakukan esktraksi ciri pada struktur molekul (SMILES). Hasil ekstraksi ciri tersebut kemudian akan digunakan sebagai masukan untuk metode rotation forest kasus klasifikasi dan kasus regresi. Model QSAR klasifikasi akan memprediksi molekul aktif dan tidak aktif pada inhibitor DPP-IV. Sedangkan model QSAR regresi akan memprediksi nilai aktivitas IC50 inhibitor DPP-IV. Pada penelitian ini untuk kasus klasifikasi dan regresi juga membandingkan performa model rotation forest menggunakan matriks rotasi PCA dengan rotation forest menggunakan matriks rotasi Sparse PCA.
Hasil penelitian ini menunjukkan bahwa model QSAR regresi menggunakan rotation forest dengan matriks rotasi PCA (RFR(PCA)) memperoleh koefisien korelasi kuadrat 29.2% dengan RMSE 45%. Sementara itu, menggunakan rotation forest dengan matriks rotasi Sparse PCA (RFR(SPCA)) memperoleh koefisien korelasi kuadrat 27.1% dengan RMSE 45.6%. Pada QSAR klasifikasi persentase banyaknya molekul yang aktif sangat besar dibandingkan yang molekul tidak aktif, hal ini dapat menyebabkan nilai evaluasi berbeda. SMOTE (Synthetic Minority Oversampling Technique) merupakan salah satu metode untuk menangani data tidak seimbang tersebut dengan cara membangkitkan data buatan. Hasil penelitian ini menunjukkan bahwa model QSAR klasifikasi menggunakan rotation forest dengan matriks rotasi PCA (RFC(PCA)) memperoleh performa tertinggi dalam memprediksi molekul aktif dan tidak aktif, yaitu nilai MCC 77.7% dengan nilai akurasi sebesar 89%, sensitivitas 89.6%, dan spesifisitas 88.1%. Sementara itu, model QSAR klasifikasi menggunakan rotation forest dengan matriks rotasi SPCA (RFC(SPCA)) memperoleh performa tertinggi, yaitu nilai MCC 80.9% dengan nilai akurasi sebesar 90.5%, sensitivitas 90.8%, dan spesifisitas 90.2%.

DPP-4 inhibitors are a new approach for the treatment of type 2 diabetes with a low risk of hypoglycemia. The Quantitative Structure-Activity Relationship (QSAR) model is a model used to filter large databases of compounds to determine the biological properties of chemical molecules based on their chemical structure. The QSAR modeling that is used in this research is QSAR classification and QSAR regression. Before creating the model, QSAR will perform feature extraction on the molecular structure (SMILES). The results of the feature extraction will be used as inputs for the rotation forest method of the classification and regression cases. The QSAR classification model predicts active and inactive molecules in DPP-IV inhibitors, while the regression QSAR model predicts the value of IC50 DPP-IV inhibitor activity. In this study, the classification and regression cases are also comparing the performances between the rotation forest model using the PCA rotation matrix and the rotation forest model using the Sparse PCA rotation matrix. 
The results of this study indicate that the QSAR regression model using rotation forest with the rotation matrix PCA (RFR (PCA)) obtained a squared correlation coefficient of 29.2% with RMSE 45%. Meanwhile, using rotation forest regression with the Sparse PCA (RFR (SPCA)) rotation matrix obtained a quadratic correlation coefficient of 27.1% with RMSE 45.6%. In the QSAR classification, the percentage of active molecules is very large compared to inactive molecules, this can cause different evaluation values. SMOTE (Synthetic Minority Oversampling Technique) is one method for handling such unbalanced data by generating artificial data. The results of this study indicate that the classification QSAR model using rotation forest classification with PCA (RFC (PCA)) rotation matrix obtained the highest performance in predicting active and inactive molecules as follows: MCC value of 77.7% with an accuracy value of 89%, sensitivity value of 89.6% and specificity value of 88.1%. Meanwhile, the QSAR classification model using rotation forest classification with the SPCA rotation matrix (RFC (SPCA)) obtained the highest performance as follows: MCC value of 80.9% with an accuracy value of 90.5%, sensitivity value of 90.8%, and specificity value of 90.2%.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
UI - Tesis Membership  Universitas Indonesia Library
Amanda Nydia Augustizhafira
"Analisis sentimen merupakan bagian dari data mining text mining , yaitu proses memahami, mengekstrak, dan mengolah data tekstual secara otomatis untuk mendapatkan informasi. Pada penelitian ini, analisis sentimen diterapkan pada salah satu media sosial, yaitu Twitter. Analisis sentimen tergolong sebagai masalah klasifikasi yang dapat diselesaikan menggunakan salah satu metode machine learning, yaitu Neural Network. Pada machine learning, data dibagi menjadi data pelatihan dan data pengujian yang berasal dari domain yang sama.
Permasalahan utama pada penelitian ini adalah data pelatihan dan data pengujian berasal dari dua domain yang berbeda, sehingga perlu diterapkan pembelajaran lain selain machine learning. Masalah tersebut dapat diselesaikan dengan menggunakan transfer learning. Transfer learning merupakan suatu pembelajaran model yang dibangun oleh suatu data pelatihan dari suatu domain dan diuji oleh suatu data pengujian dari domain yang berbeda dari domain data pelatihan. Simulasi dalam penelitian ini menghasilkan suatu akurasi transfer learning dengan metode Neural Network yang nantinya akan diuji dengan fitur n-gram bi-gram dan tri-gram serta satu metode seleksi fitur, yaitu Extra-Trees Classifier.
Dalam penelitian ini, nilai akurasi transfer learning tertinggi didapat saat hidden layer berjumlah satu. Sebagian besar nilai akurasi tertinggi didapat saat penggunaan 250 neuron pada hidden layer. Fungsi aktivasi ReLU dan tanh menghasilkan nilai akurasi yang lebih tinggi dibandingkan fungsi aktivasi logistic sigmoid. Penggunakan metode seleksi fitur dapat meningkatkan kinerja transfer learning sehingga nilai akurasinya lebih tinggi dibandingkan simulasi tanpa penggunaan metode seleksi fitur.

Sentiment analysis is a part of data mining text mining , which is the process of understanding, extracting, and processing textual data automatically to obtain information. In this research, sentiment analysis is applied to one social media called Twitter. Sentiment analysis is categorized as a classification problem that can be solved using one of machine learning methods, namely Neural Network. In machine learning, data is divided into training data and test data from the same domain.
The main problem in this research is training data and test data come from two different domains, so it is necessary to apply other learning beside machine learning. The problem can be solved by using transfer learning. Transfer learning is a model learning constructed by a training data from a domain and tested by a test data from a different domain from the training data domain. The simulation in this research resulted in an accuracy of learning transfer with Neural Network method which will be tested using n grams bi grams and tri grams and one feature selection method called Extra Trees Classifier.
In this research, the highest value of transfer learning accuracy is obtained when one hidden layer is used. Most of the highest accuracy values are obtained from the use of 250 neurons on the hidden layer. The activation function of ReLU and tanh yield a higher accuracy value than the logical activation function sigmoid . The use of feature selection method can improve the transfer learning performance so that the accuracy value is higher than simulation without the use of feature selection method.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
UI - Skripsi Membership  Universitas Indonesia Library
Theresia Gowandi
"Analisis sentimen adalah salah satu bidang dari Pemrosesan Bahasa Alami yang membangun sistem untuk mengenal opini dalam teks dan mengelompokkan ke dalam sentimen positif atau negatif. Banyak peneliti telah membangun model yang menghasilkan akurasi terbaik dalam melakukan analisis sentimen. Tiga diantaranya adalah Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU), yang merupakan bagian dari deep learning. CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dalam penggalan kalimat, sedangkan LSTM dan GRU digunakan karena kemampuannya yang memiliki memori akan input yang telah diproses sebelumnya. GRU memiliki struktur yang lebih sederhana dibandingkan dengan LSTM. Ketiga model tersebut dapat digabungkan menjadi model gabungan LSTM-CNN, CNN-LSTM, GRU-CNN, dan CNN-GRU. Penelitian sebelumnya telah membuktikan bahwa model gabungan tersebut memiliki akurasi yang lebih baik dibandingkan dengan model dasar LSTM, GRU, dan CNN. Implementasi model dilakukan pada data ulasan aplikasi berbahasa Indonesia. Hasilnya, didapatkan bahwa hampir seluruh model gabungan memiliki akurasi yang lebih baik dibandingkan dengan model dasar.

Sentiment analysis is one of the fields of Natural Language Processing that builds a system to recognize and extract opinion in the form of text into positive or negative sentiment. Nowadays, many researchers have developed methods that yield the best accuracy in performing analysis sentiment. Three particular models are Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU), which are part of deep learning architectures. CNN is used because of its ability to extract important features from each sentence fragment, while LSTM and GRU are used because of their ability to have a memory of prior inputs. GRU has a simpler and more practical structure compared to LSTM. These models can be combined into combined LSTM-CNN, CNN-LSTM, GRU-CNN, and CNN-GRU model. Former researches have proved that these models have better accuracy compared to standard models. This research is focused on the performance of all the combined LSTM-CNN, CNN-LSTM, GRU-CNN, CNN-GRU models and will be compared to the standard LSTM, GRU, CNN models. Implementation of the model is performed on a collection of application review data in Indonesian text. As a result, almost all of the combined models have better accuracy than the standard models."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
UI - Skripsi Membership  Universitas Indonesia Library
Dwi Guna Mandhasiya
"Ilmu Data adalah irisan dari matematika dan statistika, komputer, serta keahlian domain. Dalam beberapa tahun terakhir inovasi pada bidang ilmu data berkembang sangat pesat, seperti Artificial Intelligence (AI) yang telah banyak membantu kehidupan manusia. Deep Learning (DL) sebagai bagian dari AI merupakan pengembangan dari salah satu model machine learning yaitu neural network. Dengan banyaknya jumlah lapisan neural network, model deep learning mampu melakukan proses ekstrasi fitur dan klasifikasi dalam satu arsitektur. Model ini telah terbukti mengungguli teknik state-of-the-art machine learning di beberapa bidang seperti pengenalan pola, suara, citra, dan klasifikasi teks. Model deep learning telah melampaui pendekatan berbasis AI dalam berbagai tugas klasifikasi teks, termasuk analisis sentimen. Data teks dapat berasal dari berbagai sumber, seperti sumber dari media sosial. Analisis sentimen atau opinion mining merupakan salah satu studi komputasi yang menganalisis opini dan emosi yang diekspresikan pada teks. Pada penelitian ini analisis peforma machine learning dilakukan pada metode deep learning berbasis representasi data BERT dengan metode CNN dan LSTM serta metode hybrid deep learning CNN-LSTM dan LSTM-CNN. Implementasi model menggunakan data komentar youtube pada video politik dengan topik terkait Pilpres 2024, kemudian evaluasi peforma dilakukan menggunakan confusion metric berupa akurasi, presisi, dan recall.

Data Science is the intersection of mathematics and statistics, computing, and a domain of expertise. In recent years innovation in the field of data science has developed very rapidly, such as Artificial Intelligence (AI) which helped a lot in human life. Deep Learning (DL) as part of AI is the development of one of the machine learning models, namely neural network. With the large number of neural network layers, deep learning models are capable of performing feature extraction and classification processes in a single architecture. This model has proven to outperform state-of-the-art machine learning techniques in areas such as pattern recognition, speech, imagery, and text classification. Deep learning models have gone beyond AI-based approaches in a variety of text classification task, including sentiment analysis. Text data can come from various sources, such as source from social media. Sentiment analysis or opinion mining is a computational study that analyze opinions and emotions expressed in text. In this research, machine learning performance analysis is carried out on a deep learning method based on BERT data representation with the CNN and LSTM and hybrid deep learning CNN-LSTM and LSTM-CNN method. The implementation of the model uses YouTube commentary data on political videos related to the 2024 Indonesia presidential election, then performance analysis is carried out using confusion metrics in the form of accuracy, precision, and recall."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
UI - Tesis Membership  Universitas Indonesia Library
Henry Prayoga
"Penelitian ini menganalisis akurasi peramalan permintaan produk barang konsumsi cepat (FMCG) menggunakan model Machine Learning, yaitu LSTM (Long Short-Term Memory) dan SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous regressors), dengan data sekunder dari April 2021 hingga April 2024 yang terdiri dari 36 observasi bulanan. Variabel dependen adalah total penjualan, sementara variabel eksogen mencakup pengeluaran per kapita, adopsi produk, proporsi penjualan dari promosi, jumlah toko yang menjual produk, dan pangsa pasar produk. Hasil menunjukkan model LSTM memiliki akurasi lebih tinggi dalam memprediksi nilai penjualan dibandingkan SARIMAX, dengan nilai Mean Absolute Percentage Error (MAPE) yang lebih rendah pada sebagian besar sampel. Analisis korelasi mengungkapkan variabel jumlah toko yang menjual produk dan adopsi produk berpengaruh signifikan terhadap nilai penjualan dalam model LSTM, sedangkan SARIMAX unggul dalam menangkap pola musiman namun memiliki MAPE lebih tinggi. Penelitian ini menyarankan penggunaan model LSTM untuk data time series yang kompleks dan tidak stasioner, sementara SARIMAX lebih cocok untuk data dengan komponen musiman yang kuat. Pemilihan model harus mempertimbangkan karakteristik data dan tujuan analisis.

This study analyzes the forecasting accuracy of fast-moving consumer goods (FMCG) demand using Machine Learning models, namely LSTM (Long Short-Term Memory) and SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous regressors), utilizing secondary data from April 2021 to April 2024 with a total of 36 monthly observations. The dependent variable is sales value, while the exogenous variables include spend per buyer, product penetration, promo % of value, the number of stores selling, and market share. The results indicate that the LSTM model has higher accuracy in predicting sales value compared to the SARIMAX model, with a lower Mean Absolute Percentage Error (MAPE) for most samples. Correlation analysis reveals that the variables number of stores selling and product penetration significantly influence sales value in the LSTM model, whereas SARIMAX excels in capturing seasonal patterns but has a higher MAPE. This study recommends using the LSTM model for complex and non-stationary time series data, while SARIMAX is more suitable for data with strong seasonal components. Model selection should consider the characteristics of the data and the objectives of the analysis."
Depok: Fakultas Teknik Universitas Indonesia, 2024
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>