Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query

Suci Fitriyani

Model Gabungan fastText-CNN-BiLSTM untuk Analisis Sentimen pada Data Opini Berbahasa Indonesia = Hybrid Model fastText-CNN-BiLSTM for Sentiment Analysis on Indonesian Opinion Data

"Analisis sentimen merupakan studi komputasi untuk menganalisis opini seseorang terhadap suatu entitas yang diekspresikan dalam sebuah teks. Tersedia cukup banyak model machine learning terutama deep learning yang dapat digunakan untuk melakukan analisis sentimen seperti Convolutional Neural Network (CNN) dan Bidirectional Long Short-Term Memory (BiLSTM). Pada dasarnya, model deep learning tidak dapat memproses langsung sebuah data dalam bentuk teks sehingga diperlukan metode untuk mentransformasi teks menjadi tensor numerik seperti word embedding. Pada penelitian ini, diajukan model gabungan CNN-BiLSTM dengan word embedding fastText untuk melakukan analisis sentimen. Model tersebut dilatih menggunakan data tweet berbahasa Indonesia tentang opini masyarakat mengenai rencana subsidi pembelian kendaraan listrik di Indonesia. Data tersebut diklasifikasikan menjadi sentimen positif, negatif, dan netral dan ditemukan bahwa komposisi dari ketiga sentimen tersebut tidaklah seimbang (imbalanced dataset) dimana kelas positif memiliki lebih sedikit data dibanding kelaskelas lainnya. Untuk mengatasi masalah tersebut, digunakan metode resampling SMOTE agar jumlah data pada kelas positif dapat mengimbangi kelas lainnya. Model fastTextCNN-BiLSTM diukur performanya dengan melihat nilai akurasi, precision, recall, dan f1-score. Dari hasil penelitian didapat bahwa model gabungan CNN-BiLSTM memberikan nilai akurasi, precision, recall, dan f1-score yang paling baik dibanding model CNN dan BiLSTM saja. Model-model yang menggunakan word embedding fastText juga memberikan performa yang lebih baik dibanding model tanpa fastText (menggunakan word embedding standar). Secara keseluruhan, model gabungan fastTextCNN-BiLSTM ditemukan memiliki performa yang lebih baik dibandingkan dengan model-model lainnya.

Sentiment analysis is a computational study to analyze person’s opinion about an entity expressed in text. There are several machine learning models, especially deep learning models that can be used for sentiment analysis, such as Convolutional Neural Network (CNN) and Bidirectional Long Short-Term Memory (BiLSTM). Essentially, deep learning models cannot directly process textual data and they need a method to transform text into numerical tensors such as word embedding. In this research, a hybrid model CNN-BiLSTM with fastText word embedding is proposed for sentiment analysis. The model is trained using Indonesian tweets data regarding public opinions on the plan for subsidizing the purchase of electric vehicles in Indonesia. The data is classified into positive, negative, and neutral sentiments, and it is found that the composition of these sentiments is imbalanced, with the positive class having fewer data compared to the other classes. To address this issue, the SMOTE resampling method is used to balance the data in the positive class with the other classes. The performance of the fastText-CNNBiLSTM model is measured by accuracy, precision, recall, and f1-score. The research results show that the hybrid model CNN-BiLSTM achieves the highest accuracy, precision, recall, and f1-score compared to the single models CNN and BiLSTM. Models with fastText word embedding also outperform models without fastText (with standard word embedding). Overall, the hybrid model fastText-CNN-BiLSTM is found to outperform other models in terms of performance."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nyimas Sharima

Analisis faktor-faktor risiko acute respiratory distress syndrome pada pasien COVID-19 (studi kasus pasien rawat inap COVID-19 pada salah satu rumah sakit di Jakarta) = Risk factor analysis of acute respiratory distress syndrome in COVID-19 (case study of COVID-19 inpatients in one of the hospitals in Jakarta)

"Pada tanggal 11 Maret 2020, WHO menetapkan COVID-19 sebagai pandemi di dunia. Dilansir dari situs covid19.who.int, per 19 Juni 2021 Indonesia berada di urutan ke-18 dan memiliki 1,963,266 kasus terkonfirmasi dengan total 54,043 pasien yang meninggal. Salah satu kasus berat atau termasuk dalam kelompok kritis adalah pasien dengan Acute Respiratory Distress Syndrom (ARDS). Melihat banyaknya kasus ARDS yang berakhir dengan kematian dan terbatasnya gambaran klinis terkait ARDS yang disebabkan oleh COVID-19 membuat penelitian ini berfokus untuk mengidentifikasi faktor risiko yang berasosiasi dengan kejadian ARDS pada pasien COVID-19. Faktor-faktor risiko kejadian ARDS pada pasien COVID-19 diidentifikasi dengan menggunakan metode classification tree dimana performa model diukur dari nilai akurasi, sensitivitas, spesifisitas, dan AUC. Cost matrix digunakan sebagai strategi rebalancing data. Besaran risiko relatif faktor-faktor tersebut terhadap ARDS akan dihitung dengan menggunakan metode regresi logistik. Model yang dihasilkan memiliki nilai akurasi, sensitivitas, spesifisitas, dan AUC masing-masing sebesar 0.879, 0.804, 0.900, dan 0.852. Pasien COVID-19 yang mengalami peningkatan kadar hemoglobin, PCO_2 dan CRP, penurunan kadar PCT, saturasi oksigen, dan urea, mengalami gejala sesak napas, dan memiliki komorbid pneumonia secara rata-rata memiliki risiko lebih tinggi untuk mengalami kejadian ARDS.

On March 11, 2020, WHO declared COVID-19 as a worldwide pandemic. Reporting from the website covid19.who.int, as of June 19, 2021, Indonesia was in 18th place and had 1,963,266 confirmed cases with a total of 54,043 patients who died. One of the severe cases or included in the critical group was a patient with Acute Respiratory Distress Syndrome (ARDS). Seeing the large number of ARDS cases that ended in death and the limited clinical picture related to ARDS caused by COVID-19 made this research to be focused on identifying risk factors associated with ARDS incidence in COVID-19 patients. Identification of risk factors for the incidence of ARDS in COVID-19 patients using a classification method where the performance of the model is measured of the values of accuracy, sensitivity, specificity, and AUC. Cost matrix is used as a data rebalancing strategy. The relative risk of ARDS was calculated using the logistic regression method. The accuracy, sensitivity, specificity, and AUC obtained in the model are 0.879, 0.804, 0.900, and 0.852, respectively. COVID-19 patients who experienced increased hemoglobin, PCO_2, and CRP levels, decreased PCT levels, oxygen saturation, and urea, experienced symptoms of shortness of breath, and had pneumonia on average had a higher risk of developing ARDS."

Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

Unggah4 Universitas Indonesia Library

Ahmad Fauzi

Analisis sentimen dan jaringan sosial: studi kasus Pegipegi.com = Sentiment and social network analysis: a case study of Pegipegi.com

"ABSTRAK

Perkembangan jumlah pengguna internet di Indonesia mengalami peningkatan dari tahun ke tahun. Perkembangan internet berdampak pula pada munculnya beberapa ecommerce, tidak terkecuali ecommerce yang bergerak dalam jasa pemesanan tiket dan hotel. Selain itu, internet juga mendukung media sosial untuk mengekspresikan opini yang objektif tentang suatu produk/jasa. Media sosial dijadikan sebagai media electrocic word of mouth e-wom oleh pelaku jasa ecommerce. Peneltian ini terkait analisis sentiment, reputasi brand, dan jaringan sosial di Twitter terkait ecommerce yang bergerak pada bidang pemesanan hotel dan tiket. Data yang digunakan di dalam penelitian ini merupakan data yang berhubungan dengan mention @pegi_pegi, @traveloka, dan @tiket yang diambil dari periode 24 September 2016 sampai 21 November 2016. Penelitian ini menggunakan algoritme GaussianNB, MultinomialNB, BernoulliNB, ME, SVM, dan Xgboost pada proses pembuatan model. Pada kasus imbalance data, proses pembuatan model menggunakan SMOTE yang bertujuan menyeimbangkan jumlah kelas pada data yang ada. Akurasi terbaik diperoleh dengan menggunakan algoritme SVM SMOTE sebesar 0.96, presisi sebesar 0.96, recall sebesar 0.96, dan F1-Score sebesar 0.96. Nilai reputasi brand untuk @pegi_pegi sebesar -6, @traveloka sebesar -5, dan @tiket sebesar -2. Akun yang memiliki tingkat pengaruh secara keseluruhan terhadap @pegi_pegi yaitu @calvinjeremy, @traveloka yaitu @banyuwangi_kab, dan @tiket yaitu @IndahJuli.

ABSTRACT

The number of internet users in Indonesia has increased from year to year. Internet development impact on the emergence of e commerces, including in ticket and hotel reservation services. In addition, the internet also supports social media to express their opinions about a product service. Social media is used as a medium electrocic word of mouth e wom by actor rsquo s ecommerce services. This study focuses on sentiment analysis, brand reputation, and social networking on Twitter related to e commerce that focuses on the hotel and ticket reservations. The data used in this research is data related to pegi pegi, traveloka, and tiket taken from the period 24 September 2016 until 21 November 2016. This research uses a GaussianNB algorithm, MultinomialNB, BernoulliNB, ME, SVM, and Xgboost in the modeling process. In case of imbalanced data, process modeling using SMOTE which aims to balance the number of classes on existing data. Best accuracy obtained by using SVM algorithm SMOTE is 0.96, the precision is 0.96, the recall is 0.96, and F1 Score is 0.96. Brand reputation for pegi pegi is 6, traveloka is 5, and tiket is 2. Accounts that have effect on pegi pegi is calvinjeremy, traveloka is banyuwangi kab, and tiket is IndahJuli."

2017

TA-pdf

UI - Tugas Akhir Universitas Indonesia Library

Nur Fitriana Taslim

Analisis inter rasio pada hasil pemeriksaan darah lengkap terhadap kekambuhan pasien kanker payudara di Rumah Sakit XYZ di Jakarta = Inter ratio analysis of complete blood count results on breast cancer patients' relapse at XYZ Hospital in Jakarta

"Kejadian berulang atau kekambuhan kanker payudara bukan hanya menyerang kembali fisik, namun juga kondisi psikis pasien kanker payudara. Serangkaian pemeriksaan untuk

memprediksi kemungkinan kambuh kanker payudara sangat dibutuhkan untuk mencegah terjadinya kekambuhan kanker payudara. Pemeriksaan darah lengkap merupakan salah satu rangkaian peme iksaan awal pasien kanker payudara yang relatif murah dan mudah. Belum ada penelitian sebelumnya mengenai perhitungan inter rasio pada pemeriksaan darah lengkap untuk mendiagnosis penyakit kanker, khususnya kemungkinan kambuh kanker payudara. Hasil penelitian ini diharapkan dapat membantu tenaga medis dalam memprediksi kemungkinan pasien kambuh berdasarkan klasifikasi dari hasil perhitungan inter rasio pemeriksaan darah lengkap. Data dalam penelitian ini diambil dari rumah sakit XYZ di Jakarta dengan 47 pasien. Algoritma klasifikasi yang digunakan dalam penelitian ini yaitu Classification and Regression Tree (CART) untuk mengetahui variabel yang berpengaruh dalam klasifikasi pasien kambuh dan tidak kambuh. Pada penelitian ini digunakan teknik SMOTE untuk mengatasi permasalahan data tidak seimbang. Variabel inter rasio pemeriksaan darah lengkap antara rasio dari neutrofil terhadap limfosit dan rasio dari platelet terhadap sel darah putih, inter rasio pemeriksaan darah

lengkap antara rasio dari limfosit terhadap monosit dan rasio dari limfosit terhadap sel darah putih, inter rasio pemeriksaan darah lengkap antara rasio dari hemoglobin terhadap platelet dan rasio dari platelet terhadap sel darah putih, inter rasio pemeriksaan darah lengkap antara rasio dari platelet terhadap limfosit dan rasio dari hemoglobin terhadap platelet merupakan variabel yang berpengaruh dalam mendiagnosis kekambuhan dengan tingkat akurasi 93.7%, sensitivity 100%, specificity 87.5% pada training data yang sudah seimbang dengan teknik SMOTE. Selanjutnya hasil klasifikasi tersebut dikuantifikasi menggunakan metode regresi logistik untuk mengetahui seberapa besar peran masingmasing variabel dalam memprediksi kekambuhan pasien.

Repeated events or recurrences of breast cancer not only re-attack the condition of breast cancer patients physically, but also psychologically. Diagnostics checking to predict the relapse possibility of breast cancer patients is needed to prevent the recurrence of breast
cancer. Complete blood count are one of the diagnostic checking of early breast cancer patients that relatively cheap and easy. There has been no previous research on the calculation of inter-ratios for complete blood count to diagnose cancer, especially possibility relapse of breast cancer. The results of this study are expected to help medical personnel in predicting the relapse possibility of breast cancer patients based on the classification of
the results of the inter ratio calculation of complete blood count. The data in this study were taken from XYZ hospital in Jakarta with 47 patients. The classification algorithm used in this study is Classification and Regression Tree (CART) to determine the effect of the variables in the classification of relapse and non-relapse patients. In this study, the SMOTE technique was used in handling imbalanced data problems. Inter ratio of complete
blood tests between the ratio of neutrophils to lymphocytes and the ratio of platelets to white blood cells, inter ratio of complete blood tests between the ratio of lymphocytes to monocyte and the ratio of lymphocytes to white blood cells, inter ratio of complete
blood tests between the ratio of hemoglobin to platelet and the ratio of platelet to white blood cells, and inter ratio of complete blood tests between the ratio of platelet to lymphocytes and the ratio of hemoglobin to platelet are the variables that influence in diagnosing
recurrence with 93.7% accuracy rate, 100% sensitivity, and 87.5% specificity on training data that balanced using SMOTE technique. Furthermore, the results of the classification are quantified using the logistic regression method to determine how substantial the role
of each variable in predicting patients relapse."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian