Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query
cover
Julizar Isya Pandu Wangsa
"Pendeteksian topik merupakan suatu proses pengidentifikasian suatu tema sentral yang ada dalam kumpulan dokumen yang luas dan tidak terorganisir. Hal ini merupakan hal sederhana yang bisa dilakukan secara manual jika data yang ada hanya sedikit. Untuk data yang banyak dibutuhkan pengolahan yang tepat agar representasi topik dari setiap dokumen didapat dengan cepat dan akurat sehingga machine learning diperlukan. BERTopic adalah metode pemodelan topik yang memanfaatkan teknik clustering dengan menggunakan model pre-trained Bidirectional Encoder Representations from Transformers (BERT) untuk melakukan representasi teks dan Class based Term Frequency Invers Document Frequency (c-TF-IDF) untuk ekstraksi topik. Metode clustering yang digunakan pada penelitian ini adalah metode ­K-Means, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), dan Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN). BERT dipilih sebagai metode representasi teks pada penelitian ini karena BERT merepresentasikan suatu kalimat berdasarkan sequence-of-word dan telah memperhatikan aspek kontekstual kata tersebut dalam kalimat. Hasil representasi teks merupakan vektor numerik dengan dimensi yang besar sehingga perlu dilakukan reduksi dimensi menggunakan Uniform Manifold Approximation and Projection (UMAP) sebelum clustering dilakukan. Model BERTopic dengan tiga metode clustering ini akan dianalisis kinerjanya berdasarkan matrik nilai coherence, diversity, dan quality score. Nilai quality score merupakan perkalian dari nilai coherence dengan nilai diversity. Hasil simulasi yang didapat adalah model BERTopic menggunakan metode clustering K-Means lebih unggul 2 dari 3 dataset untuk nilai quality score dari kedua metode clustering yang ada.

Topic detection is the process of identifying a central theme in a large, unorganized collection of documents. This is a simple thing that can be done manually if there is only a small amount of data. For large amounts of data, proper processing is needed to represent the topic of each document quickly and accurately, so machine learning is required. BERTopic is a topic modeling method that utilizes clustering techniques by using pre-trained Bidirectional Encoder Representations from Transformers (BERT) models to perform text representation and Class based Term Frequency Inverse Document Frequency (c-TF-IDF) for topic extraction. The clustering methods used in this research are the K-Means, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), and Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN). BERT was chosen as the text representation method in this research because BERT represents a sentence based on sequence-of-words and has considered the contextual aspects of the word in the sentence. The result of text representation is a numeric vector with large dimensions, so it is necessary to reduce the dimensions using Uniform Manifold Approximation and Projection (UMAP) before clustering is done. The BERTopic model with three clustering methods will be analyzed for performance based on the matrix of coherence, diversity, and quality score values. The quality score value is the multiplication of the coherence value with the diversity value. The simulation results obtained are the BERTopic model using K-Means clustering method is superior to 2 of the 3 datasets for the quality score value of the two existing clustering methods."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Anton Ade Putra
"Universitas T memiliki rencana (roadmap) untuk mengembangkan berbagai jenis Metaverse di masa depan. Namun, ada kekhawatiran bahwa roadmap yang telah dibuat mungkin tidak sesuai dengan kebutuhan masyarakat. Oleh karena itu, penelitian ini bertujuan untuk menganalisis sentimen dan pemodelan topik tentang Metaverse di media sosial guna memberikan wawasan yang penting bagi roadmap pengembangan Metaverse di Universitas T dengan memperhatikan pendapat dan sentimen masyarakat. Data yang digunakan dalam penelitian ini adalah twit berbahasa Indonesia yang dikumpulkan dari bulan Agustus 2021 hingga April 2023. Untuk analisis, digunakan pustaka LazyPredict yang menghasilkan lima model klasifikasi, yaitu Bernoulli Naive Bayes (BernoulliNB), Nearest Centroid, Calibrated Classifier CV, Logistic Regression, dan Linear Support Vector Classification (LinearSVC). Hasil menunjukkan bahwa model BernoulliNB memiliki performa terbaik dengan nilai rata-rata F1 sebesar 0,788. Selain itu, penelitian ini juga mengidentifikasi topik-topik yang dibahas terkait dengan Metaverse menggunakan pustaka Bertopic. Temuan menunjukkan adanya topik negatif seperti ketidakpastian pengembangan Metaverse, skeptisisme terhadap teknologi baru, keterbatasan infrastruktur internet, kekhawatiran etika dan syariah, ketidakpastian legalitas, kekhawatiran privasi dan keamanan, serta skeptisisme terhadap kesiapan Indonesia dalam membangun Metaverse. Di sisi lain, topik positif meliputi peluncuran Metaverse Jagat Nusantara, potensi kripto dalam konteks Metaverse, perubahan nama Facebook menjadi Meta, konser virtual di Metaverse, kehidupan di dunia Metaverse, pengembangan teknologi Metaverse di dalam negeri, transformasi digital dan inovasi di era Metaverse, penggunaan blockchain, kripto, dan NFT dalam teknologi Metaverse, serta Manasik Haji di Metaverse. Hasil analisis sentimen dan pemodelan ini dapat memberikan wawasan yang berharga bagi Universitas T dalam memahami tren dan pandangan masyarakat terkait Metaverse. Hal ini akan membantu universitas dalam mengevaluasi roadmap Metaverse yang telah dibuat untuk memastikan kesesuaiannya dengan kebutuhan masyarakat.

Universitas T has a roadmap to develop various types of Metaverse in the future. However, there are concerns that the existing roadmap may not align with the needs of society. Therefore, this research aims to analyze the sentiment and topic modeling related to Metaverse on social media to provide valuable insights for the development roadmap of Metaverse at Universitas T, taking into account the opinions and sentiments of the public. The data used in this study are Indonesian tweets collected from August 2021 to April 2023. The LazyPredict library is utilized for analysis, which generates five classification models: Bernoulli Naive Bayes (BernoulliNB), Nearest Centroid, Calibrated Classifier CV, Logistic Regression, and Linear Support Vector Classification (LinearSVC). The results show that the BernoulliNB model performs the best with an F1 score of 0.788. Additionally, this research identifies various topics discussed in relation to Metaverse using Bertopic library. Findings indicate the presence of negative topics such as uncertainty in Metaverse development, skepticism towards new technologies, limitations of internet infrastructure, ethical and Sharia concerns, legal uncertainties, privacy and security concerns, as well as skepticism about Indonesia's readiness in building the Metaverse. On the other hand, positive topics include the launch of Metaverse Jagat Nusantara, the potential of cryptocurrencies in the context of Metaverse, the name change of Facebook to Meta, virtual concerts in the Metaverse, life in the Metaverse world, domestic Metaverse technology development, digital transformation and innovation in the era of Metaverse, the use of blockchain, cryptocurrencies, and NFTs in Metaverse technology, as well as Manasik of Hajj in the Metaverse. The results of sentiment analysis and topic modeling can provide valuable insights for Universitas T to understand the trends and public perspectives regarding Metaverse. This will assist the university in evaluating the existing Metaverse roadmap to ensure its alignment with the needs of society."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library