Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 7 dokumen yang sesuai dengan query
cover
Abstrak :
Information retrieval of text document requires a method that is able to restore a number of documents that have high relevance according to the user's request. One important step in the process is a text representation of the weighting process. The use of LCS in Tf-Idf weighting adjustments considers the appearance of the same order of words between the query and the text in the document. There is a very long document but irrelevant cause weight produced is not able to represent the value relevance of documents. This research proposes the use of LCS which gives weight to the word order by considering long documents related to the average length of documents in the corpus. This method is able to return a text document effectively. Additional features of word order by normalizing the ratio of the overall length of the document to the documents in the corpus generate values of precision and recall as well as the method of Tasi et al.

Sistem temu kembali dokumen teks membutuhkan metode yang mampu mengembalikan sejumlah dokumen yang memiliki relevansi tinggi sesuai dengan permintaan pengguna. Salah satu tahapan penting dalam proses representasi teks adalah proses pembobotan. Penggunaan LCS dalam penyesuaian bobot Tf-Idf mempertimbangkan kemunculan urutan kata yang sama antara query dan teks di dalam dokumen. Adanya dokumen yang sangat panjang namun tidak relevan menyebabkan bobot yang dihasilkan tidak mampu merepresentasikan nilai relevansi dokumen. Penelitian ini mengusulkan penggunaan metode LCS yang memberikan bobot urutan kata dengan mempertimbangkan panjang dokumen terkait dengan rata-rata panjang dokumen dalam korpus. Metode ini mampu melakukan pengembalian dokumen teks secara efektif. Penambahan fitur urutan kata dengan normalisasi rasio panjang dokumen terhadap keseluruhan dokumen dalam korpus menghasilkan nilai presisi dan recall yang sama baiknya dengan metode Tasi dkk.
Surabaya: Institut Teknologi Sepuluh Nopember Surabaya, Faculty of Information Technology, Department of Infromatics Engineering, 2013
AJ-Pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Abstrak :
Penelitian ini bertujuan untuk menggambarkan kondisi kinerja pada suatu organisasi pelayanan kemanusiaan milik pemerintah yang berlangsung di sebuah unit pelaksana teknis yakni Panti Sosial Bina Remaja (PSBR) Bambu Apus Jakarta. Penelitian ini merupakan penelitian kualitatif yang menekankan pengumpulan datanya pada adaptasi dari IDF (Institutional Development Framework). Tujuan adaptasi IDF untuk memotret kondisi kinerja organisasi dalam rangka mengidentifikasi komponen penentu keberhasilan organisasi. Hasil penelitian ini adalah gambaran kondisi kinerja PSBR Bambu Apus berdasarkan komponen sumberdaya IDF. ......This research discusses about organizational performance from governance human service organization-Youth Development Center (PSBR) Bambu Apus Jakarta.This research is qualitative descriptive interpretative which emphasize to the adaptation of Institutional Development Framework (IDF). The adaptation of IDF aim to take comprehensive description in purpose to identify organizational key to success. The research result shows the comprehensive description about organizational performance in Youth Development Center (PSBR) Bambu Apus Jakarta based on IDF’s component.
[Depok;;, ]: [Fakultas Ilmu Sosial dan Ilmu Politik Universitas Indonesia;;, ], 2014
S-pdf;;
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nicholas Pangestu
Abstrak :
Panjangnya suatu berita terkadang mengurangi minat seseorang untuk membaca berita, hal ini dapat kita lihat dari banyaknya istilah “tl:dr” pada thread di internet. Peringkasan dokumen dapat menciptkan ringkasan berita dan mengurangi waktu yang dibutuhkan untuk membaca. Salah satu cara yang dapat digunakan untuk melakukan peringkasan dokumen adalah menggunakan algoritma Textrank. Pada penelitian ini akan diimplementasikan word embedding untuk membantu algoritma Textrank memahami makna suatu kata dengan lebih baik. Hasil yang didapatkan menunjukkan bahwa penggunaan word embedding meningkatkan performa dari algoritma Textrank hingga 13% pada ROUGE-1 dan hingga 21% pada ROUGE-2. Model word embedding BERT memiliki performa tertinggi jika dibandingkan dengan word2vec (3% lebih tinggi pada ROUGE-1 dan 7% lebih tinggi pada ROUGE-2) dan fasttext (5% lebih tinggi pada ROUGE-1 dan 10% lebih tinggi pada ROUGE-2). Pada penelitian ini juga mengimplementasikan pembobotan TF-IDF dalam membuat sebuah representasi suatu kata. Hasil yang didapatkan menunjukkan bahwa pembobotan TF-IDF dapat meningkatkan performa dari tiap model word embedding yang digunakan hingga 11% pada ROUGE-1 dan hingga 19% pada ROUGE-2 dibandingkan performa tanpa pembobotan TF-IDF. ......The length of article news sometimes reduces one's interest in reading the news, we can see this from the many terms "tl:dr" in threads on the internet. Document summarization can create news summaries and reduce the time it takes to read. One way to do document summarization is to use the Textrank algorithm. In this research, word embedding will be implemented to help the Textrank algorithm understand the meaning of a word better. The results show that the use of word embedding improves the performance of the Textrank algorithm up to 13% in ROUGE-1 and up to 21% in ROUGE-2. BERT word embedding model has the highest performance when compared to word2vec (3% higher in ROUGE-1 and 7% higher in ROUGE-2) and fasttext (5% higher in ROUGE-1 and 10% higher in ROUGE-2). This study also implements TF-IDF weighting to make a word representation. The results show that TF-IDF weighting can improve the performance of each word embedding model used up to 11% in ROUGE-1 and 19% in ROUGE-2 compared to the performance without using TF-IDF.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dwi Suci Rachmawati
Abstrak :
Pasar modal merupakan salah satu penopang perekonomian di Indonesia dikarenakan pasar modal adalah salah satu sarana penambahan modal bagi perusahaan dalam melaksanakan operasional bisnisnya. Selain itu, pasar modal juga dapat memberikan keuntungan bagi perorangan atau badan usaha investor , yang dapat digunakan untuk biaya hidup di masa kini dan masa depan. Saham adalah salah satu instrumen yang diperjualbelikan di pasar modal yang dapat memberikan keuntungan hingga 20-25 per tahun, namun juga memiliki resiko yang lebih tinggi dibandingkan instrumen lainnya, dikarenakan fluktuasi harga saham yang tinggi. Investor harus berhati-hati dalam memilih waktu yang tepat dalam melakukan transaksi jual beli saham, jika tidak ingin mendapatkan kerugian yang besar. Salah satu teknik dalam menentukan waktu transaksi saham adalah berdasarkan teori Efficient Market Hypothesis EMH yang menyatakan bahwa harga saham merefleksikan informasi yang dipublikasikan terkait saham tersebut. EMH berkaitan erat dengan behavioral economics yang menyatakan bahwa keputusan investor dipengaruhi oleh persepsi atau emosi sentimen dari informasi yang diterimanya. Informasi terkait suatu saham dapat dibaca di media online dalam hal ini artikel berita yang diterbitkan oleh berbagai situs berita di Indonesia. Berdasarkan EMH dan behavioral economis tersebut, penelitian ini bertujuan untuk melihat apakah sentimen media online dapat mengklasifikasikan pergerakan harga saham di Indonesia, dengan ruang lingkup media online yang diteliti adalah www.bisnis.com. Saham yang diteliti adalah saham PT. Bank Central Asia, Tbk BBCA. Metode penelitian yang dilakukan adalah penelitian kuantitatif dengan metodologi eksperimental menggunakan pendekatan analisis sentimen. Proses ekstraksi fitur dari artikel berita bisnis.com dilakukan dengan merepresentasikan artikel berita dalam bentuk vektor menggunakan term frequency tf, term frequency inverse document frequency tf-idf, dan doc2vec. Algoritma klasifikasi yang digunakan adalah naive bayes, k-nearest neighbor KNN, dan support vector machine SVM. Setelah mendapatkan hasil klasifikasi sentimen dari berita, penelitian dilanjutkan dengan membandingkan hasil klasifikasi sentimen tersebut dengan harga aktual saham untuk hari itu sampai dengan lima hari ke depan. Hasil penelitian menunjukkan bahwa representasi vektor menggunakan tf-idf menunjukkan hasil yang lebih baik dengan akurasi klasifikasi SVM sebesar 78,66 . Sementara perbandingan akurasi hasil klasifikasi sentimen berita dengan harga aktual pergerakan saham didapatkan sebesar 63,11 . Hasil ini didapatkan untuk kondisi sentimen berita dan harga saham di hari yang sama. Hal ini menunjukkan bahwa para investor dapat mempertimbangkan sentimen berita terkait saham tertentu di situs www.bisnis.com di hari yang sama untuk melakukan transaksi jual beli saham. ...... Capital market has been acted as one of the pillar for economy growth in Indonesia, because capital market is one of additional capital for the company in carrying out its business operations. In addition, capital markets can also provide benefits to individuals or business groups investors , which its profit can be used for the cost of living in the present and the future. Stock Equity is one of the instruments traded in capital markets that can provide gains up to 20 25 per year, but also have a higher risk than other instruments, due to fluctuations in stock prices are high. Investors should be cautious in choosing the right time to make buying or selling shares, if they do not want to get a big loss. One of technique in determining time for transaction is Efficient Market Hypothesis EMH , which states that stock price movement reflects related stock rsquo s information published. EMH has correlation with behavioral economics which states that investor decision can be influenced by perception or emotion sentiment of the information which he she read. Some information related to specific stock can be read in online media, such as news article from websites in Indonesia. Based on EMH and behavioral economis, this study aims to see whether the sentiment of online media can classify stock price movements, with the scope of online media that will be studied is www.bisnis.com. Stock price which is studied is belong to PT.Bank Central Asia BBCA.JK. The research method is quantitative research with experimental methodology using sentiment analysis approach. Feature extraction is done by representing news articles in form of vector using term frequency tf, term frequency inverse document frequency tf df, and doc2vec. Classification algorithm used are naive bayes, k nearest neighbors, dan support vector machine SVM. After getting classification result from news sentiment analysis, this study continue by comparing those classifications with actual price of stock that day until five days forward. The result shows that vector representation using tf idf is better with classification accuracy 78,66. Meanwhile, comparation between news sentiments classification with actual price stock shows 63,11 within the same day. This result means that news article sentiment related to spesific stock from www.bisnis.com can be used as reference for investors in determining their participation in stocks purchase transaction.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2017
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Abstrak :
In the urban drainage design, people usually use the Intensity Duration Frequency to estimate Short Duration Design Rainfall. Problems shall arise when short duration data from Automatic Rainfall Recorder are not available in the study area....
Artikel Jurnal  Universitas Indonesia Library
cover
Yusak Sutikno
Abstrak :
Pandemi covid-19 dan kebijakan-kebijakan penanggulangannya telah mengubah cara hidup dan kebiasaan banyak orang di seluruh dunia. Terbatasnya pergerakan dan aktivitas masyarakat mendorong mereka untuk mengandalkan sektor pengiriman barang dalam upaya pemenuhan kebutuhan. Hal ini menjadikan sektor usaha pengiriman barang menjadi bagian penting dalam pemenuhan kebutuhan masyarakat di tengah pandemi. Tersedianya akun layanan resmi tiap penyedia barang di media sosial Twitter sebagai wadah pengaduan dan aspirasi pelanggan, memungkinkan untuk dilakukan analisis tren kebutuhan hingga mengukur kepuasan pelanggan terhadap layanan sektor jasa ini sebelum dan selama pandemi. Penelitian mengenai analisis sentimen pelanggan terhadap suatu produk maupun jasa sudah banyak dilakukan, namun implementasi pendekatan analisis Time Window Lexicon–TFIDF-SVM dan pemodelan topik LDA-Mallet terintegrasi belum banyak dilakukan, terutama dalam konteks analisis sentimen pada sektor jasa pengiriman barang. Penelitian ini menggunakan data Twitter yang diperoleh dengan metode scrapping dengan rentang waktu Oktober 2019 - September 2020 pada lima penyedia layanan pengiriman barang paling populer di Indonesia. Pendekatan leksikon dipergunakan dalam pembentukan data latih, dimana dari data latih ini diperoleh model klasifikasi memperoleh tingkat akurasi 89,21% kemudian diinferensikan dengan pendekatan statistik TFIDF-SVM untuk memprediksi polaritas sentimen keseluruhan data. Penelitian ini memberikan hasil bahwa: (1) Pandemi covid-19 melalui parameter kebijakan penanganan pandemi secara signifikan meningkatkan aktivitas penyampaian keluhan/aspirasi dimana hal ini menunjukkan terjadinya peningkatan jumlah layanan yang diberikan; (2) sistem pelayanan pengiriman belum cukup kuat untuk menghadapi fluktuasi permintaan, dimana peningkatan jumlah pelayanan dibarengi juga dengan peningkatan ketidakpuasan yang terindikasi dari meningkatnya polaritas sentimen ‘Negatif’ selama pandemi. Pada periode tiga bulan kedua terlihat bahwa adaptasi dan perbaikan layanan hanya terjadi pada sebagian penyedia layanan saja; dan (3) terdapat beberapa perubahan topik keluhan/aspirasi yang dilihat pada rentang waktu sebelum pandemi, tiga bulan pertama pandemi, dan tiga bulan kedua pandemi. ......The Covid-19 pandemic and activity restriction policies in an effort to contain its spread have changed the ways of life and habits of many people around the world. Limited movement and community activities encourage them to rely on the shipping sector to meet their needs. This makes the delivery of goods an important part of meeting people's needs in the midst of a pandemic. The availability of official service accounts of each goods provider on Twitter social media as a forum for complaints and customer aspirations, enabling analysis of service needs trends and measuring customer satisfaction with these service sector services before and during the pandemic. Research on customer sentiment analysis towards a product or service has been done a lot, but the implementation of the lexicon–tfidf-svm time window approach integrating with LDA-Mallet topic modeling has not been done much, especially in the context of sentiment analysis in the freight forwarding sector. This research uses Twitter data obtained by the scrapping method from October 2019 - September 2020 on the five most popular delivery service providers in Indonesia. The lexicon approach is used in the formation of training data, where the classification model of this training data accurate rate of 89.21% is obtained which is then referred to predict the polarity of the overall sentiment of the data by the TFIDF-SVM statistical approach. This study provides the results that: (1) the Covid-19 pandemic through the parameters of the pandemic management policy significantly increased the activity of submitting complaints/aspirations, indicating an increase in the number of requests for services or services provided; (2) the delivery service system is not yet strong enough to deal with fluctuations in increased demand, where an increase in the number of services is accompanied by an increase in dissatisfaction, although it is not significant for all service providers. In the second three-months period, it appears that the process of adaptation and improvement of services only occurred in part of service providers; and (3) there were some changes in the topic of complaints/aspirations that were seen in the timeframe before the pandemic, the first three months of the pandemic, and the second three months of the pandemic.
Depok: Fakultas Teknik Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Rifqi Wazirsyah
Abstrak :
E-Learning Management System (EMAS) merupakan aplikasi yang dibuat oleh Universitas Indonesia dengan berbagai fitur salah satunya forum diskusi online. Dalam forum diskusi online, mahasiswa dapat membuat postingan-postingan dalam bentuk teks untuk bisa berdiskusi. Postingan-postingan dalam bentuk teks memiliki peran penting dalam meningkatkan performa mahasiswa yang terkhusus pada kelulusannya. Pada tugas akhir ini, Multinomial Naïve Bayes (MNB) digunakan untuk mengklasifikasi performa mahasiswa berdasarkan postingan-postingan dalam bentuk teks pada forum diskusi online. Sebelum dilakukan tahapan klasifikasi, postingan-postingan tersebut dilakukan preprocessing dan pemberian bobot kata pada teks menggunakan TF-IDF. Hasil TF-IDF dinyatakan dalam bentuk vektor-vektor, proses ini disebeut dengan proses vektorisasi. Banyaknya dokumen dari data hasil vektorisasi TF-IDF yang digunakan yaitu sebanyak 228, dengan proporsi mahasiswa lulus dan tidak lulus secara berturut-turut, yaitu sebesar 219 dan 9. Pada data tersebut didominasi oleh mahasiswa lulus, artinya data tersebut tidak seimbang, sehingga diperlukan proses SMOTE untuk menyeimbangkan data. Kemudian, dilakukan implementasi model MNB pada 3 kasus pembagian data training dan data testing, yaitu 70%;30%, 80%:20% dan 90%:10%, dengan cara melatih model pada data training dan menguji model pada data testing untuk memperoleh klasifikasi performanya. Implementasi dilakukan sebanyak lima kali percobaan, sehingga didapatkan model MNB dapat mengklasifikasi performa mahasiswa dengan baik dan hasil kinerja model terbaik pada data testing 30% yaitu rata-rata akurasi sebesar 0,956, rata-rata recall sebesar 0,979, dan rata-rata f1-score sebesar 0,977. Namun rata-rata presisi terbaik didapatkan pada data testing 20%, yaitu sebesar 0,977. ......E-Learning Management System (EMAS) is an application created by the University of Indonesia with various features, one of which is an online discussion forum. In online discussion forums, students can make posts in the form of text to be able to discuss. Posts in the form of text have an important role in improving student performance, especially at graduation. In this final project, Multinomial Naive Bayes (MNB) is used to classify student performance based on posts in text form on online discussion forums. Prior to the classification stage, the posts were preprocessed and assigned word weights to the text using TF-IDF. The results of TF-IDF are expressed in the form of vectors, this process is called the vectorization process. The number of documents from the TF-IDF vectorized data used is 228, with the proportion of students graduating and not graduating respectively, which is 219 and 9. SMOTE to balance data. Then, the implementation of the MNB model was carried out in 3 cases of distribution of training data and testing data, namely 70%; 30%, 80%:20% and 90%:10%, by training the model on the training data and testing the model on the testing data to obtain performance classification. The implementation was carried out five times, so that the MNB model was able to classify student performance well and the best model performance results were on 30% testing data, namely an average accuracy of 0.956, an average recall of 0.979, and an average f1-score of 0.956. 0.977. However, the best average precision was obtained at 20% testing data, which was 0.977.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library