Hasil Pencarian

Ditemukan 2 dokumen yang sesuai dengan query

Muhammad Fauzul Akbar

Layanan Web Machine Learning dan Manajemen Beban untuk Automatic Indonesian News Generation System = Machine Learning Web Service and Load Management for Automatic Indonesian News Generation System

"Large Language Model (LLM) generatif merupakan jenis model machine learning yang dapat diaplikasikan dalam industri jurnalisme, khususnya dalam proses pembuatan dan validasi berita. Namun, LLM memerlukan sumber daya yang besar untuk operasionalnya serta membutuhkan waktu proses inferensi yang relatif lama. Penelitian ini bertujuan untuk mengembangkan layanan web machine learning yang memanfaatkan LLM generatif untuk proses pembuatan dan validasi berita. Tujuan lainnya adalah menciptakan sistem dengan mekanisme manajemen beban yang efisien untuk meminimalkan waktu inferensi. Pengembangan melibatkan beberapa tahap, yakni analisis kebutuhan stakeholder, perancangan desain dan arsitektur, implementasi, serta evaluasi. Dalam implementasi layanan web machine learning, pengembangan ini berfokus pada manajemen GPU untuk meningkatkan kecepatan proses inferensi LLM. Selain itu, dilakukan implementasi design pattern untuk meningkatkan skalabilitas dalam penambahan model machine learning. Untuk manajemen beban, dikembangkan dua mekanisme, yaitu load balancer dan scheduler. Implementasi load balancer memanfaatkan NGINX dengan metode round-robin. Sedangkan untuk scheduler, digunakan RabbitMQ sebagai antrean, dengan publisher menerima permintaan dan subscriber mendistribusikan permintaan ke layanan yang tersedia. Berdasarkan API Test, layanan ini berhasil melewati uji fungsionalitas dengan waktu respons API sekitar 1-2 menit per permintaan. Evaluasi performa pada kedua mekanisme manajemen beban menunjukkan tingkat keberhasilan 100%, dengan waktu respon rata-rata meningkat seiring dengan peningkatan jumlah request per detik. Pengelolaan beban dengan load balancer menghasilkan waktu respon yang lebih cepat, sementara pengelolaan beban dengan scheduler menghasilkan mekanisme yang lebih efektif pada proses koneksi asinkron.

Generative Large Language Model (LLM) is a type of machine learning model that can be applied in the journalism industry, especially in the process of news generation and validation. However, LLM requires large resources for its operation and requires a relatively long inference process time. This research aims to develop a machine learning web service that utilizes generative LLM for news generation and validation. Another goal is to create a system with an efficient load management mechanism to minimize inference time. The development involves several stages, namely stakeholder needs analysis, design and architecture, implementation, and evaluation. In the implementation of machine learning web services, this development focuses on GPU management to increase the speed of the LLM inference process. In addition, the implementation of design patterns is done to improve scalability in adding machine learning models. For load management, two mechanisms are developed: load balancer and scheduler. The load balancer implementation utilizes NGINX with the round-robin method. As for the scheduler, RabbitMQ is used as a queue, with the publisher receiving requests and the subscriber distributing requests to available services. Based on the API Test, the service successfully passed the functionality test with an API response time of about 1-2 minutes per request. Performance evaluation on both load management mechanisms showed a 100% success rate, with the average response time increasing as the number of requests per second increased. The use of a load balancer results in faster response times, while load management with a scheduler results in a more effective mechanism for asynchronous connection processes. "

Depok: Fakultas Ilmu Komputer Universitas Indonesia , 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Muhammad Hanif Anggawi

Layanan Back-End dan Basis Data untuk Automatic Indonesian News Generation System = Back-End Service and Database for Automatic Indonesian News Generation System

"Tujuan dari pengembangan proyek Automatic Indonesian News Generation System (AINGS) adalah untuk mengoptimalkan proses penyuntingan dan pengiriman berita di era digital, dengan fokus khusus pada aspek usability layanan web dan e siensi basis data. Proses pengembangan dimulai dengan pemetaan kebutuhan fungsional sistem de- ngan tur yang akan diimplementasi. Kebutuhan fungsional sistem mencakup pengelo- laan draf berita, pembuatan draf berita dan validasi draf berita secara otomatis serta komu- nikasi antara redaktur dan wartawan. Implementasi tur diwujudkan dengan layanan web berupa REST API yang terintegrasi dengan basis data serta layanan web machine learn- ing. Perancangan basis data dilakukan dengan melibatkan identi kasi empat entitas utama dan identi kasi hubungan antar entitas. Pengembangan basis data dilanjutkan dengan melakukan normalisasi hingga Third Normal Form (3NF) untuk memastikan konsistensi dari data yang disimpan serta e siensi dalam waktu pemrosesan. Selain itu, dilakukan im- plementasi Elasticsearch dan performanya dibandingkan dengan PostgreSQL dalam hal waktu pemrosesan untuk pencarian draf berita. Evaluasi layanan web dilakukan dengan melakukan integration testing dan evaluasi usability menggunakan heuristik. Hasil inte- gration testing menunjukan layanan web lulus semua skenario tes dan mampu memenuhi seleuruh kebutuhan fungsional sistem. Berdasarkan hasil evaluasi heuristik, layanan web yang dikembangkan mencapai nilai metrik knowability (96.49%) dan robustness (100.00%) yang baik namun untuk metrik operability (84.07%) dan ef ciency (83.33%) dapat ditingkatkan dengan memberikan opsi format data pada request dan menerapkan caching. Hasil evaluasi basis data menunjukan bahwa normalisasi pada tahap Second Normal Form (2NF) memberikan waktu pemrosesan yang lebih optimal dengan tetap memastikan konsistensi data yang terjaga. Rata-rata waktu pemrosesan yang dihasilkan oleh tahap 2NF adalah 1,712ms, sedangkan pada tahap 3NF mencapai 3,363ms. Semen- tara itu, penerapan Elasticsearch meningkatkan kinerja pencarian sehingga menghasilkan waktu pemrosesan yang lebih cepat. Menggunakan kata kunci pencarian ”Jakarta”, Elas- ticsearch dapat memproses permintaan hanya dalam waktu 8ms, sementara PostgreSQL membutuhkan waktu hingga 142,943ms.

The objective of developing the "Automatic Indonesian News Generation System" (AINGS) project is to optimize the editing and delivery process of news in the digital era, with a particular focus on the usability of web services and the ef ciency of the database. The development process begins with mapping the system’s functional requirements to the features to be implemented. The functional requirements of the system include man- aging news drafts, creating news drafts, and validating news drafts automatically, as well as communication between editors and reporters. The feature implementation is real- ized through a web service in the form of a REST API integrated with a database and machine learning web services. The database design involves identifying four main en- tities and the relationships between them. The database development is continued with normalization up to the Third Normal Form (3NF) to ensure consistency of the stored data and ef ciency in processing time. Additionally, Elasticsearch is implemented, and its performance is compared with PostgreSQL in terms of processing time for searching news drafts. The web service evaluation is carried out by conducting integration testing and usability evaluation using heuristics. The integration testing results show that the web service passes all test scenarios and meets all the system’s functional requirements. Based on the heuristic evaluation results, the developed web service achieves good met- rics in knowability (96.49%) and robustness (100.00%), but for operability (84.07%) and ef ciency (83.33%) metrics, improvements can be made by providing data format options in requests and implementing caching. The database evaluation results show that normal- ization at the Second Normal Form (2NF) stage provides more optimal processing time while ensuring data consistency. The average processing time produced by the 2NF stage is 1,712ms, while at the 3NF stage, it reaches 3,363ms. Meanwhile, the implementation of Elasticsearch enhances search performance, resulting in faster processing times. Using the search keyword ”Jakarta,” Elasticsearch can process requests in just 8ms, while Post- greSQL requires up to 142,943ms."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian