Perkembangan teknologi dan informasi kini telah memberikan berbagai kemudahan dalam menjalani kehidupan. Salah satu perkembangan teknologi tersebut adalah munculnya berbagai portal berita online di Indonesia. Hal ini menyebabkan banyak berita online yang tersebar di Indonesia. Untuk mengetahui topik utama pada waktu tertentu, sulit jika harus membaca seluruh berita online. Oleh karena itu, digunakan proses pemodelan topik yang secara otomatis membantu menemukan topik utama yaitu metode NMF (Nonnegative Matrix Factorization). Dalam metode NMF, kumpulan berita online direpresentasikan sebagai matriks. Kemudian, metode NMF memfaktorisasi matriks tersebut menjadi matriks-matriks yang nonnegatif. Secara umum, sparseness merupakan akibat dari proses faktorisasi matriks. Namun, dalam penelitian ini, dilakukan proses pengaturan derajat sparseness pada metode NMF. Proses analisis pengaruh derajat sparseness dalam metode NMF pada ekstraksi topik utama berita online Indonesia ini dilihat pada tingkat interpretabilitas topik yang dihasilkan, semakin sparse suatu matriks maka semakin sulit untuk diinterpretasikan.
Development of technology and information nowadays gives many tools to be alive. One of that improved is the appearance of many portals of online news in Indonesia. As a consequences, many online news spread easily in Indonesia. For knowing the main topics in some time, it can be hard to read all the online news in short time. So that, using topic modeling that automatically help people to find the main topics. Non-negative matrix factorization (NMF) method is part of the topic modeling. In NMF method, the collection of online news are representing by a matrix. After that, NMF method factors that matrix into two nonnegative matrixs. Generally, sparseness is a result of the factorization process. But, in this research, we use to controlling the degree of sparseness in NMF method. Process of analizing the impact of degrees of sparseness for extracting main topics of Indonesia online news are seeing by the interpretability of the topics, more sparse the matrix, more difficult to interpret.