Penelitian ini bertujuan untuk melakukan pengelompokan varian virus SARS-CoV-2 melalui proses clustering menggunakan metode unsupervised learning. Data yang digunakan adalah sekuens protein SARS-CoV-2 yang diekstraksi fiturnya menggunakan paket Discere dalam bahasa pemrograman Python. Sebanyak 27 fitur dihasilkan dan diseleksi dengan metode seleksi fitur Least Absolute Shrinkage and Selection Operator (LASSO). Metode Elbow digunakan untuk menentukan jumlah cluster yang optimal. Dalam penelitian ini, digunakan metode clustering K-Means dan Balanced Iterative Reducing and Clustering using Hierarchies (BIRCH). Evaluasi hasil clustering dilakukan menggunakan metrik evaluasi Silhouette Score dan Davies-Bouldin Index, serta memperhatikan waktu runtime untuk setiap simulasi. Hasil evaluasi kemudian dibandingkan untuk melihat perbedaan performa antara kedua metode clustering yang digunakan, serta pengaruh seleksi fitur terhadap performa clustering. Hasil terbaik diperoleh pada simulasi dengan metode clustering BIRCH + LASSO, dengan nilai Silhouette Score 0,74186 untuk jumlah cluster k=4 dan 0,73207 untuk k=5. Nilai Davies-Bouldin Index terbaik juga diperoleh pada simulasi tersebut, yaitu 0,42697 untuk k=4 dan 0,37949 untuk k=5. Waktu runtime terbaik tercatat pada simulasi dengan metode K-Means + LASSO, yaitu 0,21551 detik untuk k=4 dan 0,17539 detik untuk k=5. Dapat disimpulkan bahwa metode BIRCH menghasilkan cluster yang lebih baik berdasarkan metrik evaluasi, namun K-Means memberikan proses clustering yang lebih cepat. Seleksi fitur dengan metode LASSO juga membantu meningkatkan performa clustering.
Saat ini tidak ada keraguan bagi siswa-siswi sekolah menengah untuk melanjutkan pendidikannya ke jenjang universitas. Namun, transisi dari sekolah menengah ke pendidikan tinggi adalah tantangan besar bagi mahasiswa tahun pertama. Kinerja mahasiswa pada tahun pertama cenderung menentukan kinerja mahasiswa tersebut di tahun-tahun akademik berikutnya. Penting untuk mencari karakteristik-karakteristik mahasiswa berdasarkan kinerjanya pada awal tahun semester akademik, sehingga dapat dilakukan pendeteksian awal untuk mencegah penurunan kinerja dan meningkatkan prestasi akademik mahasiswa. Penelitian ini bertujuan untuk mengelompokkan 140 mahasiswa semester pertama. Fitur-fitur diseleksi menggunakan Chi-Square lalu digunakan Fuzzy C-Means clustering untuk mengelompokkan mahasiswa. Dari hasil simulasi, mahasiswa dikelompokkan ke dalam dua cluster dengan kinerja cluster kedua lebih baik dibanding kinerja cluster pertama.
Currently there is no doubt for high school students to continue their education at the university level. However, the transition from high school to university is a major challenge for the first-year students. Moreover, student performance during the first year tends to determine their performance in the following academic years. It is important to find student's characteristics based on their performance at the beginning of the academic semester so that early detection can be done to prevent performance degradation and increase student academic achievement. This study aims to cluster 140 first year students. Features are selected using the Chi-Square feature selection method and then using Fuzzy C-Means clustering to group the students. From simulation result, students are grouped into two clusters with the second cluster's performance is better than the first cluster's performance.
"