Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 173910 dokumen yang sesuai dengan query
cover
Julizar Isya Pandu Wangsa
"Pendeteksian topik merupakan suatu proses pengidentifikasian suatu tema sentral yang ada dalam kumpulan dokumen yang luas dan tidak terorganisir. Hal ini merupakan hal sederhana yang bisa dilakukan secara manual jika data yang ada hanya sedikit. Untuk data yang banyak dibutuhkan pengolahan yang tepat agar representasi topik dari setiap dokumen didapat dengan cepat dan akurat sehingga machine learning diperlukan. BERTopic adalah metode pemodelan topik yang memanfaatkan teknik clustering dengan menggunakan model pre-trained Bidirectional Encoder Representations from Transformers (BERT) untuk melakukan representasi teks dan Class based Term Frequency Invers Document Frequency (c-TF-IDF) untuk ekstraksi topik. Metode clustering yang digunakan pada penelitian ini adalah metode ­K-Means, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), dan Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN). BERT dipilih sebagai metode representasi teks pada penelitian ini karena BERT merepresentasikan suatu kalimat berdasarkan sequence-of-word dan telah memperhatikan aspek kontekstual kata tersebut dalam kalimat. Hasil representasi teks merupakan vektor numerik dengan dimensi yang besar sehingga perlu dilakukan reduksi dimensi menggunakan Uniform Manifold Approximation and Projection (UMAP) sebelum clustering dilakukan. Model BERTopic dengan tiga metode clustering ini akan dianalisis kinerjanya berdasarkan matrik nilai coherence, diversity, dan quality score. Nilai quality score merupakan perkalian dari nilai coherence dengan nilai diversity. Hasil simulasi yang didapat adalah model BERTopic menggunakan metode clustering K-Means lebih unggul 2 dari 3 dataset untuk nilai quality score dari kedua metode clustering yang ada.

Topic detection is the process of identifying a central theme in a large, unorganized collection of documents. This is a simple thing that can be done manually if there is only a small amount of data. For large amounts of data, proper processing is needed to represent the topic of each document quickly and accurately, so machine learning is required. BERTopic is a topic modeling method that utilizes clustering techniques by using pre-trained Bidirectional Encoder Representations from Transformers (BERT) models to perform text representation and Class based Term Frequency Inverse Document Frequency (c-TF-IDF) for topic extraction. The clustering methods used in this research are the K-Means, Density-Based Spatial Clustering of Applications with Noise (DBSCAN), and Hierarchical Density-Based Spatial Clustering of Applications with Noise (HDBSCAN). BERT was chosen as the text representation method in this research because BERT represents a sentence based on sequence-of-words and has considered the contextual aspects of the word in the sentence. The result of text representation is a numeric vector with large dimensions, so it is necessary to reduce the dimensions using Uniform Manifold Approximation and Projection (UMAP) before clustering is done. The BERTopic model with three clustering methods will be analyzed for performance based on the matrix of coherence, diversity, and quality score values. The quality score value is the multiplication of the coherence value with the diversity value. The simulation results obtained are the BERTopic model using K-Means clustering method is superior to 2 of the 3 datasets for the quality score value of the two existing clustering methods."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Banjarnahor, Evander
"Berdasarkan data WHO pada pertengahan Juli 2021 lebih dari 185,2 juta orang di seluruh dunia terinfeksi virus corona atau Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2). Virus ini menyerang penapasan manusia yang dapat mengakibatkan infeksi paru-paru pada manusia dan bahkan dapat menyebabkan kematian. Tercatat bahwa lebih dari 4 juta orang di seluruh dunia meninggal akibat terinfeksi virus corona. Di Indonesia sendiri pada pertengahan Juli 2021 tercatat lebih dari 2,4 juta orang ternfeksi virus corona dan lebih dari 65,4 ribu orang meninggal akibat terinfeksi virus corona. Berdasarkan data tersebut, perlu dilakukan analisis kekerabatan virus SARS-CoV-2 untuk mengurangi penyebaran dan memberikan batasan sosial dari negara satu dengan negara lainnya. Identifikasi kekerabatan dari virus covid-19 dan penyebarannya dapat dilakukan dengan cara pembentukan pohon filogenetik dan clustering. Pada penelitian ini pohon filogenetik akan dibangun berdasarkan metode Hierarchical Clustering dengan menggunakan metode Multiple Encoding Vector dan K-Mer berdasarkan translasi DNA kodon menjadi asam amino. Jarak Euclidean akan digunakan untuk menentukan matriks jarak. Penelitian ini selanjutnya menggunakan metode K- Means Clustering untuk melihat penyebarannya, dimana nilai k ditentukan dari jumlah centroid yang dihasilkan dari metode Hierarchical Clustering. Penelitian ini mengambil sampel barisan DNA SARS-CoV-2 dari beberapa negara yang tertular. Dari hasil simulasi, nenek moyang SARS-CoV-2 berasal dari China. Hasil analisis juga menunjukkan bahwa leluhur covid-19 yang paling dekat dengan Indonesia berasal dari India, Australia dan Spanyol. Selain itu dari hasil simulasi dihasilkan bahwa barisan DNA SARS-CoV-2 terdiri dari 9 cluster dan cluster keenam adalah kelompok yang memiliki anggota paling banyak. Hasil analisis juga menunjukkan bahwa metode ini sangat opitimal dalam pengelompokan data dengan nilai 97.4%.

Based on WHO data in middle of July 2021, Coronavirus or Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) is infecting more than 185.2 million people worldwide. The virus attacks human breathing, which can cause lung infections and can even cause death. More than 4 million people worldwide have died due to being infected with the coronavirus. In Indonesia alone, in mid-July 2021, there were more than 2.4 million people infected with the corona virus and more than 65.4 thousand people died from being infected with the corona virus. Based on those covid-19 survivor data, it is necessary to carry out a kinship analysis of the coronavirus to reduce its spreading. Identification of the kinship of the covid- 19 virus and its spread can be done by forming a phylogenetic tree and clustering. This study uses the Multiple Encoding Vector method and K-mer based on translation DNA codon to amino acid in analyzing sequences and Euclidean Distance to determine the distance matrix. This research will then use the Hierarchical Clustering method to determine the number of initial centroids and cluster, which will be used later by the K-Means Clustering method kinship in SARS-CoV-2 DNA sequence. This study took samples of DNA sequences of SARS-CoV-2 from several infected countries. From the simulation results, the ancestors of SARS-CoV-2 came from China. The results of the analysis also show that the closest ancestors of covid-19 to Indonesia came from India, Australia and Spain. In addition, the ancestors of SARS-CoV-2 came from China. The SARS- CoV-2 DNA sequence is also consisted of 9 clusters, and the sixth cluster is the group that has the most members. The results also show that this method is very optimal in a grouping of data with a value of 97.4%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Wu, Junjie
"This book addresses these challenges and makes novel contributions in establishing theoretical frameworks for K-means distances and K-means based consensus clustering, identifying the "dangerous" uniform effect and zero-value dilemma of K-means, adapting right measures for cluster validity, and integrating K-means with SVMs for rare class analysis. This book not only enriches the clustering and optimization theories, but also provides good guidance for the practical use of K-means, especially for important tasks such as network intrusion detection and credit fraud prediction. The thesis on which this book is based has won the "2010 National Excellent Doctoral Dissertation Award", the highest honor for not more than 100 PhD theses per year in China."
Berlin: Springer-Verlag, 2012
e204063793
eBooks  Universitas Indonesia Library
cover
Athiyyah Fadillah Eriri
"Pengelompokan atau clustering adalah pengelompokan objek-objek yang dilakukan atas dasar kesamaan atau jarak (perbedaan) di mana tidak ada asumsi yang dibuat mengenai banyaknya cluster atau struktur cluster. Salah satu metode yang banyak digunakan dalam penyelesaian masalah clustering adalah algoritme K-Means. Pada algoritme ini, suatu objek yang telah menjadi anggota cluster tertentu, tidak bisa menjadi anggota cluster yang lainnya. Metode ini dikenal sebagai hard clustering. Pendekatan lain dalam melakukan pengelompokan didasarkan pada teori himpunan fuzzy yang dikenal dengan pengelompokan fuzzy. Teori himpunan fuzzy memiliki nilai kekaburan antara salah atau benar. Jadi, dalam melakukan pengelompokan, setiap objek memiliki peluang menjadi anggota pada setiap cluster. Salah satu metode pengelompokan fuzzy adalah Fuzzy C-Means (FCM). Pada tugas akhir ini, metode K-Means dan FCM digunakan untuk mengelompokkan nagari-nagari di Kabupaten Agam. Nagari-nagari di Kabupaten Agam dikelompokan berdasarkan indikator pembangunan keluarga yang berasal dari Laporan Pendataan Keluarga tahun 2015 yang bersumber dari BKKBN (Badan Kependudukan dan Keluarga Berencana Nasional). Pada penelitian ini diperoleh empat cluster hasil dari indeks xie and beni. Jumlah anggota setiap cluster hasil dari algoritme K-Means adalah 32, 28, 11 dan 11. Sedangkan jumlah anggota setiap cluster hasil dari algoritme Fuzzy C-Means adalah 31, 18, 21, dan 12. Perbedaan jumlah anggota cluster yang dihasilkan algoritme K-Means dan Fuzzy C-Means adalah 14.29%. Karena rasio simpangan baku dalam dan antar cluster pada algoritme K-Means memberikan nilai yang lebih kecil dibandingkan algoritme Fuzzy C-Means maka algoritme K-Means memberikan hasil yang lebih baik dari pada algoritme Fuzzy C-Means dalam pengelompokan nagari-nagari di Kabupaten Agam.

Grouping or clustering is a method to group objects that are carried out on the basis of similarity or distance (difference) where no assumptions are made regarding the number of clusters or cluster structures. One method that is widely used in solving clustering problems is the K-Means algorithm. In this algorithm, if an object has become a member of a particular cluster, then it cannot become a member of another cluster. This method is known as hard clustering. Another approach to grouping is based on fuzzy set theory, known as fuzzy grouping. Fuzzy set theory has a blurring value between right or wrong. So, in grouping process, each object has the opportunity to become a member in each cluster. One of the fuzzy grouping methods is Fuzzy C-Means. In this study, the two methods, K-Means and Fuzzy C-Means, are used to group nagari-nagari in Agam District. Nagari is equivalent to villages in other provinces in Indonesia. The nagari grouping in Kabupaten Agam is based on family development indicators derived from the 2015 Family Data Collection Report sourced from BKKBN (Badan Kependudukan dan Keluarga Berencana Nasional). In this study four clusters were obtained based on xie and beni’s index. The numbers of members of each cluster as the result of the K-Means algorithm are 32, 28, 11 and 11. While the numbers of members of each cluster as the result of the Fuzzy C-Means algorithm are 31, 18, 21, and 12. The different cluster members produced by the K-Means and Fuzzy algorithms C-Means is 14.29%. Because the standard deviation ratio within and between clusters in the K-Means algorithm gives a smaller value than the Fuzzy C-Means algorithm, the K-Means algorithm gives better results than the Fuzzy C-Means algorithm on the nagari grouping in Agam District."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Asita Darma Irawati
"Pertimbangan finansial menjadi salah satu penentu utama apakah seseorang akan melanjutkan
pendidikan ke tingkat yang lebih tinggi atau tidak, sehingga diperlukan beasiswa untuk
membantu mahasiswa dalam menempuh pendidikan tinggi, terutama hingga tingkat doktor.
Besar biaya yang dikeluarkan oleh lembaga penyedia beasiswa kepada penerima beasiswa
tentunya diharapkan sepadan dengan kualitas ilmu yang diperoleh. Oleh karena itu, penelitian
ini bertujuan untuk membahas analisis pengelompokan universitas terbaik dunia berdasarkan
komponen biaya pendidikan program doktor dengan metode K-Means. Universitas pada
penelitian ini diambil dari QS World University Rangkings (WUR) 2022. Analisis eksploratori
data dilakukan dan diperoleh bahwa terdapat 83 dari 472 universitas di dunia memberi bantuan
dana penuh untuk studi program doktor. Nilai Silhouette sebesar 0,72 menunjukkan bahwa tiga
merupakan jumlah kelompok yang optimal bagi data. Sehingga terbentuk kelompok A
sebanyak 328 universitas, kelompok B sebanyak 108 universitas, dan kelompok C sebanyak
36 universitas. Kelompok A terdiri dari universitas dengan SPP dan biaya hidup per bulan
relatif rendah, kelompok B sedang, dan kelompok C tinggi. Untuk biaya transportasi udara,
kelompok B cenderung rendah, sedangkan kelompok A dan C relatif serupa dan lebih mahal
dari kelompok B. Sementara untuk biaya visa, kelompok A cenderung lebih murah, sedangkan
kelompok B dan C cenderung serupa dengan biaya lebih mahal. Berdasarkan analisis ini,
penulis memberikan saran universitas yang bisa dipertimbangkan lembaga pemberi beasiswa
sebagai perguruan tinggi tujuan.

Financial concern has been one of the main reasons why an individual wants to pursue higher
education. That is why scholarship is needed to help students earn an education, especially until
doctoral degree. The amount of money spent by institution who give scholarship must be
equivalent with the quality of knowledge an awardee got. This study aims to do clustering
analysis of the world’s top universities based on tuition fee components for doctoral program
using K-Means method. The object of this study are universities based on QS World University
Rankings 2022. Exploratory data analysis is done and found that there are 83 out of 472
universities in the world who give fully funded program for doctoral study. Based on the
silhouette value of 0.72, three is the best number of clusters for the data. Group A, B, C consists
of 328, 108, and 36 universities in respective order. Group A consists of universities who have
chepear tuition fee and monthly living cost compared to Group B dan C. However, Group B
consists of universities who have cheaper transportation, meanwhile Group A and C are quiet
similar. For visa, Group A is cheaper compared to Group B and C which are similar. Based on
the results, recommendations are given to the institution who provide scholarship about the
objective university for doctoral study.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nova Yuniarti
"[ABSTRAK
Berdasarkan data WHO tahun 2014, diperkirakan sekitar 15 juta orang di dunia
yang terinfeksi hepatitis B (HBsAg+) juga terinfeksi hepatitis D. Infeksi hepatitis
D dapat terjadi bersamaan (koinfeksi) atau setelah seseorang terkena hepatitis B
kronis (superinfeksi). Penyakit hepatitis B disebabkan oleh virus HBV dan
penyakit hepatitis D disebabkan oleh virus HDV. HDV tidak dapat hidup tanpa
HBV. Hepatitis D erat hubungannya dengan infeksi virus HBV, sehingga sangat
realistis bila setiap usaha pencegahan terhadap hepatitis B, maka secara tidak
langsung mencegah hepatitis D. Pada tesis ini akan dibahas bagaimana hasil
pengelompokan barisan DNA HBV menggunakan algoritma k-means clustering
dengan menggunakan perangkat lunak R. Dimulai dengan mengumpulkan barisan
DNA HBV yang diambil dari GenBank, kemudian dilakukan ekstraksi ciri
menggunakan n-mers frequency, dan hasil ekstraksi ciri barisan DNA tersebut
dikumpulkan dalam sebuah matriks dan dilakukan normalisasi menggunakan
normalisasi min-max dengan interval [0, 1] yang akan digunakan sebagai data
masukan. Jumlah cluster yang dipilih dalam penelitian ini adalah dua dan
penentuan centroid awal dilakukan secara acak. Pada setiap iterasi dihitung jarak
masing-masing objek ke masing-masing centroid dengan menggunakan Euclidean
distance dan dipilih jarak terpendek untuk menentukan keanggotaan objek di
suatu cluster sampai akhirnya terbentuk dua cluster yang konvergen. Hasil yang
diperoleh adalah virus HBV yang berada pada cluster pertama lebih ganas
dibanding virus HBV yang berada pada cluster kedua, sehingga virus HBV pada
cluster pertama berpotensi berevolusi dengan virus HDV menjadi penyebab
penyakit hepatitis D.

ABSTRACT
Based on WHO data, an estimated of 15 millions people worldwide who are
infected by hepatitis B (HBsAg+) are also infected by hepatitis D. Hepatitis D
infection can occur simultaneously with hepatitis B (co infection) or after a person
is exposed to chronic hepatitis B (super infection). Hepatitis B is caused by the
HBV virus and hepatitis D is caused by HDV virus. HDV can not live without
HBV. Hepatitis D virus is closely related to HBV infection, hence it is really
realistic that every effort of prevention against hepatitis B can indirectly prevent
hepatitis D. This thesis discussed the clustering of HBV DNA sequences by using
k-means clustering algorithm and R programming. Clustering processes is started
with collecting HBV DNA sequences that are taken from GenBank, then
performing extraction HBV DNA sequences using n-mers frequency and
furthermore the extraction results are collected as a matrix and normalized using
the min-max normalization with interval [0, 1] which will later be used as an input
data. The number of clusters is two and the initial centroid selected of cluster is
choosed randomly. In each iteration, the distance of every object to each centroid
are calculated using the Euclidean distance and the minimum distance are selected
to determine the membership in a cluster until two convergent clusters are created.
As the result, the HBV viruses in the first cluster is more virulent than the HBV
viruses in the second cluster, so the HBV viruses in the first cluster can potentially
evolve with HDV viruses that cause hepatitis D., Based on WHO data, an estimated of 15 millions people worldwide who are
infected by hepatitis B (HBsAg+) are also infected by hepatitis D. Hepatitis D
infection can occur simultaneously with hepatitis B (co infection) or after a person
is exposed to chronic hepatitis B (super infection). Hepatitis B is caused by the
HBV virus and hepatitis D is caused by HDV virus. HDV can not live without
HBV. Hepatitis D virus is closely related to HBV infection, hence it is really
realistic that every effort of prevention against hepatitis B can indirectly prevent
hepatitis D. This thesis discussed the clustering of HBV DNA sequences by using
k-means clustering algorithm and R programming. Clustering processes is started
with collecting HBV DNA sequences that are taken from GenBank, then
performing extraction HBV DNA sequences using n-mers frequency and
furthermore the extraction results are collected as a matrix and normalized using
the min-max normalization with interval [0, 1] which will later be used as an input
data. The number of clusters is two and the initial centroid selected of cluster is
choosed randomly. In each iteration, the distance of every object to each centroid
are calculated using the Euclidean distance and the minimum distance are selected
to determine the membership in a cluster until two convergent clusters are created.
As the result, the HBV viruses in the first cluster is more virulent than the HBV
viruses in the second cluster, so the HBV viruses in the first cluster can potentially
evolve with HDV viruses that cause hepatitis D.]"
2015
T44666
UI - Tesis Membership  Universitas Indonesia Library
cover
Atina
"[ABSTRAK
Intensitas keabuan yang sangat dekat memungkinkan terjadinya kesalahan dalam
menginterpretasikan citra hasil Computed Radiography (CR). Maka diperlukan
algoritma yang dapat mempermudah tim medis mendiagnosa kondisi pasien
khususnya bagian paru. Penelitian ini menggunakan tingkat keabuan /intensitas
citra sebagai dasar clustering dan segmentasi Region of Interest (ROI ) yang akan
dilakukan dengan sistem komputerisasi. Sehingga hasil pembacaan lebih akurat
dibanding secara manual. Data sampel berupa 100 citra hasil CR pasien paru
dewasa Rumah Sakit Pusat Pertamina yaitu 50 citra norma sebagai citra acuan dan
50 citra uji (normal dan abnormal). Pada clustering diuji coba dengan jumlah
cluster (k) bervariasi yaitu 3, 4, .., 10. Citra hasil clustering yang terbaik
ditunjukkan pada k = 8 karena dapat memvisualisasikan batas warna dengan lebih
jelas dibanding dengan k yang lain. Pada segmentasi ROI, citra paru dibagi
menjadi 33 daerah sesuai posisi anatomi paru yang terdiri dari 6 daerah apex, 11
daerah hilum dan 16 daerah peripheral. Selanjutnya, masing-masing daerah
pembagian diukur intensitasnya. Intensitas citra acuan dijadikan dasar untuk
menentukan abnormalitas citra uji, intensitas citra uji yang lebih tinggi dari
intensitas citra normal dikategorikan sebagai citra abnormal. Akurasi sistem pada
penelitian ini adalah 66%.

ABSTRACT
Gray intensity is very close to allow for errors in interpreting the Computed
Radiography (CR) image. It would require an algorithm that can facilitate medical
team to diagnose the patient's condition especially the lungs. Clustering k-means
clustering and segmentation Region of Interest (ROI) will be done by a
computerized system based on the image gray level / intensity. 100 CR image
used as the sample data from Rumah Sakit Pusat Pertamina, 50 image as
references images and 50 images as tested image. On clustering tested by the
number of clusters (k) varies the 3, 4, .., 10. The clustering of the best image
results are shown in k = 8 because it can visualize the color boundaries more
clearly than the other k. At ROI segmentation, lung image is divided into 33
regions corresponding anatomical position lung consist of 6 regional apex, hilum
area 11 and 16 peripheral areas. Furthermore, each regional division of the
measured intensity. The intensity of the reference image used as the basis for
determining abnormality test images, test image intensity higher than normal
image intensity categorized as abnormal image. The system accuracy in this study
was 66%., Gray intensity is very close to allow for errors in interpreting the Computed
Radiography (CR) image. It would require an algorithm that can facilitate medical
team to diagnose the patient's condition especially the lungs. Clustering k-means
clustering and segmentation Region of Interest (ROI) will be done by a
computerized system based on the image gray level / intensity. 100 CR image
used as the sample data from Rumah Sakit Pusat Pertamina, 50 image as
references images and 50 images as tested image. On clustering tested by the
number of clusters (k) varies the 3, 4, .., 10. The clustering of the best image
results are shown in k = 8 because it can visualize the color boundaries more
clearly than the other k. At ROI segmentation, lung image is divided into 33
regions corresponding anatomical position lung consist of 6 regional apex, hilum
area 11 and 16 peripheral areas. Furthermore, each regional division of the
measured intensity. The intensity of the reference image used as the basis for
determining abnormality test images, test image intensity higher than normal
image intensity categorized as abnormal image. The system accuracy in this study
was 66%.]"
2015
T43838
UI - Tesis Membership  Universitas Indonesia Library
cover
Anne Parlina
"Tren adalah suatu pola yang berulang, sementara analisis tren merupakan praktik pengumpulan dan analisis data dalam upaya untuk menemukan pola tersebut. Analisis tren adalah suatu metode untuk memproyeksikan kondisi masa depan berdasarkan data masa lalu hingga saat ini. Tinjauan literatur sistematis, bibliometrik, dan topic modeling adalah beberapa contoh pendekatan yang sering dipakai untuk menangkap fenomena perkembangan tren sains dan teknologi. Penelitian ini bertujuan untuk melakukan pengujian dan implementasi algoritma deteksi topik berbasis clustering yang dikombinasikan dengan analisis kualitatif dalam pendeteksian tren topik untuk mendapatkan gambaran yang menyeluruh mengenai konsep, struktur ilmiah, topik utama, dan perkembangan bidang teknologi big data dan smart sustainable city. Analisis topik dilakukan terhadap kumpulan data bibliografi publikasi ilmiah terkait kedua bidang tersebut yang didapat dari basis data Scopus dan CORE. Pengujian terhadap kinerja algoritma Deep-autoencoder based Fuzzy C-Means (DFCM) untuk deteksi topik dari corpus dokumen publikasi ilmiah menunjukkan bahwa algoritma DFCM menunjukkan kinerja yang baik serta dapat mengungguli kinerja algoritma-algoritma standar yang banyak dipakai untuk pendeteksian topik seperti Non-negatif Matrix Factorization (NMF) dan Latent Dirichlet Allocation (LDA) pada corpus dengan ukuran besar. Analisis hasil clustering terhadap data publikasi ilmiah memberikan gambaran perkembangan dan topik-topik yang menjadi “highlight” dalam periode tertentu, mencari research gap dan mengetahui karakteristik penelitian, serta memprediksi topik penelitian apa saja yang menjanjikan di masa depan.

A trend is a recurring pattern, while trend analysis is the practice of collecting and analyzing data to find that pattern. Trend analysis is a method for projecting future conditions based on past to present data. Systematic literature review, bibliometrics, and topic modeling are examples of approaches that are often used to capture the phenomenon of the development of science and technology trends. This study examined and implemented clustering-based topic detection algorithms, combined with qualitative analysis, to comprehensively picture the concept, scientific structure, main topics, and developments in big data technology and smart and sustainable city. The topic analysis is performed on collecting bibliographic data from scientific publications related to these two fields obtained from the Scopus and CORE database. In this research, the deep-autoencoder based on the Fuzzy C-Means (DFCM) algorithm's performance for topic detection from the corpus of scientific publication documents was examined. Based on the experiment's results, it can be concluded that the DFCM algorithm shows good performance and can outperform standard algorithms that are widely used for topic detection, such as Non-negative Matrix Factorization (NMF) and Latent Dirichlet Allocation (LDA) on topic detection tasks in huge corpus text. The clustering results analysis on scientific publication data provides an overview of research topics and developments that become "highlights" in a certain period, discover research gaps and characteristics, and predict what research topics are promising in the future."
Depok: Fakultas Teknik Universitas Indonesia, 2021
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Dewi Holilah
"Penyakit Alzheimer merupakan bentuk umum dari gangguan neurodegeneratif yang ditandai dengan rusaknya sel-sel otak, seperti kusutnya neurofibrillary dan adanya plak amiloid yang bersifat progresif. Salah satu ciri fisik seseorang menderita penyakit Alzheimer adalah adanya penyusutan luas daerah hippocampus pada otak. Hippocampus merupakan bagian terkecil dari otak yang berfungsi menyimpan memori. Deteksi penyakit Alzheimer dapat dilakukan dengan menggunakan Magnetic Resonance Image MRI yang merupakan satu teknik non inovasif untuk analisis struktur otak pada penderita Alzheimer.
Pada penelitian ini, digunakan metode K-Means Clustering dan Watershed untuk mensegmentasi daerah hippocampus yang merupakan salah satu bagian otak yang diserang ketika terkena penyakit Alzheimer. Analisis yang dilakukan untuk mendeteksi Alzheimer, yaitu membandingkan nilai threshold dengan jumlah piksel putih pada citra. Data yang digunakan pada penelitian ini yaitu Open Acess Series of Image Studies OASIS database dengan menggunakan citra potongan koronal. Berdasarkan hasil percobaan, antara metode K-Means Clustering dan Watershed keduanya dapat mensegmentasi daerah hippocampus untuk mendeteksi penyakit Alzheimer.

Alzheimer 39s disease is a common form of neurodegenerative disorders characterized by defective brain cells, such as neurofibrillary tangles and amyloid plaque that is progressive. One of the physical characteristics of someone suffering from Alzheimer 39s disease is shrinking of the hippocampus area of the brain. The hippocampus is the smallest part of the brain that serves to save memory. The detection of Alzheimer 39s disease can be done using a Magnetic Resonance Image MRI which is a technique of non inovasif for an analysis of the structure of the brain in the Alzheimer 39s patient.
In this research, K Means Clustering and Watershed method are used to segment the hippocampus area which is one part of the brain that was attacked by Alzheimer 39s disease. The analysis used to detect Alzheimer 39 s is comparing the value of the threshold with the number of white pixels in the images. The data used in this research are Open Access Series of Image Studies OASIS database by using the image of coronal slice. Based on the our experiment result, both K Means Clustering and Watershed method can segment the samehippocampus area to detect Alzheimers disease.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Farid Prasaja Putera
"ABSTRAK
Peningkatan kualitas citra medis khususnya untuk bagian kepala manusia terus dikembangkan, termasuk dengan pemodelan 3D. Hal ini dilakukan untuk mengurangi kesalahan dalam proses diagnosa dan memfasilitasi pendeteksian tumor otak dengan pendekatan 3D. Dalam prosesnya, citra MRI otak dianalisa secara 3D sehingga diperoleh bagian tumor otak. Citra MRI dikonversi dari citra berformat MINC. Citra diklasifikasi untuk mendeteksi objek menggunakan K-Means Clustering yang akan memisahkan bagian tumor dan otak. Proses filter dilakukan menggunakan Non-Local Means sehingga noise hasil pengolahan dapat berkurang dari proses sebelumnya. Hasil citra pengolahan disegmentasi untuk meningkatkan dan mendukung proses rekonstruksi menggunakan Thresholding. Terakhir adalah merekonstruksi citra dalam bentuk 3D menggunakan metode Marching Cube. Evaluasi akurasi sistem meliputi pengurangan resolusi, pengujian citra normal, uji perbandingan, penggantian format citra dan penambahan noise. Hasil akurasi pendeteksian tumor otak mencapai 100% untuk format PNG dan resolusi 512x512, 97,7% untuk resolusi 256x256, 96,9% untuk citra normal tanpa tumor dan 97,96% berdasarkan perbandingan data olah dengan data referensi. Format PNG memiliki akurasi dibandingkan format JPEG dengan perbedaan sebesar 4%. Pengujian dengan menambahkan noise menghasilkan akurasi 87,6% untuk densitas 0,01, 83,6% untuk 0,05 dan 74,5% untuk 0,09.

ABSTRACT
Medical image enhancement especially for human brain imageries is rapidly developed, including 3D modeling. This research is aimed to reduce the error of diagnosis process and facilitate brain tumor detection using 3D approach. In the process, 3D brain from MRI imageries is analyzed to detect brain tumors. MRI image is converted from MINC format. Then, the image is classified to detect objects using K-Means Clustering to divide each part of brain. Filtering is performed using Non-Local Means to remove noise from previous processes. The result of imageries are segmented to enhance and support reconstruction process using Thresholding. Finally, 3D image reconstruction is performed using Marching Cube method. The accuracy of brain tumor detection is evaluated of resolution reduction, non tumor image testing, comparison testing, modifying image format, and adding noise. The accuracy rate of brain tumor detection is 100% for PNG format and 512x512 resolution, 97,7% for 256x256 resolution, 96,9% for non tumor image and 97,96% for comparison between ideal image and reference data. PNG format has better accuracy with JPEG by 4% improvement. The accuracy of adding noise is 87,6% for 0,01 density, 83,6% for 0,05 and 74,5% for 0,09."
2016
S64517
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>