Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Noval Saputra
Abstrak :

Analisis triclustering merupakan teknik analisis pada data 3D (observasi – atribut – konteks). Analisis triclustering dapat mengelompokkan observasi pada beberapa atribut dan konteks secara bersamaan. Analisis triclustering telah sering diterapkan untuk menganalisis data ekspresi gen microarray. Penelitian ini menggunakan metode δ-Trimax untuk melakukan analisis triclustering pada data ekspresi gen microarray. Metode δ-Trimax bertujuan untuk menemukan tricluster yang memiliki mean square residual kecil dari δ dan volume maksimal. Tricluster diperoleh dengan cara melakukan penghapusan node dari data 3D dengan menggunakan algoritma multiple node deletion dan single node deletion. Kandidat tricluster yang telah didapatkan, dilakukan pengecekan  kembali dengan menambahkan beberapa node yang telah dihapus sebelumnya menggunakan algoritma node addition. Pada penelitian ini dilakukan perbaikan program pada metode δ-Trimax dan juga menambahkan penghitungan evaluasi tricluster yang dihasilkan.  Implementasi metode δ-Trimax dilakukan pada data ekspresi gen dari proses diferensiasi human induced pluripoten stem cell (HiPSC) dari pasien penyakit jantung. Ekspresi gen diukur pada 12 titik waktu dan 3 replikasi. Dari beberapa simulasi yang dilakukan, metode δ-Trimax memberikan hasil terbaik ketika δ=0,0068 dan λ=1,2. Berdasarkan tricluster yang dihasilkan dari simulasi terbaik tersebut, dipilih 5 tricluster yang diduga sebagai ciri-ciri penyakit jantung. Lima tricluster ini dapat menjadi pertimbangan bagi ahli medis untuk melakukan tindakan lebih lanjut terhadap pasien.


Triclustering analysis is an analysis technique on 3D data (observation - attribute - context). Triclustering analysis can group observations on several attributes and contexts simultaneously. Triclustering analysis has been frequently applied to analyze microarray gene expression data. This study used the δ-Trimax method to perform triclustering analysis on microarray gene expression data. The δ-Trimax method aims to find a tricluster that has a mean square residual smaller than δ and a maximum volume. Tricluster is obtained by deleting nodes from 3D data using multiple node deletion and single node deletion algorithms. The tricluster candidates that have been obtained are checked again by adding some previously deleted nodes using the node addition algorithm. In this research, the program improvement of the δ-Trimax method was carried out and also the calculation of the resulting tricluster evaluation. The implementation of the δ-Trimax method was carried out on gene expression data from the differentiation process of human induced pluripotent stem cells (HiPSC) from patients with heart disease. Gene expression was measured at 12 time points and 3 replications. From several simulations performed, the δ-Trimax method gives the best results when δ = 0.0068 and λ = 1.2. Based on the tricluster generated from the best simulation, 5 tricluster were selected which were suspected as a characteristic of heart disease. These five tricluster can be a consideration for medical experts to take further action on patients.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Stefany Nurhatika
Abstrak :

Analisis triclustering merupakan pengembangan dari analisis clustering dan biclustering. Analisis triclustering bertujuan mengelompokkan data tiga dimensi secara simultan yang menghasilkan submatriks dinamakan tricluster. Pendekatan yang digunakan dalam analisis triclustering di antaranya adalah pendekatan berdasarkan greedy dan pattern. Salah satu contoh pendekatan analisis triclustering berdasarkan greedy adalah metode  Î´ – Trimax. Sedangkan salah satu contoh analisis triclustering berdasarkan pattern adalah metode Timesvector. Metode δ – Trimax bertujuan menghasilkan tricluster yang memiliki mean square residual kecil dari threshold  dengan volume data tricluster yang maksimal. Metode Timesvector bertujuan mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Implementasi metode  Î´ – Trimax dan metode Timesvector pada penelitian ini dilakukan pada data ekspresi gen pasien penderita penyakit periodontitis. Ekspresi gen diukur pada 14 titik kondisi dan 4 titik waktu. Berdasarkan beberapa skenario yang telah diterapkan, metode Î´ – Trimax memberikan hasil terbaik pada saat menerapkan skenario dengan nilai threshold =0,0028564 dan =1,25 dengan jumlah tricluster yang dihasilkan adalah 260 tricluster. Dari 260 tricluster tersebut, dipilih tricluster ke-216 yang dianalisis dengan menggunakan metode Timesvector. Hasil tricluster yang diperoleh dapat menambah wawasan bagi ahli medis dalam memberikan periodontal treatment kepada pasien penderita periodontitis berikutnya. ......Triclustering analysis is the development of clustering and biclustering. Triclustering analysis aims to group three-dimensional data simultaneously, forming the initial subspace known as a tricluster. It utilizes two main approaches that are greedy-based and pattern-based approaches, exemplified by the δ – Trimax and Timesvector methods, respectively. The δ – Trimax method aims for triclusters with smaller mean square residuals than the threshold δ, while Timesvector groups data matrices with similar or different patterns. In a study on periodontitis patients gene expression data, comprising 14 condition points and 4 time points, both methods were implemented. The δ – Trimax method yielded optimal results under specific conditions (δ = 0.0028564, λ = 1.25), producing 260 triclusters. Among these, the 216th tricluster was selected for further analysis using the Timesvector method. The insights gained from these triclusters can enhance periodontal treatment strategies for patients with subsequent periodontitis, providing valuable guidance to medical experts.

 

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
cover
Teguh Saputra
Abstrak :

Analisis triclustering merupakan teknik yang mampu mengelompokkan data 3 dimensi secara bersamaan, sehingga dapat diperoleh sub-ruang dari data 3D yang terdiri dari subset observasi (gen), subset kondisi (kondisi) dan subset konteks (waktu). Analisis triclustering  yang  dilakukan  pada  penelitian  ini  yaitu  metode delta-Trimax melalui pendekatan   two-way   K-means.   Tujuan   dari   metode delta-Trimax yaitu menemukan tricluster yang memiliki nilai minimum dari three-dimensial mean square residual (𝑆3) dan volume maksimum. Pendekatan two-way K-means digunakan untuk membentuk suatu populasi awal agar dapat mengurangi beban komputasi dan membantu membentuk tricluster yang lebih baik. Metode ini akan diimplementasikan pada data ekspresi gen kultur HAE (Human Airway Epithelial) yang terinfeksi virus SARS-CoV, SARS-dORF6, SARS-BatSRBD, dan H1N1. Implementasi dilakukan dengan 9 simulasi dan diperoleh simulasi terbaik dengan nilai threshold dari perhitungan MSR sebesar 0.0435, threshold  = 1.7 dan sebanyak 24 tricluster terbentuk berdasarkan penilain triclustering quality index (TQI). Dari himpunan tricluster tersebut diperoleh informasi mengenai perbandingan pola ekspresi gen pada virus SARS-CoV, SARS-dORF6, SARS-BatSRBD dengan virus influenza H1N1. Terdapat 7 tricluster yang memiliki kesamaan pola ekspresi gen di setiap kondisi dan 8 tricluster yang diduga memiliki perbedaan kondisi antara setiap variasi virus SARS- CoV dengan virus influenza H1N1. Pada tricluster lainnya juga diperoleh informasi hanya beberapa variasi Sars-CoV yang memiliki kesamaan satu sama lain dan juga kesamaan atau perbedaan dengan H1N1. Berdasarkan titik waktu diperoleh 3 tricluster tidak memberikan efek karena pola ekspresi gen tiap waktu sama dengan kondisi awal yaitu titik waktu ke-1 dan 17 tricluster diduga memberikan efek paska infeksi. Untuk menilai kualitas hasil tricluster terbentuk dalam penggambaran fungsi biologis dari kumpulan gen pada tricluster dilakukan evaluasi gene ontology (GO). GO adalah sebuah sistem untuk menggambarkan fungsi, biological process, celluler componet gen dan moleculer function dalam berbagai organisme. Dari hasil evaluasi diperoleh sebanyak 20 tricluster yang memiliki keterlibatan dan kaitan kuat dengan setiap konsep GO. Sebanyak 3 tricluster hanya memiliki keterlibatan atau kaitan pada salah satu aspek GO dan 1 tricluster yang memiliki keterlibatan pada semua aspek GO namun hanya pada aspek celuller componet yang memiliki kaitan kuat. Hal ini dapat menjadi acuan bagi peneliti bidang biologi untuk memfokuskan penelitian lebih lanjut dalam pemahaman fungsi biologis pada himpunan tricluster yang memiliki keterlibatan dan kaitan kuat.


Triclustering analysis is a technique capable of clustering three-dimensional data simultaneously, thus obtaining subspaces of the 3D data consisting of subsets of observations (genes), attribute subsets (conditions), and context subsets (time). The triclustering analysis conducted in this research utilizes the δ-Trimax method through a two-way K-means approach. The goal of the δ-Trimax method is to find triclusters that have minimum values of three-dimensional mean square residu MSR_3D and maximum volume. The two-way K-means approach is used to form an initial population to reduce computational burden and aid in forming better triclusters. This method will be implemented on gene expression data from HAE (Human Airway Epithelial) cultures infected with SARS-CoV, SARS-dORF6, SARS-BatSRBD, and H1N1 viruses. The implementation is carried out through 9 simulations, and the best simulation is obtained with a threshold value of δ calculated from MSR of 0.0435, a threshold value of λ=1.7, resulting in 24 formed triclusters based on the triclustering quality index (TQI) assessment. From the set of triclusters, information regarding the comparison of gene expression patterns between SARS-CoV, SARS-dORF6, SARS-BatSRBD viruses and H1N1 influenza virus is obtained. There are 7 triclusters that exhibit similar gene expression patterns across all conditions, and 8 triclusters that are suspected to have condition differences between various SARS-CoV viruses and the H1N1 virus. Other triclusters also provide information where only certain SARS-CoV variations share similarities with each other or similarities or differences with H1N1. Based on the time points, 3 triclusters show no effect as their gene expression patterns remain the same as the initial condition (time point 1), while 17 triclusters are suspected to have post- infection effects. To assess the quality of the formed triclusters in terms of biological function representation of the gene sets within the triclusters, an evaluation of gene ontology (GO) is performed. GO is a system for describing the functions, biological processes, cellular components, and molecular functions of genes across various organisms. The evaluation method involves the Database for Annotation, Visualization, and Integrated Discovery (DAVID) in calculating p-values. The evaluation results reveal that 20 triclusters have strong involvement and correlation with each GO concept. Three triclusters only exhibit involvement or correlation in one specific aspect of GO, and one tricluster exhibits involvement in all GO aspects, but with a strong correlation only in the cellular component aspect. This information can serve as a reference for researchers in the field of biology to focus further research on understanding the biological functions within tricluster sets that have strong involvement and correlation.

Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Teguh Saputra
Abstrak :

Analisis triclustering merupakan teknik yang mampu mengelompokkan data 3 dimensi secara bersamaan, sehingga dapat diperoleh sub-ruang dari data 3D yang terdiri dari subset observasi (gen), subset kondisi (kondisi) dan subset konteks (waktu). Analisis triclustering  yang  dilakukan  pada  penelitian  ini  yaitu  metode delta-Trimax melalui pendekatan   two-way   K-means.   Tujuan   dari   metode delta-Trimax yaitu menemukan tricluster yang memiliki nilai minimum dari three-dimensial mean square residual (𝑆3) dan volume maksimum. Pendekatan two-way K-means digunakan untuk membentuk suatu populasi awal agar dapat mengurangi beban komputasi dan membantu membentuk tricluster yang lebih baik. Metode ini akan diimplementasikan pada data ekspresi gen kultur HAE (Human Airway Epithelial) yang terinfeksi virus SARS-CoV, SARS-dORF6, SARS-BatSRBD, dan H1N1. Implementasi dilakukan dengan 9 simulasi dan diperoleh simulasi terbaik dengan nilai threshold dari perhitungan MSR sebesar 0.0435, threshold  = 1.7 dan sebanyak 24 tricluster terbentuk berdasarkan penilain triclustering quality index (TQI). Dari himpunan tricluster tersebut diperoleh informasi mengenai perbandingan pola ekspresi gen pada virus SARS-CoV, SARS-dORF6, SARS-BatSRBD dengan virus influenza H1N1. Terdapat 7 tricluster yang memiliki kesamaan pola ekspresi gen di setiap kondisi dan 8 tricluster yang diduga memiliki perbedaan kondisi antara setiap variasi virus SARS- CoV dengan virus influenza H1N1. Pada tricluster lainnya juga diperoleh informasi hanya beberapa variasi Sars-CoV yang memiliki kesamaan satu sama lain dan juga kesamaan atau perbedaan dengan H1N1. Berdasarkan titik waktu diperoleh 3 tricluster tidak memberikan efek karena pola ekspresi gen tiap waktu sama dengan kondisi awal yaitu titik waktu ke-1 dan 17 tricluster diduga memberikan efek paska infeksi. Untuk menilai kualitas hasil tricluster terbentuk dalam penggambaran fungsi biologis dari kumpulan gen pada tricluster dilakukan evaluasi gene ontology (GO). GO adalah sebuah sistem untuk menggambarkan fungsi, biological process, celluler componet gen dan moleculer function dalam berbagai organisme. Dari hasil evaluasi diperoleh sebanyak 20 tricluster yang memiliki keterlibatan dan kaitan kuat dengan setiap konsep GO. Sebanyak 3 tricluster hanya memiliki keterlibatan atau kaitan pada salah satu aspek GO dan 1 tricluster yang memiliki keterlibatan pada semua aspek GO namun hanya pada aspek celuller componet yang memiliki kaitan kuat. Hal ini dapat menjadi acuan bagi peneliti bidang biologi untuk memfokuskan penelitian lebih lanjut dalam pemahaman fungsi biologis pada himpunan tricluster yang memiliki keterlibatan dan kaitan kuat.


Triclustering analysis is a technique capable of clustering three-dimensional data simultaneously, thus obtaining subspaces of the 3D data consisting of subsets of observations (genes), attribute subsets (conditions), and context subsets (time). The triclustering analysis conducted in this research utilizes the δ-Trimax method through a two-way K-means approach. The goal of the δ-Trimax method is to find triclusters that have minimum values of three-dimensional mean square residu MSR_3D and maximum volume. The two-way K-means approach is used to form an initial population to reduce computational burden and aid in forming better triclusters. This method will be implemented on gene expression data from HAE (Human Airway Epithelial) cultures infected with SARS-CoV, SARS-dORF6, SARS-BatSRBD, and H1N1 viruses. The implementation is carried out through 9 simulations, and the best simulation is obtained with a threshold value of δ calculated from MSR of 0.0435, a threshold value of λ=1.7, resulting in 24 formed triclusters based on the triclustering quality index (TQI) assessment. From the set of triclusters, information regarding the comparison of gene expression patterns between SARS-CoV, SARS-dORF6, SARS-BatSRBD viruses and H1N1 influenza virus is obtained. There are 7 triclusters that exhibit similar gene expression patterns across all conditions, and 8 triclusters that are suspected to have condition differences between various SARS-CoV viruses and the H1N1 virus. Other triclusters also provide information where only certain SARS-CoV variations share similarities with each other or similarities or differences with H1N1. Based on the time points, 3 triclusters show no effect as their gene expression patterns remain the same as the initial condition (time point 1), while 17 triclusters are suspected to have post- infection effects. To assess the quality of the formed triclusters in terms of biological function representation of the gene sets within the triclusters, an evaluation of gene ontology (GO) is performed. GO is a system for describing the functions, biological processes, cellular components, and molecular functions of genes across various organisms. The evaluation method involves the Database for Annotation, Visualization, and Integrated Discovery (DAVID) in calculating p-values. The evaluation results reveal that 20 triclusters have strong involvement and correlation with each GO concept. Three triclusters only exhibit involvement or correlation in one specific aspect of GO, and one tricluster exhibits involvement in all GO aspects, but with a strong correlation only in the cellular component aspect. This information can serve as a reference for researchers in the field of biology to focus further research on understanding the biological functions within tricluster sets that have strong involvement and correlation.

Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library