Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 6 dokumen yang sesuai dengan query
cover
Ika Marta Sari
Abstrak :

Analisis triclustering merupakan pengembangan dari analisis clustering dan analisis biclustering. Tujuan dari analisis triclustering yaitu mengelompokkan data tiga dimensi secara simultan atau bersamaan. Data tiga dimensi tersebut dapat berupa observasi, atribut, dan konteks. Salah satu pendekatan yang digunakan dalam analisis triclustering, yaitu pendekatan berdasarkan pattern contohnya, adalah metode Timesvector. Metode Timesvector bertujuan untuk mengelompokkan matriks data yang menunjukkan pola yang sama atau berbeda pada data tiga dimensi. Metode Timesvector memiliki langkah kerja yang dimulai dengan mereduksi matriks data tiga dimensi menjadi matriks data dua dimensi untuk mengurangi kompleksitas dalam pengelompokkan. Pada metode ini akan digunakan algoritma Spherical K-means dalam pengelompokkannya. Tahap selanjutnya, yaitu mengidentifikasi pola dari cluster yang dihasilkan pada Spherical K-means. Pola yang dimaksud terdiri dari tiga jenis, yaitu DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), dan SEP (Similarly Expressed Pattern). Penerapan dari metode Timesvector dilakukan pada data ekspresi gen yaitu data tumor otak yang dilakukan dalam 6 skenario. Masing-masing skenario menggunakan banyak cluster yang sama tetapi nilai threshold yang berbeda-beda. Hasil dari ke enam skenario akan divalidasi menggunakan nilai coverage dan nilai tricluster diffusion (TD). Hasil penerapan metode timesvector menunjukkan bahwa dengan menggunakan threshold sebesar 1,5 memberikan hasil yang paling optimal karena memiliki nilai coverage yang tinggi sebesar 57% dan nilai TD yang rendah sebesar 2,95594E-06. Nilai coverage yang tinggi menunjukkan kemampuan metode dalam mengekstrak data dan nilai TD yang rendah menunjukkan bahwa tricluster yang dihasilkan memiliki volume yang besar dan koherensi yang tinggi. Berdasarkan pola yang dihasilkan menggunakan skenario yang optimal diperoleh sebanyak 49 ODEP cluster dengan pasien ke-empat selalu memiliki pola ekspresi yang berbeda dibandingkan dengan pasien lainya.  Hal ini dapat digunakan oleh ahli medis untuk melakukan tindakan selanjutnya terhadap pasien tumor otak.

 


Triclustering analysis is the development of clustering analysis and biclustering analysis. The purpose of triclustering analysis is to group three-dimensional data simultaneously or simultaneously. The three-dimensional data can be in the form of observations, attributes, and context. One of the approaches used in triclustering analysis, namely an approach based on a pattern, for example, is the Timesvector method. Timesvector method aims to group data matrices that show the same or different patterns in three-dimensional data. The Timesvector method has a work step that starts with reducing the three-dimensional data matrix to a two-dimensional data matrix to reduce complexity in a grouping. In this method, the Spherical K-means algorithm will be used in grouping it. The next step is to identify the pattern of the clusters generated in the Spherical K-means. The pattern referred to consists of three types, namely DEP (Differentially Expressed Pattern), ODEP (One Differentially Expressed Pattern), and SEP (Similar Expressed Pattern). The application of the Timesvector method was carried out on gene expression data, namely brain tumor data carried out in 6 scenarios. Each scenario uses the same many clusters but different threshold values. The results of the six scenarios will be validated using the coverage value and the tricluster diffusion (TD) value. The results of applying the timesvector method show that using a threshold of 1.5 gives the most optimal results because it has a high coverage value of 57% and a low TD value of 2.95594E-06. A high coverage value indicates the method's ability to extract data and a low TD value indicates that the resulting tricluster has a large volume and high coherence. Based on the pattern generated using the optimal scenario, there were 49 ODEP clusters with the fourth patient always having a different expression pattern compared to other patients. This can be used by medical experts to perform further action on brain tumor patients.

 

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Wutun, Theresia Bunga Palang
Abstrak :
ABSTRAK

Pada penelitian ini diterapkan algoritma FABIAS (Factor Analysis for Bicluster Acquisition: Sparseness Projection) untuk mendeteksi biomarker penyakit Alzheimer pada dataset berupa 54675 data microarray ekspresi gen penyakit Alzheimer dari 161 sampel. Penelitian ini terdiri dari ekstraksi data dan seleksi gen, ekstraksi bicluster, interpretasi biologis untuk setiap bicluster, dan pendeteksian biomarker penyakit Alzheimer pada dataset yang diteliti. Hasil yang diperoleh dari penelitian ini ditemukan pada 3 daerah otak yakni daerah HIP, daerah PC, dan daerah VCX. Gen-gen biomarker penyakit Alzheimer tersebut antara lain gen BIN1, SORL1, dan CLU. Penemuan tiga gen biomarker penyakit Alzheimer dari beberapa bicluster yang dihasilkan dari penerapan algoritma FABIAS ini membuka kemungkinan adanya gen biomarker penyakit Alzheimer yang baru dari bicluster lain dengan sampel berkondisi sakit.


ABSTRACT


In this research, FABIAS algorithm (Factor Analysis for Bicluster Acquisition: Sparseness Projection) was applied to detect biomarkers of Alzheimer`s Disease in a dataset of 54.675 gene expression microarray data from 161 samples. This study consisted of data extraction and gene selection, bicluster extraction, biological interpretation of each bicluster, and biomarker detection of Alzheimer`s disease in the dataset. The results obtained from this study were found in 3 brain regions namely the HIP area, PC area, and VCX area. The biomarker of Alzheimer`s disease include BIN1, SORL1, and CLU genes. The discovery of three biomarker genes from some biclusters resulting from implementation of the FABIAS algorithm opens up the possibility of finding new Alzheimer`s disease biomarker gene from other bicluster with sick condition samples.

2019
T53941
UI - Tesis Membership  Universitas Indonesia Library
cover
Achmad Eriza Aminanto
Abstrak :
Analisis biclustering merupakan pengembangan analisis clustering, dimana analisis biclustering merupakan proses partisi data matriks menjadi sub-matriks berdasarkan baris dan kolom secara simultan. Salah satu metode analisis bicluster yaitu dengan menggunakan model probabilistik, contohnya adalah Plaid model yang dapat memberikan hasil bicluster yang bersifat overlapping. Plaid model, memperhitungkan nilai elemen yang diberikan dari suatu sub-matriks tertentu, sehingga pada analisis biclustering dapat dilihat sebagai jumlah kontribusi atau efek dari bicluster tertentu. Tahapan analisis biclustering dengan plaid model diawali dengan input data berbentuk matriks, kemudian dilakukan penaksiran model awal dan membuat matriks residual dari model tersebut. Kemudian penentuan kandidat bicluster. Kandidat tersebut ditaksir parameter efeknya dan parameter keanggotaan bicluster. Terakhir dilakukan pemangkasan kandidat bicluster tersebut. Implementasi dilakukan pada data matriks ekspresi gen berupa data numerik yaitu data penyakit kanker usus, dimana baris berisikan observasi atau pasien sedangkan kolom berisikan jenis dari gen yang dilakukan dalam 6 skenario. Masing-masing skenario menggunakan parameter model dan nilai threshold berbeda. Validasi hasil implementasi menggunakan indeks Jaccard yaitu kedektahan hasil anggota bicluster dan variansi koherensi. Hasil implementasi menunjukkan penggunaan model yang lebih sederhana yang hanya menggunakan efek mean memberikan variansi koherensi yang lebih tinggi dibandingkan penggunaan model yang berisi mean, efek baris, dan efek kolom dari bicluster.
Biclustering analysis is the development of clustering analysis, which is the process of partitioning matrix data into sub-matrices based on rows and columns simultaneously. One method of bicluster analysis is using probabilistic model, for example the Plaid model that provide overlapping bicluster. Plaid model, calculates the value of an element given from a particular sub-matrix, thus can be seen as number of contributions of particular bicluster. The process begins with matrix data input, then an initial model is assessed and makes a residual matrix from the model. Then determining bicluster candidates. The candidate assessed for its effect parameters and bicluster membership parameters. Finally, the bicluster candidate was prunned. The implementation is carried out on the gene expression matrix data in form of numerical data, namely colon cancer data, where the rows contain observations while the columns contain the types of genes carried out in 6 scenarios. Each scenario uses different model parameters and threshold values. Validation of the implementation results using Jaccard index and coherence variance. Implementation results show that simpler model which only uses mean effect gives higher coherence variance than using model that contains mean, row, and column effect of the bicluster.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gianinna Ardaneswari
Abstrak :
Diabetic Retinopathy merupakan penyakit yang disebabkan oleh komplikasi mikrovaskuler jangka panjang dari pasien Diabetes Melitus. Salah satu bentuk data biologi molekuler yang tengah berkembang pesat saat ini adalah data ekspresi gen pada microarray. Analisis data ekspresi gen dapat dilakukan dengan berbagai cara termasuk pengelompokkan data menggunakan algoritma clustering ataupun biclustering. Salah satu metode untuk menganalisis data ekspresi gen adalah metode Two-Phase Biclustering. Untuk data yang berukuran besar, metode tersebut membutuhkan waktu komputasi yang lama. Penerapan komputasi paralel diperlukan dalam metode Two-Phase Biclustering ini agar waktu komputasi yang dibutuhkan lebih sedikit dan memiliki kinerja yang baik. Dalam tesis ini akan dibahas implementasi paralel pada metode Two-Phase Biclustering, dimana fase pertama menggunakan algoritma paralel K-Means dan fase kedua menggunakan algoritma biclustering Cheng-Church pada data ekspresi gen Diabetic Retinopathy. Dari hasil penelitian kami diperoleh peningkatan kinerja komputasi berupa speed-up sebesar 3,63x pada multicore paralel R dan 34x pada pemrograman manycore paralel CUDA-GPU. ......Diabetic Retinopathy is a disease caused by long term microvascular complications on diabetes mellitus patients. Recently, the microarray gene expression data has been developing rapidly in molecular biology. There are many techniques for gene expression data analysis methods using clustering or biclustering algorithms. One of the effective method for analyzing gene expression data is Two Phase Biclustering method. However for large sized data, the method requires long computation time. Implementation of parallel computing is necessary in Two Phase Biclustering method to reduce the computation time and to obtain a good performance. In this thesis we discuss the implementation of parallel Two Phase biclustering, where in the first phase using parallel K Means algorithm and the second phase using Cheng Church biclustering algorithm on Diabetic Retinopathy gene expression data. In parallel K Means algorithms are applied multicore based parallel R programming and manycore CUDA GPU parallel programming. Parallelization using multicore based parallel R programming achieves an average speed up of 3.63x and using manycore CUDA GPU parallel programming achieves significant performance with an average speed up of 34x.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47269
UI - Tesis Membership  Universitas Indonesia Library
cover
Dea Siska
Abstrak :
Metode triclustering merupakan pengembangan dari metode clustering dan biclustering. Berbeda dengan  metode clustering dan biclustering yang bekerja pada data dua dimensi, triclustering bekerja pada data tiga dimensi yang disusun dalam bentuk matriks. Matriks ini terdiri dari dimensi observasi, atribut, dan konteks. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara simultan dan membentuk kelompok berupa subruang yang disebut tricluster. Metode ini umumnya diimplementasikan dalam bidang bioinformatika, terkhususnya dalam analisis data ekspresi gen tiga dimensi untuk menemukan profil ekspresi gen. Data atau matriks ini terdiri dari dimensi gen, kondisi eksperimen, dan waktu eksperimen (time point). Salah satu algoritma triclustering, yaitu Order Preserving Triclustering (OPTricluster), adalah algoritma yang menggunakan pendekatan pattern based dan digunakan untuk menganalisis data ekspresi gen tiga dimensi yang merupakan short time series 3-8 time point). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan ekspresi yang sama di sepanjang time points pada sejumlah kondisi eksperimen. Dalam penelitian ini, OPTricluster diimplementasikan pada data ekspresi gen sejumlah pasien yellow fever pasca vaksinasi dengan beberapa skenario yang menggunakan threshold yang berbeda-beda. Skenario dengan threshold yang optimum ditunjukkan oleh rata-rata skor Tricluster Diffusion terendah. Tricluster-tricluster yang dihasilkan berhasil menunjukkan hubungan biologis di antara pasien-pasien tersebut, di mana vaksin cenderung memberikan reaksi yang lebih signifikan pada pasien pria dibandingkan pasien wanita. Selain itu, ditemukan anomali pada pasien-pasien tersebut.
Triclustering method is the development of clustering method and biclustering method. Unlike clustering and biclustering that works on two-dimensional data, triclustering works on three-dimensional data that arranged in the form of a matrix consisting of observations, attributes, and contexts dimensions. Triclustering is able to group these dimensions simultaneously and form a subspace called a tricluster. This method is generally implemented in analysis of three-dimensional gene expression data to find profiles of gene expression. This data or matrix consists of genes, experimental conditions and time points dimensions. One of the triclustering algorithms, Order Preserving Triclustering (OPTricluster), is an algorithm that uses a pattern-based approach and used to analyze short time series data (3-8 time points). The OPTricluster forms the tricluster by identifying genes that have the same expression change across time points under a number of experimental conditions. The change in expression is expressed in a rank pattern which is divided based on three types of patterns, namely constant, conserved and divergent patterns. In this study, OPTricluster was implemented in gene expression data of yellow fever patients after vaccination using several scenarios with different thresholds. The scenario with the optimum threshold is indicated by the lowest average Tricluster Diffusion score. The resulting triclusters were successful in showing biological relationships among these patients, where the vaccine tending to have a more significant reaction in male patients than in female patients. In addition, anomalies were found in these patients.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Luthfi Zahiya
Abstrak :

Triclustering merupakan metode unsupervised learning yang bekerja pada data tiga dimensi dengan dimensi-dimensi berupa observasi, atribut, dan konteks. Tujuan dari triclustering adalah untuk membentuk himpunan submatriks yang disebut sebagai tricluster berdasarkan ketiga dimensi pada data yang diberikan. Data tiga dimensi banyak ditemukan dalam bidang biomedis, di mana hal tersebut turut mendorong penggunaan dan pengembangan triclustering untuk keperluan analisis data ekspresi gen di mana salah satu alternatif dimensi-dimensinya adalah gen, sampel, dan waktu (gene, sample, time) dan biasa juga disebut sebagai data GST. Salah satu metode triclustering yang dikembangkan untuk menganalisis data tiga dimensi short time-series adalah Order Preserving Tricluster (OPTricluster). OPTricluster mempertahankan sifat natural dimensi waktu yang berurutan dan mengelompokkan data ke dalam tricluster berdasarkan pola. Penelitian ini mengimplementasikan metode OPTricluster pada data GST biopsi otot rangka pria sehat yang berpuasa selama 24 jam. Tricluster-tricluster yang terbentuk dievaluasi menggunakan nilai Multi Slope Measure (MSL) untuk mengetahui kualitas grafis tricluster. MSL dikembangkan untuk mengevaluasi tricluster berisi data GST dan nilai MSL yang rendah menandakan kualitas tricluster yang baik. Berdasarkan analisis data GST, ditemukan bahwa penggunaan δ=1,7 menghasilkan tricluster pola constant dan divergent terbaik dan penggunaan δ=1,5 menghasilkan tricluster pola conserved terbaik. Namun, tricluster yang terbentuk mengindikasikan bahwa puasa selama 24 jam tidak menyebabkan banyak perubahan nilai ekspresi gen pada otot rangka manusia.


Triclustering is a method of unsupervised learning that runs on three-dimensional data where the dimensions are observation, attribute, and context. The objective of triclustering is to create a set of triclusters based on the three dimensions within the provided data. The abundance of three-dimensional data in the biomedical field is a big factor on the utilization and improvement of triclustering, particularly in the analysis of gene expression data which in it are the dimensions gene, sample, and time or abbreviated as GST data. One of the triclustering method developed to analyze three-dimensional short time-series data is Order Preserving Tricluster (OPTricluster). OPTricluster preserves the natural sequiential properties of the time dimension and organizes data into triclusters based on patterns. This study applies the OPTricluster method on the GST data from muscle biopsies from fasting healthy men. The formed triclusters are evaluated graphically using the Multi Slope Measure (MSL). A small MSL score indicates a good tricluster. Based on the analysis of GST data, δ=1,7 produces the best constant and divergent triclusters and δ=1,5 produces the best conserved triclusters. However, the triclusters formed suggest that fasting for 24 hours doesn’t have a lot of effect on gene expressions in human muscle.

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library