Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query
cover
Dwi Aji Apriana
Abstrak :
Triclustering merupakan salah satu metode data mining yang juga merupakan pengembangan dari metode biclustering dan clustering. Metode tersebut mengelompokkan set data berupa matriks tiga dimensi (gen, kondisi, dan waktu) menjadi kelompok-kelompok submatriks yang memiliki kesamaan satu sama lain. Salah satu algoritma dari analisis triclustering adalah Extended Dimension Iterative Signature Algorithm (EDISA). Algoritma ini mempertimbangkan jarak Pearson antara tiap gen dan kondisi terhadap vektor rata-rata sebagai ukuran kemiripan. Proses pertama dari EDISA adalah langkah preprocessing yaitu menghapus gen yang memiliki nilai ekspresi gen yang berbeda sangat signifikan dengan nilai ekspresi gen lainnya. Lalu langkah selanjutnya yaitu memilih sebanyak s sampel gen dengan cara memilih satu gen secara random untuk menjadi seed gen, lalu mencari sebanyak s-1 gen yang memiliki jarak Pearson terdekat dengan seed gen tersebut. Tahap berikutnya membuat vektor bobot gen dan kondisi, lalu memasangkannya dengan sampel gen yang telah terpilih, kemudian menghitung vektor rata-ratanya. Proses selanjutnya yaitu proses iterasi di mana setiap gen dan kondisi yang memiliki jarak Pearson terhadap vektor rata-rata di atas ambang batas tertentu (TG dan TG, keduanya merupakan ukuran seberapa baik keselarasan suatu gen dan kondisi terhadap rata-rata kandidat tricluster) harus dihapus karena dianggap tidak memiliki kemiripan yang cukup dengan anggota tricluster lain pada setiap iterasinya. Proses selanjutnya adalah postprocessing yang bertujuan untuk menggabungkan tricluster yang memiliki kemiripan untuk dijadikan tricluster yang lebih besar dan dijadikan sebagai kumpulan tricluster final. Algoritma ini diterapkan pada data ekspresi gen penyakit paru-paru. Penerapan algoritma tersebut menggunakan beberapa skenario dengan nilai Tg dan TG yang berbeda. Hasil dari penerapan pada data ekspresi gen penyakit paru-paru diperoleh bahwa semakin besar nilai TG, maka jumlah gen yang dapat masuk ke dalam tricluster makin banyak, dan semakin besar nilai TG, maka jumlah kondisi yang dapat masuk ke dalam tricluster juga makin banyak. Selain itu, dilakukan evaluasi dari tricluster menggunakan nilai Tricluster Diffusion Score (TD Score) untuk mencari skenario terbaik. Didapat bahwa skenario terbaik merupakan skenario dengan nilai Tg=0,3 dan nilai TG=0,2. Melalui algoritma ini dapat dideteksi gen-gen yang dapat membedakan karakteristik pasien yang berpenyakit paru-paru dan pasien yang sehat.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Akira Andriani
Abstrak :
Analisis clustering merupakan proses pengelompokan yang bertujuan untuk menemukan kelompok atau cluster yang didalamnya memiliki karakteristik yang serupa. Seiring berjalannya waktu, teknik clustering berkembang menjadi biclustering dan triclustering, di mana dalam triclustering data yang digunakan adalah data tiga dimensi. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara bersamaan yang nantinya kelompok yang dihasilkan disebut dengan tricluster. Pada penelitian ini, digunakan metode Fuzzy Cuckoo Search (FCS) untuk mengimplementasikan triclustering pada data ekspresi gen tiga dimensi. FCS mengaplikasikan konsep Fuzzy C-Means (FCM) ke dalam algoritma cuckoo search. Penggunaan fungsi objektif FCM dalam FCS dapat mengatasi ketidakjelasan (uncertainty) dalam data, khususnya pada data ekspresi gen. Dalam metode cuckoo search, pencarian ‘solusi’ tricluster digambarkan dengan spesies cuckoo yang meletakkan telur di sarang burung lain. Berbeda dengan cuckoo search pada umumnya yang menggunakan metode random walk levy flight untuk pencarian solusi, pada penelitian ini, digunakan metode lain, yaitu metode random walk distribusi gaussian, di mana hal tersebut merupakan sebuah kebaruan dalam penelitian ini. Cuckoo search dalam metode FCS merupakan metode metaheuristik, sehingga dapat digunakan dalam berbagai masalah analisis data, termasuk data ekspresi gen. Metode FCS berdasarkan distribusi gaussian diimplementasikan pada data ekspresi gen tiga dimensi dari gen otot rangka yang diberi infus IL-6, di mana ekspresi gen diamati pada 3 subjek dan 3 titik waktu yang berbeda. Metode ini dievaluasi menggunakan ukuran evaluasi Triclustering Quality Index (TQI). Dari skenario yang dilakukan, metode FCS memberikan hasil terbaik dengan rata-rata TQI terendah ketika menggunakan nilai gaussian dan probabilitas . Hasil implementasi metode FCS menunjukkan 4 tricluster yang diduga sebagai kumpulan gen yang berekspresi atas respon dari IL-6. Kelompok gen yang diperoleh dari tricluster dapat digunakan sebagai target oleh ahli medis dalam pengembangan di bidang pengobatan penyakit seperti kanker, diabetes, paru-paru, atau gagal jantung yang menargetkan gen-gen dalam kelompok tricluster tersebut. ......Clustering analysis is a grouping process that aims to find clusters such that objects in the same clusters have similar characteristics. Over time, clustering developed into biclustering and triclustering, wherein triclustering use three-dimensional dataset. Triclustering is able to group these three dimensions simultaneously and form groups called tricluster. This study used the Fuzzy Cuckoo Search (FCS) method to implement triclustering on three-dimensional gene expression data. FCS applies the Fuzzy C-means (FCM) concept to the cuckoo search algorithm. The use of the objective function of FCM in FCS can overcome the uncertainty in the data, especially in gene expression data. In the cuckoo search, finding the tricluster is described with cuckoo species laying their egg in the nests of other birds. The egg laid on the nest represents a 'solution' which is an update of the tricluster from the previous tricluster. Unlike cuckoo search in general, in this study, to find the tricluster solutions, it use gaussian random walk instead of levy flight random walk. Cuckoo search in the FCS method is a metaheuristic method, so it can be used in various data analysis problems, including gene expression data. FCS based on Gaussian distribution was implemented on three-dimensional gene expression data of skeletal muscle genes given IL-6 infusion, where the gene expression was observed in 3 subjects and 3 different time points. Of the 36 simulations performed, the FCS method gives the best results with the lowest average TQI when using gaussian values and probability . This method was evaluated using the Triclustering Quality Index (TQI) evaluation measure. The result of the implementation of FCS shows 4 triclusters which were suspected to be a collection of genes that change in response to IL-6. The gene groups obtained from the tricluster can be used as a consideration by medical professionals in the development of the treatment of diseases such as cancer, diabetes, pulmonary disease, or heart failure that target the genes in the tricluster group.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dea Siska
Abstrak :
Metode triclustering merupakan pengembangan dari metode clustering dan biclustering. Berbeda dengan  metode clustering dan biclustering yang bekerja pada data dua dimensi, triclustering bekerja pada data tiga dimensi yang disusun dalam bentuk matriks. Matriks ini terdiri dari dimensi observasi, atribut, dan konteks. Triclustering mampu mengelompokkan ketiga dimensi tersebut secara simultan dan membentuk kelompok berupa subruang yang disebut tricluster. Metode ini umumnya diimplementasikan dalam bidang bioinformatika, terkhususnya dalam analisis data ekspresi gen tiga dimensi untuk menemukan profil ekspresi gen. Data atau matriks ini terdiri dari dimensi gen, kondisi eksperimen, dan waktu eksperimen (time point). Salah satu algoritma triclustering, yaitu Order Preserving Triclustering (OPTricluster), adalah algoritma yang menggunakan pendekatan pattern based dan digunakan untuk menganalisis data ekspresi gen tiga dimensi yang merupakan short time series 3-8 time point). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan ekspresi yang sama di sepanjang time points pada sejumlah kondisi eksperimen. Dalam penelitian ini, OPTricluster diimplementasikan pada data ekspresi gen sejumlah pasien yellow fever pasca vaksinasi dengan beberapa skenario yang menggunakan threshold yang berbeda-beda. Skenario dengan threshold yang optimum ditunjukkan oleh rata-rata skor Tricluster Diffusion terendah. Tricluster-tricluster yang dihasilkan berhasil menunjukkan hubungan biologis di antara pasien-pasien tersebut, di mana vaksin cenderung memberikan reaksi yang lebih signifikan pada pasien pria dibandingkan pasien wanita. Selain itu, ditemukan anomali pada pasien-pasien tersebut.
Triclustering method is the development of clustering method and biclustering method. Unlike clustering and biclustering that works on two-dimensional data, triclustering works on three-dimensional data that arranged in the form of a matrix consisting of observations, attributes, and contexts dimensions. Triclustering is able to group these dimensions simultaneously and form a subspace called a tricluster. This method is generally implemented in analysis of three-dimensional gene expression data to find profiles of gene expression. This data or matrix consists of genes, experimental conditions and time points dimensions. One of the triclustering algorithms, Order Preserving Triclustering (OPTricluster), is an algorithm that uses a pattern-based approach and used to analyze short time series data (3-8 time points). The OPTricluster forms the tricluster by identifying genes that have the same expression change across time points under a number of experimental conditions. The change in expression is expressed in a rank pattern which is divided based on three types of patterns, namely constant, conserved and divergent patterns. In this study, OPTricluster was implemented in gene expression data of yellow fever patients after vaccination using several scenarios with different thresholds. The scenario with the optimum threshold is indicated by the lowest average Tricluster Diffusion score. The resulting triclusters were successful in showing biological relationships among these patients, where the vaccine tending to have a more significant reaction in male patients than in female patients. In addition, anomalies were found in these patients.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Almaira Nabila Ayudhiya
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library