Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 46930 dokumen yang sesuai dengan query
cover
"This book focuses on the analysis of dose-response microarray data in pharmaceutical settings, the goal being to cover this important topic for early drug development experiments and to provide user-friendly R packages that can be used to analyze this data. It is intended for biostatisticians and bioinformaticians in the pharmaceutical industry, biologists, and biostatistics/bioinformatics graduate students.
Part I of the book is an introduction, in which we discuss the dose-response setting and the problem of estimating normal means under order restrictions. In particular, we discuss the pooled-adjacent-violator (PAV) algorithm and isotonic regression, as well as inference under order restrictions and non-linear parametric models, which are used in the second part of the book. Part II is the core of the book, in which we focus on the analysis of dose-response microarray data. All methodological issues in the book are illustrated using real-world examples of dose-response microarray datasets from early drug development experiments."
Berlin: Springer, 2012
e20420490
eBooks  Universitas Indonesia Library
cover
Nurul Hanifah
"Diagnosis kanker payudara umum menggunakan data morfologi dan infomasi klinis. Akan tetapi diagnosis kanker yang akurat dibutuhkan untuk menangani dan terapi yang tepat. Deteksi ekspresi gen merupakan cara yang dapat digunakan untuk menganalisis kanker hingga tingkat molekuler. Microarray adalah teknologi yang memungkinkan analisis ribuan ekspresi gen dalam waktu yang bersamaan. Pembelajaran mesin dapat digunakan untuk menganalisis pola pada microarray dataset. Model pembelajan dengan deep learning, seperti deep stacking network DSN diperlukan untuk data yang kompleks seperti pada microarray. DSN pertama kali diusulkan untuk mengatasi kekurangan dari deep learning pada umumnya. Selain itu dikarenakan tingginya dimensi data microarray, sebelum melalui proses pembelajaran diperlukan reduksi dimensi pada data microarray. Reduksi data menggunakan gene shaving, dimana data akan dikelompokan menjadi beberapa cluster dan juga dengan PCA. Selanjutnya data yang sudah direduksi melalui proses pembelajaran pada model DSN yang terdiri dari 2-layer, 3-layer dan 4-layer dengan laju pembelajaran 0.01, 0.1 dan 1.0. Parameter yang diukur adalah nilai akurasi, mean square error MSE dan waktu eksekusi, dimana nilai terbaik didapatkan pada DSN 2-layer dengan laju pembelajaran 1.0 pada data hasil reduksi PCA.

The diagnosis of breast cancer uses morphological data and clinical information. However, an accurate cancer diagnosis is necessary for the proper treatment. Gene expression detection is a way that can be used to analyze cancer to the molecular level. Microarray is a technology that allows the analysis of thousands of gene expression at the same time. Machine learning can be used to analyze patterns in the microarray dataset. Machine learning with deep architecture deep learning, such as deep stacking learning DSN, is needed for complex data such as microarray. DSN was proposed to overcome the shortage of deep learning. In addition, due to the high dimension of microarray data, dimension reduction in microarray data is required before going through the learning process. Data reduction uses gene shaving, where data will be grouped into clusters and also PCA. Clusters found through the process of gene shaving is a cluster that carries important genetic information in cancer cells so that the gene can represent all data. Furthermore, the data has been reduced going through the learning process on the DSN model consisting of 2 layer, 3 layer and 4 layer with the learning rate of 0.01, 0.1 and 1.0. The parameters measured are the accuracy, mean square error MSE and execution time, which the best value is obtained on 2 layer DSN with learning rate 1.0 on data from the reduction of PCA."
Depok: Fakultas Teknik Universitas Indonesia, 2018
T50170
UI - Tesis Membership  Universitas Indonesia Library
cover
Nyoman Arda Wibawa
"Penelitian ini bertujuan untuk mencari gen terdiferensiasi dan informasi biologis dari data ekspresi gen penyakit Alzheimer. Data yang digunakan merupakan data microarray penyakit Alzheimer yang berukuran 54675 peobes × 161 sampel. Data tersebut diperoleh dari National Centre for Biotechnology Information (NCBI) yang dapat diakses melalui laman: http://www.ncbi/nlm.nih.gov/. Gen yang memiliki ekspresi terdiferensiasi diseleksi menggunakan algoritma Delta Relative Deviation dan Absolute Deviation (DARDAD). 7089 gen dengan ekspresi terdiferensiasi pada sampel sakit selanjutnya dianalisis menggunakan metode biclustering. Bicluster didapatkan dengan menggunakan model BicMix yang memodelkan matriks ekspresi gen sebagai perkalian dua parameter ditambah matriks eror. Hasil faktorisasi dari Singular Value Decomposition (SVD) digunakan untuk menginisialisasi proses estimasi parameter model BicMix menggunakan metode iteratif Variational Expectation Maximization (VEM). Hasil bicluster selanjutnya dianalisis menggunakan Gene Ontology dan Disease Ontology. Didapatkan 30 bicluster dan beberapa penyakit yang berkaitan dengan penyakit Alzheimer.

The purpose of this research is to find genes that differentially expressed and biologic information from Alzheimer's gene expression data. Microarray data of Alzheimer's disease with 54675 probes × 161 samples were used in this research. Data downloaded from National Centre for Biotechnology Information (NCBI), http://www.ncbi/nlm.nih.gov/. Delta Relative Deviation and Absolute Deviation (DARDAD) were used to find differentially expressed genes. 7089 differentially expressed genes then analyzed using biclustering method with BicMix model. BicMix modeled gene expression matrix data as multiplication two parameters and an error matrix. Parameters in the model estimated using Singular Value Decomposition (SVD) - Variational Expectation Expectation Maximization (VEM). Bicluster result then analyzed using Gene Ontology and Disease Ontology. Result of this research are 30 biclusters and disease that are active in Alzheimer.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
T54494
UI - Tesis Membership  Universitas Indonesia Library
cover
Noval Saputra
"

Analisis triclustering merupakan teknik analisis pada data 3D (observasi – atribut – konteks). Analisis triclustering dapat mengelompokkan observasi pada beberapa atribut dan konteks secara bersamaan. Analisis triclustering telah sering diterapkan untuk menganalisis data ekspresi gen microarray. Penelitian ini menggunakan metode δ-Trimax untuk melakukan analisis triclustering pada data ekspresi gen microarray. Metode δ-Trimax bertujuan untuk menemukan tricluster yang memiliki mean square residual kecil dari δ dan volume maksimal. Tricluster diperoleh dengan cara melakukan penghapusan node dari data 3D dengan menggunakan algoritma multiple node deletion dan single node deletion. Kandidat tricluster yang telah didapatkan, dilakukan pengecekan  kembali dengan menambahkan beberapa node yang telah dihapus sebelumnya menggunakan algoritma node addition. Pada penelitian ini dilakukan perbaikan program pada metode δ-Trimax dan juga menambahkan penghitungan evaluasi tricluster yang dihasilkan.  Implementasi metode δ-Trimax dilakukan pada data ekspresi gen dari proses diferensiasi human induced pluripoten stem cell (HiPSC) dari pasien penyakit jantung. Ekspresi gen diukur pada 12 titik waktu dan 3 replikasi. Dari beberapa simulasi yang dilakukan, metode δ-Trimax memberikan hasil terbaik ketika δ=0,0068 dan λ=1,2. Berdasarkan tricluster yang dihasilkan dari simulasi terbaik tersebut, dipilih 5 tricluster yang diduga sebagai ciri-ciri penyakit jantung. Lima tricluster ini dapat menjadi pertimbangan bagi ahli medis untuk melakukan tindakan lebih lanjut terhadap pasien.


Triclustering analysis is an analysis technique on 3D data (observation - attribute - context). Triclustering analysis can group observations on several attributes and contexts simultaneously. Triclustering analysis has been frequently applied to analyze microarray gene expression data. This study used the δ-Trimax method to perform triclustering analysis on microarray gene expression data. The δ-Trimax method aims to find a tricluster that has a mean square residual smaller than δ and a maximum volume. Tricluster is obtained by deleting nodes from 3D data using multiple node deletion and single node deletion algorithms. The tricluster candidates that have been obtained are checked again by adding some previously deleted nodes using the node addition algorithm. In this research, the program improvement of the δ-Trimax method was carried out and also the calculation of the resulting tricluster evaluation. The implementation of the δ-Trimax method was carried out on gene expression data from the differentiation process of human induced pluripotent stem cells (HiPSC) from patients with heart disease. Gene expression was measured at 12 time points and 3 replications. From several simulations performed, the δ-Trimax method gives the best results when δ = 0.0068 and λ = 1.2. Based on the tricluster generated from the best simulation, 5 tricluster were selected which were suspected as a characteristic of heart disease. These five tricluster can be a consideration for medical experts to take further action on patients.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Hendy Fergus Atheri Hura
"ABSTRAK
Penelitian ini mengimplementasikan metode spectral clustering-Fuzzy C-Means pada tiga microarray data ekspresi gen, dengan tujuan untuk mengelompokkan gen-gen yang memiliki tingkat ekspresi yang similar. Spectral clustering secara teoritis terdiri dari tiga tahap utama yaitu: membangun matriks jarak, membentuk matriks Laplacian, dan proses partisi, khususnya dalam tesis ini menggunakan algoritma partisi Fuzzy C-Means. Oleh karena itu, implementasi dari spectral clustering-FCM lebih sederhana dan intuitif pada pelaksanaannya. Analisis cluster singkat juga akan dipaparkan untuk masing-masing microarray data yang digunakan yaitu: Carcinoma, Leukemia, dan Lymphoma. Hasil cluster yang sangat baik didapatkan, sehingga metode yang diusulkan memiliki potensi besar ke depannya dalam penelitan pada bidang medis.

ABSTRACT
This research implements the spectral clustering FCM method on three microarray gene expression data, with the aim of grouping genes with similar expression levels. Spectral clustering is theoretically composed of three main stages building distance matrix, forming Laplacian matrix, and partitioning process, especially in this thesis using Fuzzy C Means partition algorithm. Therefore, the implementation of spectral clustering FCM is simpler and more intuitive in its implementation. Brief cluster analysis will also be presented for each microarray data used Carcinoma, Leukemia, and Lymphoma. Excellent cluster results are obtained, so the proposed method has great potential for future research in the medical field. "
2017
T48274
UI - Tesis Membership  Universitas Indonesia Library
cover
Frisca
"Spectral clustering adalah salah satu algoritma clustering modern yang paling terkenal. Sebagai teknik clustering yang efektif, metode spectral clustering muncul dari konsep teori graf spektral. Metode spectral clustering membutuhkan algoritma partisi. Ada beberapa metode partisi termasuk PAM, SOM, Fuzzy c-means, dan k-means. Berdasarkan penelitian yang telah dilakukan oleh Capital dan Choudhury pada 2013, ketika menggunakan Euclidian distance, k-means memberikan akurasi yang lebih baik dibandingkan dengan algoritma PAM. sehingga, makalah ini menggunakan algoritma k-means. Keuntungan utama dari spectral clustering adalah mengurangi dimensi data, terutama dalam hal ini untuk mengurangi dimensi yang besar dari data microarray.
Microarray data adalah chip berukuran kecil yang terbuat dari slide kaca yang berisi ribuan bahkan puluhan ribu jenis gen dalam fragmen DNA yang berasal dari cDNA. Aplikasi data microarray secara luas digunakan untuk mendeteksi kanker, misalnya adalah karsinoma, di mana sel-sel kanker mengekspresikan kelainan pada gen-nya. Proses spectral clustering dimulai dengan pengumpulan data microarray gen karsinoma, preprocessing, menghitung similaritas, menghitung , menghitung nilai eigen dari , membentuk matriks , dan clustering dengan menggunakan k-means. Dari hasil pengelompokan gen karsinoma pada penelitian ini diperoleh dua kelompok dengan nilai rata-rata Silhouette maksimal adalah 0.6336247. Proses clustering pada penelitian ini menggunakan program open source R.

Spectral clustering is one of the most famous modern clustering algorithms. As an effective clustering technique, spectral clustering method emerged from the concepts of spectral graph theory. Spectral clustering method needs partitioning algorithm. There are some partitioning methods including PAM, SOM, Fuzzy c means, and k means. Based on the research that has been done by Capital and Choudhury in 2013, when using Euclidian distance k means algorithm provide better accuracy than PAM algorithm. So in this paper we use k means as our partition algorithm. The major advantage of spectral clustering is in reducing data dimension, especially in this case to reduce the dimension of large microarray dataset.
Microarray data is a small sized chip made of a glass plate containing thousands and even tens of thousands kinds of genes in the DNA fragments derived from doubling cDNA. Application of microarray data is widely used to detect cancer, for the example is carcinoma, in which cancer cells express the abnormalities in his genes. The spectral clustering process is started with collecting microarray data of carcinoma genes, preprocessing, compute similarity matrix, compute , compute eigen value of , compute , clustering using k means algorithm. In this research, Carcinoma microarray data using 7457 genes. The result of partitioning using k means algorithm is two clusters clusters with maximum Silhouette value 0.6336247.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47117
UI - Tesis Membership  Universitas Indonesia Library
cover
Fahrezal Zubedi
"Pada penelitian ini mengimplementasikan algoritma Similarity Based Biclustering dengan menggunakan PAM clustering pada tiga dataset ekspresi gen microarray. Penelitian ini bertujuan untuk mengetahui ekspresi regulasi dari masing-masing bicluster yang diperoleh dan mengetahui kinerja algoritma Similarity Based Biclustering-PAM clustering berdasarkan hasil analisis kelompok kondisi. Similarity based biclustering-PAM clustering secara teoritis terdiri dari empat tahap utama yaitu: mentransformasi data, membangun matriks similaritas, proses clustering khususnya dalam tesis ini menggunakan metode partisi PAM dan mengekstrak bicluster. Algoritma similarity based biclustering-PAM clustering dapat mengetahui ekspresi regulasi dari tiap bicluster pada tiga dataset yaitu: Diabetes Melitus tipe II, Diabetes Retinopati, dan Limfoma. Akurasi yang diperoleh dari algoritma Similarity Based Biclustering untuk masing-masing dataset yaitu Diabetes Melitus tipe II sebesar 0.55, Diabetes Retinopati sebesar 0.80 dan Limfoma sebesar 0.83.

In this research implements Similarity Based Biclustering algorithm by using PAM Clustering method in three dataset of microarray gene expression. Aim of this research is to know the regulated expression of each obtained bicluster and to know the performance of Similarity Based Biclustering PAM Clustering algorithm based on the result of group condition analysis. Similarity Based Biclustering is theoretically composed of four main stages transforming data, constructing matrix similarity, clustering process, especially in this thesis using PAM partition algorithm and extracting bicluster. Similarity Based Biclustering PAM is able to know the regulatory expression of each bicluster in three datasets Diabetes Mellitus type 2, Diabetes Retinopathy, and Lymphoma. Accuracy obtained from Similarity Based Biclustering algorithm for each dataset is 0.55 in data of type 2 diabetes mellitus, 0.80 in diabetic retinopathy data and 0.83 in lymphoma data.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49505
UI - Tesis Membership  Universitas Indonesia Library
cover
Nuning Setyaningrum
"

Alzheimer Disease (AD) merupakan salah satu gangguan saraf yang menyerang otak manusia yang lambat namun progresif yang menyebabkan masalah serius pada otak, sikap, dan masalah percakapan pasien. Penyakit itu sampai sekarang belum ada obatnya tetapi perkembangannya bisa dihambat. Untuk membantu menghambat perkembangan AD, analisis studi tentang Alzheimers diperlukan. Dalam penelitian ini kami bertujuan menganalisis data microarray penyakit AD dengan menyeleksi gen yang signifikan pada enam daerah otak manusia untuk mengidentifikasi adanya kandidat biomarker AD dengan pendekatan metode sparse biclustering berbasis factor analysis. Dengan metode biclustering ini kami menggelompokkan secara simultan baris yang mewakili gen dan kolom yang mewakili sampel, sehingga terbentuklah bicluster-bicluster. Model metode kami adalah multiplikatif generative yaitu metode yang menguraikan matriks menjadi dua faktor matriks sparse plus noise. Dengan analisis gen hasil bicluster dengan gen ontology (GO) maka diketahui fungsi biologi bicluster tersebut. Hasil dari sparse biclustering berbasis factor analysis akhirnya terdeteksi kandidat biomarker AD di dua  daerah otak yaitu EC dan SFG. Hasil dari penelitian ini diharapkan dapat memberikan masukan buat kemajuan analisis pengembangan obat dan diagnosis Alzheimer di bidang medis.

 


Alzheimer's Disease (AD) is one of the nervous disorders that attacks the slow but progressive human brain that causes serious problems in the brain, attitudes, and problems with patient conversation. There is no cure for the disease but the development can be inhibited. To help inhibit AD development, an analysis of studies on Alzheimers is needed. In this study we aimed to analyze AD microarray data by selecting genes that were significant in six regions of the human brain to identify candidates for biomarker AD with a factor analysis sparse biclustering method approach. With this biclustering method, we group together the rows representing genes and columns that represent the sample, so that bicluster-bterluster is formed. Our model method is a generative multiplicative method that describes the matrix into two sparse plus noise matrix factors. By analyzing the gene produced by bicluster with the ontology (GO) gene, the biological function of the bicluster is known. The results from sparse biclustering based factor analysis finally detected AD biomarker candidates in two brain regions namely EC and SFG. The results of this study are expected to provide input for the progress of the analysis of drug development and Alzheimer`s diagnosis in the medical field.

 

"
2019
T54067
UI - Tesis Membership  Universitas Indonesia Library
cover
Sofia Debi Puspa
"Penelitian ini bertujuan untuk mengimplementasikan similarity based biclustering SBB dalam memperoleh bicluster sekumpulan gen dengan ekspresi yang similar di bawah kondisi tertentu yang signifikan pada data microarray. Secara teoritis similarity based biclustering terdiri atas tiga tahap utama, yaitu: membangun matriks similaritas baris gen dan matriks similaritas kolom kondisi , mempartisi masing-masing matriks similaritas dengan hard clustering khususnya dalam penelitian ini menggunakan partisi k-means, dan ekstrak bicluster. Sebelum mengimplementasikan metode SBB, strategi seleksi gen diterapkan dan selanjutnya dilakukan normalisasi. Perolehan evaluasi indeks silhouette pada dataset diabetic nephropathy, diabetic retinopathy dan lymphoma berturut-turut pada cluster kondisi yaitu 0,8304; 0,7853 dan 0,7382, sedangkan indeks silhouette untuk cluster gen yaitu 0,5382; 0,5408 dan 0,5464. Dan dari hasil analisis cluster kondisi, akurasi dari dataset diabetic nephropathy dan diabetic retinopathy yaitu 100 , sedangkan dataset lymphoma yaitu 98 . Selanjutnya dapat diketahui regulasi proses seluler yang terjadi pada bicluster dari ketiga dataset. Hasil analisis menunjukkan bahwa gen-gen yang diperoleh dari bicluster sesuai dengan fungsi gen dan proses biologis didukung oleh GO enrichment sehingga menjadi potensi yang besar bagi praktisi medis dalam tindak lanjut suatu penyakit yang diderita oleh pasien.

This study aims to implement similarity based biclustering SBB in obtaining a bicluster a set of genes that exhibit similar levels of gene expression under certain conditions that is significant in microarray data. Theoretically, similarity based biclustering consists of three main phase constructing the row gene similarity matrix and the column condition similarity matrix, partitioning each matrix similarity with hard clustering especially in this research using k means partition, and extracting bicluster. Before implementing the SBB method, the gene selection strategy is applied and subsequently normalized. The acquisition of silhouette index evaluation in diabetic nephropathy, diabetic retinopathy, and lymphoma on cluster condition respectively is 0.8304, 0.7853 and 0.7382, while the silhouette index for the gene cluster is 0.5382, 0.5408 and 0.5464. In addition, according to the cluster condition analysis, accuracy of dataset diabetic nephropathy and diabetic retinopathy is 100 , whereas dataset lymphoma is 98 . Furthermore, it can be known cellular regulation that occurs on the bicluster of the three datasets. The results of the analysis show that the genes obtained from bicluster are relevant to the function of genes and biological processes supported by GO enrichment , therefore it becomes a great potential for medical practitioners in the follow up of a disease suffered by the patient.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49530
UI - Tesis Membership  Universitas Indonesia Library
cover
Hafsa Khaerunisa Wenno
"Data mining merupakan teknik pengolahan data yang dapat digunakan untuk menemukan pola-pola kelompok dan informasi yang berguna dari kumpulan data tersebut. Salah satu teknik data mining adalah metode triclustering. Triclustering bekerja pada data tiga dimensi. Umumnya algoritma tricluster tidak efektif dalam menganalisis titik waktu pegamatan yang berjumlah sedikit. Oleh karena itu, dikembangkanlah algoritma triclustering berbasis pola yang dirancang untuk menganalisis data microarray dengan jumlah titik waktu pengamatan sedikit yaitu Order Preserving Tricluster (OPTricluster). OPTricluster membentuk tricluster dengan mengidentifikasi gen-gen yang memiliki perubahan tingkat ekspresi yang sama pada subset kondisi eksperimen disepanjang titik waktu. Setelah tricluster didapatkan, analisis Gene Ontology dibutuhkan untuk mendapatkan pemahaman anotasi gen pada hasil tricluster. Metode OPTricluster diimplementasikan pada data microarray sel kanker pankreas ASPC-1 dengan beberapa skenario menggunakan threshold yang berbeda. Skenario terbaik ditunjukkan oleh threshold optimum yang diperoleh dengan membandingkan rata-rata skor Coverage Tricluster dan Tricluster Quality Index. Kemudian tricluster dari skenario terbaik dianalisis dengan Gene Ontology (GO). Hasil penelitian ini menunjukkan bahwa metode OPTricluster berhasil membentuk tricluster dengan kinerja yang baik pada 3 pola tricluster yaitu tricluster pola constant, conserved, dan divergent. Selanjutnya analisis GO dilakukan pada tricluster terbaik pola conserved yaitu tricluster pada kelompok gen yang memiliki pola perubahan tingkat ekspresi gen yang sama saat diberikan obat JQ1 dan diperoleh informasi bahwa respon dari gen-gen sel kanker pankreas ASPC-1 dominan terlibat dalam proses metabolisme, dimana gen-gen tersebut berperan dalam perubahan tingkat ekspresi gen, selain itu letak gen-gen tersebut pun berada dalam inti sel.

Data mining is data processing techniques that can be used to find group patterns and useful information from the data set. One of the data mining techniques is the triclustering method. Triclustering works on three-dimensional data. Generally, tricluster algorithms are not effective in analyzing a small number of observation time points. Therefore, a pattern-based triclustering algorithm designed to analyze microarray data with a small number of observation time points was developed under the name Order Preserving Tricluster (OPTricluster). OPTricluster forms triclusters by identifying genes that have similar expression level changes in a subset of experimental conditions across time points. Once the tricluster is obtained, analysis with Gene Ontology is required to gain an understanding of gene annotation in the tricluster result. OPTricluster method was implemented on ASPC-1 pancreatic cancer cell microarray data with several scenarios using different thresholds. The best scenario is indicated by the optimum threshold obtained by comparing the average Tricluster Coverage and Tricluster Quality Index scores. Then the tricluster of the best scenario is analyzed with Gene Ontology (GO). The results showed that the OPTricluster method successfully formed tricluster with good performance in 3 tricluster patterns, namely constant, conserved, and divergent tricluster patterns. Furthermore, GO analysis was carried out on the best tricluster conserved pattern, namely tricluster in the gene group that has the same pattern of changes in gene expression levels when given the drug JQ1 and obtained information that the response of ASPC-1 pancreatic cancer cell genes is dominantly involved in metabolic processes, where these genes play a role in changes in gene expression levels, besides that the location of these genes is also in the cell nucleus."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>