Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 3 dokumen yang sesuai dengan query
cover
Sagitra Tri Meizanda
Abstrak :
Indeks Pembangunan Manusia (IPM) merupakan salah satu indikator yang dapat digunakan untuk menggambarkan tingkat kesejahteraan rakyat di Indonesia. Pada tahun 2021, Provinsi Papua dan Papua Barat menempati dua urutan terakhir berdasarkan nilai IPM di Indonesia. Hal ini menandakan bahwa kesejahteraan masyarakat di Provinsi Papua dan Papua Barat dalam menikmati hasil pembangunan mengalami ketertinggalan dibandingkan dengan provinsi lain. Tetapi, IPM hanya dapat menggambarkan kesejahteraan dari dimensi pembentuknya saja, sehingga dibutuhkan indikator lain yang dapat menggambarkan kesejahteraan dari berbagai dimensi yang lebih luas. Pada penelitian ini dilakukan pengelompokan terhadap kabupaten/kota yang ada di Pulau Papua agar pemerintah lebih mudah dalam mengambil kebijakan yang tepat untuk mengatasi permasalahan kesejahteraan rakyat di Pulau Papua. Analisis yang digunakan pada penelitian ini adalah analisis biclustering. Analisis biclustering merupakan metode pengembangan dari analisis clustering yang digunakan untuk mengelompokkan baris dan kolom pada data secara bersamaan. Salah satu metode dari analisis biclustering adalah menggunakan algoritma Cheng and Church. Algoritma Cheng and Church menghasilkan bicluster yang memiliki ukuran yang maksimal dan mempunyai nilai mean squared residue lebih kecil dari batas yang telah ditentukan. Evaluasi dari hasil biclustering menggunakan rata-rata mean squared residue terhadap volume bicluster dan indeks Jaccard yaitu kemiripan antara dua hasil biclustering. Data yang akan digunakan dalam penelitian ini adalah data indikator kesejahteraan rakyat di pulau Papua tahun 2021. Analisis biclustering terhadap data indikator kesejahteraan rakyat di pulau Papua tahun 2021 menggunakan algoritma Cheng and Church mampu menghasilkan sebanyak 9 bicluster. Harapannya, pemerintah dapat membuat kebijakan yang tepat sesuai dengan masalah yang terjadi pada setiap bicluster. ......The Human Development Index (HDI) is one of the indicators that can be used to describe the level of people's welfare in Indonesia. In 2021, Papua and Papua Barat Provinces occupy the last two ranks based on HDI values in Indonesia. This indicates that the welfare of the people in Papua and Papua Barat Provinces in enjoying the results of development has lagged compared to other provinces. However, HDI can only describe welfare from the dimensions that form it, so other indicators are needed to describe welfare from a broader range of dimensions. In this study, a grouping of districts/cities in Papua Island is carried out so that the government can more easily take the right policy to overcome the problems of people's welfare in Papua Island.  The analysis used in this research is biclustering analysis. Biclustering analysis is a development method of clustering analysis used to simultaneously group rows and columns in the data. One method of biclustering analysis is using the Cheng and Church algorithm. Cheng and Church's algorithm produces a bicluster with a maximum size and a mean squared residue value smaller than the predetermined limit. Evaluation of the biclustering results uses the average mean squared residue of the bicluster volume and the Jaccard index, which is the similarity between the two biclustering results. The data used in this study are welfare indicators data on Papua Island in 2021. Biclustering analysis of welfare indicators data on Papua Island in 2021 using the Cheng and Church algorithm produced as many as 9 biclusters. The hope is that the government can make the right policy according to the problems that occur in each bicluster.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rana Amalia Putri
Abstrak :
Triclustering merupakan teknik data mining untuk mengelompokkan data tiga dimensi (observasi – atribut – konteks). Metode triclustering mampu menemukan kelompok observasi dengan karakteristik yang mirip pada beberapa atribut dan konteks sekaligus. Analisis tricluster kerap diimplementasikan pada data ekspresi gen 3D (gen – kondisi – waktu). Pada penelitian ini dilakukan analisis tricluster dengan metode Hybrid Discrete Firefly Optimization (DFO) pada data ekspresi gen 3D. Metode ini merupakan kombinasi dari metode dan Discrete Firefly Optimization (DFO). Metode DFO merupakan metode optimasi yang terinspirasi dari perilaku firefly (kunang-kunang) yang selalu bergerak ke arah firefly lain dengan cahaya yang lebih terang. Metode DFO bertujuan untuk memperoleh tricluster terbaik dengan volume maksimum dari suatu populasi tricluster. Pada metode DFO, suatu tricluster dengan volume lebih kecil akan bergerak ke arah tricluster lain dengan volume lebih besar dengan bantuan crossover operator. Setiap iterasi pada metode DFO dilakukan sampai semua tricluster dibandingkan volumenya dengan satu sama lain sehingga tricluster dengan volume lebih kecil dapat diperbaiki posisinya dan meningkat volumenya. Kebaruan dari penelitian ini merupakan pembentukan populasi tricluster awal dilakukan dengan metode . Metode bertujuan untuk menghasilkan tricluster dengan Mean Squared Residue (MSR) minimum, yaitu di bawah threshold tertentu. Populasi tricluster dengan karakteristik demikian meringankan beban dan waktu komputasi pada metode DFO. Data yang digunakan pada analisis tricluster ini merupakan data ekspresi gen dari sel kanker payudara MCF-7 ketika disuntikkan 100 nM hormon estrogen untuk empat waktu berbeda, yaitu selama 0 jam, 3 jam, 6 jam, dan 12 jam. Masing-masing perlakuan direplikasi sebanyak tiga kali. Pada penelitian ini diperoleh bahwa simulasi yang menghasilkan tricluster akhir terbaik dengan TQI terkecil adalah simulasi dengan nilai sebesar 3E-05. Gen-gen yang termasuk ke dalam tricluster ini memiliki profil ekspresi yang mirip ketika disuntikkan 100nM estrogen untuk tiga replikasi dan empat waktu. Estrogen merupakan salah satu hormon yang mempengaruhi pertumbuhan kanker payudara. Oleh karena itu, kumpulan gen dari tricluster yang diperoleh dapat dijadikan acuan pada penelitian selanjutnya oleh ahli medis terkait pengaruh estrogen terhadap kanker payudara dan untuk menentukan target terapi gen kanker payudara. ......Triclustering is a data mining technique that is used to group observations on three dimensional data which consists of observation, attribute, and context dimension. Triclustering is used to find a group of observations with high similarity on several attributes and several contexts. Triclustering analysis is often implemented on three dimensional gene expression dataset. The 3D gene expression dataset dimensions consist of gene, condition, and time. The triclustering method that is used on this research is the Hybrid Discrete Firefly Optimization (DFO). This method is a combination of and DFO. Discrete Firefly Optimization (DFO) is an optimization method that was inspired by firefly movement in the wild in which a less bright firefly always moves to the one with brighter light. In triclustering analysis, every tricluster is called a firefly. Every firefly has a fitness value which is measured by its volume and a position which is represented by a binary encoding of its elements. The DFO method is used to find the best tricluster with maximum volume from a population of triclusters. In the DFO method, a tricluster with smaller volume will move towards a tricluster with larger volume. The movement is done by updating the smaller volume tricluster position. The new position is obtained through crossover operator. Every iteration of DFO is completed once every tricluster fitness value is compared to each other. Repeating the DFO iteratively will give the end result of the best tricluster with maximum volume. The novelty of this research is the addition of method in constructing the initial tricluster population. The population created from will have MSR lower than the threshold so the computation time in the optimization step can be reduced. The Hybrid DFO method is implemented on a 3D gene expression dataset related to the MCF-7 breast cancer cell. The cell is injected with 100nM estrogen for four different times, i.e. 0, 3, 6, and 12 hours. Every experiment is repeated three times. This research finds that the simulation with the best tricluster based on the TQI score is the simulation with equals to 3E-05. The genes that are included in the tricluster are found to have exhibit similar expression when injected by 100nM for three conditions and four time periods. Estrogen is one of the hormones that can affect breast cancer growth. Therefore, the genes that are included in the tricluster can be used as a reference for medical researchers in future research related to estrogen-induced breast cancer and to assist the selection for genes target in breast cancer therapy.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Allissa Rahman
Abstrak :
Data ekspresi gen merupakan data yang berisi hasil proses transformasi informasi genetik dari DNA atau RNA menjadi protein (fenotipe) yang disajikan dalam bentuk matriks berisi ekspresi gen (baris) dan kondisi (kolom). Sama halnya seperti jenis data lainnya, data ekspresi gen tidak terlepas dari kemungkinan masalah missing values atau data yang hilang. Untuk menangani masalah keberadaan missing values, diperlukan imputasi, yaitu metode untuk mengisi nilai pada data yang hilang. Metode imputasi yang digunakan pada penelitian ini adalah QP_Biclustering yang merupakan kombinasi antara biclustering dengan permasalahan pemrograman kuadratik yang akan diselesaikan dengan bahasa pemrograman Python. Metode QP_Biclustering diimplementasikan pada data ekspresi gen dari pasien Covid-19 bertipe numerik dengan tipe missing values berjenis Missing Completely at Random (MCAR). Algoritma biclustering yang digunakan sebagai metode dalam penelitian ini adalah hasil modifikasi dari algoritma SwarmBCluster, yaitu constructive heuristic with local search. Metode biclustering ini menggunakan Mean Squared Residue (MSR) dalam proses pembentukan bicluster yang berperan sebagai ukuran kualitas suatu bicluster. Setelah bicluster terbentuk, missing values akan diestimasi menggunakan quadratic programming dengan cara meminimumkan nilai MSR tiap bicluster. Hasil penelitian ini menunjukkan bahwa metode QP_Biclustering memiliki performa cukup baik untuk mengimputasi missing values pada data ekspresi gen pasien Covid-19 yang dapat dilihat dari nilai Normalized Root Mean Square Error (NRMSE) yang lebih rendah dibandingkan dengan metode KNNimpute. ......Gene expression data contains the results of the transformation process of genetic information from DNA or RNA into protein (phenotype) which is presented in the form of a matrix containing gene expression (rows) and conditions (columns). Just like other types of data, gene expression data can not be separated from the possibility of missing values or missing data problems. To deal with the problem of the presence of missing values, imputation is needed, which is a method to fill in the values in the missing data. The imputation method used in this research is QP_Biclustering which is a combination of biclustering with quadratic programming problems that will be solved using the Python programming language. The QP_Biclustering method is implemented on gene expression data from Covid-19 patients with numeric type and the missing values has Missing Completely at Random (MCAR) type. The biclustering algorithm used as a method in this research is a modified result of the SwarmBCluster algorithm, namely constructive heuristic with local search. This biclustering method uses Mean Squared Residue (MSR) in the bicluster formation process which will be used as a measure of the quality of a bicluster. After the bicluster is formed, the missing values will be estimated using quadratic programming by minimizing the MSR value for each bicluster. The results of this study indicate that the QP_Biclustering method has a fairly good performance to impute the missing values in gene expression data of Covid-19 patients which can be seen from the NRMSE (Normalized Root Mean Square Error) value which is lower than KNNimpute method.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library