Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 7 dokumen yang sesuai dengan query
cover
Yoel Fernando
Abstrak :
Penelitian biologi dengan menggunakan teknologi microarray menghasilkan data ekspresi gen berbentuk matriks di mana baris adalah gen dan kolom adalah kondisi. Analisis lanjutan dalam data ekspresi gen membutuhkan data yang lengkap. Namun, data ekspresi gen sering kali mengandung nilai hilang atau missing values. Ada berbagai cara untuk mengatasi missing values, antara lain pembuangan gen atau kondisi yang mengandung missing values, pengulangan pengambilan data, dan imputasi missing values pada data ekspresi gen. Pendekatan imputasi missing values awal hanyalah dengan mengisi nilai nol atau rata-rata baris. Namun, pendekatan ini tidak melihat informasi koheren dalam data. Pendekatan imputasi missing values terbagi menjadi empat berdasarkan informasi yang diperlukan pada algoritmanya, yaitu pendekatan lokal, pendekatan global, pendekatan hybrid, dan pendekatan knowledge assisted. Pada penelitian ini peneliti menggunakan algoritma pendekatan lokal dan global. Metode imputasi missing values paling popular untuk pendekatan global adalah Bayesian Principal Component Analysis (BPCA), sedangkan untuk pendekatan lokal adalah Local Least Square (LLS). Pada metode LLS, pemilihan similaritas gen dilakukan dengan teknik clustering dimana seluruh kondisi dalam data digunakan. Kenyataanya, terkadang gen-gen similar hanya dalam beberapa kondisi eksperimental saja. Maka, diperlukan teknik biclustering untuk dapat menemukan subset gen dan subset kondisi yang similar sebagai informasi lokal. Penerapan ide biclustering dalam LLS dinamakan sebagai Iterative Bicluster-Based Least Square (bi-iLS). Salah satu tahapan awal dalam bi-iLS adalah pembentukan matriks komplit sementara yang didapat dengan cara mengisi missing values dengan row average. Namun, row average dinilai kurang bagus karena hanya menggunakan informasi satu baris tersebut. Kekurangan ini diperbaiki dalam penelitian ini. Penggunaan metode BPCA untuk menemukan matriks komplit sementara dinilai lebih baik karena BPCA menggambarkan struktur keseluruhan data. Penggantian row average menjadi BPCA menjadi dasar masalah penelitian ini. Metode iterative Bicluster-based Bayesian Principal Component Analysis dan Least Square (bi-BPCA- iLS) pun diajukan. Penerapan bi-BPCA-iLS terhadap data ekspresi gen yang dihasilkan teknologi microarray terbukti menghasilkan penurunan nilai Normalzied Root Mean Square Error (NRMSE) sebesar 10,6% dan 0,58% secara rata-rata dalam beberapa missing rate (1%, 5%, 10%, 15%, 20%, 25%, dan 30%) jika dibandingkan dengan metode LLS dan bi-iLS. ......Biological research using microarray technique produce some important gene expression datasets. These data can be expressed as a matrix in which rows are genes and columns are different conditions. Further analysis of these datasets requires a complete dataset or matrix. However, gene expression datasets often contain missing values. There are some ways to handle missing values, such as deletion of genes or conditions that contain missing values, repeat the process of acquiring data, and impute the missing values. Early approaches in missing values imputation are simply to replace missing values with zeros or row averages, but these methods do not use the coherence inside the data. Later, approaches in missing values imputations are categorized into four groups based on the required information, such as local, global, hybrid, and knowledge assisted approaches. In this paper, local and global approaches are used. Bayesian Principal Component Analysis (BPCA) is a well-known global based method, while the most popular local based method is Local Least Square (LLS). In LLS, selection of similar genes uses clustering technique where all conditions in the data are included. The reality is genes sometimes only correlate under some experimental conditions only. So, a technique that can find subset of genes under subset of experimental conditions for local information is needed. This technique is called biclustering. The usage of biclustering in LLS is called the Iterative Bicluster-based Least Square (bi-iLS). One of the early steps in bi-iLS is to find a temporary complete matrix. Temporary complete matrix is obtained by applying row averages to impute missing values. However, row average cannot reflect the real structure of the dataset because row average only uses the information of an individual row. The missing values in a target gene do not only rely on the known values of its own row. In this research, row average in bi-iLS is replaced with BPCA. The benefit of using BPCA is that it uses global structure of the dataset. This update will be the basic problem of this research. The proposed method is called Iterative Bicluster-based Bayesian Principal Component Analysis and Least Square (bi-BPCA-iLS). This new proposed method is applied to gene expression datasets from microarray technique. It shown a decrease in values of Normalized Root Mean Square Error (NRMSE) about 10.6% from LLS and about 0.58% from bi-iLS based on different missing rates (1%, 5%, 10%, 15%, 20%, 25%, and 30%).
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nidia Ayu
Abstrak :
Coronavirus Disease (COVID-19) adalah penyakit baru yang melanda dunia tahun 2020. Penyakit ini diperkirakan berasal dari Wuhan, China (Rothan HA, 2020). WHO menetapkan COVID-19 sebagai pandemi karena penyakit ini telah berhasil menginfeksi lebih dari 190 negara di dunia. DKI Jakarta adalah Ibu Kota di Indonesia yang turut menjadi salah satu Provinsi dengan kasus konfirmasi positif COVID-19 tertinggi sampai akhir Juli 2020. Penelitian ini bertujuan untuk memodelkan rate kasus COVID-19 pada 15 kecamatan Jakarta dengan intensitas tertinggi. Alasan dipilihnya 15 kecamatan dengan intensitas tertinggi untuk menjadi area penelitian karena lebih dari 63,43% kasus konfirmasi COVID-19 dilaporkan dari 15 kecamatan, yakni Kecamatan Gambir, Menteng, Sawah Besar, Kemayoran, Taman Sari, Senen, Tanah Abang, Johar Baru, Tambora, Grogol Petamburan, Cempaka Putih, Pademangan, Setia Budi, Matraman, dan Palmerah. Rate kasus COVID-19 pada area ini kemudian dibuat model GSTAR, model ini merupakan salah satu pemodelan dalam time seriesstokastik yang mempertimbangkan indeks spasial atau lokasi dan waktu (Budi, 2019). Matriks bobot biner, matriks bobot seragam, dan matriks bobot jarak pada penelitian ini dibentuk sebagai matriks dependensi spasial antar lokasi atau disebut matriks bobot W. Hasil identifikasi STACF dan STPACF untuk semua matriks pembobot spasial didapatkan model yang sama, yaitu GSTAR(3,1). Pendugaan parameter model GSTAR(3,1) dilakukan untuk setiap matriks pembobot tersebut. Model GSTAR(3,1) yang terbaik diperoleh berdasarkan matriks pembobot jarak, dengan RMSE terkecil yaitu 0.1271. ......Coronavirus Disease (COVID-19) is a new disease that hit the world in 2020. This disease is thought to have originated in Wuhan, China (Rothan HA, 2020). WHO has designated COVID-19 as a pandemic because this disease has successfully infected more than 190 countries in world. DKI Jakarta is the capital city in Indonesia which is also one of the provinces with the highest positive confirmed cases of COVID-19 until the end of July 2020. This study aims to model the level of COVID-19 cases in 15 sub-districts of DKI Jakarta with the highest intensity. The reason for choosing 15 sub-districts with the highest intensity to be the research area was because more than 63.43% of confirmed COVID-19 cases were reported from 15 sub-districts, that is Gambir, Menteng, Sawah Besar, Kemayoran, Taman Sari, Senen, Tanah Abang, Johar Baru Districts , Tambora, Grogol Petamburan, Cempaka Putih, Pademangan, Setia Budi, Matraman, and Palmerah. Rate of COVID-19 cases in this area is then made a GSTAR model, this model is one of the models in a stochastic time series that considers spatial index or location and time (Budi, 2019). The binary weight matrix, uniform weight matrix, and distance weight matrix in this study were formed as a spatial dependency matrix between locations or called the W weight matrix. The results of STACF and STPACF services for all spatial weighting matrices obtained the same model, that is GSTAR (3,1). Estimation of parameters of the GSTAR model (3,1) is carried out for each weighting matrix. The best GSTAR (3,1) model is based on a distance weighted matrix, with an RMSE of 0.1271
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kinanty Tasya Octaviane
Abstrak :
Teknologi DNA microarray menghasilkan data ekspresi gen yang dapat digunakan untuk membantu berbagai pemecahan masalah dalam dunia kesehatan. Data ekspresi gen merupakan matriks berukuran besar berisi gen dan kondisi eksperimental yang tak jarang mengandung missing values dan outlier. Data yang mengandung missing values dapat mengganggu dan membatasi analisis. Untuk mengatasinya, metode komputasi dinilai layak untuk imputasi missing values pada data ekspresi gen sebelum dilakukan analisis lanjutan, terlebih untuk data yang memiliki outlier. Oleh karena itu, pada penelitian ini digunakan metode imputasi missing values NCBI-LPCM untuk mengatasi permasalahan missing values pada data ekspresi gen yang memiliki outlier. Metode NCBI-LPCM menggunakan ukuran korelasi LPCM yang dapat menangani keberadaan outlier untuk pembentukan bicluster dan imputasi least square yang merupakan metode imputasi dengan pendekatan lokal. LPCM mengidentifikasi gen-gen yang memiliki pola korelasi similar sehingga menjadi informasi lokal untuk dasar imputasi. Metode ini diterapkan pada data ekspresi gen pasien Leukemia Limfoblastik Akut pada missing rate 5%, 10%, 15%, 20%, 25%, 30%, dan 35%. Berdasarkan RMSE dan korelasi Pearson, metode NCBI-LPCM lebih baik jika dibandingkan dengan NCBI-SSSim yang juga dapat menangani keberadaan outlier. ......DNA microarray technology produces gene expression data that can be used to help solve various problems in healthcare. Gene expression data is a large matrix of genes and experimental conditions that often contains missing values and outliers. Data containing missing values can interfere with and limit analyses. To overcome this, computational methods are considered feasible for imputing missing values in gene expression data before further analysis is carried out, especially for data that has outliers. Therefore, in this study, the NCBI-LPCM missing values imputation method was used to overcome the problem of missing values in gene expression data with outliers. The NCBI-LPCM method uses the LPCM correlation measure which can handle the presence of outliers for bicluster formation and least square imputation which is an imputation method with a local approach. LPCM identifies genes that have similar correlation patterns so that they become local information for the basis of imputation. This method was applied to gene expression data of Acute Lymphoblastic Leukaemia patients at missing rates of 5%, 10%, 15%, 20%, 25%, 30%, and 35%. Based on RMSE and Pearson correlation, the NCBI- LPCM method is better than NCBI-SSSim which can also handle the presence of outliers.
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Allissa Rahman
Abstrak :
Data ekspresi gen merupakan data yang berisi hasil proses transformasi informasi genetik dari DNA atau RNA menjadi protein (fenotipe) yang disajikan dalam bentuk matriks berisi ekspresi gen (baris) dan kondisi (kolom). Sama halnya seperti jenis data lainnya, data ekspresi gen tidak terlepas dari kemungkinan masalah missing values atau data yang hilang. Untuk menangani masalah keberadaan missing values, diperlukan imputasi, yaitu metode untuk mengisi nilai pada data yang hilang. Metode imputasi yang digunakan pada penelitian ini adalah QP_Biclustering yang merupakan kombinasi antara biclustering dengan permasalahan pemrograman kuadratik yang akan diselesaikan dengan bahasa pemrograman Python. Metode QP_Biclustering diimplementasikan pada data ekspresi gen dari pasien Covid-19 bertipe numerik dengan tipe missing values berjenis Missing Completely at Random (MCAR). Algoritma biclustering yang digunakan sebagai metode dalam penelitian ini adalah hasil modifikasi dari algoritma SwarmBCluster, yaitu constructive heuristic with local search. Metode biclustering ini menggunakan Mean Squared Residue (MSR) dalam proses pembentukan bicluster yang berperan sebagai ukuran kualitas suatu bicluster. Setelah bicluster terbentuk, missing values akan diestimasi menggunakan quadratic programming dengan cara meminimumkan nilai MSR tiap bicluster. Hasil penelitian ini menunjukkan bahwa metode QP_Biclustering memiliki performa cukup baik untuk mengimputasi missing values pada data ekspresi gen pasien Covid-19 yang dapat dilihat dari nilai Normalized Root Mean Square Error (NRMSE) yang lebih rendah dibandingkan dengan metode KNNimpute. ......Gene expression data contains the results of the transformation process of genetic information from DNA or RNA into protein (phenotype) which is presented in the form of a matrix containing gene expression (rows) and conditions (columns). Just like other types of data, gene expression data can not be separated from the possibility of missing values or missing data problems. To deal with the problem of the presence of missing values, imputation is needed, which is a method to fill in the values in the missing data. The imputation method used in this research is QP_Biclustering which is a combination of biclustering with quadratic programming problems that will be solved using the Python programming language. The QP_Biclustering method is implemented on gene expression data from Covid-19 patients with numeric type and the missing values has Missing Completely at Random (MCAR) type. The biclustering algorithm used as a method in this research is a modified result of the SwarmBCluster algorithm, namely constructive heuristic with local search. This biclustering method uses Mean Squared Residue (MSR) in the bicluster formation process which will be used as a measure of the quality of a bicluster. After the bicluster is formed, the missing values will be estimated using quadratic programming by minimizing the MSR value for each bicluster. The results of this study indicate that the QP_Biclustering method has a fairly good performance to impute the missing values in gene expression data of Covid-19 patients which can be seen from the NRMSE (Normalized Root Mean Square Error) value which is lower than KNNimpute method.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Hayati A. Amiri
Abstrak :
Realisasi anggaran belanja modal merupakan salah satu indikator kinerja. Porsi terbesar anggaran belanja modal dimiliki oleh kegiatan pengadaan barang/jasa. Harga Perkiraan Sendiri (HPS) merupakan perkiraan harga Barang/Jasa yang telah memperhitungkan semua komponen biaya sampai dengan siap digunakan dan dimanfaatkan oleh pengguna. HPS digunakan untuk dasar menilai kewajaran harga penawaran dari calon penyedia barang/jasa. penyusunan HPS harus didasarkan kepada metode yang dapat dipertanggungjawabkan serta berdasarkan data yang relevan, aktual dan dapat diandalkan. Machine Learning adalah tentang merancang algoritme yang secara otomatis mengekstrak informasi berharga dari data. Machine Learning menggunakan Regresi linier menjadi salah satu algoritma yang paling banyak digunakan untuk melakukan model prediksi harga dan penjualan. Dalam penelitian ini menggunakan Machine Learning untuk menghitung prediksi HPS tahun 2021 pada Pengadaan Pembangunan Gedung Perusahaan X milik Pemerintah. Variabel X yang digunakan adalah Tahun, dan Variabel Y yang digunakan adalah Harga. Diperoleh hasil prediksi Machine Learning tahun 2021 mengalami kenaikan untuk Pekerjaan Dinding Batu Bata Lantai Dasar sebesar 7,1% dengan nilai RMSE 0,020 (Good Fit), Pekerjaan Dinding Batu Bata Bangunan Belakang sebesar 7,2% dengan nilai RMSE 0,019 (Good Fit), Pekerjaan Dinding Batu Bata Ruang Luar sebesar 8,6% dengan nilai RMSE 0,031 (Good Fit), Pekerjaan Finishing Lantai Dasar sebesar 1,6% dengan nilai RMSE 0,036 (Good Fit), Pekerjaan Finishing Ruang Luar Depan sebesar 2,6% dengan nilai RMSE 0,014 (Good Fit), dan Pekerjaan Finishing Ruang Luar Belakang sebesar 2% dengan nilai RMSE 0,014 (Good Fit). Hasil Prediksi dari Machine Learning semuanya memiliki kriteria good fit, dan tingkat akurasi yang tinggi. Sehingga dapat disimpulkan bahwa Prediksi Dari Machine Learning dapat membantu perencanaan anggaran dan estimasi biaya (perencanaan HPS) yang meningkatkan faktor keberhasilan proyek. ......The realization of capital expenditure budget is one of the Key Performance Indicators. The largest portion of capital expenditure budget is owned by procurement activities of goods / services. Self-Estimate Price is an estimated price of Goods/Services that has taken into account all components of cost until it is ready to be used and utilized by users. Self-Estimate Price is used to assess the fairness of the offer price of prospective providers of goods/services. Self-Estimate Price preparation must be based on accountable methods and based on relevant, actual and reliable data. Machine Learning is about designing algorithms that automatically extract valuable information from data. Machine Learning uses linear regression to be one of the most widely used algorithms for performing price and sales prediction models. In this study, Machine Learning used to calculate Self-Estimate Price predictions in 2021 in the procurement of government-owned Company X Building Development. Variable X used is Year, and Variable Y used is Price. The prediction results of Machine Learning in 2021 experienced an increase for Ground Floor Brick Wall Work by 7.1% with a RMSE value of 0.020 (Good Fit), Rear Building Brick Wall Work by 7.2% with a RMSE value of 0.019 (Good Fit), Outdoor Brick Wall Work of 8.6% with a RMSE value of 0.031 (Good Fit), Ground Floor Finishing Work of 1,6% with a RMSE value of 0.036 (Good Fit),  Outdoor Space Finishing Work is 2.6% with a RMSE value of 0.014 (Good Fit), and Outdoor Space Finishing Work by 2% with a RMSE value of 0.014 (Good Fit). it can be concluded that predictions from machine learning can help budget planning and cost estimates (Price Analysis) which increase the project's success rate.
Jakarta: Fakultas Teknik Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Nesia Dwiasta
Abstrak :
Sertifikat tanah merupakan surat tanda bukti hak yang berlaku sebagai alat pembuktian yang kuat mengenai data fisik dan data yuridis untuk kepemilikan tanah seseorang. Salah satu jenis pendaftaran sertifikat tanah yaitu sertifikat tanah rutin yang terdiri dari beberapa jenis objek sertifikat diantaranya adalah sertifikat tanah roya, peralihan hak atas tanah, perubahan hak atas tanah, hak tanggungan, split dan pendaftaran pertama kali. Instansi pemerintah yang memiliki wewenang mengeluarkan sertifikat tanah di Indonesia adalah Kementrian ATR/BPN melalui Kantor Pertanahan salah satunya yang terletak di Kabupaten Bandung. Namun kondisi yang terjadi di Kantor Pertanahan Kabupaten Bandung masih terdapat perlambatan penerbitan sertifikat tanah di setiap waktunya. Beberapa penyebab perlambatan tersebut karena proses perencanaan jumlah blangko dan petugas ukur yang masih belum sesuai. Sehingga diperlukan adanya perbaikan proses perencanaan menggunakan peramalan dengan pendekatan data mining untuk mendapatkan model terbaik. Metode yang digunakan adalah perbandingan metode Autoregressive Integrated Moving Average (ARIMA) dan Artificial Neural Network (ANN). Setelah dilakukan analisis berdasarkan Root Mean Square Error (RMSE), ANN dapat menghasilkan model dengan tingkat akurasi yang terbaik untuk melakukan peramalan pada masing-masing jenis sertifikat tanah dibandingkan ARIMA karena hasil dari ANN memiliki tingkat kesalahan terkecil. ...... A land certificate is a certificate of proof of rights that serves as a strong proof of physical data and juridical data for a person's land ownership. One type of land certificate registration is a routine land certificate consisting of several types of certificate objects includigroya land certificates, transfer of land rights, changes to land rights, mortgage rights, splits, and first registration. The government agency authorized to issue land certificatesin Indonesia is the Ministry of ATR/BPN through the land office, one of which is in Bandung Regency. However, the conditions that occur in the Bandung Regency land office are still a slowdown in the issuance of land certificates every time. Some of the reasons for the slowdown occurred because the planning process for the number of blanks and measuring officers was still not appropriate. So, it is necessary to improve the planning process using forecasting with a data mining approach to get the best model. The method used is to compare the Autoregressive Integrated Moving Average (ARIMA)and Artificial Neural Network (ANN) methods. After analyzing based on Root Mean Square Error (RMSE), the ANN can produce a model with the best accuracy forforecasting each type of land certificate compared to the ARIMA because the results of the ANN have the smallest error rate.
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aziz Fikri Hudaya
Abstrak :
Citra berkabut terjadi jika cahaya yang diterima oleh media optik dihamburkan dengan media yang keruh, seperti asap dan tetesan air. Citra berkabut dapat direstorasi menjadi citra tanpa kabut dengan proses image dehazing. Salah satu metode untuk melakukan image dehazing adalah statistical prior. Statistical prior digunakan ketika informasi yang diketahui hanyalah citra berkabut, untuk mengestimasi parameter yang tidak diketahui, seperti airlight dan transmisi. Pada penelitian ini penulis menggunakan dua metode statistical prior, yaitu Dark Channel Prior dan Two Peak Channel Prior. Untuk mendapatkan hasil terbaik, penulis melakukan optimasi parameter pada kedua metode yang digunakan. Untuk mendapatkan kualitas hasil image dehazing terbaik, penulis merancang sebuah kerangka kerja (framework usulan dari modifikasi metode Dark Channel Prior yang melibatkan pemisahan daerah langit dan non-langit dan optimasi parameter. Performa metode diuji dengan menggunakan metrik root mean square error (RMSE) dan structural similarity index measure (SSIM). Didapatkan hasil dimana metode usulan mendapatkan hasil evaluasi terbaik, dengan RMSE sebesar 0.063 dan SSIM sebesar 0.942 Untuk dataset SOTS Outdoor. Sementara untuk dataset O-Haze, metode usulan mendapatkan hasil evaluasi terbaik juga dengan RMSE sebesar 0.147 dan SSIM sebesar 0.811. ......Hazy images occur when the light received by the optical device is scattered by turbid media such as smoke and water droplets. Hazy images can be restored to its clear version by the image dehazing process. It is possible to perform image dehazing using statistical priors. Statistical priors are used when the only known information is the hazy image itself, to estimate the unknown parameters. In this study, the author used two statistical priors, namely Dark Channel Prior and Two Peak Channel Prior. To obtain the best possible results, the author attempted to optimize the parameters of the used methods. Furthermore, to obtain the best possible quality of image dehazing results, the Author proposed a framework using a modification of the Dark Channel Prior method, which involved separating the sky and non-sky areas and parameter optimization. The method performance was evaluated using the root mean square error (RMSE) and structural similarity index measure (SSIM). The results obtained show that the proposed method is able to get the best evaluation results, with an RMSE of 0.063 and SSIM of 0.942 for SOTS Outdoor dataset. For the O-Haze dataset, the proposed method also gets the best evaluation results with an RMSE of 0.147 and an SSIM of 0.811.
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library