Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 15 dokumen yang sesuai dengan query
cover
Djulio Rahmawan
"ABSTRAK
Penaksir merupakan statistik dari sampel yang digunakan untuk menaksir parameter populasi. Salah satu kriteria penaksir yang baik adalah penaksir dengan presisi yang tinggi. Dalam teori sampling, auxiliary information sering digunakan untuk meningkatkan presisi penaksir. Auxiliary information yang tersedia dalam bentuk kualitatif disebut auxiliary attribute. Nursel Koyuncu memperkenalkan keluarga penaksir mean populasi yang dapat memanfaatkan auxiliary attribute beserta parameternya. Mean square error dari keluarga penaksir Nursel Koyuncu akan dirumuskan. Akan ditunjukkan jika penaksir mean populasi yang dibentuk dari keluarga penaksir Nursel Koyuncu lebih efisien dibandingkan mean sampel. Pembuktian teori ini akan didukung dengan contoh numerik dengan menggunakan data asli.

ABSTRACT
Estimator is a statistic of the samples used to estimate population parameters. One of a good estimator criteria is the estimator has high precision. In sampling theory, auxiliary information often being used to improve the precision of the estimator. Auxiliary information which provided in qualitative form is called auxiliary attribute. Nursel Koyuncu was introducing family of mean population estimator that can utilize the auxiliary attribute and its parameters. The mean square error of the Nursel Koyuncu family estimator will be formulated. Will be indicated that the adjuster is formed from the Nursel Koyuncu rsquo s family of mean population estimator is more efficient than the sample mean. Proof of this theory would be supported by the numerical example using original data. "
Depok: Universitas Indonesia, 2016
S65821
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dwi Oktaviyanti
"Dalam bidang ekonomi, peneliti sering tertarik untuk mencari taksiran particular dari sebuah model regresi linier berganda. Namun, keberadaan omitted variables di dalam model menyebabkan mean dari error pada model tersebut bernilai tidak nol. Hal ini mengakibatkan taksiran particular least square bersifat bias. Oleh karena itu, menurut Ryo Uemukai (2010) ada cara lain untuk mencari taksiran particular dari model regresi yang memiliki omitted variables yaitu Regresi Ridge (RR). Pada skripsi ini akan dicari taksiran particular dari sebuah model regresi linier berganda yang memiliki omitted variables dengan menggunakan OLS dan RR. Selain itu, akan dilihat pengaruh omitted variables terhadap kedua taksiran particular tersebut, dari segi bias serta MSE. Untuk melihat taksiran mana yang lebih baik, peneliti membandingkan nilai MSE taksiran particular least square dengan MSE taksiran particular ridge. Pada tugas akhir ini juga akan dijelaskan syarat – syarat yang harus dipenuhi agar MSE taksiran particular ridge memiliki nilai yang lebih kecil dibandingkan MSE taksiran particular least square.

In Economic studies, researcher often interested in searching for a particular estimation over a multiple linier regression model. But, the existence of omitted variables in the model causing mean value of the error from model has no zero. This caused the particular least square estimation biased. Ryo Uemukai (2010) then pointed out that there’s other way to estimate the particular estimation from regression model with omitted variables, called Ridge Regression (RR). In this paper, we will estimate the particular estimation from a multiple linier regression model using OLS and RR. Omitted variables’ effect towards both of the particular estimation will also be observed, based on bias and MSE value. To decide which estimation is better, researcher compare the MSE least square and MSE ridge. This paper also explains the condition that must be fullfiled so that MSE of particular ridge estimations smaller than least square.
"
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2014
S56328
UI - Skripsi Membership  Universitas Indonesia Library
cover
Yoel Fernando
"Penelitian biologi dengan menggunakan teknologi microarray menghasilkan data ekspresi gen berbentuk matriks di mana baris adalah gen dan kolom adalah kondisi. Analisis lanjutan dalam data ekspresi gen membutuhkan data yang lengkap. Namun, data ekspresi gen sering kali mengandung nilai hilang atau missing values. Ada berbagai cara untuk mengatasi missing values, antara lain pembuangan gen atau kondisi yang mengandung missing values, pengulangan pengambilan data, dan imputasi missing values pada data ekspresi gen. Pendekatan imputasi missing values awal hanyalah dengan mengisi nilai nol atau rata-rata baris. Namun, pendekatan ini tidak melihat informasi koheren dalam data. Pendekatan imputasi missing values terbagi menjadi empat berdasarkan informasi yang diperlukan pada algoritmanya, yaitu pendekatan lokal, pendekatan global, pendekatan hybrid, dan pendekatan knowledge assisted. Pada penelitian ini peneliti menggunakan algoritma pendekatan lokal dan global. Metode imputasi missing values paling popular untuk pendekatan global adalah Bayesian Principal Component Analysis (BPCA), sedangkan untuk pendekatan lokal adalah Local Least Square (LLS). Pada metode LLS, pemilihan similaritas gen dilakukan dengan teknik clustering dimana seluruh kondisi dalam data digunakan. Kenyataanya, terkadang gen-gen similar hanya dalam beberapa kondisi eksperimental saja. Maka, diperlukan teknik biclustering untuk dapat menemukan subset gen dan subset kondisi yang similar sebagai informasi lokal. Penerapan ide biclustering dalam LLS dinamakan sebagai Iterative Bicluster-Based Least Square (bi-iLS). Salah satu tahapan awal dalam bi-iLS adalah pembentukan matriks komplit sementara yang didapat dengan cara mengisi missing values dengan row average. Namun, row average dinilai kurang bagus karena hanya menggunakan informasi satu baris tersebut. Kekurangan ini diperbaiki dalam penelitian ini. Penggunaan metode BPCA untuk menemukan matriks komplit sementara dinilai lebih baik karena BPCA menggambarkan struktur keseluruhan data. Penggantian row average menjadi BPCA menjadi dasar masalah penelitian ini. Metode iterative Bicluster-based Bayesian Principal Component Analysis dan Least Square (bi-BPCA- iLS) pun diajukan. Penerapan bi-BPCA-iLS terhadap data ekspresi gen yang dihasilkan teknologi microarray terbukti menghasilkan penurunan nilai Normalzied Root Mean Square Error (NRMSE) sebesar 10,6% dan 0,58% secara rata-rata dalam beberapa missing rate (1%, 5%, 10%, 15%, 20%, 25%, dan 30%) jika dibandingkan dengan metode LLS dan bi-iLS.

Biological research using microarray technique produce some important gene expression datasets. These data can be expressed as a matrix in which rows are genes and columns are different conditions. Further analysis of these datasets requires a complete dataset or matrix. However, gene expression datasets often contain missing values. There are some ways to handle missing values, such as deletion of genes or conditions that contain missing values, repeat the process of acquiring data, and impute the missing values. Early approaches in missing values imputation are simply to replace missing values with zeros or row averages, but these methods do not use the coherence inside the data. Later, approaches in missing values imputations are categorized into four groups based on the required information, such as local, global, hybrid, and knowledge assisted approaches. In this paper, local and global approaches are used. Bayesian Principal Component Analysis (BPCA) is a well-known global based method, while the most popular local based method is Local Least Square (LLS). In LLS, selection of similar genes uses clustering technique where all conditions in the data are included. The reality is genes sometimes only correlate under some experimental conditions only. So, a technique that can find subset of genes under subset of experimental conditions for local information is needed. This technique is called biclustering. The usage of biclustering in LLS is called the Iterative Bicluster-based Least Square (bi-iLS). One of the early steps in bi-iLS is to find a temporary complete matrix. Temporary complete matrix is obtained by applying row averages to impute missing values. However, row average cannot reflect the real structure of the dataset because row average only uses the information of an individual row. The missing values in a target gene do not only rely on the known values of its own row. In this research, row average in bi-iLS is replaced with BPCA. The benefit of using BPCA is that it uses global structure of the dataset. This update will be the basic problem of this research. The proposed method is called Iterative Bicluster-based Bayesian Principal Component Analysis and Least Square (bi-BPCA-iLS). This new proposed method is applied to gene expression datasets from microarray technique. It shown a decrease in values of Normalized Root Mean Square Error (NRMSE) about 10.6% from LLS and about 0.58% from bi-iLS based on different missing rates (1%, 5%, 10%, 15%, 20%, 25%, and 30%)."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Luqyana Adha Azwat
"Optimasi dosis radiasi pada perencanaan klinis menggunakan Treatment Planning System (TPS) untuk pasien radioterapi sangat penting untuk mencapai keseimbangan antara efektivitas terapi dan keselamatan pasien. Namun, proses ini memakan waktu dan sangat bergantung pada keahlian fisikawan medis. Pada penelitian ini dilakukan prediksi dosis menggunakan machine learning pada Planning Target Volume (PTV) dan Organ at Risk (OAR) untuk kasus kanker otak dengan teknik perencanaan Volumetric Modulated Arc Therapy (VMAT). Data DICOM perencanaan di ekstraksi menggunakan 3D slicer untuk mendapatkan nilai radiomic dan dosiomic yang akan digunakan pada penelitian ini dengan menggunakan model algoritma random forest. Hasil evaluasi model menunjukkan bahwa peforma model random forest dalam memprediksi dosis memiliki nilai Mean Square Error (MSE) sebesar 0,018. Nilai Homogeneity Index (HI) dan Conformity Index (CI) untuk data klinis adalah 0,136±0,134 dan 0,939±0,131 secara berturut-turut, sementara hasil prediksinya adalah 0,136±0,039 dan 0,949±0,006, dengan nilai p-value untuk fitur PTV dan OAR > 0,05. Dengan demikian, dapat disimpulkan bahwa model random forest efektif dalam memprediksi dosis untuk PTV kanker otak dan OAR, dan dapat digunakan sebagai referensi dalam proses perencanaan.

Optimizing radiation doses in clinical planning using a Treatment Planning System (TPS) for radiotherapy patients is crucial to achieving a balance between therapeutic effectiveness and patient safety. However, this process is timeconsuming and highly dependent on the expertise of medical physicists. In this study, dose prediction using machine learning for the Planning Target Volume (PTV) and Organ at Risk (OAR) in brain cancer cases was performed using the Volumetric Modulated Arc Therapy (VMAT) planning technique. DICOM planning data was extracted using 3D Slicer to obtain radiomic and dosiomic values, which were then used in this study with a random forest algorithm model. Model evaluation results showed that the random forest model's performance in predicting doses had a Mean Square Error (MSE) of 0.018. The Homogeneity Index (HI) and Conformity Index (CI) values for clinical data were 0.136±0.134 and 0.939±0.131, respectively, while the predicted results were 0.136±0.039 and 0.949±0.006, with p-values for PTV and OAR features > 0.05. Therefore, it can be concluded that the random forest model is effective in predicting doses for brain cancer PTV and OAR and can be used as a reference in the planning process."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Satrio Witjaksono
"
ABSTRAK
Terdapat berbagai macam metode peramalan yang umum
dilakukan untuk memperkirakan jumlah permintaan di masa yang
akan datang. Pada skripsi ini dipilih satu dari sembilan metode
peramalan, untuk dapat diterapkan pada perusahaan PT
Aerowisata Catering Service (ACS) sehingga penentuan metode
peramalan di perusahaan tersebut dapat Iebih efektif dan sesuai.
Dari sembilan metode peramalan, akan dipilih satu yang
paling sesuai dengan mencari Mean Square Error (MSE) dan
Mean Absolute Percent Error (MAPE) terkecil. Dengan MSE akan
dapat dideteksi metode peralaman yang paling baik diantara
beberapa metode peramalan. Sedang dengan MAPE akan dapat
dideteksi berapa persen penyimpangan peramalan yang dibuat
terhadap data yang dimiliki.
Setelah itu, dengan menggunakan Peta Rentang Bergerak
(Moving Range Chart) untuk memeriksa apakah hasil peramalan
telah dapat mewakili data yang ada.
Dari hasil perhitungan dan pemeriksaan, didapat peramalan
dengan metode Trend & Seasonal dengan 12-Butan Moving
Average memiliki nilai MSE terkecil yaitu 5618091053 dan
MAPE terkecil yaitu 2,92 ditambah hasil dari Moving Range Chart
yang memperlihatkan ada point yang keluar kendali yaitu pada
Februari 1996 yang dikarenakan Hari Raya Idul Fitri dan Hari
Raya Imlek berdekatan, sehingga dapat disimpulkan hasil
peramalan masih terkendali.
Dengan demikian metode peramalan Trend & Seasonal dengan 12-Bulan Moving Average sebagai metode peramalan yang paling sesuai untuk PT. ACS.
"
1997
S36811
UI - Skripsi Membership  Universitas Indonesia Library
cover
Maman Firmansyah
"Teknologi speech coding untuk kompresi sinyal speech dilakukan untuk menghemat konsumsi bandwidth. Salah satu metode analisis speech coding adalah Linier Predictive Coding (LPC). LPC adalah suatu metode yang memprediksi sampel ke-n dari suatu sinyal, s(n), dengan membentuk kombinasi linier dari p sampel sebelumnya. Algoritma Mixed Excited Linier Prediction (MELP) merupakan algoritma kompresi suara yang dikembangkan berdasarkan algoritma LPC. Pada coder MELP dilakukan pencampuran sinyal eksitasi pulsa dan noise untuk menghilangkan dengung yang dihasilkan LPC biasa. Pemilihan nilai koefisien linear prediction (LP) yang memiliki nilai Mean Square Error (MSE) terkecil terhadap sinyal asli dilakukan. Koefisien LP yang memiliki nilai MSE terkecil inilah yang akan dikirimkan sebagai model untuk membangkitkan sinyal suara kembali pada penerima. Dari hasil simulasi diperoleh bahwa model yang memiliki nilai MSE terkecil terhadap sinyal asli adalah yang memiliki jumlah koefisien LP sebanyak 10,15 dan 17 buah bergantung darijenis input suara."
Depok: Fakultas Teknik Universitas Indonesia, 2006
S40754
UI - Skripsi Membership  Universitas Indonesia Library
cover
K. Aparna
"Data clustering is one of the major areas in data mining. The bisecting clustering algorithm is one of the most widely used for high dimensional dataset. But its performance degrades as the dimensionality increases. Also, the task of selection of a cluster for further bisection is a challenging one. To overcome these drawbacks, we developed a novel partitional clustering algorithm called a HB-K-Means algorithm (High dimensional Bisecting K-Means). In order to improve the performance of this algorithm, we incorporate two constraints, such as a stability-based measure and a Mean Square Error (MSE) resulting in CHB-K-Means (Constraint-based High dimensional Bisecting K-Means) algorithm. The CHB-K-Means algorithm generates two initial partitions. Subsequently, it calculates the stability and MSE for each partition generated. Inference techniques are applied on the stability and MSE values of the two partitions to select the next partition for the re-clustering process. This process is repeated until K number of clusters is obtained. From the experimental analysis, we infer that an average clustering accuracy of 75% has been achieved. The comparative analysis of the proposed approach with the other traditional algorithms shows an achievement of a higher clustering accuracy rate and an increase in computation time."
2016
J-Pdf
Artikel Jurnal  Universitas Indonesia Library
cover
Nidia Ayu
"Coronavirus Disease (COVID-19) adalah penyakit baru yang melanda dunia tahun 2020.
Penyakit ini diperkirakan berasal dari Wuhan, China (Rothan HA, 2020). WHO
menetapkan COVID-19 sebagai pandemi karena penyakit ini telah berhasil menginfeksi
lebih dari 190 negara di dunia. DKI Jakarta adalah Ibu Kota di Indonesia yang turut
menjadi salah satu Provinsi dengan kasus konfirmasi positif COVID-19 tertinggi sampai
akhir Juli 2020. Penelitian ini bertujuan untuk memodelkan rate kasus COVID-19 pada
15 kecamatan Jakarta dengan intensitas tertinggi. Alasan dipilihnya 15 kecamatan dengan
intensitas tertinggi untuk menjadi area penelitian karena lebih dari 63,43% kasus
konfirmasi COVID-19 dilaporkan dari 15 kecamatan, yakni Kecamatan Gambir,
Menteng, Sawah Besar, Kemayoran, Taman Sari, Senen, Tanah Abang, Johar Baru,
Tambora, Grogol Petamburan, Cempaka Putih, Pademangan, Setia Budi, Matraman, dan
Palmerah. Rate kasus COVID-19 pada area ini kemudian dibuat model GSTAR, model
ini merupakan salah satu pemodelan dalam time seriesstokastik yang mempertimbangkan
indeks spasial atau lokasi dan waktu (Budi, 2019). Matriks bobot biner, matriks bobot
seragam, dan matriks bobot jarak pada penelitian ini dibentuk sebagai matriks dependensi
spasial antar lokasi atau disebut matriks bobot W. Hasil identifikasi STACF dan STPACF
untuk semua matriks pembobot spasial didapatkan model yang sama, yaitu GSTAR(3,1).
Pendugaan parameter model GSTAR(3,1) dilakukan untuk setiap matriks pembobot
tersebut. Model GSTAR(3,1) yang terbaik diperoleh berdasarkan matriks pembobot
jarak, dengan RMSE terkecil yaitu 0.1271.

Coronavirus Disease (COVID-19) is a new disease that hit the world in 2020. This disease
is thought to have originated in Wuhan, China (Rothan HA, 2020). WHO has designated
COVID-19 as a pandemic because this disease has successfully infected more than 190
countries in world. DKI Jakarta is the capital city in Indonesia which is also one of the
provinces with the highest positive confirmed cases of COVID-19 until the end of July
2020. This study aims to model the level of COVID-19 cases in 15 sub-districts of DKI
Jakarta with the highest intensity. The reason for choosing 15 sub-districts with the
highest intensity to be the research area was because more than 63.43% of confirmed
COVID-19 cases were reported from 15 sub-districts, that is Gambir, Menteng, Sawah
Besar, Kemayoran, Taman Sari, Senen, Tanah Abang, Johar Baru Districts , Tambora,
Grogol Petamburan, Cempaka Putih, Pademangan, Setia Budi, Matraman, and Palmerah.
Rate of COVID-19 cases in this area is then made a GSTAR model, this model is one of
the models in a stochastic time series that considers spatial index or location and time
(Budi, 2019). The binary weight matrix, uniform weight matrix, and distance weight
matrix in this study were formed as a spatial dependency matrix between locations or
called the W weight matrix. The results of STACF and STPACF services for all spatial
weighting matrices obtained the same model, that is GSTAR (3,1). Estimation of
parameters of the GSTAR model (3,1) is carried out for each weighting matrix. The best
GSTAR (3,1) model is based on a distance weighted matrix, with an RMSE of 0.1271
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Kinanty Tasya Octaviane
"Teknologi DNA microarray menghasilkan data ekspresi gen yang dapat digunakan untuk membantu berbagai pemecahan masalah dalam dunia kesehatan. Data ekspresi gen merupakan matriks berukuran besar berisi gen dan kondisi eksperimental yang tak jarang mengandung missing values dan outlier. Data yang mengandung missing values dapat mengganggu dan membatasi analisis. Untuk mengatasinya, metode komputasi dinilai layak untuk imputasi missing values pada data ekspresi gen sebelum dilakukan analisis lanjutan, terlebih untuk data yang memiliki outlier. Oleh karena itu, pada penelitian ini digunakan metode imputasi missing values NCBI-LPCM untuk mengatasi permasalahan missing values pada data ekspresi gen yang memiliki outlier. Metode NCBI-LPCM menggunakan ukuran korelasi LPCM yang dapat menangani keberadaan outlier untuk pembentukan bicluster dan imputasi least square yang merupakan metode imputasi dengan pendekatan lokal. LPCM mengidentifikasi gen-gen yang memiliki pola korelasi similar sehingga menjadi informasi lokal untuk dasar imputasi. Metode ini diterapkan pada data ekspresi gen pasien Leukemia Limfoblastik Akut pada missing rate 5%, 10%, 15%, 20%, 25%, 30%, dan 35%. Berdasarkan RMSE dan korelasi Pearson, metode NCBI-LPCM lebih baik jika dibandingkan dengan NCBI-SSSim yang juga dapat menangani keberadaan outlier.

DNA microarray technology produces gene expression data that can be used to help solve various problems in healthcare. Gene expression data is a large matrix of genes and experimental conditions that often contains missing values and outliers. Data containing missing values can interfere with and limit analyses. To overcome this, computational methods are considered feasible for imputing missing values in gene expression data before further analysis is carried out, especially for data that has outliers. Therefore, in this study, the NCBI-LPCM missing values imputation method was used to overcome the problem of missing values in gene expression data with outliers. The NCBI-LPCM method uses the LPCM correlation measure which can handle the presence of outliers for bicluster formation and least square imputation which is an imputation method with a local approach. LPCM identifies genes that have similar correlation patterns so that they become local information for the basis of imputation. This method was applied to gene expression data of Acute Lymphoblastic Leukaemia patients at missing rates of 5%, 10%, 15%, 20%, 25%, 30%, and 35%. Based on RMSE and Pearson correlation, the NCBI- LPCM method is better than NCBI-SSSim which can also handle the presence of outliers."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
K. Aparna
"Data clustering is one of the major areas in data mining. The bisecting clustering algorithm is one of the most widely used for high dimensional dataset. But its performance degrades as the dimensionality increases. Also, the task of selection of a cluster for further bisection is a challenging one. To overcome these drawbacks, we developed a novel partitional clustering algorithm called a HB-K-Means algorithm (High dimensional Bisecting K-Means). In order to improve the performance of this algorithm, we incorporate two constraints, such as a stability-based measure and a Mean Square Error (MSE) resulting in CHB-K-Means (Constraint-based High dimensional Bisecting K-Means) algorithm. The CHB-K-Means algorithm generates two initial partitions. Subsequently, it calculates the stability and MSE for each partition generated. Inference techniques are applied on the stability and MSE values of the two partitions to select the next partition for the re-clustering process. This process is repeated until K number of clusters is obtained. From the experimental analysis, we infer that an average clustering accuracy of 75% has been achieved. The comparative analysis of the proposed approach with the other traditional algorithms shows an achievement of a higher clustering accuracy rate and an increase in computation time."
Depok: Faculty of Engineering, Universitas Indonesia, 2016
UI-IJTECH 7:4 (2016)
Artikel Jurnal  Universitas Indonesia Library
<<   1 2   >>