Ditemukan 2 dokumen yang sesuai dengan query
Emha Fathul Akmam
Abstrak :
Nilai yang hilang adalah suatu kondisi ketika ada beberapa entri yang hilang atau nilai kosong pada beberapa pengamatan dalam data. Ini dapat menyebabkan kita memiliki data yang tidak lengkap yang dapat menghambat proses analisis statistik dan dapat memberikan kesimpulan yang bias dari analisis jika tidak dapat ditangani dengan benar. Masalah ini juga dapat ditemukan dalam beberapa analisis regresi linier. Salah satu cara untuk mengatasi masalah ini adalah dengan menggunakan beberapa metode imputasi yang disebut Predictive Mean Matching (PMM). Beberapa imputasi adalah pendekatan umum untuk menangani data yang hilang yang memungkinkan ketidakpastian tentang data yang hilang dengan membuat serangkaian data imputasi yang masuk akal dan hasil analisis gabungan tepat yang diperoleh dari setiap data. Metode ini akan mencocokkan jarak rata-rata prediktif dari pengamatan tidak lengkap dengan pengamatan lengkap. Dengan demikian, pengamatan lengkap yang memiliki jarak terdekat akan menjadi nilai donor bagi yang tidak lengkap. Mean prediktif untuk pengamatan lengkap diperkirakan dengan kuadrat biasa yang paling tidak lengkap dan didekati oleh konsep Bayesian. Artikel ini akan menjelaskan tentang distribusi posterior yang memungkinkan ketidakpastian nilai yang hilang untuk memperkirakan parameter pengamatan yang tidak lengkap dan mendapatkan rata-rata prediktif mereka. Artikel ini akan memberikan hasil tentang penerapan metode PMM dalam data simulasi yang memiliki pola hilang univariat dengan mekanisme MAR dan dievaluasi dengan nilai bias dari koefisien regresi dari koefisien hasil pada dataset yang ditentukan.
Missing value is a condition when there are some missing entries or empty values on some observations in the data. This can cause us to have incomplete data that can hinder the process of statistical analysis and can provide biased conclusions from the analysis if it cannot be handled properly. This problem can also be found in several linear regression analyzes. One way to overcome this problem is to use several imputation methods called Predictive Mean Matching (PMM). Some imputations are a general approach to handling missing data that allows uncertainty about missing data by making a series of reasonable imputation data and the precise combined analysis results obtained from each data. This method will match the predictive average distance from incomplete observations with complete observations. Thus, a complete observation that has the closest distance will be a donor value for the incomplete. The predictive means for complete observations are estimated with the most incomplete ordinary squares and are approached by the Bayesian concept. This article will explain posterior distributions that allow uncertainty of missing values to estimate incomplete observation parameters and obtain their predictive averages. This article will provide results about the application of the PMM method in simulation data which have a univariate missing pattern with the MAR mechanism and are evaluated with a bias value of the regression coefficient of the yield coefficient on the specified dataset.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership Universitas Indonesia Library
Muhamad Ihsan
Abstrak :
Nilai hilang merupakan suatu masalah yang sering dijumpai di berbagai bidang dan harus diatasi untuk memperoleh inferensi statistik yang baik seperti penaksiran parameter. Nilai hilang dapat ditemukan pada setiap jenis data, salah satunya pada jenis data cacah/ count data yang berdistribusi Poisson. Solusi untuk mengatasi masalah nilai hilang berjenis data cacah tersebut dapat diatasi dengan menerapkan teknik imputasi ganda. Teknik imputasi ganda merupakan suatu cara mengatasi nilai hilang dengan mengganti setiap nilai yang hilang dengan beberapa nilai estimasi. Teknik imputasi ganda untuk kasus data cacah terdiri dari tiga tahap utama yaitu tahap imputasi berdasarkan model linier normal, tahap analisis dengan metode generalized linear model Poisson regression dan tahap penggabungan pooling parameter yang didasarkan pada aturan Rubin. Studi ini juga dilengkapi dengan simulasi numerik yang bertujuan untuk komparasi akurasi berdasarkan nilai bias yang dihasilkan. Parameter yang digunakan pada simulasi ini yaitu sebesar 5,10 dan 15 dengan jumlah sampel sebesar 200 untuk tujuan mengaproksimasi sifat kenormalan dan simulasi ini diulang untuk empat skenario yang bertingkat untuk setiap parameter berdasarkan besarnya persentase observasi nilai hilang (0%, 10%, 20% dan 30%). Berdasarkan studi literatur dan simulasi numerik yang dilakukan, solusi yang diajukan untuk mengatasi nilai hilang pada data cacah menghasilkan hasil yang cukup memuaskan terutama saat parameter bernilai besar dan persentase observasi nilai hilang yang kecil. Hal ini diindikasikan dengan ukuran bias dan variansi total dari taksiran rata-rata yang kecil. Namun nilai bias cenderung meningkat seiring meningkatnya persentase observasi nilai yang hilang dan saat nilai parameter yang kecil.
Missing values are a problem that is often encountered in various fields and must be addressed to obtain good statistical inference such as parameter estimation. Missing values can be found in any type of data, included count data that has Poisson distributed. One solution to overcome that problem is applying multiple imputation techniques. The multiple imputation technique is a way of dealing with missing values by replacing each missing value with some estimated values. The multiple imputation technique for the case of count data consists of three main stages, namely the imputation stage based on the normal linear model, the analysis stage using the generalized linear model Poisson regression and the last stage is pooling parameter based on Rubins rules. This study is also equipped with numerical simulations which aim to compare accuracy based on the resulting bias value. The parameters used in this simulation are 5, 10 and 15 with a sample size of 200 for the purpose of approximating normal properties and this simulation is repeated for four multilevel scenarios for each parameter based on the percentage of observation of missing values (0%, 10%, 20% and 30%). Based on the study of literature and numerical simulations carried out, the solutions proposed to overcome the missing values in the count data yield satisfactory results, especially when the parameters are large and the percentage of observation of the missing values is small. This is indicated by the size of the bias and the total variance of the small average estimate. But the bias value tends to increase with increasing percentage of observation of missing values and when the parameter values are small.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership Universitas Indonesia Library