Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 55797 dokumen yang sesuai dengan query
cover
Muhamad Ihsan
"Nilai hilang merupakan suatu masalah yang sering dijumpai di berbagai bidang dan harus diatasi untuk memperoleh inferensi statistik yang baik seperti penaksiran parameter. Nilai hilang dapat ditemukan pada setiap jenis data, salah satunya pada jenis data cacah/ count data yang berdistribusi Poisson. Solusi untuk mengatasi masalah nilai hilang berjenis data cacah tersebut dapat diatasi dengan menerapkan teknik imputasi ganda. Teknik imputasi ganda merupakan suatu cara mengatasi nilai hilang dengan mengganti setiap nilai yang hilang dengan beberapa nilai estimasi. Teknik imputasi ganda untuk kasus data cacah terdiri dari tiga tahap utama yaitu tahap imputasi berdasarkan model linier normal, tahap analisis dengan metode generalized linear model Poisson regression dan tahap penggabungan pooling parameter yang didasarkan pada aturan Rubin. Studi ini juga dilengkapi dengan simulasi numerik yang bertujuan untuk komparasi akurasi berdasarkan nilai bias yang dihasilkan. Parameter yang digunakan pada simulasi ini yaitu sebesar 5,10 dan 15 dengan jumlah sampel sebesar 200 untuk tujuan mengaproksimasi sifat kenormalan dan simulasi ini diulang untuk empat skenario yang bertingkat untuk setiap parameter berdasarkan besarnya persentase observasi nilai hilang (0%, 10%, 20% dan 30%). Berdasarkan studi literatur dan simulasi numerik yang dilakukan, solusi yang diajukan untuk mengatasi nilai hilang pada data cacah menghasilkan hasil yang cukup memuaskan terutama saat parameter bernilai besar dan persentase observasi nilai hilang yang kecil. Hal ini diindikasikan dengan ukuran bias dan variansi total dari taksiran rata-rata yang kecil. Namun nilai bias cenderung meningkat seiring meningkatnya persentase observasi nilai yang hilang dan saat nilai parameter yang kecil.

Missing values are a problem that is often encountered in various fields and must be addressed to obtain good statistical inference such as parameter estimation. Missing values can be found in any type of data, included count data that has Poisson distributed. One solution to overcome that problem is applying multiple imputation techniques. The multiple imputation technique is a way of dealing with missing values by replacing each missing value with some estimated values. The multiple imputation technique for the case of count data consists of three main stages, namely the imputation stage based on the normal linear model, the analysis stage using the generalized linear model Poisson regression and the last stage is pooling parameter based on Rubins rules. This study is also equipped with numerical simulations which aim to compare accuracy based on the resulting bias value. The parameters used in this simulation are 5, 10 and 15 with a sample size of 200 for the purpose of approximating normal properties and this simulation is repeated for four multilevel scenarios for each parameter based on the percentage of observation of missing values (0%, 10%, 20% and 30%). Based on the study of literature and numerical simulations carried out, the solutions proposed to overcome the missing values in the count data yield satisfactory results, especially when the parameters are large and the percentage of observation of the missing values is small. This is indicated by the size of the bias and the total variance of the small average estimate. But the bias value tends to increase with increasing percentage of observation of missing values and when the parameter values are small."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Emha Fathul Akmam
"Nilai yang hilang adalah suatu kondisi ketika ada beberapa entri yang hilang atau nilai kosong pada beberapa pengamatan dalam data. Ini dapat menyebabkan kita memiliki data yang tidak lengkap yang dapat menghambat proses analisis statistik dan dapat memberikan kesimpulan yang bias dari analisis jika tidak dapat ditangani dengan benar. Masalah ini juga dapat ditemukan dalam beberapa analisis regresi linier. Salah satu cara untuk mengatasi masalah ini adalah dengan menggunakan beberapa metode imputasi yang disebut Predictive Mean Matching (PMM). Beberapa imputasi adalah pendekatan umum untuk menangani data yang hilang yang memungkinkan ketidakpastian tentang data yang hilang dengan membuat serangkaian data imputasi yang masuk akal dan hasil analisis gabungan tepat yang diperoleh dari setiap data. Metode ini akan mencocokkan jarak rata-rata prediktif dari pengamatan tidak lengkap dengan pengamatan lengkap. Dengan demikian, pengamatan lengkap yang memiliki jarak terdekat akan menjadi nilai donor bagi yang tidak lengkap. Mean prediktif untuk pengamatan lengkap diperkirakan dengan kuadrat biasa yang paling tidak lengkap dan didekati oleh konsep Bayesian. Artikel ini akan menjelaskan tentang distribusi posterior yang memungkinkan ketidakpastian nilai yang hilang untuk memperkirakan parameter pengamatan yang tidak lengkap dan mendapatkan rata-rata prediktif mereka. Artikel ini akan memberikan hasil tentang penerapan metode PMM dalam data simulasi yang memiliki pola hilang univariat dengan mekanisme MAR dan dievaluasi dengan nilai bias dari koefisien regresi dari koefisien hasil pada dataset yang ditentukan.

Missing value is a condition when there are some missing entries or empty values ​​on some observations in the data. This can cause us to have incomplete data that can hinder the process of statistical analysis and can provide biased conclusions from the analysis if it cannot be handled properly. This problem can also be found in several linear regression analyzes. One way to overcome this problem is to use several imputation methods called Predictive Mean Matching (PMM). Some imputations are a general approach to handling missing data that allows uncertainty about missing data by making a series of reasonable imputation data and the precise combined analysis results obtained from each data. This method will match the predictive average distance from incomplete observations with complete observations. Thus, a complete observation that has the closest distance will be a donor value for the incomplete. The predictive means for complete observations are estimated with the most incomplete ordinary squares and are approached by the Bayesian concept. This article will explain posterior distributions that allow uncertainty of missing values ​​to estimate incomplete observation parameters and obtain their predictive averages. This article will provide results about the application of the PMM method in simulation data which have a univariate missing pattern with the MAR mechanism and are evaluated with a bias value of the regression coefficient of the yield coefficient on the specified dataset."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dobson, Annette J.
Boca Raton: CRC Press, Taylor & Francis Group, 2008
519.5 DOB i
Buku Teks  Universitas Indonesia Library
cover
Dobson, Annette J.
London: Chapman & Hall, 1993
519.535 DOB i
Buku Teks  Universitas Indonesia Library
cover
Nurul Shabrina
"Microarray merupakan salah satu teknologi pada bidang biologi yang memberikan
informasi tentang ekspresi gen. Data microarray mentah berupa gambar, yang harus
diubah menjadi matriks ekspresi gen dimana baris menunjukkan gen, kolom
menunjukkan kondisi eksperimental. Namun, pada praktiknya data microarray banyak
ditemukan missing values yang tentunya akan menghambat proses dari analisis datanya.
Imputasi merupakan salah satu solusi yang dapat mengatasi adanya missing values pada
data microarray. Dengan menggunakan imputasi, nilai missing values yang terdapat pada
matriks data diprediksi atau diestimasi sehingga diperoleh matriks data yang lengkap.
Metode imputasi yang digunakan pada penelitian ini bernama bi-KNN-RLSP, yang
menggunakan konsep biclustering, principal component analysis, dan regresi kuantil.
Dalam proses pembentukan biclustering, dibutuhkan matriks lengkap sementara yang
diperoleh melalui proses praimputasi dengan KNNimpute. Percobaan bi-KNN-RLSP
dilakukan pada data ekspresi gen garis sel kanker serviks dengan menerapkan missing
rate yang berbeda, yaitu 1%, 5%, 10%, 15%, 20%, 25%, dan 30% dengan menggunakan
parameter k=10 pada proses praimputasi KNNimpute. Hasil percobaan tersebut dievaluasi
performanya menggunakan normalized root mean squared error. Nilai rata-rata NRMSE
pada percobaan yang dilakukan sebanyak lima kali memiliki nilai yang lebih rendah
dibandingkan dengan metode bi-RLSP dan row average. Waktu komputasi untuk metode bi-KNN-RLSP dan bi-RLSP tidak jauh berbeda, sehingga dengan waktu yang tidak
signifikan berbeda, metode bi-KNN-RLSP dapat menghasilkan nilai NRMSE yang lebih kecil dibandingkan dengan bi-RLSP. Oleh karena itu, dapat dikatakan bahwa modifikasi praimputasi row average pada metode bi-RLSP menjadi KNNimpute dapat menghasilkan performa imputasi yang lebih bagus. Selain itu, diperoleh hasil bahwa nilai NMRSE untuk metode bi-KNN-RLSP meningkat seiring dengan meningkatnya missing rate.

Microarray is a technology in biology that provides information about gene expression. The raw microarray data is in the form of images, which must be converted into a gene expression matrix where rows indicate genes, columns indicate experimental conditions. However, in practice, many missing values are found in microarray data, which of course
will hinder the process of data analysis. Imputation is one solution that can overcome the missing values in microarray data. By using imputation, the missing values contained in the data matrix are predicted or estimated so that a complete data matrix is obtained. The imputation method used in this study is called bi-KNN-RLSP, which uses the concept of
biclustering, principal component analysis, and quantile regression. In the process of forming biclustering, a temporary complete matrix is needed which is obtained through the pre-imputation process with KNNimpute. The bi-KNN-RLSP experiment was carried out on cervical cancer cell line gene expression data by applying different missing rates,
namely 1%, 5%, 10%, 15%, 20%, 25%, and 30% using the parameter k=10. in the KNNimpute pre-imputation process. The results of these experiments were evaluated for their performance using the normalized root mean squared error. The average value of NRMSE in the five times experiment has a lower value than the bi-RLSP and row average methods. The computation time for the bi-KNN-RLSP and bi-RLSP methods is not much different, so with the time that is not significantly different, the bi-KNN-RLSP method can produce a smaller NRMSE value compared to bi-RLSP. Therefore, it can be said that the modification of the row average preimputation in the bi-RLSP method to KNNimpute can produce better imputation performance. In addition, it was found that the NMRSE value for the bi-KNN-RLSP method increased along with the increase in the missing rate.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Jonathan Anthony
"Kejadian multivariat adalah kejadian-kejadian yang memiliki tidak hanya satu peristiwa yang mempengaruhi, tetapi bisa lebih banyak peristiwa yang memberi dampak pada peristiwa utamanya. Dampak yang dihasilkan dari suatu kejadian dapat berupa apa saja dan bisa diprediksi. Hal ini menyebabkan perlunya dibentuk sebuah model untuk memprediksi dampak dari sebuah kejadian sehingga dapat diambil keputusan penting berdasarkan kejadian tersebut. Saham merupakan salah satu contoh yang dapat direpresentasikan sebagai kejadian multivariat, seperti harga saham saat penutupan atau closing price, harga maksimal penutupan saham pada periode tertentu, dan durasi waktu (bulanan). Harga penutupan saham dan harga maksimal penutupan saham pada periode tertentu merupakan variabel acak kontinu yang masing-masing diasumsikan berdistribusi eksponensial dan truncated logistic. Durasi waktu (bulanan) merupakan variabel acak diskrit yang diasumsikan berdistribusi geometrik. Untuk mengakomodir kejadian multivariat yang melibatkan ketiga variabel acak tersebut digunakan distribusi trivariat yaitu, distribusi TETLG (Trivariate distribution with Exponential, Truncated Logistic, and Geometric marginals). Selanjutnya, untuk mengetahui pola hubungan antara ketiga variabel acak sebagai vektor respon dengan tiga kovariat yaitu, tingkat pengangguran, tingkat inflasi, dan tingkat obligasi 10 tahun, dikonstruksi sebuah Generalized Linear Model (GLM) untuk kejadian multivariat. Estimasi parameter model GLM kejadian multivariat, dilakukan menggunakan metode Maximum Likelihood. Sebagai implementasi pemodelan harga saham menggunakan GLM kejadian multivariat, diterapkan pada data harga penutupan saham dari Yahoo! Finance untuk periode 2 Januari 1958 hingga 17 April 2020. Berdasarkan uji likelihood ratio, diperoleh hasil bahwa hanya tingkat inflasi dan tingkat pengangguran yang memiliki pengaruh signifikan terhadap pemodelan harga saham.

Multivariate events are events that have not only one influencing event, but there can be more events that have an impact on the main event. The impact resulting from an event can be anything and can be predicted. This causes the need to establish a model to predict the impact of an event so that important decisions can be made based on the incident. Stocks are one example that can be represented as multivariate events, such as the closing price of a stock, the maximum closing price for a given period, the duration of time (monthly). The closing price of shares and the maximum closing price of shares in a certain period are continuous random variables which are assumed to have exponential distribution and truncated logistic respectively. Time duration (months) is a discrete random variable which is assumed to have a geometric distribution. To accommodate multivariate events involving the three random variables, a trivariate distribution is used, namely, the TETLG distribution (Trivariate distribution with Exponential, Truncated Logistic, and Geometric marginals). Furthermore, to determine the pattern of relationship between the three random variables as response vectors with three covariates, which are, the unemployment rates, the inflation rates, and the 10-year bond rates, a Generalized Linear Model (GLM) for multivariate events is constructed. Estimation of GLM model parameters for multivariate events was carried out using the Maximum Likelihood method. As an implementation of stock price modeling using GLM multivariate events, it is applied to closing stock price data from Yahoo! Finance for the period January 2, 1958 to April 17, 2020. Based on the likelihood ratio test, it was found that only the inflation rate and unemployment rate had a significant influence on stock price modelling."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia;Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Tri Handhika
"Tugas Akhir ini bertujuan untuk mencari taksiran parameter pada General Linear Mixed Model. Parameter-parameter dalam General Linear Mixed Model merupakan parameter untuk melihat efek fixed dan efek random dari variabel-variabel prediktor terhadap variabel respon. Salah satu metode yang digunakan untuk mencari taksiran parameter pada General Linear Mixed Model adalah Metode Empirical Best Linear Unbiased Prediction (EBLUP).
Berbeda dengan Metode Best Linear Unbiased Prediction (BLUP) di mana parameter dari variansi efek random-nya diketahui, Metode EBLUP memerlukan penaksiran terhadap parameter tersebut yang pada kenyataannya tidak diketahui nilainya. Metode yang digunakan untuk menaksir parameter dari variansi efek random ini ialah Metode Maximum Likelihood (ML). Kemudian, Metode EBLUP dilanjutkan dengan mensubstitusikan taksiran parameter dari variansi efek random ke dalam taksiran parameter pada General Linear Mixed Model yang diperoleh melalui prosedur penaksiran dengan menggunakan Metode BLUP."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahrmeir, Ludwig
New York: Springer-Verlag, 1994
519.535 FAH m (1)
Buku Teks  Universitas Indonesia Library
cover
Murni
"General Linear Mixed Model merupakan model di mana variabel response dipengaruhi oleh faktor fixed dan faktor random. Parameter dari faktor fixed dan random (efek fixed dan random) pada model tersebut tidak diketahui nilainya sehingga harus dilakukan penaksiran. Adapun metode yang digunakan untuk menaksir efek fixed dan random, diantaranya adalah BLUP dan EBLUP. Setelah didapatkan taksiran parameter, selanjutnya akan dilihat seberapa baik taksiran parameter yang diperoleh, yaitu dengan cara mencari Mean Squared Error (MSE) pada General Linear mixed Model. Karena metode penaksiran yang digunakan adalah BLUP dan EBLUP maka pada Tugas Akhir ini akan dibahas mengenai MSE BLUP, MSE EBLUP, dan penaksiran pada MSE EBLUP. Penaksiran ini dilakukan karena nilai dari MSE EBLUP bergantung pada parameter dari variansi efek random yang tidak diketahui nilainya. Kemudian, cara yang digunakan untuk menaksir MSE EBLUP adalah dengan mensubstitusikan taksiran parameter dari variansi efek random ke dalam MSE EBLUP."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2008
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Shabrul Jamil
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2007
S27754
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>