Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query
cover
Jessie Mirra
Abstrak :
Seringkali analisis statistik beranggapan suatu data hanya berasal dari satu populasi saja. Padahal pada kenyataannya terdapat kondisi dimana suatu data bisa dibagi menjadi beberapa sub-populasi. Gaussian Finite Mixture Model adalah salah satu metode untuk memodelkan data heterogen yang memungkinkan berasal dari sub-populasi yang berbeda. Model ini berbentuk superposisi dari beberapa distribusi Gaussian. Jumlah distribusi akan ditentukan dengan menggunakan Akaikes Information Criterion dan model diagnostik. Estimasi parameter pada model ini menggunakan metode Bayesian, yaitu dengan menentukan distribusi prior untuk parameter model, digabungkan dengan likelihood yang akan menghasilkan distribusi posterior. Kemudian, Markov chain Monte Carlo-Gibbs Sampler digunakan untuk menarik sampel pada parameter dari distribusi poteriornya masing-masing. ......Commonly statistical analysis assume data comes from one population. But there are conditions where data might be generated from several sub-populations. Gaussian Finite Mixture Model (GFMM) is one of the methods to model heterogeneous data that might come from different sub-populations. This model was formed as a superposition of several Gaussian distribution, with different location parameter. Number of distributions will be determined using Akaike`s Information Criterion and model diagnostic. Parameter estimation is conducted using Bayesian method, that is by specifying the prior distribution for the models parameters, combined with the likelihood to produce the posterior distribution. Finnally, Markov chain Monte Carlo-Gibbs Sampler is implemented to withdraw sampel of parameters from the corresponding posterior distributions.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Azizah Awaliah
Abstrak :
Regresi Poisson sering digunakan untuk menganalisis data diskrit count data. Regresi ini memiliki asumsi equidispersi. Namun, dalam banyak kasus sering dijumpai asumsi tersebut tidak terpenuhi karena adanya overdispersi pada data. Salah satu penyebab overdispersi adalah excess zero. Model regresi yang dapat digunakan untuk mengatasi masalah tersebut adalah regresi Zero-Inflated Poisson ZIP . Regresi ZIP menyelesaikan masalah excess zero dengan mengidentifikasi structural zeros di tahap pertama dan model Poisson counts di tahap kedua. Pada penelitian ini, parameter regresi ditaksir menggunakan metode Bayesian. Pada metode Bayesian, unsur ketidakpastian parameter dipertimbangkan model dalam bentuk distribusi prior. Dengan mengombinasikan distribusi prior dan likelihood, diperoleh distribusi posterior dari parameter yang menjadi perhatian dalam penelitian. Teknik komputasional Markov Chain Monte Carlo-Gibbs Sampling MCMC-GS digunakan untuk melakukan sampling nilai-nilai parameter dari distribusi posterior tersebut. Metode ini kemudian diterapkan untuk memodelkan frekuensi komplikasi motorik pada 215 penderita penyakit Parkinson. Diperoleh hasil bahwa total skor MDS-UPDRS Part 2 dan 3 berasosiasi dengan konsumsi atau tidaknya obat-obatan pada pasien. Lebih lanjut, untuk mereka yang mengonsumsi obat, total skor MDS-UPDRS Part 1 berasosiasi dengan frekuensi komplikasi motorik. ......Poisson regression is commonly used for analizing count data. This method requires equidispersion assumption. However, in the case of overdispersion, this assumption is not always fulfilled. Overdispersion may exist when there is excess zeros in the data. One of the regression models which might solve it is Zero Inflated Poisson ZIP regression. ZIP regression solves the excess zero problem by identifying the structural zeros at the first stage, then Poisson counts model at the second stage. In this research, the regression parameters are estimated using Bayesian method. Bayesian method acomodates the uncertainty parameters through prior distribution. Combining the prior distribution and likelihood from the data results in the posterior distribution of the parameters of interest. True parameters are then sampled using Markov Chain Monte Carlo Gibbs Sampling MCMC GS. Therefore, this method is applied to model the frequency of motor complications in 215 Parkinson 39 s disease patients. The result shows that total score of MDS UPDRS Part 2 and 3 associated with those taking the medicines or not. Furthermore, for those taking the medicines, total score of MDS UPDRS Part 1 associated with motor complications frequency.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Amanda Putri Tiyas Pratiwi
Abstrak :
Model Cox merupakan model yang sering digunakan untuk menganalisis time-tovent data, yaitu data yang pengamatannya bergantung pada waktu. Terkadang, Selain informasi tentang waktu, data time-to-event juga dilengkapi dengan informasi tambahan (variabel penjelas). Analisis data waktu ke acara seperti ini dengan menggunakan model Cox akan menghasilkan perkiraan bahaya. Model Cox memiliki dua komponen utama yaitu baseline hazard dan mengandung fungsi eksponensial koefisien regresi. Bahaya didefinisikan sebagai produk antara dua komponen ini. Untuk dapat memperoleh bahaya spesifik, bahaya baseline dan koefisien regresi di model Cox harus diperkirakan. Dalam tesis ini, asumsi konstanta akan didefinisikan sebagai bahaya dasar dari model Cox. Kemudian, konstanta dan koefisien regresi dimasukkan Model ini akan diestimasi dengan menggunakan metode Bayesian dimana sampel diambil Parameter distribusi posterior dilakukan dengan menggunakan metode Markov chain Monte Carlo dengan algoritma pengambilan sampel Gibbs. Untuk metode Bayesian, distribusi sebelumnya untuk Bahaya baseline diasumsikan mengikuti distribusi gamma dan untuk koefisien regresi diasumsikan mengikuti distribusi normal. Data EKG (echocardiogram) yang terdiri dari 106 observasi dan enam variabel penjelas digunakan dalam analisis. Mendapatkan hasil bahwa estimasi parameter yang diperoleh konvergen. ......The Cox model is a model that is often used to analyze time-to-event data, namely data whose observations are time dependent. Sometimes, in addition to information about time, time-to-event data is also supplemented with additional information (explanatory variables). Analysis of time-to-event data like this using the Cox model will yield hazard estimates. The Cox model has two main components, namely the baseline hazard and contains an exponential regression coefficient function. Hazard is defined as a product between these two components. In order to obtain a specific hazard, the baseline hazard and regression coefficient in the Cox model must be estimated. In this thesis, the constant assumption will be defined as the basic hazard of the Cox model. Then, the constants and regression coefficients are entered. This model will be estimated using the Bayesian method where the sample is taken. Posterior distribution parameters are carried out using the Markov chain Monte Carlo method with the Gibbs sampling algorithm. For the Bayesian method, the previous distribution for baseline hazard is assumed to follow the gamma distribution and for the regression coefficient it is assumed to follow a normal distribution. EKG (echocardiogram) data which consists of 106 observations and six explanatory variables were used in the analysis. Obtain the result that the parameter estimates obtained are convergent.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Patrecia Alandia Lukman
Abstrak :
Model regresi logistik umum digunakan untuk memodelkan variabel respon berupa variabel kategorik dengan sejumlah variabel prediktor. Kontribusi dari variabel prediktor terhadap variabel respon dinyatakan melalui koefisien regresi (beta), sehingga beta memiliki peran yang penting dalam penggunaan model. Oleh karena itu, perlu dilakukan estimasi nilai beta. Pada skripsi ini dibahas mengenai estimasi beta menggunakan metode Bayesian. Metode Bayesian adalah metode penaksiran parameter yang memanfaatkan gabungan informasi dari data sampel dan informasi terdahulu/prior mengenai karakteristik parameter yang akan ditaksir sehingga metode Bayesian dapat mengatasi masalah jika kualitas data sampel kurang mendukung pengamatan. Prosedur penaksiran parameter tersebut meliputi spesifikasi distribusi prior, digunakan prior non-konjugat, pembentukan fungsi likelihood, dan pembentukan distribusi posterior. Lalu, metode Bayesian Logistic Regression tersebut akan digunakan dalam menganalisa data pasien kanker nasofaring (KNF) pasca radiasi, untuk menilai signifikansi dari komponen skor Zulewski dalam memprediksi ada tidaknya hipotiroid yang merupakan efek samping jangka panjang dari radiasi yang diberikan untuk KNF. Berdasarkan Markov Chain Monte Carlo dengan Gibbs Sampling, diperoleh hasil estimasi yang konvergen. Hasil yang diperoleh adalah tidak ada komponen skor Zulewski yang lebih signifikan antara satu dengan yang lainnya. Diperlukan tambahan informasi dari pengukuran selain komponen skor Zulewski untuk dapat menentukan apakah seorang pasien KNF akan mengalami hipotiroid atau tidak.
Logistic regression models are commonly used to model response variables in the form of categorical variables with a number of predictor variables. The contribution of the predictor variable to the response variable is expressed through a regression coefficient (beta) so that beta has an important role in the use of the model. Therefore, it is necessary to estimate the value of beta. This thesis will discuss the estimated beta using the Bayesian method. Bayesian Method is a parameter estimation method that utilizes a combination of information from sample data and prior information about the characteristics of the parameters to be estimated so that the Bayesian method can overcome the problem if the quality of the sample data does not support observation. The parameter estimation procedure includes the prior distribution specification, which is to use non-conjugate prior, the formation of the likelihood function, and the formation of the posterior distribution. Then, the Bayesian Logistic Regression method will be used in analyzing post-radiation nasopharyngeal cancer (NPC) patient data, to determine the significance of the Zulewski’s score component in predicting the presence or absence of hypothyroidism which is a long-term side effect of radiation given to NPC. Based on Markov Chain Monte Carlo with Gibbs Sampling, a convergent estimate is obtained. The result is that there is no component of Zulewski’s score that is more significant between one another. Additional information is needed from measurements other than the Zulewski’s score component to be able to determine whether a NPC patient will have hypothyroidism or not.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Dickson Dichandra
Abstrak :
Regresi kuantil adalah metode regresi yang menghubungkan kuantil dari variabel respon dengan satu atau beberapa variabel prediktor. Regresi kuantil memiliki kelebihan yang tidak dimiliki oleh regresi linier yaitu robust terhadap outlier dan dapat memodelkan data yang heteroskedastisitas. Regresi kuantil dapat diestimasi parameternya dengan metode Bayesian. Metode Bayesian adalah alat analisis data yang diturunkan berdasarkan prinsip inferensi Bayesian. Inferensi Bayesian adalah proses mempelajari analisis data secara induktif dengan teorema Bayes. Untuk menaksir parameter regresi dengan inferensi Bayesian, perlu dicari distribusi posterior dari parameter regresi dimana distribusi posterior proporsional terhadap perkalian distribusi prior dan fungsi likelihoodnya. Karena perhitungan distribusi posterior secara analitik sulit untuk dilakukan jika semakin banyak parameter yang ditaksir, maka diajukan metode Markov Chain Monte Carlo (MCMC). Penggunaan metode Bayesian dalam regresi kuantil memiliki kelebihan yaitu penggunaan MCMC memiliki kelebihan yaitu mendapatkan sampel nilai parameter dari distribusi posterior yang tidak diketahui, penggunaan yang efisien secara komputasi, dan mudah diimplementasikannya. Yu dan Moyeed (2001) memperkenalkan regresi kuantil Bayesian dengan menggunakan fungsi likelihood dari error yang berdistribusi Asymmetric Laplace Distribution (ALD) dan menemukan bahwa meminimumkan taksiran parameter pada regresi kuantil sama dengan memaksimalkan fungsi likelihood dari error yang berdistribusi Asymmetric Laplace Distribution (ALD). Metode yang digunakan untuk menaksir parameter regresi kuantil adalah Gibbs sampling dari distribusi ALD yang merupakan kombinasi dari distribusi eksponensial dan Normal. Penaksiran parameter model regresi dilakukan dengan cara pengambilan sampel pada distribusi posterior dari parameter regresi yang ditemukan dalam skripsi ini. Pengambilan sampel pada distribusi posterior dapat menggunakan metode Gibbs sampling. Hasil yang diperoleh dari Gibbs sampling berupa barisan sampel parameter yang diestimasikan. Setelah mendapatkan barisan sampel, barisan sampel dirata-ratakan untuk mendapatkan taksiran parameter regresinya. Studi kasus dalam skripsi ini adalah membahas pengaruh faktor risiko dari nasabah asuransi kendaraan bermotor terhadap besar klaim yang diajukan oleh nasabah. ......Quantile regression is a regression method that links the quantiles of the response variable with one or more predictor variables. Quantile regression has advantages that linear regression does not have; it is robust against outliers and can model heteroscedasticity data. The parameters of quantile regression can be estimated using the Bayesian method. The Bayesian method is a data analysis tool derived based on the Bayesian inference principle. Bayesian inference is the process of studying data analysis inductively with the Bayes theorem. To estimate regression parameters with Bayesian inference, it is necessary to find the posterior distribution of the regression parameters where the posterior distribution is proportional to the product of the prior distribution and its likelihood function. Since the calculation of the posterior distribution analytically is difficult to do if the more parameters are estimated, the Markov Chain Monte Carlo (MCMC) method is proposed. The use of the Bayesian method in quantile regression has advantages, namely the use of MCMC has the advantages of obtaining sample parameter values from an unknown posterior distribution, using computationally efficient, and easy to implement. Yu and Moyeed (2001) introduced Bayesian quantile regression using the likelihood function of errors with an Asymmetric Laplace Distribution (ALD) distribution and found that minimizing parameter estimates in quantile regression is the same as maximizing the likelihood function of errors with an Asymmetric Laplace Distribution (ALD) distribution. The method used to estimate quantile regression parameters is Gibbs sampling from the ALD distribution, which is a combination of the exponential and normal distributions. The estimation of the regression model parameters is done by sampling the posterior distribution of the regression parameters which is found in this thesis. Gibbs sampling method is used to sampling the posterior distribution. The results obtained from Gibbs sampling are a sample sequence of estimated parameters. After obtaining the sample sequences, the sample lines are averaged to obtain an estimated regression parameter. The case study in this thesis discusses the effect of risk factors from motor vehicle insurance customers on the size of claims submitted by customers.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library