Aileen Jessica Novia
Abstrak :
Pada model hidden Markov (HMM), keadaan saat ini hanya bergantung pada keadaan tepat sebelumnya tetapi tidak bergantung pada observasi tepat sebelumnya. Pada skripsi ini dibahas mengenai tipe lain dari HMM yang disebut sebagai model hidden Markov dengan keadaan yang bergantung kepada observasi( Hidden Markov Model with States Sepending on Observations atau HMMSDO). Pada HMMSDO, keadaan saat ini bergantung pada keadaan dan observasi yang terjadi tepat sebelumnya dengan barisan keadaan tetap memenuhi sifat Markov. Tiga masalah pada HMMSDO, yaitu masalah evaluasi model, optimisasi barisan keadaan, dan estimasi parameter.
Pada skripsi ini akan dibahas mengenai HMMSDO, penggunaannya dalam prediksi struktur protein sekunder, beserta analisa implementasinya. Tiga prosedur dalam implementasi adalah estimasi parameter, menghitung likelihood, dan memprediksi barisan struktur protein sekunder. Hasil implementasi menunjukkan adanya pengaruhi nilai awal prosentase keakuratan prediksi dan semakin besar jumlah data training, semakin baik prosentase keakuratan yang dihasilkan. Data yang digunakan adalah data protein immunoglobin dan dapat diunduh pada http://swift.cmbi.ru.nl/gv/pdbfinder/.
......
In the standard hidden Markov model (HMM), the current state depends only on the immediately preceeding state, but does not depend on the immediately preceeding observation. This skripsi presents a new type of hidden Markov model which is called hidden Markov model with states depending on observations (HMMSDO). In HMMSDO, the current state depends on the immediately preceeding state and observation, and the state sequence has Markov property. Three problems in HMMSDO, which are model evaluation, state sequence optimization, and parameter estimation.
This skripsi will gives explanation regarding HMMSDO, the implementation of it in predicting protein secondary structures, and analization of the implementation. Three procedures in the implementation are parameter estimation, computation of likelihood, and prediction of protein secondary structure. The implementation shows that initial parameter value affect the percentage accuracy of predicition and the bigger amount data training used will give better percentage accuracy of prediction. Data that is used is protein from immunoglobin and can be downloaded at http://swift.cmbi.ru.nl/gv/pdbfinder/.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2013
S53823
UI - Skripsi Membership Universitas Indonesia Library