Σκοπός της διπλωματικής αυτής εργασίας είναι η παρουσίαση των ισχυρών και πλέον γνωστών μεθόδων Markov Chain Monte Carlo (MCMC), που παράγουν κατά προσέγγιση δείγματα από μια κατανομή, με παραδείγματα και εφαρμογές στo στατιστικό πακέτο R.
Στο πρώτο κεφάλαιο γίνεται μια περιληπτική ανάλυση στη θεωρία των στοχαστικών ανελίξεων με αναφορά στις βασικές κατηγορίες στοχαστικών ανελίξεων ενώ δίνεται ιδιαίτερη έμφαση στις Μαρκοβιανές αλυσίδες και στις διάφορες ιδιότητες τους. Ακόμη, αναλύεται η έννοια της στάσιμης συνάρτησης κατανομής ενώ περιλαμβάνονται και κάποια παραδείγματα στην R με σκοπό την πλήρη κατανόηση της έννοιας αυτής.
Στο δεύτερο κεφάλαιο γίνεται μια επιγραμματική αναφορά σε διάφορες μεθόδους δειγματοληψίας ενώ παρουσιάζεται περιληπτικά και η μέθοδος εκτιμητριών Monte Carlo. Ακόμη, γίνεται μία εισαγωγή στις μεθόδους MCMC ενώ παράλληλα παραθέτονται και κάποια πιθανά προβλήματα των μεθόδων αυτών καθώς και ο εντοπισμός αυτών των προβλημάτων με τα κατάλληλα διαγνωστικά εργαλεία.
Στο τρίτο κεφάλαιο πραγματοποιείται η ανάλυση της μεθόδου Metropolis-Hastings που είναι ένα από τα κυριότερα μέλη των αλγόριθμων Markov Chain Monte Carlo. Αρχικά, παρουσιάζονται οι πιο κοινές μορφές του αλγόριθμου Metropolis-Hastings, ανάλογα με την κατανομή εισήγησης που χρησιμοποιείται κάθε φορά, με αρκετά παραδείγματα, ενώ γίνεται και σύγκριση αυτών των μεθόδων με απλούς δειγματολήπτες που παράγουν ανεξάρτητες και ισόνομες τυχαίες τιμές. Ακόμη, σε αυτό το κεφάλαιο συζητείται η βαθμονόμηση του αλγόριθμου μέσω του ποσοστού αποδοχής ενώ τέλος παραθέτονται και κάποιες εφαρμογές του Metropolis-Hastings στην R.
Στο τέταρτο κεφάλαιο αναλύεται επίσης μια ευρεία διαδεδομένη μέθοδος των MCMC, ο δειγματολήπτης Gibbs. Παρουσιάζεται αναλυτικά ο απλός δειγματολήπτης Gibbs δύο σταδίων αλλά και εκείνος με τα πολλαπλά στάδια συνοδευόμενοι από παραδείγματα στην R. Τέλος, δίνεται μια ιδιαίτερη έμφαση στους παράγοντες που εμποδίζουν την αποτελεσματικότητα των αλγόριθμων Gibbs με αντίστοιχα παραδείγματα και εφαρμογές στο στατιστικό πακέτο R.
Τέλος, στο πέμπτο κεφάλαιο γίνεται μια αναφορά σε κάποιους άλλους Μαρκοβιανούς δειγματολήπτες, όπως ο hit-and-run και ο slice sampler, ενώ παραθέτονται οι αντίστοιχοι αλγόριθμοι αυτών των δειγματοληπτών και κάποια παραδείγματα για την καλύτερη κατανόηση τους.
The purpose of this dissertation is the presentation of the powerful and well-known methods Markov Chain Monte Carlo (MCMC), which produce samples from an arbitrary distribution, with a number of examples and applications in the statistical package, R.
The first chapter is the summary of the theory of stochastic processes with a reference to the basic categories of stochastic processes with particular emphasis on Markov Chains and their various properties. Moreover, theorems and definitions on the stationary distribution are given including some examples in R in order to become fully comprehensible.
The second chapter seeks a general introduction to various sampling methods while it presents Monte Carlo estimation methods. Furthermore, in this chapter takes place an introduction in MCMC methods and the identification of some potential problems of MCMC algorithms with the appropriate diagnostic tools.
The third chapter includes the analysis of Metropolis-Hastings algorithm which is one of the main members of the Markov Chain Monte Carlo methods. Firstly, the most common versions of Metropolis-Hastings, according to the proposal distribution, are presented with several examples and comparisons with other samplers. Secondly, there is a discussion about the calibration of the algorithm via its acceptance rate. Finally, further applications of various types of Metropolis-Hastings are made.
The fourth chapter presents Gibbs sampler, which might be considered the workhorse of the MCMC world. This chapter covers both the two-stage and the multistage Gibbs samplers with corresponding examples in R. Furthermore, a special emphasis is given on several factors that might hinder the implementation of a Gibbs algorithm while a number of applications are cited in the last section.
Finally, the fifth chapter summarizes two other basic Markov samplers, hit-and-run and slice sampler, with the corresponding algorithms and relevant examples for better understanding.