HEAL DSpace

Επιλογή μοντέλων βάσει μεθόδων Bootstrap και Jackknife

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ελευθερίου, Νικόλαος Α. el
dc.contributor.author Eleftheriou, Nikolaos A. en
dc.date.accessioned 2015-05-05T09:43:49Z
dc.date.available 2015-05-05T09:43:49Z
dc.date.issued 2015-05-05
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/40702
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.8767
dc.rights Default License
dc.subject Ανάλυση Παλινδρόμησης el
dc.subject Regression Analysis en
dc.subject Κριτήριο πληροφορίας του Ακάικε el
dc.subject Μπευζιανό κριτήριο πληροφορίας el
dc.subject Σφάλματα τύπου Ι el
dc.subject Σφάλματα τύπου ΙΙ el
dc.subject AIC en
dc.subject Bootstrap en
dc.subject Jackknife en
dc.subject Errors type I and II en
dc.subject BIC en
dc.title Επιλογή μοντέλων βάσει μεθόδων Bootstrap και Jackknife el
heal.type bachelorThesis
heal.secondaryTitle Model selection based on the Bootstrap and Jackknife methods en
heal.classification Στατιστική el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-02-16
heal.abstract Η ανάλυση παλινδρόμησης αποτελεί ένα στατιστικό εργαλείο για την διερεύνηση των σχέσεων μεταξύ μεταβλητών και ιδιαίτερα στην περιγραφή του τρόπου μεταβολής της σχέσης της εξαρτημένης μεταβλητής με μια ή περισσότερες ανεξάρτητες μεταβλητές. Η διερεύνηση γίνεται συνήθως με την συλλογή δεδομένων για τις υπό εξέταση μεταβλητές και εκτιμώντας την ποσοτική επίδραση που έχουν σε άλλες μεταβλητές. Οι σχέσεις αυτές μεταξύ των μεταβλητών παρουσιάζονται με κάποια μαθηματική εξίσωση και αποτελούν ένα στατιστικό μοντέλο. Συχνά όμως υπάρχει μεγάλη δυσκολία στην εύρεση εκείνου του μοντέλου στο οποίο όλα τα δεδομένα μας θα προσαρμόζονται. Για την εύρεση εκείνου του βέλτιστου μοντέλου και των μεταβλητών του που θα περιγράφει καλύτερα τα δεδομένα μας, έχουν αναπτυχθεί διάφορα κριτήρια επιλογής μοντέλων τα οποία συγκρίνοντας όλα τα δυνατά μοντέλα προσπαθούν να επιλέξουν το βέλτιστο από αυτά. Σκοπός της εργασίας αυτής είναι η σύγκριση δύο κριτηρίων επιλογής μοντέλων, το AIC (Akaike’s information criterion) και το BIC (Bayesian information criterion). Επιπλέον, συγκρίνεται η απόδοση των δύο κριτηρίων όταν αυτά συνδυάζονται με μεθόδους αναδειγματοληψίας όπως η Bootstrap και η Jackknife. Πιο αναλυτικά στο πρώτο κεφάλαιο περιγράφεται η έννοια και ο ρόλος του στατιστικού μοντέλου. Ενώ στο δεύτερο κεφάλαιο παρουσιάζονται βασικές έννοιες που χρησιμοποιούνται στην εργασία, όπως για παράδειγμα της ανάλυσης παλινδρόμησης, της λογαριθμικής πιθανοφάνειας και του συντελεστή συσχέτισης. Στο τρίτο κεφάλαιο αναλύονται τα κριτήρια επιλογής μοντέλων AIC (Akaike’s Information Criterion) και BIC (Bayesian Information Criterion). Αναλύεται η έννοια της Kullback-Leibler πληροφορίας και δίνονται οι περιγραφές των αποδείξεων των δύο κριτηρίων. Στο τέταρτο κεφάλαιο αναλύονται οι μέθοδοι αναδειγματοληψίας Bootstrap και Jackknife, οι βασικές τους έννοιες και δίνονται μερικά παραδείγματα εφαρμογής τους. Στο τελευταίο κεφάλαιο παρουσιάζονται οι προσομοιώσεις που συγκρίνουν τα κριτήρια πληροφορίας για τις δύο μεθόδους αναδειγματοληψίας. Υπολογίζονται οι φορές που επιλέγεται το σωστό μοντέλο καθώς και τα σφάλματα τύπου Ι και ΙΙ σε διάφορες προσομοιώσεις. Τα προγράμματα που χρησιμοποιήθηκαν κατασκευάστηκαν στο R 3.0.2 πακέτο. el
heal.abstract Regression analysis is a statistical tool for investigating the relationships between variables and especially for specifying how the relationship between a dependent variable and one or more independent variables varies. The investigation, often, involves the assembly of data on the variables under study and estimating the quantitative effect that they have on the other variables. These relationships are represented as mathematical equations and depict a statistical model. Though often, there is great difficulty in finding that model that best fits all our data. In order to find that optimal model and the variables that will best describe our data, different model selection criteria have been developed which by comparing all possible models they try to select the optimal one. The purpose of this thesis is the comparison of two model selection criteria, the AIC (Akaike’s Information Criterion) and BIC (Bayesian Information Criterion). Moreover, the performance of the two criteria is compared in cases where they are combined with resampling methods like the Bootstrap and the Jackknife. More specifically, in the first chapter the concept and role of the statistical model is described. While in the second one basic concepts that are used in the thesis are introduced, like for example the theory of regression analysis, the log likelihood and the correlation coefficient. In the third chapter, the model selection criteria AIC and BIC are analysed. The theory of Kullback-Leibler is presented as well as descriptions of the proofs of the two criteria. In the fourth chapter the resampling methods Bootstrap and Jackknife are being introduced. The basic concepts behind the methods and a few examples with applications are given. In the last chapter, simulations through which we compare the criteria for both resampling methods are being presented. The percentage of times that a correct model is selected is being computed as well as the errors of type I and II in different cases. The code of the programs used has been written in R 3.0.2. en
heal.advisorName Βόντα, Φιλία el
heal.committeeMemberName Βόντα, Φιλία el
heal.committeeMemberName Καρώνη, Χρυσηίς el
heal.committeeMemberName Κουκουβίνος, Χρήστος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.numberOfPages 84 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής