dc.contributor.author |
Ελευθερίου, Νικόλαος Α.
|
el |
dc.contributor.author |
Eleftheriou, Nikolaos A.
|
en |
dc.date.accessioned |
2015-05-05T09:43:49Z |
|
dc.date.available |
2015-05-05T09:43:49Z |
|
dc.date.issued |
2015-05-05 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/40702 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.8767 |
|
dc.rights |
Default License |
|
dc.subject |
Ανάλυση Παλινδρόμησης |
el |
dc.subject |
Regression Analysis |
en |
dc.subject |
Κριτήριο πληροφορίας του Ακάικε |
el |
dc.subject |
Μπευζιανό κριτήριο πληροφορίας |
el |
dc.subject |
Σφάλματα τύπου Ι |
el |
dc.subject |
Σφάλματα τύπου ΙΙ |
el |
dc.subject |
AIC |
en |
dc.subject |
Bootstrap |
en |
dc.subject |
Jackknife |
en |
dc.subject |
Errors type I and II |
en |
dc.subject |
BIC |
en |
dc.title |
Επιλογή μοντέλων βάσει μεθόδων Bootstrap και Jackknife |
el |
heal.type |
bachelorThesis |
|
heal.secondaryTitle |
Model selection based on the Bootstrap and Jackknife methods |
en |
heal.classification |
Στατιστική |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2015-02-16 |
|
heal.abstract |
Η ανάλυση παλινδρόμησης αποτελεί ένα στατιστικό εργαλείο για την διερεύνηση των σχέσεων μεταξύ μεταβλητών και ιδιαίτερα στην περιγραφή του τρόπου μεταβολής της σχέσης της εξαρτημένης μεταβλητής με μια ή περισσότερες ανεξάρτητες μεταβλητές. Η διερεύνηση γίνεται συνήθως με την συλλογή δεδομένων για τις υπό εξέταση μεταβλητές και εκτιμώντας την ποσοτική επίδραση που έχουν σε άλλες μεταβλητές. Οι σχέσεις αυτές μεταξύ των μεταβλητών παρουσιάζονται με κάποια μαθηματική εξίσωση και αποτελούν ένα στατιστικό μοντέλο. Συχνά όμως υπάρχει μεγάλη δυσκολία στην εύρεση εκείνου του μοντέλου στο οποίο όλα τα δεδομένα μας θα προσαρμόζονται. Για την εύρεση εκείνου του βέλτιστου μοντέλου και των μεταβλητών του που θα περιγράφει καλύτερα τα δεδομένα μας, έχουν αναπτυχθεί διάφορα κριτήρια επιλογής μοντέλων τα οποία συγκρίνοντας όλα τα δυνατά μοντέλα προσπαθούν να επιλέξουν το βέλτιστο από αυτά.
Σκοπός της εργασίας αυτής είναι η σύγκριση δύο κριτηρίων επιλογής μοντέλων, το AIC (Akaike’s information criterion) και το BIC (Bayesian information criterion). Επιπλέον, συγκρίνεται η απόδοση των δύο κριτηρίων όταν αυτά συνδυάζονται με μεθόδους αναδειγματοληψίας όπως η Bootstrap και η Jackknife.
Πιο αναλυτικά στο πρώτο κεφάλαιο περιγράφεται η έννοια και ο ρόλος του στατιστικού μοντέλου. Ενώ στο δεύτερο κεφάλαιο παρουσιάζονται βασικές έννοιες που χρησιμοποιούνται στην εργασία, όπως για παράδειγμα της ανάλυσης παλινδρόμησης, της λογαριθμικής πιθανοφάνειας και του συντελεστή συσχέτισης.
Στο τρίτο κεφάλαιο αναλύονται τα κριτήρια επιλογής μοντέλων AIC (Akaike’s Information Criterion) και BIC (Bayesian Information Criterion). Αναλύεται η έννοια της Kullback-Leibler πληροφορίας και δίνονται οι περιγραφές των αποδείξεων των δύο κριτηρίων.
Στο τέταρτο κεφάλαιο αναλύονται οι μέθοδοι αναδειγματοληψίας Bootstrap και Jackknife, οι βασικές τους έννοιες και δίνονται μερικά παραδείγματα εφαρμογής τους.
Στο τελευταίο κεφάλαιο παρουσιάζονται οι προσομοιώσεις που συγκρίνουν τα κριτήρια πληροφορίας για τις δύο μεθόδους αναδειγματοληψίας. Υπολογίζονται οι φορές που επιλέγεται το σωστό μοντέλο καθώς και τα σφάλματα τύπου Ι και ΙΙ σε διάφορες προσομοιώσεις. Τα προγράμματα που χρησιμοποιήθηκαν κατασκευάστηκαν στο R 3.0.2 πακέτο. |
el |
heal.abstract |
Regression analysis is a statistical tool for investigating the relationships between variables and especially for specifying how the relationship between a dependent variable and one or more independent variables varies. The investigation, often, involves the assembly of data on the variables under study and estimating the quantitative effect that they have on the other variables. These relationships are represented as mathematical equations and depict a statistical model. Though often, there is great difficulty in finding that model that best fits all our data. In order to find that optimal model and the variables that will best describe our data, different model selection criteria have been developed which by comparing all possible models they try to select the optimal one.
The purpose of this thesis is the comparison of two model selection criteria, the AIC (Akaike’s Information Criterion) and BIC (Bayesian Information Criterion). Moreover, the performance of the two criteria is compared in cases where they are combined with resampling methods like the Bootstrap and the Jackknife.
More specifically, in the first chapter the concept and role of the statistical model is described. While in the second one basic concepts that are used in the thesis are introduced, like for example the theory of regression analysis, the log likelihood and the correlation coefficient.
In the third chapter, the model selection criteria AIC and BIC are analysed. The theory of Kullback-Leibler is presented as well as descriptions of the proofs of the two criteria.
In the fourth chapter the resampling methods Bootstrap and Jackknife are being introduced. The basic concepts behind the methods and a few examples with applications are given.
In the last chapter, simulations through which we compare the criteria for both resampling methods are being presented. The percentage of times that a correct model is selected is being computed as well as the errors of type I and II in different cases. The code of the programs used has been written in R 3.0.2. |
en |
heal.advisorName |
Βόντα, Φιλία |
el |
heal.committeeMemberName |
Βόντα, Φιλία |
el |
heal.committeeMemberName |
Καρώνη, Χρυσηίς |
el |
heal.committeeMemberName |
Κουκουβίνος, Χρήστος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
84 σ. |
|
heal.fullTextAvailability |
true |
|