dc.contributor.author |
Γούργουρα, Κωνσταντίνα
|
el |
dc.contributor.author |
Gourgoura, Konstantina
|
en |
dc.date.accessioned |
2021-03-11T07:42:09Z |
|
dc.date.available |
2021-03-11T07:42:09Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/53025 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.20723 |
|
dc.rights |
Default License |
|
dc.subject |
Υπόλοιπα |
el |
dc.subject |
Δυαδική διάσπαση |
el |
dc.subject |
Καμπύλη kaplan - meier |
el |
dc.subject |
Πρόβλεψη |
el |
dc.subject |
Residuals |
en |
dc.subject |
Kaplan - meier curve |
en |
dc.subject |
Recursive partitioning |
en |
dc.subject |
Prediction |
en |
dc.subject |
AIC |
en |
dc.title |
Προσεγγίσεις στη στατική μοντελοποίηση - παλινδρόμηση και δέντρα |
el |
dc.title |
Approaches to statistical modeling - regression and trees |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Μαθηματικά |
el |
heal.classification |
Στατιστική Μοντελοποίηση |
el |
heal.classification |
Mathematics |
en |
heal.classification |
Statistical Modeling |
en |
heal.language |
el |
|
heal.access |
campus |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2021-02-25 |
|
heal.abstract |
Η Στατιστική Ανάλυση αποτελεί μία επιστήμη, η οποία μας δίνει τη δυνατότητα να επεξεργαστούμε, να παρουσιάσουμε και να ερμηνεύσουμε συλλεγμένα δεδομένα. Αυτά τα δεδομένα μπορεί να αφορούν έρευνες πληθώρας επιστημών, όπως είναι οι θετικές επιστήμες (μαθηματικά, φυσική, βιολογία κ.α.) και οι κοινωνικές επιστήμες (ψυχολογία, οικονομία κ.α.). Η παρούσα εργασία αποτελείται από δύο μέρη, ένα θεωρητικό και ένα πειραματικό. Στο πρώτο μέρος, που αποτελείται από τέσσερα κεφάλαια, παρουσιάζουμε τη θεωρία για τέσσερις μεθόδους στατιστικής ανάλυσης, ενώ στο δεύτερο μέρος, που αποτελείται από το πέμπτο κεφάλαιο, εφαρμόζουμε τις μεθόδους αυτές σε τρία διαφορετικά σύνολα δεδομένων και συγκρίνουμε τα αποτελέσματα τους. Ακολουθεί μια σύντομη περίληψη του κάθε κεφαλαίου.
Στο 1ο Κεφάλαιο παρουσιάζουμε δύο μεθόδους στατιστικής μοντελοποίησης. Η πρώτη είναι η Γραμμική Παλινδρόμηση, την οποία εφαρμόζουμε σε σύνολα δεδομένων με σκοπό τη διερεύνηση της σχέσης μεταξύ μιας ποσοτικής μεταβλητής απόκρισης με μία ή περισσότερες επεξηγηματικές μεταβλητές και η άλλη είναι η Λογιστική Παλινδρόμηση, με την οποία μπορούμε να προβλέψουμε την πιθανότητα εμφάνισης ενός γεγονότος, μελετώντας τη μη-γραμμική σχέση μεταξύ της κατηγορικής μεταβλητής απόκρισης και των επεξηγηματικών μεταβλητών.
Στο 2ο Κεφάλαιο παρουσιάζουμε τα Δέντρα Απόφασης και πιο συγκεκριμένα τα Δέντρα Παλινδρόμησης και τα Δέντρα Ταξινόμησης, ανάλογα με το αν η εφαρμογή τους αφορά πρόβλημα παλινδρόμησης ή ταξινόμησης αντίστοιχα. Γενικά, οι μέθοδοι που βασίζονται στην κατασκευή δέντρων αφορούν τη διάσπαση του χώρου των μεταβλητών πρόβλεψης σε ένα σύνολο ορθογώνιων περιοχών, που στην κάθε μία ανήκουν εκείνες οι παρατηρήσεις με παρόμοιες τιμές απόκρισης.
Στο 3ο Κεφάλαιο παρουσιάζουμε τα Δέντρα Επιβίωσης, τα οποία εφαρμόζουμε σε δεδομένα επιβίωσης, όταν μας ενδιαφέρει η εμφάνιση ενός συγκεκριμένου συμβάντος και η χρονική στιγμή που έγινε αυτό.
Στο 4ο Κεφάλαιο παρουσιάζουμε το μοντέλο παλινδρόμησης του Cox, με το οποίο ουσιαστικά διερευνάμε τη σχέση μεταξύ του χρόνου επιβίωσης και των διαθέσιμων επεξηγηματικών μεταβλητών σε δεδομένα επιβίωσης.
Στο 5ο Κεφάλαιο πραγματοποιούμε τη στατιστική ανάλυση τριών συνόλων δεδομένων με χρήση του στατιστικού προγράμματος R. Στο πρώτο σύνολο εφαρμόζουμε γραμμική παλινδρόμηση και δέντρα παλινδρόμησης, στο δεύτερο χρησιμοποιούμε το μοντέλο παλινδρόμησης του Cox και τα δέντρα επιβίωσης, ενώ στο τρίτο σύνολο δεδομένων εφαρμόζουμε λογιστική παλινδρόμηση και δέντρα ταξινόμησης. Στο τέλος κάθε εφαρμογής πραγματοποιείται σύγκριση των αποτελεσμάτων. |
el |
heal.abstract |
Statistical analysis is a science that enables us to process, present and interpret collected data. These data may concern research in a variety of sciences, such as the exact sciences (mathematics, physics, biology etc.) and the social sciences (psychology, economics etc.). This thesis consists of two parts, one theoretical and one experimental. In the first part, consisting of four chapters, we present the theory for four methods of statistical analysis, while in the second part, consisting of the fifth chapter, we apply these methods to three different datasets and compare their results. Here is a brief summary of each chapter.
In the 1st Chapter, we present two methods of statistical modeling. The first method is Linear Regression, which we apply to datasets for the purpose of investigating the relationship between a quantitative response variable with one or more explanatory variables and the other method is Logistic Regression, by which we can predict the probability of occurrence of an event by studying the non-linear relationship between the categorical response variable and explanatory variables.
In the 2nd Chapter, we present Decision Trees and more specifically Regression Trees and Classification Trees, depending on whether their application concerns regression or classification problems respectively. In general, methods based on tree construction involve splitting the space of predictive variables into a set of rectangular areas, each belonging to those observations with similar response values.
In the 3rd Chapter, we present Survival Trees, which we apply to survival data when we are interested in the occurrence of a specific event and the time when it happened.
In the 4th Chapter, we present Cox's Regression Model, which explores the relationship between survival time and available explanatory variables in survival data.
In the 5th Chapter, we perform the statistical analysis of three sets of data using the statistical program R. To the first set we apply Linear Regression and Regression Trees, for the second we use Cox's Regression Model and Survival Trees, while to the third set of data we apply Logistic Regression and Classification Trees. At the end of each application, a comparison of results is carried out. |
en |
heal.advisorName |
Καρώνη, Χρυσηίς |
el |
heal.advisorName |
Caroni, Chrys |
en |
heal.committeeMemberName |
Καρώνη, Χρυσηίς |
el |
heal.committeeMemberName |
Παυλοπούλου, Κάλλια |
el |
heal.committeeMemberName |
Παπανικολάου, Βασίλης |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
108 σ. |
el |
heal.fullTextAvailability |
false |
|