dc.contributor.author | Ρουσής, Δημήτριος | el |
dc.contributor.author | Rousis, Dimitrios | en |
dc.date.accessioned | 2018-10-12T08:51:33Z | |
dc.date.available | 2018-10-12T08:51:33Z | |
dc.date.issued | 2018-10-12 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/47791 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.16004 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Cox | en |
dc.subject | Μοντέλα παλινδρόμησης | el |
dc.subject | Μέθοδοι ποινών | el |
dc.subject | Μοντέλα αναλογικής διακινδύνευσης | el |
dc.subject | Elastic Net | en |
dc.subject | Ridge | en |
dc.title | Χρήση μεθόδων με ποινή σε μοντέλα παλινδρόμησης αναλογικής διακινδύνευσης | el |
heal.type | bachelorThesis | |
heal.classification | Στατιστική | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2018-06-25 | |
heal.abstract | Η παρούσα διπλωματική εργασία ασχολείται με τη στατιστική ανάλυση δεδομένων διάρκειας ζωής κάνοντας χρήση μιας ειδικής κατηγορίας μοντέλων στα οποία έχει επιβληθεί κάποιος συγκεκριμένος περιορισμός για τις εκτιμήσεις των παραμέτρων του -μια «ποινή» όπως συχνά αναφέρεται στη βιβλιογραφία. Πιο αναλυτικά, το πρώτο κεφάλαιο αναφέρεται στις βασικές έννοιες του κλάδου της Ανάλυσης Αξιοπιστίας και Επιβίωσης (δεδομένα διάρκειας ζωής, συνάρτηση επιβίωσης, συνάρτηση διακινδύνευσης, σωρευτική συνάρτηση διακινδύνευσης κλπ). Επιπλέον, παραθέτονται στοιχεία από την μη-παραμετρική ανάλυση δεδομένων διάρκειας ζωής (εκτιμήτρια Kaplan-Meier, εκτιμήτρια Nelson-Aalen, μη παραμετρικός έλεγχος Log-rank, γραφικοί έλεγχοι). Το δεύτερο κεφάλαιο χωρίζεται σε δύο σκέλη. Στο πρώτο σκέλος, γίνεται εκτενής παρουσίαση του μοντέλου αναλογικής διακινδύνευσης (προσαρμογή μοντέλου, γραφικός έλεγχος της υπόθεσης της αναλογικής διακινδύνευσης, ορισμός υπολοίπων, κριτήρια επιλογής μεταβλητών, μέτρα καλής προσαρμογής του μοντέλου κλπ). Στο δεύτερο σκέλος εισάγεται μια ειδική κατηγορία μοντέλου αναλογικής διακινδύνευσης, το οποίο θα προσαρμοστεί στο σύνολο δεδομένων μας, το οποίο είναι το μοντέλο του Cox. Στο τρίτο κεφάλαιο παρουσιάζεται η έννοια της μεθόδου ποινής, για την αντιμετώπιση των προβλημάτων της πολυσυγγραμμικότητας (multicollinearity) και της υπερπροσαρμογής (overfitting) μοντέλου. Γίνεται αναφορά στα είδη αυτών των μεθόδων, που έχουν αναπτυχθεί πολύ τα τελευταία χρόνια, και αναλύονται οι μέθοδοι Ridge, Lasso και (naïve) Elastic Net, που θα χρησιμοποιηθούν μετέπειτα και στο πρόβλημά μας. Το κεφάλαιο ολοκληρώνεται με την παρουσίαση της μεθόδου cross-validation για την επιλογή του βέλτιστου συντελεστή λ που χρησιμοποιείται σε όλες τις τεχνικές με ποινή. Στο τέταρτο, και τελευταίο κεφάλαιο, μελετάται ένα σύνολο δεδομένων διάρκειας ζωής από ασθενείς που πάσχουν από οξεία μυελοπλαστική λευχαιμία (acute myeloblastic leukaemia) στο οποίο εφαρμόζονται όλες οι προαναφερθείσες μεθόδους. Πιο συγκεκριμένα, γίνεται μια πρώτη μη-παραμετρική ανάλυση των δεδομένων, προσαρμόζεται το κλασικό μοντέλο του Cox, πραγματοποιούνται όλοι οι κατάλληλοι έλεγχοι υποθέσεων και τέλος εφαρμόζονται όλες οι τεχνικές ποινής που αναλύθηκαν ελέγχοντας αν και κατά πόσο αυτές επηρεάζουν τα προηγούμενα αποτελέσματα που εξήχθησαν. Για την ανάλυση των δεδομένων χρησιμοποιήθηκαν τα στατιστικά πακέτα της R και του Minitab. | el |
heal.abstract | Τhe current thesis deals with the statistical analysis of lifetime data making use of a special category of models in which has been imposed some concrete restriction for the estimates of its parameters - a “penalty”, as it is often cited in the bibliography. More specifically, the first chapter refers to the basic principles of Reliability and Survival Analysis (lifetime data, survival function, hazard function, cumulative hazard function etc). Moreover, techniques from the not-parametric lifetime data analysis are represented (Kaplan-Meier estimator, Nelson-Aalen estimator, non parametric Log-rank test, graphical tests). The second chapter is separated in two parts. In the first part, the proportional hazards model is analyzed thoroughly (model adjustment, graphical test for the proportional hazards hypothesis, residuals definition, variables selection criteria, metres of goodness of fit etc). The second part is referred to a special case of proportional hazards model that will be adapted in our dataset, which is the Cox model. Τhe third chapter deals with penalized methods which are used for the confrontation of multicollinearity and overfitting problems in regression models. It combines the definition and the analysis of Ridge, Lasso and (naïve) Elastic Net penalized methods that have been developed over the past few years, and will be used in our dataset. The chapter is completed with the presentation of cross-validation method which provides us with the optimal choice of penalty factor λ. The fourth, and last chapter, studies a lifetime dataset of patients that suffer from acute myeloblastic leukaemia. More specifically, the chapter starts with a non-parametric data analysis. Secondly, the classic Cox model is adjusted and, in order to confirm the model hypotheses, many analytical and graphical tests are included. Finally, all the penalized techniques are applied in order to check their influence over the previous results that were exported. The statistical packages R and Minitab were used for the data analysis. | en |
heal.advisorName | Καρώνη, Χρυσηίς | el |
heal.committeeMemberName | Βόντα, Φίλια | el |
heal.committeeMemberName | Παπανικολάου, Βασίλειος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Μαθηματικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 95 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: