HEAL DSpace

Χρήση μεθόδων με ποινή σε μοντέλα παλινδρόμησης αναλογικής διακινδύνευσης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ρουσής, Δημήτριος el
dc.contributor.author Rousis, Dimitrios en
dc.date.accessioned 2018-10-12T08:51:33Z
dc.date.available 2018-10-12T08:51:33Z
dc.date.issued 2018-10-12
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/47791
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.16004
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Cox en
dc.subject Μοντέλα παλινδρόμησης el
dc.subject Μέθοδοι ποινών el
dc.subject Μοντέλα αναλογικής διακινδύνευσης el
dc.subject Elastic Net en
dc.subject Ridge en
dc.title Χρήση μεθόδων με ποινή σε μοντέλα παλινδρόμησης αναλογικής διακινδύνευσης el
heal.type bachelorThesis
heal.classification Στατιστική el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2018-06-25
heal.abstract Η παρούσα διπλωματική εργασία ασχολείται με τη στατιστική ανάλυση δεδομένων διάρκειας ζωής κάνοντας χρήση μιας ειδικής κατηγορίας μοντέλων στα οποία έχει επιβληθεί κάποιος συγκεκριμένος περιορισμός για τις εκτιμήσεις των παραμέτρων του -μια «ποινή» όπως συχνά αναφέρεται στη βιβλιογραφία. Πιο αναλυτικά, το πρώτο κεφάλαιο αναφέρεται στις βασικές έννοιες του κλάδου της Ανάλυσης Αξιοπιστίας και Επιβίωσης (δεδομένα διάρκειας ζωής, συνάρτηση επιβίωσης, συνάρτηση διακινδύνευσης, σωρευτική συνάρτηση διακινδύνευσης κλπ). Επιπλέον, παραθέτονται στοιχεία από την μη-παραμετρική ανάλυση δεδομένων διάρκειας ζωής (εκτιμήτρια Kaplan-Meier, εκτιμήτρια Nelson-Aalen, μη παραμετρικός έλεγχος Log-rank, γραφικοί έλεγχοι). Το δεύτερο κεφάλαιο χωρίζεται σε δύο σκέλη. Στο πρώτο σκέλος, γίνεται εκτενής παρουσίαση του μοντέλου αναλογικής διακινδύνευσης (προσαρμογή μοντέλου, γραφικός έλεγχος της υπόθεσης της αναλογικής διακινδύνευσης, ορισμός υπολοίπων, κριτήρια επιλογής μεταβλητών, μέτρα καλής προσαρμογής του μοντέλου κλπ). Στο δεύτερο σκέλος εισάγεται μια ειδική κατηγορία μοντέλου αναλογικής διακινδύνευσης, το οποίο θα προσαρμοστεί στο σύνολο δεδομένων μας, το οποίο είναι το μοντέλο του Cox. Στο τρίτο κεφάλαιο παρουσιάζεται η έννοια της μεθόδου ποινής, για την αντιμετώπιση των προβλημάτων της πολυσυγγραμμικότητας (multicollinearity) και της υπερπροσαρμογής (overfitting) μοντέλου. Γίνεται αναφορά στα είδη αυτών των μεθόδων, που έχουν αναπτυχθεί πολύ τα τελευταία χρόνια, και αναλύονται οι μέθοδοι Ridge, Lasso και (naïve) Elastic Net, που θα χρησιμοποιηθούν μετέπειτα και στο πρόβλημά μας. Το κεφάλαιο ολοκληρώνεται με την παρουσίαση της μεθόδου cross-validation για την επιλογή του βέλτιστου συντελεστή λ που χρησιμοποιείται σε όλες τις τεχνικές με ποινή. Στο τέταρτο, και τελευταίο κεφάλαιο, μελετάται ένα σύνολο δεδομένων διάρκειας ζωής από ασθενείς που πάσχουν από οξεία μυελοπλαστική λευχαιμία (acute myeloblastic leukaemia) στο οποίο εφαρμόζονται όλες οι προαναφερθείσες μεθόδους. Πιο συγκεκριμένα, γίνεται μια πρώτη μη-παραμετρική ανάλυση των δεδομένων, προσαρμόζεται το κλασικό μοντέλο του Cox, πραγματοποιούνται όλοι οι κατάλληλοι έλεγχοι υποθέσεων και τέλος εφαρμόζονται όλες οι τεχνικές ποινής που αναλύθηκαν ελέγχοντας αν και κατά πόσο αυτές επηρεάζουν τα προηγούμενα αποτελέσματα που εξήχθησαν. Για την ανάλυση των δεδομένων χρησιμοποιήθηκαν τα στατιστικά πακέτα της R και του Minitab. el
heal.abstract Τhe current thesis deals with the statistical analysis of lifetime data making use of a special category of models in which has been imposed some concrete restriction for the estimates of its parameters - a “penalty”, as it is often cited in the bibliography. More specifically, the first chapter refers to the basic principles of Reliability and Survival Analysis (lifetime data, survival function, hazard function, cumulative hazard function etc). Moreover, techniques from the not-parametric lifetime data analysis are represented (Kaplan-Meier estimator, Nelson-Aalen estimator, non parametric Log-rank test, graphical tests). The second chapter is separated in two parts. In the first part, the proportional hazards model is analyzed thoroughly (model adjustment, graphical test for the proportional hazards hypothesis, residuals definition, variables selection criteria, metres of goodness of fit etc). The second part is referred to a special case of proportional hazards model that will be adapted in our dataset, which is the Cox model. Τhe third chapter deals with penalized methods which are used for the confrontation of multicollinearity and overfitting problems in regression models. It combines the definition and the analysis of Ridge, Lasso and (naïve) Elastic Net penalized methods that have been developed over the past few years, and will be used in our dataset. The chapter is completed with the presentation of cross-validation method which provides us with the optimal choice of penalty factor λ. The fourth, and last chapter, studies a lifetime dataset of patients that suffer from acute myeloblastic leukaemia. More specifically, the chapter starts with a non-parametric data analysis. Secondly, the classic Cox model is adjusted and, in order to confirm the model hypotheses, many analytical and graphical tests are included. Finally, all the penalized techniques are applied in order to check their influence over the previous results that were exported. The statistical packages R and Minitab were used for the data analysis. en
heal.advisorName Καρώνη, Χρυσηίς el
heal.committeeMemberName Βόντα, Φίλια el
heal.committeeMemberName Παπανικολάου, Βασίλειος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Μαθηματικών el
heal.academicPublisherID ntua
heal.numberOfPages 95 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα