dc.contributor.author |
Βέργου, Αικατερίνη
|
el |
dc.contributor.author |
Vergou, Aikaterini
|
en |
dc.date.accessioned |
2021-09-15T06:37:17Z |
|
dc.date.available |
2021-09-15T06:37:17Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/53853 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.21551 |
|
dc.rights |
Default License |
|
dc.subject |
Μοντέλο επιταχυνόμενης διακοπής |
el |
dc.subject |
Μοντέλο αναλογικής διακινδύνευσης |
el |
dc.subject |
Ημι-παραμετρικό μοντέλο Cox |
el |
dc.subject |
Παλινδρόμηση κορυφογραμμής |
el |
dc.subject |
Παλινδρόμηση Lasso |
el |
dc.subject |
Accelerated life model |
en |
dc.subject |
Proportional hazard model |
en |
dc.subject |
Semi-parametric cox model |
en |
dc.subject |
Ridge regression |
en |
dc.subject |
Lasso regression |
en |
dc.title |
Εφαρμογές παραμετρικών και ημι-παραμετρικών μοντέλων και μεθόδων συρρίκνωσης σε δεδομένα διάρκειας ζωής |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Μοντέλα Επιβίωσης |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2021-07 |
|
heal.abstract |
Η παρούσα διπλωματική εργασία ασχολείται με τη στατιστική ανάλυση δεδομένων διάρκειας ζωής με χρήση διάφορων μεθόδων και μοντέλων με σκοπό την επιστημονική μελέτη των δεδομένων μέχρις ότου συμβεί κάποιο γεγονός. Ο κλάδος της Στατιστικής με τον οποίο θα ασχοληθούμε είναι η Ανάλυση Επιβίωσης η οποία έχει πολλές εφαρμογές σε βιοϊατρικές αλλά και τεχνολογικές επιστήμες.
Πιο αναλυτικά, στο πρώτο κεφάλαιο περιγράφονται κάποιες βασικές έννοιες και ορισμούς της Ανάλυσης της Επιβίωσης, όπως είναι για παράδειγμα τα αποκομμένα δεδομένα, η συνάρτηση επιβίωσης, η συνάρτηση διακινδύνευσης, η σωρευτική συνάρτηση διακινδύνευσης κ.τ.λ. Επίσης, παρουσιάζονται κάποιες βασικές κατανομές της Στατιστικής Ανάλυσης, για παράδειγμα η κατανομή Weibull, Log-Normal, Log-Logistic κ.τ.λ. Τέλος, περιγράφονται κάποιες μη-παραμετρικές τεχνικές που είναι πολύ χρήσιμες στην Ανάλυση Επιβίωσης (εκτιμήτρια Kaplan-Meier, εκτιμήτρια Nelson-Aalen κ.τ.λ.).
Στο δεύτερο κεφάλαιο παρουσιάζονται αναλυτικά τα Παραμετρικά Μοντέλα Παλινδρόμησης, τα οποία χρησιμοποιούνται πολύ συχνά σε δεδομένα διάρκειας ζωής. Στο πρώτο μέρος του κεφαλαίου γίνεται παρουσίαση του μοντέλου Επιταχυνόμενης Διακοπής (AL) καθώς και του μοντέλου Αναλογικής Διακινδύνευσης (PH). Ενώ στο δεύτερο μέρος γίνεται εκτενής παρουσίαση του ημι-παραμετρικού μοντέλου του Cox (εκτίμηση παραμέτρων, γραφικός έλεγχος της υπόθεσης της αναλογικής διακινδύνευσης, υπόλοιπα Schoenfeld, καμπύλες ROC & AUC κ.τ.λ.). Τέλος, παρουσιάζονται διάφορα κριτήρια επιλογής μεταβλητών και μέτρα καλής προσαρμογής για τα παραπάνω μοντέλα.
Στο τρίτο κεφάλαιο παρουσιάζονται οι μέθοδοι Συρρίκνωσης που χρησιμοποιούνται για την αντιμετώπιση των προβλημάτων της πολυσυγγραμμικότητας. Πιο συγκεκριμένα γίνεται παρουσίαση των μεθόδων Ridge και Lasso, οι οποίες έχουν αναπτυχθεί πολύ τα τελευταία χρόνια. Το κεφάλαιο ολοκληρώνεται με την παρουσίαση της μεθόδου Cross-Validation για την επιλογή του βέλτιστου συντελεστή λ που χρησιμοποιείται σε όλες τις μεθόδους Συρρίκνωσης.
Στο τέταρτο κεφάλαιο μελετάται ένα απλό σύνολο δεδομένων διάρκειας ζωής από λαμπτήρες φθορισμού. Στην αρχή, γίνεται μια πρώτη μη-παραμετρική ανάλυση των δεδομένων με τις τεχνικές που παρουσιάστηκαν στα προηγούμενα κεφάλαια. Ενώ στη συνέχεια προσαρμόζεται ένα μοντέλο Επιταχυνόμενης Διακοπής (AL) και γίνεται γραφικός έλεγχος μέσω των υπολοίπωνCox-Snell.
Στο πέμπτο και τελευταίο κεφάλαιο μελετάται ένα σύνολο δεδομένων διάρκειας ζωής από ασθενείς που έχουν υποβληθεί σε μεταμόσχευση μυελού των οστών. Αρχικά, γίνεται μια πρώτη μη-παραμετρική ανάλυση των δεδομένων, ενώ στη συνέχεια προσαρμόζεται ένα μοντέλο Επιταχυνόμενης Διακοπής (AL) και γίνεται γραφικός έλεγχος μέσω των υπολοίπωνCox-Snell. Έπειτα, προσαρμόζεται το ημι-παραμετρικό μοντέλο του Cox και γίνονται οι καμπύλες ROC. Τέλος, προσαρμόζονται τα μοντέλα Ridge και Lasso με βάση το ημι-παραμετρικό μοντέλο του Cox. Για την ανάλυση των δεδομένων χρησιμοποιήθηκαν τα στατιστικά πακέτα της R και του Minitab. |
el |
heal.abstract |
This thesis deals with the statistical analysis of lifetime data making use of various methods and models for the purpose of scientific study of data that describe the time until an event occurs. The field of Statistics that we will deal with is Survival Analysis which has many applications in biomedical and technological sciences.
More specifically, the first chapter refers to the basic principles and definitions of Reliability and Survival Analysis (lifetime data, survival function, hazard function, cumulative hazard function etc.). Moreover, some basic distributions of Statistical Analysis are presented, for example the Weibull, Log-Normal, Log-Logistic etc. Finally, techniques from non-parametric lifetime data analysis are described (Kaplan-Meier estimator, Nelson-Aalen estimator etc.).
The second chapter presents in detail the Parametric Regression Models which are very often used in lifetime data. The first part of the chapter presents the Accelerated Life model (AL) as well as the Proportional Hazard model (PH). In the second part there is an extensive presentation of the semi-parametric Cox model (parameter estimation, graphical test for the proportional hazards hypothesis, Schoenfeld residuals, ROC & AUC curves, etc.). Finally, various variable selection criteria and measures of goodness of fit for the above models are presented.
The third chapter presents the Shrinkage methods used for the confrontation of multilinearity problems. More specifically, the Ridge and Lasso methods are presented, which have been greatly developed in recent years. The chapter concludes with a presentation of the Cross-Validation method for selecting the optimal factor λ used in all Shrinkage methods.
In the fourth chapter a simple set of lifetime data from fluorescent lamps is studied. At the beginning, an initial non-parametric analysis of the data is performed with the techniques presented in the previous chapters. An Accelerated Life model (AL) is then fitted and graphically tested via the Cox-Snell residuals.
The fifth and final chapter studies a set of lifetime data from patients who have undergone bone marrow transplantation. First, a non-parametric analysis of the data is performed, and then an Accelerated Life (AL) model is fitted, and a graphical test is performed through the Cox-Snell residuals. Moreover, the semi-parametric Cox model is fitted, and the ROC curves are constructed. Finally, the Ridge and Lasso models are fitted based on the semi-parametric Cox model. The statistical packages R and Minitab were used for data analysis. |
en |
heal.advisorName |
Καρώνη, Χρυσηΐς |
el |
heal.committeeMemberName |
Κουκουβίνος, Χρήστος |
el |
heal.committeeMemberName |
Παπανικολάου, Βασίλης |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Μαθηματικών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
97 σ. |
el |
heal.fullTextAvailability |
false |
|