dc.contributor.author | Καστρησίου, Άννα-Μαρία | el |
dc.contributor.author | Kastrisiou, Anna-Maria | en |
dc.date.accessioned | 2018-06-26T09:41:44Z | |
dc.date.available | 2018-06-26T09:41:44Z | |
dc.date.issued | 2018-06-26 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/47123 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.15388 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Ανάλυση επιβίωσης | el |
dc.subject | Μηχανές διανυσμάτων υποστήριξης | el |
dc.subject | Ταξινομητής μέγιστου περιθωρίου | el |
dc.subject | Δεδομένα επιβίωσης | el |
dc.subject | Σφάλματα | el |
dc.subject | Data mining | en |
dc.subject | SVM | en |
dc.subject | Cox | en |
dc.subject | Classification | en |
dc.subject | Censoring | en |
dc.title | Μοντελοποίηση δεδομένων επιβίωσης με μηχανές διανυσμάτων υποστήριξης | el |
heal.type | bachelorThesis | |
heal.classification | Ιατρική στατιστική | el |
heal.classificationURI | http://data.seab.gr/concepts/b973e4eb80bdcbcdcf80cb82c61a4bcd0034ab9c | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2018-02-23 | |
heal.abstract | Στη συγκεκριμένη εργασία θα ασχοληθούμε με τη δημιουργία μοντέλων για δεδομένα με αποκομμένες παρατηρήσεις και ειδικότερα σε δεδομένα επιβίωσης. Αυτό επιτυγχάνεται με τη βοήθεια των μηχανών διανυσμάτων υποστήριξης (SVM) για δύο κλάσεις, αλλά και το μοντέλο του Cox. Αρχικά, στο πρώτο κεφάλαιο αναφέρεται η ανάγκη εξόρυξης δεδομένων (Data Mining), ώστε ο τεράστιος αριθμός δεδομένων να μετατραπεί σε χρήσιμες πληροφορίες. Επίσης ορίζονται κάποιες βασικές έννοιες, μεταξύ των οποίων και οι ταξινομητές (γραμμικοί και τετραγωνικοί), τα σφάλματα, οι πίνακες σύγχυσης και απώλειας και οι καμπύλες ROC. Στη συνέχεια, στο δεύτερο κεφάλαιο αναφέρονται μοντέλα παλινδρόμησης για αποκομμένες παρατηρήσεις, που προκύπτουν από το θάνατο ή την αποτυχία μιας μονάδας. Επίσης, ορίζονται κάποιες βασικές έννοιες, όπως ο χρόνος επιβίωσης και αποκοπής, ο εκτιμητής Nelson-Aalen, η συνάρτηση κινδύνου και το μοντέλο του Cox, ενώ αναφέρουμε και ένα παράδειγμα για τα δεδομένα του καρκίνου του μαστού. Επιπλέον, αναφερόμαστε στη μοντελοποίηση των δεδομένων επιβίωσης, καθώς εξηγούμε πώς μπορεί να χρησιμοποιηθεί και για την πρόβλεψη των δεδομένων. Στο τρίτο κεφάλαιο ασχολούμαστε με τις μηχανές διανυσμάτων υποστήριξης (SVM), αναφερόμαστε στον ταξινομητή μέγιστου περιθωρίου και στον ταξινομητή διανυσμάτων υποστήριξης. Γίνεται περιγραφή των SVM με δύο κλάσεις καθώς επίσης γίνεται και μια αναφορά στην περίπτωση δεδομένων με περισσότερες από δύο κλάσεις, ενώ παρουσιάζεται και μια εφαρμογή της SVM σε δεδομένα καρδιακών παθήσεων. Επιπλέον περιγράφονται δύο μέθοδοι για την ανάλυση δεδομένων επιβίωσης που βασίζονται στις μηχανές διανυσμάτων υποστήριξης. Τέλος, στο τέταρτο κεφάλαιο αναλύονται τα πειραματικά αποτελέσματα για συνθετικά (προσομοιωμένα) και για πραγματικά δεδομένα, ενώ στο πέμπτο και τελευταίο κεφάλαιο παρουσιάζονται τα συμπεράσματα της ανάλυσης SVM και του μοντέλου του Cox. | el |
heal.abstract | In this assignment we will deal with the creation of models for data with censoring observations and specifically for survival data. This is achieved by using support vector machines (SVMs) for two classes, as well as the Cox model. To begin with, the first chapter considers the need of data mining, so as to convert the large amount of data into useful information. In addition, some basic concepts are defined, including classifiers (linear or quadratic), errors, confusion and loss matrices and ROC curves. Thereafter, chapter two focuses on regression models for censoring observations that have resulted from the death or the failure of a unit. Moreover, some key concepts are defined, such as the survival time and censoring time, the Nelson ‐ Aalen classifier, the hazard function and the Cox model, as well as an example for breast cancer data is also provided. Additionally we refer to the modeling of survival data, while we explain how it can be used for data prediction. In chapter three we refer to support vector machines (SVMs), the maximal margin classifier, and to the support vector classifier. We provide descriptions of SVMs with two classes, as well as a reference to instances of data with more than two classes is also made, while an application of SVMs to the heart disease data is presented. Two methods are also outlined for the analysis of survival data which are based on support vector machines. In conclusion, in chapter four we analyse the experimental results for synthetic and real life data, whereas in chapter five, the final chapter, we present the conclusions of the SVM and Cox model analysis | en |
heal.advisorName | Κουκουβίνος, Χρήστος | el |
heal.committeeMemberName | Καρώνη-Ρίτσαρντσον, Χρυσηίς | el |
heal.committeeMemberName | Βόντα, Φιλία | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Μαθηματικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 104 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: