HEAL DSpace

Μοντελοποίηση δεδομένων επιβίωσης με μηχανές διανυσμάτων υποστήριξης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Καστρησίου, Άννα-Μαρία el
dc.contributor.author Kastrisiou, Anna-Maria en
dc.date.accessioned 2018-06-26T09:41:44Z
dc.date.available 2018-06-26T09:41:44Z
dc.date.issued 2018-06-26
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/47123
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.15388
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Ανάλυση επιβίωσης el
dc.subject Μηχανές διανυσμάτων υποστήριξης el
dc.subject Ταξινομητής μέγιστου περιθωρίου el
dc.subject Δεδομένα επιβίωσης el
dc.subject Σφάλματα el
dc.subject Data mining en
dc.subject SVM en
dc.subject Cox en
dc.subject Classification en
dc.subject Censoring en
dc.title Μοντελοποίηση δεδομένων επιβίωσης με μηχανές διανυσμάτων υποστήριξης el
heal.type bachelorThesis
heal.classification Ιατρική στατιστική el
heal.classificationURI http://data.seab.gr/concepts/b973e4eb80bdcbcdcf80cb82c61a4bcd0034ab9c
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2018-02-23
heal.abstract Στη συγκεκριμένη εργασία θα ασχοληθούμε με τη δημιουργία μοντέλων για δεδομένα με αποκομμένες παρατηρήσεις και ειδικότερα σε δεδομένα επιβίωσης. Αυτό επιτυγχάνεται με τη βοήθεια των μηχανών διανυσμάτων υποστήριξης (SVM) για δύο κλάσεις, αλλά και το μοντέλο του Cox. Αρχικά, στο πρώτο κεφάλαιο αναφέρεται η ανάγκη εξόρυξης δεδομένων (Data Mining), ώστε ο τεράστιος αριθμός δεδομένων να μετατραπεί σε χρήσιμες πληροφορίες. Επίσης ορίζονται κάποιες βασικές έννοιες, μεταξύ των οποίων και οι ταξινομητές (γραμμικοί και τετραγωνικοί), τα σφάλματα, οι πίνακες σύγχυσης και απώλειας και οι καμπύλες ROC. Στη συνέχεια, στο δεύτερο κεφάλαιο αναφέρονται μοντέλα παλινδρόμησης για αποκομμένες παρατηρήσεις, που προκύπτουν από το θάνατο ή την αποτυχία μιας μονάδας. Επίσης, ορίζονται κάποιες βασικές έννοιες, όπως ο χρόνος επιβίωσης και αποκοπής, ο εκτιμητής Nelson-Aalen, η συνάρτηση κινδύνου και το μοντέλο του Cox, ενώ αναφέρουμε και ένα παράδειγμα για τα δεδομένα του καρκίνου του μαστού. Επιπλέον, αναφερόμαστε στη μοντελοποίηση των δεδομένων επιβίωσης, καθώς εξηγούμε πώς μπορεί να χρησιμοποιηθεί και για την πρόβλεψη των δεδομένων. Στο τρίτο κεφάλαιο ασχολούμαστε με τις μηχανές διανυσμάτων υποστήριξης (SVM), αναφερόμαστε στον ταξινομητή μέγιστου περιθωρίου και στον ταξινομητή διανυσμάτων υποστήριξης. Γίνεται περιγραφή των SVM με δύο κλάσεις καθώς επίσης γίνεται και μια αναφορά στην περίπτωση δεδομένων με περισσότερες από δύο κλάσεις, ενώ παρουσιάζεται και μια εφαρμογή της SVM σε δεδομένα καρδιακών παθήσεων. Επιπλέον περιγράφονται δύο μέθοδοι για την ανάλυση δεδομένων επιβίωσης που βασίζονται στις μηχανές διανυσμάτων υποστήριξης. Τέλος, στο τέταρτο κεφάλαιο αναλύονται τα πειραματικά αποτελέσματα για συνθετικά (προσομοιωμένα) και για πραγματικά δεδομένα, ενώ στο πέμπτο και τελευταίο κεφάλαιο παρουσιάζονται τα συμπεράσματα της ανάλυσης SVM και του μοντέλου του Cox. el
heal.abstract In this assignment we will deal with the creation of models for data with censoring observations and specifically for survival data. This is achieved by using support vector machines (SVMs) for two classes, as well as the Cox model. To begin with, the first chapter considers the need of data mining, so as to convert the large amount of data into useful information. In addition, some basic concepts are defined, including classifiers (linear or quadratic), errors, confusion and loss matrices and ROC curves. Thereafter, chapter two focuses on regression models for censoring observations that have resulted from the death or the failure of a unit. Moreover, some key concepts are defined, such as the survival time and censoring time, the Nelson ‐ Aalen classifier, the hazard function and the Cox model, as well as an example for breast cancer data is also provided. Additionally we refer to the modeling of survival data, while we explain how it can be used for data prediction. In chapter three we refer to support vector machines (SVMs), the maximal margin classifier, and to the support vector classifier. We provide descriptions of SVMs with two classes, as well as a reference to instances of data with more than two classes is also made, while an application of SVMs to the heart disease data is presented. Two methods are also outlined for the analysis of survival data which are based on support vector machines. In conclusion, in chapter four we analyse the experimental results for synthetic and real life data, whereas in chapter five, the final chapter, we present the conclusions of the SVM and Cox model analysis en
heal.advisorName Κουκουβίνος, Χρήστος el
heal.committeeMemberName Καρώνη-Ρίτσαρντσον, Χρυσηίς el
heal.committeeMemberName Βόντα, Φιλία el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Μαθηματικών el
heal.academicPublisherID ntua
heal.numberOfPages 104 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα