dc.contributor.author | Δημητρίου, Έλενα Μαρία | el |
dc.contributor.author | Dimitriou, Elena Maria | en |
dc.date.accessioned | 2016-10-31T09:17:14Z | |
dc.date.available | 2016-10-31T09:17:14Z | |
dc.date.issued | 2016-10-31 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/43936 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.13214 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Νευρωνικά δίκτυα | el |
dc.subject | Μοντέλο Cox | el |
dc.subject | Ανάλυση ROC | el |
dc.subject | Neural networks | en |
dc.title | Εφαρμογές των νευρωνικών δικτύων, της ROC ανάλυσης και του μοντέλου του Cox σε ιατρικά δεδομένα | el |
heal.type | bachelorThesis | |
heal.classification | Βιοστατιστική | el |
heal.classificationURI | http://data.seab.gr/concepts/ab6eff81044890e13a67718890061695455a60df | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2016-10-07 | |
heal.abstract | Στις μέρες μας η ραγδαία ανάπτυξη της επιστήμης των ηλεκτρονικών υπολογιστών καθώς και η διόγκωση των βάσεων δεδομένων έφερε ως φυσικό επακόλουθο την εξαγωγή χρήσιμων πληροφοριών, από το πλήθος δεδομένων που καλούμαστε να επεξεργαστούμε πρακτικά αδύνατη. Με τις κλασσικές μεθόδους της στατιστικής να αδυνατούν να βοηθήσουν στην επίλυση αυτού του ζητήματος η ανάγκη για εναλλακτικές μεθόδους οδήγησε στην ανάπτυξη της επιστήμης της Εξόρυξης Δεδομένων (data mining) η οποία αξιοποιεί μεθόδους από τις επιστήμες της μηχανικής μάθησης, της τεχνητής νοημοσύνης και φυσικά της στατιστικής για την εύρεση συσχετισμών και πληροφοριών μέσα από μάζες δεδομένων με κύριο στόχο την κατασκευή μοντέλων πρόβλεψης σε νέα σύνολα δεδομένων. Η ανάγκη αυτή για πρόβλεψη αποτελούσε για αιώνες συνεχή και επιτακτική ανάγκη του ανθρώπου, η ανάπτυξη των νευρωνικών δικτύων έχει δώσει νέες προοπτικές στις δυνατότητες του ανθρώπου να προβλέπει την εξέλιξη σύνθετων φαινομένων που παλαιότερα ήταν αδύνατο να μοντελοποιηθούν. Αρκετοί τομείς έχουν επωφεληθεί με αυτή την εξέλιξη όπως ο χρηματοοικονομικός τομέας, ο χώρος των επενδύσεων, αλλά κυρίως ο τομέας της ιατρικής. Στην παρούσα διπλωματική εργασία παρουσιάζονται μέσω μίας εφαρμογής, στρατηγικές που έχουν αναπτυχθεί προκειμένου να επεκταθούν οι μέθοδοι πρόβλεψης των νευρωνικών δικτύων σε αποκομμένα ιατρικά δεδομένα. Σε μία Monte Carlo μελέτη προσομοίωσης συγκρίνονται τρείς μέθοδοι νευρωνικών δικτύων με το μοντέλο παλινδρόμησης του Cox. Στο πρώτο κεφάλαιο, παρουσιάζεται εκτενώς η έννοια του Data Mining, η διαδικασία που ακολουθείται για την ανακάλυψη γνώσης από βάσεις δεδομένων (Knowledge Discovery from Databases-KDD), γίνεται ιδιαίτερη αναφορά στα σύνολα εκπαίδευσης τα οποία συμβάλλουν στην αρχική ανακάλυψη σχέσεων και στα σύνολα ελέγχου που με τη σειρά τους αξιολογούν τη δυνατότητα πρόγνωσης του μοντέλου. Παρουσιάζονται επίσης οι βασικές κατηγορίες του όπως επίσης και οι τομείς στους οποίους εφαρμόζεται. Το δεύτερο κεφάλαιο αναφέρεται στα Νευρωνικά Δίκτυα, τα οποία αξιοποιώντας αρχές της τεχνητής νοημοσύνης μιμούνται την ικανότητα των νευρώνων του ανθρώπινου εγκεφάλου τόσο στη δομή όσο και στη λειτουργία τους. Παρουσιάζονται τα Τεχνητά Νευρωνικά Δίκτυα όσο αφορά τη δομή και τον τρόπο εκπαίδευσης τους, γίνεται μία ιδιαίτερη μνεία στον απλό αισθητήρα (Perceptron). Ο Πολυεπίπεδος Αισθητήρας (MultiLayer Perceptron, MLP), καθώς και τα Δίκτυα Ακτινικής Συνάρτησης Βάσης (Radial Basis Function Networks, RBF) περιγράφονται επίσης αναλυτικά στο κεφάλαιο αυτό. Το τρίτο κεφάλαιο αφορά την Ανάλυση Επιβίωσης, δηλαδή την ανάλυση δεδομένων διάρκειας ζωής. Αναλύονται οι βασικές έννοιες της Ανάλυσης Επιβίωσης και ιδιαίτερα οι αποκομμένες παρατηρήσεις οι οποίες διαφοροποιούν την Ανάλυση Επιβίωσης από τις άλλες μεθόδους της στατιστικής. Τέλος στο κεφάλαιο αυτό παρουσιάζεται εκτενώς το Μοντέλο Αναλογικού Κινδύνου του Cox (Cox Proportional Hazard Model). Το τέταρτο κεφάλαιο αναφέρεται στις βασικές μέθοδοι της διαγνωστικής έρευνας καθώς επίσης και μέτρα διαγνωστικής ακρίβειας. Στη συνέχεια παρουσιάζονται, οι Καμπύλες Λειτουργικού Χαρακτηριστικού Δείκτη (ROC) οι οποίες αποτελούν μία χρήσιμη τεχνική απεικόνισης και οργάνωσης διάφορων ταξινομητών, με στόχο την επιλογή του καλύτερου με βάση την απόδοσή τους. Επιπλέον, γίνεται ανάλυση κάποιων βασικών εννοιών όπως η ευαισθησία και η ειδικότητα, οι οποίες είναι απαραίτητες για την αξιολόγηση ενός διαγνωστικού ελέγχου και τέλος περιγράφονται κάποια μέτρα απόδοσης όπως το εμβαδό κάτω από την καμπύλη ROC (AUC) και ο δείκτης C (c-index) ή αλλιώς c-statistic. Στο πέμπτο και τελευταίο κεφάλαιο γίνεται η παρουσίαση των αποτελεσμάτων της εφαρμογής με τη σύγκριση της απόδοσης των μεθόδων των νευρωνικών δικτύων σε σχέση με το μοντέλο παλινδρόμησης του Cox. | el |
heal.abstract | Nowadays, the rapid development of computer science and the expansion of databases brought as a natural consequence, the extraction of useful information from the large number of data that we are called to edit, practically impossible. With classical methods of statistics unable to help solve this problem, the need for alternative methods led to the development of the science of data mining which utilized methods from disciplines such as machine learning, artificial intelligence and of course statistics for finding correlations and informations from an enormous mass of data with the main objective being to build predictive models to new data sets. This need for prediction was for centuries a continuing and urgent need for humans. The development of neural networks has provided new perspectives on human potential to predict the development of complex events that were previously impossible to be modeled. Several areas have benefited from this development such as the financial sector, the area of investment, but especially the medical sector. This thesis presents through an application, strategies which were developed in order to extend the prediction methods of neural networks in censored medical data. In a Monte Carlo simulation study three methods of neural networks are compared with the Cox regression model. The first chapter presents extensively the concept of Data Mining, a procedure used for Knowledge Discovery from Databases (KDD). In addition there is a specific referral to the training sets which contribute to the initial discovery of correlations between the data and the testing sets which evaluate the model’s ability to predict. Τhe basic categories of data mining are also presented as well as the areas in which it is applied as data mining is a relatively new area which includes a series of techniques that are now used in almost all areas of modern society. The second chapter refers to Neural Networks, which by utilizing the principles of artificial intelligence they mimic the ability of the human brain neurons, both in structure and function. Artificial Neural Networks are illustrated as regards to the structure and the way they are trained, furthermore there is a special mention of the simple sensor, the Perceptron. The MultiLayer Perceptron (MLP), and Radial Basis Function Networks (RBF) are also described in this chapter. Εφαρμογές των Νευρωνικών Δικτύων, της ROC ανάλυσης και του μοντέλου του Cox σε ιατρικά δεδομένα 8 | The third chapter deals with the Survival Analysis, that is, the analysis for lifetime data. The basic concepts of Survival Analysis are analyzed and a special reference to censored observations which distinguish the Survival Analysis from other statistic methods is given. Moreover, we extensively present the model of Cox Proportional Hazard Model. The fourth chapter presents some basic methods of diagnostic research as well as some measures of diagnostic accuracy. Then the Receiving Operating Characteristic Curves (ROC) are mentioned which are a useful technique for organizing classifiers and visualizing their performance. In addition concepts such as sensitivity and specificity are presented in detail, which in turn are necessary for the evaluation of a diagnostic test and some performance measures such as the area under the ROC curve (AUC) and the c-index or c-statistic. In the fifth and final chapter the results of the application are presented by comparing the performance of the methods of neural networks to the Cox regression model. | en |
heal.advisorName | Κουκουβίνος, Χρήστος | el |
heal.committeeMemberName | Καρώνη-Ρίτσαρντσον, Χρυσηίς | el |
heal.committeeMemberName | Βόντα, Φιλία | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών | el |
heal.academicPublisherID | NTUA | |
heal.numberOfPages | 166 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: