HEAL DSpace

Τεχνικές Εξόρυξης Δεδομένων, Λογιστική Παλινδρόμηση και χρήση ROC Καμπυλών για την Ανάλυση Πραγματικών Ιατρικών Δεδομένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Κουκουβίνος, Χρήστος el
dc.contributor.author Ηράκλη, Δημούλα Η. el
dc.contributor.author Eracli, Demoula E. en
dc.date.accessioned 2012-07-23T09:28:04Z
dc.date.available 2012-07-23T09:28:04Z
dc.date.copyright 2012-07-17 -
dc.date.issued 2012-07-23
dc.date.submitted 2012-07-17 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/6466
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.10861
dc.description.abstract Η τεχνολογία του data mining είναι μια σχετικά καινούρια περιοχή η οποία περιλαμβάνει τεχνικές επεξεργασίας και ανάλυσης μεγάλων βάσεων δεδομένων. Ο στόχος αυτών των τεχνικών είναι η ανακάλυψη νέων προτύπων μεταξύ των δεδομένων και η εξαγωγή χρήσιμων πληροφοριών. Στην παρούσα διπλωματική εργασία μελετήθηκαν οι εξης : τα Δέντρα Αποφάσεων, τα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ), η Λογιστική Παλινδρόμηση και οι Καμπύλες ROC. Το πρώτο κεφάλαιο περιέχει μια εισαγωγή στις τεχνικές του data mining η οποία περιλαμβάνει τους σκοπούς και τη διαδικασία του, καθώς επίσης και τουσ τομείς στους οποίους εφαρμόζεται. Στο δεύτερο κεφάλαιο αναλύονται οι τεχνικές εξόρυξης γνώσης. Στα Δέντρα Αποφάσεων μελετήθηκε ο Αλγόριθμος C&RT και στα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ) αναλύθηκαν τα κύρια χαρακτηριστικά τους καθώς και δύο κύρια μοντέλα των τεχνητών νευρωνικών δικτύων, τα δίκτυα MLP και RBFN. Ακολούθως, παρουσιάζεται η Λογιστική Παλινδρόμηση και τρόποι με τους οποίους εκτιμούνται οι παράμετροι. Τέλος, παρουσιάζεται η βασική ορολογία της ROC Ανάλυσης και περιγράφεται η έννοια και η χρήση του Εμβαδού Κάτω από την Καμπύλη ROC. Το τρίτο κεφάλαιο περιλαμβάνει την εφαρμογή που πραγματοποιήθηκε πάνω σε πραγματικά ιατρικά δεδομένα (8862 ασθενείς με τραύματα) με τη βοήθεια του προγράμματος Clementine SPSS, ενός λογισμικού εξόρυξυς δεδομένων. Τα δεδομένα αυτά εφαρμόστηκαν στον Αλγόριθμο C&RT, στις νευρωνικές μεθόδους MLP και RBFN και στο μοντέλο της Λογιστικής Παλινδρόμησης με σκοπό να προβλέψουμε και να συγκρίνουμε τα αποτελέσματα . el
dc.description.abstract Data mining is a relatively new field which includes techniques for processing and analysing large databases. The goal of these techniques is to discover new patterns among the data and extract useful knowledge. In my diploma dissertation, I have investigated the following: the technology of Decision Trees, Artificial Neural Networks (ANNs), Logistic Regression and ROC curves. The first chapter constitutes an introduction to the data mining techniques and examines their purposes, the general data mining procedure as well as their applications. The second chapter analyses the data mining techniques. Firstly, as far as Decision trees are concerned, I focused on C&RT Algorithm. On the other hand, in the case of Artificial Neural Networks (ANNs), I analysed the main characteristics as well as the two most common classes of ANNs, namely; the Multilayer Perceptrons (MLPs) and the Radial Basis Function Networks (RBFNs). This chapter also deals with Logistic Regression and ways in which the parameters are estimated. Finally, the basic terminals for ROC Analysis are presented and the meaning and utility of the Area Under the ROC Curve are also described. The objective of the third chapter is to examine an application on actual medical data (8862 trauma patients) using Clementine SPSS, a data mining software. This data was applied to the Classification and Regression Trees (C&RT), Multilayer Perceptron Neural Networks (MLPs), Radial Basis Function Neural Networks (RBFNs) and Logistic Regression (LR) to predict and compare the results in terms of overall classification accuracy, sensitivity , specificity, positive predictive value, the negative predictive value and area under the ROC curve (AUC). en
dc.description.statementofresponsibility Δημούλα Η. Ηράκλη el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Τεχνικές εξόρυξης el
dc.subject Νευρωνικά δίκτυα el
dc.subject Λογιστική παλινδρόμηση el
dc.subject ROC καμπύλες el
dc.subject Δέντρα αποφάσεων el
dc.subject Data mining en
dc.subject neural networks en
dc.subject logistic regression en
dc.subject MLP en
dc.subject RBFN en
dc.subject Decision trees en
dc.title Τεχνικές Εξόρυξης Δεδομένων, Λογιστική Παλινδρόμηση και χρήση ROC Καμπυλών για την Ανάλυση Πραγματικών Ιατρικών Δεδομένων el
dc.type bachelorThesis el (en)
dc.date.accepted 2012-07-13 -
dc.date.modified 2012-07-17 -
dc.contributor.advisorcommitteemember Σπηλιώτης, Ιωάννης el
dc.contributor.advisorcommitteemember Βόντα, Φιλία el
dc.contributor.committeemember Κουκουβίνος, Χρήστος el
dc.contributor.committeemember Σπηλιώτης, Ιωάννης el
dc.contributor.committeemember Βόντα, Φιλία el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών & Φυσικών Επιστημών. el
dc.date.recordmanipulation.recordcreated 2012-07-23 -
dc.date.recordmanipulation.recordmodified 2012-07-23 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής