dc.contributor.advisor |
Κουκουβίνος, Χρήστος |
el |
dc.contributor.author |
Ηράκλη, Δημούλα Η.
|
el |
dc.contributor.author |
Eracli, Demoula E.
|
en |
dc.date.accessioned |
2012-07-23T09:28:04Z |
|
dc.date.available |
2012-07-23T09:28:04Z |
|
dc.date.copyright |
2012-07-17 |
- |
dc.date.issued |
2012-07-23 |
|
dc.date.submitted |
2012-07-17 |
- |
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/6466 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.10861 |
|
dc.description.abstract |
Η τεχνολογία του data mining είναι μια σχετικά καινούρια περιοχή η οποία περιλαμβάνει τεχνικές επεξεργασίας και ανάλυσης μεγάλων βάσεων δεδομένων. Ο στόχος αυτών των τεχνικών είναι η ανακάλυψη νέων προτύπων μεταξύ των δεδομένων και η εξαγωγή χρήσιμων πληροφοριών. Στην παρούσα διπλωματική εργασία μελετήθηκαν οι εξης : τα Δέντρα Αποφάσεων, τα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ), η Λογιστική Παλινδρόμηση και οι Καμπύλες ROC.
Το πρώτο κεφάλαιο περιέχει μια εισαγωγή στις τεχνικές του data mining η οποία περιλαμβάνει τους σκοπούς και τη διαδικασία του, καθώς επίσης και τουσ τομείς στους οποίους εφαρμόζεται.
Στο δεύτερο κεφάλαιο αναλύονται οι τεχνικές εξόρυξης γνώσης. Στα Δέντρα Αποφάσεων μελετήθηκε ο Αλγόριθμος C&RT και στα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ) αναλύθηκαν τα κύρια χαρακτηριστικά τους καθώς και δύο κύρια μοντέλα των τεχνητών νευρωνικών δικτύων, τα δίκτυα MLP και RBFN. Ακολούθως, παρουσιάζεται η Λογιστική Παλινδρόμηση και τρόποι με τους οποίους εκτιμούνται οι παράμετροι. Τέλος, παρουσιάζεται η βασική ορολογία της ROC Ανάλυσης και περιγράφεται η έννοια και η χρήση του Εμβαδού Κάτω από την Καμπύλη ROC.
Το τρίτο κεφάλαιο περιλαμβάνει την εφαρμογή που πραγματοποιήθηκε πάνω σε πραγματικά ιατρικά δεδομένα (8862 ασθενείς με τραύματα) με τη βοήθεια του προγράμματος Clementine SPSS, ενός λογισμικού εξόρυξυς δεδομένων. Τα δεδομένα αυτά εφαρμόστηκαν στον Αλγόριθμο C&RT, στις νευρωνικές μεθόδους MLP και RBFN και στο μοντέλο της Λογιστικής Παλινδρόμησης με σκοπό να προβλέψουμε και να συγκρίνουμε τα αποτελέσματα . |
el |
dc.description.abstract |
Data mining is a relatively new field which includes techniques for processing and analysing large databases. The goal of these techniques is to discover new patterns among the data and extract useful knowledge. In my diploma dissertation, I have investigated the following: the technology of Decision Trees, Artificial Neural Networks (ANNs), Logistic Regression and ROC curves.
The first chapter constitutes an introduction to the data mining techniques and examines their purposes, the general data mining procedure as well as their applications.
The second chapter analyses the data mining techniques. Firstly, as far as Decision trees are concerned, I focused on C&RT Algorithm. On the other hand, in the case of Artificial Neural Networks (ANNs), I analysed the main characteristics as well as the two most common classes of ANNs, namely; the Multilayer Perceptrons (MLPs) and the Radial Basis Function Networks (RBFNs). This chapter also deals with Logistic Regression and ways in which the parameters are estimated. Finally, the basic terminals for ROC Analysis are presented and the meaning and utility of the Area Under the ROC Curve are also described.
The objective of the third chapter is to examine an application on actual medical data (8862 trauma patients) using Clementine SPSS, a data mining software. This data was applied to the Classification and Regression Trees (C&RT), Multilayer Perceptron Neural Networks (MLPs), Radial Basis Function Neural Networks (RBFNs) and Logistic Regression (LR) to predict and compare the results in terms of overall classification accuracy, sensitivity , specificity, positive predictive value, the negative predictive value and area under the ROC curve (AUC). |
en |
dc.description.statementofresponsibility |
Δημούλα Η. Ηράκλη |
el |
dc.language.iso |
el |
en |
dc.rights |
ETDFree-policy.xml |
en |
dc.subject |
Τεχνικές εξόρυξης |
el |
dc.subject |
Νευρωνικά δίκτυα |
el |
dc.subject |
Λογιστική παλινδρόμηση |
el |
dc.subject |
ROC καμπύλες |
el |
dc.subject |
Δέντρα αποφάσεων |
el |
dc.subject |
Data mining |
en |
dc.subject |
neural networks |
en |
dc.subject |
logistic regression |
en |
dc.subject |
MLP |
en |
dc.subject |
RBFN |
en |
dc.subject |
Decision trees |
en |
dc.title |
Τεχνικές Εξόρυξης Δεδομένων, Λογιστική Παλινδρόμηση και χρήση ROC Καμπυλών για την Ανάλυση Πραγματικών Ιατρικών Δεδομένων |
el |
dc.type |
bachelorThesis |
el (en) |
dc.date.accepted |
2012-07-13 |
- |
dc.date.modified |
2012-07-17 |
- |
dc.contributor.advisorcommitteemember |
Σπηλιώτης, Ιωάννης |
el |
dc.contributor.advisorcommitteemember |
Βόντα, Φιλία |
el |
dc.contributor.committeemember |
Κουκουβίνος, Χρήστος |
el |
dc.contributor.committeemember |
Σπηλιώτης, Ιωάννης |
el |
dc.contributor.committeemember |
Βόντα, Φιλία |
el |
dc.contributor.department |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών & Φυσικών Επιστημών. |
el |
dc.date.recordmanipulation.recordcreated |
2012-07-23 |
- |
dc.date.recordmanipulation.recordmodified |
2012-07-23 |
- |