dc.contributor.author | Δρόσου, Κρυσταλλένια | el |
dc.contributor.author | Drosou, Krystallenia | en |
dc.date.accessioned | 2020-08-28T05:16:31Z | |
dc.date.available | 2020-08-28T05:16:31Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/51024 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.18722 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Support Vector Machines | en |
dc.subject | Imbalanced learning problem | el |
dc.subject | Medical Data | en |
dc.subject | Imbalanced classification | en |
dc.subject | Ταξινόμηση δεδομένων | el |
dc.subject | Ιατρικά Δεδομένα | el |
dc.subject | Μηχανές Διανυσματικής Υποστήριξης | el |
dc.title | Μέθοδοι για την Ταξινόμηση μη Ισορροπημένων Δεδομένων με Μηχανές Διανυσματικής Υποστήριξης | el |
dc.title | Class Imbalanced Problem with Support Vector Machines | en |
dc.contributor.department | Εφαρμοσμένες Μαθηματικές Επιστήμες | el |
heal.type | masterThesis | |
heal.classification | Μαθηματικά | el |
heal.classification | mathematics and statistics | en |
heal.classification | Supervised learning (Machine learning) | el |
heal.classification | Learning classifier systems | el |
heal.classification | Medical statistics | el |
heal.classificationURI | http://lod.nal.usda.gov/6369 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh94008290 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh2009000319 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh85083031 | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2015-06-02 | |
heal.abstract | Στην παρούσα μεταπτυχιακή εργασία θα ασχοληθούμε με το πρόβλημα που σχετίζεται με την ανισορροπία μεταξύ των κλάσεων σε προβλήματα ταξινόμησης και συγκεκριμένα στη δυαδική ταξινόμηση. Βασικός ταξινομητής που θα χρησιμοποιήσουμε είναι οι Μηχανές Διανυσματικής Υποστήριξης. Στην συγκεκριμένη εργασία ερχόμαστε αντιμέτωποι με διάφορες μεθόδους και αλγορίθμους από το πεδίο της μηχανικής μάθησης έχοντας ως στόχο την εύρεση ενός μοντέλου το οποίο θα έχει καλή προβλεπτική ικανότητα σε προβλήματα με μη ισορροπημένες κλάσεις μεταξύ των δεδομένων. Δεδομένου ότι στην περίπτωση των ιατρικών δεδομένων το πρόβλημα αυτό αποτελεί τoν κανόνα και όχι την εξαίρεση, εφαρμόζουμε τις μεθόδους σε πέντε σύνολα δεδομένων που προέρχονται από τον ιατρικό κλάδο. Οι διάφορες μέθοδοι εξισορρόπησης που χρησιμοποιούμε αναφέρονται τόσο σε επιπέδο προ-επεξεργασίας των δεδομένων όσο και σε αλγοριθμικό επίπεδο. Ιδιαίτερα σημαντικό φαίνεται να μελετήσουμε τα μικρά μη ισορροπημένα σύνολα εκπαίδευσης ξεχωριστά από τα μεγάλα λόγω χρήζουν διαφορετικές μεταχείρισης. Ως εκ τούτου το πρώτο μέρος της ανάλυσης πραγματοποιείται σε μικρότερα σύνολα ιατρικών δεδομένων και το δεύτερο μέρος σε ένα μεγαλύτερο σύνολο δεδομένων. Πιο συγκεκριμένα, το πρώτο κεφάλαιο ασχολείται με την βασική ιδέα του προβλήματος της ανισορροπίας μεταξύ των κλάσεων σε προβλήματα ταξινόμησης και το δεύτερο με τις τεχνικές και μεθόδους χειρισμού των μη ισορροπημένων δεδομένων. Το κεφάλαιο 3 παρουσιάζει το πρόβλημα της ανισσοροπίας των κλάσεων με τη χρήση των μηχανών διανυσματικής υποστήριξης και παρουσιάζονται διάφορες μέθοδοι που θα εφορμοστούν και στην πράξη αποδεικνύοντας τη σημαντικότητα των παρουσιαζόμενων τεχνικών. Στο τέταρτο κεφάλαιο αναφερόμαστε στην αξιολόγηση ενός μοντέλου ταξινόμησης με τη χρήση πολλαπλής διασταυρωμένης επικύρωσης, στην απόδοση των προαναφερθέντων ταξινομητών αλλά και σε διάφορα μέτρα απόδοσης που είναι απαραίτητο να ληφθούν υπόψη όταν αντιμετωπίζουμε προβλήματα με μη ισορροπημένα δεδομένα. Το κεφάλαιο 5 αποτελείται από δύο μέρη. Το πρώτο μέρος περιλαμβάνει την ανάλυση τεσσάρων συνόλων ιατρικών δεδομένων με τη χρήση αλγορίθμων εξισορρόπησης και το δεύτερο μέρος παρουσιάζει την ανάλυση ενός μεγάλου συνόλου ιατρικών δεδομένων με τη χρήση τόσο αλγοριθμικών όσο και μεθόδων προ-επεξεργασίας των δεδομένων. Στο έκτο και τελευταίο κεφάλαιο παρουσιάζονται τα συμπεράσματα της παραπάνω μελέτης. | el |
heal.abstract | In this master thesis we will deal with the problem associated with imbalance between classes in classification problems and specifically on binary classification. The main classifier we will use is the Support Vector Machines. In this work we are confronted with different methods and algorithms from the field of machine learning with the aim of finding a model that will have good predictive ability in problems with unbalanced distributions between classes. Since, in medical diagnosis problems this fact constitutes the rule rather than an exception; we applied many reweighted methods on five datasets from the medical diagnosis field. Various rebalancing methods are used and reported at both on pre-processing and on algorithmic level. The first part of the analysis performed in smaller datasets of medical data and the second part into a larger data set. More specifically, the first chapter deals with the basic idea of the problem of imbalanced classes in classification problems and the second one with techniques and methods for handling such data. Chapter 3 presents the class imbalanced problem with Support Vector Machines presenting various methods that will be applied in practice demonstrating the significance of the presented techniques. In the fourth chapter we refer to the evaluation of a classification model using multiple cross-validation, the performance of the aforementioned classifiers and various performance measures need to be taken into account when facing problems with imbalanced data. Chapter 5 consists of two parts. The first part comprises the analysis of four sets of medical data using reweighted algorithms and the second part presents the analysis of a large set of medical data using both algorithmic and pre-processing methods. The sixth and final chapter presents the conclusions of the above study. | en |
heal.sponsor | Η ολοκλήρωση της διπλωματικής εργασίας συγχρηματοδοτήθηκε μέσω της Πράξης Πρόγραμμα χορήγησης υποτροφιών ΙΚΥ για Μεταπτυχιακές Σπουδές Πρώτου Κύκλου (Μάστερ) ‐ Οριζόντια Πράξη, από πόρους του ΕΠ «Εκπαίδευση και Δια Βίου Μάθηση» του Ευρωπαϊκού Κοινωνικού Ταμείου (ΕΚΤ) του ΕΣΠΑ, 2007‐2013. | el |
heal.sponsor | Η ολοκλήρωση της διπλωματικής εργασίας συγχρηματοδοτήθηκε από το Ιδρυμα Λοχαγού Φανουράκη | el |
heal.advisorName | Κουκουβίνος, Χρήστος | el |
heal.committeeMemberName | Σπυλιώτης, Ιωάννης | el |
heal.committeeMemberName | Βόντα, Φιλία | el |
heal.academicPublisher | Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 181 | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: