HEAL DSpace

Μέθοδοι για την Ταξινόμηση μη Ισορροπημένων Δεδομένων με Μηχανές Διανυσματικής Υποστήριξης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Δρόσου, Κρυσταλλένια el
dc.contributor.author Drosou, Krystallenia en
dc.date.accessioned 2020-08-28T05:16:31Z
dc.date.available 2020-08-28T05:16:31Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/51024
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.18722
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Support Vector Machines en
dc.subject Imbalanced learning problem el
dc.subject Medical Data en
dc.subject Imbalanced classification en
dc.subject Ταξινόμηση δεδομένων el
dc.subject Ιατρικά Δεδομένα el
dc.subject Μηχανές Διανυσματικής Υποστήριξης el
dc.title Μέθοδοι για την Ταξινόμηση μη Ισορροπημένων Δεδομένων με Μηχανές Διανυσματικής Υποστήριξης el
dc.title Class Imbalanced Problem with Support Vector Machines en
dc.contributor.department Εφαρμοσμένες Μαθηματικές Επιστήμες el
heal.type masterThesis
heal.classification Μαθηματικά el
heal.classification mathematics and statistics en
heal.classification Supervised learning (Machine learning) el
heal.classification Learning classifier systems el
heal.classification Medical statistics el
heal.classificationURI http://lod.nal.usda.gov/6369
heal.classificationURI http://id.loc.gov/authorities/subjects/sh94008290
heal.classificationURI http://id.loc.gov/authorities/subjects/sh2009000319
heal.classificationURI http://id.loc.gov/authorities/subjects/sh85083031
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-06-02
heal.abstract Στην παρούσα μεταπτυχιακή εργασία θα ασχοληθούμε με το πρόβλημα που σχετίζεται με την ανισορροπία μεταξύ των κλάσεων σε προβλήματα ταξινόμησης και συγκεκριμένα στη δυαδική ταξινόμηση. Βασικός ταξινομητής που θα χρησιμοποιήσουμε είναι οι Μηχανές Διανυσματικής Υποστήριξης. Στην συγκεκριμένη εργασία ερχόμαστε αντιμέτωποι με διάφορες μεθόδους και αλγορίθμους από το πεδίο της μηχανικής μάθησης έχοντας ως στόχο την εύρεση ενός μοντέλου το οποίο θα έχει καλή προβλεπτική ικανότητα σε προβλήματα με μη ισορροπημένες κλάσεις μεταξύ των δεδομένων. Δεδομένου ότι στην περίπτωση των ιατρικών δεδομένων το πρόβλημα αυτό αποτελεί τoν κανόνα και όχι την εξαίρεση, εφαρμόζουμε τις μεθόδους σε πέντε σύνολα δεδομένων που προέρχονται από τον ιατρικό κλάδο. Οι διάφορες μέθοδοι εξισορρόπησης που χρησιμοποιούμε αναφέρονται τόσο σε επιπέδο προ-επεξεργασίας των δεδομένων όσο και σε αλγοριθμικό επίπεδο. Ιδιαίτερα σημαντικό φαίνεται να μελετήσουμε τα μικρά μη ισορροπημένα σύνολα εκπαίδευσης ξεχωριστά από τα μεγάλα λόγω χρήζουν διαφορετικές μεταχείρισης. Ως εκ τούτου το πρώτο μέρος της ανάλυσης πραγματοποιείται σε μικρότερα σύνολα ιατρικών δεδομένων και το δεύτερο μέρος σε ένα μεγαλύτερο σύνολο δεδομένων. Πιο συγκεκριμένα, το πρώτο κεφάλαιο ασχολείται με την βασική ιδέα του προβλήματος της ανισορροπίας μεταξύ των κλάσεων σε προβλήματα ταξινόμησης και το δεύτερο με τις τεχνικές και μεθόδους χειρισμού των μη ισορροπημένων δεδομένων. Το κεφάλαιο 3 παρουσιάζει το πρόβλημα της ανισσοροπίας των κλάσεων με τη χρήση των μηχανών διανυσματικής υποστήριξης και παρουσιάζονται διάφορες μέθοδοι που θα εφορμοστούν και στην πράξη αποδεικνύοντας τη σημαντικότητα των παρουσιαζόμενων τεχνικών. Στο τέταρτο κεφάλαιο αναφερόμαστε στην αξιολόγηση ενός μοντέλου ταξινόμησης με τη χρήση πολλαπλής διασταυρωμένης επικύρωσης, στην απόδοση των προαναφερθέντων ταξινομητών αλλά και σε διάφορα μέτρα απόδοσης που είναι απαραίτητο να ληφθούν υπόψη όταν αντιμετωπίζουμε προβλήματα με μη ισορροπημένα δεδομένα. Το κεφάλαιο 5 αποτελείται από δύο μέρη. Το πρώτο μέρος περιλαμβάνει την ανάλυση τεσσάρων συνόλων ιατρικών δεδομένων με τη χρήση αλγορίθμων εξισορρόπησης και το δεύτερο μέρος παρουσιάζει την ανάλυση ενός μεγάλου συνόλου ιατρικών δεδομένων με τη χρήση τόσο αλγοριθμικών όσο και μεθόδων προ-επεξεργασίας των δεδομένων. Στο έκτο και τελευταίο κεφάλαιο παρουσιάζονται τα συμπεράσματα της παραπάνω μελέτης. el
heal.abstract In this master thesis we will deal with the problem associated with imbalance between classes in classification problems and specifically on binary classification. The main classifier we will use is the Support Vector Machines. In this work we are confronted with different methods and algorithms from the field of machine learning with the aim of finding a model that will have good predictive ability in problems with unbalanced distributions between classes. Since, in medical diagnosis problems this fact constitutes the rule rather than an exception; we applied many reweighted methods on five datasets from the medical diagnosis field. Various rebalancing methods are used and reported at both on pre-processing and on algorithmic level. The first part of the analysis performed in smaller datasets of medical data and the second part into a larger data set. More specifically, the first chapter deals with the basic idea of the problem of imbalanced classes in classification problems and the second one with techniques and methods for handling such data. Chapter 3 presents the class imbalanced problem with Support Vector Machines presenting various methods that will be applied in practice demonstrating the significance of the presented techniques. In the fourth chapter we refer to the evaluation of a classification model using multiple cross-validation, the performance of the aforementioned classifiers and various performance measures need to be taken into account when facing problems with imbalanced data. Chapter 5 consists of two parts. The first part comprises the analysis of four sets of medical data using reweighted algorithms and the second part presents the analysis of a large set of medical data using both algorithmic and pre-processing methods. The sixth and final chapter presents the conclusions of the above study. en
heal.sponsor Η ολοκλήρωση της διπλωματικής εργασίας συγχρηματοδοτήθηκε μέσω της Πράξης Πρόγραμμα χορήγησης υποτροφιών ΙΚΥ για Μεταπτυχιακές Σπουδές Πρώτου Κύκλου (Μάστερ) ‐ Οριζόντια Πράξη, από πόρους του ΕΠ «Εκπαίδευση και Δια Βίου Μάθηση» του Ευρωπαϊκού Κοινωνικού Ταμείου (ΕΚΤ) του ΕΣΠΑ, 2007‐2013. el
heal.sponsor Η ολοκλήρωση της διπλωματικής εργασίας συγχρηματοδοτήθηκε από το Ιδρυμα Λοχαγού Φανουράκη el
heal.advisorName Κουκουβίνος, Χρήστος el
heal.committeeMemberName Σπυλιώτης, Ιωάννης el
heal.committeeMemberName Βόντα, Φιλία el
heal.academicPublisher Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.numberOfPages 181
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα