HEAL DSpace

Μηχανές διανυσμάτων υποστήριξης και ψ-μάθηση για την ταξινόμηση δεδομένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κωνσταντή, Παναγιώτα el
dc.contributor.author Konstanti, Panagiota en
dc.date.accessioned 2016-10-25T06:36:15Z
dc.date.available 2016-10-25T06:36:15Z
dc.date.issued 2016-10-25
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/43889
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.10826
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Μηχανική μάθηση el
dc.subject Μηχανές διανυσμάτων υποστήριξης el
dc.subject Ψ-μάθηση el
dc.subject Ταξινόμηση δεδομένων el
dc.subject Ταξινομητές el
dc.subject Machine learning en
dc.subject Support vector machines en
dc.subject Classification en
dc.subject Classifier en
dc.subject Ψ-learning en
dc.title Μηχανές διανυσμάτων υποστήριξης και ψ-μάθηση για την ταξινόμηση δεδομένων el
heal.type bachelorThesis
heal.secondaryTitle Support vector machines and ψ-learning for data classification en
heal.classification Στατιστική και μαθηματικά el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2016-09-13
heal.abstract Στην επιστήμη και την τεχνολογία η ταξινόμηση γίνεται ολοένα και πιο σημαντική ως εργαλείο για την εξαγωγή πληροφοριών. Διάφορες μέθοδοι κατά καιρούς έχουν προταθεί για την βελτίωση της ταξινόμησης και την απόδοση καλύτερων αποτελεσμάτων. Η παρούσα διπλωματική επικεντρώνεται σε δυο τεχνικές ταξινόμησης περιθωρίου-βάσης, τη δημοφιλή SVM (Μηχανή Διανυσμάτων Υποστήριξης) καθώς και μια νέα τεχνική τη λεγόμενη ψ-Learning. Παρά το γεγονός ότι και οι δυο τεχνικές μοιάζουν εκ τον υστέρων θα δούμε ότι η ψ-μάθηση πλεονεκτεί έναντι της SVM τόσο σε αριθμητικό όσο και σε θεωρητικό επίπεδο. Στο πρώτο κεφάλαιο γίνεται εισαγωγή στην έννοια της μηχανικής μάθησης, στον τρόπο λειτουργίας της καθώς επίσης και στις τεχνικές ταξινόμησης που έχουν αναπτυχθεί παράλληλα στην στατιστική και την μηχανική μάθηση. Επίσης γίνεται μια εκτενέστερη αναφορά στους ταξινομητές μέγιστου περιθωρίου. Στο δεύτερο κεφάλαιο αναπτύσσουμε την ιδέα των μηχανών διανυσμάτων υποστήριξης (SVMs) για την επίλυση των προβλημάτων διαχωρισμού των δεδομένων με μεγάλο περιθώριο σε δυαδικά προβλήματα ταξινόμησης καθώς επίσης και σε πράξεις στο επίπεδο του πυρήνα. Στην συνέχεια επεκτείνουμε την δυαδική ταξινόμηση στην περίπτωση πολλαπλών κατηγοριών με την χρήση δυο πολύ σημαντικών συστημάτων ταξινόμησης. Στο τρίτο κεφάλαιο παρουσιάζουμε την τεχνική μάθησης ψ-μάθηση και δείχνουμε ότι σε μη διαχωρίσιμες περιπτώσεις αποτελεί λύση στα προβλήματα που αντιμετωπίζει η αντίστοιχη SVM. Αναπτύσσουμε την ιδέα της, η οποία βασίζεται σε ένα μη κυρτό πρόβλημα ελαχιστοποίησης και προτείνουμε μεθόδους επίλυσης της ελαχιστοποίησης αυτής. Επίσης αναφερόμαστε στο θεωρητικό της υπόβαθρο το οποίο της παρέχει ισχυρά πλεονεκτήματα έναντι των άλλων μεθόδων ταξινόμησης. Τέλος επεκτείνουμε την δυαδική ταξινόμηση σε ταξινόμηση πολλαπλών κατηγοριών και βλέπουμε ότι η ψ-learning διατηρεί την ερμηνεία των περιθωρίων και τις ιδιότητες της αντίστοιχης δυαδικής ταξινόμησης. Στο τέταρτο κεφάλαιο αρχικά παρουσιάζουμε τα μέτρα αξιολόγησης ενός μοντέλου. Στην συνέχεια γίνονται εφαρμογές σε πραγματικά δεδομένα τα οποία πάρθηκαν από το UCI Machine Learning Repository. Αρχικά γίνεται μια εφαρμογή στην R σε δεδομένα στα οποία έχουμε ένα πρόβλημα δυαδικής ταξινόμησης (Parkinsons Data Set). Εφαρμόζουμε την ταξινόμηση με την χρήση των μηχανών διανυσμάτων υποστήριξης για τους τέσσερις διαφορετικούς πυρήνες και κάνουμε συγκρίσεις των αποτελεσμάτων αυτών σύμφωνα με τα κριτήρια απόδοσης. Τέλος γίνονται ακόμη τρεις εφαρμογές σε πραγματικά δεδομένα για την σύγκριση των αποτελεσμάτων της τεχνικής SVM και ψ-μάθησης Στο πέμπτο και τελευταίο κεφάλαιο γίνεται ένας επίλογος που παραθέτουμε τα γενικά μας συμπεράσματα. el
heal.abstract Classification is increasingly becoming an important tool for extracting information in both science and technology. Various methods have been proposed from time to time to improve the classification and yield better results. This thesis focuses on two Margin-based classification techniques, the popular Support Vector Machine (SVM) and a new technique called ψ-Learning. Although, the two techniques seem to be similar at first, it is shown afterwards that ψ-learning outweighs SVM not only in numerical but also in theoretical level. The first chapter is the introduction to the concept of machine learning, its operations as well as the classification techniques that have been developed alongside in statistics and engineering learning. There is also a more extensive reference to the maximum margin classifiers. In the second chapter the idea of SVMs is developed for solving problems of data separation by a large margin in binary classification problems as well as in operations to the kernel level. Then the binary classification is expanded in the case of multiple categories using two very important classification systems. In the third chapter the ψ-Learning technique is presented and it is shown that in non-separable cases this method is the solution to problems the corresponding SVM faces. Its concept, which is based on a non-convex minimization problem, is developed and we suggest methods to solve this minimization. There is also a reference to its theoretical background which gives this technique powerful advantages over other classification methods. Finally, the binary classification is expanded into a multicategory classification and it is clearly seen that ψ-learning maintains the interpretation of the margins and the qualities of the corresponding binary classification. In the fourth chapter we initially present the evaluation measures of a model. Then applications are contacted to real data that have been obtained from the UCI Machine Learning Repository. Originally data with a binary classification problem (Parkinsons Data Set) is applied to R. The classification is applied with the use of support vector machines for four different kernels and we compare these results according to the performance criteria. Finally, there are three more applications to real data which can enhance the comparison of the results between the technical SVM and ψ-learning. In the fifth and final chapter the overall conclusions are presented. en
heal.advisorName Κουκουβίνος, Χρήστος el
heal.committeeMemberName Καρώνη-Ρίτσαρντσον, Χρυσηίς el
heal.committeeMemberName Βόντα, Φιλία el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Μαθηματικών el
heal.academicPublisherID ntua
heal.numberOfPages 131 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα