dc.contributor.author | Ασπρογέρακα, Θεοφίλη | el |
dc.contributor.author | Asprogeraka, Theofili | |
dc.date.accessioned | 2015-06-26T10:01:35Z | |
dc.date.available | 2015-06-26T10:01:35Z | |
dc.date.issued | 2015-06-26 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/40898 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.8664 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Συσταδοποίηση | el |
dc.subject | Ανάλυση συναισθήματος | el |
dc.subject | Κλάσεις συναισθήματος | el |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Clustering | en |
dc.subject | Sentiment analysis | en |
dc.subject | Classes of sentiment | en |
dc.subject | k-means | en |
dc.subject | Expectation - maximization | en |
dc.subject | Tweets | en |
dc.subject | Μη επιβλεπόμενη μηχανική μάθηση | el |
dc.title | Ανάλυση συναισθήματος σε κείμενο από tweets με μεθόδους μη επιβλεπόμενης μηχανικής μάθησης | el |
heal.type | bachelorThesis | |
heal.classification | Μηχανική μάθηση | el |
heal.classification | Ανάλυση συναισθήματος | el |
heal.classification | Αλληλεπίδραση ανθρώπου - υπολογιστή | el |
heal.classification | Machine learning | el |
heal.classification | Sentiment analysis | en |
heal.classification | Human - computer interaction | en |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh85079324 | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2015-03-27 | |
heal.abstract | Αντικείμενο της παρούσας διπλωματικής είναι η Ανάλυση Συναισθήματος σε κείμενο μικρού μήκους που προέρχεται από δικτυακές πηγές, με χρήση Μηχανικής Μάθησης. Το σύνολο δεδομένων που χρησιμοποιείται αποτελείται από δημοσιεύσεις του ιστοχώρου κοινωνικής δικτύωσης www.twitter.com, οι οποίες έχουν κοινό θέμα τον τουρισμό στην Ελλάδα. Στόχος μας είναι η κατάταξη των δημοσιεύσεων (tweets) στις εξής τέσσερις κλάσεις συναισθήματος: θετική (positive) κλάση, αρνητική (negative) κλάση, ουδέτερη (neutral) κλάση, απροσδιόριστη (undefined) κλάση με τη βοήθεια Μη Επιβλεπόμενης Μηχανικής Μάθησης. Αρχικά, γίνεται μια εισαγωγή στην έννοια της Ανάλυσης Συναισθήματος και ακολούθως γίνεται εκτενής αναφορά στις δύο βασικές μεθόδους που εφαρμόζονται στα προβλήματα Ανάλυσης Συναισθήματος. Αυτές είναι η βασισμένη σε λεξικό μέθοδος και η βασισμένη σε Μηχανική Μάθηση μέθοδος, με το ενδιαφέρον μας να επικεντρώνεται στη δεύτερη. Στο τμήμα που αναφέρεται στην βασισμένη σε λεξικό μέθοδο γίνεται περιγραφή της μεθόδου, των δυσκολιών και των τρόπων αντιμετώπισης τους και τέλος περιγράφεται η δημιουργία διαδεδομένων Λεξικών Συναισθήματος και γίνεται αναφορά σε σημαντικές σχετικές δημοσιεύσεις. Στο τμήμα που αφορά τη μέθοδο που βασίζεται στη Μηχανική Μάθηση γίνεται περιγραφή των κατηγοριών Μηχανικής Μάθησης γενικά και ειδικά για το πρόβλημα της Ανάλυσης Συναισθήματος. Αναλύονται τα στάδια και οι παράμετροι της μεθόδου και περιγράφονται βασικοί αλγόριθμοι για κάθε μία από τις κατηγορίες Μηχανικής Μάθησης στην Ανάλυση Συναισθήματος. Ακολούθως, γίνεται αναφορά στα προβλήματα της μεθόδου, στους τρόπους αξιολόγησης ενός συστήματος Ανάλυσης Συναισθήματος και σε διάφορα διαθέσιμα datasets. Tέλος, γίνεται ειδική αναφορά στη διαχείριση των tweets και κλείνουμε με μια σύντομη περιγραφή σχετικών δημοσιεύσεων και με την παράθεση διαθέσιμων APIs Ανάλυσης Συναισθήματος. Στη συνέχεια, έχοντας πλέον περιγράψει θεωρητικά όλα τα απαραίτητα στάδια και παραμέτρους εστιάζουμε στην εφαρμογή της μεθόδου Μηχανικής Μάθησης στα δεδομένα μας. Δοκιμάζουμε διάφορες εκδοχές προεπεξεργασίας των δεδομένων, διαφορετικούς αλγορίθμους και μεταβολή διάφορων παραμέτρων του προβλήματος. Έμφαση δόθηκε στην Μη Επιβλεπόμενη Μηχανική Μάθηση (συσταδοποίηση), ωστόσο για βαθύτερη κατανόηση και μελέτη των αποτελεσμάτων έγιναν δοκιμές και με τη μέθοδο Επιβλεπόμενης Μάθησης. Μελετώντας με προσοχή τα αποτελέσματα που προκύπτουν από τις διάφορες δοκιμές, συμπεραίνουμε ότι η συσταδοποίηση δεν μπορεί να δώσει ικανοποιητικά αποτελέσματα στο πρόβλημα της Ανάλυσης Συναισθήματος σε tweets λόγω του ότι η μέθοδος προσπαθεί να εντοπίσει ομοιότητες μεταξύ των tweets αγνοώντας εντελώς τις διαφορές που ενδεχομένως να είναι πιο σημαντικές. Ωστόσο, μέσα από τη μελέτη των αποτελεσμάτων καταλήγουμε σε σημαντικά ευρήματα που θα μπορούσαν να φανούν χρήσιμα σε μελλοντικές έρευνες. | el |
heal.advisorName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας - Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 122 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: