HEAL DSpace

Ανάλυση συναισθήματος σε κείμενο από tweets με μεθόδους μη επιβλεπόμενης μηχανικής μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ασπρογέρακα, Θεοφίλη el
dc.contributor.author Asprogeraka, Theofili
dc.date.accessioned 2015-06-26T10:01:35Z
dc.date.available 2015-06-26T10:01:35Z
dc.date.issued 2015-06-26
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/40898
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.8664
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Συσταδοποίηση el
dc.subject Ανάλυση συναισθήματος el
dc.subject Κλάσεις συναισθήματος el
dc.subject Μηχανική μάθηση el
dc.subject Clustering en
dc.subject Sentiment analysis en
dc.subject Classes of sentiment en
dc.subject k-means en
dc.subject Expectation - maximization en
dc.subject Tweets en
dc.subject Μη επιβλεπόμενη μηχανική μάθηση el
dc.title Ανάλυση συναισθήματος σε κείμενο από tweets με μεθόδους μη επιβλεπόμενης μηχανικής μάθησης el
heal.type bachelorThesis
heal.classification Μηχανική μάθηση el
heal.classification Ανάλυση συναισθήματος el
heal.classification Αλληλεπίδραση ανθρώπου - υπολογιστή el
heal.classification Machine learning el
heal.classification Sentiment analysis en
heal.classification Human - computer interaction en
heal.classificationURI http://id.loc.gov/authorities/subjects/sh85079324
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-03-27
heal.abstract Αντικείμενο της παρούσας διπλωματικής είναι η Ανάλυση Συναισθήματος σε κείμενο μικρού μήκους που προέρχεται από δικτυακές πηγές, με χρήση Μηχανικής Μάθησης. Το σύνολο δεδομένων που χρησιμοποιείται αποτελείται από δημοσιεύσεις του ιστοχώρου κοινωνικής δικτύωσης www.twitter.com, οι οποίες έχουν κοινό θέμα τον τουρισμό στην Ελλάδα. Στόχος μας είναι η κατάταξη των δημοσιεύσεων (tweets) στις εξής τέσσερις κλάσεις συναισθήματος: θετική (positive) κλάση, αρνητική (negative) κλάση, ουδέτερη (neutral) κλάση, απροσδιόριστη (undefined) κλάση με τη βοήθεια Μη Επιβλεπόμενης Μηχανικής Μάθησης. Αρχικά, γίνεται μια εισαγωγή στην έννοια της Ανάλυσης Συναισθήματος και ακολούθως γίνεται εκτενής αναφορά στις δύο βασικές μεθόδους που εφαρμόζονται στα προβλήματα Ανάλυσης Συναισθήματος. Αυτές είναι η βασισμένη σε λεξικό μέθοδος και η βασισμένη σε Μηχανική Μάθηση μέθοδος, με το ενδιαφέρον μας να επικεντρώνεται στη δεύτερη. Στο τμήμα που αναφέρεται στην βασισμένη σε λεξικό μέθοδο γίνεται περιγραφή της μεθόδου, των δυσκολιών και των τρόπων αντιμετώπισης τους και τέλος περιγράφεται η δημιουργία διαδεδομένων Λεξικών Συναισθήματος και γίνεται αναφορά σε σημαντικές σχετικές δημοσιεύσεις. Στο τμήμα που αφορά τη μέθοδο που βασίζεται στη Μηχανική Μάθηση γίνεται περιγραφή των κατηγοριών Μηχανικής Μάθησης γενικά και ειδικά για το πρόβλημα της Ανάλυσης Συναισθήματος. Αναλύονται τα στάδια και οι παράμετροι της μεθόδου και περιγράφονται βασικοί αλγόριθμοι για κάθε μία από τις κατηγορίες Μηχανικής Μάθησης στην Ανάλυση Συναισθήματος. Ακολούθως, γίνεται αναφορά στα προβλήματα της μεθόδου, στους τρόπους αξιολόγησης ενός συστήματος Ανάλυσης Συναισθήματος και σε διάφορα διαθέσιμα datasets. Tέλος, γίνεται ειδική αναφορά στη διαχείριση των tweets και κλείνουμε με μια σύντομη περιγραφή σχετικών δημοσιεύσεων και με την παράθεση διαθέσιμων APIs Ανάλυσης Συναισθήματος. Στη συνέχεια, έχοντας πλέον περιγράψει θεωρητικά όλα τα απαραίτητα στάδια και παραμέτρους εστιάζουμε στην εφαρμογή της μεθόδου Μηχανικής Μάθησης στα δεδομένα μας. Δοκιμάζουμε διάφορες εκδοχές προεπεξεργασίας των δεδομένων, διαφορετικούς αλγορίθμους και μεταβολή διάφορων παραμέτρων του προβλήματος. Έμφαση δόθηκε στην Μη Επιβλεπόμενη Μηχανική Μάθηση (συσταδοποίηση), ωστόσο για βαθύτερη κατανόηση και μελέτη των αποτελεσμάτων έγιναν δοκιμές και με τη μέθοδο Επιβλεπόμενης Μάθησης. Μελετώντας με προσοχή τα αποτελέσματα που προκύπτουν από τις διάφορες δοκιμές, συμπεραίνουμε ότι η συσταδοποίηση δεν μπορεί να δώσει ικανοποιητικά αποτελέσματα στο πρόβλημα της Ανάλυσης Συναισθήματος σε tweets λόγω του ότι η μέθοδος προσπαθεί να εντοπίσει ομοιότητες μεταξύ των tweets αγνοώντας εντελώς τις διαφορές που ενδεχομένως να είναι πιο σημαντικές. Ωστόσο, μέσα από τη μελέτη των αποτελεσμάτων καταλήγουμε σε σημαντικά ευρήματα που θα μπορούσαν να φανούν χρήσιμα σε μελλοντικές έρευνες. el
heal.advisorName Κόλλιας, Στέφανος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας - Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 122 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα