HEAL DSpace

Ανάλυση ελληνικής κοινής γνώμης στο Twitter βασισμένη σε λεξικό

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Σφακιανάκης, Αχιλλεύς el
dc.contributor.author Sfakianakis, Achillefs en
dc.date.accessioned 2016-06-21T13:17:04Z
dc.date.available 2016-06-21T13:17:04Z
dc.date.issued 2016-06-21
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/42785
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.10860
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Ανάλυση συναισθήματος el
dc.subject Εξόρυξη γνώμης el
dc.subject Μέσα κοινωνικής δικτύωσης el
dc.subject Λεξικό συναισθήματος el
dc.subject Sentiment analysis en
dc.subject Opinion mining en
dc.subject Twitter en
dc.subject Social networks en
dc.subject Sentiment lexicon en
dc.title Ανάλυση ελληνικής κοινής γνώμης στο Twitter βασισμένη σε λεξικό el
heal.type bachelorThesis
heal.classification Αλληλεπίδραση ανθρώπου-υπολογιστή el
heal.classificationURI http://data.seab.gr/concepts/bac4b03419be9dd1ca94c3c927e170560d480f68
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2016-03-28
heal.abstract Η τεράστια ανάπτυξη των διαδικτυακών εφαρμογών, όπως είναι τα μικρο-ιστολόγια, τα φόρουμ και τα μέσα κοινωνικής δικτύωσης, έχει οδηγήσει στη δημιουργία ενός τεράστιου όγκου διαδικτυακών κειμένων. Η ανάγκη χειρισμού όλων αυτών των δεδομένων μέσω αυτοματοποιημένων τεχνικών, για την κατανόηση των συναισθημάτων, των επιθυμιών και των προθέσεων των χρηστών, προκειμένου να διευκολυνθεί η διαδικασία λήψης αποφάσεων, έχει οδηγήσει στη ραγδαία εξέλιξη του πεδίου της Ανάλυσης Συναισθήματος ή ισοδύναμα Εξόρυξης Γνώμης. Η παρούσα εργασία εστιάζει το ενδιαφέρον της στο Twitter, το οποίο είναι μια πλατφόρμα κοινωνικής δικτύωσης που επιτρέπει στους χρήστες της να δημοσιεύουν ενημερώσεις και να ανταλλάσσουν σύντομα μηνύματα, τα οποία ονομάζονται tweets. Συγκεκριμένα, μελετώνται tweets Ελλήνων χρηστών που αφορούν θέματα κοινωνικής και πολιτικής φύσεως και αναπτύσσεται ένα αυτόματο σύστημα Ανάλυσης Συναισθήματος, το οποίο βασίζεται σε λεξικό συναισθήματος και ταξινομεί τα tweets σε μία απο τις τρείς πιθανές κλάσεις (αρνητικό, θετικό ή ουδέτερο), ανάλογα με την πολικότητα του συναίσθηματος που εκφράζουν. Το λεξικό δημιουργήθηκε με την προσθήκη τμήματος των συχνότερα εμφανιζόμενων λέξεων που εντοπίστηκαν σε ένα σύνολο 20000 tweets, σε ένα ήδη υπάρχον, ελεύθερα διαθέσιμο λεξικό συναισθήματος. Το σύστημα αποτελείται από τρία βασικά στάδια: το στάδιο της προεπεξεργασίας, στο οποίο τα tweets φιλτράρονται για να αφαιρεθεί όλη η άχρηστη πληροφορία, το στάδιο του μετασχηματισμού, κατά το οποίο οι λέξεις των φιλτραρισμένων tweets μετασχηματίζονται σε κατάλληλη μορφή για να μπορούν να εντοπιστούν στο λεξικό και τέλος το στάδιο της ανίχνευσης άρνησης, στο οποίο γίνεται χρήση κάποιων γλωσσολογικών κανόνων για να καθοριστεί αν κάθε λέξη που εντοπίστηκε εντάσσεται σε σχήμα άρνησης και συνεπώς πρέπει να αντιστραφεί η πολικότητά της. Για την αξιολόγηση του συστήματος επιλέχθηκε ένα σύνολο tweets που αφορούσαν τα αποτελέσματα του δευτέρου γύρου των εσωκομματικών εκλογών της Νέας Δημοκρατίας, που ανακοινώθηκαν την 11η Ιανουαρίου 2016. Ο λόγος επιλογής του συγκεκριμένου θέματος, ήταν οτι οι εκλογικές διαδικασίες μονοπωλούν το ενδιαφέρον των χρηστών στο διαδίκτυο, τα σχόλια των οποίων σε τέτοιες περιπτώσεις έχουν πλούσιο συναισθηματικό περιεχόμενο, αφού εκφράζουν με ιδιαιτέρως καυστικό τρόπο είτε την επιδοκιμασία τους είτε την αποδοκιμασία τους προς τα εκλογικά αποτελέσματα. el
heal.abstract The great development of internet applications, such as microblogs, forums and social networks has resulted into the generation of huge volumes of on line textual data. The need for automated manipulation of such data in order to understand the feelings, the desires and the intentions of the users and ultimately facilitate the decision-making process has given rise to the field of Sentiment Analysis or Opinion Mining. This thesis focuses on Twitter, which is an online social network platform that allows users to post updates and send short messages, called tweets. More specifically, tweets of Greek users that refer to political or social issues are taken into account and it is implemented an automatic system for Sentiment Analysis, that is based on a sentiment lexicon and classifies tweets into one of the three possible categories (negative, neutral, or positive), depending on the polarity of the sentiment expressed. The lexicon was created by adding part of the most frequent words that were detected in a data set of 20.000 tweets, into a pre-built greek sentiment lexicon that is publicly available. The system consists of three main stages: the pre-processing stage, in which tweets are filtered to remove noise, the transformation stage, in which the words of the filtered tweets are transformed into a proper form so that they can be traced in the lexicon and finally the negation-detection stage, in which linguistic rules are used to determine for each word of the transformed tweets, that it was found in the lexicon, if it is included in a negation scheme and so its polarity must be inverted. To evaluate the system we used a data set concerning the results of the intraparty elections of New Democracy, that were announced on the 11th of January 2016. This choice was made because elections monopolize the interest of internet users, whose comments, in such occasions, have strong sentiments, because they express either their approval or their disapproval to the elective results in a penetrating way. en
heal.advisorName Κόλλιας, Στέφανος el
heal.committeeMemberName Καρπούζης, Κωνσταντίνος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 118 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα