HEAL DSpace

Autonomous vehicles: Multi-class twitter sentiment analysis

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Τριβυζά, Μαρία-Φιλίππα el
dc.contributor.author Trivyza, Maria-Filippa en
dc.date.accessioned 2021-11-02T11:23:13Z
dc.date.available 2021-11-02T11:23:13Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54013
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.21711
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject Twitter sentiment analysis en
dc.subject Autonomous vehicles en
dc.subject Multi-class classification en
dc.subject Transfer learning en
dc.subject Attention mechanisms en
dc.subject Twitter ανάλυση συναισθήματος el
dc.subject Αυτόνομα οχήματα el
dc.subject Ταξινόμηση πολλαπλών κλάσεων el
dc.subject Μεταφορά μάθησης el
dc.subject Μηχανισμοί προσοχής el
dc.title Autonomous vehicles: Multi-class twitter sentiment analysis en
heal.type masterThesis
heal.classification Machine learning en
heal.classification Deep learning en
heal.classification Natural language processing en
heal.classification Μηχανική μάθηση el
heal.classification Βαθιά μάθηση el
heal.classification Επεξεργασία φυσικής γλώσσας el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-05-18
heal.abstract Sentiment analysis (or opinion mining) refers to the use of natural language processing (NLP) and machine learning (ML) to interpret and classify opinions in a piece of human-written text. Sentiment analysis in social media data such as Twitter messages (tweets) present an important topic of research and can refer to the automatic identification of opinions of consumers towards an event, organization, product, brand or person by analyzing their posts. Most studies related to sentiment analysis focus on the binary and ternary classification of these opinions, even though the task of multi-class classification has always been the most interesting, yet most challenging. This thesis researches the task of multi-class Twitter sentiment analysis and aims to explore the views of the general public towards self-driving cars or autonomous vehicles (AVs). We used an imbalanced annotated Twitter data set with captured self-driving car-related tweets, and a data set containing movie reviews used for fine-grained classification. We implemented and experimented with various deep learning models, namely a 2-layer bi-directional long short-term memory (BLSTM) network with self-attention (2-BLSTM+Att), and various state-of-the-art (SOTA) bi-directional encoder representations from transformers (BERT) models. Also, we used a weighted loss function in order to tackle the problem of class imbalance. We evaluated our models using the accuracy and F1 score metrics. To find people’s opinion regarding the controversial technology of AVs, self-driving car-related tweets were captured using the Twitter API and classified in a five-scale sentiment polarity from highly negative, negative, neutral, positive to highly positive. en
heal.abstract Η ανάλυση συναισθήματος (ή η εξόρυξη γνώμης) αναφέρεται στη χρήση της επεξεργασίας φυσικής γλώσσας (NLP) και της μηχανικής μάθησης (ML) για την ερμηνεία και την ταξινόμηση των συναισθημάτων σε ένα κομμάτι κειμένου γραμμένο από άνθρωπο. Η ανάλυση συναισθήματος σε δεδομένα κοινωνικών μέσων όπως τα Twitter μηνύματα (tweets) παρουσιάζει ένα σημαντικό θέμα έρευνας και αναφέρεται στον αυτόματο προσδιορισμό των απόψεων των καταναλωτών για ένα συμβάν, οργανισμό, προϊόν, επωνυμία ή άτομο αναλύοντας τις δημοσιεύσεις τους. Οι περισσότερες μελέτες που σχετίζονται με την ανάλυση συναισθήματος επικεντρώνονται στη δυαδική και τριμερή ταξινόμηση αυτών των απόψεων, παρόλο που η ταξινόμηση πολλαπλών τάξεων ήταν πάντα η πιο ενδιαφέρουσα, αλλά και η πιο δύσκολη. Αυτή η διατριβή ερευνά την ανάλυση συναισθήματος πολλαπλών κλάσεων από tweets και στοχεύει στη διερεύνηση των απόψεων του κοινού σχετικά με τα αυτοκινούμενα αυτοκίνητα ή τα αυτόνομα οχήματα (AVs). Χρησιμοποιήσαμε ένα μη-ισορροπημένο σχολιασμένο σύνολο δεδομένων από συλλεγμένα tweets που σχετίζονται με τα αυτοκινούμενα αυτοκίνητα και ένα σύνολο δεδομένων που περιέχει κριτικές ταινιών, το οποίο χρησιμοποιείται για ταξινόμηση πολλαπλών κλάσεων. Υλοποιήσαμε και πειραματιστήκαμε με διάφορα μοντέλα βαθιάς μάθησης, όπως ένα δίκτυο δύο στρωμάτων αμφίδρομης μακροπρόθεσμης μνήμης (BLSTM) με αυτο-προσοχή (2-BLSTM+Att) και διάφορα υπερσύγχρονα (SOTA) μοντέλα αμφίδρομων αναπαραστάσεων κωδικοποιητών από τους μετασχηματιστές (BERT). Επίσης, χρησιμοποιήσαμε μια σταθμισμένη συνάρτηση απώλειας για να αντιμετωπίσουμε το πρόβλημα των μη-ισορροπημένων δεδομένων. Για να βρεθεί η γνώμη των ανθρώπων σχετικά με την αμφιλεγόμενη τεχνολογία των AVs, συλλέχθηκαν tweets που σχετίζονται με τα αυτοκινούμενα αυτοκίνητα χρησιμοποιώντας το API του Twitter και ταξινομήθηκαν σε πολικότητα συναισθήματος πέντε κλάσεων από εξαιρετικά αρνητικό, αρνητικό, ουδέτερο, θετικό σε πολύ θετικό. el
heal.advisorName Matsopoulos, George en
heal.advisorName Ματσόπουλος, Γεώργιος el
heal.committeeMemberName Πρωτονοτάριος, Εμμανουήλ el
heal.committeeMemberName Νικόλαος, Δουλάμης el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 104 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα