dc.contributor.author |
Mandilara, Eleni
|
en |
dc.contributor.author |
Μανδηλαρά, Ελένη
|
el |
dc.date.accessioned |
2015-12-09T13:02:58Z |
|
dc.date.available |
2015-12-09T13:02:58Z |
|
dc.date.issued |
2015-12-09 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/41768 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.11107 |
|
dc.rights |
Default License |
|
dc.subject |
Sentiment analysis |
en |
dc.subject |
Artificial neural networks |
el |
dc.subject |
Back propagation algorithm |
en |
dc.subject |
Twitter |
en |
dc.subject |
Data mining |
en |
dc.subject |
Βιοκλιματικά |
el |
dc.subject |
Ανάλυση συναισθήματος |
el |
dc.subject |
Τεχνητά νευρωνικά δίκτυα |
el |
dc.subject |
Αλγόριθμος οπίσθιας διάδοσης σφάλματος |
el |
dc.subject |
Εξόρυξη δεδομένων |
el |
dc.title |
Automatic detection of opinion polarity from Twitter |
en |
dc.title |
Αυτόματη ανίχνευση της πολικότητας της γνώμης στο Twitter |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Neural networks (Computer science) |
el |
heal.classificationURI |
http://id.loc.gov/authorities/subjects/sh90001937 |
|
heal.language |
el |
|
heal.language |
en |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2015-09-18 |
|
heal.abstract |
The subject of this diploma thesis is the automatic detection of the polarity – also known as sentiment analysis – of the opinion which is expressed by users on web. Twitter consisted the web source of our interest. Twitter is an online social networking service that enables users to publish and read short messages known as tweets. Sentiment analysis aims to classify correctly text samples according the overall polarity of the opinion they express (positive, negative, neutral).
In order to achieve the sentiment analysis of tweets, we implemented a supervised online learning system, based on artificial neural networks. This system consists of two main parts: the first one pre-processes the tweets, while the second one implements the learning procedure based on the neural network. The first part aims to the refinement and cleaning of the tweets from noise and useless information, as well as to their transmutation into a form which is comprehensible by a machine. This is achieved through the extraction of specific features and the construction of the corresponding vectors. The second part, the part of the neural network, is implemented by a multi-layer perceptron, which is trained by the error back propagation algorithm, and aims to the correct classification of the tweets into two or three discrete classes, each one of them corresponds to the opinion polarity expressed in each tweet (positive, negative or positive, negative, neutral). |
en |
heal.abstract |
Αντικείμενο της παρούσας διπλωματικής εργασίας είναι η αυτόματη ανίχνευση της πολικότητας – ή, αλλιώς, η συναισθηματική ανάλυση – της γνώμης που εκφράζεται από χρήστες σε διαδικτυακές πηγές. Διαδικτυακή πηγή του ενδιαφέροντός μας αποτέλεσε το Twitter, το οποίο είναι μια online υπηρεσία κοινωνικής δικτύωσης που προσφέρει τη δυνατότητα σε χρήστες να δημοσιεύουν και να διαβάζουν σύντομα μηνύματα γνωστά ως tweets. Στόχος της συναισθηματικής ανάλυσης είναι η ταξινόμηση δειγμάτων κειμένου με βάση τη συνολική πολικότητα της γνώμης που εκφράζουν (θετική, αρνητική, ουδέτερη).
Με στόχο, λοιπόν, τη συναισθηματική ανάλυση των tweets, υλοποιήθηκε ένα σύστημα επιβλεπόμενης online μάθησης, βασισμένο στα τεχνητά νευρωνικά δίκτυα, το οποίο αποτελείται από δύο κύρια μέρη: το πρώτο ασχολείται με την προ-επεξεργασία των tweets, ενώ το δεύτερο υλοποιεί τη
διαδικασία μάθησης μέσω του νευρωνικού δικτύου. Το πρώτο μέρος έχει ως στόχο τον εξωραϊσμό και καθαρισμό των tweets από θόρυβο ή περιττή πληροφορία, καθώς και τη μεταφορά τους σε μια μορφή κατανοητή από ένα υπολογιστικό σύστημα. Αυτό επιτυγχάνεται μέσω της εξαγωγής συγκεκριμένων
χαρακτηριστικών και της κατασκευής των αντίστοιχων διανυσμάτων. Το δεύτερο μέρος, αυτό του νευρωνικού δικτύου, υλοποιείται από ένα πολυεπίπεδο perceptron, το οποίο εκπαιδεύεται μέσω του αλγορίθμου οπίσθιας διάδοσης σφάλματος, και αποβλέπει στην ορθή ταξινόμηση των tweets σε δύο ή τρεις διακριτές κλάσεις, οι οποίες αντιστοιχούν στην πολικότητα της γνώμης που εκφέρεται ανά tweet (θετική, αρνητική ή θετική, αρνητική, ουδέτερη). |
el |
heal.advisorName |
Κόλλιας, Στέφανος |
en |
heal.committeeMemberName |
Κόλλιας, Στέφανος |
en |
heal.committeeMemberName |
Καρπουζής, Κώστας |
en |
heal.committeeMemberName |
Στάμου, Γεώργιος |
en |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
159 σ. |
|
heal.fullTextAvailability |
true |
|