dc.contributor.author |
Απειρανθίτης, Αντώνιος
|
el |
dc.contributor.author |
Τσαχανσάχης, Βασίλειος
|
el |
dc.contributor.author |
Apeiranthitis, Antonis
|
en |
dc.contributor.author |
Tsachansachis, Vasileios
|
en |
dc.date.accessioned |
2016-10-03T11:59:04Z |
|
dc.date.available |
2016-10-03T11:59:04Z |
|
dc.date.issued |
2016-10-03 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/43734 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.12908 |
|
dc.rights |
Default License |
|
dc.subject |
Ανάλυση συναισθημάτων |
el |
dc.subject |
Απεικόνιση δεδομένων |
el |
dc.subject |
Εξόρυξη δεδομένων |
el |
dc.subject |
Ανακάλυψη γνώσης |
el |
dc.subject |
Επεξεργασία δεδομένων |
el |
dc.subject |
Hadoop |
en |
dc.subject |
HDFS |
en |
dc.subject |
Hive |
en |
dc.subject |
NiFi |
en |
dc.subject |
Twitter |
en |
dc.title |
Ανάλυση δεδομένων από κοινωνικά δίκτυα για τη μελέτη των συναισθημάτων των χρηστών |
el |
dc.title |
Mining Twitter data for sentiment analysis |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Τηλεπικοινωνίες |
el |
heal.classification |
Δίκτυα υπολογιστών |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2016-07-11 |
|
heal.abstract |
Αντικείμενο της παρούσας διπλωματικής αποτελεί η ανάλυση δεδομένων του κοινωνικού δικτύου Twitter για την μελέτη των συναισθημάτων των χρηστών. Το σύνολο των δεδομένων που χρησιμοποιείται αποτελείται από πραγματικά tweets, τα
οποία δημοσιεύθηκαν στη βάση του Twitter, έχουν στο περιεχόμενό τους τη λέξη κλειδί refugees και συγκεντρώθηκαν σε διάστημα 4 εβδομάδων σε συγκεκριμένες ώρες της ημέρας. Η καταγραφή αυτών των δεδομένων έγινε με την βοήθεια του Apache NiFi. Αρχικά, η εργασία έχει σα στόχο την υλοποίηση ενός συστήματος το οποίο ανά πάσα στιγμή είναι σε θέση να λαμβάνει μια λέξη κλειδί και να συγκεντρώνει τα tweets τα οποία πραγματοποιήθηκαν με την λέξη αυτή στο περιεχόμενό τους. Εν συνεχεία, να τα μεταφέρει και να τα αποθηκεύει σε μορφή πίνακα στον αποθηκευτικό του χώρο. Επίσης, να μπορεί να συνδυάζει αυτές τις αρχικές πληροφορίες με ένα σύνολο δευτερευόντων πληροφοριών, ώστε με την χρήση αυτών και περαιτέρω ανάλυση, να είναι σε θέση να παράγει χρήσιμα στατιστικά στοιχεία. Για τον σκοπό αυτό χρησιμοποιήθηκαν εργαλεία ανοιχτού κώδικα όπως Apache Hadoop, Apache NiFi και Apache Hive. Σε πρώτη φάση, γίνεται ενασχόληση με ζητήματα όπως η αποθήκευση και ο καθαρισμός των δεδομένων.Σε δεύτερη φάση, η εργασία καταπιάνεται με το πεδίο της εξόρυξης γνώσης από
δεδομένα (data mining), με την εφαρμογή ενός αλγορίθμου κατηγοριοποίησης. Συγκεκριμένα, γίνεται προσπάθεια για κατηγοριοποίηση σε τρεις ευρύτερες ομάδες του συναισθήματος που εκφράζει κάθε tweet με βάση τα στοιχεία που εξήχθησαν. Στόχος είναι η αναπαράσταση και απεικόνιση των αποτελεσμάτων σε έναν παγκόσμιο χάρτη με την βοήθεια του google maps. |
el |
heal.abstract |
Subject of this thesis is the data analysis of the social network Twitter with the aim to study user emotions. The data used in this study consist of real tweets, which were posted on Twitter, include the keyword refugees in their text content, and were collected
in a time span of 4 weeks in specific daytimes. The data collection was conducted using the software Apache NiFi. Initially, the dissertation has as its goal the implementation of a system, which in any given time will be able to receive a keyword and collect tweets including that same keyword. Subsequently, the tweets will get transferred and stored in the system’s internal storage file system unit in a matrix format. Furthermore, the system will be able to combine the initial information with a set of secondary data and additional analysis, in order to produce valuable statistical insights. For this purpose, open sourced software like Apache Hadoop, Apache NiFi, and Apache Hive were used. During the first stage, this dissertation focuses on matters such as data storing and cleansing. During the second stage, this paper focuses on the field of data mining by use of a classification algorithm. More specifically, an effort is being made to categorize the tweets in three broad groups based on the emotion described in those tweets. Aim of this study is the representation and visualization of the results in a global map with the help of Google Maps. |
en |
heal.advisorName |
Θεολόγου, Μιχαήλ |
el |
heal.committeeMemberName |
Θεολόγου, Μιχαήλ |
el |
heal.committeeMemberName |
Συκάς, Ευστάθιος |
el |
heal.committeeMemberName |
Στασινόπουλος, Γεώργιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
117 σ. |
|
heal.fullTextAvailability |
true |
|