HEAL DSpace

Ανάλυση δεδομένων από κοινωνικά δίκτυα για τη μελέτη των συναισθημάτων των χρηστών

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Απειρανθίτης, Αντώνιος el
dc.contributor.author Τσαχανσάχης, Βασίλειος el
dc.contributor.author Apeiranthitis, Antonis en
dc.contributor.author Tsachansachis, Vasileios en
dc.date.accessioned 2016-10-03T11:59:04Z
dc.date.available 2016-10-03T11:59:04Z
dc.date.issued 2016-10-03
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/43734
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.12908
dc.rights Default License
dc.subject Ανάλυση συναισθημάτων el
dc.subject Απεικόνιση δεδομένων el
dc.subject Εξόρυξη δεδομένων el
dc.subject Ανακάλυψη γνώσης el
dc.subject Επεξεργασία δεδομένων el
dc.subject Hadoop en
dc.subject HDFS en
dc.subject Hive en
dc.subject NiFi en
dc.subject Twitter en
dc.title Ανάλυση δεδομένων από κοινωνικά δίκτυα για τη μελέτη των συναισθημάτων των χρηστών el
dc.title Mining Twitter data for sentiment analysis en
heal.type bachelorThesis
heal.classification Τηλεπικοινωνίες el
heal.classification Δίκτυα υπολογιστών el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2016-07-11
heal.abstract Αντικείμενο της παρούσας διπλωματικής αποτελεί η ανάλυση δεδομένων του κοινωνικού δικτύου Twitter για την μελέτη των συναισθημάτων των χρηστών. Το σύνολο των δεδομένων που χρησιμοποιείται αποτελείται από πραγματικά tweets, τα οποία δημοσιεύθηκαν στη βάση του Twitter, έχουν στο περιεχόμενό τους τη λέξη κλειδί refugees και συγκεντρώθηκαν σε διάστημα 4 εβδομάδων σε συγκεκριμένες ώρες της ημέρας. Η καταγραφή αυτών των δεδομένων έγινε με την βοήθεια του Apache NiFi. Αρχικά, η εργασία έχει σα στόχο την υλοποίηση ενός συστήματος το οποίο ανά πάσα στιγμή είναι σε θέση να λαμβάνει μια λέξη κλειδί και να συγκεντρώνει τα tweets τα οποία πραγματοποιήθηκαν με την λέξη αυτή στο περιεχόμενό τους. Εν συνεχεία, να τα μεταφέρει και να τα αποθηκεύει σε μορφή πίνακα στον αποθηκευτικό του χώρο. Επίσης, να μπορεί να συνδυάζει αυτές τις αρχικές πληροφορίες με ένα σύνολο δευτερευόντων πληροφοριών, ώστε με την χρήση αυτών και περαιτέρω ανάλυση, να είναι σε θέση να παράγει χρήσιμα στατιστικά στοιχεία. Για τον σκοπό αυτό χρησιμοποιήθηκαν εργαλεία ανοιχτού κώδικα όπως Apache Hadoop, Apache NiFi και Apache Hive. Σε πρώτη φάση, γίνεται ενασχόληση με ζητήματα όπως η αποθήκευση και ο καθαρισμός των δεδομένων.Σε δεύτερη φάση, η εργασία καταπιάνεται με το πεδίο της εξόρυξης γνώσης από δεδομένα (data mining), με την εφαρμογή ενός αλγορίθμου κατηγοριοποίησης. Συγκεκριμένα, γίνεται προσπάθεια για κατηγοριοποίηση σε τρεις ευρύτερες ομάδες του συναισθήματος που εκφράζει κάθε tweet με βάση τα στοιχεία που εξήχθησαν. Στόχος είναι η αναπαράσταση και απεικόνιση των αποτελεσμάτων σε έναν παγκόσμιο χάρτη με την βοήθεια του google maps. el
heal.abstract Subject of this thesis is the data analysis of the social network Twitter with the aim to study user emotions. The data used in this study consist of real tweets, which were posted on Twitter, include the keyword refugees in their text content, and were collected in a time span of 4 weeks in specific daytimes. The data collection was conducted using the software Apache NiFi. Initially, the dissertation has as its goal the implementation of a system, which in any given time will be able to receive a keyword and collect tweets including that same keyword. Subsequently, the tweets will get transferred and stored in the system’s internal storage file system unit in a matrix format. Furthermore, the system will be able to combine the initial information with a set of secondary data and additional analysis, in order to produce valuable statistical insights. For this purpose, open sourced software like Apache Hadoop, Apache NiFi, and Apache Hive were used. During the first stage, this dissertation focuses on matters such as data storing and cleansing. During the second stage, this paper focuses on the field of data mining by use of a classification algorithm. More specifically, an effort is being made to categorize the tweets in three broad groups based on the emotion described in those tweets. Aim of this study is the representation and visualization of the results in a global map with the help of Google Maps. en
heal.advisorName Θεολόγου, Μιχαήλ el
heal.committeeMemberName Θεολόγου, Μιχαήλ el
heal.committeeMemberName Συκάς, Ευστάθιος el
heal.committeeMemberName Στασινόπουλος, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής el
heal.academicPublisherID ntua
heal.numberOfPages 117 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής