dc.contributor.author |
Λουκαδάκης, Εμμανουήλ
|
el |
dc.contributor.author |
Loukadakis, Emmanouil
|
en |
dc.date.accessioned |
2016-10-11T05:56:29Z |
|
dc.date.available |
2016-10-11T05:56:29Z |
|
dc.date.issued |
2016-10-11 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/43768 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.8066 |
|
dc.rights |
Default License |
|
dc.subject |
Κοινωνικά δίκτυα |
el |
dc.subject |
Δημοφιλείς συζητήσεις |
el |
dc.subject |
Χωρική κάλυψη |
el |
dc.subject |
Μηνύματα με γεωγραφικό στίγμα |
el |
dc.subject |
Ρεύματα δεδομένων |
el |
dc.subject |
Social networks |
en |
dc.subject |
Popular topics |
en |
dc.subject |
Spatial coverage |
en |
dc.subject |
Geottaged messages |
en |
dc.subject |
Data streams |
en |
dc.title |
Εποπτεία γεωγραφικής κάλυψης συζητήσεων σε κοινωνικά δίκτυα |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Επιστήμη υπολογιστών/πληροφορική |
el |
heal.classificationURI |
http://data.seab.gr/concepts/77de68daecd823babbb58edb1c8e14d7106e83bb |
|
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2016-04-08 |
|
heal.abstract |
Αντικείμενο της διπλωματικής εργασίας είναι η ανάπτυξη ενός αλγορίθμου για την ανίχνευση δημοφιλών συζήτησεων που εκτυλίσσονται στα κοινωνικά δίκτυα, καθώς και για την εποπτεία της γεωγραφικής τους κάλυψης με την πάροδο του χρόνου. Συγκεκριμένα, η μελέτη επικεντρώθηκε στο κοινωνικό δίκτυο Twitter, καθώς τα σχετικά μηνύματα δημοσιεύονται με πολύ γρήγορο ρυθμό, επομένως θεωρείται ότι συγκροτούν ένα ρεύμα δεδομένων. ́Οταν διαδραματίζεται ένα γεγονός (λ.χ. ποδοσφαιρικός αγώνας, διαδήλωση, συναυλία), οι χρήστες των κοινωνικών δικτύων έχουν την τάση να δημοσιεύουν μηνύματα και να συζητούν σχετικά με αυτό. Τέτοια γεγονότα μπορούν να χαρακτηριστούν ως δημοφιλείς συζητήσεις και τα σχετικά μηνύματα στο Twitter συνήθως συνοδεύονται από χαρακτηριστικές ετικέτες. Πολλές φορές, μία τέτοια συζήτηση είναι δημοφιλής μόνο κατά τόπους, υποθέτοντας βέβαια ότι είναι γνωστή η γεωγραφική θέση των χρηστών που συμμετέχουν σ ́ αυτήν. Στην παρούσα διπλωματική εργασία, μελετάμε την εξέλιξη τέτοιων συζητήσεων στον χώρο και στον χρόνο, ανανεώνοντας τις περιοχές επιρροής τους σε πραγματικό χρόνο. Παρακολουθώντας τις μεταβολές στην γεωγραφική κάλυψη τέτοιων φαινομένων, μπορούμε να εξάγουμε χρήσιμα συμπεράσματα σχετικά με την ένταση κάθε φαινομένου και τον αντίκτυπο που έχει στην κοινωνία. Η εργασία επικεντρώνεται κυρίως στην ανάπτυξη τεχνικών για ανίχνευση συζητήσεων, προσδιορισμό των πιο δημοφιλών από αυτές και εποπτεία της γεωγραφικής κάλυψής τους. Ο αλγόριθμος είναι επίτηδες προσεγγιστικός ως προς την εκτίμηση της γεωγραφικής κάλυψης των δημοφιλών συζητήσεων, στοχεύοντας σε βελτιωμένες επιδόσεις ως προς τον χρόνο εκτέλεσης. Πειραματική μελέτη σε πραγματικά δεδομένα από το Twitter για την ευρύτερη περιοχή του Λονδίνου, επιβεβαίωσε ότι η προτεινόμενη μεθοδολογία είναι ικανή να αντιμετωπίσει κλιμακούμενους όγκους μηνυμάτων για διάφορες τιμές παραμέτρων επιστρέφοντας εκτιμήσεις καλής ποιότητας. Ως γενικό συμπέρασμα της εργασίας μπορεί να ειπωθεί ότι ο αλγόριθμος είναι κατάλληλος για ανίχνευση της χωρικής κάλυψης τέτοιων συζητήσεων, θυσιάζοντας την ακρίβεια προς όφελος της έγκαιρης απόκρισης. |
el |
heal.abstract |
The purpose of this diploma thesis is to develop an algorithm for detection of popular
topics unfolding in social networks, as well as for monitoring their spatial coverage through
time. We particularly focus our study on Twitter, mainly because the posting rate of such
messages is extremely high, so they can be considered as a data stream. When an event
(e.g., a match, a demonstration, or a concert) is ongoing, many users tend to post messages
referring to that event in social networks. Essentially, this creates a discussion over the
same topic, which is usually characterized by hashtag(s). Sometimes, such a topic may
be popular only locally, assuming that related posts have a geographical reference, which
represents the location where the user posted the message. In this diploma thesis, we
study how trending topics evolve both in space and time, updating the corresponding
local areas in real time. Observing the evolving spatial coverage of such posts may reveal
the intensity of the phenomenon and its impact on local communities.
This thesis mainly focuses on developing efficient methods for topic detection, identification
of trending topics and monitoring their spatial coverage, aiming at significant
reduction in processing costs. The suggested algorithm is deliberately chosen to be approximate
with respect to the calculation of spatial coverages. An experimental study was
conducted against real-world data from Twitter concerning the greater area of London.
These tests confirmed that the proposed methodology is able to perform against scalable
volumes of data under various parameter settings and can also yield good-quality results.
The overall conclusion of this thesis is that the algorithm is suitable for real time detection
of the spatial footprint of evolving topics, where some accuracy may be sacrificed for the
benefit of timely response. |
en |
heal.advisorName |
Βασιλείου, Ιωάννης |
el |
heal.committeeMemberName |
Βασιλείου, Ιωάννης |
el |
heal.committeeMemberName |
Κοζύρης, Νεκτάριος |
el |
heal.committeeMemberName |
Θεοδωρίδης, Ιωάννης |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
85 σ. |
el |
heal.fullTextAvailability |
true |
|