dc.contributor.author | Ηλίας, Λουκάς | el |
dc.date.accessioned | 2020-12-14T11:09:09Z | |
dc.date.available | 2020-12-14T11:09:09Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/52502 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.20200 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Μέσα κοινωνικής δικτύωσης | el |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Επεξεργασία φυσικής γλώσσας | el |
dc.subject | Επιλογή χαρακτηριστικών | el |
dc.subject | Εξόρυξη δεδομένων | el |
dc.subject | Social media | en |
dc.subject | Natural language processing | en |
dc.subject | Machine learning | en |
dc.subject | Bots detection | en |
dc.subject | Data mining | en |
dc.title | Ανίχνευση κακόβουλων χρηστών σε κοινωνικά δίκτυα μέσω μεθόδων βαθιάς μάθησης | el |
dc.contributor.department | ΤΟΜΕΑΣ ΕΠΙΚΟΙΝΩΝΙΩΝ, ΗΛΕΚΤΡΟΝΙΚΗΣ ΚΑΙ ΣΥΣΤΗΜΑΤΩΝ ΠΛΗΡΟΦΟΡΙΚΗΣ | el |
heal.type | bachelorThesis | |
heal.classification | Μηχανική Μάθηση | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2020 | |
heal.abstract | Αναμφισβήτητα, τα μέσα κοινωνικής δικτύωσης, όπως το Facebook και το Twitter, αποτελούν αναπόσπαστο κομμάτι της καθημερινότητάς μας λόγω των ποικίλων δυνατοτήτων, που προσφέρουν. Ειδικότερα, το Twitter παρέχει τη δυνατότητα στους χρήστες μέσω των tweets, σύντομων κειμένων μήκους έως 280 χαρακτήρες, να εκφράζουν τις απόψεις και τις σκέψεις τους σε θέματα της επικαιρότητας, διαμορφώνοντας κατ' αυτόν τον τρόπο τις τάσεις ή ακόμα και να συνομιλούν με χρήστες από όλο τον κόσμο άμεσα και χωρίς κανένα κόστος. Ωστόσο, το Twitter και γενικότερα τα μέσα κοινωνικής δικτύωσης αποτελούν αντικείμενο έλξης αυτοματοποιημένων λογαριασμών, γνωστών ως bots, οι οποίοι έχουν ως απώτερο στόχο την παραπληροφόρηση του χρήστη μέσω της διάδοσης ψευδών ειδήσεων, την προώθηση συγκεκριμένων προϊόντων και ιδεών καθώς και τη διακίνηση, πολλές φορές, υλικού πορνογραφικού περιεχομένου μέσω των ιστοσελίδων, που δημοσιεύουν στα tweets τους. Καθίσταται, λοιπόν, σαφές ότι αποτελεί αδήριτη ανάγκη η έγκαιρη ανίχνευση των bots. Αντικείμενο της παρούσας διπλωματικής εργασίας αποτελεί η προστασία των χρηστών του Twitter από κακόβουλους χρήστες. Συγκεκριμένα, προτείνονται δύο μέθοδοι κατηγοριοποίησης των χρηστών του Twitter σε αληθινούς χρήστες και αυτοματοποιημένους λογαριασμούς. Κατά την πρώτη μέθοδο συλλέγεται ένας μεγάλος αριθμός χαρακτηριστικών ανά χρήστη, που έχουν χρησιμοποιηθεί σε πρόσφατες ερευνητικές εργασίες για την ανίχνευση των bots. Αφού υλοποιούμε διάφορες τεχνικές επιλογής χαρακτηριστικών και μεθόδους δειγματοληψίας με σκοπό την εύρεση του βέλτιστου υποσυνόλου χαρακτηριστικών και τη δημιουργία ενός ομοιόμορφου συνόλου δεδομένων αντίστοιχα, αξιολογούμε την επίδοση του κάθε υποσυνόλου με χρήση αλγορίθμων Μηχανικής Μάθησης. Κατά τη δεύτερη μέθοδο, κάνοντας χρήση μόνο των tweets των χρηστών υλοποιούμε μία αρχιτεκτονική Βαθιάς Μάθησης, η οποία αποτελείται από Αμφίδρομα Αναδρομικά Νευρωνικά Δίκτυα Μακράς Βραχυπρόθεσμης Μνήμης (BiLSTM) με μηχανισμό προσοχής ακολουθούμενα από dense layers. Με αυτόν τον τρόπο αποφεύγουμε τη χρονοβόρα διαδικασία της εξαγωγής χαρακτηριστικών. Αξιολογούμε την επίδοση του μοντέλου Βαθιάς Μάθησης με διάφορες μετρικές αξιολόγησης. Και στις δύο μεθόδους χρησιμοποιούμε δύο δημόσια διαθέσιμα σύνολα δεδομένων και παρατηρούμε ότι οι τεχνικές, που εφαρμόζουμε, επιτυγχάνουν ανταγωνιστικές επιδόσεις συγκριτικά με τα αποτελέσματα των ερευνητικών εργασιών περί ανίχνευσης των bots, που έχουν δημοσιευτεί έως τώρα. | el |
heal.advisorName | Ρουσσάκη, Ιωάννα | el |
heal.committeeMemberName | Αναγνώστου, Μιλτιάδης | el |
heal.committeeMemberName | Παπαβασιλείου, Συμεών | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 105 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: