HEAL DSpace

Μελέτη αποδοτικότητας αλγορίθμων μηχανικής μάθησης για παραμετροποιημένες εισόδους

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Μαγκαφά, Μαρίνα el
dc.contributor.author Magkafa, Marina en
dc.date.accessioned 2019-04-01T09:11:07Z
dc.date.available 2019-04-01T09:11:07Z
dc.date.issued 2019-04-01
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/48556
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.16012
dc.rights Default License
dc.subject Ανάλυση συναισθήματος el
dc.subject Μηχανική μάθηση el
dc.subject Βάσεις δεδομένων el
dc.subject Πολικότητα κειμένου el
dc.subject Ταξινόμηση el
dc.subject Sentiment analysis en
dc.subject Polarity text en
dc.subject Machine learning en
dc.subject Document classification en
dc.subject Database el
dc.title Μελέτη αποδοτικότητας αλγορίθμων μηχανικής μάθησης για παραμετροποιημένες εισόδους el
heal.type bachelorThesis
heal.classification Βάσεις δεδομένων el
heal.classification Big data en
heal.classificationURI http://id.loc.gov/authorities/subjects/sh2012003227
heal.language el
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2018-09-28
heal.abstract Ο τομέας της ανάλυσης συναισθημάτων αναπτύχθηκε τα τελευταία χρόνια από την ανάγκη για εξαγωγή γνώμης και συναισθημάτων με αυτοματοποιημένο τρόπο από μεγάλο όγκο δεδομένων παραγόμενων από χρήστες, που διατίθεται ελεύθερα στο διαδίκτυο. Για τον σκοπό αυτό γίνεται χρήση μεθόδων που στηρίζονται σε τεχνικές μηχανικής μάθησης. Με την εκπαίδευση των αλγορίθμων μηχανικής μάθησης με χρήση χαρακτηριστικών κειμένων που γνωρίζουμε την πολικότητα τους, κατασκευάζονται μοντέλα για την πρόβλεψη της πολικότητας νέων κειμένων. Στο πλαίσιο αυτό, η παρούσα εργασία μελετά την ανάλυση συναισθήματος σε δεδομένα κριτικής ταινιών και επιχειρήσεων, με τη χρήση τριών αλγορίθμων μηχανικής μάθησης, με σκοπό την ανίχνευση της πολικότητας τους. Πιο συγκεκριμένα, εξετάζουμε την μεταβολή της απόδοσης κάθε αλγορίθμου, σε κάθε βάση δεδομένων, για διαφορετικές παραμέτρους του συνόλου εκπαίδευσης. Οι βασικές παράμετροι των μοντέλων, που μελετάμε την επίδρασή τους, είναι το πλήθος των δεδομένων, το είδος της βάσης δεδομένων και η χρήση κειμένων στο σύνολο εκπαίδευσης με πιο έντονη ή με περισσότερο αμφιλεγόμενη έκφραση της πολικότητας τους. el
heal.abstract The field of sentiment analysis has been developed in recent years by the need for opinion and sentiment extraction in an automated way from a large volume of user-generated data, freely available on the Internet. For this purpose, methods based on machine learning techniques are used. By training the machine learning algorithms, using attributes from texts which we know their polarity, models are constructed to predict the polarity of new texts. In this context, this thesis studies the sentiment analysis in movie and business reviews data, using three machine learning algorithms, in order to detect their polarity. More specifically, we examine how the performance of each algorithm changes, in each database for different parameters of the training set. The basic parameters of the models in the study are the number of data, the type of database and the use of texts in the training set with a more pronounced or more controversial expression of their polarity. en
heal.advisorName Βαρβαρίγου, Θεοδώρα el
heal.committeeMemberName Βαρβαρίγου, Θεοδώρα el
heal.committeeMemberName Βαρβαρίγος, Εμμανουήλ el
heal.committeeMemberName Λούμος, Βασίλειος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής el
heal.academicPublisherID ntua
heal.numberOfPages 76 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής