dc.contributor.author |
Μαγκαφά, Μαρίνα
|
el |
dc.contributor.author |
Magkafa, Marina
|
en |
dc.date.accessioned |
2019-04-01T09:11:07Z |
|
dc.date.available |
2019-04-01T09:11:07Z |
|
dc.date.issued |
2019-04-01 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/48556 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.16012 |
|
dc.rights |
Default License |
|
dc.subject |
Ανάλυση συναισθήματος |
el |
dc.subject |
Μηχανική μάθηση |
el |
dc.subject |
Βάσεις δεδομένων |
el |
dc.subject |
Πολικότητα κειμένου |
el |
dc.subject |
Ταξινόμηση |
el |
dc.subject |
Sentiment analysis |
en |
dc.subject |
Polarity text |
en |
dc.subject |
Machine learning |
en |
dc.subject |
Document classification |
en |
dc.subject |
Database |
el |
dc.title |
Μελέτη αποδοτικότητας αλγορίθμων μηχανικής μάθησης για παραμετροποιημένες εισόδους |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Βάσεις δεδομένων |
el |
heal.classification |
Big data |
en |
heal.classificationURI |
http://id.loc.gov/authorities/subjects/sh2012003227 |
|
heal.language |
el |
|
heal.access |
campus |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2018-09-28 |
|
heal.abstract |
Ο τομέας της ανάλυσης συναισθημάτων αναπτύχθηκε τα τελευταία χρόνια από την ανάγκη για εξαγωγή γνώμης και συναισθημάτων με αυτοματοποιημένο τρόπο από μεγάλο όγκο δεδομένων παραγόμενων από χρήστες, που διατίθεται ελεύθερα στο διαδίκτυο. Για τον σκοπό αυτό γίνεται χρήση μεθόδων που στηρίζονται σε τεχνικές μηχανικής μάθησης. Με την εκπαίδευση των αλγορίθμων μηχανικής μάθησης με χρήση χαρακτηριστικών κειμένων που γνωρίζουμε την πολικότητα τους, κατασκευάζονται μοντέλα για την πρόβλεψη της πολικότητας νέων κειμένων.
Στο πλαίσιο αυτό, η παρούσα εργασία μελετά την ανάλυση συναισθήματος σε δεδομένα κριτικής ταινιών και επιχειρήσεων, με τη χρήση τριών αλγορίθμων μηχανικής μάθησης, με σκοπό την ανίχνευση της πολικότητας τους. Πιο συγκεκριμένα, εξετάζουμε την μεταβολή της απόδοσης κάθε αλγορίθμου, σε κάθε βάση δεδομένων, για διαφορετικές παραμέτρους του συνόλου εκπαίδευσης. Οι βασικές παράμετροι των μοντέλων, που μελετάμε την επίδρασή τους, είναι το πλήθος των δεδομένων, το είδος της βάσης δεδομένων και η χρήση κειμένων στο σύνολο εκπαίδευσης με πιο έντονη ή με περισσότερο αμφιλεγόμενη έκφραση της πολικότητας τους. |
el |
heal.abstract |
The field of sentiment analysis has been developed in recent years by the need for opinion and sentiment extraction in an automated way from a large volume of user-generated data, freely available on the Internet. For this purpose, methods based on machine learning techniques are used. By training the machine learning algorithms, using attributes from texts which we know their polarity, models are constructed to predict the polarity of new texts. In this context, this thesis studies the sentiment analysis in movie and business reviews data, using three machine learning algorithms, in order to detect their polarity. More specifically, we examine how the performance of each algorithm changes, in each database for different parameters of the training set. The basic parameters of the models in the study are the number of data, the type of database and the use of texts in the training set with a more pronounced or more controversial expression of their polarity. |
en |
heal.advisorName |
Βαρβαρίγου, Θεοδώρα |
el |
heal.committeeMemberName |
Βαρβαρίγου, Θεοδώρα |
el |
heal.committeeMemberName |
Βαρβαρίγος, Εμμανουήλ |
el |
heal.committeeMemberName |
Λούμος, Βασίλειος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
76 σ. |
el |
heal.fullTextAvailability |
true |
|