dc.contributor.author | Ψαρουδάκης, Ανδρέας | |
dc.date.accessioned | 2022-02-22T14:07:05Z | |
dc.date.available | 2022-02-22T14:07:05Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/54789 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.22487 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/3.0/gr/ | * |
dc.subject | Αναγνώριση συναισθήματος in-the-wild | el |
dc.subject | Κατηγοριοποίηση στα βασικά συναισθήματα | el |
dc.subject | Νευρωνικά Δίκτυα Βαθιάς Μάθησης | el |
dc.subject | Επαύξηση δεδομένων | el |
dc.subject | Τεχνική mixup | el |
dc.subject | Human affect recognition in-the-wild | en |
dc.subject | Basic expression classification | en |
dc.subject | Deep Neural Networks | en |
dc.subject | Data augmentation | en |
dc.subject | mixup technique | en |
dc.title | Επαύξηση δεδομένων: Εξετάζοντας την αποτελεσματικότητα της τεχνικής mixup σε προβλήματα συναισθηματικής αναγνώρισης του πραγματικού κόσμου | el |
dc.title | Data augmentation: Testing the effectiveness of the mixup technique in affective computing tasks in-the-wild | en |
dc.contributor.department | Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Συστημάτων Τεχνητής Νοημοσύνης και Μάθησης | el |
heal.type | bachelorThesis | |
heal.classification | Νευρωνικά Δίκτυα Βαθιάς Μάθησης στην Αναγνώριση Συναισθήματος | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2022-02-02 | |
heal.abstract | Το ανθρώπινο συναίσθημα αποτελεί μια συνειδητή υποκειμενική εμπειρία η οποία μπορεί να εκδηλωθεί με ποικίλους τρόπους. Την τελευταία δεκαετία, με την ραγδαία εξέλιξη στον τομέα της Τεχνητής Νοημοσύνης, έχουν πραγματοποιηθεί πολυάριθμες μελέτες για την ανάπτυξη συστημάτων και ρομπότ που θα είναι σε θέση να αντιλαμβάνονται αυτόματα ανθρώπινα συναισθήματα και συμπεριφορές. Απώτερος στόχος είναι η δημιουργία ψηφιακών βοηθών που θα εμφανίζουν ανθρωποκεντρικό χαρακτήρα και θα αλληλεπιδρούν με τους χρήστες με όσο το δυνατόν πιο φυσικό τρόπο. Πρόκειται για ένα πολύ σύνθετο και απαιτητικό εγχείρημα μιας και η συναισθηματική αναγνώριση σε συνθήκες πραγματικού κόσμου εμπεριέχει πολλούς αστάθμητους παράγοντες. Στο πλαίσιο αυτό φαίνεται πως μπορούν να συνεισφέρουν ιδιαίτερα τα Νευρωνικά Δίκτυα Βαθιάς Μάθησης, σύγχρονα υπολογιστικά εργαλεία που έχουν την ικανότητα να διαχειρίζονται αποτελεσματικά μεγάλα σύνολα πληροφοριών. Παρά τη σημαντική ισχύ τους, τα δίκτυα αυτά είναι επιρρεπή στο φαινόμενο της υπερεκπαίδευσης. Αυτό σημαίνει πως συχνά καταλήγουν να απομνημονεύουν τα δεδομένα εισόδου, αδυνατώντας να γενικεύσουν επιτυχημένα το εξεταζόμενο πρόβλημα. Μια καλή λύση είναι η επέκταση του συνόλου εκπαίδευσης, με την προσθήκη νέων δειγμάτων. Ωστόσο, σε πολλές εφαρμογές η συγκέντρωση νέων εικόνων και η αντίστοιχη επισημείωσή τους αποτελούν μια αρκετά χρονοβόρα και δαπανηρή διαδικασία. Για το λόγο αυτό έχουν προταθεί διάφορες τεχνικές επαύξησης δεδομένων, δηλαδή μέθοδοι οι οποίες παράγουν τεχνητά νέα δείγματα, αξιοποιώντας αυτά που υπάρχουν ήδη διαθέσιμα. Μια αρκετά πρόσφατη τέτοια τεχνική, η οποία έχει συνεισφέρει θετικά σε διάφορα προβλήματα κατηγοριοποίησης, είναι η mixup. Σύμφωνα με αυτή, η εκπαίδευση ενός δικτύου πραγματοποιείται πάνω σε κυρτούς συνδυασμούς των δεδομένων εκπαίδευσης και των αντίστοιχων ετικετών τους. Με τον τρόπο αυτό επεκτείνεται η κατανομή των διαθέσιμων δεδομένων και το δίκτυο παρουσιάζει καλύτερη ικανότητα γενίκευσης. Στα πλαίσια της παρούσας διπλωματικής, εξετάζουμε την αποτελεσματικότητα της τεχνικής mixup στο πρόβλημα της συναισθηματικής αναγνώρισης σε πραγματικές, μη-ελεγχόμενες συνθήκες (in-the-wild). Συγκεκριμένα, εκπαιδεύουμε δίκτυα Βαθιάς Μάθησης με την εν λόγω τεχνική για κατηγοριοποίηση εικόνων εκφράσεων προσώπου στα 7 βασικά συναισθήματα. Παράλληλα, προτείνουμε και μια παραλλαγή της mixup, την Addmixup, με βάση την οποία το δίκτυο εκπαιδεύεται ταυτόχρονα πάνω σε εικονικά και πραγματικά παραδείγματα. Συγκρίνουμε τις δύο αυτές μεθόδους με την κλασική αρχή Ελαχιστοποίησης Εμπειρικού Ρίσκου ενώ παράλληλα εξετάζουμε και την επίδραση του dropout, μιας μορφής κανονικοποίησης του δικτύου, σε όλες τις προαναφερθείσες τεχνικές. Από την πειραματική μας μελέτη εξάγονται χρήσιμα συμπεράσματα ενώ παράλληλα τίθενται οι βάσεις για πολλές ακόμα μελλοντικές επεκτάσεις. | el |
heal.abstract | The human emotion constitutes a conscious subjective experience that can be expressed in various ways. During the past decade, with the rapid development in the field of Artificial Intelligence, scientists have conducted numerous studies to develop systems and robots that will be capable of perceiving automatically people’s feelings and behaviors. The ultimate goal is the creation of digital assistants that will display a human-centered character and interact with users in the most natural way possible. It is a very complex and demanding task since the emotional recognition in real world conditions contains many imponderables. It seems that some modern computer tools, named Deep Neural Networks, can contribute significantly towards this direction, since they are capable of managing effectively large datasets. Despite their considerable power, these networks are prone to overfitting. This means that they often tend to memorize the input data, thus failing to generalize successfully the problem under consideration. One good solution would be to expand the training set, by adding new samples. However, in multiple applications, the collection of new images and their corresponding annotation is quite a time consuming and costly process. Because of this, various data augmentation techniques have been proposed; methods that produce artificially new samples, by utilising those already available. A fairly recent technique of this kind, which has positively contributed to various classification tasks, is called mixup. According to it, a Neural Network is trained on convex combinations of pairs of examples and their corresponding labels. By doing so, the distribution of the available data is extended and the generalisation ability of the network improves. Ιn this diploma thesis, we examine the effectiveness of mixup in affective computive tasks in real, uncontrolled, conditions (in-the-wild). Specifically, we train Deep Neural Networks using this technique to classify facial images in 7 basic expressions. Meanwhile, we propose a variation of mixup, named Addmixup, according to which the network is trained concurrently on virtual and real examples. We compare these two methods with the classic Empirical Risk Minimization principle, while at the same time, we examine the effect of dropout, a form of network normalization, in all the aforementioned techniques. From our experimental study, useful conclusions are drawn. In addition, the foundations are laid for many further future extensions. | en |
heal.advisorName | Κόλλιας, Στέφανος | |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | |
heal.committeeMemberName | Στάμου, Γιώργος | el |
heal.academicPublisher | Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 81 σ. | |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: