HEAL DSpace

Επαύξηση δεδομένων: Εξετάζοντας την αποτελεσματικότητα της τεχνικής mixup σε προβλήματα συναισθηματικής αναγνώρισης του πραγματικού κόσμου

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ψαρουδάκης, Ανδρέας
dc.date.accessioned 2022-02-22T14:07:05Z
dc.date.available 2022-02-22T14:07:05Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54789
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22487
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject Αναγνώριση συναισθήματος in-the-wild el
dc.subject Κατηγοριοποίηση στα βασικά συναισθήματα el
dc.subject Νευρωνικά Δίκτυα Βαθιάς Μάθησης el
dc.subject Επαύξηση δεδομένων el
dc.subject Τεχνική mixup el
dc.subject Human affect recognition in-the-wild en
dc.subject Basic expression classification en
dc.subject Deep Neural Networks en
dc.subject Data augmentation en
dc.subject mixup technique en
dc.title Επαύξηση δεδομένων: Εξετάζοντας την αποτελεσματικότητα της τεχνικής mixup σε προβλήματα συναισθηματικής αναγνώρισης του πραγματικού κόσμου el
dc.title Data augmentation: Testing the effectiveness of the mixup technique in affective computing tasks in-the-wild en
dc.contributor.department Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Συστημάτων Τεχνητής Νοημοσύνης και Μάθησης el
heal.type bachelorThesis
heal.classification Νευρωνικά Δίκτυα Βαθιάς Μάθησης στην Αναγνώριση Συναισθήματος el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-02-02
heal.abstract Το ανθρώπινο συναίσθημα αποτελεί μια συνειδητή υποκειμενική εμπειρία η οποία μπορεί να εκδηλωθεί με ποικίλους τρόπους. Την τελευταία δεκαετία, με την ραγδαία εξέλιξη στον τομέα της Τεχνητής Νοημοσύνης, έχουν πραγματοποιηθεί πολυάριθμες μελέτες για την ανάπτυξη συστημάτων και ρομπότ που θα είναι σε θέση να αντιλαμβάνονται αυτόματα ανθρώπινα συναισθήματα και συμπεριφορές. Απώτερος στόχος είναι η δημιουργία ψηφιακών βοηθών που θα εμφανίζουν ανθρωποκεντρικό χαρακτήρα και θα αλληλεπιδρούν με τους χρήστες με όσο το δυνατόν πιο φυσικό τρόπο. Πρόκειται για ένα πολύ σύνθετο και απαιτητικό εγχείρημα μιας και η συναισθηματική αναγνώριση σε συνθήκες πραγματικού κόσμου εμπεριέχει πολλούς αστάθμητους παράγοντες. Στο πλαίσιο αυτό φαίνεται πως μπορούν να συνεισφέρουν ιδιαίτερα τα Νευρωνικά Δίκτυα Βαθιάς Μάθησης, σύγχρονα υπολογιστικά εργαλεία που έχουν την ικανότητα να διαχειρίζονται αποτελεσματικά μεγάλα σύνολα πληροφοριών. Παρά τη σημαντική ισχύ τους, τα δίκτυα αυτά είναι επιρρεπή στο φαινόμενο της υπερεκπαίδευσης. Αυτό σημαίνει πως συχνά καταλήγουν να απομνημονεύουν τα δεδομένα εισόδου, αδυνατώντας να γενικεύσουν επιτυχημένα το εξεταζόμενο πρόβλημα. Μια καλή λύση είναι η επέκταση του συνόλου εκπαίδευσης, με την προσθήκη νέων δειγμάτων. Ωστόσο, σε πολλές εφαρμογές η συγκέντρωση νέων εικόνων και η αντίστοιχη επισημείωσή τους αποτελούν μια αρκετά χρονοβόρα και δαπανηρή διαδικασία. Για το λόγο αυτό έχουν προταθεί διάφορες τεχνικές επαύξησης δεδομένων, δηλαδή μέθοδοι οι οποίες παράγουν τεχνητά νέα δείγματα, αξιοποιώντας αυτά που υπάρχουν ήδη διαθέσιμα. Μια αρκετά πρόσφατη τέτοια τεχνική, η οποία έχει συνεισφέρει θετικά σε διάφορα προβλήματα κατηγοριοποίησης, είναι η mixup. Σύμφωνα με αυτή, η εκπαίδευση ενός δικτύου πραγματοποιείται πάνω σε κυρτούς συνδυασμούς των δεδομένων εκπαίδευσης και των αντίστοιχων ετικετών τους. Με τον τρόπο αυτό επεκτείνεται η κατανομή των διαθέσιμων δεδομένων και το δίκτυο παρουσιάζει καλύτερη ικανότητα γενίκευσης. Στα πλαίσια της παρούσας διπλωματικής, εξετάζουμε την αποτελεσματικότητα της τεχνικής mixup στο πρόβλημα της συναισθηματικής αναγνώρισης σε πραγματικές, μη-ελεγχόμενες συνθήκες (in-the-wild). Συγκεκριμένα, εκπαιδεύουμε δίκτυα Βαθιάς Μάθησης με την εν λόγω τεχνική για κατηγοριοποίηση εικόνων εκφράσεων προσώπου στα 7 βασικά συναισθήματα. Παράλληλα, προτείνουμε και μια παραλλαγή της mixup, την Addmixup, με βάση την οποία το δίκτυο εκπαιδεύεται ταυτόχρονα πάνω σε εικονικά και πραγματικά παραδείγματα. Συγκρίνουμε τις δύο αυτές μεθόδους με την κλασική αρχή Ελαχιστοποίησης Εμπειρικού Ρίσκου ενώ παράλληλα εξετάζουμε και την επίδραση του dropout, μιας μορφής κανονικοποίησης του δικτύου, σε όλες τις προαναφερθείσες τεχνικές. Από την πειραματική μας μελέτη εξάγονται χρήσιμα συμπεράσματα ενώ παράλληλα τίθενται οι βάσεις για πολλές ακόμα μελλοντικές επεκτάσεις. el
heal.abstract The human emotion constitutes a conscious subjective experience that can be expressed in various ways. During the past decade, with the rapid development in the field of Artificial Intelligence, scientists have conducted numerous studies to develop systems and robots that will be capable of perceiving automatically people’s feelings and behaviors. The ultimate goal is the creation of digital assistants that will display a human-centered character and interact with users in the most natural way possible. It is a very complex and demanding task since the emotional recognition in real world conditions contains many imponderables. It seems that some modern computer tools, named Deep Neural Networks, can contribute significantly towards this direction, since they are capable of managing effectively large datasets. Despite their considerable power, these networks are prone to overfitting. This means that they often tend to memorize the input data, thus failing to generalize successfully the problem under consideration. One good solution would be to expand the training set, by adding new samples. However, in multiple applications, the collection of new images and their corresponding annotation is quite a time consuming and costly process. Because of this, various data augmentation techniques have been proposed; methods that produce artificially new samples, by utilising those already available. A fairly recent technique of this kind, which has positively contributed to various classification tasks, is called mixup. According to it, a Neural Network is trained on convex combinations of pairs of examples and their corresponding labels. By doing so, the distribution of the available data is extended and the generalisation ability of the network improves. Ιn this diploma thesis, we examine the effectiveness of mixup in affective computive tasks in real, uncontrolled, conditions (in-the-wild). Specifically, we train Deep Neural Networks using this technique to classify facial images in 7 basic expressions. Meanwhile, we propose a variation of mixup, named Addmixup, according to which the network is trained concurrently on virtual and real examples. We compare these two methods with the classic Empirical Risk Minimization principle, while at the same time, we examine the effect of dropout, a form of network normalization, in all the aforementioned techniques. From our experimental study, useful conclusions are drawn. In addition, the foundations are laid for many further future extensions. en
heal.advisorName Κόλλιας, Στέφανος
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος
heal.committeeMemberName Στάμου, Γιώργος el
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 81 σ.
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα