HEAL DSpace

Πολυτροπική βαθιά μάθηση για την αναγνώριση συναισθημάτων και τη σύνθεση εκφράσεων προσώπου με εφαρμογές στην αλληλεπίδραση ανθρώπου-ρομπότ

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Φιλντίσης, Παναγιώτης-Παρασκευάς el
dc.contributor.author Filntisis, Panagiotis Paraskevas en
dc.date.accessioned 2023-02-15T09:52:37Z
dc.date.available 2023-02-15T09:52:37Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/57139
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.24837
dc.rights Default License
dc.subject Αναγνώριση Συναισθήματος el
dc.subject Βαθιά Μάθηση el
dc.subject Σύνθεση Εκφράσεων el
dc.subject Τρισδιάστατη Ανακατασκευή el
dc.subject Όραση Υπολογιστών el
dc.subject Affective Computing en
dc.subject Computer Vision en
dc.subject Expression Synthesis en
dc.subject Emotion Recognition en
dc.subject Deep Learning en
dc.title Πολυτροπική βαθιά μάθηση για την αναγνώριση συναισθημάτων και τη σύνθεση εκφράσεων προσώπου με εφαρμογές στην αλληλεπίδραση ανθρώπου-ρομπότ el
dc.title Multimodal Deep Learning for Emotion Recognition and Expression Synthesis with Applications in Human-Robot Interaction en
dc.contributor.department Σημάτων, Ελέγχου και Ρομποτικής el
heal.type doctoralThesis
heal.secondaryTitle Multimodal Deep Learning for Emotion Recognition and Expression Synthesis with Applications in Human-Robot Interaction el
heal.classification Affective Computing en
heal.classification Computer Vision en
heal.classification Machine Learning en
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-11-07
heal.abstract Ο χώρος του affective computing είναι ένας συναρπαστικός καινούργιος τομέας έρευνας που έχει ως στόχο να παρέχει στους υπολογιστές και τα ρομπότ τη δυνατότητα αναγνώρισης, έκφρασης, μοντελοποίησης αλλά και «αίσθησης» συναισθημάτων. Το διεπιστημονικό αυτό πεδίο του affective computing αντλεί πόρους από την επιστήμη των υπολογιστών, τα μαθηματικά, τις γνωσιακές επιστήμες και την ψυχολογία. Σε αυτή τη διατριβή, η οποία χωρίζεται σε δύο κύρια μέρη, διερευνούμε δύο πτυχές του συγκεκριμένου πεδίου: η πρώτη πτυχή είναι η «αναγνώριση συναισθήματος» και η δεύτερη είναι η «σύνθεση της έκφρασης του συναισθήματος». Οι δύο αυτές κατευθύνσεις αποτελούν τις πιο σημαντικές πτυχές που πρέπει να εξετάσει κανείς όταν χτίζει συστήματα αλληλεπίδρασης ανθρώπου-ρομπότ. Για το σκοπό αυτό, στο πρώτο μέρος, διερευνούμε και μελετάμε διάφορα κανάλια που περιέχουν πολύτιμες πληροφορίες για την αναγνώριση των συναισθημάτων ενός ανθρώπου και σχεδιάζουμε αρχιτεκτονικές βασισμένες σε βαθιά μάθηση, που μπορούν να συνδυάσουν αποτελεσματικά πληροφορίες από τα κανάλια αυτα, με απώτερο στόχο την ανάπτυξη ενός συστήματος για σενάρια αλληλεπίδρασης ανθρώπου/παιδιού με ρομπότ. Ενώ η αναγνώριση συναισθημάτων στο παρελθόν έχει ως επί το πλείστον επικεντρωθεί στις εκφράσεις του προσώπου και στην ομιλία, κατά τη διατριβή αυτή λαμβάνουμε υπόψη τη γλώσσα του σώματος του ανθρώπου, τη σκηνή στην οποία βρίσκεται, καθώς και τη σημασιολογική έννοια των συναισθημάτων. Στο δεύτερο μέρος, αρχικά ενισχύουμε τις υπάρχουσες μεθόδους για τη σύνθεση της οπτικοακουστικής ομιλίας, δίνοντάς τους τη δυνατότητα να συνδυάζουν και να εκφράζουν συναισθήματα σε διαφορετικά επίπεδα έντασης. Στη συνέχεια, σχεδιάζουμε ένα μοντέλο βαθιάς μάθησης με σκοπό τη σύνθεση οπτικοακουστικής ομιλίας που επιτυγχάνει υψηλό επίπεδο ρεαλισμού και εκφραστικότητας, ξεπερνώντας τις προηγούμενες μεθόδους. Τέλος, παρουσιάζουμε την πρώτη μέθοδο για τρισδιάστατη ανακατασκευή προσώπων από βίντεο μίας όψης, με έμφαση στα χαρακτηριστικά και τη γεωμετρία του στόματος κατά την ομιλία. Η μέθοδος αυτή παρακάμπτει τη συνηθισμένη απαίτηση για κοπιώδη συλλογή μεγάλου πλήθους τρισδιάστατων δεδομένων υψηλής πιστότητας, προσφέροντας έναν εύκολο και καινοτόμο τρόπο για την απόκτηση τρισδιάστατων δεδομένων εκφραστικών προσώπων από βίντεο. el
heal.abstract Affective computing is an exciting new research area with the goal of equipping computers and robots with the capability of recognizing, expressing, modeling, and even ``feeling" emotions. An interdisciplinary field, affective computing draws resources from computer science, mathematics, cognitive sciences, and psychology. In this thesis, which is split into two major parts, we explore two aspects of affective computing; namely ``emotion recognition" and ``expression synthesis" since they constitute the most important aspects one needs to consider when building human-robot interaction systems. To this end, in the first part, we explore and study various information streams that contain valuable information for recognizing the emotions of a human, and design architectures based on deep learning, that can efficiently combine information from these streams, with the ultimate goal of deploying the system for human-robot interaction, with an emphasis in child-robot interaction scenarios. While traditional approaches for emotion recognition have mostly focused on facial expressions and speech, we take into account the body language the context, and also employ embeddings that accurately capture the semantic distances of discrete emotions. In the second part, we first enhance existing methods for audiovisual speech synthesis, by giving them the capabilities to both combine, and express emotions in different intensity levels. Then, we design a deep learning-based architecture for expressive audiovisual speech synthesis which achieves a high level of realism and expressiveness, outperforming previous methods. Lastly, we present the first method for visual speech aware monocular perceptual 3D reconstruction in the wild. This work tackles the traditional bottleneck of data collection for high-fidelity 3D ground truth data and offers the field of affective computing a way for easier acquisition of expressive 3D facial data data from monocular videos. en
heal.advisorName Μαραγκός, Πέτρος el
heal.advisorName Petros, Maragos en
heal.committeeMemberName Potamianos, Alexandros en
heal.committeeMemberName Potamianos, Gerasimos en
heal.committeeMemberName Tzafestas, Costas en
heal.committeeMemberName Katsamanis, Athanasios en
heal.committeeMemberName Kollias, Stefanos en
heal.committeeMemberName Maragos, Petros en
heal.committeeMemberName Roussos, Anastasios en
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής el
heal.academicPublisherID ntua
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής