dc.contributor.author | Βεργοπούλου, Έλενα | el |
dc.contributor.author | Vergopoulou, Elena | en |
dc.date.accessioned | 2022-05-17T10:12:38Z | |
dc.date.available | 2022-05-17T10:12:38Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/55152 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.22850 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Αναγνώριση συναισθημάτων | el |
dc.subject | Τεχνητή νοημοσύνη | el |
dc.subject | Βαθιά μάθηση | el |
dc.subject | Γεννητικά ανταγωνιστικά δίκτυα | el |
dc.subject | Μετάφραση εικόνας-σε-εικόνα | el |
dc.title | Ανάλυση συναισθημάτων σε εικόνες με χρήση γεννητικών ανταγωνιστικών δικτύων | el |
heal.type | bachelorThesis | |
heal.classification | Νευρωνικά Δίκτυα | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2021-11-15 | |
heal.abstract | Η παρούσα διπλωματική πραγματεύεται το θέμα της ανάλυσης αλλά και σύνθεσης συναισθημάτων στο ανθρώπινο πρόσωπο με τη χρήση βαθιών νευρωνικών δικτύων. Ο βασικός σκοπός είναι η μετατροπή ενός συναισθήματος που αναπαριστάται σε μία εικόνα σε ένα άλλο νέο συναίσθημα, πετυχαίνοντας όμως παράλληλα ένα ρεαλιστικό αποτέλεσμα. Για την κατηγοριοποίηση των συναισθημάτων επιλέχθηκε η δομή των επτά βασικών εκφράσεων (Seven Basic Expressions). Η διαδικασία αυτή της μετατροπής ονομάζεται Μετάφραση Εικόνας-σε-Εικόνα (Image-to-Image Translation). Τα τελευταία χρόνια σημαντικό ρόλο σε αυτή τη διαδικασία διαδραματίζουν τα Ανταγωνιστικά Γεννητικά Δίκτυα (Generative Adversarial Networks). Τα συστήματα αυτά χρησιμοποιούνται όλο και περισσότερο σε σημαντικές εφαρμογές και διακρίνονται για την ικανότητά τους να παραγάγουν υψηλής ποιότητας εικόνες. Αποτελούνται από δύο μοντέλα, έναν γεννήτορα (generator), ο οποίος είναι υπεύθυνος για το κομμάτι της σύνθεσης των εικόνων και έναν διευκρινιστή (discriminator), ο οποίος κάνει την κατηγοριοποίηση. Για το πειραματικό κομμάτι χρησιμοποιήθηκε το μοντέλο StarGAN, το οποίο έχει τη δυνατότητα να εκτελεί μεταφράσεις εικόνας για πολλαπλούς τομείς χρησιμοποιώντας μόνο ένα μοντέλο, καθώς και το σύνολο δεδομένων AffectNet, μία μεγάλη βάση με πολλές ταυτότητες και εύρος, γεγονός που θα βοηθήσει το GAN στην εξαγωγή όσο το δυνατόν καλύτερων αποτελεσμάτων. Εξετάζουμε την απόδοση του διευκρινιστή τόσο για αληθινές εικόνες όσο και για εικόνες που έχουν δημιουργηθεί από τον γεννήτορα. Τα αποτελέσματα που λαμβάνουμε είναι πολύ ενθαρρυντικά καθώς οι εικόνες που συνθέτουμε φαίνεται να είναι αρκετά ρεαλιστικές ώστε να καταφέρουν να εξαπατήσουν τον διευκρινιστή στον μεγαλύτερο βαθμό. Επιπλέον και ως προς την παραγωγή των ζητούμενων συναισθημάτων έχουμε θετικά αποτελέσματα και ο διευκρινιστής αναγνωρίζει επιτυχώς το εκάστοτε συναίσθημα. Όσον αφορά τον γεννήτορα πραγματοποιήθηκε μία ανάλυση ως προς το πόσο ρεαλιστικές είναι οι εικόνες και τα συναισθήματα που παράγει αλλά και κατά πόσο αλλοιώνει την αρχική εικόνα. Τα αποτελέσματα αυτά παρουσιάζονται αναλυτικά και παραθέτονται προτάσεις για μελλοντικές επεκτάσεις. | el |
heal.advisorName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 86 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: