dc.contributor.author | Αναστασάκης, Ζαχαρίας | el |
dc.contributor.author | Anastasakis, Zacharias | en |
dc.date.accessioned | 2023-04-10T09:12:20Z | |
dc.date.available | 2023-04-10T09:12:20Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/57534 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.25231 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Οπτική Αναγνώριση Συσχετίσεων | el |
dc.subject | Παραγωγή Γράφων Σκηνής | el |
dc.subject | Αυτο-επιβλεπόµενη Μάθηση | el |
dc.subject | Εκπαίδευση µε λίγα δείγµατα | el |
dc.subject | Μετασχηµατιστές | el |
dc.subject | Visual Relationship Detection | en |
dc.subject | Scene Graph Generation (SGG) | en |
dc.subject | Self Supervised Learning | en |
dc.subject | Few-shot Learning | en |
dc.subject | Transformers | en |
dc.title | Αυτο-επιβλεπόμενη μάθηση για οπτική αναγνώριση συσχετίσεων | el |
heal.type | bachelorThesis | |
heal.classification | Μηχανική Μάθηση | el |
heal.language | el | |
heal.language | en | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2023-03-15 | |
heal.abstract | Το πρόβληµα της δηµιουργίας γράφου σκηνής στην όραση υπολογιστών περιλαµβάνει τη δηµιουργία µιας αναπαράστασης µιας εικόνας µε ϐάση ένα γράφο. Ο γράφος αποτελείται από αντικείµενα (κόµβους) µε τις σχέσεις (ακµές) µεταξύ τους, αναπαριστώντας τη σκηνή και τα στοιχεία της µε δοµηµένο τρόπο. Στόχος είναι η εξαγωγή σηµασιολογικών πληροφοριών από µια εικόνα και η αναπαράστασή τους σε µορφή που να µπορεί εύκολα να αναλυθεί και να γίνει κατανοητή. Παρατηρώντας τη συµπεριφορά σύγχρονων µοντέλων στη ϐιβλιογραφία, καθίσταται σαϕές πως η πλειονότητα των σηµερινών µεθόδων ϐασίζεται στην επιβλεπόµενη µάθηση, όπου το µοντέλο εκπαιδεύεται σε ένα µεγάλο όγκο επισηµειωµένων δεδοµένων εικόνων. Παρά την επιτυχία της, η µάθηση µε επίβλεψη είναι ακριβή και χρονοβόρα, καθώς απαιτεί µεγάλες ποσότητες επισηµειωµένων δεδοµένων και ετικετών. Η έλλειψη µάθησης µε αυτο-επίβλεψη στη δηµιουργία γράφων σκηνής είναι εύκολο να παρατηρηθεί. ΄Ενας από τους κύριους λόγους που µπορεί να συµβαίνει αυτό είναι ότι η δηµιουργία γράφων σκηνής είναι µια σύνθετη εργασία που απαιτεί την εξαγωγή πληροφοριών από εικόνες, η οποία µπορεί να είναι πρόκληση για τις µεθόδους χωρίς επίβλεψη. Η συνεισφορά αυτής της διπλωµατικής εργασίας αφορά την εισαγωγή µίας νέας αρχιτεκτονικής µοντέλου αυτο-επιβλεπόµενης µάθησης, το οποίο προ-εκπαιδεύεται σε µη επισηµειωµένα δεδοµένα και καταφέρνει να πετύχει έως και 7% σχετική ϐελτίωση συγκριτικά µε επανυλοποιήσεις µεθόδων της ϐιβλιογραφίας όταν εκπαιδεύεται µε λίγα επισηµειωµένα δεδοµένα (few-shot learning) τόσο στο VRD όσο και στο VG200 σύνολο δεδοµένων, δύο από τα δηµοφιλέστερα σύνολα δεδοµένων του προβλήµατος. | el |
heal.advisorName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Βουλόδημος, Αθανάσιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 84 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: