HEAL DSpace

Αυτο-επιβλεπόμενη μάθηση για οπτική αναγνώριση συσχετίσεων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αναστασάκης, Ζαχαρίας el
dc.contributor.author Anastasakis, Zacharias en
dc.date.accessioned 2023-04-10T09:12:20Z
dc.date.available 2023-04-10T09:12:20Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/57534
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.25231
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Οπτική Αναγνώριση Συσχετίσεων el
dc.subject Παραγωγή Γράφων Σκηνής el
dc.subject Αυτο-επιβλεπόµενη Μάθηση el
dc.subject Εκπαίδευση µε λίγα δείγµατα el
dc.subject Μετασχηµατιστές el
dc.subject Visual Relationship Detection en
dc.subject Scene Graph Generation (SGG) en
dc.subject Self Supervised Learning en
dc.subject Few-shot Learning en
dc.subject Transformers en
dc.title Αυτο-επιβλεπόμενη μάθηση για οπτική αναγνώριση συσχετίσεων el
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-03-15
heal.abstract Το πρόβληµα της δηµιουργίας γράφου σκηνής στην όραση υπολογιστών περιλαµβάνει τη δηµιουργία µιας αναπαράστασης µιας εικόνας µε ϐάση ένα γράφο. Ο γράφος αποτελείται από αντικείµενα (κόµβους) µε τις σχέσεις (ακµές) µεταξύ τους, αναπαριστώντας τη σκηνή και τα στοιχεία της µε δοµηµένο τρόπο. Στόχος είναι η εξαγωγή σηµασιολογικών πληροφοριών από µια εικόνα και η αναπαράστασή τους σε µορφή που να µπορεί εύκολα να αναλυθεί και να γίνει κατανοητή. Παρατηρώντας τη συµπεριφορά σύγχρονων µοντέλων στη ϐιβλιογραφία, καθίσταται σαϕές πως η πλειονότητα των σηµερινών µεθόδων ϐασίζεται στην επιβλεπόµενη µάθηση, όπου το µοντέλο εκπαιδεύεται σε ένα µεγάλο όγκο επισηµειωµένων δεδοµένων εικόνων. Παρά την επιτυχία της, η µάθηση µε επίβλεψη είναι ακριβή και χρονοβόρα, καθώς απαιτεί µεγάλες ποσότητες επισηµειωµένων δεδοµένων και ετικετών. Η έλλειψη µάθησης µε αυτο-επίβλεψη στη δηµιουργία γράφων σκηνής είναι εύκολο να παρατηρηθεί. ΄Ενας από τους κύριους λόγους που µπορεί να συµβαίνει αυτό είναι ότι η δηµιουργία γράφων σκηνής είναι µια σύνθετη εργασία που απαιτεί την εξαγωγή πληροφοριών από εικόνες, η οποία µπορεί να είναι πρόκληση για τις µεθόδους χωρίς επίβλεψη. Η συνεισφορά αυτής της διπλωµατικής εργασίας αφορά την εισαγωγή µίας νέας αρχιτεκτονικής µοντέλου αυτο-επιβλεπόµενης µάθησης, το οποίο προ-εκπαιδεύεται σε µη επισηµειωµένα δεδοµένα και καταφέρνει να πετύχει έως και 7% σχετική ϐελτίωση συγκριτικά µε επανυλοποιήσεις µεθόδων της ϐιβλιογραφίας όταν εκπαιδεύεται µε λίγα επισηµειωµένα δεδοµένα (few-shot learning) τόσο στο VRD όσο και στο VG200 σύνολο δεδοµένων, δύο από τα δηµοφιλέστερα σύνολα δεδοµένων του προβλήµατος. el
heal.advisorName Κόλλιας, Στέφανος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Βουλόδημος, Αθανάσιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 84 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα