heal.abstract |
Σε ορισμένα σενάρια αναγνώρισης αντικειμένων, τα δεδομένα με ετικέτες μπορεί να μην καλύπτουν όλες τις κατηγορίες. Η Μάθηση Χωρίς Παραδείγματα (ΜΧΠ) αντιμετωπίζει αυτό το ζήτημα αξιοποιώντας βοηθητικές πληροφορίες που περιγράφουν κάθε κατηγορία, επιδιώκοντας την ανάπτυξη ενός ταξινομητή ικανού να αναγνωρίζει δείγματα από κατηγορίες που δεν έχουν επισημανθεί με ετικέτες. Η ημιεπαγωγική ΜΧΠ (Transductive ZSL) επεκτείνει αυτή την έννοια αναγνωρίζοντας δείγματα από άγνωστες κατηγορίες, χρησιμοποιώντας πληροφορίες τόσο από ορατές όσο και από αόρατες κατηγορίες κατά τη διάρκεια της εκπαίδευσης. Σε αυτή τη διπλωματική εργασία, προτείνουμε μια νέα προσέγγιση για την ημιεπαγωγική ΜΧΠ ενσωματώνοντας έναν από τους καλύτερους αλγόριθμους μη επιβλεπόμενης συσταδοποίησης και τροποποιώντας τον σύμφωνα με τις ανάγκες μας. Από όσο γνωρίζουμε, αυτή είναι η πρώτη προσπάθεια γεφύρωσης του χάσματος μεταξύ των προόδων στη βιβλιογραφία μη επιβλεπόμενης συσταδοποίησης και της Μάθησης Χωρίς Παραδείγματα.
Αρχικά, χρησιμοποιούμε τον αλγόριθμο συσταδοποίησης για να χωρίσουμε όλες τις εικόνες στον οπτικό χώρο σε ξεχωριστά σύνολα. Στη συνέχεια, χρησιμοποιούμε την αντιστοιχία μεταξύ ορισμένων ομάδων και γνωστών κατηγοριών, για να βρούμε μια αμφιμονοσήμαντη απεικόνιση από τον σημασιολογικό χώρο, που περιέχει πρωτότυπα για κάθε κατηγορία, στις ομάδες του οπτικού χώρου. Χρησιμοποιώντας αυτήν την απεικόνιση, προβάλλουμε τα πρωτότυπα από τον σημασιολογικό χώρο στον οπτικό χώρο και ταξινομούμε δείγματα των άγνωστων κατηγοριών με βάση την απόστασή τους από αυτά τα προβεβλημένα πρωτότυπα.
Μέσω πειραμάτων σε δύο σύνολα δεδομένων, δείχνουμε την αποτελεσματικότητα της προσέγγισης μας σε ημιεπαγωγικές ΜΧΠ εργασίες. Η μέθοδος μας επιτυγχάνει απόδοση συγκρίσιμη με άλλους κορυφαίους αλγορίθμους ΜΧΠ στο σύνολο δεδομένων AwA2, χωρίς να απαιτείται εκπαίδευση από άκρο σε άκρο ή λεπτομερής προσαρμογή της αρχιτεκτονικής ResNet101. |
el |