HEAL DSpace

Κατανοώντας τα νευρωνικά δίκτυα με κάψουλες: προς έναν κλιμακώσιμο αλγόριθμο δρομολόγησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Μπαρμπέρης, Αλέξανδρος el
dc.contributor.author Barmperis, Alexandros en
dc.date.accessioned 2023-01-18T10:17:50Z
dc.date.available 2023-01-18T10:17:50Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56748
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.24446
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by/3.0/gr/ *
dc.subject Τεχνητή Νοημοσύνη el
dc.subject Νευρωνικά Δίκτυα με Κάψουλες el
dc.subject Βαθιά Νευρωνικά Δίκτυα el
dc.subject Μηχανική Μάθηση el
dc.subject Αλγόριθμος Δρομολόγησης με Προσοχή el
dc.subject Machine Learning en
dc.subject Deep Neural Networks en
dc.subject Capsule Neural Networks en
dc.subject Self-Attention Capsules en
dc.subject Arti cial Intelligence en
dc.title Κατανοώντας τα νευρωνικά δίκτυα με κάψουλες: προς έναν κλιμακώσιμο αλγόριθμο δρομολόγησης el
dc.title Understanding capsule neural networks: towards a scalable routing algorithm en
heal.type bachelorThesis
heal.classification Eectrical and Computer Engineering en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-10-21
heal.abstract Τελευταία, στον κλάδο της Τεχνητής Νοημοσύνης, παρατηρείται ραγδαία αύξηση του μεγέθους των Βαθιών Νευρωνικών Δικτύων. Με τα νέα συστήματα να έχουν κολοσσιαίο ενεργειακό κόστος για την ανάπτυξή τους, προκύπτει το ερώτημα του αν η απόδοσή τους επιδέχεται βελτίωση. Μια ελπιδοφόρα λύση είναι τα Νευρωνικά Δίκτυα με Κάψουλες που, αντιμετωπίζοντας ανεπάρκειες στον σχεδιασμό της αρχιτεκτονικής των δικτύων, οδηγούν σε συστήματα Όρασης Υπολογιστών με υψηλή απόδοση. Σε αυτά, οι αποκρίσεις τεχνητών νευρώνων του δικτύου οργανώνονται σε ομάδες, τις κάψουλες. Η κάθε κάψουλα μαθαίνει να αναγνωρίζει ένα συγκεκριμένο αντικείμενο (ή τμήμα του). Μέσω μιας διαδικασίας που θυμίζει ανάστροφα γραφικά, αποδομεί το αντικείμενο σε χαρακτηριστικές ιδιότητες όπως η πόζα, τις οποίες ενθυλακώνει. Επειδή σε ένα Νευρωνικό Δίκτυο με Κάψουλες, περιλαμβάνονται πολλά επίπεδα από αυτές, σχηματίζεται μια ιεραρχική διάταξη όπου κάψουλες χαμηλότερων επιπέδων (αναπαριστούν τμήματα αντικειμένου) δρομολογούνται σε ανώτερες κάψουλες που αναγνωρίζουν μεγαλύτερα αντικείμενα και σχηματίζονται από τη σύνθεση μερών τους. Η ιεραρχική αποδόμηση των αντικειμένων μαζί με την εξαγωγή των παραμέτρων πόζας αυτών επιτρέπει την εύρωστη μοντελοποίηση των αντικειμένων από το δίκτυο οδηγώντας σε αποδοτικότερη αναγνώρισή τους υπό διαφορετικές οπτικές γωνίες. Δυστυχώς, τα Νευρωνικά Δίκτυα με Κάψουλες δεν έχουν λάβει τη δέουσα προσοχή, γεγονός που αποδίδεται στη δυσνοητότητά τους και στην αδυναμία κλιμάκωσής τους σε μεγαλύτερα συστήματα. Η αντιμετώπιση αυτών των προβλημάτων αποτελεί τον στόχο της παρούσας εργασίας. Το πρώτο πρόβλημα, το προσεγγίζουμε διατελώντας μια διεξοδική μελέτη στα βασικά έργα που θεμελιώνουν την εν λόγω τεχνολογία. Η μελέτη περιλαμβάνει, μεταξύ άλλων, πρωτότυπα πειράματα που φανερώνουν την εσωτερική λειτουργία της και γραφικά σχήματα που διευκολύνουν την κατανόηση της. Αναφορικά με το δεύτερο πρόβλημα, δανειζόμενοι ιδέες από τον δημοφιλή Μηχανισμό Προσοχής και από τους χάρτες αυτο-οργάνωσης αντίστοιχα, δημιουργούμε δύο νέα, γρήγορα συστήματα Νευρωνικών Δικτύων με Κάψουλες. Μέσα από τα πειράματα, πιστοποιούμε έμπρακτα όλους τους θεμελιακούς ισχυρισμούς της τεχνολογίας που μελετάμε ενώ παράλληλα αποδεικνύουμε ότι το ένα εκ των γρήγορων παραλλαγών που προτείνουμε εμφανίζει την τρίτη καλύτερη επίδοση σε πρόβλημα ορόσημο (smallNORB) ανοίγοντας τον δρόμο για αποδοτικά, κλιμακώσιμα συστήματα. el
heal.abstract Lately, in the field of Artificial Intelligence there is a growing trend for Deeper Neural Networks. Given that these costly Machine Learning systems require extreme amounts of energy resources to be developed, it makes sense to ask whether their efficiency can be improved. Capsule Networks, a modern approach which tackles inefficiencies in core Neural Network's architectural design principles, constitutes a promising solution for building more efficient Computer Vision systems. More specifically, in the proposed systems neural activations are grouped together into capsules. Every capsule is trained to recognize a specific entity (object or object part) and encapsulates it's equivariant properties (e.g. it's pose) which it computes through a procedure that resembles inverse graphics. When feeding a Capsule Network comprised of multiple capsule layers with an image depicting an object, a parse tree is dynamically created as lower level capsules (representing object parts) selectively activate higher level capsules (representing bigger objects) through a routing algorithm. The resulting hierarchical decomposition of the entities along with the extraction of their equivariant properties helps the Network form robust, intrinsic object models thus leading to efficient, viewpoint invariant object recognition. Unfortunately, Capsule Networks have not received much attention due to their abstruse nature as well as their inability to scale into larger systems. Our goal in the thesis at hand is to address those two problems, pushing towards a more sustainable future. The first problem is confronted by our thorough investigation of the fundamental academic articles which define the technology. It also includes extensive, novel experimentation and graphical representations of the results, all aiming to elucidate the new systems. Regarding the second problem, we propose two alternative, fast Capsule Network systems inspired by the popular Attention Mechanism and the algorithm used in Self-Organizing Maps respectively. Through our experiments, we testify the foundational assumptions of Capsule Networks and make significant observations. In addition, we show that one of our proposed systems archives state-of-the-art results on the smallNORB benchmark while greatly reducing computational load and thus, paving the way for efficient, scalable Capsule Networks. en
heal.advisorName Κόλλιας, Στέφανος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Βουλόδημος, Αθανάσιος el
heal.committeeMemberName Στάμου, Γιώργος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 243 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού 3.0 Ελλάδα