HEAL DSpace

Αυτόματη Αναγνώριση Ανθρώπινων Δράσεων χρησιμοποιώντας Βαθιά Συνελικτικά Νευρωνικά Δίκτυα

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Νικολουδάκης, Ευάγγελος el
dc.contributor.author Nikoloudakis, Efangelos el
dc.date.accessioned 2017-09-18T10:43:55Z
dc.date.available 2017-09-18T10:43:55Z
dc.date.issued 2017-09-18
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/45639
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.14442
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Αναγνώριση Ανθρώπινων Δράσεων el
dc.subject Αναγνώριση Ανθρώπινων Χειρονομιών el
dc.subject 3Δ Συνελικτικά Νευρωνικά Δίκτυα el
dc.subject Συνελικτικά Νευρωνικά Δίκτυα Διπλής Ροής el
dc.subject Πυκνές Τροχιές el
dc.subject Human Action Recognition en
dc.subject Human Gesture Recognition en
dc.subject 3D Convolutional Neural Networks en
dc.subject Two-Stream Convolutional Neural Networks en
dc.subject Dense Trajectories en
dc.subject Μηχανές Διανυσμάτων Υποστήριξης el
dc.subject Support Vector Machines en
dc.title Αυτόματη Αναγνώριση Ανθρώπινων Δράσεων χρησιμοποιώντας Βαθιά Συνελικτικά Νευρωνικά Δίκτυα el
heal.type bachelorThesis
heal.classification Όραση Υπολογιστών el
heal.classification Μηχανική Μάθηση el
heal.classification Νευρωνικά Δίκτυα el
heal.classification Αλληλεπίδραση Ανθρώπου-Μηχανής el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2017-07-18
heal.abstract Η παρούσα Διπλωματική Εργασία πραγματεύεται το πρόβλημα της αυτόματης αναγνώρισης ανθρώπινων δράσεων, στο πλαίσιο της αλληλεπίδρασης ανθρώπου-μηχανής. Για την εξαγωγή χαρακτηριστικών χρησιμοποιούνται τόσο hand-crafted τεχνικές όσο και τεχνικές βαθιάς μάθησης. Συγκεκριμένα, δίνεται έμφαση στην εφαρμογή των βελτιωμένων πυκνών τροχιών με Bag-of Words κωδικοποίηση καθώς και στην χρήση Τρισδιάστατων Συνελικτικών Νευρωνικών Δικτύων (3D ConvNets) και Συνελικτικών Νευρωνικών Δικτύων Διπλής Ροής (Two-Stream ConvNets), από τα οποία εξάγουμε χαρακτηριστικά βαθιάς μάθησης. Πειραματιζόμαστε χρησιμοποιώντας τις διαθέσιμες αναπαραστάσεις βίντεο, αξιολογώντας την επίδοση τους σε μία σειρά από δημοφιλείς βάσεις δεδομένων, καθώς και στη βάση ανθρώπινων δράσεων Cognimuse, η οποία δημιουργήθηκε στο ερευνητικό πλαίσιο της παρούσας εργασίας και παρουσιάζει ιδιαίτερες προκλήσεις. Για την ταξινόμηση των δράσεων χρησιμοποιούνται μη γραμμικές Μηχανές Διανυσμάτων Υποστήριξης με πυρήνα x^2, στο επίπεδο των οποίων εφαρμόζεται σύμμειξη των παραγόμενων αναπαράστασεων βίντεο, επιτυγχάνοντας state-of-the-art επίδοση στη βάση δεδομένων HMDB51 και πολύ υψηλή ακρίβεια αναγνώρισης στη βάση δεδομένων Hollywood2. el
heal.advisorName Μαραγκός, Πέτρος el
heal.committeeMemberName Μαραγκός, Πέτρος el
heal.committeeMemberName Τζαφέστας, Κωνσταντίνος el
heal.committeeMemberName Ποταμιάνος, Γεράσιμος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής. Εργαστήριο Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων el
heal.academicPublisherID ntua
heal.numberOfPages 123 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα