HEAL DSpace

Αναγνώριση ανθρώπινων ενεργειών σε βίντεο με χρήση νευρωνικών δικτύων και λογισμού γεγονότων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Πράπας, Ιωάννης el
dc.contributor.author Prapas, Ioannis en
dc.date.accessioned 2017-09-14T07:04:02Z
dc.date.available 2017-09-14T07:04:02Z
dc.date.issued 2017-09-14
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/45612
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.14550
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject Αναγνώριση ανθρώπινων ενεργειών el
dc.subject Συνελικτικά νευρωνικά δίκτυα el
dc.subject Αυτοκωδικοποιητές el
dc.subject C3D χαρακτηριστικά en
dc.subject Λογισμός γεγονότων en
dc.subject Human action recognition en
dc.subject Convolutional neural networks en
dc.subject Autoencoders en
dc.subject C3D features en
dc.subject Event Calculus en
dc.title Αναγνώριση ανθρώπινων ενεργειών σε βίντεο με χρήση νευρωνικών δικτύων και λογισμού γεγονότων el
dc.title Human action recognition in videos with use of neural networks and event calculus en
heal.type bachelorThesis
heal.classification Artificial intelligence--Data processing el
heal.classification Machine learning el
heal.classification Neural networks (Computer science)--Congresses el
heal.classification Computer vision el
heal.classificationURI http://id.loc.gov/authorities/subjects/sh85008182
heal.classificationURI http://id.loc.gov/authorities/subjects/sh85079324
heal.classificationURI http://id.loc.gov/authorities/subjects/sh2008108385
heal.classificationURI http://id.loc.gov/authorities/subjects/sh85029549
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2017-07-11
heal.abstract Ο σκοπός αυτής της διπλωματικής εργασίας ήταν σε πρώτο στάδιο η μελέτη σύγχρονων αριθμητικών μεθόδων για την αναγνώριση ανθρώπινων ενεργειών σε βίντεο και στην συνέχεια ο συνδυασμός τους με λογισμό γεγονότων με στόχο την υψηλού επιπέδου κατανόηση βίντεο. Σε αυτό το πλαίσιο, εξετάσαμε μεθόδους εξαγωγής χαρακτηριστικών κατάλληλων για ανάλυση βίντεο. Υλοποιήσαμε συνελικτικούς αυτοκωδικοποιητές και εξετάσαμε την χρήση τους για αναπαράσταση των καρέ του βίντεο. Τελικά, χρησιμοποιήσαμε και αξιολογήσαμε τα C3D χαρακτηριστικά ως αναπαράσταση κατάλληλη για αναγνώριση απλών ανθρώπινων ενεργειών. Σαν επόμενο στάδιο στην διαδικασία, ελέγξαμε κατά πόσο οι αναγνωρισμένες απλές ενέργειες μπορούν να βοηθήσουν τον OLED, ένα σύστημα επαγωγικού λογικού προγραμματισμού, να παράγει θεωρίες Λογισμού Γεγονότων για σύνθετες ενέργειες, οι οποίες αφορούν αλληλεπίδραση ατόμων. Συμβάλλουμε, λοιπόν, στην γεφύρωση του χάσματος που υπάρχει μεταξύ της αδιάφανης (φύση μαύρου κουτιού) αποτελεσματικότητας της βαθιάς μάθησης να βγάζει νόημα από ανεπεξέργαστα δεδομένα και του διαφανούς συμπερασμού της λογικής που μας επιτρέπει να εισάγουμε ανθρώπινη γνώση για την φύση των προβλημάτων υπό επίλυση. Λόγω του ότι οι παρατηρήσεις από τη φύση τους καταγράφουν μέρος της πραγματικότητας, ενώ η λογική εκφράζει συνήθως γενικότερη γνώση, θέλουμε να ενθαρρύνουμε την συνέχιση της έρευνας μακριά από πλήρεις αρχιτεκτονικές μαύρου κουτιού και πιο κοντά σε συγχωνεύσεις τους με συστήματα λογικού συμπερασμού. Τα πειραματικά αποτελέσματα αυτής της εργασίας ενθαρρύνουν περαιτέρω την έρευνα προς αυτήν την κατεύθυνση. el
heal.abstract The main aim of this thesis was to study modern numerical methods for human action recognition in videos and combine them with event calculus towards a high-level understanding. In the context of low-level human action recognition, we considered feature extraction methods suitable for video analysis. We implemented a convolutional autoencoders and considered their use for frame-level representation. Finally, we used and evaluated the C3D features as a representation for low-level action recognition. As the next step in the pipeline, we checked how useful the recognized low-level human actions can be for OLED, an Inductive Logic Programming system, capable of learning Event Calculus theories for complex actions, involving the interaction of more than one individuals. Our contribution lies mainly in bridging the gap between the opaque (black box nature) effectiveness of deep learning to make sense out of raw data and the transparent reasoning of Event Calculus, which allows us to embed human knowledge in the problem-solving process. Because observations capture only certain aspects of the real world, but logic often represents generic knowledge, we would like to encourage research to move away from end-to-end black box architectures and towards hybrids with computational logic. Our experimental results encourage further research towards this direction. en
heal.advisorName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.advisorName Παλιούρας, Γεώργιος el
heal.advisorName Αρτίκης, Αλέξανδρος el
heal.advisorName Μπασκιώτης, Νικόλαος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Στάμου, Γιώργος el
heal.committeeMemberName Τσανάκας, Παναγιώτης el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών el
heal.academicPublisherID ntua
heal.numberOfPages 66 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα