dc.contributor.author | Πράπας, Ιωάννης | el |
dc.contributor.author | Prapas, Ioannis | en |
dc.date.accessioned | 2017-09-14T07:04:02Z | |
dc.date.available | 2017-09-14T07:04:02Z | |
dc.date.issued | 2017-09-14 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/45612 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.14550 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/3.0/gr/ | * |
dc.subject | Αναγνώριση ανθρώπινων ενεργειών | el |
dc.subject | Συνελικτικά νευρωνικά δίκτυα | el |
dc.subject | Αυτοκωδικοποιητές | el |
dc.subject | C3D χαρακτηριστικά | en |
dc.subject | Λογισμός γεγονότων | en |
dc.subject | Human action recognition | en |
dc.subject | Convolutional neural networks | en |
dc.subject | Autoencoders | en |
dc.subject | C3D features | en |
dc.subject | Event Calculus | en |
dc.title | Αναγνώριση ανθρώπινων ενεργειών σε βίντεο με χρήση νευρωνικών δικτύων και λογισμού γεγονότων | el |
dc.title | Human action recognition in videos with use of neural networks and event calculus | en |
heal.type | bachelorThesis | |
heal.classification | Artificial intelligence--Data processing | el |
heal.classification | Machine learning | el |
heal.classification | Neural networks (Computer science)--Congresses | el |
heal.classification | Computer vision | el |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh85008182 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh85079324 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh2008108385 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh85029549 | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2017-07-11 | |
heal.abstract | Ο σκοπός αυτής της διπλωματικής εργασίας ήταν σε πρώτο στάδιο η μελέτη σύγχρονων αριθμητικών μεθόδων για την αναγνώριση ανθρώπινων ενεργειών σε βίντεο και στην συνέχεια ο συνδυασμός τους με λογισμό γεγονότων με στόχο την υψηλού επιπέδου κατανόηση βίντεο. Σε αυτό το πλαίσιο, εξετάσαμε μεθόδους εξαγωγής χαρακτηριστικών κατάλληλων για ανάλυση βίντεο. Υλοποιήσαμε συνελικτικούς αυτοκωδικοποιητές και εξετάσαμε την χρήση τους για αναπαράσταση των καρέ του βίντεο. Τελικά, χρησιμοποιήσαμε και αξιολογήσαμε τα C3D χαρακτηριστικά ως αναπαράσταση κατάλληλη για αναγνώριση απλών ανθρώπινων ενεργειών. Σαν επόμενο στάδιο στην διαδικασία, ελέγξαμε κατά πόσο οι αναγνωρισμένες απλές ενέργειες μπορούν να βοηθήσουν τον OLED, ένα σύστημα επαγωγικού λογικού προγραμματισμού, να παράγει θεωρίες Λογισμού Γεγονότων για σύνθετες ενέργειες, οι οποίες αφορούν αλληλεπίδραση ατόμων. Συμβάλλουμε, λοιπόν, στην γεφύρωση του χάσματος που υπάρχει μεταξύ της αδιάφανης (φύση μαύρου κουτιού) αποτελεσματικότητας της βαθιάς μάθησης να βγάζει νόημα από ανεπεξέργαστα δεδομένα και του διαφανούς συμπερασμού της λογικής που μας επιτρέπει να εισάγουμε ανθρώπινη γνώση για την φύση των προβλημάτων υπό επίλυση. Λόγω του ότι οι παρατηρήσεις από τη φύση τους καταγράφουν μέρος της πραγματικότητας, ενώ η λογική εκφράζει συνήθως γενικότερη γνώση, θέλουμε να ενθαρρύνουμε την συνέχιση της έρευνας μακριά από πλήρεις αρχιτεκτονικές μαύρου κουτιού και πιο κοντά σε συγχωνεύσεις τους με συστήματα λογικού συμπερασμού. Τα πειραματικά αποτελέσματα αυτής της εργασίας ενθαρρύνουν περαιτέρω την έρευνα προς αυτήν την κατεύθυνση. | el |
heal.abstract | The main aim of this thesis was to study modern numerical methods for human action recognition in videos and combine them with event calculus towards a high-level understanding. In the context of low-level human action recognition, we considered feature extraction methods suitable for video analysis. We implemented a convolutional autoencoders and considered their use for frame-level representation. Finally, we used and evaluated the C3D features as a representation for low-level action recognition. As the next step in the pipeline, we checked how useful the recognized low-level human actions can be for OLED, an Inductive Logic Programming system, capable of learning Event Calculus theories for complex actions, involving the interaction of more than one individuals. Our contribution lies mainly in bridging the gap between the opaque (black box nature) effectiveness of deep learning to make sense out of raw data and the transparent reasoning of Event Calculus, which allows us to embed human knowledge in the problem-solving process. Because observations capture only certain aspects of the real world, but logic often represents generic knowledge, we would like to encourage research to move away from end-to-end black box architectures and towards hybrids with computational logic. Our experimental results encourage further research towards this direction. | en |
heal.advisorName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.advisorName | Παλιούρας, Γεώργιος | el |
heal.advisorName | Αρτίκης, Αλέξανδρος | el |
heal.advisorName | Μπασκιώτης, Νικόλαος | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γιώργος | el |
heal.committeeMemberName | Τσανάκας, Παναγιώτης | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 66 σ. | el |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: