HEAL DSpace

Αναγνώριση και Ταξινόμηση Ανθρώπινων Δράσεων σε Video

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Μαραγκός, Πέτρος el
dc.contributor.author Μανίνης, Κέβης-Κοκίτσι Ι. el
dc.contributor.author Maninis, Kevis-Kokitsi I. en
dc.date.accessioned 2014-12-05T12:35:42Z
dc.date.available 2014-12-05T12:35:42Z
dc.date.copyright 2014-08-27 -
dc.date.issued 2014-12-05
dc.date.submitted 2014-08-27 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/39828
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.6812
dc.description 112 σ. el
dc.description.abstract Σκοπός της παρούσας διπλωματικής εργασίας είναι η αντιμετώπιση του προβλήματος της αναγνώρισης και ταξινόμησης ανθρώπινων δράσεων σε video. Το πρόβλημα αυτό θεωρείται θεμελιώδες στην ανάλυση και ερμηνεία video και για αυτό ερευνάται και εφαρμόζεται ευρέως σε διάφορους τομείς όπως η ανάκτηση δεδομένων από video, η οπτική επιτήρηση και παρακολούθηση, η ρομποτική και η αλληλεπίδραση ανθρώπου-υπολογιστή. Η προσέγγιση που χρησιμοποιήσαμε εκμεταλλεύεται μεθόδους αναπαράστασης των video μέσω τοπικών χαρακτηριστικών. Σκοπεύουμε στην εύρεση εύρωστων χωροχρονικών σημείων ενδιαφέροντος που να αποτελούν πηγή μιας συμπαγούς αναπαράστασης των video, στα πλαίσια της οποίας αναπτύσσουμε και παρουσιάζουμε δύο νέους αλγόριθμους ανίχνευσης. Για την εξαγωγή χαρακτηριστικών χρησιμοποιούμε δημοφιλείς περιγραφητές όπως οι Histograms of Oriented Gradients/Histograms of Optical Flow (HOG/HOF) και οι Histograms of Oriented 3D Gradients (HOG3D). Γίνεται προσπάθεια μοντελοποίησης και αναγνώρισης των ανθρώπινων δράσεων με χρήση ισχυρών εργαλείων όπως οι Μηχανές Διανυσμάτων Υποστήριξης, τα κρυφά Μαρκοβιανά Μοντέλα και οι ταξινομητές k-Nearest Neighbour, σε συνδυασμό με γνωστές τεχνικές όπως Bag-of-Features και Γραμμική Πρόβλεψη. Οι αλγόριθμοί μας αξιολογούνται πειραματικά σε δύο πολύ γνωστές βάσεις δεδομένων ανθρώπινων δράσεων, όπου και ξεπερνούν τις επιδόσεις που επιτεύχθηκαν από δημοφιλείς αλγόριθμους της βιβλιογραφίας. Ο πειραματισμός μας επεκτάθηκε σε μια νέα πολυαισθητηριακή βάση δεδομένων, όπου και εφαρμόσαμε νέες τεχνικές αναγνώρισης συνεχόμενων δράσεων. el
dc.description.abstract The aim of this thesis is to deal with the task of human action classification and recognition in videos. This task is considered fundamental in video analysis and video understanding and because of that it is widely researched and applied in several domains such as video retrieval, video surveillance, robotics and human-computer interaction. Our approach takes advantage of video representation with local features. Our aim is to find robust spatio-temporal interest points that lead to compact representation of videos. We develop and propose two new algorithms that search for local spatiotemporal interest points. For feature extraction we use popular descriptors as Histograms of Oriented Gradients/Histograms of Optical Flow (HOG/HOF) and Histograms of Oriented 3D Gradients (HOG3D). We try to model and recognize human actions using powerful machine learning tools such as Support Vector Machines, Hidden Markov Models and k-Nearest Neighbour classifiers combined with known techniques such as Bag-of-Features and Linear Predictive Coding. Our algorithms are experimentally evaluated in two popular action databases, in which they ourperform state-of-the-art detectors. The experimental evaluation was extended to a new multisensor database, where we applied new methods for continuous action recognition. en
dc.description.statementofresponsibility Κέβης-Κοκίτσι Ι. Μανίνης el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Όραση υπολογιστών el
dc.subject Αναγνώριση ανθρώπινων δράσεων el
dc.subject Τοπικά χωροχρονικά χαρακτηριστικά el
dc.subject Μηχανές διανυσμάτων υποστήριξης el
dc.subject Κρυφά μαρκοβιανά μοντέλα el
dc.subject Φιλτράρισμα σε πολλαπλές ζώνες συχνοτήτων el
dc.subject Φίλτρα Gabor el
dc.subject Ανάλυση κυρίαρχης ενέργειας el
dc.subject Ανίχνευση ενέργειας σε video el
dc.subject Computer vision en
dc.subject Human action recognition en
dc.subject Local spatio-temporal features en
dc.subject Support vector machines en
dc.subject Hidden markov models en
dc.subject Multiband filtering en
dc.subject Gabor filters en
dc.subject Dominant energy analysis en
dc.subject Energy tracking in videos en
dc.title Αναγνώριση και Ταξινόμηση Ανθρώπινων Δράσεων σε Video el
dc.title.alternative Action Recognition and Classification in Videos en
dc.type bachelorThesis el (en)
dc.date.accepted 2014-07-29 -
dc.date.modified 2014-08-27 -
dc.contributor.advisorcommitteemember Μαραγκός, Πέτρος el
dc.contributor.advisorcommitteemember Τζαφέστας, Κωνσταντίνος el
dc.contributor.advisorcommitteemember Ποταμιάνος, Γεράσιμος el
dc.contributor.committeemember Τζαφέστας, Κωνσταντίνος el
dc.contributor.committeemember Ποταμιάνος, Γεράσιμος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
dc.date.recordmanipulation.recordcreated 2014-12-05 -
dc.date.recordmanipulation.recordmodified 2014-12-05 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής