dc.contributor.advisor |
Μαραγκός, Πέτρος |
el |
dc.contributor.author |
Παυλάκος, Γεώργιος Η.
|
el |
dc.contributor.author |
Pavlakos, Georgios I.
|
en |
dc.date.accessioned |
2014-12-01T11:50:49Z |
|
dc.date.available |
2014-12-01T11:50:49Z |
|
dc.date.copyright |
2014-07-31 |
- |
dc.date.issued |
2014-12-01 |
|
dc.date.submitted |
2014-07-31 |
- |
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/39799 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.7062 |
|
dc.description |
120 σ. |
el |
dc.description.abstract |
Η συγκεκριμένη διπλωματική έχει σαν αντικείμενο την αντιμετώπιση του προβλήματος της αναγνώρισης χειρονομιών, και των τεχνικών πολυτροπικής σύμμειξης που μπορούν να εφαρμοστούν. Μελετάται η μοντελοποίηση και η αναγνώριση των χειρονομιών με χρήση ισχυρών εργαλείων όπως τα Κρυφά Μαρκοβιανά Μοντέλα, αλλά και άλλων ταξινομητών μηχανικής μάθησης, όπως τα Support Vector Machines και k-Nearest Neighbor. Για την εξαγωγή χαρακτηριστικών χρησιμοποιούμε το κανάλι πληροφορίας της χειρομορφής, από όπου εξάγουμε δημοφιλείς οπτικούς περιγραφητές, όπως τα Histograms of Oriented Gradients (HOG), αλλά και το κανάλι πληροφορίας της θέσης-κίνησης, όπου τα χαρακτηριστικά προκύπτουν από τη θέση (σχετική θέση, απόσταση) και την κίνηση (ταχύτητα, διεύθυνση), του χεριού και του αγκώνα. Τέλος, παρουσιάζουμε δύο επιτυχημένα σχήματα σύμμειξης αυτών των δύο καναλιών οπτικής πληροφορίας με την τροπικότητα του ήχου. Μάλιστα, τα αποτελέσματά μας σε πολυτροπική βάση αναγνώρισης χειρονομιών, ξεπερνούν τις επιδόσεις που επιτεύχθηκαν σε πρόσφατο διαγωνισμό πολυτροπικής αναγνώρισης χειρονομιών. |
el |
dc.description.abstract |
This thesis focuses on the gesture recognition problem and on multimodal fusion techniques for it. We study gesture modeling and recognition using powerful tools, such as Hidden Markov Models, as well as other machine learning classifiers, like Support Vector Machines and K-Nearest Neighbor. For feature extraction we focus on Handshape information, employing various visual descriptors, like Histograms of Oriented Gradients (HOG), and Movement-Position information, where features are extracted based on the position (relative position, distance) and the movement (velocity, direction) of hands and elbows. Finally, we present two successful fusion schemes, employing both visual cues and audio modality. Our proposed methodology achieves high gesture recognition accuracy in a multimodal gesture dataset, outperforming all recently published approaches on the same challenging gesture recognition task. |
en |
dc.description.statementofresponsibility |
Γεώργιος Η. Παυλάκος |
el |
dc.language.iso |
el |
en |
dc.rights |
ETDFree-policy.xml |
en |
dc.subject |
Όραση υπολογιστών |
el |
dc.subject |
Πολυτροπική αναγνώριση χειρονομιών |
el |
dc.subject |
Επικοινωνία ανθρώπου-υπολογιστή |
el |
dc.subject |
Αισθητήρας Kinect |
el |
dc.subject |
Κρυφά Μαρκοβιανά μοντέλα |
el |
dc.subject |
Ιστογράμματα προσανατολισμένων gradients |
el |
dc.subject |
Σχήματα πολυτροπικής σύμμειξης |
el |
dc.subject |
Computer vision |
en |
dc.subject |
Multimodal gesture recognition |
en |
dc.subject |
Human-computer interaction |
en |
dc.subject |
Kinect sensor |
en |
dc.subject |
Hidden Markov models |
en |
dc.subject |
Histograms of oriented gradients |
en |
dc.subject |
Mltimodal fusion schemes |
en |
dc.title |
Πολυτροπική Αναγνώριση Χειρονομιών |
el |
dc.title.alternative |
Multimodal Gesture Recognition |
en |
dc.type |
bachelorThesis |
el (en) |
dc.date.accepted |
2014-07-16 |
- |
dc.date.modified |
2014-07-31 |
- |
dc.contributor.advisorcommitteemember |
Παπαβασιλόπουλος, Γεώργιος |
el |
dc.contributor.advisorcommitteemember |
Τζαφέστας, Κωνσταντίνος |
el |
dc.contributor.committeemember |
Μαραγκός, Πέτρος |
el |
dc.contributor.committeemember |
Παπαβασιλόπουλος, Γεώργιος |
el |
dc.contributor.committeemember |
Τζαφέστας, Κωνσταντίνος |
el |
dc.contributor.department |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής. Εργαστήριο Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων. |
el |
dc.date.recordmanipulation.recordcreated |
2014-12-01 |
- |
dc.date.recordmanipulation.recordmodified |
2014-12-01 |
- |