dc.contributor.author | Stavrakakis, Ioannis Odysseas![]() |
en |
dc.contributor.author | Σταυρακάκης, Ιωάννης Οδυσσέας![]() |
el |
dc.date.accessioned | 2025-07-30T10:37:13Z | |
dc.date.available | 2025-07-30T10:37:13Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/62230 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.29926 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/3.0/gr/ | * |
dc.subject | Gait analysis | en |
dc.subject | Ανάλυση βάδισης | el |
dc.subject | Deep learning | en |
dc.subject | Computer vision | en |
dc.subject | Τεχνητή όραση | el |
dc.subject | Τεχνητή νοημοσύνη | el |
dc.subject | Avatar | en |
dc.subject | Ανθρώπινο πλέγμα | el |
dc.subject | Mesh reconstruction | en |
dc.subject | Ανακατασκευή πλέγματος | en |
dc.title | Ανάλυση βάδισης χρήσει ανακατασκευής ανθρώπινων μοντέλων βαθιάς μάθησης | el |
dc.title | Gait analysis using deep learning-driven avatar reconstruction | en |
heal.type | bachelorThesis | |
heal.classification | Computer Vision | en |
heal.classification | Machine Learning | en |
heal.classification | Robotics | en |
heal.classification | Ρομποτική | el |
heal.classification | Τεχνητή Όραση | el |
heal.classification | Τεχνητή Νοημοσύνη | el |
heal.language | en | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2024 | |
heal.abstract | Η παρούσα διπλωματική εργασία επικεντρώνεται στον σχεδιασμό και την υλοποίηση μιας αξιόπιστης και ακριβούς εναλλακτικής λύσης για την ανάλυση της βάδισης, χρησιμοποιώντας ανακατασκευές avatar μέσω βαθιάς μάθησης, καθώς και στην εξαγωγή χρήσιμων κατευθυντήριων γραμμών που γενικεύουν τη διαδικασία και μπορούν να υποστηρίξουν μελλοντικούς ερευνητές. Πρόκειται για μια πρωτοποριακή μελέτη που εστιάζει στη δημιουργία ενός πλαισίου επιλογής καμερών καθώς και ενός προσαρμοσμένου εργαλείου για την επεξεργασία και τη δημιουργία μεταβλητών ανάλυσης βάδισης. Το Κεφάλαιο 1 προσφέρει μια εισαγωγή στο θέμα, περιλαμβάνοντας το κίνητρο της διατριβής καθώς και μια βιβλιογραφική ανασκόπηση του κύκλου βάδισης, των σημαντικότερων παραδειγμάτων λογισμικού ανάλυσης βάδισης και των εφαρμογών βαθιάς μάθησης στην ανάλυση βάδισης. Το Κεφάλαιο 2 παρουσιάζει μια λεπτομερή ανάλυση των αλγορίθμων ανακατασκευής avatar, ξεκινώντας με τη διάκριση μεταξύ ρητών και άρρητων μεθόδων και μια εισαγωγή στο μοντέλο SMPL και τον διάδοχό του, SMPL-X. Στη συνέχεια, εξετάζονται προηγμένοι, αλγόριθμοι ανακατασκευής avatar που σχετίζονται με το έργο, ακολουθούμενοι από μια συγκριτική αξιολόγηση για την επιλογή του καταλληλότερου αλγορίθμου. Ο βέλτιστος αλγόριθμος μελετάται λεπτομερώς, με ιδιαίτερη έμφαση στα βασικά του στοιχεία, τη ροή επεξεργασίας, τις ρυθμίσεις και τους περιορισμούς του. Το Κεφάλαιο 3 επικεντρώνεται στη διαδικασία αξιολόγησης των πλεγμάτων (mesh). Παρουσιάζονται σημαντικές μέθοδοι αξιολόγησης, οι οποίες συγκρίνονται και αξιολογούνται τελικά για την επιλογή της πιο αποτελεσματικής προσέγγισης για τις ανάγκες της εργασίας. Με τη χρήση της επιλεγμένης μεθόδου, διεξάγεται μια αρχική σύγκριση πλήρους πλέγματος, αναδεικνύοντας το πλαίσιο που χρησιμοποιήθηκε και εντοπίζοντας τυχόν περιορισμούς που επιβάλλει. Στη συνέχεια, ακολουθεί μια στοχευμένη αξιολόγηση με βάση τα υποϊσχιακά και υποαστραγαλικά μήκη, προσφέροντας μια πολυδιάστατη εκτίμηση. Το Κεφάλαιο 4 εξετάζει τη διαδικασία βαθμονόμησης καμερών, ορίζοντας και αναλύοντας τις κύριες παραμέτρους της, όπως οι εγγενείς, εξωγενείς και οι πίνακες παραμόρφωσης. Επιλέγεται ένα μοτίβο βαθμονόμησης για την κάλυψη των μοναδικών απαιτήσεων της εργασίας και αξιολογούνται τα κορυφαία εργαλεία βαθμονόμησης για την αναγνώριση της βέλτιστης επιλογής. Το Κεφάλαιο 5 παρουσιάζει το πλαίσιο επιλογής καμερών, περιγράφοντας τη μέθοδο για τον προσδιορισμό του ιδανικού αριθμού και της θέσης των καμερών. Ξεκινά με την επεξήγηση της αρχικοποίησης του πλέγματος καμερών και τον ορισμό των ανώτερων και κατώτερων ορίων του αριθμού καμερών. Εισάγεται η μετρική Μέσου Τετραγωνικού Σφάλματος (MSE) και εφαρμόζεται στη Διαδικασία Εμπρόσθιας Διέλευσης (Forward Pass) για τη βελτιστοποίηση της τοποθέτησης των καμερών. Παρουσιάζονται τεχνικές ευθυγράμμισης επιφάνειας και ανακατασκευής, αξιοποιώντας τα αποτελέσματα της Εμπρόσθιας Διέλευσης για τη βελτιστοποίηση της δημιουργίας πλέγματος, ενώ η Διαδικασία Αντίστροφης Διέλευσης (Reverse Pass) χρησιμοποιεί αυτές τις πληροφορίες για τη μείωση του αριθμού καμερών μέσω μιας διαδικασίας βασισμένης στη βελτιστοποίηση, καθορίζοντας την τελική διαμόρφωση. Το Κεφάλαιο 6 εφαρμόζει το πλαίσιο επιλογής καμερών για τη δημιουργία ενός εικονικού περιβάλλοντος προσομοίωσης. Συζητείται η ενσωμάτωση βιβλιοθηκών και η ανάπτυξη ενός προσαρμοσμένου πρόσθετου για τη δημιουργία σκηνών, την ανακατασκευή κινήσεων και την εξαγωγή δεδομένων βάδισης. Τα αποτελέσματα αυτά αξιολογούνται, οδηγώντας επιπλέον πληροφορίες σχετικά με τον βέλτιστο αριθμό και την τοποθέτηση καμερών, παρέχοντας κατευθυντήριες γραμμές για μια ευέλικτη και ρεαλιστική προσέγγιση συλλογής δεδομένων. Το Κεφάλαιο 7 αναπαράγει αυτή τη διαδικασία σε πραγματικό περιβάλλον. Περιγράφεται η πειραματική διάταξη και η ροή εργασίας, ακολουθούμενες από ανάλυση των πραγματικών αποτελεσμάτων σε σύγκριση με τα ευρήματα της προσομοίωσης. Επιπλέον, πραγματοποιείται μια συγκριτική αξιολόγηση με ένα σύστημα υψηλής ποιότητας, παρέχοντας ένα σημείο αναφοράς για την εκτίμηση της ακρίβειας της μεθόδου. Το Κεφάλαιο 8 ολοκληρώνει τη διπλωματική εργασία, συνοψίζοντας τα κύρια ευρήματα και προτείνοντας κατευθύνσεις για μελλοντική έρευνα και ανάπτυξη. | el |
heal.abstract | This thesis focuses on the design and implementation of a reliable and accurate solution for markerless gait analysis, utilizing deep learning-driven avatar reconstructions and a novel framework for optimal camera selection in motion capture alongside a customized tool for processing and extracting gait analysis parameters. Chapter 1 introduces the thesis, outlining its motivation and providing a comprehensive literature review. The chapter covers the gait cycle, notable examples of gait analysis software, and applications of deep learning in gait analysis. Chapter 2 delves into avatar reconstruction algorithms, starting with a distinction between implicit and explicit methods, followed by an introduction to the SMPL model and its advanced successor, SMPL-X. The chapter reviews state-of-the-art algorithms relevant to the project, conducting a comparative evaluation to select the most suitable one. The chosen algorithm is then analyzed in depth, with a focus on its core components, processing pipeline, configurations, and limitations. Chapter 3 addresses the mesh evaluation process, comparing and assessing various evaluation methods to identify the most effective one for the project. A full-mesh comparison is conducted using the selected method, with an evaluation of its limitations. This is followed by a targeted assessment of subischial and subankle lengths, providing a comprehensive, multi-faceted evaluation. Chapter 4 explores the camera calibration process, detailing its key parameters, including intrinsic, extrinsic, and distortion matrices. A calibration pattern is chosen to meet the project’s specific needs, and leading calibration toolboxes are reviewed to select the optimal one. Chapter 5 introduces the camera selection framework, outlining the methodology for determining the ideal number and positioning of cameras. The chapter begins by initializing a camera grid and defining upper and lower bounds for the camera count. The Mean Square Error (MSE) metric is employed in the Forward Pass to optimize camera placement. Surface alignment and reconstruction techniques are then presented, leveraging the Forward Pass results to refine mesh generation. The Reverse Pass applies optimization-driven insights to reduce the camera count, establishing the final configuration. Chapter 6 applies the camera selection framework in a virtual simulation environment. This includes integrating libraries and developing a custom add-on for scene creation, animation reconstruction, and gait data exportation. The results are evaluated to provide insights into optimal camera count and placement, offering flexible and practical guidelines for data collection. Chapter 7 extends the work into a real-world lab environment. The experimental setup and pipeline are detailed, followed by an analysis of lab results compared to the simulated findings. Additionally, a benchmark comparison against a high-end product is conducted to evaluate the accuracy of the proposed method. Chapter 8 concludes the thesis by summarizing the key findings and proposing directions for future research and development. | en |
heal.advisorName | Παπαδόπουλος, Ευάγγελος | el |
heal.committeeMemberName | Παπαδόπουλος, Ευάγγελος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Μηχανολόγων Μηχανικών. Τομέας Μηχανολογικών Κατασκευών και Αυτομάτου Ελέγχου | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 185 σ. | el |
heal.fullTextAvailability | false |
The following license files are associated with this item: