Abstract:
Η ακριβής παρακολούθηση της ανθρώπινης βάδισης αποτελεί σημαντική συνιστώσα για διάφορες ρομποτικές εφαρμογές, όπως οι ρομποτικές πλατφόρμες κινητικής υποβοήθησης με στόχο την παροχή βοήθειας σε ασθενείς με μειωμένη κινητικότητα (mobility assistive robots), οι επονομαζόμενοι κοινωνικοί ρομποτικοί βοηθοί (social robot assistants), κ.α. Μια αρχιτεκτονική ρομποτικού ελέγχου με επίγνωση του περιβάλλοντος απαιτεί ακριβή και αξιόπιστη γνώση της κινητικής κατάστασης του χρήστη σε πραγματικό χρόνο, ώστε να αξιολογείται συνεχώς το επίπεδο της βάδισης του ασθενούς και να προσαρμόζεται η κίνηση του ρομπότ κατάλληλα με στόχο τη βέλτιστη παροχή βοήθειας και υποστήριξης. Σε αυτήν την κατεύθυνση, η παρούσα διατριβή πραγματεύεται θέματα παρακολούθησης της ανθρώπινης βάδισης, και ειδικά της κίνησης των ποδιών ενός χρήστη σε συνεχή και δυναμική διάδραση με ενσωματωμένη ρομποτική πλατφόρμα υποβοήθησης κινητικότητας. Πιο συγκεκριμένα, στο πρώτο στάδιο της διατριβής μελετήθηκε μεθοδολογία παρακολούθησης ανθρώπινης βάδισης με χρήση Φίλτρου Kalman και K-means συσταδοποίησης, καθώς και μεθοδολογίες που χρησιμοποιούν Φίλτρα Σωματιδίων (Particle Filters - PFs) βάσει Ακολουθιακής Επαναδειγματοληψίας Σημαντικότητας (Sequential Importance Resampling - SIR). Στη συνέχεια, αναπτύχθηκε μια νέα μεθοδολογία παρακολούθησης με χρήση ενός PF επαυξημένου μέσω πιθανοτικής συσχέτισης δεδομένων (probabilistic data association - PDA). Παράλληλα, αναπτύχθηκαν μεθοδολογίες για την ανάλυση της ανθρώπινης βάδισης με την εξαγωγή χωροχρονικών παραμέτρων, οι οποίες χρησιμεύουν στην κλινική διάγνωση χαρακτηριστικών παθολογικής βάδισης. Στο επόμενο στάδιο της διατριβής, αναπτύχθηκε μια νέα προσέγγιση παρακολούθησης της ανθρώπινης βάδισης που χρησιμοποιεί δύο PFs με PDA σε ένα πρωτότυπο σχήμα αλληλεπιδραστικού πολλαπλού μοντέλου (Interacting Multiple Model - IMM). Στόχος της μεθοδολογίας αυτής αποτελεί η επιλογή σε πραγματικό χρόνο του κατάλληλου μοντέλου κίνησης σύμφωνα με την ανάλυση της ανθρώπινης βάδισης και τη χρήση του αλγορίθμου Viterbi για μια επαυξημένη εκτίμηση της κατάστασης της ανθρώπινης βάδισης. Η εκτιμώμενη κατάσταση βάδισης επίσης αλληλεπιδρά με το IMM ως μια πρότερη πληροφορία που οδηγεί τη διαδικασία της μαρκοβιανής δειγματοληψίας, ενώ το PDA εξασφαλίζει ότι παρακολουθούνται τα πόδια του ίδιου ανθρώπου-χρήστη. Τα δεδομένα παρατήρησης προέρχονται από έναν ανιχνευτή λέιζερ (laser range finder - LRF), ο οποίος είναι τοποθετημένος επάνω στη ρομποτική πλατφόρμα κινητικής υποβοήθησης. Στο πλαίσιο της παρούσας διατριβής, εκπονήθηκε μια λεπτομερής πειραματική ανάλυση και αξιολόγηση του προτεινόμενου αλγορίθμου χρησιμοποιώντας δεδομένα αληθείας (ground truth) από ένα σύστημα καταγραφής κίνησης (motion capturing), που χρησιμοποιήθηκε σε πραγματικά πειράματα με ηλικιωμένα άτομα που παρουσίαζαν διάφορες κινητικές δυσλειτουργίες. Για την πειραματική επαλήθευση της προτεινόμενης μεθοδολογίας, υπολογίσθηκε η ακρίβεια του αλγορίθμου, αλλά και η ευρωστία του σε περιπτώσεις θορύβου και ανυπαρξίας δεδομένων παρατήρησης, καθώς και η επιτυχία του ως προς την ταξινόμηση της κατάσταση βάδισης, ελέγχοντας την επίδραση διαφορετικού αριθμού δειγμάτων στα PFs. Τα αποτελέσματα για τα ηλικιωμένα άτομα δείχνουν τις δυνατότητες που παρέχει το προτεινόμενο πλαίσιο μεθοδολογίας για εφαρμογή σε πραγματικό χρόνο, λόγω της αποτελεσματικότητάς του ως προς την παροχή ακριβών και αξιόπιστων εκτιμήσεων για την επαυξημένη κατάσταση βάδισης του ανθρώπου με χρήση μικρού αριθμού δειγμάτων στα στοχαστικά φίλτρα εκτίμησης. Εν συνεχεία, η ερευνητική εργασία επικεντρώθηκε στη μελέτη της ευστάθειας κατά τη βάδιση και την αντίστοιχη ανάπτυξη ενός δικτύου βαθιάς μάθησης με χρήση αναδρομικών νευρωνικών δικτύων για την πρόβλεψη της ευστάθειας βάδισης ως ασφαλούς ή επίφοβης για πτώση βάδισης, με χρήση πολυτροπικής πληροφορίας από δεδομένα κάμερας και λέιζερ. Τελική συνεισφορά της παρούσας διατριβής αποτελεί η μελέτη και ανάπτυξη διαφόρων στρατηγικών ελέγχου για τη ρομποτική πλατφόρμα υποβοήθησης με χρήση ανθρωποκεντρικής πληροφορίας σχετικά με την κινητική κατάσταση του εκάστοτε χρήστη. Αρχικά μελετήθηκε και υλοποιήθηκε μια στρατηγική ελέγχου για τον σχηματισμό ανθρώπου-ρομπότ με την ανάπτυξη ενός κινηματικού ελεγκτή που λαμβάνει υπόψη την κινηματική κατηγοριοποίηση του χρήστη προκειμένου να προσαρμόζονται οι βέλτιστες παράμετροι του ελεγκτή σε σχέση με την απόσταση και τον προσανατολισμό του σχήματος άνθρωπος-ρομπότ. Παρά το γεγονός ότι μια τέτοια σχεδίαση είχε καλά αποτελέσματα σε ευθεία πορεία, δεν ήταν δυνατόν να προσαρμόζεται σε πιο σύνθετες κινήσεις που περιλάμβαναν επίσης στροφές. Για το λόγο αυτό, η παρούσα διατριβή ολοκληρώνεται με την παρουσίαση, ανάλυση και υλοποίηση μιας μεθόδου ενισχυτικής μάθησης (reinforcement learning), η οποία ενσωματώνει και ένα βαθύ νευρωνικό δίκτυο για την πρόβλεψη της πρόθεσης κίνησης του ατόμου. Στόχος είναι η εκμάθηση μιας πολιτικής ελέγχου για τον ρομποτικό βοηθό ώστε να προσαρμόζεται στην κινητική κατάσταση και τις προθέσεις του εκάστοτε χρήστη. Εκτενής πειραματική ανάλυση αποδεικνύει την αποτελεσματικότητα της προτεινόμενης μεθόδου σε σχέση με βασικές μεθόδους ελέγχου, αναδεικνύοντας τη δυνατότητα χρήσης της προτεινόμενης μεθοδολογίας ως ικανής ανθρωποκεντρικής στρατηγικής λήψης αποφάσεων για την κίνηση του ρομποτικού βοηθού με προσαρμογή στον εκάστοτε χρήστη.