Ο σκοπός της παρούσας διπλωματικής εργασίας ήταν η ανάπτυξη και η επέκταση μιας μεθοδολογίας για την επίλυση του προβλήματος της ταυτόχρονης εκτίμησης θέσης και χαρτογράφησης (SLAM – Simultaneous Localization and Mapping) σε ένα αυτόνομο, κινούμενο ρομποτικό όχημα. Η τεχνική που αναπτύχθηκε στηρίζεται σε συνδυασμό αφενός της μετρικής πληροφορίας από τους κωδικοποιητές στους τροχούς του ρομπότ και αφετέρου της οπτικής πληροφορίας, που λαμβάνεται από μια απλή, μονοσκοπική, web κάμερα. Ο συνδυασμός των δύο ειδών πληροφορίας γίνεται με ένα διακριτό φίλτρο Bayes. Για την μοντελοποίηση του περιβάλλοντος επελέχθη η μέθοδος του τοπολογικού χάρτη, εμπλουτισμένου με την μετρική πληροφορία που μας ήταν διαθέσιμη.
Δεδομένου ότι η μέθοδος αυτή έχει αναπτυχθεί για την επίλυση του SLAM σε περιβάλλοντα εσωτερικά και με έντονη δομή, χρησιμοποιήσαμε κάποιες απλουστευτικές παραδοχές ως προς την κίνηση του ρομπότ ( ακολουθώντας τις παραδοχές μιας προηγούμενης εργασίας που χρησιμοποιούσε οπτική οδομετρία). Η κωδικοποίηση της οπτικής πληροφορίας, έγινε με χρήση των χαρακτηριστικών SURF (Speeded-Up Robust Features). Παράλληλα, χρησιμοποιήσαμε και ιδέες οπτικής κωδικοποίησης από προηγούμενες εργασίες, κυρίως τα ιστογράμματα χρωματικού τόνου και κορεσμού, προκειμένου να κάνουμε σύγκριση της επίδοσής τους. Αναπτύξαμε ένα απλό αλλά αποτελεσματικό μοντέλο παρατήρησης προκειμένου να συγκρίνουμε εικόνες, χρησιμοποιώντας τα χαρακτηριστικά SURF. Επιπρόσθετα, θέλοντας να αξιοποιήσουμε την μετρική πληροφορία, βελτιώσαμε το προηγούμενο μοντέλο κίνησης (βασισμένο σε οπτική οδομετρία), με ένα πιο σύνθετο, το οποίο πλέον λαμβάνει υπ’όψιν την αβεβαιότητα της οδομετρίας του ρομπότ – μια αλλαγή που βελτίωσε πολύ, την συνέργεια των βημάτων πρόβλεψης και παρατήρησης του διακριτού φίλτρου Bayes.
Διεξήχθη ένα πλήθος πειραμάτων στο εσωτερικό των κτηρίων της Σχολής Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του ΕΜΠ. Τα πειράματα αυτά είχαν τρεις στόχους. Πρώτον, να αναδείξουν το βελτιωμένο μοντέλο παρατήρησης με χρήση των χαρακτηριστικών SURF, σε σχέση με αυτό των ιστογραμμάτων χρωματικού τόνου και κορεσμού. Δεύτερον, να επιβεβαιώσουν την ικανότητα του συστήματός μας να εντοπίζει επιτυχώς την θέση του μέσα στον χώρο, καθώς κατασκευάζει ένα αντιπροσωπευτικό χάρτη αυτού, όπως επίσης και την δυνατότητά του να αναγνωρίζει βρόχους διαφόρων μηκών. Στο σημείο αυτό, μας ενδιέφερε επιπλέον να δείξουμε πώς το νέο βελτιωμένο μοντέλο κίνησης και η αξιοποίηση της μετρικής πληροφορίας, μπορεί να βελτιώσει σημαντικά την επίδοση του αλγορίθμου. Τέλος, στόχος μας ήταν να εντοπίσουμε τις αδυναμίες του αλγορίθμου.
Η μεθοδολογία αυτή μπορεί να γίνει οδηγός για την υλοποίηση ενός εύρωστου συστήματος Ταυτόχρονης Εκτίμησης Θέσης και Χαρτογράφησης, βασισμένου σε μετρική πληροφορία από κατάλληλους αισθητήρες (πχ. Κωδικοποιητές τροχών) πάνω στο ρομπότ και σε οπτική πληροφορία από κάμερες, κατάλληλου για εφαρμογές σε δομημένα περιβάλλοντα. Πιστεύουμε ότι η μεθοδολογία αυτή μπορεί εύκολα να βελτιωθεί και να επεκταθεί, καθώς είναι δομημένη σε ανεξάρτητα τμήματα.
The purpose of this diploma thesis was the development and expansion of a methodology to perform simultaneous localization and mapping (SLAM) with an autonomous mobile robotic vehicle. The proposed technique relies on the fusion of the metric information received from the robot’s encoders and visual information extracted from a simple, monocular, web camera. The fusion of these types of sensory information was accomplished using a Discrete Bayes Filter. The method chosen for modeling the environment was based on a topological representation, combined with the metric information received.
Given the fact that this method was developed to perform SLAM in indoor and heavily structured environments, we applied a few simplifying assumptions regarding the robot’s movement (following the assumptions of a previous Diploma Thesis, which relied solely on a visual odometry scheme to calculate the movement of the robot). Visual information is encoded using SURF features (Speeded-Up Robust Features) and its effectiveness is compared to the visual encoding ideas from a previous Diploma Thesis, where HIS color histograms had been proposed. A simple, yet effective observation model was developed for the purpose of comparing images using SURF features. Furthermore, in order to utilize the metric information, we enhanced the simple visual odometry motion model with a more complex one, taking into consideration the uncertainty of the robot’s pose; an addition that greatly improved the synergy achieved between the prediction and update steps of the Discrete Bayes Filter.
Finally, experiments were conducted in the building of the Electrical and Computer Engineering School of the National Technical University of Athens. The purpose of these experiments was threefold. Firstly, to show the improved performance of the new observation model, based on SURF features, as compared to the one based on HIS histograms. Secondly, to confirm that our system is capable of successfully localizing itself in the workspace, whilst creating a representative map of its environment, as well as effectively recognizing loop closures of different lengths. At this point, we were also interested in showing that our new improved motion model could greatly enhance the effectiveness of the developed SLAM algorithm. Lastly, a series of experiments was conducted in order to reveal specific weaknesses of our method.
The methodology proposed in this Diploma Thesis, can be used as a guide for the implementation of a robust SLAM system, based on metric information from the wheel’s encoders and visual information from a monocular camera, mainly for structured environments. We believe that this methodology can be easily improved and expanded, given its modular structure.