HEAL DSpace

Ανάπτυξη κατανεμημένου πολυπρακτορικού συστήματος από κοινού ενισχυτικής μάθησης για την αυτόνομη ρύθμιση του βηματισμού σε τετράποδο ρομπότ

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Τζαφέστας, Κωνσταντίνος el
dc.contributor.author Αποστολόπουλος, Σωτήριος Α. el
dc.contributor.author Apostolopoulos, Sotirios A. en
dc.date.accessioned 2012-05-04T07:09:51Z
dc.date.available 2012-05-04T07:09:51Z
dc.date.copyright 2012-04-02 -
dc.date.issued 2012-05-04
dc.date.submitted 2012-04-02 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/6134
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.4363
dc.description 92 σ. el
dc.description.abstract Η κίνηση ρομπότ με πόδια έχει προσελκύσει το ενδιαφέρον αρκετών ερευνητών από διάφορα επιστημονικά πεδία παγκοσμίως, για περισσότερες από δύο δεκαετίες. Η σχεδίαση βέλτιστων προτύπων βάδισης για ένα βαδίζον ρομπότ συνιστά ένα ιδιαίτερα πολύπλοκο πρόβλημα, κυρίως λόγω του μεγάλου αριθμού παραμέτρων οι οποίες καθορίζουν τη συμπεριφορά κίνησης, καθιστώντας έτσι την εφαρμογή τυπικών αλγορίθμων αναζήτησης ακατάλληλη. Λύση στο πρόβλημα αυτό μπορούν να δώσουν μέθοδοι Μηχανικής Μάθησης, οι οποίες δε χρειάζονται κάποιο μοντέλο του συστήματος και μπορούν να μάθουν τις παραμέτρους με καλή προσέγγιση. Η εργασία η οποία παρουσιάζεται σε αυτή τη διπλωματική εργασία, εμπνεύστηκε από την ανάγκη ανάπτυξης μεθοδολογιών οι οποίες μπορούν να παρέχουν ιδιότητες αναπτυξιακής μάθησης και προσαρμογής συμπεριφοράς σε πολύπλοκους ρομποτικούς μηχανισμούς, όπως τα ρομπότ με πόδια. Ο στόχος είναι να προσδώσουν στους πολύπλοκους ρομποτικούς μηχανισμούς τη δυνατότητα να μαθαίνουν αυτόματα τον τρόπο με τον οποίο θα φέρνουν εις πέρας νέες εργασίες, ιδιαίτερα εργασίες δύσκολες σε μη – φιλικά και μη – δομημένα περιβάλλοντα για τα οποία τα κλασικά ρομπότ με τροχούς κρίνονται ακατάλληλα. Στην παρούσα διπλωματική εργασία, προτείνουμε δύο νέες μεθόδους μάθησης παραμέτρων ενός τετράποδου ρομποτικού συστήματος, με σκοπό την κίνηση του με κάποια επιθυμητή ταχύτητα. Οι μέθοδοι αυτοί χρησιμοποιούν Ενισχυτική Μάθηση. Αρχικά προτείνουμε μία προσέγγιση ενός πράκτορα και στη συνέχεια, προτείνουμε μία προσέγγιση πολλών πρακτόρων. Συγκεκριμένα προσθέτουμε τέσσερις ακόμη πράκτορες, σε διαφορετικό επίπεδο, οι οποίοι μαθαίνουν κάποια τοπική συμπεριφορά και συγχρονίζονται από τον πράκτορα της πρώτης προσέγγισης. Το σύστημα αξιολογείται στην πλατφόρμα εξομοίωσης WebotsΤΜ. Τα αποτελέσματα που προκύπτουν αποδεικνύουν ότι ο προτεινόμενος πολυπρακτορικός μηχανισμός μάθησης καθιστά ικανό το ρομπότ να κινηθεί με ένα ευσταθές πρότυπο βάδισης, επιτυγχάνοντας την επιθυμητή ταχύτητα με πολύ μικρό σφάλμα και υψηλό βαθμό γενίκευσης. el
dc.description.abstract Legged robot locomotion has attracted the interest of many researchers, from different scientific fields worldwide, for more than two decades now. Designing optimal gait patterns for a walking robot constitutes a particularly complex problem, notably due to the large number of parameters that govern locomotion behavior, making the application of typical search algorithms inappropriate. Solution to this problem can come from Machine Learning methods, that do not need a model of the system and are able to learn this set of parameters with a very good approximation. The work presented in this diploma thesis has been motivated by the need to develop methodologies that can provide complex robotic mechanisms, such as legged walking robots, with developmental learning and behavioral adaptability properties. The goal is to endow complex robot mechanisms with capacities to automatically learn how to fulfill new tasks, especially difficult tasks in hostile and unstructured environments for which classic wheeled mobile robots are unsuitable. In this diploma thesis, we propose two new methods for parameter learning of a quadruped robot, in order to make it able to move with a desired velocity. These methods use Reinforcement Learning. At first, we suggest a single agent approach and later, we suggest a multiagent approach. Specifically, we introduce four additional agents, on a different level, that learn a local behavior and are coordinated by the agent of the first approach. The system is evaluated on the Webots simulation platform. The obtained results show that the proposed multi-agent learning mechanism enables the quadruped robot to achieve a stable gait pattern, reaching its goal velocity with very slight error and great degree of generalization. en
dc.description.statementofresponsibility Σωτήριος Α. Αποστολόπουλος el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Κίνηση τετράποδου ρομπότ el
dc.subject Ενισχυτική μάθηση el
dc.subject Κοινή δράση μάθησης el
dc.subject Πολυπρακτορικό σύστημα el
dc.subject Κατανεμημένο σύστημα el
dc.subject Πολυεπίπεδο σύστημα el
dc.subject Quadrupedal robot locomotion en
dc.subject Reinforcement learning en
dc.subject Joint action learning en
dc.subject Multiagent system en
dc.subject Distributed system en
dc.subject Multilevel system en
dc.title Ανάπτυξη κατανεμημένου πολυπρακτορικού συστήματος από κοινού ενισχυτικής μάθησης για την αυτόνομη ρύθμιση του βηματισμού σε τετράποδο ρομπότ el
dc.type bachelorThesis el (en)
dc.date.accepted 2012-04-02 -
dc.date.modified 2012-04-02 -
dc.contributor.advisorcommitteemember Μαράτος, Νικόλαος el
dc.contributor.advisorcommitteemember Στάμου, Γεώργιος el
dc.contributor.committeemember Τζαφέστας, Κωνσταντίνος el
dc.contributor.committeemember Μαράτος, Νικόλαος el
dc.contributor.committeemember Στάμου, Γεώργιος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής el
dc.date.recordmanipulation.recordcreated 2012-05-04 -
dc.date.recordmanipulation.recordmodified 2012-05-04 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής