dc.contributor.author | Καράμπελα, Θεοφανία | el |
dc.contributor.author | Karampela, Theofania | en |
dc.date.accessioned | 2022-12-12T09:29:35Z | |
dc.date.available | 2022-12-12T09:29:35Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/56416 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.24114 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Ενισχυτική Μάθηση | el |
dc.subject | Ρομποτικός Χειρισμός Εσωτερικής Λαβής | el |
dc.subject | Συνεχής Χώρος Δράσεων | el |
dc.subject | Συνεχής Χώρος Καταστάσεων | el |
dc.subject | Ανάδραση Δύναμης | el |
dc.title | Εκμάθηση ρομποτικής κίνησης με χρήση αλγορίθμου ενισχυτικής μάθησης και ανάδραση δύναμης | el |
heal.type | bachelorThesis | |
heal.classification | Robotics | en |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2022-09-06 | |
heal.abstract | Η ανάπτυξη επιδέξιων ρομποτικών λαβών στη γεωργία, και συγκεκριμένα στην καλλιέργεια μανιταριών, για τη συγκομιδή των προϊόντων και την προσεκτική λήψη αντικειμένων, αποτελεί σύγχρονη επιδίωξη στον τομέα της ρομποτικής. Τέτοιου είδους λαβές μπορούν να αναπτυχθούν με πλήθος μεθόδων, καθώς και με τη χρήση ποικίλων διαφορετικών ρομποτικών χειριστών, προκειμένου να προκύψουν τα επιθυμητά αποτελέσματα ως προς το είδος της λαβής, την ποιότητα του συλλεγόμενου προϊόντος και το κόστος της εργασίας, τόσο από άποψη πόρων, όσο και χρόνου. Σε αυτήν την διπλωματική εργασία παρουσιάζουμε τη χρήση μιας μεθόδου Actor-Critic, με εφαρμογή σε συνεχείς χώρους δράσεων και καταστάσεων, με στόχο την model-free εκπαίδευση ενός πράκτορα. Ο στόχος του πράκτορα είναι να καταφέρνει να εξέρχεται ενός διαδρόμου πεπερασμένου μήκους. Η γνώση του για τη δυναμική του περιβάλλοντος περιορίζεται αποκλειστικά στο πεδίο δυνάμεων-επαναφοράς που δέχεται από τα τοιχώματα του διαδρόμου. Η συγκεκριμένη εφαρμογή, αποτελεί απλούστευση του προβλήματος της επίτευξης ενός επιδέξιου εσωτερικού ρομποτικού χειρισμού (in-hand grasp), δεδομένου ότι η κίνηση του αντικειμένου μέσα στο διάδρομο, προσομοιάζει τις κινήσεις στροφής και μετατόπισης που καλείται να πραγματοποιήσει η ρομποτική λαβή κατά τη συγκομιδή των μανιταριών. Η εκπαίδευση των Actor-Critic, οι οποίοι αναπαρίστανται μέσω νευρωνικών δικτύων, γίνεται με τη χρήση Ενισχυτικής Μάθησης και πιο συγκεκριμένα, με χρήση Temporal Difference μάθησης, σε περιβάλλον αγνώστου μοντέλου. | el |
heal.advisorName | Τζαφέστας, Κωνσταντίνος | el |
heal.committeeMemberName | Ποταμιάνος, Αλέξανδρος | el |
heal.committeeMemberName | Ψυλλάκης, Χαράλαμπος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 118 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: