HEAL DSpace

Εκμάθηση ρομποτικής κίνησης με χρήση αλγορίθμου ενισχυτικής μάθησης και ανάδραση δύναμης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Καράμπελα, Θεοφανία el
dc.contributor.author Karampela, Theofania en
dc.date.accessioned 2022-12-12T09:29:35Z
dc.date.available 2022-12-12T09:29:35Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56416
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.24114
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Ενισχυτική Μάθηση el
dc.subject Ρομποτικός Χειρισμός Εσωτερικής Λαβής el
dc.subject Συνεχής Χώρος Δράσεων el
dc.subject Συνεχής Χώρος Καταστάσεων el
dc.subject Ανάδραση Δύναμης el
dc.title Εκμάθηση ρομποτικής κίνησης με χρήση αλγορίθμου ενισχυτικής μάθησης και ανάδραση δύναμης el
heal.type bachelorThesis
heal.classification Robotics en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-09-06
heal.abstract Η ανάπτυξη επιδέξιων ρομποτικών λαβών στη γεωργία, και συγκεκριμένα στην καλλιέργεια μανιταριών, για τη συγκομιδή των προϊόντων και την προσεκτική λήψη αντικειμένων, αποτελεί σύγχρονη επιδίωξη στον τομέα της ρομποτικής. Τέτοιου είδους λαβές μπορούν να αναπτυχθούν με πλήθος μεθόδων, καθώς και με τη χρήση ποικίλων διαφορετικών ρομποτικών χειριστών, προκειμένου να προκύψουν τα επιθυμητά αποτελέσματα ως προς το είδος της λαβής, την ποιότητα του συλλεγόμενου προϊόντος και το κόστος της εργασίας, τόσο από άποψη πόρων, όσο και χρόνου. Σε αυτήν την διπλωματική εργασία παρουσιάζουμε τη χρήση μιας μεθόδου Actor-Critic, με εφαρμογή σε συνεχείς χώρους δράσεων και καταστάσεων, με στόχο την model-free εκπαίδευση ενός πράκτορα. Ο στόχος του πράκτορα είναι να καταφέρνει να εξέρχεται ενός διαδρόμου πεπερασμένου μήκους. Η γνώση του για τη δυναμική του περιβάλλοντος περιορίζεται αποκλειστικά στο πεδίο δυνάμεων-επαναφοράς που δέχεται από τα τοιχώματα του διαδρόμου. Η συγκεκριμένη εφαρμογή, αποτελεί απλούστευση του προβλήματος της επίτευξης ενός επιδέξιου εσωτερικού ρομποτικού χειρισμού (in-hand grasp), δεδομένου ότι η κίνηση του αντικειμένου μέσα στο διάδρομο, προσομοιάζει τις κινήσεις στροφής και μετατόπισης που καλείται να πραγματοποιήσει η ρομποτική λαβή κατά τη συγκομιδή των μανιταριών. Η εκπαίδευση των Actor-Critic, οι οποίοι αναπαρίστανται μέσω νευρωνικών δικτύων, γίνεται με τη χρήση Ενισχυτικής Μάθησης και πιο συγκεκριμένα, με χρήση Temporal Difference μάθησης, σε περιβάλλον αγνώστου μοντέλου. el
heal.advisorName Τζαφέστας, Κωνσταντίνος el
heal.committeeMemberName Ποταμιάνος, Αλέξανδρος el
heal.committeeMemberName Ψυλλάκης, Χαράλαμπος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής el
heal.academicPublisherID ntua
heal.numberOfPages 118 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα