dc.contributor.author | Τσιατσιάνης, Γεώργιος Χρήστος | el |
dc.contributor.author | Tsiatsianis, Georgios Christos | en |
dc.date.accessioned | 2022-11-10T10:23:13Z | |
dc.date.available | 2022-11-10T10:23:13Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/56118 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.23816 | |
dc.description | Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Μαθηματική Προτυποποίηση σε Σύγχρονες Τεχνολογίες και στα Χρηματοοικονομικά” | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Βαθιά ενισχυτική μάθηση | el |
dc.subject | Υλοποίηση | el |
dc.subject | Ανάλυση | el |
dc.subject | Implementation | en |
dc.subject | Deep reinforcement learning | en |
dc.subject | Analysis | en |
dc.title | Μελέτη ασύγχρονων μεθόδων βαθιάς ενισχυτικής μάθησης | el |
dc.title | Asynchronous methods for deep reinforcement learning | en |
heal.type | masterThesis | |
heal.classification | Τενχητή νοημοσύνη,Αλγόριθμοι, Μαθηματικά | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2022-09-23 | |
heal.abstract | Η βαθιά ενιχσυτική μάθηση αποτελεί ένα από τα πιο υποσχόμενα πεδία της μηχανικής μάθησης. Φαίνεται να επιλυεί αποδοτικά ένα ευρύ φάσμα προβλημάτων. Η ασυγχρονη ενισχυτική μάθηση αποτελεί εξέλιξη στο συγκεκριμένο τομέα. Επιχειρεί να επιλύσει τα προβλήματα ταχύτερα αποδοτικότερα και εξερευνώντας το περιβάλλον μάθησης του πράκτορα πολύ καλύτερα και παρέχοντας μεγαλύτερη ευστάθεια στο σύστημα. Στα πρώτα κεφάλαια της παρούσας διπλωματικής εργασίας, εισάγουμε με αναλυτιή μεθοδολογία τον αναγνώστη πάνω στις έννοιες της ενισχυτικής μάθησης. Στη συνέχεια, παρέχουμε στον αναγνώστη το απαραίτητο θεωρητικό για να κατανοήσει την αναγκαιότητα χρήσης της βαθιάς ενισχυτικής μάθησης. Εξηγούμε τα βασικότερα είδη βαθιάς ενισχυτικής μάθησης. Τέλος, εισάγουμε τον αναγνώστη στις έννοιες της ασύγχρονης ενισχυτικής μάθησης. Στην παρούσα διπλωματική εργασία, βασιζόμενοι στην βιβλιογραφία υλοποιήσαμε και εξετάσαμε τη συμπεριφορά των ασύγχρονων αλγορίθμων asynchronous one step Sarsa, asynchronous one step Q-learning, asynchronous n-step Q-learning, asynchronous advantage Actor-Critic. Επίσης, υλοποιήσαμε και τους αλγορίθμους βαθιάς ενισχυτικής μάθησης DQN, Double DQN, Dueling DQN. ”Τρέξαμε” τα προγράμματα τύπου DQN σε κάρτα γραφικών (GPU),ενώ τους αλγόριθμους ασύγχρονης ενισχυτικής μάθησης σε απλή CPU. Συγκρίναμε τις επιδόσεις όλων των προγραμμάτων ενισχυτικής μάθησης πάνω στο παιχνίδι Cart-pole. | el |
heal.advisorName | Σταφυλοπάτης, Ανδρέας | el |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 102 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: