HEAL DSpace

Μελέτη ασύγχρονων μεθόδων βαθιάς ενισχυτικής μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Τσιατσιάνης, Γεώργιος Χρήστος el
dc.contributor.author Tsiatsianis, Georgios Christos en
dc.date.accessioned 2022-11-10T10:23:13Z
dc.date.available 2022-11-10T10:23:13Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56118
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.23816
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Μαθηματική Προτυποποίηση σε Σύγχρονες Τεχνολογίες και στα Χρηματοοικονομικά” el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Βαθιά ενισχυτική μάθηση el
dc.subject Υλοποίηση el
dc.subject Ανάλυση el
dc.subject Implementation en
dc.subject Deep reinforcement learning en
dc.subject Analysis en
dc.title Μελέτη ασύγχρονων μεθόδων βαθιάς ενισχυτικής μάθησης el
dc.title Asynchronous methods for deep reinforcement learning en
heal.type masterThesis
heal.classification Τενχητή νοημοσύνη,Αλγόριθμοι, Μαθηματικά el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-09-23
heal.abstract Η βαθιά ενιχσυτική μάθηση αποτελεί ένα από τα πιο υποσχόμενα πεδία της μηχανικής μάθησης. Φαίνεται να επιλυεί αποδοτικά ένα ευρύ φάσμα προβλημάτων. Η ασυγχρονη ενισχυτική μάθηση αποτελεί εξέλιξη στο συγκεκριμένο τομέα. Επιχειρεί να επιλύσει τα προβλήματα ταχύτερα αποδοτικότερα και εξερευνώντας το περιβάλλον μάθησης του πράκτορα πολύ καλύτερα και παρέχοντας μεγαλύτερη ευστάθεια στο σύστημα. Στα πρώτα κεφάλαια της παρούσας διπλωματικής εργασίας, εισάγουμε με αναλυτιή μεθοδολογία τον αναγνώστη πάνω στις έννοιες της ενισχυτικής μάθησης. Στη συνέχεια, παρέχουμε στον αναγνώστη το απαραίτητο θεωρητικό για να κατανοήσει την αναγκαιότητα χρήσης της βαθιάς ενισχυτικής μάθησης. Εξηγούμε τα βασικότερα είδη βαθιάς ενισχυτικής μάθησης. Τέλος, εισάγουμε τον αναγνώστη στις έννοιες της ασύγχρονης ενισχυτικής μάθησης. Στην παρούσα διπλωματική εργασία, βασιζόμενοι στην βιβλιογραφία υλοποιήσαμε και εξετάσαμε τη συμπεριφορά των ασύγχρονων αλγορίθμων asynchronous one step Sarsa, asynchronous one step Q-learning, asynchronous n-step Q-learning, asynchronous advantage Actor-Critic. Επίσης, υλοποιήσαμε και τους αλγορίθμους βαθιάς ενισχυτικής μάθησης DQN, Double DQN, Dueling DQN. ”Τρέξαμε” τα προγράμματα τύπου DQN σε κάρτα γραφικών (GPU),ενώ τους αλγόριθμους ασύγχρονης ενισχυτικής μάθησης σε απλή CPU. Συγκρίναμε τις επιδόσεις όλων των προγραμμάτων ενισχυτικής μάθησης πάνω στο παιχνίδι Cart-pole. el
heal.advisorName Σταφυλοπάτης, Ανδρέας el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.numberOfPages 102 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα