HEAL DSpace

Εφαρμογή αλγορίθμων ενισχυτικής μάθησης και μεταφορά μάθησης στο sonic the hedgehog

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κανιούρας, Χρυσόστομος el
dc.date.accessioned 2021-02-09T11:31:52Z
dc.date.available 2021-02-09T11:31:52Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/52885
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.20583
dc.rights Default License
dc.subject Τεχνητή νοημοσύνη el
dc.subject Ενισχυτική μάθηση el
dc.subject Βαθιά ενισχυτική μάθηση el
dc.subject Νευρωνικά δίκτυα el
dc.subject DQN en
dc.subject Rainbow en
dc.subject Policy gradient en
dc.subject PPO en
dc.subject Transfer learning en
dc.subject Video games en
dc.subject Sonic retro contest en
dc.subject Μηχανική μάθηση el
dc.title Εφαρμογή αλγορίθμων ενισχυτικής μάθησης και μεταφορά μάθησης στο sonic the hedgehog el
dc.contributor.department Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.type bachelorThesis
heal.classification Τεχνητή Νοημοσύνη el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2020-07-10
heal.abstract Τα τελευταία χρόνια, έχει γίνει εμφανές πως το πεδίο της Ενισχυτικής Μηχανικής Μάθησης μπορεί να επιλύσει προβλήματα υψηλών διαστάσεων δεδομένης καλής συνάρτησης κόστους και απεριόριστου χρόνου να διαδράσει με το περιβάλλον. Ωστόσο , αν και αυτή τα στοιχεία αποτελούν κλειδί στην εκμάθηση των πρακτόρων δεν είναι πρακτικά εφικτά ούτε μοναδικά. Ιδανικά ένας έξυπνος πράκτορας θα είναι σε θέση να γενικεύει μεταξύ καθηκόντων που του ανατίθενται και να χρησιμοποιεί προγενέστερες εμπειρίες προκειμένου να αποκτήσει νέες δυνατότητες πιο γρήγορα. Στο πλαίσιο αυτής της εργασίας εξετάστηκε η απόδοση των πιο πρόσφατων αλγόριθμων ενισχυτικής μάθησης, Rainbow και PPO, στα video games της σειράς Sonic the Hedgehog και η δυνατότητά τους για μαθησιακή μεταφορά (transfer learning) σε αυτό το περιβάλλον. Δηλαδή να μάθουν να επιλύουν και να κερδίζουν σε περιβάλλοντα που δεν έχουν συναντήσει προηγουμένως εφόσον έχουν εκπαιδευτεί προηγουμένως σε παρόμοια. el
heal.advisorName Σταφυλοπάτης, Ανδρέας - Γεώργιος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας - Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 83 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής