dc.contributor.author |
Κανιούρας, Χρυσόστομος
|
el |
dc.date.accessioned |
2021-02-09T11:31:52Z |
|
dc.date.available |
2021-02-09T11:31:52Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/52885 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.20583 |
|
dc.rights |
Default License |
|
dc.subject |
Τεχνητή νοημοσύνη |
el |
dc.subject |
Ενισχυτική μάθηση |
el |
dc.subject |
Βαθιά ενισχυτική μάθηση |
el |
dc.subject |
Νευρωνικά δίκτυα |
el |
dc.subject |
DQN |
en |
dc.subject |
Rainbow |
en |
dc.subject |
Policy gradient |
en |
dc.subject |
PPO |
en |
dc.subject |
Transfer learning |
en |
dc.subject |
Video games |
en |
dc.subject |
Sonic retro contest |
en |
dc.subject |
Μηχανική μάθηση |
el |
dc.title |
Εφαρμογή αλγορίθμων ενισχυτικής μάθησης και μεταφορά μάθησης στο sonic the hedgehog |
el |
dc.contributor.department |
Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Τεχνητή Νοημοσύνη |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2020-07-10 |
|
heal.abstract |
Τα τελευταία χρόνια, έχει γίνει εμφανές πως το πεδίο της Ενισχυτικής Μηχανικής Μάθησης μπορεί να επιλύσει προβλήματα υψηλών διαστάσεων δεδομένης καλής συνάρτησης κόστους και απεριόριστου χρόνου να διαδράσει με το περιβάλλον. Ωστόσο , αν και αυτή τα στοιχεία αποτελούν κλειδί στην εκμάθηση των πρακτόρων δεν είναι πρακτικά εφικτά ούτε μοναδικά. Ιδανικά ένας έξυπνος πράκτορας θα είναι σε θέση να γενικεύει μεταξύ καθηκόντων που του ανατίθενται και να χρησιμοποιεί προγενέστερες εμπειρίες προκειμένου να αποκτήσει νέες δυνατότητες πιο γρήγορα.
Στο πλαίσιο αυτής της εργασίας εξετάστηκε η απόδοση των πιο πρόσφατων αλγόριθμων ενισχυτικής μάθησης, Rainbow και PPO, στα video games της σειράς Sonic the Hedgehog και η δυνατότητά τους για μαθησιακή μεταφορά (transfer learning) σε αυτό το περιβάλλον. Δηλαδή να μάθουν να επιλύουν και να κερδίζουν σε περιβάλλοντα που δεν έχουν συναντήσει προηγουμένως εφόσον έχουν εκπαιδευτεί προηγουμένως σε παρόμοια. |
el |
heal.advisorName |
Σταφυλοπάτης, Ανδρέας - Γεώργιος |
el |
heal.committeeMemberName |
Σταφυλοπάτης, Ανδρέας - Γεώργιος |
el |
heal.committeeMemberName |
Στάμου, Γεώργιος |
el |
heal.committeeMemberName |
Κόλλιας, Στέφανος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
83 σ. |
el |
heal.fullTextAvailability |
false |
|