dc.contributor.author | Θεοδοσίου, Ιωάννης | el |
dc.contributor.author | Theodosiou, Ioannis | en |
dc.date.accessioned | 2021-07-15T11:10:14Z | |
dc.date.available | 2021-07-15T11:10:14Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/53630 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.21328 | |
dc.rights | Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nd/3.0/gr/ | * |
dc.subject | Επιβλεπόμενη μάθηση | el |
dc.subject | Ενισχυτική μάθηση | el |
dc.subject | Βαθιά ενισχυτική μάθηση | el |
dc.subject | Τεχνητά νευρωνικά δίκτυα | el |
dc.subject | Αλγόριθμοι αναζήτησης δέντρου | el |
dc.subject | Reinforcement learning | en |
dc.subject | Supervised learning | en |
dc.subject | Deep reinforcement learning | en |
dc.subject | Artificial neural networks | en |
dc.subject | Tree search algorithms | en |
dc.title | Τεχνικές επιβλεπόμενης και ενισχυτικής μάθησης στο παιχνίδι checkers | el |
heal.type | bachelorThesis | |
heal.classification | Τεχνητή Νοημοσύνη | el |
heal.classification | Μηχανική Μάθηση | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2021-05-26 | |
heal.abstract | Τα τελευταία χρόνια έχει γίνει εμφανές ότι η μηχανική και η ενισχυτική μάθηση αποτελούν ισχυρό τρόπο αντιμετώπισης παιχνιδιών ανάμεσα σε δύο παίκτες και γενικότερα περιβάλλοντα στα οποία υπάρχει εναλλαγή κινήσεων και η πλεονεκτική θέση του ενός φέρνει σε μειονεκτική θέση τον άλλο. Συγκεκριμένα το 2016 έχουμε ίσως ένα από τα μεγαλύτερα επιτεύγματα στον χώρο της επιστήμης των υπολογιστών όταν μηχανή σχεδιασμένη από τη DeepMind της Google κατάφερε για πρώτη φορά να νικήσει σε μία σειρά αγώνων Go τον νυν παγκόσμιο πρωταθλητή. Κάτι τέτοιο θεωρούνταν από πολλούς ακατόρθωτο μέσω κλασικών τεχνικών Τεχνητής νοημοσύνης κυρίως λόγω της αχανής φύσης του παιχνιδιού με περισσότερες από 10^172 διαφορετικές θέσεις, περισσότερες δηλαδή από όσα είναι τα άτομα στο σύμπαν. Σκοπός της παρούσας εργασίας είναι η μελέτη των αλγορίθμων μάθησης, επιβλεπόμενης και ενισχυτικής, πάνω στο παιχνίδι checkers ,γνωστό και ως ντάμα, το οποίο αν και απλούστερο, με 10^20 θέσεις παρουσιάζει μεγάλο υπολογιστικό ενδιαφέρον. | el |
heal.advisorName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 105 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: