HEAL DSpace

Τεχνικές επιβλεπόμενης και ενισχυτικής μάθησης στο παιχνίδι checkers

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Θεοδοσίου, Ιωάννης el
dc.contributor.author Theodosiou, Ioannis en
dc.date.accessioned 2021-07-15T11:10:14Z
dc.date.available 2021-07-15T11:10:14Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/53630
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.21328
dc.rights Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nd/3.0/gr/ *
dc.subject Επιβλεπόμενη μάθηση el
dc.subject Ενισχυτική μάθηση el
dc.subject Βαθιά ενισχυτική μάθηση el
dc.subject Τεχνητά νευρωνικά δίκτυα el
dc.subject Αλγόριθμοι αναζήτησης δέντρου el
dc.subject Reinforcement learning en
dc.subject Supervised learning en
dc.subject Deep reinforcement learning en
dc.subject Artificial neural networks en
dc.subject Tree search algorithms en
dc.title Τεχνικές επιβλεπόμενης και ενισχυτικής μάθησης στο παιχνίδι checkers el
heal.type bachelorThesis
heal.classification Τεχνητή Νοημοσύνη el
heal.classification Μηχανική Μάθηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-05-26
heal.abstract Τα τελευταία χρόνια έχει γίνει εμφανές ότι η μηχανική και η ενισχυτική μάθηση αποτελούν ισχυρό τρόπο αντιμετώπισης παιχνιδιών ανάμεσα σε δύο παίκτες και γενικότερα περιβάλλοντα στα οποία υπάρχει εναλλαγή κινήσεων και η πλεονεκτική θέση του ενός φέρνει σε μειονεκτική θέση τον άλλο. Συγκεκριμένα το 2016 έχουμε ίσως ένα από τα μεγαλύτερα επιτεύγματα στον χώρο της επιστήμης των υπολογιστών όταν μηχανή σχεδιασμένη από τη DeepMind της Google κατάφερε για πρώτη φορά να νικήσει σε μία σειρά αγώνων Go τον νυν παγκόσμιο πρωταθλητή. Κάτι τέτοιο θεωρούνταν από πολλούς ακατόρθωτο μέσω κλασικών τεχνικών Τεχνητής νοημοσύνης κυρίως λόγω της αχανής φύσης του παιχνιδιού με περισσότερες από 10^172 διαφορετικές θέσεις, περισσότερες δηλαδή από όσα είναι τα άτομα στο σύμπαν. Σκοπός της παρούσας εργασίας είναι η μελέτη των αλγορίθμων μάθησης, επιβλεπόμενης και ενισχυτικής, πάνω στο παιχνίδι checkers ,γνωστό και ως ντάμα, το οποίο αν και απλούστερο, με 10^20 θέσεις παρουσιάζει μεγάλο υπολογιστικό ενδιαφέρον. el
heal.advisorName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 105 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα