HEAL DSpace

Χρήση βαθιάς ενισχυτικής μάθησης για την επίλυση του Rubik’s Cube

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Σταυρουλάκης, Στυλιανός - Ανδρέας el
dc.contributor.author Stavroulakis, Stylianos - Andreas en
dc.date.accessioned 2020-04-13T13:18:57Z
dc.date.available 2020-04-13T13:18:57Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/50132
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.17830
dc.rights Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-sa/3.0/gr/ *
dc.subject Βαθιά ενισχυτική μάθηση el
dc.subject Αυτοδιδασκόμενη επανάληψη el
dc.subject Αναζήτηση el
dc.subject Μόντε Κάρλο el
dc.subject Νευρωνικά δίκτυα el
dc.subject Κύβος Ρούμπικ el
dc.title Χρήση βαθιάς ενισχυτικής μάθησης για την επίλυση του Rubik’s Cube el
heal.type bachelorThesis
heal.classification Reinforcement learning en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2019-07-12
heal.abstract Ένας από τους κλάδους της μηχανικής μάθησης, ο οποίος παρουσιάζει μεγάλη πρόοδο τα τελευταία χρόνια, είναι η βαθιά ενισχυτική μάθηση. Προγράμματα που στοχεύουν στη μεγιστοποίηση κάποιας σωρευτικής ανταμοιβής αποδεικνύονται ελπιδοφόρα στην προσπάθεια να επεκταθεί το εύρος των επιλύσιμων προβλημάτων μεγάλης πολυπλοκότητας. Ωστόσο, το εκάστοτε περιβάλλον με το οποίο αλληλεπιδρά κάποιος πράκτορας βαθιάς ενισχυτικής μάθησης, ενδέχεται να περιέχει μια ευρύτερη ποικιλία πιθανών σημάτων ανταμοιβής κατά την εκπαίδευση. Ένα παράδειγμα συνδυαστικού προβλήματος με αραιές ανταμοιβές αποτελεί και ο φημισμένος κύβος του Ρούμπικ. Η αντιμετώπιση των αραιών ανταμοιβών καθώς και το γεγονός ότι δεν υπάρχει εγγύηση τερματισμού του προβλήματος, είναι μια από τις μεγαλύτερες προκλήσεις στην βαθιά ενισχυτική μάθηση. Στόχος της διπλωματικής εργασίας είναι η εισαγωγή της έννοιας της εντροπίας του κύβου του Ρούμπικ, και η μερική χρήση του σαν οδηγό από έναν πράκτορα, ο οποίος χρησιμοποιεί έναν αλγόριθμο αυτοδιδασκόμενης επανάληψης κατά την εκπαίδευση του, με απώτερο σκοπό την αποδοτικότερη λύση του κύβου. el
heal.advisorName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Στάμου, Γιώργος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών. Εργαστήριο Ευφυών Επικοινωνιών και Δικτύων Ευρείας Ζώνης el
heal.academicPublisherID ntua
heal.numberOfPages 97 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα