HEAL DSpace

Reinforcement Learning για μη γραμμικό έλεγχο σε παίγνια με διακριτό σύνολο δράσεων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κορδαλής, Δημήτριος el
dc.contributor.author Λάμπος-Κοραλής, Παναγιώτης el
dc.contributor.author Kordalis, Dimitrios en
dc.contributor.author Lampos-Koralis, Panagiotis en
dc.date.accessioned 2022-06-14T08:45:00Z
dc.date.available 2022-06-14T08:45:00Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/55270
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22968
dc.rights Default License
dc.subject Βαθιά νευρωνικά δίκτυα el
dc.subject Ενισχυτική μάθηση el
dc.subject Διαδικασία απόφασης Markov el
dc.subject Μη γραμμικός έλεγχος el
dc.subject Βαθιά μάθηση el
dc.subject Deep neural networks en
dc.subject Reinforcement learning en
dc.subject Markov decision processes en
dc.subject Nonlinear control en
dc.subject Deep learning en
dc.title Reinforcement Learning για μη γραμμικό έλεγχο σε παίγνια με διακριτό σύνολο δράσεων el
dc.title Reinforcement Learning for non-linear control in games with a distinct set of actions en
heal.type bachelorThesis
heal.classification Machine learning en
heal.language el
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2022-02-18
heal.abstract Η παρούσα διατριβή αντιμετωπίζει την αλληλεπίδραση της Ενισχυτικής Μάθησης και των βαθιών νευρωνικών δικτύων για διακριτό μη γραμμικό έλεγχο για περιβάλλοντα ελέγχου αναφοράς. Η Ενισχυτική Μάθηση αποτελεί το μαθηματικό πλαίσιο για την αντιμετώπιση διαδοχικών προβλημάτων λήψης αποφάσεων όπου δεν υπάρχει άμεση συνεκτίμηση της υποκείμενης δυναμικής. Ειδικότερα, στην Ενισχυτική Μάθηση, το πρόβλημα ελέγχου διατυπώνεται ως Διαδικασία Απόφασης Markov και στόχος είναι η μάθηση μιας συνάρτησης Q που ποσοτικοποιεί το αναμενόμενο άθροισμα των ανταμοιβών που δίνεται σε μια πολιτική δράσης. Οι ισχυρές δυνατότητες αναπαράστασης των βαθιών νευρωνικών δικτύων, σε συνδυασμό με τις εξελίξεις του υλικού τα τελευταία χρόνια, επέτρεψαν στις έννοιες της Ενισχυτικής Μάθησης να προκύψουν ως τα κατάλληλα παραδείγματα για την επίλυση προβλημάτων λήψης αποφάσεων μεγάλης κλίμακας. Ως εκ τούτου, σε αυτή τη διατριβή, εξετάζουμε την απόδοση των σύγχρονων αλγορίθμων βαθιάς μάθησης ενίσχυσης σε μερικά από τα πιο παραγωγικά μη γραμμικά περιβάλλοντα ελέγχου. el
heal.abstract The present thesis copes with the interplay of Reinforcement learning anddeep neural networks for discrete non-linear control for benchmark controlenvironments. Reinforcement Learning constitutes the mathematicalframework for tackling sequential decision-making problems where there is nodirect consideration for the underlying dynamics. In particular, inReinforcement Learning, the control problem is formulated as a MarkovDecision Process and the goal is to learn a function Q that quantifies theexpected sum of rewards given a policy for action. The powerfulrepresentation capabilities of deep neural networks, in conjunction with thehardware developments during the recent years has enabled theReinforcement Learning concepts to arise as the appropriate paradigms forsolving large-scale decision-making problems. Therefore, in this thesis, weexamine the performance of the current state-of-the-art deep ReinforcementLearning algorithms in some of the most prolific non-linear controlenvironments. en
heal.advisorName Αδαμοπούλου, Ευγενία el
heal.advisorName Δεμέστιχας, Κωνσταντίνος el
heal.advisorName Συκάς, Ευστάθιος el
heal.advisorName Ρουσσάκη, Ιωάννα el
heal.committeeMemberName Δεμέστιχας, Κωνσταντίνος el
heal.committeeMemberName Συκάς, Ευστάθιος el
heal.committeeMemberName Ρουσσάκη, Ιωάννα el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής el
heal.academicPublisherID ntua
heal.numberOfPages 61 σ. el
heal.fullTextAvailability false
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής