dc.contributor.author |
Κορδαλής, Δημήτριος
|
el |
dc.contributor.author |
Λάμπος-Κοραλής, Παναγιώτης
|
el |
dc.contributor.author |
Kordalis, Dimitrios
|
en |
dc.contributor.author |
Lampos-Koralis, Panagiotis
|
en |
dc.date.accessioned |
2022-06-14T08:45:00Z |
|
dc.date.available |
2022-06-14T08:45:00Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/55270 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.22968 |
|
dc.rights |
Default License |
|
dc.subject |
Βαθιά νευρωνικά δίκτυα |
el |
dc.subject |
Ενισχυτική μάθηση |
el |
dc.subject |
Διαδικασία απόφασης Markov |
el |
dc.subject |
Μη γραμμικός έλεγχος |
el |
dc.subject |
Βαθιά μάθηση |
el |
dc.subject |
Deep neural networks |
en |
dc.subject |
Reinforcement learning |
en |
dc.subject |
Markov decision processes |
en |
dc.subject |
Nonlinear control |
en |
dc.subject |
Deep learning |
en |
dc.title |
Reinforcement Learning για μη γραμμικό έλεγχο σε παίγνια με διακριτό σύνολο δράσεων |
el |
dc.title |
Reinforcement Learning for non-linear control in games with a distinct set of actions |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Machine learning |
en |
heal.language |
el |
|
heal.access |
campus |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2022-02-18 |
|
heal.abstract |
Η παρούσα διατριβή αντιμετωπίζει την αλληλεπίδραση της Ενισχυτικής Μάθησης και των βαθιών νευρωνικών δικτύων για διακριτό μη γραμμικό έλεγχο για περιβάλλοντα ελέγχου αναφοράς.
Η Ενισχυτική Μάθηση αποτελεί το μαθηματικό πλαίσιο για την
αντιμετώπιση διαδοχικών προβλημάτων λήψης αποφάσεων όπου
δεν υπάρχει άμεση συνεκτίμηση της υποκείμενης δυναμικής.
Ειδικότερα, στην Ενισχυτική Μάθηση, το πρόβλημα ελέγχου
διατυπώνεται ως Διαδικασία Απόφασης Markov και στόχος είναι η
μάθηση μιας συνάρτησης Q που ποσοτικοποιεί το αναμενόμενο
άθροισμα των ανταμοιβών που δίνεται σε μια πολιτική δράσης. Οι
ισχυρές δυνατότητες αναπαράστασης των βαθιών νευρωνικών
δικτύων, σε συνδυασμό με τις εξελίξεις του υλικού τα τελευταία
χρόνια, επέτρεψαν στις έννοιες της Ενισχυτικής Μάθησης να
προκύψουν ως τα κατάλληλα παραδείγματα για την επίλυση
προβλημάτων λήψης αποφάσεων μεγάλης κλίμακας. Ως εκ τούτου, σε αυτή τη διατριβή, εξετάζουμε την απόδοση των σύγχρονων αλγορίθμων βαθιάς μάθησης ενίσχυσης σε μερικά από τα πιο παραγωγικά μη γραμμικά περιβάλλοντα ελέγχου. |
el |
heal.abstract |
The present thesis copes with the interplay of Reinforcement learning anddeep neural networks for discrete non-linear control for benchmark controlenvironments. Reinforcement Learning constitutes the mathematicalframework for tackling sequential decision-making problems where there is nodirect consideration for the underlying dynamics. In particular, inReinforcement Learning, the control problem is formulated as a MarkovDecision Process and the goal is to learn a function Q that quantifies theexpected sum of rewards given a policy for action. The powerfulrepresentation capabilities of deep neural networks, in conjunction with thehardware developments during the recent years has enabled theReinforcement Learning concepts to arise as the appropriate paradigms forsolving large-scale decision-making problems. Therefore, in this thesis, weexamine the performance of the current state-of-the-art deep ReinforcementLearning algorithms in some of the most prolific non-linear controlenvironments. |
en |
heal.advisorName |
Αδαμοπούλου, Ευγενία |
el |
heal.advisorName |
Δεμέστιχας, Κωνσταντίνος |
el |
heal.advisorName |
Συκάς, Ευστάθιος |
el |
heal.advisorName |
Ρουσσάκη, Ιωάννα |
el |
heal.committeeMemberName |
Δεμέστιχας, Κωνσταντίνος |
el |
heal.committeeMemberName |
Συκάς, Ευστάθιος |
el |
heal.committeeMemberName |
Ρουσσάκη, Ιωάννα |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
61 σ. |
el |
heal.fullTextAvailability |
false |
|
heal.fullTextAvailability |
false |
|