Η παρούσα διπλωματική εργασία εξετάζει την υπολογιστική μοντελοποίηση της συμπεριφοράς των παραγωγών ηλεκτρικής ενέργειας σε ανταγωνιστικό περιβάλλον, μέσω μεθόδων ενισχυτικής μάθησης και συγκεκριμένα μέσω του τροποποιημένου αλγορίθμου των Roth & Erev. Αρχικά γίνεται αναφορά στη σημασία αλλά και στις προκλήσεις που έχει η μοντελοποίηση της αγοράς ηλεκτρικής ενέργειας και επισημαίνονται τα βασικά χαρακτηριστικά της ελληνικής αγοράς: ο Ημερήσιος Ενεργειακός Προγραμματισμός (ΗΕΠ) και η Οριακή Τιμή Συστήματος (ΟΤΣ). Εν συνεχεία, περιγράφεται η έννοια της μάθησης στις υπολογιστικές μηχανές, ορίζονται οι απαιτούμενες έννοιες και αναφέρονται επιγραμματικά οι τρεις βασικοί τύποι της. Ακολουθεί πλήρης παρουσίαση των μεθόδων ενισχυτικής μάθησης, τόσο με το απαράιτητο θεωρητικό υπόβαθρο, όσο και με το αντίστοιχο μαθηματικό τους μοντέλο. Έπειτα, γίνεται παρουσίαση του αρχικού αλγορίθμου των Roth και Erev (RE αλγόριθμος), αλλά και του αντίστοιχου τροποποιημένου αλγορίθμου (MRE), που αποτελεί βελτίωση του αρχικού. Παράλληλα, τονίζονται οι λόγοι για τους οποίους οι δυο αλγόριθμοι προτιμώνται για την επιλύση του προβλήματος της μοντελοποίησης της συμπεριφοράς των παραγωγών ηλεκτρικής ενέργειας και γίνεται η απαραίτητη προσαρμογή τους στο εν λόγω πρόβλημα. Τέλος, δίδεται ο κώδικας των RE και MRE αλγορίθμων στη γλώσσα προγραμματισμού Python.
This thesis examines the computational modeling of producers’ behavior in a competitive electricity market, throughout methods of reinforcement learning and particularly, using the Modified Roth Erev algorithm. At first, the importance and the challenges of modeling the electricity market are mentioned. Also, the basic traits of Greek electricity market, the Day Ahead Schedule (DAS) and the System Marginal Price (SMP) are presented. Later on, the definition of Learning in computational machines is given and its basic three types are briefly described. The full presentation of the reinforcement learning methods, along with their theoretical and mathematical background follows. Moreover, both Roth Erev (RE) and Modified Roth Erev (MRE) algorithms are described and analysed and the reasons for which these two algorithms are used for modeling the strategy of day-ahead electricity market are given. Finally, the implementation of the two algorithms into Python source code is presented.