HEAL DSpace

Θεωρία παιγνίων και βελτιστοποίησης για μελέτη ενεργειακών αγορών και υποστήριξη αποφάσεων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Χρυσανθόπουλος, Νικόλαος Χ. el
dc.contributor.author Chrysanthopoulos, Nikolaos C. en
dc.date.accessioned 2020-03-05T09:28:31Z
dc.date.available 2020-03-05T09:28:31Z
dc.date.issued 2020-03-05
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/49859
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.17557
dc.description.abstract Η θεωρία παιγνίων προσφέρει πλειάδα εργαλείων για την περιγραφή και την μελέτη της αλληλεπίδρασης των οικονομικών οντοτήτων που συμμετέχουν στις αγορές, επιδιώκοντας την εξυπηρέτηση, συνήθως, διαφορετικών συμφερόντων. Η διαθέσιμη πληροφόρηση, ο αριθμός και το μέγεθος των συμμετεχόντων, οι εξωτερικότητες που σχετίζονται με τα δίκτυα μεταφοράς είναι μερικοί μόνο από τους παράγοντες που επηρεάζουν το επίπεδο ανταγωνισμού μιας αγοράς. Η ατελής πληροφόρηση αποτελεί και βασικό στοιχείο του πρώτου υποδείγματος που εξετάζεται, το οποίο βασίζεται στον ανταγωνισμό μέσω της επιλογής ποσοτήτων. Σε ένα πλαίσιο επαναλαμβανόμενης αλληλεπίδρασης, οι επιχειρήσεις επιλέγουν τις ποσότητες που παράγουν ή/και διοχετεύουν στην αγορά χωρίς να έχουν γνώση σχετικά με την επιλογή του αντιπάλου. Στην προσπάθεια εκτίμησης αυτής, ένας κανόνας προσαρμογής που εξασφαλίζει τη σύγκληση στην ισορροπία υιοθετείται συμμετρικά με τις μυωπικές βέλτιστες αποκρίσεις να οδηγούν στο σταθερό σημείο. Λόγω της μη κοινά γνωστής παραμέτρου, του οριακού κόστους, που παραμένει ιδιωτική καθ ́ όλη τη διάρκεια του παιγνίου, οι παίχτες μπορούν να επιλέξουν αν θα συμπεριφερθούν βάση του πραγματικού κόστους τους ή αν θα αποκρίνονται σαν να είχαν διαφορετική τιμή της ιδιωτικής παραμέτρου με στόχο την προς όφελός τους μετατόπιση της ισορροπίας. Η συμπεριφορική προσποίηση αποτελεί κυρίαρχη στρατηγική, γεγονός που ενισχύεται περαιτέρω στα πλαίσια μια αγοράς που συνδέει στοχαστικά την εξέλιξη του κόστους των επιχειρήσεων με την κερδοφορία τους. Η κύρια δυσκολία που συναντάται κατά τη γενίκευση των αποτελεσμάτων αυτών, σε πιο ανταγωνιστικές αγορές, έγκειται στο γεγονός ότι η υιοθετηθείσα διαδικασία αναπροσαρμογής είναι ευσταθής μόνο στα πλαίσια του δυοπωλίου. Αντί της χρήσης λογικών όπως εκείνων της «ταχύτητας αναπροσαρμογής», προτείνονται κανόνες προερχόμενοι από την οικογένεια των Κινούμενων Μέσων, γνωστοί για τις εξαιρετικές ιδιότητες εξομάλυνσης που κατέχουν. Χρησιμοποιώντας τον κανόνας σταθερού μεγέθους μνήμης με ομοιόμορφη στάθμιση, προσδιορίζεται ο ακριβής αριθμός υστερήσεων, βάση του αριθμού των παιχτών, ώστε το παίγνιο να συγκλίνει. Ο άλλος κύριος κανόνας που προτείνεται, είναι εκείνος του συνεχώς αυξανόμενου μεγέθους μνήμης, ο οποίος ταυτίζεται με το fictitious play. Μαζί με ορισμένους υβριδικούς κανόνες που προκύπτουν από το συνδυασμό των βασικών, όλοι οι κανόνες αναλύονται και συγκρίνονται ως προς την ευστάθεια που δύναται να παρέχουν και την καταλληλότητά τους στα πλαίσια αγορών σταθερού ή αυξανόμενου ανταγωνισμού, καλύπτοντας την απόσταση μεταξύ των δύο προαναφερθέντων προσεγγίσεων της βιβλιογραφίας. Σε ένα πιο εφαρμοσμένο πλαίσιο, η εκμάθηση βέλτιστων στρατηγικών σε περιπτώσεις διαφορετικών επιπέδων πληροφόρησης είναι ένα από τα ζητήματα που πραγματεύεται το μοντέλο στοχαστικού παιγνίου για αγορά ισχύος επόμενης ημέρας. Η ενισχυτική εκμάθηση τύπου R-Learning, μία off-policy μέθοδος, υιοθετείται από τους παίχτες με σκοπό την εξερεύνηση και εκμετάλλευση του συστήματος μέσω της ανάδειξης βέλτιστων πλάνων δράσης. Με την εισαγωγή μιας τεχνικής μετασχηματισμού του χώρου κατάστασης, το μοντέλο μπορεί να προσαρμοστεί σε περιπτώσεις που οι παίχτες προσλαμβάνουν διαφορετικά το διάνυσμα κατάστασης. Το μοντέλο, όπως και ο προτεινόμενος αλγόριθμος, εφαρμόζονται σε περιπτώσεις που διαφοροποιούνται ως προς την τοπολογία του δικτύου ή τον αριθμό των επιχειρήσεων που εκμεταλλεύονται τις μονάδες παραγωγής και σε σενάρια αξιοποίησης διαφορετικών συνόλων πληροφορίας. Μέσω παραλλαγών ζήτησης, προϊόν επεξεργασίας πραγματικών δεδομένων εξετάζονται οι επιπτώσεις που διάφοροι κρίσιμοι παράγοντες επιφέρουν στα οικονομικά αποτελέσματα και στην αποδοτικότητα της αγοράς. Τέλος, το σύνολο της ανάλυσης καταδεικνύει διάφορες εξαιρετικά σημαντικές πτυχές της σχέσης μεταξύ ατελούς πληροφόρησης, εξωγενών παραγόντων και του επιπέδου ανταγωνισμού, αποδίδοντας, ταυτόχρονα, έμφαση στα ποιοτικά χαρακτηριστικά που πρέπει να διασφαλίζονται κατά τον αποδοτικό σχεδιασμό τέτοιων αγορών. el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Ολιγοπώλιο Cournot el
dc.subject Cournot Oligopoly en
dc.subject Προσποίηση el
dc.subject Pretending en
dc.subject Επίπεδα ανταγωνισμού el
dc.subject Competition levels en
dc.subject Στοχαστικό παίγνιο el
dc.subject Stochastic game en
dc.subject Αγορά ισχύος el
dc.subject Power Market en
dc.title Θεωρία παιγνίων και βελτιστοποίησης για μελέτη ενεργειακών αγορών και υποστήριξη αποφάσεων el
dc.title Game theory and optimisation for studying energy markers and supporting decision making en
dc.contributor.department Τομέας Σημάτων, Ελέγχου & Ρομποτικής el
heal.type doctoralThesis
heal.classification Θεωρία Παιγνίων el
heal.classification Game Theory en
heal.classification Ενεργειακές Αγορές el
heal.classification Energy Markets en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2019-10-29
heal.abstract Η θεωρία παιγνίων προσφέρει πλειάδα εργαλείων για την περιγραφή και την μελέτη της αλληλεπίδρασης των οικονομικών οντοτήτων που συμμετέχουν στις αγορές, επιδιώκοντας την εξυπηρέτηση, συνήθως, διαφορετικών συμφερόντων. Η διαθέσιμη πληροφόρηση, ο αριθμός και το μέγεθος των συμμετεχόντων, οι εξωτερικότητες που σχετίζονται με τα δίκτυα μεταφοράς είναι μερικοί μόνο από τους παράγοντες που επηρεάζουν το επίπεδο ανταγωνισμού μιας αγοράς. Η ατελής πληροφόρηση αποτελεί και βασικό στοιχείο του πρώτου υποδείγματος που εξετάζεται, το οποίο βασίζεται στον ανταγωνισμό μέσω της επιλογής ποσοτήτων. Σε ένα πλαίσιο επαναλαμβανόμενης αλληλεπίδρασης, οι επιχειρήσεις επιλέγουν τις ποσότητες που παράγουν ή/και διοχετεύουν στην αγορά χωρίς να έχουν γνώση σχετικά με την επιλογή του αντιπάλου. Στην προσπάθεια εκτίμησης αυτής, ένας κανόνας προσαρμογής που εξασφαλίζει τη σύγκληση στην ισορροπία υιοθετείται συμμετρικά με τις μυωπικές βέλτιστες αποκρίσεις να οδηγούν στο σταθερό σημείο. Λόγω της μη κοινά γνωστής παραμέτρου, του οριακού κόστους, που παραμένει ιδιωτική καθ ́ όλη τη διάρκεια του παιγνίου, οι παίχτες μπορούν να επιλέξουν αν θα συμπεριφερθούν βάση του πραγματικού κόστους τους ή αν θα αποκρίνονται σαν να είχαν διαφορετική τιμή της ιδιωτικής παραμέτρου με στόχο την προς όφελός τους μετατόπιση της ισορροπίας. Η συμπεριφορική προσποίηση αποτελεί κυρίαρχη στρατηγική, γεγονός που ενισχύεται περαιτέρω στα πλαίσια μια αγοράς που συνδέει στοχαστικά την εξέλιξη του κόστους των επιχειρήσεων με την κερδοφορία τους. Η κύρια δυσκολία που συναντάται κατά τη γενίκευση των αποτελεσμάτων αυτών, σε πιο ανταγωνιστικές αγορές, έγκειται στο γεγονός ότι η υιοθετηθείσα διαδικασία αναπροσαρμογής είναι ευσταθής μόνο στα πλαίσια του δυοπωλίου. Αντί της χρήσης λογικών όπως εκείνων της «ταχύτητας αναπροσαρμογής», προτείνονται κανόνες προερχόμενοι από την οικογένεια των Κινούμενων Μέσων, γνωστοί για τις εξαιρετικές ιδιότητες εξομάλυνσης που κατέχουν. Χρησιμοποιώντας τον κανόνας σταθερού μεγέθους μνήμης με ομοιόμορφη στάθμιση, προσδιορίζεται ο ακριβής αριθμός υστερήσεων, βάση του αριθμού των παιχτών, ώστε το παίγνιο να συγκλίνει. Ο άλλος κύριος κανόνας που προτείνεται, είναι εκείνος του συνεχώς αυξανόμενου μεγέθους μνήμης, ο οποίος ταυτίζεται με το fictitious play. Μαζί με ορισμένους υβριδικούς κανόνες που προκύπτουν από το συνδυασμό των βασικών, όλοι οι κανόνες αναλύονται και συγκρίνονται ως προς την ευστάθεια που δύναται να παρέχουν και την καταλληλότητά τους στα πλαίσια αγορών σταθερού ή αυξανόμενου ανταγωνισμού, καλύπτοντας την απόσταση μεταξύ των δύο προαναφερθέντων προσεγγίσεων της βιβλιογραφίας. Σε ένα πιο εφαρμοσμένο πλαίσιο, η εκμάθηση βέλτιστων στρατηγικών σε περιπτώσεις διαφορετικών επιπέδων πληροφόρησης είναι ένα από τα ζητήματα που πραγματεύεται το μοντέλο στοχαστικού παιγνίου για αγορά ισχύος επόμενης ημέρας. Η ενισχυτική εκμάθηση τύπου R-Learning, μία off-policy μέθοδος, υιοθετείται από τους παίχτες με σκοπό την εξερεύνηση και εκμετάλλευση του συστήματος μέσω της ανάδειξης βέλτιστων πλάνων δράσης. Με την εισαγωγή μιας τεχνικής μετασχηματισμού του χώρου κατάστασης, το μοντέλο μπορεί να προσαρμοστεί σε περιπτώσεις που οι παίχτες προσλαμβάνουν διαφορετικά το διάνυσμα κατάστασης. Το μοντέλο, όπως και ο προτεινόμενος αλγόριθμος, εφαρμόζονται σε περιπτώσεις που διαφοροποιούνται ως προς την τοπολογία του δικτύου ή τον αριθμό των επιχειρήσεων που εκμεταλλεύονται τις μονάδες παραγωγής και σε σενάρια αξιοποίησης διαφορετικών συνόλων πληροφορίας. Μέσω παραλλαγών ζήτησης, προϊόν επεξεργασίας πραγματικών δεδομένων εξετάζονται οι επιπτώσεις που διάφοροι κρίσιμοι παράγοντες επιφέρουν στα οικονομικά αποτελέσματα και στην αποδοτικότητα της αγοράς. Τέλος, το σύνολο της ανάλυσης καταδεικνύει διάφορες εξαιρετικά σημαντικές πτυχές της σχέσης μεταξύ ατελούς πληροφόρησης, εξωγενών παραγόντων και του επιπέδου ανταγωνισμού, αποδίδοντας, ταυτόχρονα, έμφαση στα ποιοτικά χαρακτηριστικά που πρέπει να διασφαλίζονται κατά τον αποδοτικό σχεδιασμό τέτοιων αγορών. el
heal.abstract Game theory offers a variety of tools for the description and study of the interaction of market participants, which usually seek to serve different interests. The information available, the number and size of firms, the externalities associated with the transmission networks are just some of the factors that influence the level of competition of a market. Incomplete information has been an important element of the first model considered, which is based on competition over quantities. In a framework of repeated interaction, firms select their production level without knowing about their rival’s choice. In an effort to estimate their rival’s output, an adaptive rule that ensures convergence is adopted symmetrically and the myopic best responses lead firms to the fixed point. Due to the private parameter, the marginal cost, which remains unknown throughout the game, players are allowed to choose whether to behave on the basis of their actual cost or as if they had a different value of the private parameter, aiming to shift the equilibrium on their benefit. Behavioural pretending is shown to be a dominant strategy, a fact that is further enhanced in the context of a market, where the evolution of the actual marginal costs is linked to the firm’s past profitability. The main difficulty in extending such a model in more competitive oligopolies is due to the adaptive rule adopted by firms. As it is well known in the related literature, the so-called Cournot adjustment process, fails to result convergence in more competitive structures than that of a duopoly. Instead of following the “speed of adjustment” approach, where the intense of adaptation is controlled through a parameter, we introduce rules based on the family of Moving Averages, which are well known for their smoothing properties. By considering a rule of fixed memory window, under a uniform weighting scheme, we identify the exact number of past observations required for the game to converge, based on the number of players. The other main rule examined extensively, is a rule of constantly increasing memory window, which is also known as fictitious play in the literature. Along with some hybrid versions resulted by their combination, all rules are examined for their convergent properties and their suitability in markets of fixed or increasing competition, with the analysis to be filling the gap between those two distinct approaches found in the literature. In a more application-driven framework, a stochastic game model for a day-ahead power market is also considered along with the capability of learning in the identification of the optimal strategies under different levels of information. R-Learning, an off-policy, reinforcement learning method, is adopted by the players to explore and exploit the system, for the formation of optimal action plans. The incomplete information is incorporated into the model through a state space transformation, a technique utilised for the model’s adjustment in cases where the players perceive differently the state vector. This model, as well as the proposed algorithm, are applied mostly in cases where the network’s topology and the number of firms operating the production units vary or in scenarios of exploiting different sets of information, with main goal the identification of market power. Several versions of demand, which have been developed by tackling real data, are used for the identification of the qualitative effects that some of the most critical factors may have in the market’s outcome and in its efficiency. Finally, all the analysis aims to highlight the strong connections that exist between incomplete information, externalities and the competition level, while at the same time emphasises on the qualitative characteristics that the efficient market design should possess. en
heal.advisorName Παπαβασιλόπουλος, Γεώργιος Π. el
heal.advisorName Papavassilopoulos, George P. en
heal.committeeMemberName Μαραγκός, Πέτρος el
heal.committeeMemberName Ψαρράς, Ιωάννης el
heal.committeeMemberName Δούκας, Χρυσόστομος el
heal.committeeMemberName Χαλικιάς, Γεώργιος el
heal.committeeMemberName Γάτσιος, Κωνσταντίνος el
heal.committeeMemberName Ασκούνης, Δημήτριος el
heal.committeeMemberName Μέντζας, Γρηγόριος el
heal.committeeMemberName Maragos, Petros en
heal.committeeMemberName Psarras, John en
heal.committeeMemberName Doukas, Haris en
heal.committeeMemberName Halikias, George en
heal.committeeMemberName Askounis, Dimitrios en
heal.committeeMemberName Gatsios, Konstantine en
heal.committeeMemberName Mentzas, Gregoris en
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 130
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα