Abstract:
Η θεωρία παιγνίων προσφέρει πλειάδα εργαλείων για την περιγραφή και την μελέτη της αλληλεπίδρασης των οικονομικών οντοτήτων που συμμετέχουν στις αγορές, επιδιώκοντας την εξυπηρέτηση, συνήθως, διαφορετικών συμφερόντων. Η διαθέσιμη πληροφόρηση, ο αριθμός και το μέγεθος των συμμετεχόντων, οι εξωτερικότητες που σχετίζονται με τα δίκτυα μεταφοράς είναι μερικοί μόνο από τους παράγοντες που επηρεάζουν το επίπεδο ανταγωνισμού μιας αγοράς. Η ατελής πληροφόρηση αποτελεί και βασικό στοιχείο του πρώτου υποδείγματος που εξετάζεται, το οποίο βασίζεται στον ανταγωνισμό μέσω της επιλογής ποσοτήτων. Σε ένα πλαίσιο επαναλαμβανόμενης αλληλεπίδρασης, οι επιχειρήσεις επιλέγουν τις ποσότητες που παράγουν ή/και διοχετεύουν στην αγορά χωρίς να έχουν γνώση σχετικά με την επιλογή του αντιπάλου. Στην προσπάθεια εκτίμησης αυτής, ένας κανόνας προσαρμογής που εξασφαλίζει τη σύγκληση στην ισορροπία υιοθετείται συμμετρικά με τις μυωπικές βέλτιστες αποκρίσεις να οδηγούν στο σταθερό σημείο. Λόγω της μη κοινά γνωστής παραμέτρου, του οριακού κόστους, που παραμένει ιδιωτική καθ ́ όλη τη διάρκεια του παιγνίου, οι παίχτες μπορούν να επιλέξουν αν θα συμπεριφερθούν βάση του πραγματικού κόστους τους ή αν θα αποκρίνονται σαν να είχαν διαφορετική τιμή της ιδιωτικής παραμέτρου με στόχο την προς όφελός τους μετατόπιση της ισορροπίας. Η συμπεριφορική προσποίηση αποτελεί κυρίαρχη στρατηγική, γεγονός που ενισχύεται περαιτέρω στα πλαίσια μια αγοράς που συνδέει στοχαστικά την εξέλιξη του κόστους των επιχειρήσεων με την κερδοφορία τους. Η κύρια δυσκολία που συναντάται κατά τη γενίκευση των αποτελεσμάτων αυτών, σε πιο ανταγωνιστικές αγορές, έγκειται στο γεγονός ότι η υιοθετηθείσα διαδικασία αναπροσαρμογής είναι ευσταθής μόνο στα πλαίσια του δυοπωλίου. Αντί της χρήσης λογικών όπως εκείνων της «ταχύτητας αναπροσαρμογής», προτείνονται κανόνες προερχόμενοι από την οικογένεια των Κινούμενων Μέσων, γνωστοί για τις εξαιρετικές ιδιότητες εξομάλυνσης που κατέχουν. Χρησιμοποιώντας τον κανόνας σταθερού μεγέθους μνήμης με ομοιόμορφη στάθμιση, προσδιορίζεται ο ακριβής αριθμός υστερήσεων, βάση του αριθμού των παιχτών, ώστε το παίγνιο να συγκλίνει. Ο άλλος κύριος κανόνας που προτείνεται, είναι εκείνος του συνεχώς αυξανόμενου μεγέθους μνήμης, ο οποίος ταυτίζεται με το fictitious play. Μαζί με ορισμένους υβριδικούς κανόνες που προκύπτουν από το συνδυασμό των βασικών, όλοι οι κανόνες αναλύονται και συγκρίνονται ως προς την ευστάθεια που δύναται να παρέχουν και την καταλληλότητά τους στα πλαίσια αγορών σταθερού ή αυξανόμενου ανταγωνισμού, καλύπτοντας την απόσταση μεταξύ των δύο προαναφερθέντων προσεγγίσεων της βιβλιογραφίας. Σε ένα πιο εφαρμοσμένο πλαίσιο, η εκμάθηση βέλτιστων στρατηγικών σε περιπτώσεις διαφορετικών επιπέδων πληροφόρησης είναι ένα από τα ζητήματα που πραγματεύεται το μοντέλο στοχαστικού παιγνίου για αγορά ισχύος επόμενης ημέρας. Η ενισχυτική εκμάθηση τύπου R-Learning, μία off-policy μέθοδος, υιοθετείται από τους παίχτες με σκοπό την εξερεύνηση και εκμετάλλευση του συστήματος μέσω της ανάδειξης βέλτιστων πλάνων δράσης. Με την εισαγωγή μιας τεχνικής μετασχηματισμού του χώρου κατάστασης, το μοντέλο μπορεί να προσαρμοστεί σε περιπτώσεις που οι παίχτες προσλαμβάνουν διαφορετικά το διάνυσμα κατάστασης. Το μοντέλο, όπως και ο προτεινόμενος αλγόριθμος, εφαρμόζονται σε περιπτώσεις που διαφοροποιούνται ως προς την τοπολογία του δικτύου ή τον αριθμό των επιχειρήσεων που εκμεταλλεύονται τις μονάδες παραγωγής και σε σενάρια αξιοποίησης διαφορετικών συνόλων πληροφορίας. Μέσω παραλλαγών ζήτησης, προϊόν επεξεργασίας πραγματικών δεδομένων εξετάζονται οι επιπτώσεις που διάφοροι κρίσιμοι παράγοντες επιφέρουν στα οικονομικά αποτελέσματα και στην αποδοτικότητα της αγοράς. Τέλος, το σύνολο της ανάλυσης καταδεικνύει διάφορες εξαιρετικά σημαντικές πτυχές της σχέσης μεταξύ ατελούς πληροφόρησης, εξωγενών παραγόντων και του επιπέδου ανταγωνισμού, αποδίδοντας, ταυτόχρονα, έμφαση στα ποιοτικά χαρακτηριστικά που πρέπει να διασφαλίζονται κατά τον αποδοτικό σχεδιασμό τέτοιων αγορών.