dc.contributor.author |
Πετσαγκουράκης, Παναγιώτης
|
el |
dc.contributor.author |
Petsagourakis, Panagiotis
|
en |
dc.date.accessioned |
2015-11-26T08:45:28Z |
|
dc.date.available |
2015-11-26T08:45:28Z |
|
dc.date.issued |
2015-11-26 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/41668 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.11134 |
|
dc.rights |
Default License |
|
dc.subject |
Τεχνητή νοημοσύνη |
el |
dc.subject |
Δυναμικός προγραμματισμός |
el |
dc.subject |
Ρύθμιση διεργασιών |
el |
dc.subject |
Νευρωνικά δίκτυα |
el |
dc.subject |
Ενισχυτική μάθηση |
el |
dc.subject |
Process control |
en |
dc.subject |
Reinforcement learning |
en |
dc.subject |
Neural networks |
el |
dc.subject |
Dynamic programming |
el |
dc.subject |
Artificial intelligence |
el |
dc.title |
Αλγόριθμος ενισχυτικής μάθησης για ρύθμιση διεργασιών με
κατασκευή νευρωνικών δικτύων ακτινικής βάσης σε πραγματικό
χρόνο |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Αυτόματος έλεγχος |
el |
heal.classification |
Τεχνητή νοημοσύνη |
el |
heal.classification |
Δυναμικός προγραμματισμός |
el |
heal.classification |
Ρύθμιση διεργασιών |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2015-07-07 |
|
heal.abstract |
Η ρύθμιση ενός μη γραμμικού συστήματος δεν μπορεί να πραγματοποιηθεί με
ευκολία, ειδικά όταν υπάρχει μη γραμμικότητα και στη μεταβλητή εισόδου (non
affine). Η ενισχυτική μάθηση δίνει τη δυνατότητα να σχεδιαστεί online ένας ευσταθής ρυθμιστής χωρίς καμία γνώση για το σύστημα. Ο εν λόγο ρυθμιστής έχει δύο
οντότητες, το action νευρωνικό δίκτυο και το critic νευρωνικό δίκτυο. Το πρώτο
προσεγγίζει το μη γραμμικό κομμάτι του συστήματος και παράγει ένα μέρος του
σήματος εισόδου, ενώ από την άλλη το critic εφαρμόζεται για να προσεγγίζει τη
συνάρτηση κόστους με στόχο να ανανεώσει τα βάρη του action νευρωνικού δικτύου. Οι περισσότερες εφαρμογές που εμφανίζονται βιβλιογραφικά στην online
μάθηση, μέσω νευρωνικών δικτύων λαμβάνουν τυχαίες αρχικές τιμές για το διάνυ-
σμα των βαρών που συνδέει τους νευρώνες εισόδου με τους κρυφούς νευρώνες.
Το αποτέλεσμα αυτής της διαδικασίας είναι η απόδοση του συστήματος να αλλάζει
σε κάθε προσομοίωση. Στην παρούσα εργασία, εφαρμόστηκε μια διαφορετική προσέγγιση, όπου χρησιμοποιήθηκαν νευρωνικά δίκτυα ακτινικής βάσης (RBF neural
networks), όπου τα κέντρα των συναρτήσεων ενεργοποίησης, αλλά και ο αριθμός
νευρώνων (nodes) πλέον αλλάζουν και αυτά με online κινήσεις. Για το σκοπό αυτό
χρησιμοποιήθηκε ο αλγόριθμος online fuzzy means, όπου επιλέγει σε κάθε χρονική
στιγμή αν θα αυξηθούν τα κέντρα. Αυτή η προσέγγιση εφαρμόστηκε σε 3 προβλήματα. Το πρώτο αποτελείται από ένα μη γραμμικό non affine μαθηματικό σύστημα,
ενώ τα άλλα δυο εξάγονται από το χώρο της χημικής μηχανικής. |
el |
heal.abstract |
Controlling a nonlinear system is not an easy task, especially, when the input
variable consists of a non-affine term. Reinforcement learning provides the opportunity
to design online a stable controller without any knowledge of the system
itself. The proposed controller has two entities, an action neural network and
a critic neural network. The action neural network approximates the nonlinear
part of the system’s dynamics, and generates the control signal. On the other
hand, the critic neural network is implemented to approximate the cost function,
aiming to update the adaptable weights of the action network. In literature,
there are many applications of the control theory applied on online learning.
Most of them initialize randomly the weight vector from the input layer to the
hidden layer and continuously hold it constant. The result of this is that the
performance changes at each simulation. In this project a different approach is
implemented, using Radial Basis Function (RBF) networks as artificial neural
networks to tackle this problem. The online fuzzy means algorithm is used at the
learning procedure, updating not only the parameters (centers of the RBF) but
also the number of the nodes of the networks. Consequently, every parameter
of the networks is trained online instead of offline. This approach is applied on
three examples. The first one is a nonlinear, non-affine discrete system and the
other two are taken from chemical engineering application. |
en |
heal.advisorName |
Σαρίμβεης, Χαράλαμπος |
el |
heal.committeeMemberName |
Μπουντουβής, Ανδρέας |
el |
heal.committeeMemberName |
Κυρανούδης, Χρήστος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών. Τομέας Ανάλυσης, Σχεδιασμού και Ανάπτυξης Διεργασιών και Συστημάτων |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
117 σ. |
en |
heal.fullTextAvailability |
true |
|