HEAL DSpace

Αλγόριθμος ενισχυτικής μάθησης για ρύθμιση διεργασιών με κατασκευή νευρωνικών δικτύων ακτινικής βάσης σε πραγματικό χρόνο

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Πετσαγκουράκης, Παναγιώτης el
dc.contributor.author Petsagourakis, Panagiotis en
dc.date.accessioned 2015-11-26T08:45:28Z
dc.date.available 2015-11-26T08:45:28Z
dc.date.issued 2015-11-26
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/41668
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.11134
dc.rights Default License
dc.subject Τεχνητή νοημοσύνη el
dc.subject Δυναμικός προγραμματισμός el
dc.subject Ρύθμιση διεργασιών el
dc.subject Νευρωνικά δίκτυα el
dc.subject Ενισχυτική μάθηση el
dc.subject Process control en
dc.subject Reinforcement learning en
dc.subject Neural networks el
dc.subject Dynamic programming el
dc.subject Artificial intelligence el
dc.title Αλγόριθμος ενισχυτικής μάθησης για ρύθμιση διεργασιών με κατασκευή νευρωνικών δικτύων ακτινικής βάσης σε πραγματικό χρόνο el
heal.type bachelorThesis
heal.classification Αυτόματος έλεγχος el
heal.classification Τεχνητή νοημοσύνη el
heal.classification Δυναμικός προγραμματισμός el
heal.classification Ρύθμιση διεργασιών el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-07-07
heal.abstract Η ρύθμιση ενός μη γραμμικού συστήματος δεν μπορεί να πραγματοποιηθεί με ευκολία, ειδικά όταν υπάρχει μη γραμμικότητα και στη μεταβλητή εισόδου (non affine). Η ενισχυτική μάθηση δίνει τη δυνατότητα να σχεδιαστεί online ένας ευσταθής ρυθμιστής χωρίς καμία γνώση για το σύστημα. Ο εν λόγο ρυθμιστής έχει δύο οντότητες, το action νευρωνικό δίκτυο και το critic νευρωνικό δίκτυο. Το πρώτο προσεγγίζει το μη γραμμικό κομμάτι του συστήματος και παράγει ένα μέρος του σήματος εισόδου, ενώ από την άλλη το critic εφαρμόζεται για να προσεγγίζει τη συνάρτηση κόστους με στόχο να ανανεώσει τα βάρη του action νευρωνικού δικτύου. Οι περισσότερες εφαρμογές που εμφανίζονται βιβλιογραφικά στην online μάθηση, μέσω νευρωνικών δικτύων λαμβάνουν τυχαίες αρχικές τιμές για το διάνυ- σμα των βαρών που συνδέει τους νευρώνες εισόδου με τους κρυφούς νευρώνες. Το αποτέλεσμα αυτής της διαδικασίας είναι η απόδοση του συστήματος να αλλάζει σε κάθε προσομοίωση. Στην παρούσα εργασία, εφαρμόστηκε μια διαφορετική προσέγγιση, όπου χρησιμοποιήθηκαν νευρωνικά δίκτυα ακτινικής βάσης (RBF neural networks), όπου τα κέντρα των συναρτήσεων ενεργοποίησης, αλλά και ο αριθμός νευρώνων (nodes) πλέον αλλάζουν και αυτά με online κινήσεις. Για το σκοπό αυτό χρησιμοποιήθηκε ο αλγόριθμος online fuzzy means, όπου επιλέγει σε κάθε χρονική στιγμή αν θα αυξηθούν τα κέντρα. Αυτή η προσέγγιση εφαρμόστηκε σε 3 προβλήματα. Το πρώτο αποτελείται από ένα μη γραμμικό non affine μαθηματικό σύστημα, ενώ τα άλλα δυο εξάγονται από το χώρο της χημικής μηχανικής. el
heal.abstract Controlling a nonlinear system is not an easy task, especially, when the input variable consists of a non-affine term. Reinforcement learning provides the opportunity to design online a stable controller without any knowledge of the system itself. The proposed controller has two entities, an action neural network and a critic neural network. The action neural network approximates the nonlinear part of the system’s dynamics, and generates the control signal. On the other hand, the critic neural network is implemented to approximate the cost function, aiming to update the adaptable weights of the action network. In literature, there are many applications of the control theory applied on online learning. Most of them initialize randomly the weight vector from the input layer to the hidden layer and continuously hold it constant. The result of this is that the performance changes at each simulation. In this project a different approach is implemented, using Radial Basis Function (RBF) networks as artificial neural networks to tackle this problem. The online fuzzy means algorithm is used at the learning procedure, updating not only the parameters (centers of the RBF) but also the number of the nodes of the networks. Consequently, every parameter of the networks is trained online instead of offline. This approach is applied on three examples. The first one is a nonlinear, non-affine discrete system and the other two are taken from chemical engineering application. en
heal.advisorName Σαρίμβεης, Χαράλαμπος el
heal.committeeMemberName Μπουντουβής, Ανδρέας el
heal.committeeMemberName Κυρανούδης, Χρήστος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών. Τομέας Ανάλυσης, Σχεδιασμού και Ανάπτυξης Διεργασιών και Συστημάτων el
heal.academicPublisherID ntua
heal.numberOfPages 117 σ. en
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής