HEAL DSpace

Θεωρητική και εμπειρική σύγκριση στοχαστικών μεθόδων και μεθόδων μηχανικής μάθησης στην πρόβλεψη υδρολογικών διεργασιών

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Παπαχαραλάμπους, Γεωργία Α el
dc.contributor.author Papacharalampous, Georgia A en
dc.date.accessioned 2017-03-07T09:10:46Z
dc.date.available 2017-03-07T09:10:46Z
dc.date.issued 2017-03-07
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/44529
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.5652
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Επιστήμη και Τεχνολογία Υδατικών Πόρων” el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Hydrological processes en
dc.subject Machine learning en
dc.subject Forecasting methods en
dc.subject Stochastic models en
dc.subject Time series en
dc.subject Υδρολογικές διεργασίες el
dc.subject Μηχανική μάθηση el
dc.subject Μέθοδοι πρόβλεψης el
dc.subject Στοχαστικές ανελίξεις el
dc.subject Χρονοσειρές el
dc.title Θεωρητική και εμπειρική σύγκριση στοχαστικών μεθόδων και μεθόδων μηχανικής μάθησης στην πρόβλεψη υδρολογικών διεργασιών el
dc.title Theoretical and empirical comparison of stochastic and machine learning methods for hydrological processes forecasting en
heal.type masterThesis
heal.classification Στοχαστική Υδρολογία el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2016-10-27
heal.abstract Η πρόβλεψη της μελλοντικής συμπεριφοράς υδρολογικών διεργασιών είναι χρήσιμη στον σχεδιασμό και την λειτουργία των έργων υδραυλικού μηχανικού. Παράλληλα με τη διαρκώς αυξανόμενη χρήση των πιθανοτικών μεθόδων πρόβλεψης για τον εν λόγω σκοπό, μεγάλο πρακτικό και ερευνητικό ενδιαφέρον εξακολουθεί να υπάρχει και για τις μεθόδους σημειακής εκτίμησης. Γεγονός ακόμη είναι ότι οι μέθοδοι μηχανικής μάθησης έχουν εισέλθει δυναμικά στον χώρο της υδρολογίας και ότι η έρευνα εστιάζει συχνά στην σύγκριση μεθόδων της συγκεκριμένης κατηγορίας με κλασικές στοχαστικές μεθόδους. Οι διενεργούμενες συγκρίσεις στη διεθνή βιβλιογραφία αφορούν συνήθως μελέτες περίπτωσης. Η παρούσα εργασία διεξάγει μία θεωρητική σύγκριση της επίδοσης κλασικών στοχαστικών μεθόδων και μεθόδων μηχανικής μάθησης στην πρόβλεψη ανελίξεων πραγματοποιώντας υπολογιστικά πειράματα μεγάλης κλίμακας που βασίζονται σε προσομοιώσεις. Σκοπός της είναι η διατύπωση γενικών συμπερασμάτων επί του θέματος, τα οποία συνιστούν την βασική επιστημονική συνεισφορά της. Η συγκεκριμένη θεωρητική σύγκριση συνοδεύεται από εμπειρική μικρής κλίμακας σε γεωφυσικές διεργασίες με στόχο την ανάδειξη επιμέρους σημείων. Έμφαση δίνεται στις μεθόδους Support Vector Machines (SVM), που είναι οι δημοφιλέστερες από τις νεοεισαχθείσες στο πεδίο της υδρολογίας μέθοδοι μηχανικής μάθησης, ενώ στην σύγκριση συμμετέχουν και μέθοδοι Νευρωνικών Δικτύων - Neural Networks (NN), η χρήση των οποίων είναι μάλλον εδραιωμένη. Η σύγκριση αφορά μακροπρόθεσμες προβλέψεις στην χρονική κλίμακα των παρατηρήσεων, παρότι η βραχυπρόθεσμη πρόβλεψη είναι επίσης χρήσιμη. Όσον αφορά την μεθοδολογία που ακολουθείται, χρησιμοποιούνται συνολικά 28 μέθοδοι, από τις οποίες οι 9 είναι μέθοδοι μηχανικής μάθησης. Οι έξι από τις τελευταίες κατασκευάζονται βάσει ενός αλγορίθμου SVM και οι υπόλοιπες τρεις βάσει ενός αλγορίθμου NN. Πραγματοποιούνται 20 πειράματα προσομοίωσης, καθένα από τα οποία χρησιμοποιεί ως δεδομένα για την εφαρμογή των μεθόδων 2 000 χρονοσειρές, οι οποίες παράγονται με βάση ένα, κάθε φορά διαφορετικό, μοντέλο στοχαστικής ανέλιξης από τις συχνά χρησιμοποιούμενες οικογένειες μοντέλων Autoregressive Moving Average (ARMA), Autoregressive Integrated Moving Average (ARIMA), Autoregressive Fractionally Integrated Moving Average (ARFIMA) και Seasonal Autoregressive Integrated Moving Average (SARIMA). Συμπληρωματικά γίνονται 8 υπολογιστικά πειράματα, τα οποία χρησιμοποιούν από μία ιστορική χρονοσειρά. Οι εκάστοτε χρονοσειρές χωρίζονται σε δύο τμήματα. Το πρώτο τμήμα χρησιμοποιείται για την εκπαίδευση των μοντέλων, τα οποία στην συνέχεια διενεργούν προβλέψεις που αντιστοιχούν στο δεύτερο τμήμα, ενώ το τελευταίο χρησιμοποιείται ως χρονοσειρά - στόχος, δηλαδή ως αναφορά για την σύγκριση των προβλέψεων μεταξύ τους. Η συναξιολόγηση των μεθόδων πρόβλεψης γίνεται με βάση τις τιμές που λαμβάνουν 22 μέτρα, τα οποία ποσοτικοποιούν την επίδοση των μεθόδων ως προς ορισμένα κριτήρια. Τα τελευταία αφορούν την αμεροληψία ως προς την μέση τιμή και την τυπική απόκλιση, την ακρίβεια και την συσχέτιση. Το σημαντικότερο εξαγόμενο είναι ότι γενικώς δεν υπάρχουν μέθοδοι το ίδιο καλές ή κακές σε σχέση με τις υπόλοιπες ως προς το σύνολο των μέτρων που χρησιμοποιούνται, με αποτέλεσμα η συνολική εικόνα να είναι μάλλον ομοιόμορφη. Παρά ταύτα, υπάρχουν μέθοδοι που είναι σταθερά καλύτερες ή χειρότερες από άλλες ως προς συγκεκριμένα μέτρα, χωρίς αυτό να ισχύει για όλες τις μεθόδους. Προκύπτει ότι μία γενική κατάταξη των μεθόδων δεν είναι εφικτή, αλλά εφικτή είναι μια καταρχήν κατηγοριοποίηση τους με βάση την παρόμοια επίδοση στα διάφορα μέτρα. Άλλο σημαντικό συμπέρασμα είναι ότι μέθοδοι περισσότερο εξεζητημένες δεν δίνουν κατ’ ανάγκην καλύτερες προβλέψεις από απλούστερες μεθόδους. Τονίζεται ότι οι μέθοδοι μηχανικής μάθησης δεν διαφέρουν από τις κλασικές στοχαστικές μεθόδους ως προς τα όσα διατυπώνονται παραπάνω, ενώ ενδιαφέρον παρουσιάζει και το γεγονός ότι οι αλγόριθμοι SVM και ΝΝ που χρησιμοποιούνται στην παρούσα εργασία προσφέρουν εν δυνάμει πολύ καλή επίδοση ως προς την ακρίβεια σε σχέση με την συνολική εικόνα. Επισημαίνεται ότι, παρότι η εργασία εστιάζει στην σημειακή πρόβλεψη υδρολογικών διεργασιών, τα ανωτέρω αλλά και τα υπόλοιπα συμπεράσματα που προκύπτουν είναι γενικού επιστημονικού ενδιαφέροντος, ενώ επίσης αφορούν όλες τις δυνατές χρονικές κλίμακες παρατήρησης. Τέλος, παράλληλα με την χρήση συνθετικών χρονοσειρών, σημαντική συνεισφορά αποτελεί και η χρήση αρκετών μεθόδων και μέτρων. Λιγότερες μέθοδοι και λιγότερα μέτρα, ιδίως στην περίπτωση που τα τελευταία θα αντιστοιχούσαν σε λιγότερα κριτήρια, θα οδηγούσαν σε πολύ διαφορετική συνολική εικόνα. Για τον λόγο αυτό η μεθοδολογία της παρούσας εργασίας θεωρείται καταλληλότερη για αξιολόγηση οποιασδήποτε νέας μεθόδου σημειακής πρόβλεψης από την εφαρμογή μικρού αριθμού μεθόδων αναφοράς και μέτρων, η οποία συχνά απαντάται στην βιβλιογραφία. el
heal.abstract Forecasting the future behaviour of hydrological processes is useful in the design and operation of hydraulic engineering works. While the attention given to probabilistic forecasting is growing, there is still large practical and scientific interest in point estimation. It is also a fact that machine learning methods have established themselves as a promising approach to hydrological forecasting and, as a result, research within the field of hydrology often focuses on comparing machine learning methods to classical stochastic methods. The comparisons performed in the literature are usually based on case studies. This thesis conducts a theoretical comparison on the forecasting performance between several classical stochastic and machine learning point estimation methods by performing large-scale computational experiments based on simulations. The purpose of the thesis is to provide generalized results. The theoretical comparison is accompanied by a small-scale empirical comparison to highlight important points. Emphasis is placed on Support Vector Machines (SVM), that consist the most popular new entrant machine learning category in the field of hydrology, while the well-established Neural Networks (NN) are also involved in the comparison. The comparison refers to long-term forecasting on the observation time scale, although short-term forecasting is also useful. As regards the methodology, a total of 28 methods are used, among which 9 are machine learning methods. Six of the latter methods are built using a SVM algorithm and the remaining three using a NN algorithm. 20 simulation experiments are performed, while each of them uses 2 000 simulated time series. The time series are simulated using a stochastic model from the frequently used families of models Autoregressive Moving Average (ARMA), Autoregressive Integrated Moving Average (ARIMA), Autoregressive Fractionally Integrated Moving Average (ARFIMA) and Seasonal Autoregressive Integrated Moving Average (SARIMA). Additionally, 8 computational experiments are carried out, each using one historical time series. Each time series is divided into two parts. The first part is used for training the model and the second for testing its forecast. The comparative assessment of the methods is based on 22 metrics, that quantify the methods’ performance according to several criteria. These criteria are related to the bias with respect to the mean and standard deviation, the accuracy and the correlation. The most important outcome of this thesis is that in general there is not a uniformly better or worse method. However, there are methods that are regularly better or worse than others according to specific metrics. It appears that, although a general ranking of the methods is not possible, their classification based on their similar or contrasting performance in the various metrics is possible to some extent. Another important conclusion is that more sophisticated methods do not necessarily provide better forecasts compared to simpler methods. It is pointed out that machine learning methods do not differ dramatically from classical stochastic methods, while it is interesting that the SVM and NN algorithms used in this thesis offer potentially very good performance in terms of accuracy, compared to the overall picture. It should be noted that, although the present thesis focuses on hydrological processes, the results are of general scientific interest and they also concern all possible observation time scales. In addition to the use of simulated processes, another important point in the present thesis is the use of several methods and metrics. Using fewer methods and fewer metrics would have led to a very different overall picture, particularly if those fewer metrics corresponded to fewer criteria. For this specific reason, the proposed methodology of the thesis is considered to be more appropriate for the evaluation of forecasting methods. en
heal.advisorName Κουτσογιάννης, Δημήτριος el
heal.committeeMemberName Κουτσογιάννης, Δημήτριος el
heal.committeeMemberName Μακρόπουλος, Χρήστος el
heal.committeeMemberName Μαμάσης, Νικόλαος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Πολιτικών Μηχανικών. Τομέας Υδατικών Πόρων και Περιβάλλοντος. Εργαστήριο Υδρολογίας και Αξιοποίησης Υδατικών Πόρων el
heal.academicPublisherID ntua
heal.numberOfPages 249 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα