Σύγκριση Στατιστικών Μεθόδων και Μεθόδων Υπολογιστικής Νοημοσύνης για Βραχυπρόθεσμη Πρόβλεψη Μονομεταβλητών Κυκλοφοριακών Χρονοσειρών

Καμπιτάκης, Εμμανουήλ; Kampitakis, Emmanouil

dc.contributor.author	Καμπιτάκης, Εμμανουήλ	el
dc.contributor.author	Kampitakis, Emmanouil	en
dc.date.accessioned	2020-10-21T17:31:51Z
dc.date.available	2020-10-21T17:31:51Z
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/51560
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.19258
dc.description	Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Εφαρμοσμένες Μαθηματικές Επιστήμες”	el
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.subject	Πρόβλεψη Κυκλοφορίας	el
dc.subject	Μηχανική Μάθηση	el
dc.subject	Βαθιά Μηχανική Μάθηση	el
dc.subject	Στατιστικές Μέθοδοι Πρόβλεψης	el
dc.subject	Πρόβλεψη Χρονοσειρών	el
dc.subject	Traffic Forecasting	en
dc.subject	Machine Learning	el
dc.subject	Deep Learning	el
dc.subject	Statistical Forecasting Methods	el
dc.subject	Time Series Prediction	el
dc.title	Σύγκριση Στατιστικών Μεθόδων και Μεθόδων Υπολογιστικής Νοημοσύνης για Βραχυπρόθεσμη Πρόβλεψη Μονομεταβλητών Κυκλοφοριακών Χρονοσειρών	el
dc.title	Comparison of Statistical and Computational Intelligence Methods for Univariate Short-term Traffic Timeseries	en
heal.type	masterThesis
heal.classification	Βραχυπρόθεσμη Πρόβλεψη Οδικής Κυκλοφορίας	el
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2020-02-21
heal.abstract	Η βραχυπρόθεσμη πρόβλεψη κυκλοφορίας αποτελεί μία από τις σημαντικότερες προκλήσεις των Ευφυών Μεταφορικών Συστημάτων καθώς η κυκλοφοριακή συμφόρηση και τα επακόλουθα που δημιουργεί είναι από τα σημαντικότερα προβλήματα των σύγχρονων μεγάλων πόλεων. Αν και μελετάται εκτενώς στην βιβλιογραφία για πάνω από 5 δεκαετίες, η ραγδαία εξέλιξη των τελευταίων χρόνων στον κλάδο της μηχανικής μάθησης και της βαθιάς μηχανικής μάθησης καθώς και η εμφάνιση νέων πηγών πληροφοριών, οι οποίες μας προσφέρουν πλέον περισσότερα και ποιοτικότερα δεδομένα, έχουν ανοίξει νέους ορίζοντες για μία αποτελεσματικότερη και πιο ακριβής βραχυπρόθεσμη πρόβλεψη κυκλοφοριακών μεγεθών. Παρόλα αυτά, λίγα έχουν γίνει σε επίπεδο συγκριτικής ανάλυσης με σκοπό την πραγματική κατανόηση των νέων μέθοδων και πως εκείνες θα μπορούσαν να βοηθήσουν ουσιαστικά σε εφαρμογές πραγματικού χρόνου διαχείρισης κυκλοφορίας. Σκοπός της παρούσας διπλωματικής εργασίας είναι η διεξαγωγή συγκριτικής ανάλυσης 15 διαφορετικών μεθόδων πρόβλεψης, από τις οποίες οι 10 αφορούν σε μοντέλα Βαθιάς Μηχανικής Μάθησης (MLP, LSTM, GRU, CNN, Dilated CNN, CNN-LSTM, Conv-LSTM, Encoder-Decoder LSTM, Encoder-Decoder CNN-LSTM και Encoder-Decoder Conv-LSTM) ενώ οι υπόλοιπες 5 αφορούν σε γνωστές στατιστικές μεθόδους χρονοσειρών (STL αποσύνθεση και ARIMA, ARIMAX, STL αποσύνθεση και ETS, TBATS και Theta) για βραχυπρόθεσμη πρόβλεψη μονομεταβλητών κυκλοφοριακών χρονοσειρών. Οι τεχνικές πρόβλεψης εφαρμόζονται σε χρονοσειρές μέσης ταχύτητα διαδρομής (ανά 5 λέπτα) σε μία αρτηρία την πόλης Xi’an στην Κίνα. Οι χρονοσειρές έχουν προκύψει από ανεπεξέργαστα GPS δεδομένα των ταξί της εταιρίας DiDi. Απώτερος σκοπός είναι η ανάδειξη δυσκολιών που σχετίζονται με την εκπαίδευση τέτοιων μοντέλων (Βαθιάς Μηχανικής Μάθησης) και πόσο εύκολο είναι να ξεπεράσουν σε προβλεπτική ικανότητα τις παραδοσιακές στατιστικές μεθόδους. Εξετάστηκαν επίσης, δύο μέθοδοι προεπεξεργασίας δεδομένων, η αφαίρεση της εποχικής και της συνιστώσας τάσης, δανεισμένες από την κλασσική ανάλυση χρονοσειρών, και πως αυτές επηρεάζουν την επίδοση μοντέλων Βαθιάς Μηχανικής Μάθησης. Για τον υπολογισμό της 1ης συνιστώσας έγινε με την μέθοδο “LOESS”, ενώ της 2ης με την μέθοδο των κυβικών σπλινών. Ως μέθοδος αξιολόγησης της προβλεπτικής ικανότητας των μοντέλων χρησιμοποιήθηκε η μέθοδος κυλιόμενης αρχής χωρίς επανεκπαίδευση με σταθερή τιμή του ορίζοντα πρόβλεψης, για 5 διαφορετικές μετρικές σφάλματος. O ορίζοντας πρόβλεψης ορίστηκε από 5 λεπτά έως 60 λεπτά (1-12 βήματα). Το πρόβλημα της πρόβλεψης διατυπώθηκε ως πρόβλημα αυτοπαλινδρόμησης, AR(p), χωρίς εξωγενείς μεταβλητές. Υπολογίστηκε η υπολογιστική πολυπλοκότητα για κάθε μέθοδο η οποία ορίζεται ως η επιπλέον «προσπάθεια» (πολλαπλασιαστικά), σε σύγκριση με την μέθοδο αναφοράς, που απαιτείται για την αντίστοιχη μείωση του σφάλματος πρόβλεψης. Επιπροσθέτως, υπολογίστηκε η ποσοστιαία προσαρμογή κάθε μεθόδου, κανονικοποιημένη από το τετράγωνο της μέσης τιμής της χρονοσειράς, και εξετάστηκε γραφικά η σχέση της με την προβλεπτική ικανότητα. Τέλος, διερευνήθηκε και πάλι γραφικά η ευαισθησία των μη παραμετρικών μοντέλων στον χώρο των παραμέτρων που εξετάστηκαν. Τα αποτελέσματα δείχνουν ότι όλες οι μέθοδοι έχουν καλύτερη προβλεπτική ικανότητα από την μέθοδο αναφοράς, ενώ φαίνεται οι μέθοδοι Βαθιάς Μηχανικής Μάθησης να υπερτερούν των στατιστικών μεθόδων (εκτός της μεθόδου MLP), χωρίς η επιλογή της μετρικής σφάλματος να επηρρεάζει την επιλογή της καλύτερης μεθόδου. Καλύτερη μέθοδος από τις στατιστικές μεθόδους για τις μέσες τιμές των σφαλμάτων και για όλες τις μετρικές είναι η μέθοδος ARIMA με εποχική αποσύνθεση, ενώ η αντίστοιχα καλύτερη μέθοδος για τις μεθόδους βαθιάς μηχανικής μάθησης είναι η μέθοδος Encoder-Decoder LSTM, η οποία είναι και η καλύτερη σε προβλεπτική ικανότητα από συνολικά όλες που εξετάστηκαν. Ακόμα, προκύπτει ότι και οι 2 στατιστικές μέθοδοι προ-επεξεργασίας που εφαρμόστηκαν είναι στατιστικά σημαντικές για την βελτίωση της απόδοσης των μεθόδων βαθιάς μηχανικής μάθησης. Μάλιστα, η αφαίρεση της εποχικής συνιστώσας βρέθηκε να έχει σημαντική μειωτική επιρροή στο σφάλμα για όλες τις μεθόδους που εξετάστηκαν. Η υπολογιστική πολυπλοκότητα των μεθόδων βαθιάς μηχανικής μάθησης βρέθηκε ότι είναι τρεις τάξεις μεγέθους μεγαλύτερη από την αντίστοιχη των στατιστικών μεθόδων, και τέλος, αναδείχθηκε η ανάγκη αυτοματοποίησης της εκπαίδευσης των πρώτων καθώς και περαιτέρω διερεύνησης σημαντικών παραμέτρων για το πρόβλημα της πρόβλεψης κυκλοφορίας.	el
heal.abstract	Short-term traffic prediction is one of the most important challenges in ITS systems as traffic congestion and its aftermaths are of paramount importance in metropolitan areas. In the last five decades this subject has been thoroughly studied in dozens of research papers, but the rapid development in machine learning and deep learning, and the emergence of new data sources makes it possible to examine and predict traffic conditions in big cities more accurately than ever. Despite this, there is still not a clear view about the various requirements involved in training these new methods and how to effectively use them in traffic forecasting in order to be essentialy helpful in real time traffic management applications. The aim of this master thesis, is the conduction of a comparative analysis in 15 different forecasting methods, 10 of them are from the area of deep learning (MLP, LSTM, GRU, CNN, Dilated CNN, CNN-LSTM, Conv-LSTM, Encoder-Decoder LSTM, Encoder-Decoder CNN-LSTM and Encoder-Decoder Conv-LSTM) and the rest of them are from the area of statistical time series (STL decomposition and ARIMA, ARIMAX, STL decomposition and ETS, TBATS and Theta). The data are the average speed (1 observation per 5 minutes) from October and November in 2016 for an arterial in the city of Xi’an in China which were extracted from raw GPS data collected from DiDi’s tazi drivers. The ultimate goal is to highlight the difficulties associated with the training of such models (Deep Learning) and how easy it is to overcome traditional statistical methods in predictive capability. Two data preprocessing methods were examined, deseasonalization and detrending, borrowed from statistical time series in order to investigate how these two methods affect the performarmance of deep learning models. For the calculation of the seasonal component the “LOESS” method was used, while for the trend component the cubic splines method was used. The predictive capability of each model was tested using the rolling origin without retraining and constant horizon method. Also, five different error measures were used. The horizon was set to be from 5 minutes to 60 minutes (1-12 steps). The time series forecasting problem was formalized as an auto-regressive task, i.e., based on an AR(p) model, with no exogenous variables. Computational Complexity (CC) is used to determine the time needed to train a given model and use it for forecasting. Thus, CC can be simply defined as the computational time required by the model to predict a time series, divided by the corresponding time needed by the baseline method to achieve the same task. In this regard, we end up with a relative metric indicating the additional, proportional time required for obtaining the forecasts from the more complex methods. Additionaly, the accuracy of how well a model fits the historical data is calculated which is actually the Mean Squared Error (MSE) of the in-sample forecasts, normalized by the squared mean value of the time series being examined. Finally, we examined graphically the sensitivity of each model’s average MAE to hyperparameter changes within the bounds searched. The results indicate that all methods have better predictive performance than the baseline method (Seasonal Naïve method), while the deep learning methods seem to outperform the statistical methods (except the MLP method), without the choice of the error measure affecting the choice of the best method. The best method from the statistical ones in terms of predictive performance for all mean error measures is the seasonal decomposition with ARIMA method, while the corresponding one for deep learning methods is the Encoder-Decoder LSTM method, which is the superior one to all other methods that we examined. Both of the statistical preprocessing methods mentioned above are statistically significant for improving the performance of deep learning methods. Moreover, the seasonal adjustment was found to have a significant reductive effect on error for all deep learing models. Finally, the computational complexity of deep learning methods was found to be three orders of magnitude greater than that of statistical methods. We conclude by highlighting the need to automate the training procedure of deep learning methods and to further examine important parameters that we believe that highly affect the traffic forecasting problem.	en
heal.advisorName	Βλαχογιάννη, Ελένη	el
heal.committeeMemberName	Γιαννής, Γεώργιος	el
heal.committeeMemberName	Καρώνη, Χρυσηίς	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών	el
heal.academicPublisherID	ntua
heal.numberOfPages	299 σ.	el
heal.fullTextAvailability	false