HEAL DSpace

Ανάπτυξη μεθοδολογίας πρόβλεψης μεταβολής θέσης σημείων στο χώρο με χρήση τεχνητών νευρωνικών δικτύων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αλεβιζάκου, Ελένη-Γεωργία el
dc.contributor.author Alevizakou, Eleni-Georgia en
dc.date.accessioned 2017-11-30T09:54:43Z
dc.date.available 2017-11-30T09:54:43Z
dc.date.issued 2017-11-30
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/46007
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.2814
dc.rights Default License
dc.subject Τεχνητά Νευρωνικά Δίκτυα el
dc.subject Γεωδαισία el
dc.subject Πρόβλεψη el
dc.subject Μεταβολή θέσης el
dc.subject Συμβατικές μέθοδοι πρόβλεψης el
dc.subject Artificial Neural Networks en
dc.subject Geodesy el
dc.subject Forecast el
dc.subject Change of point position el
dc.subject Conventional forecast methods el
dc.title Ανάπτυξη μεθοδολογίας πρόβλεψης μεταβολής θέσης σημείων στο χώρο με χρήση τεχνητών νευρωνικών δικτύων el
dc.title Development of a methodology using artificial neural networks to forecast the change of point positions in space en
dc.contributor.department Τομέας Τοπογραφίας, Εργαστήριο Γενικής Γεωδαίσιας el
heal.type doctoralThesis
heal.classification ΓΕΩΔΑΙΣΙΑ el
heal.classification ΣΧΕΔΙΑΣΜΟΣ ΚΑΙ ΠΡΟΒΛΕΨΗ el
heal.classificationURI http://data.seab.gr/concepts/fdf9939fd41fe8fdbde9da195afeb4522860796e
heal.classificationURI http://data.seab.gr/concepts/da939a0aaef19a32855a8b8df6528077ec3a75a9
heal.language el
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2017-10-23
heal.abstract Η διατριβή ασχολείται με την ανάπτυξη μιας μεθοδολογίας, η οποία βασίζεται στα Τεχνητά Νευρωνικά Δίκτυα (ΤΝΔ). Η προτεινόμενη αυτή μεθοδολογία αφορά στην πρόβλεψη της μεταβολής της θέσης σημείων στο χώρο, δηλαδή της μετακίνησης ή της παραμόρφωσης της επιφάνειας που ανήκουν. Επικεντρώνεται τόσο στη βραχυπρόθεσμη πρόβλεψη (short-term forecasting) ενός τέτοιου πολύπλοκου φαινομένου όσο και στη μακροπρόθεσμη (long-term forecasting). Κίνητρο αποτέλεσε ο συνδυασμός δύο σκέψεων-δεδομένων, πρώτον της εισαγωγής της έννοιας της πρόβλεψης στους περισσότερους επιστημονικούς κλάδους (Οικονομία, Μετεωρολογία, Ιατρική κ.ά.) και δεύτερον της επιθυμίας για γνώση της μελλοντικής συμπεριφοράς και θέσης μιας κατασκευής ή μιας περιοχής της φυσικής γήινης επιφάνειας. Οι πρωτοτυπίες της διατριβής έγκεινται στο ότι : -Εισάγεται η έννοια της πρόβλεψης στην επιστήμη της Γεωδαισίας και ελέγχονται όλα τα συμβατικά γεωδαιτικά μοντέλα παραμόρφωσης (deformation models) με στόχο την παραγωγή προβλέψεων μεταβολής της θέσης σημείων στο χώρο. -Χρησιμοποιείται η επιστήμη της "Ανακάλυψης γνώσης από Βάσεις Δεδομένων" (Knowledge Discovery In Databases-KDD) και συγκεκριμένα η εξόρυξη γνώσης από δεδομένα (data mining) και η διαχείριση και προ-επεξεργασία μεγάλου όγκου (big data) δεδομένων. -Δοκιμάζονται ορισμένες συμβατικές ποσοτικές μέθοδοι προβλέψεων, οι οποίες επιλέγχθησαν κατάλληλα από άλλες επιστήμες (π.χ. ιατρική, οικονομία) για την πρόβλεψη μεταβολής της θέσης σημείων στο χώρο. -Εφαρμόζεται η ευφυής μέθοδος των Τεχνητών Νευρωνικών Δικτύων (ΤΝΔ) για την πρόβλεψη της μεταβολής της θέσης σημείων στο χώρο. -Συγκρίνονται οι συμβατικές μέθοδοι με τις ευφυείς. -Αναπτύσσεται μια αυτοματοποιημένη και ολοκληρωμένη μεθοδολογία για την πρόβλεψη μεταβολής της θέσης σημείων στο χώρο η οποία βασίζεται σε ΤΝΔ. Η διδακτορική διατριβή αναπτύσσεται σε τρία μέρη, που χωρίζονται αντίστοιχα σε κεφάλαια. Πρώτο μέρος Το μέρος αυτό της διατριβής, το οποίο αποτελείται από τρία κεφάλαια (τα υπ. αριθμ. 1, 2 και 3), έχει ως αντικείμενο τη λεπτομερή καταγραφή και βιβλιογραφική ανασκόπηση, σε διεθνή κλίμακα, των επιστημονικών περιοχών οι οποίες άπτονται σε αυτή. Συγκεκριμένα, η διατριβή βασίζεται στο συνδυασμό ετερόκλητων επιστημονικών περιοχών για την επίτευξη του κοινού στόχου που αναφέρθηκε ήδη. Επομένως, κάθε κεφάλαιο του πρώτου μέρους αποτελεί μια σε βάθος αναφορά στις διαφορετικές αυτές επιστημονικές περιοχές. Στο πρώτο κεφάλαιο αναλύεται ότι αφορά στη μεταβολή της θέσης σημείων στο χώρο, καθώς τελικός στόχος αποτελεί η πρόβλεψη αυτού του φαινομένου. Γίνεται σαφής διάκριση μεταξύ των όρων της "παραμόρφωσης" ("deformation") και της "μετακίνησης" ("displacement") και παρουσιάζονται τα πρότυπα ελέγχου που έχουν αναπτυχθεί για θέματα μελέτης παραμορφώσεων. Καταγράφονται επίσης όλα τα είδη γεωδαιτικών δικτύων ελέγχου, τα οποία μπορεί να ιδρυθούν προκειμένου να γίνει η διαχρονική παρακολούθηση (monitoring) μιας τεχνικής κατασκευής ή της ΦΓΕ, ώστε να ελεγθεί η ύπαρξη παραμόρφωσης ή μετακίνησης. Ωστόσο, το σημαντικότερο μέρος του κεφαλαίου αυτού είναι η καταγραφή όλων των μοντέλων, τα οποία αναφέρονται ως συμβατικά γεωδαιτικά μοντέλα, και έχουν αναπτυχθεί για την ανίχνευση της μεταβολής της θέσης σημείων στο χώρο. Συγκεκριμένα, αναλύονται τα περιγραφικά μοντέλα (descriptive models) και τα μοντέλα αιτίας-αποτελέσματος (cause-response models). Σε επόμενο κεφάλαιο τα μοντέλα αυτά ελέγχονται για την ικανότητά τους στην πρόβλεψη της μεταβολής της θέσης και όχι μόνο στη παρακολούθηση του φαινομένου. Στο δεύτερο κεφάλαιο καταγράφεται και αναλύεται λεπτομερώς ότι αφορά στις χρονοσειρές, καθώς διαδραματίζουν πολύ σημαντικό ρόλο στην ανάπτυξη της τελικής μεθοδολογίας. Καταγράφονται όλοι οι βασικοί ορισμοί και οι βασικές έννοιες στατιστικής όπως επίσης και όλα τα ποιοτικά χαρακτηριστικά που μπορεί να υπάρχουν σε μια χρονοσειρά. Τέλος, αναλύεται και όποια διαδικασία φασματικής-συχνοτικής ανάλυσης (ανάλυση Fourier και ανάλυση Wavelet) η οποία μπορεί να πραγματοποιηθεί σε μια χρονοσειρά, εάν αυτό κριθεί απαραίτητο. Στο τρίτο κεφάλαιο, παρουσιάζεται η επιστήμη της πρόβλεψης γενικότερα, ως μετάφραση της ορολογίας "forecasting" και όχι "prediction" με ότι αυτό συνεπάγεται. Συγκεκριμένα, αναλύονται όλες οι μέθοδοι πρόβλεψης οι οποίες σήμερα χρησιμοποιούνται σε διάφορες επιστήμες (π.χ. Ιατρική, Οικονομία, Μετεωρολογία κ.ά.). Ο τρόπος διάκρισης γίνεται σε : -Ποσοτική πρόβλεψη (quantitative forecasting) που περιλαμβάνει τις μεθόδους χρονοσειρών (time series methods), τις αιτιοκρατικές ή επεξηγηματικές μεθόδους (causal relationship or explanatory methods) και τις μεθόδους τεχνητής νοημοσύνης (artificial intelligence methods). -Ποιοτική ή Κριτική πρόβλεψη (qualitative or judgmental forecasting) που περιλαμβάνει τις ατομικές μεθόδους (individual methods) και τις μεθόδους επιτροπής (committee methods). -Τεχνολογική πρόβλεψη (technological forecasting) που περιλαμβάνει τις διερευνητικές μεθόδους (exploratory methods) και τις κανονιστικές μεθόδους (normative methods). Κάθε μια από τις παραπάνω μεθόδους, όπως και όλες οι προαναφερθείσες υπο-κατηγόριες, αναλύονται σε αυτό το κεφάλαιο. Επιπλέον, καταγράφονται και αναλύονται όλα τα στάδια τα οποία πρέπει να ακολουθηθούν προκειμένου να παραχθεί τελικά μια πρόβλεψη ανεξαρτήτως της μεθόδου που θα χρησιμοποιηθεί. Πρόκειται για τα εξής: Ορισμός του προβλήματος → εύρεση διαθέσιμων δεδομένων υπό τη μορφή χρονοσειράς → προκαταρκτική ανάλυση δεδομένων → επιλογή μεθόδου → εφαρμογή μεθόδου → αξιολόγηση μεθόδου → παραγωγή και χρήση προβλέψεων. Επιπρόσθετα, δίνεται ιδιαίτερη έμφαση στην καταγραφή όλων των πιθανών κριτηρίων και στις περιπτώσεις στις οποίες το καθένα μπορεί να χρησιμοποιηθεί για την τελική αξιολόγηση οποιασδήποτε μεθόδου πρόβλεψης. Συνδυαστικά, αναλύονται και οι διάφορες τεχνικές αξιολόγησης, δίνοντας έμφαση στην τεχνική του διαχωρισμού των δεδομένων (split dataset), έτσι ώστε κάποια δεδομένα να χρησιμοποιηθούν στην αξιολόγηση της όποιας μεθόδου προκειμένου να είναι ανεξάρτητη και ανεπηρέαστη. Τέλος, αναλύεται ιδιαίτερα η σημαντικότητα του διαστήματος πρόβλεψης (prediction interval) καθώς κάθε πρόβλεψη περιέχει πάντα ένα ποσοστό αβεβαιότητας και έναν βαθμό ασάφειας. Δεύτερο μέρος Στο μέρος αυτό της διατριβής, το οποίο αποτελείται από δύο κεφάλαια (τα υπ. αρίθμ. 4 και 5), αναλύεται και τεκμηριώνεται η προτεινόμενη μεθοδολογία πρόβλεψης μεταβολής της θέσης σημείων στο χώρο βασιζόμενη σε ΤΝΔ. Συγκεκριμένα, στο τέταρτο κεφάλαιο παρουσιάζεται η προτεινόμενη διαδικασία ανάπτυξης του ΤΝΔ το οποίο εντάσσεται στην αυτοματοποιημένη μεθοδολογία. Αυτή βασίζεται σε μια μέθοδο η οποία είναι ορθή (accurate), σταθερή (stable) και γενική (general) ώστε να μπορεί να χρησιμοποιηθεί σε ίδιας φύσης διαφορετικά προβλήματα. H μεθοδολογία που προτείνεται ακολουθεί τα παρακάτω στάδια και χρησιμοποιεί τις αντίστοιχες τεχνικές. • Αρχικά ορίζεται το πρόβλημα ως πρόβλεψη μεταβολής της θέσης σημείου στο χώρο της φυσικής γήινης επιφάνειας ή μιας επιφάνειας γενικά. • Στη συνέχεια καθορίζεται εάν η μεθοδολογία αναφέρεται σε πρόβλεψη ενός χρονικού βήματος (one-step-ahead forecast) ή σε προβλέψεις πολλών μελλοντικών χρονικών στιγμών (multi-step-ahead forecast). • Ακολουθεί η ανάλυση των δεδομένων (data analysis), δηλαδή των χρονοσειρών των ιστορικών δεδομένων. Προτείνεται η εύρεση κάποιων βασικών υπολογιστικών μέτρων δηλαδή του μέσου όρου, της μέγιστης και ελάχιστης τιμής, της τυπικής απόκλισης, της συνδιακύμανσης, της αυτοδιακύμανσης, της συσχέτισης και της αυτοσυσχέτισης. • Επιπλέον προτείνεται να εξετάζονται και τα ποιοτικά χαρακτηριστικά της χρονοσειράς. Δηλαδή η πιθανή ύπαρξη τάσης, εποχικότητας, κυκλικότητας ή και τυχαιότητας καθώς διαδραματίζουν ιδιαίτερο ρόλο στην παραγωγή των προβλέψεων. • Ακολουθεί το στάδιο της προ-επεξεργασίας της χρονοσειράς. Στο στάδιο αυτό αντιμετωπίζονται προβλήματα όπως: κενές καταγραφές (missing values), πιθανές διπλές καταγραφές και όποιες έκτοπες τιμές (outliers). • Τελευταίο στάδιο αυτό της εκπαίδευσης του πλέον κατάλληλου ΤΝΔ, που αποτελεί και τον πυρήνα της μεθοδολογίας. Στο συγκεκριμένο πρόβλημα προτείνεται η χρήση των μη γραμμικών αυτοπαλινδρομικών NAR (non-linear autoregressive) αναδρομικών νευρωνικών δικτύων για πρόβλεψη ενός χρονικού βήματος και των μη γραμμικών αυτοπαλινδρομικών NARX (non-linear autoregressive with eXogenous inputs) με εξωγενείς εισόδους για πρόβλεψη πολλαπλών βημάτων. Τα ΤΝΔ αυτά δεν έχουν χρησιμοποιηθεί μέχρι σήμερα για πρόβλεψη μεταβολής της θέσης. Η επιλογή αυτή εξασφαλίζει ότι τα ΤΝΔ "εκπαιδεύονται" χρησιμοποιώντας τα ίδια τα δεδομένα της χρονοσειράς του εξεταζόμενου φαινομένου. Αυτό το στάδιο περιλαμβάνει επίσης όλα τα επιμέρους βήματα για τον προσδιορισμό όλων των υπερ-παραμέτρων του ΤΝΔ το οποίο τελικά θα χρησιμοποιηθεί. Επίσης περιλαμβάνει και όλα τα κριτήρια τα οποία χρησιμοποιούνται για την επιλογή του καταλληλότερου ΤΝΔ. o Κανονικοποίηση (normalization) των δεδομένων. o Διαχωρισμός των συνόλων εκπαίδευσης, επικύρωσης και δοκιμής. o Εκπαίδευση του δικτύου με παραδείγματα. o Δοκιμές στην επιλογή του αλγόριθμου εκπαίδευσης, της συνάρτησης μεταφοράς, του αριθμού των κρυφών νευρώνων, των κρυφών επιπέδων και καθυστερήσεων. o Επιλογή κριτηρίου αξιολόγησης. Η μεθοδολογία εκτός από το προτεινόμενο ΤΝΔ εξετάζει και τη χρήση κάποιων εκ των συμβατικών μεθόδων οι οποίες αναλύθηκαν. Ο σκοπός είναι η σύγκριση των παραγόμενων προβλέψεων που προκύπτουν από τις ευφυείς μεθόδους και από τις συμβατικές. Οι συμβατικές μέθοδοι οι οποίες εξετάζονται και τελικά συγκρίνονται είναι οι εξής : o Κινηματικό γραμμικό μοντέλο (kinematic linear model) o Κινηματικό πολυωνυμικό μοντέλο 2ου βαθμού (kinematic polynomial 2nd degree model) o Απλός μέσος (simple mean) o Απλός κινητός μέσος (simple moving average) o Διπλός κινητός μέσος (double moving average) o Απλή εκθετική εξομάλυνση (simple exponential smoothing) o Διπλή εκθετική εξομάλυνσης (double exponential smoothing, Brown's method) o Εκθετική εξομάλυνση με προσαρμογή στην τάση (Exponential smoothing adjusted for trend, Holt's method) o Αυτοπαλινδρομικές (αυτοαναδρομικές) μέθοδοι κινητού μέσου όρου (Autoregressive Moving Average Methods, ARMA) Το πέμπτο κεφάλαιο αφορά στην υλοποίηση μεθόδων πρόβλεψης μεταβολής της θέσης. Στο κεφάλαιο αυτό αρχικά αναφέρεται το λογισμικό υποστήριξης της προτεινόμενης μεθοδολογίας. Στη συνέχεια παρουσιάζονται τα αποτελέσματα που προέκυψαν εφαρμόζοντας τη μεθοδολογία σε πραγματικά δεδομένα μόνιμων σταθμών αναφοράς GNSS. Προτείνονται οι τρόποι επιλογής ενός αντιπροσωπευτικού δείγματος σε περιπτώσεις όπου τα διαθέσιμα δεδομένα είναι πάρα πολλά σε όγκο (σε αυτή την περίπτωση τρείς σταθμοί GNSS), καθώς αυτό αποτελεί και το βασικό μειονέκτημα χρήσης των ΤΝΔ ως μέθοδος πρόβλεψης. Τελικά, προτείνεται η χρήση του στωματοποιημένου τυχαίου δείγματος με χρήση του δείκτη της διακύμανσης των συγκεκριμένων διαθέσιμων χρονοσειρών Χ, Υ και Z. Παρουσιάζονται τα αποτελέσματα της προ-επεξεργασίας καθώς επίσης και τα αποτελέσματα της πρόβλεψης των συμβατικών μεθόδων που υλοποιήθηκαν, τόσο για ένα χρονικό βήμα (one-step) όσο και για πολλαπλά (multi-step), για τους τρείς σταθμούς του δείγματος. Τα ΤΝΔ που εκπαιδεύτηκαν είναι μη γραμμικά αυτοπαλινδομικά NAR (non-linear autoregressive) αναδρομικά για one-step πρόβλεψη και NARX (non-linear autoregressive with eXogenous inputs) με εξωγενείς εισόδους στην περίπτωση των πολλαπλών βημάτων. Η επιλογή του καταλληλότερου ΤΝΔ έγινε χρησιμοποιώντας ως κριτήριο τον συντελεστή προσδιορισμού R2 (coefficient of determination). Όλα τα εξεταζόμενα ΤΝΔ αποτελούνται από ένα κρυφό επίπεδο, έχουν ως συνάρτηση ενεργοποίησης των κρυφών νευρώνων και των νευρώνων εξόδου την logsig και διαφοροποιούνται αρχικά στα εξής σημεία : -στο διάστημα κανονικοποίησης δεδομένων εισόδου σε [-0.8,0.8] και [0.1,0.9] -στον τρόπο διαχωρισμού των δεδομένων σε τυχαίο διαχωρισμό (70%, 15%, 15%) και σε χρονολογικό (70%, 15%, 15%) -στον αλγόριθμο εκπαίδευσης trainlm, trainbfg και trainbr. Από αυτόν τον πρώτο διαχωρισμό δημιουργούνται 12 test sets. Το κάθε test set υλοποιεί τελικά 12 ξεχωριστά ΤΝΔ, για κάθε i σταθμό, τα οποία διαφοροποιούνται στα εξής: -στον αριθμό των κρυφών νευρώνων : min=5, max= 20, step= 5 -στον αριθμό των καθυστερήσεων : min= 2, max= 82, step= 40 Επομένως δημιουργήθηκαν 12 test sets για κάθε ένα από τα 14 σενάρια. Στο κάθε test set υλοποιούνται και εκπαιδεύονται 12 ΤΝΔ με διαφορετικές παραμέτρους για κάθε μόνιμο σταθμό GNSS. Συγκεκριμένα εκπαιδεύτηκαν : • 672 ΤΝΔ για κάθε σταθμό, για τα σενάρια I έως IV, δηλαδή 4 σενάρια υλοποιώντας τα test sets 1 έως 6 και το test set 9 (7 test sets × 4 σενάρια × 12 ΤΝΔ για one-step και αντίστοιχα για multi-step). Η γνώση που πρόεκυψε από την εκπαίδευση αυτών των ΤΝΔ βοήθησε στην μείωση του αριθμού των ΤΝΔ που εκπαιδευτήκαν στα επόμενα σενάρια καθώς υλοποιήθηκαν συγκεκριμένα test sets. • 288 ΤΝΔ για κάθε σταθμό, για τα σενάρια V έως X, δηλαδή 6 σενάρια υλοποιώντας τα test sets 3 και 9. (2 test sets × 6 σενάρια × 12 ΤΝΔ για one-step και αντίστοιχα για multi-step). • 96 ΤΝΔ για κάθε σταθμό, για τα σενάρια XI έως XIV, δηλαδή 4 σενάρια υλοποιώντας μόνο το test sets 3. (1 test set × 4 σενάρια × 12 ΤΝΔ για one-step και αντίστοιχα για multi-step). Άρα, τα ΤΝΔ που υλοποιήθηκαν ήταν 1056 για κάθε σταθμό για πρόβλεψη one-step και multi-step. Συνεπώς για τους 3 σταθμούς του δείγματος εκπαιδεύτηκαν 3168 ΤΝΔ. Τρίτο μέρος Στο τελευταίο μέρος της διατριβής, το οποίο αποτελείται από δύο κεφάλαια (τα υπ αριθμ. 6 και 7), παρουσιάζονται τα τελικά αποτελέσματα και το τελικό ΤΝΔ της μεθοδολογίας όπως επίσης τα συμπεράσματα και οι προτάσεις. Στο έκτο κεφάλαιο, παρουσιάζονται τα αποτελέσματα που προέκυψαν για την πρόβλεψη ενός χρονικού βήματος αλλά και πολλαπλών χρονικών βημάτων τόσο με χρήση συμβατικών μεθόδων όσο και με χρήση του προτεινόμενου ΤΝΔ, για τους 1000 εξεταζόμενους σταθμούς GNSS. Τελικά το προτεινόμενο ΤΝΔ είναι ένα μη γραμμικό αυτοπαλινδομικό NAR (non-linear autoregressive) αναδρομικό νευρωνικό δίκτυο και ένα NARX (non-linear autoregressive with eXogenous inputs) με εξωγενείς εισόδους στην περίπτωση των πολλαπλών βημάτων. Αποτελείται από ένα κρυφό επίπεδο και έχει ως συνάρτηση ενεργοποίησης των κρυφών νευρώνων και των νευρώνων εξόδου την logsig. Ο διαχωρισμός των δεδομένων γίνεται με χρονολογικό τρόπο (70%, 15%, 15%) και η κανονικοποίηση τους στο διάστημα [0.1,0.9]. Αλγόριθμος εκπαίδευσης είναι ο Bayesian regularization. Ο αριθμός των κρυφών νευρώνων είναι 10 και ο αριθμός των καθυστερήσεων 42 για προβλέψεις ενός βήματος. Ενώ για προβλέψεις πολλαπλών βημάτων είναι 20 νευρώνες και 2 καθυστερήσεις. Επιπλέον, αποφασίστηκε ως είσοδοι να είναι ανεξάρτητα οι συντεταγμένες X, Y και Z με τις αντίστοιχες εξόδους (δηλαδή τα σενάρια I, II και III). Επομένως, όσον αφορά τα ΤΝΔ εκπαιδεύτηκαν τελικά 3000 ΤΝΔ για το σύνολο των 1000 σταθμών GNSS (1000 GNSS × 3 σενάρια) για one-step πρόβλεψη και αντίστοιχα για multi-step, πέραν των αρχικών 3168 ΤΝΔ που εκπαιδεύτηκαν για την επιλογή με χρήση του δείγματος. Στο έβδομο και τελευταίο κεφάλαιο συνοψίζονται τα συμπεράσματα τα οποία προέκυψαν και γίνονται κάποιες προτάσεις για περαιτέρω έρευνα. Τελικά αποδεικνύεται ότι η προτεινόμενη μεθοδολογία η οποία βασίζεται σε ΤΝΔ μπορεί να δίνει προβλέψεις μεταβολής της θέσης σημείων στο χώρο της τάξης των 2mm με MAE 0.5 mm ενώ αντίστοιχα η βέλτιστη συμβατική μέθοδος - ARMA model (4,3) - με MAE 1.8mm. el
heal.abstract The aim of this dissertation is to develop a methodology based on the intelligent method of the Artificial Neural Networks (ANN). The proposed methodology successes forecasting the change of point position, i.e. the displacement or deformation of the surface that they belong to. It focuses both on the short-term and on the long-term forecasting of such a complex phenomenon. The motivation was the combination of two thoughts: the introduction of the concept of forecasting in most scientific disciplines (e.g. economics, meteorology, medicine) and the desire to know the future position of a point in a construction or in the crustal movements. The originality of the dissertation lies in: - The introduction of the concept of forecast in the science of Geodesy and the checking of the conventional geodetic deformation models in order to produce forecasts of the change of point positions. - The use of the science of "Knowledge Discovery in Databases-KDD" and, in particular, of data mining and analysis and preprocessing of big data. - The use of appropriate and selected conventional quantitative forecasting methods, which are used in sciences such as medicine and economics, in order to produce forecasts of the change of point positions. - The application of the Intelligent Artificial Neural Network (ANN) method to forecast the change of point positions. - The comparison of conventional methods with intelligent ones. - The development of an automated and integrated methodology, based on ANN, to forecast the position change in the space. This PhD dissertation is divided into three parts which are divided into chapters. First part This part of the dissertation, which consists of three chapters (the 1st, 2nd and 3rd), focuses on the detailed recording of the international bibliography of the scientific areas that are involved. Specifically, the dissertation is based on the combination of heterogeneous scientific areas in order to achieve the goal already mentioned. Therefore, each chapter of the first part is an in-depth reference to these different sciences. In the first chapter the change of point position is analyzed, as the ultimate goal is to forecast this phenomenon. There is a clear distinction between the terms deformation and displacement and the test standards developed (DIN and ISO) for deformation analysis are presented. Also, all the types of geodetic control networks that may be used in order to sustain a monitoring of a technical construction or the earth crustal, in order to check for displacement or deformation. The most important part of this chapter, however, is the recording of all the models, which are referred as conventional ones, and have been developed to detect the change of point positions. In particular, the descriptive models are analyzed in depth as well as the cause-response models. In a later chapter, these models are tested for their ability to forecast position change and not just to monitor such a phenomenon. The second chapter records and analyzes in detail all about the time series as they play a very important role in the development of the final methodology. All basic definitions and basic concepts of statistics are recorded as well as all qualitative features that may be included in a time series. Finally, any spectral analysis process (Fourier analysis and Wavelet analysis) which can be applied over a time series, is referred. In the third chapter, the forecasting science is presented in general. In particular, all the forecasting methods that are currently used in various sciences (e.g. medicine, economy, meteorology, etc.) are analyzed. The way of classification presented is the following: - Quantitative forecasting including time series methods, causal relationship or explanatory methods and artificial intelligence methods. - Qualitative or judgmental forecasting including individual methods and committee methods. - Technological forecasting including exploratory methods and normative methods. Each one of the above methods, as well as all the aforementioned sub-categories, are discussed in this chapter. In addition, all the steps to be followed are recorded and analyzed to ultimately produce a forecast regardless of the used method. These are the following: Problem definition → finding the available data in time series form → preliminary data analysis (data-preprocessing) → method choice → method application → method evaluation → production and use of forecasts. In addition, particular emphasis is given to the listing of all possible criteria and to the cases where each one can be used for the final evaluation of any forecast method. Moreover, various evaluation procedures are analyzed, emphasizing on the technique of "split dataset" which can be used to evaluate any forecasting method in order the evaluation to be bias-free. Finally, the significance of the prediction interval (PI) is emerged since each forecast always has a grade of uncertainty and a grade of ambiguity. Second part This part of the dissertation, which consists of two chapters (the 4th and the 5th), analyzes and substantiates the proposed methodology for forecasting the change of point position in the space based on ANNs. Specifically, the fourth chapter presents the proposed process for the development of the ANN, which is part of the automated methodology. The process is accurate, stable and general, so that it can be used for the same nature different problems. The proposed methodology consists of the following steps and uses the corresponding techniques. • Initially, the problem is defined as a forecasting of the change of the point position which belongs on the earth's crustal or on a construction's surface. • The methodology answers both to one-step-ahead forecasts and to multi-step-ahead forecasts. • The next step is the data analysis, i.e. the time series of the acquired historical data for the phenomenon. It is proposed to find some basic computational indexes, namely the mean, the maximum and the minimum value, the variance, the standard deviation, the covariance, the autocovariance, the correlation and the autocorrelation. • Next the qualitative characteristics of the time series must be examined. That is to detect the probable existence of trend, seasonality, cyclicality or even randomness as they play a special role in the production of forecasts. • The next step is the pre-processing of the time series. At this step, problems such as missing values, possible duplicate records, and any unusual outliers may be identified. • The last step is the training of the appropriate ANN, which is also the core of the methodology. The use of nonlinear autoregressive NAR networks for forecasting one time step and non-linear autoregressive with eXogenous inputs NARX for multi-step forecasting is proposed. This network has not been used again to forecast a change in position. It was chosen because it can be trained using the data of the time series of the phenomenon under consideration. This step also includes all the individual steps for identifying all the hyper-parameters of the ANN that will finally be used. It also includes all the criteria that are used to select the most appropriate ANN. - Normalization of the data. - Separation of training, testing and validation sets. - Network training with examples. - Tests in selecting the training algorithm, transfer function, number of hidden neurons, hidden layers and delays. - Select an evaluation criterion. The methodology in addition to the proposed ANN examines the use of some of the conventional methods that have been analyzed, for the same purpose. The scope is to compare the forecasts generated by intelligent methods to those which are provided by the conventional methods. The conventional methods that are examined and compared are the following: - Kinematic linear model - Kinematic polynomial 2nd degree model - Simple mean - Simple moving average - Simple exponential smoothing - Double moving average - Double exponential smoothing, Brown's method - Exponential smoothing adjusted for trend, Holt's method - Autoregressive Moving Average Methods, ARMA The fifth chapter concerns the implementation of all the above mentioned forecasting methods. This chapter initially refers the compilation of the software in order to support the proposed methodology. Moreover, the results which are obtained by applying the methodology to actual data acquired by permanent GNSS stations are presented. Different ways of choosing a representative sample, in cases where the available data is too much, are also recorded. The large number of available data creates the main disadvantage of the use of an ANN as a forecasting method because the training time increases rapidly. Finally, it is proposed to use stratified random sample by using the variance index of the available X, Y and Z time series. The results of the pre-processing are presented as well as the results of the forecasting of the selected conventional methods, both for one-step and for multi-step. The choice of the best ANN was made using the coefficient of determination (R2) as the selection criterion. At first, all the tested ANNs were consisted of one hidden layer and the activation function of the hidden and output neurons was the "logsig". The tests were initially differentiated in the following : - the input data normalization interval [-0.8,0.8] or [0.1.0.9] - the input data divides method into random separation (70%, 15%, 15%) or chronological (70%, 15%, 15%) - the training algorism trainlm, trainbfg or trainbr. From the above 12 test sets are created. Each test set eventually implements 12 separate ANNs which then differentiate into the following: - the number of hidden neurons: min = 5, max = 20, step = 5 - the number of delays: min = 2, max = 82, step = 40 Therefore, 12 test sets were created for each of the 14 scenarios. In each test set, 12 ANNs with different parameters are implemented and trained for each GNSS station. Specifically, for every GNSS station: • 672 ANNs were trained, for the scenarios I to IV, that is 4 scenarios, implementing the test sets 1 to 6 and the test set 9 (7 test sets × 4 scenarios × 12 ΑΝΝs for one-step and multi-step forecast respectively). The knowledge from their training helped the reduction of the number of the ANNs in total. • 288 ANNs were trained, for the scenarios V to X, that is 6 scenarios, implementing the test sets 3 and 9. (2 test sets × 6 scenarios × 12 ΑΝΝs for one-step and multi-step forecast respectively). • 96 ANNs were trained, for the scenarios XI to XIV, that is 4 scenarios, implementing the test set 3. (1 test set × 4 scenarios × 12 ΑΝΝs for one-step and multi-step forecast respectively). So, the ANNs that were implemented were 1056 for each station for one-step and multi-step forecasting. Therefore, for the 3 sample stations 3168 ANNs were trained. Third part The final part, which also consists of two chapters (the 6th and 7th), presents the final results and the final ANN of the methodology as well as the conclusions and proposals. Therefore, the sixth chapter presents the results obtained for forecasting one-step as well as multi-step both using conventional methods and using the proposed ANN. Finally the proposed ANN is a NAR (nonlinear autoregressive) recurrent neural network for one-step forecasts and a NARX (non-linear autoregressive with eXogenous inputs) in the case of multi-steps. It consists of one hidden layer and has as activation function of hidden neurons and output neurons the logsig function. Data is separated in chronological order (70%, 15%, and 15%) and their normalization is in the space [0.1, 0.9]. The training algorithm is Bayesian regularization. The number of hidden neurons is 10 and the number of delays 42 for one-step forecasts. While for multi-step forecasts there are 20 neurons and 2 delays. In addition, X, Y and Z coordinates have been decided to be separately the inputs , with the corresponding outputs (i.e. scenarios I, II and III). Therefore, 3000 ANNs were trained for all the 1000 GNSS stations (1000 GNSS × 3 scenarios) for the one-step forecasting, and other 3000 for the multi-step forecasting. The seventh and final chapter summarizes the conclusions that have emerged and makes some proposals for further research. It is finally proven that the proposed methodology, based on an ANN, can give forecasts of position change of the order of 2 mm with MAE of the order of 0.5 mm while the optimum conventional method -ARMA model (4,3)- with MAE 1.8 mm. en
heal.sponsor Ειδικός Λογαριασμός Κονδυλίων Έρευνας (ΕΛΚΕ) ΕΜΠ el
heal.advisorName Πανταζής, Γεώργιος el
heal.advisorName Pantazis, Georgios en
heal.committeeMemberName Δεληκαράογλου, Δημήτριος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Δουλάμης, Νικόλαος el
heal.committeeMemberName Λάμπρου, Ευαγγελία el
heal.committeeMemberName Πικριδάς, Χρήστος el
heal.committeeMemberName Σταθάς, Δημοσθένης el
heal.committeeMemberName Delikaraoglou, Dimitrios en
heal.committeeMemberName Stafylopatis, Andreas-Georgios en
heal.committeeMemberName Doulamis, Nikolaos en
heal.committeeMemberName Pikridas, Christos en
heal.committeeMemberName Lamprou, Evaggelia en
heal.committeeMemberName Stathas, Dimosthenis el
heal.academicPublisher Σχολή Αγρονόμων και Τοπογράφων Μηχανικών el
heal.academicPublisherID ntua
heal.numberOfPages 340
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής