Περίληψη:
Η συνεχής τεχνολογική εξέλιξη στα πεδία της γεωπληροφορικής και ειδικότερα της επεξεργασίας εικόνας (image processing), της όρασης υπολογιστών (computer vision), της Φωτογραμμετρίας (photogrammetry) και της Τηλεπισκόπησης (remote sensing), παρέχει νέα εργαλεία και αυτοματοποιημένες λύσεις για εφαρμογή σε μελέτες πολεοδομίας, χωροταξίας και κτηματολογίου. Εκτός από τις παραδοσιακές τεχνικές, που κάνουν χρήση δεδομένων που περιέχουν αμιγώς ραδιομετρική πληροφορία (εναέριες ή δορυφορικές εικόνες) για την αυτόματη ανίχνευση και κατάτμηση αντικειμένων ενδιαφέροντος ή την ταξινόμηση μίας περιοχής μελέτης, τα τελευταία χρόνια, η επιστημονική κοινότητα έχει στραφεί στη χρήση τρισδιάστατων (3Δ) νεφών σημείων, που προέρχονται είτε από εναέρια συστήματα LIDAR (LIght Detection and Ranging) είτε από τεχνικές πυκνής συνταύτισης εικόνων (Dense Image Matching-DIM). Από την εκτενή ανασκόπηση και διερεύνηση της σχετικής διεθνούς βιβλιογραφίας, προέκυψε πως η ανίχνευση, η κατάτμηση και ο εντοπισμός μεταβολών κτισμάτων από εικόνες και νέφη σημείων αποτελούν θέματα με προοπτική, δυναμική και μεγάλο ερευνητικό ενδιαφέρον, λόγω των ολοένα και μεγαλύτερων απαιτήσεων για ακρίβεια, ταχύτητα και οικονομία.
Στην παρούσα διατριβή γίνεται εκτενής και λεπτομερής προσέγγιση των επιστημονικών πεδίων της ανίχνευσης, της κατάτμησης και του εντοπισμού μεταβολών κτισμάτων από εικόνες και νέφη σημείων μέσα από την ανάπτυξη μίας ολοκληρωμένης μεθοδολογίας, με πρωτότυπα στοιχεία στα επιμέρους στάδιά της. Τα αποτελέσματα που προκύπτουν από το κάθε στάδιο αξιοποιούνται στο επόμενο έτσι ώστε τελικά να παραχθούν τα 3Δ μοντέλα κτισμάτων σε διάφορα επίπεδα λεπτομέρειας (Levels of Detail-LoDs).
Πιο συγκεκριμένα, πραγματοποιήθηκε ποιοτική και ποσοτική σύγκριση μεταξύ νεφών σημείων από LIDAR και DIM, αλλά και φωτογραμμετρικών προϊόντων (ορθοεικόνες) σε σύνθετες αστικές περιοχές με ιδιαίτερη αρχιτεκτονική και έντονες ασυνέχειες βάθους όπως και σε ημι-αστικές περιοχές. Ανάμεσα στα συμπεράσματα που προέκυψαν αξίζει να σημειωθεί ότι στις ημι-αστικές περιοχές, όπου το ανάγλυφο ήταν πιο ήπιο και χωρίς πολλές ανθρωπογενείς κατασκευές, οι διαφορές μεταξύ των δύο τύπων νεφών σημείων ήταν μικρές. Αυτό είχε ως αποτελέσματα την επίτευξη παρόμοιων ακριβειών στις παραγόμενες ορθοεικόνες. Αντιθέτως, στις αστικές περιοχές όπου παρατηρήθηκαν έντονες ασυνέχειες βάθους και αποκρύψεις, τα νέφη σημείων από DIM παρουσίασαν σημαντικές τοπικές παραμορφώσεις στα όρια των αντικειμένων. Αυτό είχε επίπτωση και στις παραγόμενες ορθοεικόνες παρουσιάζοντας αντίστοιχες αλλοιώσεις. Για την εξαγωγή των βέλτιστων αποτελεσμάτων στη διαδικασία DIM, απαιτείται η κατάλληλη παραμετροποίηση του εκάστοτε εφαρμοζόμενου αλγορίθμου. Επίσης, η μικρή πυκνότητα του νέφους σημείων από LIDAR είχε ως αποτέλεσμα την απουσία σημαντικής πληροφορίας στα όρια κάποιων κτισμάτων ενώ παράλληλα κάποια μικρά κτίσματα περιγράφηκαν μερικώς. Ωστόσο, τα νέφη σημείων από LIDAR παρουσίασαν ομοιογενείς ακρίβειες στις παραγόμενες ορθοεικόνες των αστικών και των ημι-αστικών περιοχών. Γενικά, τα προβλήματα που εμφανίστηκαν στα όρια των κτισμάτων, τόσο στα νέφη σημείων όσο και στις παραγόμενες ορθοεικόνες, επηρεάζουν σημαντικά τις επόμενες διαδικασίες ανίχνευσης, κατάτμησης και εντοπισμού μεταβολών κτισμάτων.
Στο πλαίσιο της διατριβής πραγματοποιήθηκε επίσης η διερεύνηση, αξιολόγηση και συλλογή κατάλληλων στοιχείων (κανάλια, δείκτες και χαρακτηριστικά) από τη διεθνή βιβλιογραφία με σκοπό την αξιοποίηση δεδομένων που προέρχονται μόνο από έναν δέκτη, δηλαδή είτε μόνο από φωτογραφική μηχανή (εικόνες ή και νέφη σημείων από DIM) είτε μόνο από εναέριο σαρωτή laser (νέφη σημείων από LIDAR). Δόθηκε έμφαση στα στοιχεία μέσω των οποίων επιτυγχάνεται ο διαχωρισμός των κτισμάτων από άλλα αντικείμενα όπως βλάστηση, έδαφος, δρόμοι κ.ά. Τα στοιχεία αυτά αφορούσαν είτε εναέριες εικόνες υψηλής ανάλυσης (ραδιομετρική πληροφορία) είτε νέφη σημείων από LIDAR ή DIM (υψομετρική πληροφορία). Αποδείχθηκε πως οι προτεινόμενες μεθοδολογίες που αξιοποιούν δεδομένα από ένα δέκτη και κάνουν είτε συνδυασμό ραδιομετρικής και υψομετρικής πληροφορίας (ορθοεικόνες με νέφη σημείων από DIM) είτε συνδυασμό κατάλληλων χαρακτηριστικών υψομετρικής πληροφορίας (για νέφη σημείων από LIDAR), πετυχαίνουν παρόμοιες ακρίβειες μεταξύ τους αλλά και παρόμοιες ακρίβειες με άλλες μεθοδολογίες που χρησιμοποιούν υψηλού κόστους ετερογενή δεδομένα (ορθοεικόνες με νέφη σημείων από LIDAR).
Παράλληλα, αναπτύχθηκαν δύο προσεγγίσεις για την ανίχνευση κτισμάτων και τον εντοπισμό των μεταβολών τους οι οποίες εφαρμόζουν: 1) τεχνικές μηχανικής μάθησης (machine learning), και 2) τεχνικές παραμετρικής μοντελοποίησης (model-based). Οι μέθοδοι εφαρμόστηκαν σε πληθώρα περιοχών μελέτης (ελληνικών και μη) και διαφόρων τύπων κτισμάτων, όπως και δεδομένων με διαφορετική ανάλυση προερχόμενα από διάφορους δέκτες. Συγκεκριμένα, αναπτύχθηκαν ένας αλγόριθμος βαθιάς μηχανικής μάθησης μέσω CNN (Convolutional Neural Network ή αλλιώς Συνελικτικό Νευρωνικό Δίκτυο), και μια νέα τεχνική ενίσχυσης χαρακτηριστικών μέσω συνέλιξης ανά γραμμής σάρωσης (scan line smooth filtering). Τόσο τα πειραματικά αποτελέσματα όσο και οι συγκρίσεις με άλλες τεχνικές της διεθνούς βιβλιογραφίας σε σετ δεδομένων αναφοράς της ISPRS (International Society for Photogrammetry and Remote Sensing), έδειξαν πως και οι δύο προσεγγίσεις μπορούν να επιτύχουν παρόμοιες ακρίβειες. Η επιλογή για το ποια από τις δύο προσεγγίσεις θεωρείται καταλληλότερη για την κάθε εφαρμογή εξαρτάται από διάφορους παράγοντες οι οποίοι επισημαίνονται στην παρούσα έρευνα. To CNN συγκρίθηκε και με άλλες ρηχές και τυπικές τεχνικές μηχανικής μάθησης όπως SVMs (Support Vector Machines ή αλλιώς Μηχανές Υποστήριξης Διανυσμάτων) και ANN (Artificial Neural Network ή αλλιώς Τεχνητό Νευρωνικό Δίκτυο) και αναδείχθηκε η σαφής υπεροχή του στις επιτυγχανόμενες ακρίβειες χρησιμοποιώντας μάλιστα μικρά ποσοστά δειγμάτων εκπαίδευσης. Ωστόσο, ο συνολικός υπολογιστικός χρόνος εκτέλεσης του CNN και ειδικότερα ο χρόνος εκπαίδευσης του είναι πολύ μεγαλύτερος από τις τεχνικές SVMs. Το πρόβλημα του μεγάλου υπολογιστικού χρόνου του CNN μπορεί να μειωθεί σημαντικά κάνοντας χρήση ενός σταθμού εργασίας με μεγαλύτερες δυνατότητες. Η χρήση μονάδας GPU ή/και η εφαρμογή εξελιγμένων τεχνικών μάθησης μπορούν επίσης να επιταχύνουν τη διαδικασία μάθησης.
Από την άλλη, ο SHT (3D Standard Hough Transform) και η μεταγενέστερη παραλλαγή του, ο RHT (3D Randomized Hough Transform), που μειώνει σημαντικά τον υπολογιστικό χρόνο του πρώτου, είναι δύο δημοφιλείς αλγόριθμοι, που ανήκουν στην κατηγορία των καθοδηγούμενων από τα δεδομένα μεθόδων (data driven) για την κατάτμηση οροφών κτισμάτων από νέφη σημείων. Αναπτύχθηκε νέα αρχιτεκτονική του συσσωρευτή στον παραμετρικό χώρο Hough και προτάθηκαν νέες επεκτάσεις του RHT, όπως: 1) πρόσθετοι γεωμετρικοί περιορισμοί αποκοπής για τη συλλογή της τριάδας σημείων, 2) πρόσθετο κριτήριο επιλογής για τον εντοπισμό των σημείων που ανήκουν στο προσδιορισθέν κυρίαρχο επίπεδο, 3) αυτόματη επιλογή υπο-περιοχών μέσω προσαρμοστικών σημείων, και 4) αυτόματη καθοδική ρύθμιση παραμέτρων. Βάσει των προτεινόμενων επεκτάσεων και της αρχιτεκτονικής του συσσωρευτή, προτάθηκαν πέντε παραλλαγές του RHT (iRHT, ΕRHT, eΕRHT, APRHT-C και APRHT-R) στις οποίες έγινε ανάλυση ευαισθησίας των παραμέτρων τους μέσα από εκτενείς πειραματικές εφαρμογές σε διάφορα είδη δεδομένων και τύπους κτισμάτων.
Η εφαρμογή του iRHT σε τυπικές περιπτώσεις κτισμάτων οδήγησε σε υπο-κατατμημένα, πλασματικά και υπερ-κατατμημένα επίπεδα. Οι eERHT, APRHT-C και APRHT-R ανταποκρίθηκαν καλύτερα σε σχέση με τον ERHT σε κατασκευές με αρχιτεκτονικές ιδιαιτερότητες και σε σύνθετες περιπτώσεις κτισμάτων. Παρά το γεγονός πως οι eERHT, APRHT-C και APRHT-R εξαγάγουν παρόμοια αποτελέσματα, οι δύο APRHTs εκτελούνται σε αρκετά μικρότερο υπολογιστικό χρόνο σε σχέση με τον eERHT. Αυτό παρατηρήθηκε τόσο σε κατασκευές με αρχιτεκτονικές ιδιαιτερότητες όσο και σε σύνθετες περιπτώσεις κτισμάτων. Παρόλα αυτά, για τυπικές περιπτώσεις κτισμάτων, ο ERHT εξάγει ικανοποιητικά αποτελέσματα μετά το στάδιο της μετα-επεξεργασίας απορροφώντας κυρίως περιπτώσεις πλασματικών και υπερ-κατατμημένων επιπέδων. Μάλιστα, πέτυχε μεγαλύτερες ακρίβειες από άλλες τεχνικές της διεθνούς βιβλιογραφίας όπως ο RANSAC. Παρόλα αυτά, ακόμα και μετά το στάδιο της μετα-επεξεργασίας, εντοπίστηκαν κάποια τοπικά υπο-κατατμημένα επίπεδα. Αυτά τα επίπεδα μπορούν να απορροφηθούν είτε ενισχύοντας το στάδιο της μετα-επεξεργασίας με πρόσθετες τεχνικές είτε χρησιμοποιώντας αυστηρότερη παραμετροποίηση μέσω της εφαρμογής των APRHT-C και APRHT-R. Αξιολογώντας ποιοτικά τα 3Δ μοντέλα των κτισμάτων που εξήχθησαν με εφαρμογή των ERHT και APRHT-C, προκύπτει ότι μπορούν να αξιοποιηθούν σε πληθώρα εφαρμογών, καθώς καλύπτουν επαρκώς τις προδιαγραφές των LoD 1 και LoD 2.