Στη συγκεκριμένη διπλωματική εργασία σχεδιάστηκαν, αναπτύχθηκαν και αξιολογήθηκαν αλγόριθμοι τηλεπισκόπησης, με απώτερο σκοπό τη διαχείριση και ανάλυση μεγάλων γεωχωρικών δεδομένων. Για το σκοπό αυτό, χρησιμοποιήθηκαν δορυφορικά τηλεπισκοπικά δεδομένα από το δορυφόρο Landsat 8, καθώς και ελεύθερα διανυσματικά δεδομένα από αντίστοιχους ανοικτούς ιστοχώρους.
Πιο συγκεκριμένα, ο σχεδιασμός επικεντρώθηκε στην αποτελεσματική αντιμετώπιση εφαρμογών ανίχνευσης μεταβολών, αξιοποιώντας διαδικασίες μηχανικής μάθησης σε μεγάλα δεδομένα παρατήρησης της γης. Προς την κατεύθυνση αυτή, αναπτύχθηκαν και αξιολογήθηκαν αλγόριθμοι σε όλα τα στάδια της ανάλυσης των τηλεπισκοπιών δεδομένων, δίνοντας ιδιαίτερη έμφαση στην προεπεξεργασία τους. Αρχικά, στο στάδιο της προεπεξεργασίας των δεδομένων αναπτύχθηκαν λογισμικά, σε γλώσσα προγραμματισμού C/C++, που πραγματοποιούν τις απαραίτητες ραδιομετρικές διορθώσεις σύμφωνα με τη βιβλιογραφία της USGS. Παράλληλα, αναπτύχθηκε λογισμικό που ανιχνεύει και αφαιρεί σύννεφα και σκιές από μια απεικόνιση λαμβάνοντας υπόψη διαχρονικά δεδομένα και χρονοσειρές του ίδιου δορυφόρου. Επίσης, στον πυρήνα της μεθοδολογίας που αναπτύχθηκε εφαρμόζονται διαδικασίες μηχανικής μάθησης καθώς και εξόρυξης δεδομένων (data mining) σε αλγορίθμους ταξινόμησης, με στόχο τη δημιουργία και εφαρμογή ενός στατιστικού μοντέλου εκπαίδευσης για την ταξινόμηση περιοχών που δεν συμμετείχαν στη διαδικασία εκπαίδευσης. Τέλος, τα αποτελέσματα που προέκυψαν από τις επεξεργασίες αποθηκεύονται σε γεωχωρική βάση και ενσωματώνονται σε δοκιμαστική έκδοση εφαρμογής διαδικτυακού συστήματος GIS για τη διαχείριση, απεικόνιση και διάθεσή τους.
Όλα τα εργαλεία που χρησιμοποιούνται στο πλαίσιο της διπλωματικής εργασίας αξιοποιούν λογισμικά και δεδομένα που διέπονται από τις αρχές του ανοιχτού λογισμικού και των ανοιχτών προτύπων αντίστοιχα. Πιο συγκεκριμένα, χρησιμοποιούνται λογισμικά όπως είναι το οrfetoolbox, το qgis, η βιβλιοθήκη OpenCV κ.α. Επιπλέον, τα προγράμματα που δημιουργήθηκαν διέπονται και αυτά από τις αρχές του ελεύθερου λογισμικού και χαρακτηρίζονται από την άδεια GNU General Public License με σκοπό την περαιτέρω έρευνα και βελτίωσή τους.
In this Diploma Thesis are designed, developed and evaluated remote sensing algorithms, which are designed with the underlying aim to manage and analyze big geospatial data. For this purpose, remote sensing data from the satellite Landsat 8 and freely vector data from the respective websites were used.
As part of this work, it was attempted to devise a methodological approach that can effectively address change detection applications, utilizing machine learning processes in big data, for earth observation purposes. For this purpose, algorithms and programs were created and evaluated at all stages of the analysis process, placing great emphasis on the preprocessing of the data. At the stage of preprocessing programs, in C/C++ computer language, were developed which accomplish the necessary radiometric processing for data of Landsat 8, in accordance to the official bibliography of USGS. Moreover, a program that detects and removes clouds and shadows of a scene, taking into account multitemporal data and time series of the same satellite, was developed and tested in various areas of interest. The methological approach that is presented, takes advantage of machine learning procedures and data mining techniques in order to implement a statistical learning model, which can classify areas that weren’t involved in the training process. Finally, the results that were produced from the processings were stored in geospatial database and incorporated in demo Web Gis application for their management, display and disposal.
The aim of this thesis was also to use software and data governed by the principles of open source and open standars, respectively. More specifically, software such as orfeotoolbox, Qgis and the library OpenCV were used in all the stages of the analysis. Additionaly, the programs that were created are also governed by the principles of free software and are characterized by the licence GNU General Public Licence for further research and improvement.