Αυτόματος εντοπισμός περιοχών ενδιαφέροντος από δορυφορικές εικόνες με χρήση βαθιάς επεξηγήσιμης μάθησης

Μπήκας, Χρήστος; Bikas, Christos

dc.contributor.author	Μπήκας, Χρήστος	el
dc.contributor.author	Bikas, Christos	en
dc.date.accessioned	2024-06-21T10:20:36Z
dc.date.available	2024-06-21T10:20:36Z
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/59762
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.27458
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.subject	Αυτόματος εντοπισμός	el
dc.subject	Βαθιά μάθηση	el
dc.subject	Επεξηγήσιμη μάθηση	el
dc.subject	Σημασιολογική κατάτμηση	el
dc.subject	Πλήρως συνελικτικά δίκτυα	el
dc.subject	Deep Learning	en
dc.subject	Explainable AI	en
dc.subject	Semantic Segmentation	en
dc.subject	FCN	en
dc.subject	U-Net	en
dc.subject	CAM	en
dc.title	Αυτόματος εντοπισμός περιοχών ενδιαφέροντος από δορυφορικές εικόνες με χρήση βαθιάς επεξηγήσιμης μάθησης	el
dc.title	Automatic detection of regions of interest from satellite images using explainable deep learning	en
heal.type	bachelorThesis
heal.classification	Γεωπληροφορική - Φωτογραμμετρία	el
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2024-03-13
heal.abstract	Οι δορυφορικές εικόνες αποτελούν ένα από τα πιο χρήσιμα δεδομένα για την παρακολούθηση της γης και χρησιμοποιούνται σε πολλές εφαρμογές για τη μέτρηση, τον εντοπισμό, την παρακολούθηση της ανθρώπινης δραστηριότητας, αλλά και την παρακολούθηση του φυσικού περιβάλλοντος σε όλη την γη. Η μέθοδος του αυτόματου εντοπισμού στις δορυφορικές εικόνες αποτελεί μια εξαιρετικά σπουδαία πτυχή της ανάλυσης των γεωχωρικών αυτών δεδομένων, προωθώντας την αποτελεσματική, αξιόπιστη και επιταχυνόμενη ανάλυση τους, ανοίγοντας νέες προοπτικές σε πολλούς τομείς εφαρμογής. Η βαθιά μάθηση αναδεικνύεται ως βασικό εργαλείο στον αυτόματο εντοπισμό περιοχών ενδιαφέροντος από δορυφορικές εικόνες, διαθέτοντας τα πιο δημοφιλή μοντέλα για την εργασία της σημασιολογικής κατάτμησης, που απασχολεί την παρούσα διπλωματική. Ωστόσο, μια εργασία σημασιολογικής κατάτμησης σε δορυφορικές εικόνες διαθέτει πολλές προκλήσεις, όπως η πολυπλοκότητα και ποικιλομορφία του περιβάλλοντος, που σημαίνει μεγάλο πλήθος κλάσεων στις δορυφορικές εικόνες για κατηγοριοποίηση, η ύπαρξη πολλών διαφορετικών τύπων δεδομένων δορυφορικών εικόνων, καθώς και ο μεγάλος όγκος δεδομένων τους, που προκαλούν την ανάγκη για υψηλή υπολογιστική ισχύ και εμφανίζουν δυσκολία στην διαχείριση τους. Επομένως η διπλωματική αυτή έχει ως κύριο στόχο την αυτοματοποιημένη εξαγωγή των πέντε βασικών κατηγοριών (κτίρια, επιφάνειες, δρόμοι, βλάστηση, νερό), από ένα μικρό σύνολο δεδομένων με RGB δορυφορικές εικόνες, απαιτώντας μηδενικό κόστος και ελάχιστη υπολογιστική ισχύ σε συνδυασμό με την υψηλή ταχύτητα υλοποίησης των διαδικασιών. Το προτεινόμενο μοντέλο για την υλοποίηση των στόχων, είναι το πλήρως συνελικτικό νευρωνικό δίκτυο U-Net. Το δίκτυο αυτό μιμούμενο τον τρόπο εκπαίδευσης του ανθρώπινου εγκεφάλου, έχει την ιδιότητα μέσα από συνεχή επεξεργασία δεδομένων, να μπορεί να εντοπίζει και να χαρτογραφεί τις κατηγορίες σε νέες RGB εικόνες. Για την εκπαίδευση και αξιολόγηση του δικτύου, χρησιμοποιήθηκε το μικρό σύνολο δεδομένων “Dubai Dataset, by Humans in the Loop”. Με βάση τα αποτελέσματα εφαρμογής του μοντέλου στις εικόνες του dataset, αλλά και τις τιμές αξιολόγησης του, το μοντέλο πέτυχε μεγάλες αποδόσεις και ακρίβεια στον εντοπισμό της κάθε κατηγορίας. Ποσοτικά πέτυχε τιμές απώλειας 17.49%, ακρίβεια 93.65% και δείκτη jaccard 83.24% στο σετ εκπαίδευσης, με τις αντίστοιχες τιμές στο σετ επικύρωσης (val) να είναι της ίδιας τάξης μεγέθους και απόδοσης. Με σκοπό την περαιτέρω αξιολόγηση του και επαλήθευση της αξιοπιστίας του, πραγματοποιήθηκαν συγκρίσεις με μοντέλα που χρησιμοποιούνται από άλλες έρευνες για το ίδιο πρόβλημα εργασίας, αλλά και έγινε η εφαρμογή του σε μια δορυφορική εικόνα άλλου dataset από αυτό που εκπαιδεύτηκε. Τέλος, μέσω αναφοράς στην ενότητα της επεξηγήσιμης μάθησης και συγκεκριμένα την οπτικοποίηση της επξηγησιμότητας του μοντέλου με την μέθοδο CAM, πέρα από την εξασφάλιση της διαφάνειας του μοντέλου, έγινε εξαγωγή διαφόρων σημαντικών συμπερασμάτων.	el
heal.abstract	Satellite images are one of the most valuable datasets for monitoring Earth and are used in many applications for measuring, detecting, and tracking human activity, as well as monitoring the natural environment worldwide. The method of automatic detection in satellite images is an extremely significant aspect of the analysis of these geospatial data, promoting their efficient, reliable, and accelerated analysis, opening up new prospects in many application fields. Deep learning emerges as a fundamental tool in the automatic detection of areas of interest from satellite images, employing the most popular models for semantic segmentation, which is the focus of this thesis. However, semantic segmentation work on satellite images presents many challenges, such as the complexity and diversity of the environment, which means a large number of classes in satellite images for classification, the existence of many different types of satellite image data, and their large volume, leading to the need for high computational power and presenting difficulties in their management. Therefore, this thesis aims at the automated extraction of the five basic categories (buildings, surfaces, roads, vegetation, water) from a small dataset of RGB satellite images, requiring zero cost and minimal computational power in combination with high-speed implementation of processes. The proposed model for achieving these goals is the fully convolutional neural network U-Net. This network, mimicking the way the human brain is trained, and has the ability through continuous data processing, to identify concerned categories in new RGB images. For the training and evaluation of the network, the small dataset "Dubai Dataset, by Humans in the Loop" was used. Based on the application results of the model to the images of the dataset, as well as its evaluation values, the model achieved high performance and accuracy in detecting each category. Quantitatively, it achieved loss values of 17.49%, accuracy of 93.65%, and Jaccard index of 83.24% in the training set, with corresponding values in the validation set being of the same order of magnitude and performance. For further evaluation and verification of its reliability, comparisons were made with models used by other studies for the same work problem. Also the model was applied to a satellite image from another dataset than the one it was trained, in order to evaluate it more specific for real works. Finally, by referring to the explainable deep learning section and specifically the visualization of the model's explainability using the CAM method, beyond ensuring the transparency of the model, various important conclusions were drawn.	en
heal.advisorName	Δουλάμης, Αναστάσιος	el
heal.committeeMemberName	Δουλάμης, Νικόλαος	el
heal.committeeMemberName	Καράντζαλος, Κωνσταντίνος	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Φωτογραμμετρίας	el
heal.academicPublisherID	ntua
heal.numberOfPages	94 σ.	el
heal.fullTextAvailability	false