dc.contributor.author | Μπήκας, Χρήστος | el |
dc.contributor.author | Bikas, Christos | en |
dc.date.accessioned | 2024-06-21T10:20:36Z | |
dc.date.available | 2024-06-21T10:20:36Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/59762 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.27458 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Αυτόματος εντοπισμός | el |
dc.subject | Βαθιά μάθηση | el |
dc.subject | Επεξηγήσιμη μάθηση | el |
dc.subject | Σημασιολογική κατάτμηση | el |
dc.subject | Πλήρως συνελικτικά δίκτυα | el |
dc.subject | Deep Learning | en |
dc.subject | Explainable AI | en |
dc.subject | Semantic Segmentation | en |
dc.subject | FCN | en |
dc.subject | U-Net | en |
dc.subject | CAM | en |
dc.title | Αυτόματος εντοπισμός περιοχών ενδιαφέροντος από δορυφορικές εικόνες με χρήση βαθιάς επεξηγήσιμης μάθησης | el |
dc.title | Automatic detection of regions of interest from satellite images using explainable deep learning | en |
heal.type | bachelorThesis | |
heal.classification | Γεωπληροφορική - Φωτογραμμετρία | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2024-03-13 | |
heal.abstract | Οι δορυφορικές εικόνες αποτελούν ένα από τα πιο χρήσιμα δεδομένα για την παρακολούθηση της γης και χρησιμοποιούνται σε πολλές εφαρμογές για τη μέτρηση, τον εντοπισμό, την παρακολούθηση της ανθρώπινης δραστηριότητας, αλλά και την παρακολούθηση του φυσικού περιβάλλοντος σε όλη την γη. Η μέθοδος του αυτόματου εντοπισμού στις δορυφορικές εικόνες αποτελεί μια εξαιρετικά σπουδαία πτυχή της ανάλυσης των γεωχωρικών αυτών δεδομένων, προωθώντας την αποτελεσματική, αξιόπιστη και επιταχυνόμενη ανάλυση τους, ανοίγοντας νέες προοπτικές σε πολλούς τομείς εφαρμογής. Η βαθιά μάθηση αναδεικνύεται ως βασικό εργαλείο στον αυτόματο εντοπισμό περιοχών ενδιαφέροντος από δορυφορικές εικόνες, διαθέτοντας τα πιο δημοφιλή μοντέλα για την εργασία της σημασιολογικής κατάτμησης, που απασχολεί την παρούσα διπλωματική. Ωστόσο, μια εργασία σημασιολογικής κατάτμησης σε δορυφορικές εικόνες διαθέτει πολλές προκλήσεις, όπως η πολυπλοκότητα και ποικιλομορφία του περιβάλλοντος, που σημαίνει μεγάλο πλήθος κλάσεων στις δορυφορικές εικόνες για κατηγοριοποίηση, η ύπαρξη πολλών διαφορετικών τύπων δεδομένων δορυφορικών εικόνων, καθώς και ο μεγάλος όγκος δεδομένων τους, που προκαλούν την ανάγκη για υψηλή υπολογιστική ισχύ και εμφανίζουν δυσκολία στην διαχείριση τους. Επομένως η διπλωματική αυτή έχει ως κύριο στόχο την αυτοματοποιημένη εξαγωγή των πέντε βασικών κατηγοριών (κτίρια, επιφάνειες, δρόμοι, βλάστηση, νερό), από ένα μικρό σύνολο δεδομένων με RGB δορυφορικές εικόνες, απαιτώντας μηδενικό κόστος και ελάχιστη υπολογιστική ισχύ σε συνδυασμό με την υψηλή ταχύτητα υλοποίησης των διαδικασιών. Το προτεινόμενο μοντέλο για την υλοποίηση των στόχων, είναι το πλήρως συνελικτικό νευρωνικό δίκτυο U-Net. Το δίκτυο αυτό μιμούμενο τον τρόπο εκπαίδευσης του ανθρώπινου εγκεφάλου, έχει την ιδιότητα μέσα από συνεχή επεξεργασία δεδομένων, να μπορεί να εντοπίζει και να χαρτογραφεί τις κατηγορίες σε νέες RGB εικόνες. Για την εκπαίδευση και αξιολόγηση του δικτύου, χρησιμοποιήθηκε το μικρό σύνολο δεδομένων “Dubai Dataset, by Humans in the Loop”. Με βάση τα αποτελέσματα εφαρμογής του μοντέλου στις εικόνες του dataset, αλλά και τις τιμές αξιολόγησης του, το μοντέλο πέτυχε μεγάλες αποδόσεις και ακρίβεια στον εντοπισμό της κάθε κατηγορίας. Ποσοτικά πέτυχε τιμές απώλειας 17.49%, ακρίβεια 93.65% και δείκτη jaccard 83.24% στο σετ εκπαίδευσης, με τις αντίστοιχες τιμές στο σετ επικύρωσης (val) να είναι της ίδιας τάξης μεγέθους και απόδοσης. Με σκοπό την περαιτέρω αξιολόγηση του και επαλήθευση της αξιοπιστίας του, πραγματοποιήθηκαν συγκρίσεις με μοντέλα που χρησιμοποιούνται από άλλες έρευνες για το ίδιο πρόβλημα εργασίας, αλλά και έγινε η εφαρμογή του σε μια δορυφορική εικόνα άλλου dataset από αυτό που εκπαιδεύτηκε. Τέλος, μέσω αναφοράς στην ενότητα της επεξηγήσιμης μάθησης και συγκεκριμένα την οπτικοποίηση της επξηγησιμότητας του μοντέλου με την μέθοδο CAM, πέρα από την εξασφάλιση της διαφάνειας του μοντέλου, έγινε εξαγωγή διαφόρων σημαντικών συμπερασμάτων. | el |
heal.abstract | Satellite images are one of the most valuable datasets for monitoring Earth and are used in many applications for measuring, detecting, and tracking human activity, as well as monitoring the natural environment worldwide. The method of automatic detection in satellite images is an extremely significant aspect of the analysis of these geospatial data, promoting their efficient, reliable, and accelerated analysis, opening up new prospects in many application fields. Deep learning emerges as a fundamental tool in the automatic detection of areas of interest from satellite images, employing the most popular models for semantic segmentation, which is the focus of this thesis. However, semantic segmentation work on satellite images presents many challenges, such as the complexity and diversity of the environment, which means a large number of classes in satellite images for classification, the existence of many different types of satellite image data, and their large volume, leading to the need for high computational power and presenting difficulties in their management. Therefore, this thesis aims at the automated extraction of the five basic categories (buildings, surfaces, roads, vegetation, water) from a small dataset of RGB satellite images, requiring zero cost and minimal computational power in combination with high-speed implementation of processes. The proposed model for achieving these goals is the fully convolutional neural network U-Net. This network, mimicking the way the human brain is trained, and has the ability through continuous data processing, to identify concerned categories in new RGB images. For the training and evaluation of the network, the small dataset "Dubai Dataset, by Humans in the Loop" was used. Based on the application results of the model to the images of the dataset, as well as its evaluation values, the model achieved high performance and accuracy in detecting each category. Quantitatively, it achieved loss values of 17.49%, accuracy of 93.65%, and Jaccard index of 83.24% in the training set, with corresponding values in the validation set being of the same order of magnitude and performance. For further evaluation and verification of its reliability, comparisons were made with models used by other studies for the same work problem. Also the model was applied to a satellite image from another dataset than the one it was trained, in order to evaluate it more specific for real works. Finally, by referring to the explainable deep learning section and specifically the visualization of the model's explainability using the CAM method, beyond ensuring the transparency of the model, various important conclusions were drawn. | en |
heal.advisorName | Δουλάμης, Αναστάσιος | el |
heal.committeeMemberName | Δουλάμης, Νικόλαος | el |
heal.committeeMemberName | Καράντζαλος, Κωνσταντίνος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Φωτογραμμετρίας | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 94 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: