HEAL DSpace

Τεχνικές Βαθιάς Μάθησης για Σημασιολογική Κατάτμηση Εικόνων με 3 Κανάλια

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Τσαρπαλής, Ηλίας el
dc.contributor.author Tsarpalis, Ilias en
dc.date.accessioned 2022-04-11T09:10:10Z
dc.date.available 2022-04-11T09:10:10Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/55058
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22756
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Νευρωνικά Δίκτυα el
dc.subject Neural Networks en
dc.subject Σημασιολογική Κατάτμιση el
dc.subject Segmentation en
dc.subject Ανίχνευση Διαβρώσεων el
dc.subject Corrosion Detection en
dc.subject Πλήρως Συνελικτικό Δίκτυο el
dc.subject Fully Convolutional Network en
dc.subject Μνημείο Πολιτιστικής Κληρονομιάς el
dc.subject Cultural Heritage Monument en
dc.title Τεχνικές Βαθιάς Μάθησης για Σημασιολογική Κατάτμηση Εικόνων με 3 Κανάλια el
dc.title Deep Learning Techniques for 3 Channel Image Segmentation en
heal.type bachelorThesis
heal.classification Γεωπληροφορική - Λογισμικό el
heal.classification Geoinformation - Software en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-10-18
heal.abstract Η ανάπτυξη τεχνικών βαθιάς μάθησης νευρωνικών δικτύων σημειώνει ραγδαία ανάπτυξη την τελευταία δεκαετία βρίσκοντας εφαρμογή σε πολλούς επιστημονικούς κλάδους. Η δημιουργία τεράστιων βάσεων δεδομένων και η εύκολη πρόσβαση σε αυτά επιτρέπει την αποτελεσματική εκπαίδευση νευρωνικών δικτύων με υψηλές ακρίβειες. Τα αυτοκινούμενα οχήματα, η ανίχνευση και η αξιολόγηση ιατρικών δεδομένων και η παρακολούθηση παραμορφώσεων σε υφιστάμενες κατασκευές είναι μόνο μερικά από τα προβλήματα που μπορούν να αντιμετωπιστούν με πολύ καλές αποδόσεις από τα νευρωνικά δίκτυα. Η συγκεκριμένη εργασία με τίτλο «Τεχνικές Βαθιάς Μάθησης για Σημασιολογική Κατάτμηση Εικόνων με 3 Κανάλια», αφορά την ανίχνευση διαβρωμένων λίθων σε κομμάτι τείχους που βρίσκεται στο φρούριο του Αγίου Νικολάου στην Ρόδο. Η σημασιολογική κατάτμηση έγινε με την χρήση ενός νέου τύπου Πλήρως Συνελικτικού Νευρωνικού Δικτύου που κάνει χρήση των Residual Blocks και της Προσοχής (Attention), το Residual Attention U-Net. Στα πρώτα κεφάλαια γίνεται ανάλυση όλων των παραπάνω όρων και γενικότερα βασικών εννοιών που η γνώση τους θεωρήθηκε απαραίτητη για την πλήρη κατανόηση του προβλήματος και της προτεινόμενης λύσης του. Στην συνέχεια περιγράφεται η δομή του προτεινόμενου μοντέλου, καθώς και η διαδικασία πρόβλεψης της σημασιολογικής κατάτμησης των 3-κάναλων εικόνων. Τα δεδομένα συλλέχθηκαν με την βοήθεια του συστήματος HyperView που επιτρέπει την λήψη και την εξαγωγή ένωσης πραγματικών εικόνων και εικόνων υπέρυθρης ακτινοβολίας. Οι εικόνες αυτές ύστερα από κατάλληλη επεξεργασία, εισήλθαν στο νευρωνικό σαν δεδομένα για την εκπαίδευση και την εξαγωγή προβλέψεων σημασιολογικών μασκών σε περιβάλλον Python 3. Η αξιολόγηση των προβλέψεων έγινε με την χρήση των μεταβλητών accuracy, precision, recall και F1-score. Στην παρούσα διπλωματική εργασία έγινε προσπάθεια βέλτιστης πρόβλεψης των διαβρωμένων λίθων του υπό εξέταση τείχους, χρησιμοποιώντας στο σύνολο 11 εικόνες για την εκπαίδευση και την αξιολόγηση του νευρωνικού δικτύου. Παρά τον περιορισμένο αριθμό δεδομένων, το καινοτόμο δίκτυο Residual Attention U-Net ήταν ικανό να προβλέψει με επάρκεια το ποσοστό διάβρωσης του τείχους, γεγονός που το καθιστά ένα πολλά υποσχόμενο εργαλείο Μηχανικού για τον συνεχή έλεγχο βλαβών και μετατοπίσεων σε υφιστάμενες κατασκευές. Ωστόσο, θα πρέπει να τονιστεί ότι παρόλο που οι 11 εικόνες αρκούσαν για τη σωστή πρόβλεψη της ποσοστιαίας διάβρωσης, υψηλότερη ακρίβεια θα μπορούσε να επιτευχθεί με τη χρήση μεγαλύτερης βάσης δεδομένων. el
heal.abstract The development of new deep learning techniques is being prolific the last decade, with countless applications on a variety of scientific problems. Recently, big datasets are employed to train neural networks more efficiently and make predictions with high accuracy. Self-driving cars, medical imaging, and remote corrosion control on existing structures are only few of the problems that a neural network can deal with. This thesis, with title “Deep Learning Techniques for 3 Channel Image Segmentation”, is dealing with the problem of corrosion detection on part of a wall at the Agios Nikolaos for-tress of Rhodes. In order to complete this task, a Fully Convolutional Neural Network architecture is proposed, which makes use of the Residual Blocks and Attention, called Residual Attention U-Net. The aforementioned terms and the theoretical concepts are explained in the first chapter of the thesis, which are considered necessary to fully understand the nature of the problem and the proposed solution. Afterwards, the architecture of the proposed network is described, as the method to predict the image segmentation. The data was first collected using the HyperView system, which can take both Visual and Near-infrared Images and then they were combined to produce a 3-channel Image. After the post-processing procedure, the images and their binary masks, are used to train the model and make prediction on them using a software application realized in Python3. To evaluate the results of the predictions, the accuracy, precision, recall, and F1 scores have been used. Herein, an attempt of best prediction on the corroded stones of the wall was made, despite the small size of the data set, being 11 pictures in total. Nevertheless, the new deep learning technique of ResAttUNet (Residual Attention U-Net) could adequately predict the percentage of corroded stones on the wall, fact that makes it a great tool for the engineers for problems related to corrosion detection and displacement remote control. However, it is important to understand that although the neural network was able to predict well the percentage corrosion of the wall, more refined results could be achieved using a bigger data size. en
heal.advisorName Δουλάμης, Νικόλαος el
heal.committeeMemberName Γεωργόπουλος, Ανδρέας el
heal.committeeMemberName Ιωαννίδης, Χαράλαμπος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Φωτογραμμετρίας el
heal.academicPublisherID ntua
heal.numberOfPages 72 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα