dc.contributor.author | Σαλάς, Εμμανουήλ | el |
dc.contributor.author | Salas, Emmanouil | en |
dc.date.accessioned | 2020-12-30T07:40:22Z | |
dc.date.available | 2020-12-30T07:40:22Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/52692 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.20390 | |
dc.description | Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Γεωπληροφορική” | el |
dc.rights | Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/gr/ | * |
dc.subject | Βαθιά μάθηση | el |
dc.subject | Τεχνητά νευρωνικά δίκτυα | el |
dc.subject | Συνελικτικά νευρωνικά δίκτυα | el |
dc.subject | U-net | el |
dc.subject | U-net αναλύσεως σε πολλαπλή κλίμακα | el |
dc.subject | Πολυκλαδικό U-net | el |
dc.subject | Γεωμορφολογικές δομές πυθμένα | el |
dc.subject | Ψηφιακό μοντέλο εδάφους | el |
dc.subject | Ωκεάνιες τάφροι | el |
dc.subject | Ηπειρωτική υφαλοκρηπίδα | el |
dc.subject | Ηπειρωτική κατωφέρεια | el |
dc.subject | Άβυσσος | el |
dc.subject | Μέσο-ωκεάνια ράχη | el |
dc.subject | Ρηξιγενής κοιλάδα | el |
dc.subject | Υποθαλάσσια οροσειρά | el |
dc.subject | Σημασιολογική κατάτμηση εικόνας | el |
dc.subject | Τηλεπισκόπηση | el |
dc.subject | Deep learning | en |
dc.subject | Artificial neural networks | en |
dc.subject | Convolutional neural networks | en |
dc.subject | U-net | en |
dc.subject | Multi-modal U-net | en |
dc.subject | Geomorphologic seabed features | en |
dc.subject | Digital terrain model | en |
dc.subject | Oceanic trench | en |
dc.subject | Continental shelf | en |
dc.subject | Continental slope | en |
dc.subject | Abyss | en |
dc.subject | Mid-oceanic ridge | en |
dc.subject | Rift valley | en |
dc.subject | Oceanic ridge | en |
dc.subject | Image semantic segmentation | en |
dc.subject | Remote sensing | en |
dc.subject | Multi-scale analysis U-net | en |
dc.title | Αυτόματη αναγνώριση γεωμορφολογικών δομών πυθμένα με χρήση συνελικτικών νευρωνικών δικτύων σε ψηφιακά μοντέλα υποθαλάσσιου αναγλύφου | el |
dc.title | Automatic identification of seabed geomorphologic features using convolutional neural networks in digital submarine terrain models | en |
heal.type | masterThesis | |
heal.classification | Γεωμορφολογία | el |
heal.classification | Βαθιά μάθηση | el |
heal.classification | Geomorphology | en |
heal.classification | Deep learning | el |
heal.access | campus | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2020-10-29 | |
heal.abstract | Η παρούσα διπλωματική εργασία έχει ως στόχο την εξέταση των τεχνικών βαθιάς μάθησης ως πιθανό εργαλείο αυτόματης αναγνώρισης των γεωμορφών του θαλάσσιου πυθμένα. Συγκεκριμένα εξετάζετε η δυνατότητα των συνελικτικών νευρωνικών δικτύων στην χαρτογράφηση των δομών αυτών, μέσω της κατάτμησης ψηφιακών μοντέλων υποθαλάσσιου αναγλύφου. Οι γεωμορφές πυθμένα που εξετάστηκαν στην παρούσα εργασία είναι η ηπειρωτική υφαλοκρηπίδα, η ηπειρωτική κατωφέρεια, η άβυσσος, οι ωκεάνιες τάφροι, οι ωκεάνιες οροσειρές, οι ρηξιγενείς κοιλάδες και οι μέσοωκεάνιες ράχες. Για την αποτελεσματική λειτουργία των νευρωνικών δικτύων, είναι απαραίτητη η ύπαρξη ενός συνόλου δεδομένων μεγάλου όγκου πληροφορίας. Αυτό πρέπει να αποτελείται από ζεύγη δεδομένων εισόδου και δεδομένων επαλήθευσης, μέσω των οποίων γίνεται η εκπαίδευση του νευρωνικού δικτύου. Μετά από έρευνα παρατηρήθηκε η απουσία συνόλου δεδομένων ειδικά σχεδιασμένο για το πεδίο των γεωμορφών του πυθμένα. Για τις ανάγκες της παρούσας μελέτης πραγματοποιήθηκε η κατασκευή, εκ του μηδενός, σύνολο δεδομένων εκπαίδευσης, το οποίο σχεδιάστηκε με γνώμονα τις ιδιαιτερότητες του προβλήματος. Τα δεδομένα εισόδου αποτελούνται από εικόνες διαστάσεων 512x512 και χωρική ανάλυση 175m, όπου τα διαφορετικά κανάλια περιέχουν πληροφορία ψηφιακού μοντέλου υποθαλάσσιου αναγλύφου και των διαφορετικών γεωμορφομετρικών δεικτών παραγόμενα από αυτό το μοντέλο. Οι γεωμορφομετρικοί δείκτες που περιέχονται στα δεδομένα εκπαίδευσης είναι η κλίση αναγλύφου (slope) και ο δείκτης τοπογραφικής θέσης ('topographic position index' TPI). Η πηγή του αρχικού μοντέλου προέρχεται από την διαδικτυακή πλατφόρμα European Marine Observation and Data Network (EMODnet) (“EMODnet Bathymetry Viewing and Download service,” n.d.). Τα δεδομένα επαλήθευσης αποτελούνται από εικόνες, ιδίων διαστάσεων και ανάλυσης, όπου ο αριθμός των καναλιών είναι ίσος με τον αριθμό των δομών που εξετάζονται στο σύνολο δεδομένων. Κάθε κανάλι αποτυπώνει τις περιοχές, όπου απαντάτε η εκάστοτε δομή πυθμένα. Η κατασκευή των δεδομένων επαλήθευσης πραγματοποιήθηκε χρησιμοποιώντας τα shapefile με γεωμορφές πυθμένα, τα οποία είναι αποτέλεσμα της μεθόδου ταξινόμησης των Harris et al., (2014). Για την κατασκευή του συνόλου δεδομένων σχεδιάστηκε και χρησιμοποιήθηκε ένα qgis μοντέλο με σκοπό την δημιουργία των εικόνων, οι οποίες στην συνέχεια επεξεργάζονται από κώδικα γλώσσας προγραμματισμού Python. Μέσω της ανωτέρω ακολουθίας εργαλείων κατασκευάστηκαν τέσσερα σύνολα δεδομένων, τα οποία αντιστοιχούν σε διαφορετικές γεωμορφές πυθμένα. Το πρώτο σύνολο δεδομένων αφορά τις δομές ηπειρωτική υφαλοκρηπίδα, ηπειρωτική κατωφέρεια, και άβυσσο με 500 ζεύγη παραδειγμάτων εκπαίδευσης. Το δεύτερο σύνολο δεδομένων αφορά την δομή ωκεάνιων τάφρων με 107 ζεύγη παραδειγμάτων εκπαίδευσης. Το τρίτο σύνολο δεδομένων αφορά την δομή μέσοωκεάνιων ραχών με 115 ζεύγη παραδειγμάτων εκπαίδευσης. Το τέταρτο σύνολο δεδομένων αφορά τις δομές ωκεάνιες οροσειρές και ρηξιγενείς κοιλάδες με 115 ζεύγη παραδειγμάτων εκπαίδευσης. Για τον σκοπό της χαρτογράφησης των δομών του πυθμένα εκπαιδεύτηκαν τέσσερα νευρωνικά δίκτυα σε κάθε σύνολο δεδομένων. Η βασική δομή νευρωνικού δικτύου που εξετάστηκε, στην οποία βασίζονται τα υπόλοιπα δίκτυα της παρούσας εργασίας, είναι η αρχιτεκτονική U-net, η οποία αναπτύχθηκε για την εκτέλεση σημασιολογικής κατάτμησης εικόνας. Τροποποιώντας την παραπάνω αρχιτεκτονική κατασκευάστηκαν τρία επιπλέον νευρωνικά δίκτυα. Με έμπνευση την εργασία των Farabet et. al., (2013), κατασκευάστηκε το Multi-Scale Analysis U-net, το οποίο επεξεργάζεται τα αρχικά δεδομένα εισόδου σε διαφορετικές αναλύσεις. Ακόμη συνδυάζοντας την αρχιτεκτονική του δικτύου των Du et. al.,(2019) και του U-net, κατασκευάστηκε το Multi-Modal U-net το οποίο επεξεργάζεται κάθε δείκτη των δεδομένων εισόδου ξεχωριστά. Τέλος συνδυάζοντας τις δύο αυτές αρχιτεκτονικές δικτύου, κατασκευάστηκε το Multi-Scale Analysis & Multi-Modal U-net, όπου συνδυάζει τον τρόπο λειτουργίας των δύο αυτών δικτύων. Τα νευρωνικά δίκτυα που περιγράφηκαν άνωθεν, κατασκευάστηκαν και εκπαιδεύτηκαν στο διαδικτυακό περιβάλλον προγραμματισμού Google Colaboratory σε γλώσσα Python, το οποίο κάνει χρήση GPU. Οι υπερπαράμετροι που χρησιμοποιήθηκαν παρέμειναν ίδιοι για όλα τα νευρωνικά δίκτυα κατά την εκπαίδευσή τους σε όλα τα σύνολα δεδομένων, ώστε να καταστεί δυνατή η σύγκρισή τους. Για την πραγματοποίηση της σύγκρισης των νευρωνικών δικτύων, έγινε υπολογισμός ορισμένων δεικτών αξιολόγησης. Κατά την σύγκριση, μεγάλη προσοχή δόθηκε στα οπτικά αποτελέσματα που παράγει το κάθε νευρωνικό δίκτυο. Για την δομή των ωκεάνιων τάφρων, σε όλα τα δίκτυα παρατηρήθηκαν σχετικά καλές τιμές δεικτών με την ορθότητα να κυμαίνεται στο 88-89%. Τα οπτικά αποτελέσματα για όλα τα νευρωνικά δίκτυα είναι σε γενικές γραμμές ίδια και σχετικά πιο περιορισμένα από τα δεδομένων επαλήθευσης. Για την δομή των ωκεάνιων μέσοωκεάνιων ραχών, τα δίκτυα παρουσίασαν αδυναμία ταξινόμησης τους. Για την δομή των ωκεάνιων οροσειρών, σε όλα τα δίκτυα παρατηρήθηκαν σχετικά μέτριες τιμές δεικτών με την ορθότητα να κυμαίνεται στο 82-83%. Τα οπτικά αποτελέσματα για όλα τα νευρωνικά δίκτυα παρουσίασαν ορισμένα λάθη στην ταξινόμηση, όμως σε ορισμένες περιπτώσεις μετά από εξέταση των δεδομένων εισόδου παρατηρήθηκε ότι τα λάθη αυτά οφείλονται σε ελλιπή δεδομένα επαλήθευσης. Για την δομή των ρηξιγενών κοιλάδων, παρατηρούνται τιμές δεικτών στο ίδιο εύρος με τις ωκεάνιες οροσειρές, εκτός του Multi-Modal U-net, που παρουσιάζει τιμή ορθότητα 78%. Ως προς τα οπτικά αποτελέσματα, παρατηρείται σε όλα τα δίκτυα σύγχυση των ρηξιγενών κοιλάδων και των ρωγματογενών ζωνών, οι οποίες έχουν παρόμοια μορφομετρικά χαρακτηριστικά αλλά δεν είναι ταξινομημένες στα δεδομένα επαλήθευσης. Τέλος ως προς το σύνολο δεδομένων των δομών βάσης το δίκτυο Multi-Scale Analysis & Multi-Modal U-net παρουσίασε τα καλύτερα αποτελέσματα και για τις τρείς γεωμορφές. Συγκεκριμένα για τον δείκτη ορθότητας καταγράφηκαν τιμές 96% για τις ηπειρωτικές υφαλοκρηπίδες, 85% για τις ηπειρωτικές κατωφέρειες και 89% για την άβυσσο. Το δίκτυο πραγματοποιεί ταξινομήσεις που είναι πολύ κοντά στα δεδομένα επαλήθευσης, ενώ επιλύει σε μεγάλο βαθμό την δυσκολία που παρουσιάζουν τα άλλα δίκτυα στην ταξινόμηση εικόνων όπου υπάρχει ανισορροπία των κλάσεων. | el |
heal.abstract | The current thesis is focused in examining deep learning techniques as a possible tool for automatic recognition of seabed features. Specifically, the ability of Convolutional Neural Networks in mapping these structures was assessed, through the segmentation of digital submarine terrain models. The seabed features examined as case study in the present work are the continental shelf, the continental slope, the abyss, the oceanic trenches, the ocean mountain ranges (ridges), the rift valleys and the mid-ocean ridges. For the efficient construction of a neural network, it is necessary to have a large data set of information. This should consist of input data and verification data pairs, through which the neural network training takes place. After thorough research, there was observed an absence of data sets specially designed for the field of seabed features. For the needs of the present study, training data sets were constructed, from the very beginning, and were designed having in mind the peculiarities of the problem. The input data consists of 512x512 images and 175m spatial resolution, where the different channels contain information of a Digital Submarine Terrain Model and the different geomorphometric indicators produced by this model. The geomorphometric indices included in the training data are the slope and the topographic position index (TPI). The source of the original Terrain Model comes from the online platform of the European Marine Observation and Data Network (EMODnet) (“EMODnet Bathymetry Viewing and Download service,” n.d.). The verification data consists of images of the same dimensions and spatial resolution as the input data, where the number of channels is equal to the number of features examined in the data set. Each channel captures the areas where the respective seabed feature is located. The verification data was constructed using seabed features shapefiles, which are the result of the classification method of Harris et al., (2014). To build the data set, a qgis model was designed and used to create the images, which are then processed in Python code. Through the upper sequence of tools, four data sets were constructed, which correspond to different seabed features. The first data set concerns the structures of continental shelf, continental slope, and abyss with 500 pairs of training examples. The second data set concerns the structure of ocean trenches with 107 pairs of training examples. The third data set concerns the structure of mid-oceanic ridges with 115 pairs of training examples. The fourth data set concerns the structures of ocean ridges and rift valleys with 115 pairs of training examples. For the purpose of mapping the seabed structures, four neural networks were trained in each data set. The basic neural network structure examined, on which the other networks of the present work are based, is the U-net architecture, which was developed to perform image semantic segmentation. By modifying the above architecture, three additional neural networks were constructed. Inspired by the work of Farabet et. al., (2013), the Multi-Scale Analysis U-net was constructed, which processes the initial input data in different scales. Also, combining the network architecture of Du et. al., (2019) and U-net, the Multi-Modal U-net was constructed which processes each input data index separately. Finally, combining these two network architectures, Multi-Scale Analysis & Multi-Modal U-net was built, where it combines the operation of these two networks. The neural networks described above, were constructed and trained in the Google Colaboratory online programming environment in Python, which uses GPU. The hyperparameters used remained the same for all neural networks during their training in all data sets, so that they could be compared with each other. To make the comparison of the referred neural networks, some evaluation indicators had to be calculated. When comparing the networks, great attention was paid to the visual results produced by the neural network. For the structure of the ocean trenches, relatively good indicator values were observed in all networks, with the accuracy ranging from 88-89%. The visual results for all neural networks are generally the same and relatively more restricted than the verification data. For the feature of the mid-oceanic ridges, the networks were unable to classify them. For the feature of the oceanic ridges, relatively moderate indicator values were observed in all networks with the accuracy ranging from 82-83%. The optical results for all neural networks showed some errors in the classification, but in some cases after the examination of the input data, it was observed that these errors are due to incomplete verification data. For the feature of the rift valleys, indicator values are observed in the same range as the oceanic ridges, except for the Multi-Modal U-net, which shows a value of 78%. In terms of visual results, confusion of rift valleys and fractured zones is observed in all networks, which have similar morphometric characteristics but are not classified in the verification data. Finally, regarding the data set of the base features, the Multi-Scale Analysis & Multi-Modal U-net network came up with the best results for all three geomorphs. Specifically for the accuracy index, values of 96% were recorded for the continental shelf, 85% for the continental slopes and 89% for the abyss. The network performs classifications that are very close to the verification data, while it largely solves the problem that other networks have, when there is a class imbalance. | en |
heal.advisorName | Αργιαλάς, Δημήτριος | el |
heal.committeeMemberName | Αργιαλάς, Δημήτριος | el |
heal.committeeMemberName | Καραθανάση, Βασιλεία | el |
heal.committeeMemberName | Καράντζαλος, Κωνσταντίνος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 166 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: