HEAL DSpace

Σημασιολογική κατάτμηση RGB και RGB-D εικόνων με χρήση μεθόδων Βαθιάς Μηχανικής Μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Τσιρώνης, Πέτρος el
dc.contributor.author Tsironis, Petros en
dc.date.accessioned 2022-02-10T12:16:45Z
dc.date.available 2022-02-10T12:16:45Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54690
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22388
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject Σημασιολογική κατάτμηση el
dc.subject Μηχανική μάθηση el
dc.subject Ορθοφωτογραφίες el
dc.subject Φωτογραμμετρία el
dc.subject Όραση υπολογιστών el
dc.subject Machine learning en
dc.subject Semantic segmentation en
dc.subject Orthoimages en
dc.subject Photogrammetry en
dc.subject Computer vision en
dc.title Σημασιολογική κατάτμηση RGB και RGB-D εικόνων με χρήση μεθόδων Βαθιάς Μηχανικής Μάθησης el
dc.title Semantic Segmentation of RGB and RGB-D images with the use of methods of Deep Machine Learning en
heal.type bachelorThesis
heal.classification Photogrammetry en
heal.classification Computer vision en
heal.classification Machine Learning en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-10
heal.abstract Η Μηχανική Μάθηση είναι ένας από τους σημαντικότερους τομείς των υπολογιστικών συστημάτων τα τελευταία χρόνια λόγω της ραγδαίας εξέλιξής της. Αυτό συνέβη καθώς πολλοί επιστημονικοί τομείς, όπως και η φωτογραμμετρία, βασίζονται πλέον στις μεθόδους αυτής, και κυρίως στην χρήση νευρωνικών δικτύων συνέλιξης (Convolutional Neural Networks, CNN), για την ανάπτυξη μοντέλων που διευκολύνουν και επιταχύνουν σημαντικά την έρευνα. Ειδικότερα, όπως και εδώ, τα δίκτυα αυτά χρησιμοποιούνται κατά κύριο λόγο για επίλυση προβλημάτων αναγνώρισης προτύπων στην Μηχανική Όραση (CV). Τα CNNs ανήκουν στις αλγοριθμικές αρχιτεκτονικές εκμάθησης αναπαραστάσεων, συνεπώς δεν χρειάζονται εξαγωγή χαρακτηριστικών από ανθρώπινο παράγοντα, αλλά εξάγουν αυτόματα τα χαρακτηριστικά που χρειάζονται βασιζόμενα στα δεδομένα που τους έχουν ήδη δοθεί. Η παρούσα διπλωματική εξετάζει πιο από τα CNN που χρησιμοποιούνται δίνει το καλύτερο δυνατό αποτέλεσμα για το πρόβλημα σημασιολογικής κατάτμησης ορθοφωτογραφιών μνημείων RGB και RGB-D, οι οποίες είναι εικόνες υπό συγκεκριμένη κλίμακα, οι οποίες μπορούν να αντιμετωπιστούν ως χάρτες και επιτρέπουν να πραγματοποιούνται μετρήσεις ακριβείας επάνω σε αυτές. Τα CNN που χρησιμοποιήθηκαν για την μελέτη είναι τα SegNet, U-Net, ResNet50 και 101 με βάσεις FCN και DeepLabV3. Για κάθε μια από τις παραπάνω αρχιτεκτονικές πραγματοποιήθηκαν στατιστικές μετρήσεις σε εικόνες, στις οποίες είχε πραγματοποιηθεί από πριν ταξινόμηση των διάφορων κατηγοριών που επιλέχθηκαν για την μελέτη. Βάσει των μετρήσεων αυτών επιλέχθηκε η αρχιτεκτονική με το καλύτερο δυνατό αποτέλεσμα για τον αυτοματισμό του κατάτμηση των ορθοφωτογραφιών που χρησιμοποιήθηκαν, καθώς και άλλων στο μέλλον. Επιπλέον παρουσιάζονται οι ρυθμίσεις που πραγματοποιήθηκαν για την βέλτιστη επιλογή του κάθε ενός CNN και η σημαντικότητα αυτών στον κώδικα που χρησιμοποιήθηκε για την βέλτιστη επίλυση του προβλήματος. Με βάση τα αποτελέσματα παρατηρείται η σημαντικότητα της επιλογής της αρχιτεκτονικής CNN και πόσο σημαντικός είναι ο ανθρώπινος παράγοντας και οι επιλογές ρυθμίσεων για την τελική εμφάνιση της σημασιολογικής κατάτμησης της κάθε εικόνας. el
heal.abstract Machine learning is one of the most important areas of computational systems of the recent years, because of its fast evolution. This happened because many scientific areas, like photogrammetry, are based on machine learning methods, and especially on the use of Convolutional Neural Networks (CNN), for the development of models that can reduce the amount of time and optimize surveys. Specifically, as in this study, these networks are used primarily for solving problems of pattern recognition in Computer Vision (CV). CNNs are categorized as algorithmic architectures of learning patterns, so they do not have the need of a human aspect for learning, but they extract automatically the characteristics based on the data that they were given. The current diploma thesis examines, which of the CNN architectures that is used gives the best output for the problem of semantic segmentation of RGB and RGB-D orthoimages of monument sites. Orthoimages are images of specific scale, which can be seen as maps and accurate measurements can be made on them. The architectures that were used for this research are SegNet, U-Net and ResNet50 and 101 with FCN and DeepLabV3 backbone. For each one of these architectures statistical measurements on images were made, on which were already drawn the chromatic categories that are used on this research. Based on those measurements the best architectures for solving the problem of automating the categorization of the cultural orthoimages used, and many other in the feature were selected. Also the best settings used are presented that were used for the final architecture selection and the importance of those for the optimization of solving the problem with the use of a certain algorithm. Based on the results one can comprehend the importance of selecting the architecture, of the human choices and the selection of settings used for the semantic segmentation of every image. en
heal.advisorName Γεωργόπουλος, Ανδρέας el
heal.committeeMemberName Γεωργόπουλος, Ανδρέας el
heal.committeeMemberName Ιωαννίδης, Χαράλαμπος el
heal.committeeMemberName Δουλάμης, Αναστάσιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Φωτογραμμετρίας el
heal.academicPublisherID ntua
heal.numberOfPages 86 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα