HEAL DSpace

Ανίχνευση αντικειμένων σε τηλεπισκοπικά δεδομένα με τεχνικές βαθιάς μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Γιαννακέλος, Κωνσταντίνος el
dc.contributor.author Giannakelos, Κωνσταντίνος en
dc.date.accessioned 2022-03-29T12:14:39Z
dc.date.available 2022-03-29T12:14:39Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/55007
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22705
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση" el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject ́Οραση υπολογιστών el
dc.subject Βαθιά μηχανική μάθηση el
dc.subject Ανίχνευση αντικειμένων el
dc.subject Κατάτμηση στιγμιότυπου el
dc.subject Τηλεπισκόπηση el
dc.subject Computer vision en
dc.subject Deep learning en
dc.subject Object detection en
dc.subject Instance segmentation en
dc.subject Remote sensing en
dc.title Ανίχνευση αντικειμένων σε τηλεπισκοπικά δεδομένα με τεχνικές βαθιάς μάθησης el
dc.title Deep Object Detectors for Remote Sensing Data en
heal.type masterThesis
heal.classification ́Οραση Υπολογιστών el
heal.classification Βαθιά Μηχανική Μάθηση el
heal.classification Ανίχνευση Αντικειμένων el
heal.classification Κατάτμηση Στιγμιότυπου el
heal.classification Τηλεπισκόπηση el
heal.classification Computer Vision en
heal.classification Deep Learning en
heal.classification Object Detection en
heal.classification Instance Segmentation en
heal.classification Remote Sensing el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-11-01
heal.abstract Με την ευρεία χρήση πολλών διαφορετικών τύπων αισθητήρων τα τελευταία χρόνια, έχουν δημιουργηθεί και αναλυθεί μεγάλες ποσότητες διαφορετικών και πολύπλοκων δεδομένων για την εξαγωγή χρήσιμων πληροφοριών. Μετά τις πρόσφατες συμβολές στην ́Οραση Υπολογιστών, έχουν αναπτυχθεί καινοτόμοι αλγόριθμοι και μέθοδοι για τη βελτίωση της παρατήρησης σε εικόνες Tηλεπισκόπησης χρησιμοποιώντας τεχνικές Βαθιάς Μηχανικής Μάθησης, όπως τα Συνελικτικά Νευρωνικά Δίκτυα (ΣΝΔ). Μερικές από τις πιο σημαντικές μεθόδους ερμηνείας είναι η ανίχνευση αντικειμένων.Η ανίχνευση αντικειμένων είναι ένα σημαντικό μέρος του συστήματος επεξεργασίας εικόνας, ειδικά για εφαρμογές σε τομείς όπως η επιτήρηση γης, η παρακολούθηση της κυκλοφορίας, η διαχείριση καταστροφών, η έξυπνη στάθμευση ή ο πολεοδομικός σχεδιασμός. Ως εκ τούτου, η απόδοση των ανιχνευτών αντικειμένων παίζει σημαντικό ρόλο στη λειτουργία τέτοιων συστημάτων. Σε αυτή τη μελέτη, διεξάγουμε μια ενδελεχή έρευνα και αξιολόγηση των υφιστάμενων αλγορίθμων ανίχνευσης αντικειμένων βασισμένων σε βαθιά μάθηση τελευταίας τεχνολογίας που χρησιμοποιούνται στην εναέρια απεικόνιση. Η παρούσα διπλωματική εργασία χωρίζεται σε τρία κύρια μέρη. Το πρώτο μέρος της διερευνά τους πιο σύγχρονους αλγόριθμους ανίχνευσης αντικειμένων καθώς και μερικούς από τους πιο διάσημους αλγόριθμους σημασιολογικής κατάτμησης και κατάτμησης στιγμιότυπου. Ο στόχος είναι να εντοπιστούν τα προβλήματα που υπάρχουν στις εναέριες εικόνες ή στους σύγχρονους ανιχνευτές αντικειμένων και να κατανοηθούν οι προτεινόμενες προσεγγίσεις για την επίλυσή τους. Στο επόμενο μέρος της διπλωματική εργασίας, οι δύο βασικές αρχιτεκτονικές ανίχνευσής αντικειμένων, Faster R-CNN και RetinaNet, καθώς και τα τέσσερα σύγχρονες μέθοδοι ανίχνευσης αντικειμένων, DCL RetinaNet, R3Det, S2ANet και το SCRDET++, αξιολογούνται στο DOTA, ένα δημοσίως διαθέσιμο σύνολο δεδομένων που εμπεριέχει εναέριες εικόνες μεγάλης κλίμακας, κατάλληλο για εφαρμογή αλγορίθμων ανίχνευσης αντικειμένων. Τα Faster R-CNN, RetinaNet S2ANet εκπαιδεύονται από την αρχή σύνολο δεδομένων, ενώ τα υπόλοιπα μοντέλα που χρησιμοποιούνται είναι ήδη προεκπαιδευμένα. ́Ολα τα αποτελέσματα της αξιολόγησης αναλύονται λεπτομερώς ενώ οι σύγχρονες μέθοδοι συγκρίνονται μεταξύ τους για να επισημανθούν τυχόν δυνατά σημεία ή αδυναμίες. Στο τελευταίο μέρος της διπλωματική εργασίας, προτείνεται το ΣΝΔ S2AU-Net, ένας αλγόριθμος κατάτμησης στιγμιότυπου που επεκτείνει τον S2ANet, έναν από τους σύγχρονους αλγόριθμους ανίχνευσης αντικειμένων που μελετήθηκαν, με το U-Net, ένας αλγόριθμος σημασιολογικής κατάτμησης που χρησιμοποιείται σε εικόνες βιοϊατρικής. Ομοίως, η απόδοσή του αξιολογείται στο iSAID, ένα δημοσίως διαθέσιμο σύνολο δεδομένων που εμπεριέχει εναέριες εικόνες μεγάλης κλίμακας κατάλληλο για εφαρμογή αλγορίθμων σημασιολογικής κατάτμησης και κατάτμησης στιγμιότυπου. Η μέθοδος παράγει ικανοποιητικά αποτελέσματα συγκρίσιμα με εκείνα της D2Det, μιας άλλης μεθόδου κατάτμησης στιγμιότυπου, που επιτυγχάνει αποτελέσματα αιχμής στο iSAID. Τέλος, εξάγονται συμπεράσματα σχετικά με τη δυνατότητα εφαρμογής κάθε μεθόδου και προτείνονται μελλοντικές κατευθύνσεις που μπορούν να βελτιώσουν την απόδοση τόσο των αναφερθέντων μεθόδων ανίχνευσης αντικειμένων όσο και της προτεινόμενης μεθόδου. el
heal.abstract With the widespread usage of many different types of sensors in recent years, large amounts of diverse and complex sensor data have been generated and analyzed to extract useful information. Thanks to recent advancements in Computer Vision, innovative algorithms and methods have been developed to improve observation on remote sensing images using Deep Learning techniques such as the Convolutional Neural Networks (CNN). Some of the most important interpreting methods is Object Detection. Object detection is an important part of the image processing system, especially for applications in areas such as land surveillance, traffic surveillance and tracking, disaster management, smart parking or urban planning. Hence, the performance of object detectors plays an important role in the functioning of such systems. In this study, we conduct a thorough investigation and evaluation of existing state-of-the-art Deep Learning-based Object Detection algorithms used in Aerial Imagery. The current thesis is divided into three main parts. The first part of the thesis investigates the current state-of-the-art object detection algorithms as well as some of the most famous semantic/instance segmentation algorithms and summarize the related work. The goal is to identify the existing problems in Aerial Imagery or modern object detectors and understand their proposed approaches towards solving them. In the next part of the thesis, two baseline CNN models, Faster R-CNN and RetinaNet, and the four state-of-the-art object detection CNN models, DCL RetinaNet, R3Det, S2ANet and SCRDET++, are evaluated on DOTA a publicly available large scale Aerial Imagery dataset suitable for object detection. In particular, Faster R-CNN, RetinaNet S2ANet are trained from scratch while the rest of the models used are already pretrained on the dataset. All evaluation results are analyzed while state of the art methods are compared with each other to highlight any strengths or weaknesses. In the final part of the thesis, S2AU-Net is proposed, an Instance Segmentation algorithm which extends S2ANet, one of the studied state of the art object detection algorithms, with U-Net, a semantic segmentation method used in biomedical image segmentation. Likewise, its performance is evaluated on iSAID, a publicly available large scale Aerial Imagery dataset suitable for Instance Segmentation. The method produces satisfactory results comparable to those of D2Det, another Instance Segmentation method which achieves state of the art results on iSAID. Finally, conclusions regarding the applicability of each method are drawn and future direc- tions are suggested to enhance the performance of both object detection and proposed methods. en
heal.advisorName Καράντζαλος, Κωνσταντίνος el
heal.advisorName Karantzalos, Konstantinos en
heal.committeeMemberName Karantzalos, Konstantinos en
heal.committeeMemberName Vakalopoulou, Maria en
heal.committeeMemberName Papoutsis, Ioannis en
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 90 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα