HEAL DSpace

Ανίχνευση κτιρίων με χρήση βαθιάς μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ατζαράκη, Άννα el
dc.contributor.author Atzaraki, Anna en
dc.date.accessioned 2023-01-20T10:47:53Z
dc.date.available 2023-01-20T10:47:53Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56806
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.24504
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Γεωπληροφορική” el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Βαθιά μάθηση el
dc.subject Τεχνητή νοημοσύνη el
dc.subject Συνελικτικά νευρωνικά δίκτυα el
dc.subject Ανίχνευση αντικειμένων el
dc.subject Ανίχνευση κτιρίων el
dc.subject Δείγματα εκπαίδευσης el
dc.subject ResNet34 en
dc.subject Artificial intelligent en
dc.subject Object detection en
dc.subject Building detection en
dc.subject Resnet34 en
dc.subject Ssd en
dc.subject Training samples en
dc.subject Resnet34 en
dc.subject Ssd en
dc.subject Convolutional neural network en
dc.subject Deep learning en
dc.title Ανίχνευση κτιρίων με χρήση βαθιάς μάθησης el
dc.title Building detection using deep learning en
heal.type masterThesis
heal.classification Τηλεπισκόπηση el
heal.classification Βαθιά Μάθηση el
heal.classification Remote sensing en
heal.classification Deep learning el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-10-31
heal.abstract Οι εφευρέτες ονειρευόντουσαν από καιρό να δημιουργήσουν μηχανές που σκέφτονται. Αυτή η επιθυμία χρονολογείται από πίσω τουλάχιστον στην εποχή της αρχαίας Ελλάδας. Οι μυθικές μορφές Πυγμαλίων, Δαίδαλος, και ο Ήφαιστος μπορούν όλοι να ερμηνευθούν ως θρυλικοί εφευρέτες και η Γαλάτεια, ο Τάλως, και η Πανδώρα μπορούν όλοι να θεωρηθούν ως τεχνητή ζωή (Ovid & Martin, 2004, Sparkes, 1996; Tandy, 1997). Τα τελευταία χρόνια, ο τομέας της τεχνητής νοημοσύνης παρουσιάζει σημαντική ανάπτυξη και ιδιαίτερα στις τεχνικές βαθιάς μάθησης οι οποίες καλούνται να αντιμετωπίσουν πληθώρα προβλημάτων ως προς την ανίχνευση αντικειμένων. Η παρούσα εργασία εμβαθύνει στην αυτόματη ανίχνευση κτιρίων και στην ανάλυση της μελέτης αυτής για τον εντοπισμό των κτιρίων μέσω τεχνικών βαθιάς μάθησης. Η εργασία διεκπεραιώθηκε με το λογισμικό ArcGIS Pro της εταιρίας ESRI, διεθνής προμηθευτής λογισμικού συστημάτων γεωγραφικών πληροφοριών, διαδικτυακών GIS και εφαρμογών διαχείρισης βάσεων γεωγραφικών δεδομένων. Στο περιβάλλον του λογισμικού αναπτύχθηκε μελέτη με βάση τη βαθιά μάθηση για την ανίχνευση κτιρίων. Ως δεδομένο για την επίτευξη των στόχων της εργασίας, χρησιμοποιήθηκε μια αεροφωτογραφία έτους 2019 και αποτελεί προϊόν της προπτυχιακής μου εργασίας. Δημιουργήθηκε έπειτα από δεδομένα που συλλέχθηκαν μέσω πτήσης UAS ενώ περιοχή μελέτης είναι η Βρίσα Λέσβου. Η ανάλυση περιλάμβανε τη δημιουργία δειγμάτων εκπαίδευσης και την εκπαίδευση μοντέλων βαθιάς μάθησης με κύριο στόχο την ανίχνευση των κτιρίων της περιοχής. Συνολικά δημιουργήθηκαν – ψηφιοποιήθηκαν 280 δείγματα εκπαίδευσης κτιρίων. Για τις ανάγκες της εργασίας, εκπαιδεύτηκαν τρία μοντέλα με βαθιά μάθηση σύμφωνα με διαφορετικές παραμέτρους. Για την ανίχνευση των κτιρίων πραγματοποιήθηκαν δώδεκα πειράματα, τρία για κάθε μοντέλο βαθιάς μάθησης. Πιο συγκεκριμένα η παρούσα μελέτη εστιάζει στην ορθή ανίχνευση των κτιρίων, εξετάζει τι αποτελεί κτίριο στην ορθοφωτογραφία σύμφωνα με τα δείγματα που συλλέχθηκαν. Η επικύρωση των αποτελεσμάτων πραγματοποιήθηκε υπολογίζοντας την ακρίβεια με βάση τα δείγματα εκπαίδευσης και τα δώδεκα πειράματα - ανιχνεύσεις που εφαρμόστηκαν. Ως αποτέλεσμα η διαδικασία αυτή είχε μετρητικές ακρίβειας οι οποίες αξιολογήθηκαν και με την βοήθεια φωτοερμηνείας της αεροφωτογραφίας. Τα αποτελέσματα της αξιολόγησης για το πρώτο μοντέλο εκπαίδευσης είχαν ικανοποιητικά αποτελέσματα καθώς το πείραμα από τα τέσσερα με την μεγαλύτερη ακρίβεια ήταν εκείνο με ακρίβεια 69%. Το δεύτερο μοντέλο εκπαίδευσης είχε αξιόλογα αποτελέσματα καθώς και τα τέσσερα πειράματα είχαν ακρίβεια πάνω από 60% με το τέταρτο πείραμα να φτάνει 82% ακρίβεια οδηγώντας στο καλύτερο αποτέλεσμα της μελέτης. Το μοντέλο με την χειρότερη ακρίβεια ήταν το τρίτο μοντέλο εκπαίδευσης το οποίο παρουσίασε εσφαλμένη ανίχνευση. Τα τέσσερα πειράματα είχαν ακρίβεια μικρότερη από 2% με το πρώτο και δεύτερο πείραμα να λαμβάνουν μηδενικά ποσοστά. Συγκρίνοντας τα μοντέλα μεταξύ τους διαπιστώθηκε ότι διπλασιάζοντας το μέγεθος της παρτίδας το μοντέλο αποδίδει καλύτερα. Όσο μικρότερο μέγεθος παρτίδας δέχεται το μοντέλο βαθιάς μάθησης τόσο πιο εσφαλμένα είναι τα αποτελέσματα του, αντίστοιχα όσο μεγαλύτερο μέγεθος της παρτίδας λαμβάνει το μοντέλο τόσο πιο αποδοτικό είναι. Το μέγεθος της παρτίδας εξετάζει την ακρίβεια της εκτίμησης της διαβάθμισης σφάλματος κατά την εκπαίδευση του νευρωνικού δικτύου. Συνοψίζοντας η παρούσα εργασία, προβάλει πως η αυτόματη ανίχνευση σε ένα χώρο με ένα συγκεκριμένο αντικείμενο ανίχνευσης μπορεί να φέρει εξαιρετικά αποτελέσματα λαμβάνοντας υπόψη συγκεκριμένες παραμέτρους. Η μέθοδος ανίχνευσης με βαθιά μάθηση είναι μια αξιόπιστη μέθοδος όσον αφορά την ανίχνευση αντικειμένων με απαραίτητη προϋπόθεση τη μελέτη και τη παραμετροποίηση της μεθόδου όσον αφορά το λογισμικό εργασίας. Η εργασία διακρίνεται σε έξι ενότητες. Στη πρώτη ενότητα πραγματοποιείται η ανάλυση του θεωρητικού υπόβαθρου στην ανίχνευση κτιρίων και τη βαθιά μάθηση. Στη δεύτερη ενότητα παρουσιάζεται η περιοχή μελέτης, η Βρίσα Λέσβου. Οι επόμενες τρείς ενότητες, προβάλλουν τις μεθόδους που χρησιμοποιήθηκαν, τα δεδομένα αλλά και την επεξεργασία τους. Η εργασία ολοκληρώνεται με τα αποτελέσματα και τα συμπεράσματα της μελέτης. el
heal.abstract Inventors have long dreamed of creating machines that think. This desire dates back to at least the time of ancient Greece. The mythical figures Pygmalion, Daedalus, and Hephaestus may all be interpreted as legendary inventors, and Galatea, Talos, and Pandora may all be regarded as artificial life. (Ovid & Martin, 2004, Sparkes, 1996; Tandy, 1997). Over the last years, the study of artificial intelligence shows significant growth, especially regarding deep learning techniques which are called to deal with a multitude of problems in terms of object recognition. This paper delves into the automatic building detection and the study of the results for the localization of buildings. The work was carried out using ArcGIS Pro software from ESRI (an international software supplier of geographic information systems, online GIS and geographic database management applications). Deep learning-based study for building detection was developed in this software environment. As a source data to achieve the goals of this study an aerial photo from 2019 was used, which was a product of my undergraduate studies. It was created with data collected through a drone flight and the area of study is Vrisa in Lesvos island in Greece. The analysis involved generating training samples and training deep learning models with the main goal of detecting building in this area. A total of 280 training samples were created and digitized. For the needs of this study, three deep learning models were trained according to different parameters. Twelve experiments were performed to detect the buildings, three for each deep learning model. More specifically, in this study we focus on the correct buildings detection and the notion of what constitutes a building in the orthoimagery according to the samples collected. The validation of the results was performed by calculating the accuracy based on the training samples on the twelve experiments - detections applied. As a result, this process had accuracy metrics that were also evaluated with the help of photo interpretation of aerial photography. The process evaluation for the first training model has satisfactory results as the experiment out of the four with the highest accuracy was the one with that scored 69%. The second training model had remarkable results as all four experiments had over 60% accuracy with the fourth experiment reaching 82% leading to the best result of the study. The model with the worst accuracy was the third training model which showed a false detection. All four experiments had an accuracy of less than 2% with the first and second experiments receiving zero percentages. Upon comparing the models, it was found that by doubling the batch size, better performance is achived. When the deep learning model receives a smaller batch size, the results are incorrect. However, with a bigger batch size, a more efficient result is achieved. The batch size examines the accuracy of the estimation of error gradient during the training of the neural network training.To summarize this study, we can see how automatic detection in a controlled space using a specific detection object can bring excellent results considering specific parameters. Deep learning detection method is reliable in object detection with the prerequisite of studying and parameterizing the method in terms of working software. The study is divided into six sections. The first section analyzes the theoretical background in building recognition through deep learning. The second section presents the study area, Vrisa. The next three sections analyses the methods used, the data and their processing. The paper concludes with the results and conclusions of the study. en
heal.advisorName Αργιαλάς, Δημήτριος el
heal.committeeMemberName Κολοκούσης, Πολυχρόνης el
heal.committeeMemberName Καράντζαλος, Κωνσταντίνος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών el
heal.academicPublisherID ntua
heal.numberOfPages 105 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα