dc.contributor.author |
Μπίμπας, Ιωάννης
|
el |
dc.contributor.author |
Bimpas, Ioannis
|
en |
dc.date.accessioned |
2024-12-23T09:50:33Z |
|
dc.date.available |
2024-12-23T09:50:33Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/60610 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.28306 |
|
dc.rights |
Default License |
|
dc.subject |
Ταξινόμηση |
el |
dc.subject |
Δορυφορικές εικόνες |
el |
dc.subject |
Χρήσεις γης |
el |
dc.subject |
Τεχνητή νοημοσύνη |
el |
dc.subject |
Σημασιολογική κατάτμηση |
el |
dc.subject |
Classification |
en |
dc.subject |
Land use |
en |
dc.subject |
Satellite images |
en |
dc.subject |
Vision transformer |
en |
dc.subject |
Artificial intelligence |
en |
dc.title |
Ταξινόμηση χρήσεων γης με τεχνικές τεχνητής νοημοσύνης |
el |
dc.title |
Land use classification using artificial intelligence techniques |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Τοπογραφία |
el |
heal.classification |
Topography |
en |
heal.language |
el |
|
heal.access |
campus |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2024-06-21 |
|
heal.abstract |
Η αυτόματη ταξινόμηση χρήσεων γης από δορυφορικές εικόνες RGB αποτελεί μια διαδικασία χρήσιμη για τους μηχανικούς και ερευνητές που ασχολούνται με έργα σχετικά με το ανθρωπογενές περιβάλλον. Ωστόσο, αποτελεί μια πολύ δύσκολη διαδικασία, ειδικότερα όσο αυξάνεται η πολυπλοκότητα της δόμησης μιας περιοχής ή όταν τα φυσικά αντικείμενα και οι ανθρωπογενείς κατασκευές εμφανίζονται σε πολλά σημεία της περιοχής ενδιαφέροντος. Αισθητήρες που συλλέγουν χρήσιμη πληροφορία για την αυτόματη ταξινόμηση χρήσεων γης, έχουν πολύ υψηλό κόστος και απαιτούν μεγάλη προεπεξεργασία, για την ορθή αυτοματοποίηση της διαδικασίας. Στην ακόλουθη διπλωματική εργασία, εμπνευσμένοι από τα κατορθώματα της τεχνητής νοημοσύνης σε απαιτητικά προβλήματα όρασης υπολογιστών, ταξινόμησης εικόνων και πολλά άλλα, προτείνεται η αντιμετώπιση του εν λόγω προβλήματος μέσω της αρχιτεκτονικής του Vision Transformer (ViT). Ένα τέτοιο δίκτυο, μιμούμενο τον τρόπο εκπαίδευσης του ανθρώπινου εγκεφάλου, έχει την ιδιότητα μέσα από συνεχή επεξεργασία δεδομένων, στα οποία παρουσιάζονται οι σωστές κατηγορίες χρήσεων γης, να μπορεί να ταξινομεί και να χαρτογραφεί χρήσεις γης σε νέες RGB εικόνες. Η ιδιαιτερότητα της αρχιτεκτονικής ViT ευνοεί την προσκείμενη εφαρμογή, καθώς σε πρώτο στάδιο το δίκτυο «αναγνωρίζει» τις διάφορες κατηγορίες χρήσεων γης, ενώ σε δεύτερο στάδιο, «μαθαίνει» να τις χαρτογραφεί, δηλαδή εκτελεί σημασιολογική κατάτμηση σε μια εικόνα. Με σκοπό την αξιολόγηση του δικτύου, χρησιμοποιήθηκε το αποθετήριο δεδομένων EuroSAT, το οποίο διαθέτει μεγάλο αριθμό εικόνων προς εκπαίδευση. Τα πειραματικά αποτελέσματα του δικτύου σε εικόνες του EuroSAT, δείχνουν πως τόσο οπτικά, όσο και στατιστικά, το μοντέλο ανεξαρτήτου πυκνότητας δόμησης έχει την ικανότητα να ταξινομεί τις χρήσεις γης πετυχαίνοντας υψηλή ακρίβεια στο σετ ελέγχου. |
el |
heal.abstract |
Automatic land use classification from RGB satellite images is a useful process for engineers and researchers working on projects related to the human environment. However, it is a very challenging task, especially as the complexity of urban structures increases or when natural objects and human-made constructions appear in many parts of the area of interest. Sensors that collect useful information for automatic land use classification are very costly and require extensive preprocessing for the proper automation of the process. In this thesis, inspired by the achievements of artificial intelligence in demanding problems of computer vision, image classification, and many others, we propose addressing this problem using the Vision Transformer (ViT) architecture. Such a network, mimicking the training method of the human brain, has the capability through continuous data processing, where the correct land use categories are presented, to classify and map land uses in new RGB images. The particularity of the ViT architecture favors the application at hand, as in the first stage the network "recognizes" the various land use categories, while in the second stage, it "learns" to map them, performing semantic segmentation on an image. To evaluate the network, the EuroSAT dataset was used, which provides a large number of images for training. The experimental results of the network on EuroSAT images show that both visually and statistically, the model, regardless of building density, can classify land uses with high accuracy on the test set. |
en |
heal.advisorName |
Δουλάμης, Νικόλαος |
el |
heal.advisorName |
Doulamis, Nikolaos |
en |
heal.committeeMemberName |
Δουλάμης, Αναστάσιος |
el |
heal.committeeMemberName |
Δουλάμης, Νικόλαος |
el |
heal.committeeMemberName |
Πότσιου, Χρυσή |
el |
heal.committeeMemberName |
Doulamis, Anastasios |
en |
heal.committeeMemberName |
Doulamis, Nikolaos |
en |
heal.committeeMemberName |
Potsiou, Cryssy |
en |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Φωτογραμμετρίας |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
78 σ. |
el |
heal.fullTextAvailability |
false |
|
heal.fullTextAvailability |
false |
|