Η Διπλωματική Εργασία αφορά στην επεξεργασία Υπερφασματικών δεδομένων με σκοπό την εξαγωγή συμπερασμάτων πάνω στις διάφορες διαδικασίες που είναι απαραίτητες για την ανάλυση του μεγάλου όγκου δεδομένων, αλλά και για τους βέλτιστους τρόπους ταυτοποίησης και κατηγοριοποίησης αντικειμένων εντός αστικής περιοχής. Περιοχή μελέτης αποτέλεσε η πόλη της Χαλκίδας με υπερφασματικά δεδομένα που αποκτήθηκαν από τον αισθητήρα CASI 550, με 96 κανάλια από τα 422.6-964.4nm, μέγεθος εικονοστοιχείου στο έδαφος 2χ2m και χωρική ανάλυση στα 3m. Οι επεξεργασίες υλοποιήθηκαν αρχικά σε τρία αντιπροσωπευτικά δείγματα της εικόνας για λόγους ταχύτητας, ενώ όλες οι διαδικασίες εκτελέσθηκαν με το λογισμικό ENVI 4.4 της εταιρείας ESRI. Λόγω της πολυπλοκότητας του αστικού περιβάλλοντος οι αρχικές επεξεργασίες στα δεδομένα, όπως η δημιουργία λόγων καναλιών, τα έγχρωμα σύνθετα και οι χρωματικοί μετασχηματισμοί, είχαν ιδιαίτερη σημασία και ρόλο, όχι μόνο για τον εντοπισμό των κατηγοριών αλλά και για το πώς αυτές διαχωρίζονται ή συγχέονται. Κύρια αιτία για τα παραπάνω ήταν η απαίτηση καλής καταγραφής των Περιοχών Εκπαίδευσης, που συμμετείχαν έπειτα στις διαδικασίες τις ανίχνευσης εικονοστοιχείων-στόχων και της ταξινόμησης. Ο μεγάλος όγκος των δεδομένων προϋπόθετε όμως τη μείωση της διάστασης του υπερφασματικού χώρου με ταυτόχρονη αποκοπή του θορύβου και εξαγωγή της σημαντικής πληροφορίας. Αυτό επιτελέσθηκε με τους μετασχηματισμούς των Principal Component Analysis και Minimum Noise Fraction, που κατάφεραν να τοποθετήσουν σε λίγες κύριες συνιστώσες το σύνολο σχεδόν της πληροφορίας. Στη συνέχεια της εργασίας έγινε προσπάθεια ανίχνευσης των εικονοστοιχείων-καθαρών στόχων με τον αλγόριθμο Pixel Purity Index και τη συλλογή σημείων στις άκρες δισδιάστατων ιστογραμμάτων, με δεδομένα εισαγωγής τις Κύριες Συνιστώσες του MNF. Για τον υπολογισμό των ποσοστών αφθονίας του κάθε καθαρού στόχου εφαρμόστηκαν οι αλγόριθμοι Matched Filter και Linear Mixing Model με δεδομένα εισαγωγής τα προϊόντα του MNF, PCA και 9 λόγους καναλιών. Ο αλγόριθμος Matched Filter απέφερε τα καλύτερα αποτελέσματα για όλες σχεδόν τις αστικές κατηγορίες, εκτός αυτών που σημειώθηκαν εντός σκιασμένων περιοχών. Καλύτερα δεδομένα εισαγωγής στον αλγόριθμο Matched Filter θεωρήθηκαν οι λόγοι καναλιών. Για την ταξινόμηση των εικονοστοιχείων της εικόνας δοκιμάστηκαν όλοι σχεδόν οι διατιθέμενοι αλγόριθμοι του ENVI. Τα πιο αξιόλογα αποτελέσματα αφορούσαν στις μεθόδους του Maximum Likelihood, Minimum Distance, Mahalanobis Distance και SAM, με δεδομένα εισαγωγής τα προϊόντα των PCA, MNF και λόγους καναλιών. Η διαπίστωση ότι τα αποτελέσματα του Matched Filter τα οποία βασίζονται σε λόγους καναλιών διαχωρίζουν με τον καλύτερο τρόπο τις αστικές κατηγορίες οδήγησε στην εισαγωγή τους ως δεδομένα στους αλγορίθμους ταξινόμησης. Αν και η διαδικασία αυτή ήταν ασυνήθιστη, απέφερε τα καλύτερα αποτελέσματα, ειδικά με τη χρήση των Maximum Likelihood και Minimum Distance. Η μη επιβλεπόμενη ταξινόμηση απέδωσε μόνο με χρήση του αλγόριθμου ISODATA που κατάφερε να διαχωρίσει σωστά τις κύριες αστικές μονάδες. Η αξιολόγηση των αποτελεσμάτων έγινε μέσω του πίνακα σύγχυσης με χρήση νέων Περιοχών Ελέγχου. Μέσω των δεικτών αξιολόγησης, όπως των ποσοστών σφαλμάτων παράλειψης και συμπερίληψης, πραγματοποιήθηκαν συγκρίσεις των αποτελεσμάτων στην περίπτωση συμμετοχής των φωτισμένων στόχων και των υπό σκιά και στην περίπτωση μη συμμετοχής των σκιασμένων στόχων κατόπιν αφαίρεσης από την εικόνα όλων των τμημάτων της που παρουσίαζαν σκιασμένες περιοχές. Η αποκοπή των σκιασμένων περιοχών και στόχων επέφερε βελτιώσεις στη συνολική ακρίβεια των ταξινομήσεων. Στην περίπτωση που συμμετείχαν στόχοι υπό σκιά, μόνο η κατηγορία του ‘‘σκιασμένου γρασιδιού’’ ανιχνεύθηκε και ταξινομήθηκε σωστά, ενώ για όλες τις υπόλοιπες σκιασμένες αστικές κατηγορίες που ανιχνεύθηκαν δεν εξήχθη κάποιο αξιόλογο αποτέλεσμα. Σε όλες τις ταξινομήσεις του αστικού χώρου, είτε με τη συμμετοχή των σκιασμένων καθαρών στόχων, ή χωρίς αυτή, το κυριότερο πρόβλημα αφορούσε στη σύγχυση μεταξύ οροφών κτιρίων και οδοστρώματος, στα οποία η βασική συνιστώσα είναι κοινή. Παρόλ’ αυτά, η προτεινόμενη μεθοδολογία με την εισαγωγή των προϊόντων του Matched Filter που προέκυψαν από 9 λόγους καναλιών ως δεδομένα στον αλγόριθμο Maximum Likelihood για την ταξινόμηση μόνο αστικών φωτισμένων περιοχών, έδωσε ακρίβεια 84.5173% στο σύνολο της εικόνας.
This study investigates efforts towards establishing Hyperspectral Analysis approaches for use in urban environments. The principal objective was to investigate Hyperspectral mapping procedures for urban areas by evaluating and demonstrating existing methods and conclude in the ways Hyperspectral data should be managed. The study area was the city of Halkis with Hyperspectral data acquired by the sensor CASI 550 with 3m spatial resolution and 96 bands ranging from 422.6-964.4nm. The original image was split in three samples for better processing. For all the applications being conducted in the study the software ENVI 4.4 was the one that exclusively used. Because of the complexity of urban areas, Image Enhancement, Band Ratios, Color Composites and Color Transforms played an important role not only in localizing the spectral classes but also in examining how these are mixed or discriminated. The results of that was the good collection of Regions of Interest that were critical for spectral classification and unmixing. The high dimensionality of the data was a primary concern and confronted with the transformations of Principal Component Analysis and Minimum Noise Fraction, which succeeded in collecting the majority of the image variance in the first few components. The attempt of target detection was carried out by applying the algorithm Pixel Purity Index and by collecting endmembers in the corners of 2-D Scatterplots with input data the principal components of MNF. For the calculation of the percentages of abundances for every target, Matched Filter and Linear Mixing Model were used, with input data the products of PCA, MNF and 9 Band Ratios. Matched Filter showed the best results and the Band Ratios were regarded as the best input data. Concerning the classification algorithms Maximum Likelihood and Minimum Distance showed the best results when the input data were Band Ratios and the products of Matched Filter, which succeeded to perform great discrimination between all the reference spectral classes. Additionally, we also present results came from Mahalanobis Distance and SAM. Unsupervised classification performed well with the ISODATA classifier, which categorized the main urban classes. The evaluation carried out through the Confusion Matrix with the use of test samples, procedure that can’t be thought as the most reliable, but inevitable, since the absence of Ground Truth Data. Finally, the study ends with the comparison between classification algorithms and different combinations of input data, through the percentages of commission and omission. We also check the differences in overall accuracy when shadowed areas of the image are calculated and when they are excluded with the use of a mask. In the last case we observed improvements in overall accuracy of the classification, since only the class of ‘‘shadowed grass’’ was successfully identified and mapped. Unfortunately, none of the rest shadowed classes had exploitable information content. At all classifications took part the main problem was the confusion between roofs and asphalt. Besides that, the suggested methology of inserting the products of Matched Filter produced by Band Ratios as input data in Maximum Likelihood classification succeeded an overall accuracy of 84.5173%.