dc.contributor.author | Αναστασοπούλου, Νικολέττα | el |
dc.contributor.author | Anastasopoulou, Nikoletta | en |
dc.date.accessioned | 2025-01-10T09:07:48Z | |
dc.date.available | 2025-01-10T09:07:48Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/60698 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.28394 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Sentinel-2 | en |
dc.subject | Επιβλεπόμενη Ταξινόμηση | el |
dc.subject | Ακρίβεια Ταξινόμησης | el |
dc.subject | Υπερδειγματοληψία | el |
dc.subject | Υποδειγματοληψία | el |
dc.subject | Αλγόριθμος Random Forest | el |
dc.subject | Μέθοδοι Υπερδειγματοληψίας | el |
dc.subject | Δείκτης Αναλογίας Ισορροπίας | el |
dc.subject | Supervised Classification | en |
dc.subject | Classification Algorithm | en |
dc.subject | Classification Accuracy | en |
dc.subject | Oversampling | en |
dc.subject | Undersampling | en |
dc.subject | Random Forest | en |
dc.subject | Oversampling methods | en |
dc.subject | Undersampling methods | en |
dc.subject | Balance Ratio Indice (BRI) | en |
dc.title | Μέθοδοι υπερδειγματοληψίας και υποδειγματοληψίας για την αύξηση της ακρίβειας ταξινομήσεων | el |
heal.type | bachelorThesis | |
heal.classification | Τηλεπισκόπηση | el |
heal.classification | Μηχανική Μάθηση | el |
heal.classification | Remote sensing | en |
heal.classification | Machine Learning | en |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2024-07-17 | |
heal.abstract | Στην παρούσα διπλωματική εργασία αναπτύσσονται, εφαρμόζονται κι αξιολογούνται πειράματα επιβλεπόμενης ταξινόμησης σε μη ισορροπημένα σύνολα δεδομένων, με τη χρήση μεθόδων τυχαίας υπερδειγματοληψίας και τυχαίας υποδειγματοληψίας, για την αξιολόγηση της ακρίβειας που επιτυγχάνεται σε κάθε μια από τις δυο μεθόδους, για κάθε αλγόριθμο ταξινόμησης. Για τις ανάγκες των πειραματικών εφαρμογών αξιοποιείται μια Sentinel-2A πολυφασματική απεικόνιση, με τα 10 από τα 12 διαθέσιμα κανάλια, ατμοσφαιρικά διορθωμένη (προϊόν Level 2Α). Εκτελούνται διαδοχικά, ένα σύνολο από πειράματα με το πρώτο να χρησιμοποιεί ισορροπημένο σύνολο δεδομένων, που συνιστά τον βασικό πυλώνα και στη συνέχεια, ακολουθούν πειράματα με μη ισορροπημένα σύνολα δεδομένων εκπαίδευσης, τα οποία αντιμετωπίζονται είτε με υπερδειγματοληψία είτε με υποδειγματοληψία, ανάλογα με το τι υποδεικνύει κάθε φορά ο δείκτης αναλογίας ισορροπίας, που δημιουργείται στα πλαίσια διεξαγωγής της εργασίας. Ο δείκτης αναλογίας ισορροπίας σχετίζεται με το πλήθος των πολυγώνων εκπαίδευσης των κατηγοριών χρήσης/κάλυψης γης. Η πρώτη εφαρμογή αναπτύσσεται με στόχο τη διερεύνηση κι αξιολόγηση της απόδοσης των αλγορίθμων επιβλεπόμενης ταξινόμησης σε ένα ισορροπημένο σύνολο δεδομένων, επιδιώκοντας υψηλή ακρίβεια. Ειδικότερα, αξιοποιώντας ένα ισορροπημένο, ως προς την έκταση των κατηγοριών χρήσης/κάλυψης γης, σύνολο δεδομένων εκπαίδευσης εκτελείται ταξινόμηση και συγκρίνονται ποιοτικά οι θεματικοί χάρτες των ταξινομήσεων με το Corine Land Cover (CLC) και τον κυρωμένο δασικό χάρτη της περιοχής μελέτης, ενώ σε δεύτερο χρόνο γίνεται η ποσοτική αξιολόγηση με τον υπολογισμό των μετρικών precision, recall και F1-score ,που προκύπτουν από τον πίνακα σύγχυσης. Σε επόμενο βήμα, υπολογίζοντας για κάθε κατηγορία το δείκτη αναλογίας ισορροπίας, εφαρμόζεται υπερδειγματοληψία ή υποδειγματοληψία, εκτελείται εκ νέου μια σειρά από εφαρμογές επιβλεπόμενης ταξινόμησης κι αξιολογείται η επίδραση που έχει σε κάθε περίπτωση η μέθοδος διαχείρισης των μη ισορροπημένων δεδομένων, στην ακρίβεια της ταξινόμησης. Η εργασία ολοκληρώνεται με τα τελικά συμπεράσματα κι ορισμένες προτάσεις για πιθανά θέματα μελλοντικής έρευνας. | el |
heal.abstract | In this thesis, supervised classification experiments on unbalanced datasets are developed, implemented and evaluated using random oversampling and random undersampling methods to evaluate the accuracy achieved in each of the two methods for each classification algorithm. For the needs of the experimental applications, a Sentinel-2A multispectral imagery is utilized, with 10 of the 12 available channels, atmospherically corrected (Level 2Α product). A set of experiments are performed sequentially, with the first one using a balanced dataset, which constitutes the main pillar, followed by experiments with unbalanced training datasets, which are treated either by oversampling or undersampling, depending on what is indicated each time by the balance ratio index which is made for this thesis needs. The Balance Ratio Indice (BRI) is related to the number of training polygons of the land use/land cover categories. The first application is developed to investigate and evaluate the performance of supervised classification algorithms on a balanced dataset, aiming for high accuracy. In particular, utilizing a balanced, in terms of land use/land cover categories, training dataset, classification is performed and the thematic maps of the classifications are qualitatively compared with the Corine Land Cover (CLC) and the validated forest map of the study area, while in a second step the quantitative evaluation is performed by calculating the precision, recall and F1-score, metrics derived from the confusion matrix. In the next step, by calculating for each category the Balance Ratio Indice, oversampling or undersampling is applied, a series of supervised classification applications are re-run and the effect of the method of handling unbalanced data on the accuracy of the classification is evaluated in each case. The paper concludes with the final conclusions and some suggestions for possible future research topics. | en |
heal.advisorName | Καράντζαλος, Κωνσταντίνος | el |
heal.committeeMemberName | Παπουτσής, Ιωάννης | el |
heal.committeeMemberName | Ανδρώνης, Βασίλειος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Τηλεπισκόπησης | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 154 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: