HEAL DSpace

Μέθοδοι υπερδειγματοληψίας και υποδειγματοληψίας για την αύξηση της ακρίβειας ταξινομήσεων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αναστασοπούλου, Νικολέττα el
dc.contributor.author Anastasopoulou, Nikoletta en
dc.date.accessioned 2025-01-10T09:07:48Z
dc.date.available 2025-01-10T09:07:48Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/60698
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.28394
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Sentinel-2 en
dc.subject Επιβλεπόμενη Ταξινόμηση el
dc.subject Ακρίβεια Ταξινόμησης el
dc.subject Υπερδειγματοληψία el
dc.subject Υποδειγματοληψία el
dc.subject Αλγόριθμος Random Forest el
dc.subject Μέθοδοι Υπερδειγματοληψίας el
dc.subject Δείκτης Αναλογίας Ισορροπίας el
dc.subject Supervised Classification en
dc.subject Classification Algorithm en
dc.subject Classification Accuracy en
dc.subject Oversampling en
dc.subject Undersampling en
dc.subject Random Forest en
dc.subject Oversampling methods en
dc.subject Undersampling methods en
dc.subject Balance Ratio Indice (BRI) en
dc.title Μέθοδοι υπερδειγματοληψίας και υποδειγματοληψίας για την αύξηση της ακρίβειας ταξινομήσεων el
heal.type bachelorThesis
heal.classification Τηλεπισκόπηση el
heal.classification Μηχανική Μάθηση el
heal.classification Remote sensing en
heal.classification Machine Learning en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2024-07-17
heal.abstract Στην παρούσα διπλωματική εργασία αναπτύσσονται, εφαρμόζονται κι αξιολογούνται πειράματα επιβλεπόμενης ταξινόμησης σε μη ισορροπημένα σύνολα δεδομένων, με τη χρήση μεθόδων τυχαίας υπερδειγματοληψίας και τυχαίας υποδειγματοληψίας, για την αξιολόγηση της ακρίβειας που επιτυγχάνεται σε κάθε μια από τις δυο μεθόδους, για κάθε αλγόριθμο ταξινόμησης. Για τις ανάγκες των πειραματικών εφαρμογών αξιοποιείται μια Sentinel-2A πολυφασματική απεικόνιση, με τα 10 από τα 12 διαθέσιμα κανάλια, ατμοσφαιρικά διορθωμένη (προϊόν Level 2Α). Εκτελούνται διαδοχικά, ένα σύνολο από πειράματα με το πρώτο να χρησιμοποιεί ισορροπημένο σύνολο δεδομένων, που συνιστά τον βασικό πυλώνα και στη συνέχεια, ακολουθούν πειράματα με μη ισορροπημένα σύνολα δεδομένων εκπαίδευσης, τα οποία αντιμετωπίζονται είτε με υπερδειγματοληψία είτε με υποδειγματοληψία, ανάλογα με το τι υποδεικνύει κάθε φορά ο δείκτης αναλογίας ισορροπίας, που δημιουργείται στα πλαίσια διεξαγωγής της εργασίας. Ο δείκτης αναλογίας ισορροπίας σχετίζεται με το πλήθος των πολυγώνων εκπαίδευσης των κατηγοριών χρήσης/κάλυψης γης. Η πρώτη εφαρμογή αναπτύσσεται με στόχο τη διερεύνηση κι αξιολόγηση της απόδοσης των αλγορίθμων επιβλεπόμενης ταξινόμησης σε ένα ισορροπημένο σύνολο δεδομένων, επιδιώκοντας υψηλή ακρίβεια. Ειδικότερα, αξιοποιώντας ένα ισορροπημένο, ως προς την έκταση των κατηγοριών χρήσης/κάλυψης γης, σύνολο δεδομένων εκπαίδευσης εκτελείται ταξινόμηση και συγκρίνονται ποιοτικά οι θεματικοί χάρτες των ταξινομήσεων με το Corine Land Cover (CLC) και τον κυρωμένο δασικό χάρτη της περιοχής μελέτης, ενώ σε δεύτερο χρόνο γίνεται η ποσοτική αξιολόγηση με τον υπολογισμό των μετρικών precision, recall και F1-score ,που προκύπτουν από τον πίνακα σύγχυσης. Σε επόμενο βήμα, υπολογίζοντας για κάθε κατηγορία το δείκτη αναλογίας ισορροπίας, εφαρμόζεται υπερδειγματοληψία ή υποδειγματοληψία, εκτελείται εκ νέου μια σειρά από εφαρμογές επιβλεπόμενης ταξινόμησης κι αξιολογείται η επίδραση που έχει σε κάθε περίπτωση η μέθοδος διαχείρισης των μη ισορροπημένων δεδομένων, στην ακρίβεια της ταξινόμησης. Η εργασία ολοκληρώνεται με τα τελικά συμπεράσματα κι ορισμένες προτάσεις για πιθανά θέματα μελλοντικής έρευνας. el
heal.abstract In this thesis, supervised classification experiments on unbalanced datasets are developed, implemented and evaluated using random oversampling and random undersampling methods to evaluate the accuracy achieved in each of the two methods for each classification algorithm. For the needs of the experimental applications, a Sentinel-2A multispectral imagery is utilized, with 10 of the 12 available channels, atmospherically corrected (Level 2Α product). A set of experiments are performed sequentially, with the first one using a balanced dataset, which constitutes the main pillar, followed by experiments with unbalanced training datasets, which are treated either by oversampling or undersampling, depending on what is indicated each time by the balance ratio index which is made for this thesis needs. The Balance Ratio Indice (BRI) is related to the number of training polygons of the land use/land cover categories. The first application is developed to investigate and evaluate the performance of supervised classification algorithms on a balanced dataset, aiming for high accuracy. In particular, utilizing a balanced, in terms of land use/land cover categories, training dataset, classification is performed and the thematic maps of the classifications are qualitatively compared with the Corine Land Cover (CLC) and the validated forest map of the study area, while in a second step the quantitative evaluation is performed by calculating the precision, recall and F1-score, metrics derived from the confusion matrix. In the next step, by calculating for each category the Balance Ratio Indice, oversampling or undersampling is applied, a series of supervised classification applications are re-run and the effect of the method of handling unbalanced data on the accuracy of the classification is evaluated in each case. The paper concludes with the final conclusions and some suggestions for possible future research topics. en
heal.advisorName Καράντζαλος, Κωνσταντίνος el
heal.committeeMemberName Παπουτσής, Ιωάννης el
heal.committeeMemberName Ανδρώνης, Βασίλειος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Τηλεπισκόπησης el
heal.academicPublisherID ntua
heal.numberOfPages 154 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα