HEAL DSpace

Μελέτη µοντέλων τµηµατοποίησης εικόνας σε διαφορετικά σύνολα δεδοµένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Νάνος, Γεώργιος el
dc.contributor.author Nanos, Georgios en
dc.date.accessioned 2024-01-29T11:06:26Z
dc.date.available 2024-01-29T11:06:26Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/58717
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.26413
dc.rights Default License
dc.subject Τµηµατοποίηση Εικόνας el
dc.subject Βαθιά Μάθηση el
dc.subject Σηµασιολογική Τµηµατοποίηση el
dc.subject Συνελικτικά Νευρωνικά ∆ίκτυα el
dc.subject Μηχανική Μάθηση el
dc.title Μελέτη µοντέλων τµηµατοποίησης εικόνας σε διαφορετικά σύνολα δεδοµένων el
dc.title Study of image segmentation models on different datasets en
heal.type bachelorThesis
heal.generalDescription Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Διπλωματική Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Επιστήμη Δεδομένων και Μηχανική Μάθηση” el
heal.classification Βαθιά Μάθηση el
heal.classification Τεχνητή Νοημοσύνη el
heal.classification Μηχανική Μάθηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-09-28
heal.abstract Η διαδικασία τµηµατοποίησης µιας εικόνας σε διαφορετικές περιοχές ή αντικείµενα είναι ένα κρίσιµο ϐήµα στην όραση υπολογιστών και την ανάλυση εικόνας. Τα τελευταία χρόνια, τα µοντέλα τµηµατοποίησης εικόνας που ϐασίζονται στη ϐαθιά µάθηση έχουν επιδείξει αξιοσηµείωτες επιδόσεις σε διάφορα σύνολα δεδοµένων αναφοράς. Στην παρούσα µελέτη, πραγµατοποιήσαµε µια ολοκληρωµένη ανάλυση διαφόρων µοντέλων τµηµατοποίησης εικόνας τελευταίας τεχνολογίας σε διάφορα σύνολα δεδοµένων αναφοράς, συµπεριλαµβανοµένου του συνόλου δεδοµένων Corsican Fire. Τα µοντέλα που διερευνήθηκαν στην παρούσα µελέτη περιλαµβάνουν τα DeepLabv3+, HRNet, HRNet+OCRNet, DDRNet, PIDNet, Swin Transformer, BASNet, BISNet, UNET3+, Attention U-Net και EMANet. Κάθε µοντέλο έχει µοναδικό αρχιτεκτονικό σχεδιασµό και ξεχωριστά χαρακτηριστικά, τα οποία δοκιµάζονται σε διάφορα σύνολα δεδοµένων αναφοράς για την αξιολόγηση της απόδοσής τους. Το σύνολο δεδοµένων Corsican Fire είναι ένα απαιτητικό σύνολο δεδοµένων που αποτελείται από εικόνες υψηλής ανάλυσης από δάση που έχουν ληφθεί κατά τη διάρκεια ξεσπασµάτων πυρκαγιών. Για να ελέγξουµε την ανθεκτικότητα του µοντέλου, συµπεριλάβαµε επίσης άλλα σύνολα δεδοµένων αναφοράς, τα οποία χρησιµοποιούνται ευρέως στον τοµέα της κατάτµησης εικόνων. Τα πειραµατικά µας αποτελέσµατα αποκαλύπτουν ότι τα µοντέλα Attention U-Net, EMANet και Swin Transformer υπερτερούν των άλλων µοντέλων όσον αφορά τη συνολική ακρίβεια τµηµατοποίησης και την ταχύτητα στο σύνολο δεδοµένων της πυρκαγιάς της Κορσικής. Επιπλέον, πραγµατοποιήσαµε µια εκτενή συγκριτική ανάλυση των µοντέλων σε άλλα σύνολα δεδοµένων αναφοράς και τα αποτελέσµατα δείχνουν ότι κάθε µοντέλο έχει τα δυνατά και τα αδύνατα σηµεία του, ανάλογα µε τα χαρακτηριστικά του συνόλου δεδοµένων και την εργασία τµηµατοποίησης. Συνεπώς στη συνέχεια της παρούσας µελέτης αποδείχθηκε ότι διαφορετικά µοντέλα αποδίδουν καλύτερα στην τεχνική transfer learning για την αξιολόγησή της επίδοσής τους σε άλλα σύνολα δεδοµένων. Συνολικά, η µελέτη µας παρέχει µια ολοκληϱωµένη αξιολόγηση των σύγχρονων µοντέλων τµηµατοποίησης εικόνας σε διάφορα σύνολα δεδοµένων αναφοράς, αναδεικνύοντας τις επιδόσεις, τα δυνατά σηµεία και τους περιορισµούς τους. Τα ευρήµατα αυτής της µελέτης µπορούν να χρησιµεύσουν ως σηµείο αναφοράς για τους ερευνητές στον τοµέα της όρασης υπολογιστών και της ανάλυσης εικόνας και µπορούν να ϐοηθήσουν στην ανάπτυξη αποδοτικότερων και ακριβέστερων µοντέλων τµηµατοποίησης εικόνας. el
heal.sponsor The process of segmenting an image into different regions or objects is a critical step in computer vision and image analysis. In recent years, deep learning-based image-segmentation models have demonstrated remarkable performance on various benchmark datasets. In this study, we have conducted a comprehensive analysis of several state-of-the-art image segmentation models on different benchmark datasets, including the Corsican Fire dataset. The models investigated in this study include DeepLabv3+, HRNet, HRNet+OCRNet, DDRNet, PIDNet, Swin Transformer, BASNet, BISNet, UNET3+, Attention U-Net, and EMANet. Each model has a unique architectural design and distinct features, which are tested on several benchmark datasets to evaluate their performance. The Corsican Fire dataset is a challenging dataset that consists of high-resolution images of forests captured during wildfire outbreaks. To test the model’s robustness, we have also included other benchmark datasets, which are widely used in the field of image segmentation. Our experimental results reveal that the Attention U-Net, EMANet, and Swin Transformer outperform the other models in terms of overall accuracy segmentation and speed on the Corsica fire dataset. In addition, we performed an extensive comparative analysis of the models on other datasets data sets and the results show that each model has its strengths and weaknesses. weak points, depending on the characteristics of the dataset and the task segmentation task. Therefore, in the remainder of this study, it was shown that different models perform better in the transfer learning technique for its evaluation performance on other datasets. Overall, our study provides a comprehensive evaluation of state-of-the-art image segmentation models on different benchmark datasets, highlighting their performance, strengths, and limitations. The findings of this study can serve as a benchmark for researchers in the field of computer vision and image analysis and can aid in the development of more efficient and accurate image segmentation models. en
heal.advisorName Κόλλιας, Στέφανος el
heal.advisorName Τζούβελη, Παρασκευή el
heal.committeeMemberName Στάμου, Γιώργος el
heal.committeeMemberName Βουλόδηµος, Αθανάσιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 174 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής