dc.contributor.author |
Νάνος, Γεώργιος
|
el |
dc.contributor.author |
Nanos, Georgios
|
en |
dc.date.accessioned |
2024-01-29T11:06:26Z |
|
dc.date.available |
2024-01-29T11:06:26Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/58717 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.26413 |
|
dc.rights |
Default License |
|
dc.subject |
Τµηµατοποίηση Εικόνας |
el |
dc.subject |
Βαθιά Μάθηση |
el |
dc.subject |
Σηµασιολογική Τµηµατοποίηση |
el |
dc.subject |
Συνελικτικά Νευρωνικά ∆ίκτυα |
el |
dc.subject |
Μηχανική Μάθηση |
el |
dc.title |
Μελέτη µοντέλων τµηµατοποίησης εικόνας σε διαφορετικά σύνολα δεδοµένων |
el |
dc.title |
Study of image segmentation models on different datasets |
en |
heal.type |
bachelorThesis |
|
heal.generalDescription |
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Διπλωματική Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Επιστήμη Δεδομένων και Μηχανική Μάθηση” |
el |
heal.classification |
Βαθιά Μάθηση |
el |
heal.classification |
Τεχνητή Νοημοσύνη |
el |
heal.classification |
Μηχανική Μάθηση |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2023-09-28 |
|
heal.abstract |
Η διαδικασία τµηµατοποίησης µιας εικόνας σε διαφορετικές περιοχές ή αντικείµενα είναι ένα κρίσιµο ϐήµα στην όραση υπολογιστών και την ανάλυση εικόνας. Τα τελευταία χρόνια, τα µοντέλα τµηµατοποίησης εικόνας που ϐασίζονται στη ϐαθιά µάθηση έχουν επιδείξει αξιοσηµείωτες επιδόσεις σε διάφορα σύνολα δεδοµένων αναφοράς. Στην παρούσα µελέτη, πραγµατοποιήσαµε µια ολοκληρωµένη ανάλυση διαφόρων µοντέλων τµηµατοποίησης εικόνας τελευταίας τεχνολογίας σε διάφορα σύνολα δεδοµένων αναφοράς, συµπεριλαµβανοµένου του συνόλου δεδοµένων Corsican Fire. Τα µοντέλα που διερευνήθηκαν στην παρούσα µελέτη περιλαµβάνουν τα DeepLabv3+, HRNet, HRNet+OCRNet, DDRNet, PIDNet, Swin
Transformer, BASNet, BISNet, UNET3+, Attention U-Net και EMANet. Κάθε µοντέλο έχει µοναδικό αρχιτεκτονικό σχεδιασµό και ξεχωριστά χαρακτηριστικά, τα οποία δοκιµάζονται σε διάφορα σύνολα δεδοµένων αναφοράς για την αξιολόγηση της απόδοσής τους. Το σύνολο δεδοµένων Corsican Fire είναι ένα απαιτητικό σύνολο δεδοµένων που αποτελείται από εικόνες
υψηλής ανάλυσης από δάση που έχουν ληφθεί κατά τη διάρκεια ξεσπασµάτων πυρκαγιών. Για να ελέγξουµε την ανθεκτικότητα του µοντέλου, συµπεριλάβαµε επίσης άλλα σύνολα δεδοµένων αναφοράς, τα οποία χρησιµοποιούνται ευρέως στον τοµέα της κατάτµησης εικόνων. Τα πειραµατικά µας αποτελέσµατα αποκαλύπτουν ότι τα µοντέλα Attention U-Net, EMANet
και Swin Transformer υπερτερούν των άλλων µοντέλων όσον αφορά τη συνολική ακρίβεια τµηµατοποίησης και την ταχύτητα στο σύνολο δεδοµένων της πυρκαγιάς της Κορσικής. Επιπλέον, πραγµατοποιήσαµε µια εκτενή συγκριτική ανάλυση των µοντέλων σε άλλα σύνολα δεδοµένων αναφοράς και τα αποτελέσµατα δείχνουν ότι κάθε µοντέλο έχει τα δυνατά και τα αδύνατα σηµεία του, ανάλογα µε τα χαρακτηριστικά του συνόλου δεδοµένων και την εργασία
τµηµατοποίησης. Συνεπώς στη συνέχεια της παρούσας µελέτης αποδείχθηκε ότι διαφορετικά µοντέλα αποδίδουν καλύτερα στην τεχνική transfer learning για την αξιολόγησή της επίδοσής τους σε άλλα σύνολα δεδοµένων. Συνολικά, η µελέτη µας παρέχει µια ολοκληϱωµένη αξιολόγηση των σύγχρονων µοντέλων τµηµατοποίησης εικόνας σε διάφορα σύνολα δεδοµένων αναφοράς, αναδεικνύοντας τις επιδόσεις, τα δυνατά σηµεία και τους περιορισµούς τους. Τα ευρήµατα αυτής της µελέτης µπορούν να χρησιµεύσουν ως σηµείο αναφοράς για τους ερευνητές στον τοµέα της όρασης υπολογιστών και της ανάλυσης εικόνας και µπορούν να ϐοηθήσουν στην ανάπτυξη αποδοτικότερων και ακριβέστερων µοντέλων τµηµατοποίησης εικόνας. |
el |
heal.sponsor |
The process of segmenting an image into different regions or objects is a critical step in computer vision and image analysis. In recent years, deep learning-based image-segmentation models have demonstrated remarkable performance on various benchmark datasets. In this study, we have conducted a comprehensive analysis of several state-of-the-art image segmentation models on different benchmark datasets, including the Corsican Fire dataset. The models investigated in this study include DeepLabv3+, HRNet, HRNet+OCRNet, DDRNet, PIDNet, Swin Transformer, BASNet, BISNet, UNET3+, Attention U-Net, and EMANet. Each model has a unique architectural design and distinct features, which are tested on several benchmark datasets to evaluate their performance. The Corsican Fire dataset is a challenging dataset that consists of high-resolution images
of forests captured during wildfire outbreaks. To test the model’s robustness, we have also included other benchmark datasets, which are widely used in the field of image segmentation. Our experimental results reveal that the Attention U-Net, EMANet, and Swin Transformer outperform the other models in terms of overall accuracy segmentation and
speed on the Corsica fire dataset. In addition, we performed an extensive comparative analysis of the models on other datasets data sets and the results show that each model
has its strengths and weaknesses. weak points, depending on the characteristics of the dataset and the task segmentation task. Therefore, in the remainder of this study, it was shown that different models perform better in the transfer learning technique for its evaluation performance on other datasets. Overall, our study provides a comprehensive evaluation of state-of-the-art image segmentation models on different benchmark datasets,
highlighting their performance, strengths, and limitations. The findings of this study can serve as a benchmark for researchers in the field of computer vision and image analysis and can aid in the development of more efficient and accurate image segmentation
models. |
en |
heal.advisorName |
Κόλλιας, Στέφανος |
el |
heal.advisorName |
Τζούβελη, Παρασκευή |
el |
heal.committeeMemberName |
Στάμου, Γιώργος |
el |
heal.committeeMemberName |
Βουλόδηµος, Αθανάσιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
174 σ. |
el |
heal.fullTextAvailability |
false |
|