Μελέτη µοντέλων τµηµατοποίησης εικόνας σε διαφορετικά σύνολα δεδοµένων

Νάνος, Γεώργιος; Nanos, Georgios

dc.contributor.author	Νάνος, Γεώργιος	el
dc.contributor.author	Nanos, Georgios	en
dc.date.accessioned	2024-01-29T11:06:26Z
dc.date.available	2024-01-29T11:06:26Z
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/58717
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.26413
dc.rights	Default License
dc.subject	Τµηµατοποίηση Εικόνας	el
dc.subject	Βαθιά Μάθηση	el
dc.subject	Σηµασιολογική Τµηµατοποίηση	el
dc.subject	Συνελικτικά Νευρωνικά ∆ίκτυα	el
dc.subject	Μηχανική Μάθηση	el
dc.title	Μελέτη µοντέλων τµηµατοποίησης εικόνας σε διαφορετικά σύνολα δεδοµένων	el
dc.title	Study of image segmentation models on different datasets	en
heal.type	bachelorThesis
heal.generalDescription	Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Διπλωματική Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Επιστήμη Δεδομένων και Μηχανική Μάθηση”	el
heal.classification	Βαθιά Μάθηση	el
heal.classification	Τεχνητή Νοημοσύνη	el
heal.classification	Μηχανική Μάθηση	el
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2023-09-28
heal.abstract	Η διαδικασία τµηµατοποίησης µιας εικόνας σε διαφορετικές περιοχές ή αντικείµενα είναι ένα κρίσιµο ϐήµα στην όραση υπολογιστών και την ανάλυση εικόνας. Τα τελευταία χρόνια, τα µοντέλα τµηµατοποίησης εικόνας που ϐασίζονται στη ϐαθιά µάθηση έχουν επιδείξει αξιοσηµείωτες επιδόσεις σε διάφορα σύνολα δεδοµένων αναφοράς. Στην παρούσα µελέτη, πραγµατοποιήσαµε µια ολοκληρωµένη ανάλυση διαφόρων µοντέλων τµηµατοποίησης εικόνας τελευταίας τεχνολογίας σε διάφορα σύνολα δεδοµένων αναφοράς, συµπεριλαµβανοµένου του συνόλου δεδοµένων Corsican Fire. Τα µοντέλα που διερευνήθηκαν στην παρούσα µελέτη περιλαµβάνουν τα DeepLabv3+, HRNet, HRNet+OCRNet, DDRNet, PIDNet, Swin Transformer, BASNet, BISNet, UNET3+, Attention U-Net και EMANet. Κάθε µοντέλο έχει µοναδικό αρχιτεκτονικό σχεδιασµό και ξεχωριστά χαρακτηριστικά, τα οποία δοκιµάζονται σε διάφορα σύνολα δεδοµένων αναφοράς για την αξιολόγηση της απόδοσής τους. Το σύνολο δεδοµένων Corsican Fire είναι ένα απαιτητικό σύνολο δεδοµένων που αποτελείται από εικόνες υψηλής ανάλυσης από δάση που έχουν ληφθεί κατά τη διάρκεια ξεσπασµάτων πυρκαγιών. Για να ελέγξουµε την ανθεκτικότητα του µοντέλου, συµπεριλάβαµε επίσης άλλα σύνολα δεδοµένων αναφοράς, τα οποία χρησιµοποιούνται ευρέως στον τοµέα της κατάτµησης εικόνων. Τα πειραµατικά µας αποτελέσµατα αποκαλύπτουν ότι τα µοντέλα Attention U-Net, EMANet και Swin Transformer υπερτερούν των άλλων µοντέλων όσον αφορά τη συνολική ακρίβεια τµηµατοποίησης και την ταχύτητα στο σύνολο δεδοµένων της πυρκαγιάς της Κορσικής. Επιπλέον, πραγµατοποιήσαµε µια εκτενή συγκριτική ανάλυση των µοντέλων σε άλλα σύνολα δεδοµένων αναφοράς και τα αποτελέσµατα δείχνουν ότι κάθε µοντέλο έχει τα δυνατά και τα αδύνατα σηµεία του, ανάλογα µε τα χαρακτηριστικά του συνόλου δεδοµένων και την εργασία τµηµατοποίησης. Συνεπώς στη συνέχεια της παρούσας µελέτης αποδείχθηκε ότι διαφορετικά µοντέλα αποδίδουν καλύτερα στην τεχνική transfer learning για την αξιολόγησή της επίδοσής τους σε άλλα σύνολα δεδοµένων. Συνολικά, η µελέτη µας παρέχει µια ολοκληϱωµένη αξιολόγηση των σύγχρονων µοντέλων τµηµατοποίησης εικόνας σε διάφορα σύνολα δεδοµένων αναφοράς, αναδεικνύοντας τις επιδόσεις, τα δυνατά σηµεία και τους περιορισµούς τους. Τα ευρήµατα αυτής της µελέτης µπορούν να χρησιµεύσουν ως σηµείο αναφοράς για τους ερευνητές στον τοµέα της όρασης υπολογιστών και της ανάλυσης εικόνας και µπορούν να ϐοηθήσουν στην ανάπτυξη αποδοτικότερων και ακριβέστερων µοντέλων τµηµατοποίησης εικόνας.	el
heal.sponsor	The process of segmenting an image into different regions or objects is a critical step in computer vision and image analysis. In recent years, deep learning-based image-segmentation models have demonstrated remarkable performance on various benchmark datasets. In this study, we have conducted a comprehensive analysis of several state-of-the-art image segmentation models on different benchmark datasets, including the Corsican Fire dataset. The models investigated in this study include DeepLabv3+, HRNet, HRNet+OCRNet, DDRNet, PIDNet, Swin Transformer, BASNet, BISNet, UNET3+, Attention U-Net, and EMANet. Each model has a unique architectural design and distinct features, which are tested on several benchmark datasets to evaluate their performance. The Corsican Fire dataset is a challenging dataset that consists of high-resolution images of forests captured during wildfire outbreaks. To test the model’s robustness, we have also included other benchmark datasets, which are widely used in the field of image segmentation. Our experimental results reveal that the Attention U-Net, EMANet, and Swin Transformer outperform the other models in terms of overall accuracy segmentation and speed on the Corsica fire dataset. In addition, we performed an extensive comparative analysis of the models on other datasets data sets and the results show that each model has its strengths and weaknesses. weak points, depending on the characteristics of the dataset and the task segmentation task. Therefore, in the remainder of this study, it was shown that different models perform better in the transfer learning technique for its evaluation performance on other datasets. Overall, our study provides a comprehensive evaluation of state-of-the-art image segmentation models on different benchmark datasets, highlighting their performance, strengths, and limitations. The findings of this study can serve as a benchmark for researchers in the field of computer vision and image analysis and can aid in the development of more efficient and accurate image segmentation models.	en
heal.advisorName	Κόλλιας, Στέφανος	el
heal.advisorName	Τζούβελη, Παρασκευή	el
heal.committeeMemberName	Στάμου, Γιώργος	el
heal.committeeMemberName	Βουλόδηµος, Αθανάσιος	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών	el
heal.academicPublisherID	ntua
heal.numberOfPages	174 σ.	el
heal.fullTextAvailability	false