Κατηγοριοποίηση ιατρικών εικόνων µε χρήση υβριδικών CNN-ViT µοντέλων

Παντελαίος, Δημήτριος; Κόλλιας, Στέφανος; Pantelaios, Dimitrios; Kollias, Stefanos

dc.contributor.author	Παντελαίος, Δημήτριος	el
dc.contributor.author	Κόλλιας, Στέφανος	el
dc.contributor.author	Pantelaios, Dimitrios	en
dc.contributor.author	Kollias, Stefanos	en
dc.date.accessioned	2024-01-24T08:32:37Z
dc.date.available	2024-01-24T08:32:37Z
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/58646
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.26342
dc.rights	Default License
dc.subject	Συνελικτικά Νευρωνικά ∆ίκτυα	el
dc.subject	Κατηγοριοποίηση ιατρικών εικόνων	el
dc.subject	Ιογενής Πνευµονία	el
dc.subject	Βακτηριακή Πνευµονία	el
dc.subject	Υβριδικά µοντέλα ViT-CNN	el
dc.subject	Vision Transformers	en
dc.subject	COVID-19	en
dc.subject	DeiT	en
dc.subject	CeiT	en
dc.subject	Compact Transformers	el
dc.title	Κατηγοριοποίηση ιατρικών εικόνων µε χρήση υβριδικών CNN-ViT µοντέλων	el
heal.type	bachelorThesis
heal.classification	Μηχανική Μάθηση	el
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2023-07-27
heal.abstract	Παρακινούμενοι από την επιτυχία των μετασχηματιστών στον τομέα της επεξεργασίας φυσικής γλώσσας, έγιναν προσπάθειες να εφαρμοστούν αντίστοιχα μοντέλα και στον τομέα της όρασης υπολογιστών. Γι' αυτό το λόγο δημιουργήθηκαν οι Vision Transformers, οι οποίοι παρουσιάζουν κορυφαίες επιδόσεις σε τομείς όπως η κατηγοριοποίηση εικόνων. Ωστόσο, οι Vision Transformers συλλαµβάνουν µακρινές καθολικές εξαρτήσεις μέσω των επιπέδων προσοχής, αλλά δεν διαθέτουν επαγωγικές προκαταλήψεις, ώστε να μπορούν να γενικευθούν όταν εκπαιδεύονται σε µικρό σύνολο δεδοµένων, με αποτέλεσμα να απαιτούνται μεγαλύτερα σύνολα δεδομένων για την εκπαίδευση τους. Αυτό αποτελεί ένα σημαντικό εμπόδιο στην κατηγοριοποίηση ιατρικών εικόνων, καθώς είναι δύσκολη η εύρεση μεγάλων ιατρικών συνόλων δεδομένων. Η παρούσα μελέτη ασχολείται με την κατηγοριοποίηση ακτινογραφιών θώρακος, που αντιστοιχούν σε διαφορετικές ασθένειες που επηρεάζουν τους πνεύμονες, όπως είναι ο COVID-19. Πιο συγκεκριμένα, COVID-19 είναι μια αρκετά μεταδοτική μολυσματική ασθένεια που προσβάλει το αναπνευστικό σύστημα και οφείλεται στον ιό SARS-CoV-2. Πολλοί ασθενείς που προσβάλλονται από αυτή χρειάζονται άμεση ιατρική βοήθεια και αυτό καθιστά επιτακτική την άμεση ανιχνευση της. Για την επίλυση των παραπάνω προβλημάτων επινοήθηκαν τα υβριδικά μοντέλα, τα οποία προσπαθούν να προσθέσουν κάποια πλεονεκτήματα των συνελικτικών νευρωνικών δικτύων στους Vision Transformer, προκειμένου να γίνει δυνατή η εκπαίδευση των μοντέλων σε μικρότερα σύνολα δεδομένων. Στην μελέτη αυτή επικεντρωνόμαστε στην σύγκριση των υβριδικών μοντέλων προεκπαιδευμένων στο ImageNet-1k με τον παραδοσιακό Vision Transformer προεκπαιδευμένo στο ImageNet-21k, αλλά και στην εκπαίδευση των μοντέλων από την αρχή κάνοντας χρήση τόσο ενός μέρους, όσο και ολόκληρου του διαθέσιμου συνόλου δεδομένων COVID-QU-Ex. Τα αποτελέσματα που προκύπτουν δείχνουν την υπεροχή των υβριδικών μοντέλων τόσο όσον αφορά την ακρίβεια, τον χρόνο εκπαίδευσης, αλλά και τον αριθμό των δεδομένων που απαιτείται για την εκπαίδευση.	el
heal.advisorName	Τζούβελη, Παρασκευή	el
heal.committeeMemberName	Κόλλιας, Στέφανος	el
heal.committeeMemberName	Στάμου, Γιώργος	el
heal.committeeMemberName	Βουλόδημος, Αθανάσιος	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών	el
heal.academicPublisherID	ntua
heal.numberOfPages	112 σ.	el
heal.fullTextAvailability	false