HEAL DSpace

Κατηγοριοποίηση ιατρικών εικόνων µε χρήση υβριδικών CNN-ViT µοντέλων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Παντελαίος, Δημήτριος el
dc.contributor.author Κόλλιας, Στέφανος el
dc.contributor.author Pantelaios, Dimitrios en
dc.contributor.author Kollias, Stefanos en
dc.date.accessioned 2024-01-24T08:32:37Z
dc.date.available 2024-01-24T08:32:37Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/58646
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.26342
dc.rights Default License
dc.subject Συνελικτικά Νευρωνικά ∆ίκτυα el
dc.subject Κατηγοριοποίηση ιατρικών εικόνων el
dc.subject Ιογενής Πνευµονία el
dc.subject Βακτηριακή Πνευµονία el
dc.subject Υβριδικά µοντέλα ViT-CNN el
dc.subject Vision Transformers en
dc.subject COVID-19 en
dc.subject DeiT en
dc.subject CeiT en
dc.subject Compact Transformers el
dc.title Κατηγοριοποίηση ιατρικών εικόνων µε χρήση υβριδικών CNN-ViT µοντέλων el
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-07-27
heal.abstract Παρακινούμενοι από την επιτυχία των μετασχηματιστών στον τομέα της επεξεργασίας φυσικής γλώσσας, έγιναν προσπάθειες να εφαρμοστούν αντίστοιχα μοντέλα και στον τομέα της όρασης υπολογιστών. Γι' αυτό το λόγο δημιουργήθηκαν οι Vision Transformers, οι οποίοι παρουσιάζουν κορυφαίες επιδόσεις σε τομείς όπως η κατηγοριοποίηση εικόνων. Ωστόσο, οι Vision Transformers συλλαµβάνουν µακρινές καθολικές εξαρτήσεις μέσω των επιπέδων προσοχής, αλλά δεν διαθέτουν επαγωγικές προκαταλήψεις, ώστε να μπορούν να γενικευθούν όταν εκπαιδεύονται σε µικρό σύνολο δεδοµένων, με αποτέλεσμα να απαιτούνται μεγαλύτερα σύνολα δεδομένων για την εκπαίδευση τους. Αυτό αποτελεί ένα σημαντικό εμπόδιο στην κατηγοριοποίηση ιατρικών εικόνων, καθώς είναι δύσκολη η εύρεση μεγάλων ιατρικών συνόλων δεδομένων. Η παρούσα μελέτη ασχολείται με την κατηγοριοποίηση ακτινογραφιών θώρακος, που αντιστοιχούν σε διαφορετικές ασθένειες που επηρεάζουν τους πνεύμονες, όπως είναι ο COVID-19. Πιο συγκεκριμένα, COVID-19 είναι μια αρκετά μεταδοτική μολυσματική ασθένεια που προσβάλει το αναπνευστικό σύστημα και οφείλεται στον ιό SARS-CoV-2. Πολλοί ασθενείς που προσβάλλονται από αυτή χρειάζονται άμεση ιατρική βοήθεια και αυτό καθιστά επιτακτική την άμεση ανιχνευση της. Για την επίλυση των παραπάνω προβλημάτων επινοήθηκαν τα υβριδικά μοντέλα, τα οποία προσπαθούν να προσθέσουν κάποια πλεονεκτήματα των συνελικτικών νευρωνικών δικτύων στους Vision Transformer, προκειμένου να γίνει δυνατή η εκπαίδευση των μοντέλων σε μικρότερα σύνολα δεδομένων. Στην μελέτη αυτή επικεντρωνόμαστε στην σύγκριση των υβριδικών μοντέλων προεκπαιδευμένων στο ImageNet-1k με τον παραδοσιακό Vision Transformer προεκπαιδευμένo στο ImageNet-21k, αλλά και στην εκπαίδευση των μοντέλων από την αρχή κάνοντας χρήση τόσο ενός μέρους, όσο και ολόκληρου του διαθέσιμου συνόλου δεδομένων COVID-QU-Ex. Τα αποτελέσματα που προκύπτουν δείχνουν την υπεροχή των υβριδικών μοντέλων τόσο όσον αφορά την ακρίβεια, τον χρόνο εκπαίδευσης, αλλά και τον αριθμό των δεδομένων που απαιτείται για την εκπαίδευση. el
heal.advisorName Τζούβελη, Παρασκευή el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Στάμου, Γιώργος el
heal.committeeMemberName Βουλόδημος, Αθανάσιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 112 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής