heal.abstract |
Παρακινούμενοι από την επιτυχία των μετασχηματιστών στον τομέα της επεξεργασίας φυσικής γλώσσας, έγιναν προσπάθειες να εφαρμοστούν αντίστοιχα μοντέλα και στον τομέα της όρασης υπολογιστών. Γι' αυτό το λόγο δημιουργήθηκαν οι Vision Transformers, οι οποίοι παρουσιάζουν κορυφαίες επιδόσεις σε τομείς όπως η κατηγοριοποίηση εικόνων. Ωστόσο, οι Vision Transformers συλλαµβάνουν µακρινές καθολικές εξαρτήσεις μέσω των επιπέδων προσοχής, αλλά δεν διαθέτουν επαγωγικές προκαταλήψεις, ώστε να μπορούν να γενικευθούν όταν εκπαιδεύονται σε µικρό σύνολο δεδοµένων, με αποτέλεσμα να απαιτούνται μεγαλύτερα σύνολα δεδομένων για την εκπαίδευση τους. Αυτό αποτελεί ένα σημαντικό εμπόδιο στην κατηγοριοποίηση ιατρικών εικόνων, καθώς είναι δύσκολη η εύρεση μεγάλων ιατρικών συνόλων δεδομένων. Η παρούσα μελέτη ασχολείται με την κατηγοριοποίηση ακτινογραφιών θώρακος, που αντιστοιχούν σε διαφορετικές ασθένειες που επηρεάζουν τους πνεύμονες, όπως είναι ο COVID-19. Πιο συγκεκριμένα, COVID-19 είναι μια αρκετά μεταδοτική μολυσματική ασθένεια που προσβάλει το αναπνευστικό σύστημα και οφείλεται στον ιό SARS-CoV-2. Πολλοί ασθενείς που προσβάλλονται από αυτή χρειάζονται άμεση ιατρική βοήθεια και αυτό καθιστά επιτακτική την άμεση ανιχνευση της. Για την επίλυση των παραπάνω προβλημάτων επινοήθηκαν τα υβριδικά μοντέλα, τα οποία προσπαθούν να προσθέσουν κάποια πλεονεκτήματα των συνελικτικών νευρωνικών δικτύων στους Vision Transformer, προκειμένου να γίνει δυνατή η εκπαίδευση των μοντέλων σε μικρότερα σύνολα δεδομένων. Στην μελέτη αυτή επικεντρωνόμαστε στην σύγκριση των υβριδικών μοντέλων προεκπαιδευμένων στο ImageNet-1k με τον παραδοσιακό Vision Transformer προεκπαιδευμένo στο ImageNet-21k, αλλά και στην εκπαίδευση των μοντέλων από την αρχή κάνοντας χρήση τόσο ενός μέρους, όσο και ολόκληρου του διαθέσιμου συνόλου δεδομένων COVID-QU-Ex. Τα αποτελέσματα που προκύπτουν δείχνουν την υπεροχή των υβριδικών μοντέλων τόσο όσον αφορά την ακρίβεια, τον χρόνο εκπαίδευσης, αλλά και τον αριθμό των δεδομένων που απαιτείται για την εκπαίδευση. |
el |