Abstract:
Στο πλαίσιο της διατριβής μελετήθηκαν διάφορες εφαρμογές της Βαθιάς Μηχανικής Μάθησης για την αναγνώριση οπτικών δεδομένων. Αρχικά μελετήθηκαν, σχεδιάστηκαν και υλοποιήθηκαν διάφορες μεθοδολογίες σε τομείς όπως η ανάλυση συναισθήματος και η ανάλυση εικόνας. Ιδιαίτερη έμφαση δόθηκε στον τομέα της ιατρικής εικόνας με εφαρμογές σε νευροεκφυλιστικές νόσους, όπου κατασκευάσθηκε ένα σύνολο δεδομένων σχετικών με τη Νόσο του Parkinson. Έπειτα, σχεδιάσθηκαν και υλοποιήθηκαν διάφορες αρχιτεκτονικές για την ανάλυση των εικόνων αυτών, ώστε να εκπαιδευθεί ένα σύστημα ικανό να παράγει διαγνώσεις. Η απόδοση του τελευταίου όμως δεν αρκεί από μόνη της ώστε να εξασφαλιστεί η χρησιμότητά του, καθόσον το σύστημα να πρέπει να παρέχει μια μορφή ερμηνευσιμότητας. Κατά συνέπεια, το σύστημα επεκτάθηκε ώστε να του δοθεί η απαραίτητη διαφάνεια για το σκοπό αυτό. Στη συνέχεια, μελετήθηκε εκτενέστερα το θέμα της Ερμηνευσιμότητας των Βαθιών Νευρωνικών Δικτύων. Πιο συγκεκριμένα, ορίστηκαν διάφορες μετρικές μέσω των οποίων μπορεί κανείς να ποσοτικοποιήσει πόσο ερμηνεύσιμο είναι ένα δίκτυο και πόση απόδοση θα έπρεπε να θυσιάσει για να το πετύχει αυτό. Το πρόβλημα αντιμετωπίσθηκε με δύο προσεγγίσεις που έδωσαν πολύ ικανοποιητικά αποτελέσματα: η πρώτη είναι επέκταση της γνωστής τεχνικής των Χαρτών Ενεργοποίησης Κλάσης, ενώ η δεύτερη προτείνει μια νέα αρχιτεκτονική, η οποία θα εκπαιδεύεται για να προσδώσει εξηγήσεις στις αποφάσεις ενός δικτύου. Αυτό επιτυγχάνεται μέσω δύο υπο-δικτύων, ενός που έχει σκοπό να κρύβει μέρος της εισόδου και ενός που προσπαθεί να ταξινομεί την μερικώς κρυμμένη είσοδο, τα οποία εκπαιδεύονται συνεργατικά μέσω μιας συνάρτησης σφάλματος με δύο όρους.