heal.abstract |
Στην παρούσα διπλωματική εργασία μελετάμε την κατάθλιψη και πώς μπορεί να ανιχνευθεί μέσω
μοντέλων Βαθιάς Μηχανικής Μάθησης. Η κατάθλιψη είναι ένα από τα πιο κοινά ψυχικά νοσήματα
που ταλανίζει πολλούς ανθρώπους σε όλο τον κόσμο. Ευτυχώς, υπάρχει πληθώρα φαρμακευτικών
αγωγών που δύνανται να αντιμετωπίσουν την κατάθλιψη. Ωστόσο, η διάγνωση της κρίνεται ακόμη
επίπονη, καθώς τα συμπτώματα της κατάθλιψης είναι πολλαπλά και αρκετά κοινά με άλλες ψυχικές
ασθένειες και, επομένως, δυσχεραίνουν την διαδικασία διάγνωσης.
Αρχικά, ακολουθώντας μια εκτενή αναφορά στην μέχρι τώρα έρευνα που έχει πραγματοποιηθεί
γύρω από την διαδικασία ανίχνευσης κατάθλιψης στον τομέα της Επεξεργασίας Φυσικής Γλώσσας,
επιλέγουμε να πραγματοποιήσουμε την δική μας έρευνα σε αυτή την εργασία χρησιμοποιώντας ένα
σύνολο δεδομένων που προέρχεται από την διαδικτυακή πλατφόρμα Reddit. Ειδικότερα, έχει συλ-
λεχθεί ένα σύνολο χρηστών, μαζί με τις δημοσιεύσεις τους σε διάφορα νήματα της πλατφόρμας και
έχουν ταξινομηθεί ως καταθλιπτικοί ή υγιείς. Το σύνολο δεδομένων μας, μάς αναγκάζει να στρα-
φούμε σε μοντέλα δύο επιπέδων, καθώς θα χρειαστούμε πρώτα μια επεξεργασία των δεδομένων σε
επίπεδο δημοσίευσης και στη συνέχεια σε επίπεδο χρήστη. Η πρώτη μας ενέργεια είναι να ανιχνε-
ύσουμε διάφορες εκδηλώσεις της ανθρώπινης συμπεριφοράς και να τις συνδυάσουμε κατάλληλα με τις
̈με-συμφραζόμενα’ αναπαραστάσεις που εξάγονται από το Bert. Χρησιμοποιούμε κατάλληλους ανι-
χνευτές για το συναίσθημα, την ειρωνεία και τα χαρακτηριστικά της προσωπικότητας για την κάθε
δημοσίευση του χρήστη.
́Επειτα, επιλέγουμε να εστιάσουμε στον ανιχνευτή συναισθήματος και να προσπαθήσουμε να βελτι-
ώσουμε την γενικότερη επίδοση της αρχιτεκτονικής μας, ύστερα από παρατηρήσεις της απόδοσης των
μοντέλων μας. Αναπτύσσουμε διαφορετικές μεθόδους ενσωμάτωσης της πληροφορίας που λαμβάνου-
με από τον ανιχτευτή στις αναπαράστασεις που εξάγονται από το Bert. Συγκεντρωτικά, αναλύουμε
τρεις μεθόδους που πραγματοποιούνται σε επίπεδο χρήστη, όπου συνδυάζουμε δύο διαφορετικές ανα-
παραστάσεις του χρήστη: μία από το Bert και μία από τον ανιχνευτή, και τρεις μεθόδους σε επίπεδο
δημοσίευσης, όπου χρησιμοποιούμε τον μηχανισμό Προσοχής κατάλληλα για να συνδυάσουμε τις δύο
αναπαραστάσεις της κάθε δημοσίευσης και συνολικά να πάρουμε μια αναπαράσταση για τον χρήστη.
́Υστερα από μία επιπλέον ανάλυση μας στο σύνολο δεδομένων, καταλήγουμε σε δύο σημαντικά χαρα-
κτηριστικά που μπορούν να βοηθήσουν περαιτέρω στην επίδοση του μοντέλου μας, η χρήση υβριστικού
και ηθικού λεξιλογίου. Είσαγουμε κατάλληλα αυτά τα χαρακτηριστικά στο μοντέλο μας και καταφέρ-
νουμε μια βελτίωση της τάξης του 5% σε σχέση με το μοντέλο χωρίς αυτά και 15% σε σχέση με τα
μέχρι πρότινος καλύτερα μοντέλα.
Τέλος, επεκτείνουμε τις ιδέες και την αρχιτεκτονική μας σε δύο ακόμα σύνολα δεδομένων: ένα
ακόμα σχετιζόμενο με την κατάθλιψη και ένα που αφορά στην ανίχνευση δημοσιεύσεων που περιέχουν
σημάδια άγχους. Και τα δύο σύνολα δεδομένων αναγκάζουν την αρχιτεκτονική μας να ̈κατέβει’ ένα
επίπεδο, προκειμένου να εφαρμοστεί, έχοντας σε αυτές τις περιπτώσεις ένα επίπεδο λέξεων και ένα
επίπεδο δημοσιεύσεων. Η ικανότητα γενίκευσης του μοντέλου μας, καθώς και η χρήση ενός ανιχνευτή
συναισθήματος και η εισαγωγή επιπλέον χαρακτηριστικών, σχετιζόμενων με το υβριστικό και ηθικό
λεξιλόγιο, κρίνονται αποτελεσματικά και στις δύο περιπτώσεις. |
el |