heal.abstract |
Σκοπός της εργασίας αυτής είναι η μελέτη ενός σχετικά νέου τομέα της μηχανικής μάθησης, της μάθησης σε μεταβαλλόμενα περιβάλλοντα (learning in nonstationary environments), και η εφαρμογή κάποιων από τις μεθοδολογίες του σε ένα πρόβλημα αναγνώρισης συναισθήματος από εικόνα.
Οι συνήθεις αλγόριθμοι μηχανικής μάθησης (νευρωνικά δίκτυα, SVM, Random forests, κλπ.) λειτουργούν με τον εξής τρόπο: αρχικά εκπαιδεύονται σε ένα γνωστό σύνολο δεδομένων (train data) και στη συνέχεια εφαρμόζονται στα υπόλοιπα δεδομένα που θέλουμε να ταξινομήσουμε (test data). Η διαδικασία αυτή κάνει μία θεμελιώδη παραδοχή: ότι η στατιστική κατανομή των test data είναι η ίδια με τη στατιστική κατανομή των train data. Με τον τρόπο αυτό, ένας αλγόριθμος μηχανικής μάθησης μαθαίνει τις ιδιότητες των δεδομένων απ’ τα test data, και τις εφαρμόζει μετά στα προς ταξινόμηση δεδομένα.
Υπάρχουν όμως κάποιες περιπτώσεις, όπου η παραπάνω υπόθεση είναι λανθασμένη. Σε μία αρκετά μεγάλη ποικιλία φαινομένων, η στατιστική κατανομή των δεδομένων μεταβάλλεται με το χρόνο. Μερικά παραδείγματα είναι οι κλιματολογικές συνθήκες, δημογραφικά δεδομένα, εισηγητικά συστήματα όπου οι προτιμήσεις του χρήστη αλλάζουν όσο αυτός μεγαλώνει, ρομπότ που αλληλεπιδρούν με το περιβάλλον, κλπ. Σε αυτές τις περιπτώσεις χρειαζόμαστε κάποιες μεθόδους, οι οποίες να μπορούν να ανιχνεύουν τις στατιστικές μεταβολές των δεδομένων, και να τροποποιούν ανάλογα τον ταξινομητή, προσθέτοντας σε αυτόν τη νέα γνώση. Ο κλάδος αυτός της μηχανικής μάθησης ονομάζεται adaptive learning, ή learning in nonstationary environments, ενώ το φαινόμενο της στατιστικής μεταβολής των φαινομένων ονομάζεται concept drift (μεταβολή εννοιολογικού πλαισίου, ή απλώς μεταβολή πλαισίου).
Στην παρούσα εργασία, θα παρουσιάσουμε και θα ανακεφαλαιώσουμε τις σημαντικότερες ιδέες και τεχνικές του adaptive learning. Στη συνέχεια, στο πειραματικό μέρος, θα προσπαθήσουμε να εφαρμόσουμε κάποιες απ’ τις τεχνικές αυτές στο πεδίο της αναγνώρισης συναισθήματος από εικόνα (emotion recognition). Χρησιμοποιώντας μία βάση με φωτογραφίες χρηστών και αντίστοιχων συναισθημάτων, θα εκπαιδεύσουμε ένα deep neural net στο να αναγνωρίζει τα συναισθήματα αυτά. Στη συνέχεια, θα προκαλέσουμε drift στο dataset μας, εισάγοντας στον ταξινομητή εικόνες των χρηστών με άλλες συνθήκες φωτισμού, περιβάλλοντος, κλπ., τροποποιημένες – αλλοιωμένες εικόνες των χρηστών, εικόνες άλλων χρηστών, κλπ., και θα δούμε οι αλγόριθμοί μας είναι σε θέση να αντιληφθούν τις μεταβολές αυτές, και αν μπορούν να βελτιώσουν την απόδοση της ταξινόμησης, και σε ποιο βαθμό. Τέλος, ανακεφαλαιώνουμε τα συμπεράσματά που βγάλαμε, και προτείνουμε πιθανές βελτιώσεις. |
el |