heal.abstract |
Στο σύγχρονο διαδίκτυο, η αφθονία δεδομένων μπορεί να αποβεί αφόρητη για τους χρήστες. Για την βελτίωση της εμπειρίας χρήστη, οι εξατομικευμένες προτάσεις γίνονται όλο και πιο σημαντικές. Εμπνευσμένη από την αυξανόμενη τάση των προσεγγίσεων που βασίζονται σε γράφους στα συστήματα συστάσεων, αυτή η διπλωματική εργασία διερευνά τις δυνατότητες των νευρωνικών δικτύων γράφων (GNN) για την ανάπτυξη ενος συστήματος προτάσεων ταινιών. Η προσέγγισή μας περιλαμβάνει την αντιμετώπιση του προβλήματος ως την διαδικασία πρόβλεψης βάρους των ακμών σε ένα διμερές γράφημα, αποτελούμενο από χρήστες και ταινίες ως κόμβους, και τις αντίστοιχες βαθμολογήσεις ως ακμές. Πραγματοποιούμε την έρευνά μας σε ένα σχετικά νέο σύνολο δεδομένων, ονομαζόμενο The Movies Dataset, το οποίο δεν έχει χρησιμοποιηθεί ευρέως σε δημοσιεύσεις για συστήματα συστάσεων. Το σύνολο δεδομένων αυτό περιέχει βαθμολογήσεις από πραγματικούς χρήστες σε ταινίες, καθώς και πολυάριθμα μεταδεδομένα σχετικά με το περιεχόμενο κάθε ταινίας, τα οποία έχουν εξαχθεί από ποικίλες διαδιτκυακές πηγές. Μοντελοποιούμε το σύνολο δεδομένων ως γράφο και το αποθηκεύουμε σε ένα σύστημα διαχείρισης βάσεων δεδομένων γράφων. Για την αξιοποίηση των πολυάριθμων μεταδεδομένων που σχετίζονται με το περιεχόμενο της κάθε ταινίας, τα κωδικοποιούμε ως εμφυτεύματα κόμβων χρησιμοποιώντας ποικίλες τεχνικές. Το υλοποιημένο μοντέλο συστάσεων λαμβάνει ως είσοδο τον διμερή γράφο και προβλέπει τις ακριβείς τιμές των νέων βαθμολογήσεων. Μετά από την διεξαγωγή πολλαπλών πειραμάτων και τον συντονισμό των πολυάριθμων υπερπαραμέτρων, η λύση μας πετυχαίνει επιδόσεις συγκρινόμενες με λύσεις τελευταίας τεχνολογίας, που βασίζονται σε γράφους, στο αντίστοιχο σύνολο δεδομένων MovieLens. Δείχνουμε ότι χρησιμοποιώντας κατάλληλους αλγορίθμους για την δημιουργία των εμφυτευμάτων κόμβων που αντιπροσωπεύουν το περιεχόμενο της κάθε ταινίας, μπορούμε να βελτιώσουμε την ακρίβεια των προβλέψεων σε όλες τις αρχιτεκτονικές νευρωνικών δικτύων γράφων που διερευνήθηκαν σε αυτήν την διατριβή. Επιπλέον της ανωτέρω έρευνας, αναπτύσσουμε και μία πλήρη διαδικτυακή εφαρμογή, που αποτελείται από πολυάριθμες υπηρεσίες στην πλευρά του διακοσμητή, και από μία διεπαφή χρήστη. Η πλατφόρμα δίνει στους χρήστες την δυνατότητα να εξερευνούν και να βαθμολογούν ταινίες, συμβάλλοντας στην επέκταση του συνόλου δεδομένων με νέους χρήστες και αξιολογήσεις. Επιπλέον, η ενοποίηση του μοντέλου συστάσεων με τα υπόλοιπα συστατικά μέρη της πλατφόρμας, προσφέρει μία εισαγωγή στο πεδίο των MLOps, ενώ ταυτόχρονα επιτρέπει την δοκιμή του συστήματος συστάσεων σε πραγματικές συνθήκες. |
el |