| heal.abstract |
Η παρούσα μεταπτυχιακή εργασία εξετάζει τους τρόπους ενίσχυσης των ικανοτήτων των Μεγάλων Γλωσσικών Μοντέλων (LLMs) σε απαιτητικά προβλήματα συλλογιστικής, τα οποία προϋποθέτουν την ενσωμάτωση πληροφορίας από πολλαπλές κειμενικές πηγές. Παρά τις ήδη αξιοσημείωτες επιδόσεις των LLMs σε πληθώρα εργασιών Επεξεργασίας Φυσικής Γλώσσας (NLP), αυτά συχνά αντιμετωπίζουν προκλήσεις σε σύνθετες, πολυβηματικές διεργασίες ερωταπόκρισης.
Για την αντιμετώπιση αυτής της αδυναμίας, η παρούσα εργασία εστιάζει σε ένα πλαίσιο «δημιουργίας με ενισχυμένη ανάκτηση» (Retrieval-Augmented Generation – RAG), στο οποίο ένα Νευρωνικό Δίκτυο Γράφων (Graph Neural Network – GNN) λειτουργεί ως μηχανισμός ανάκτησης πληροφοριών. Συγκεκριμένα, κατασκευάζεται ένας γράφος ανάκτησης, όπου κάθε κόμβος αντιπροσωπεύει ένα κειμενικό απόσπασμα από ένα εκτενές αποθετήριο γνώσης, ενώ οι ακμές κωδικοποιούν τις σχέσεις ομοιότητας μεταξύ των αποσπασμάτων. Μέσω της εκπαίδευσης του GNN, επιτυγχάνεται η διάχυση και η ολοκλήρωση της πληροφορίας στον γράφο, επιτρέποντας τον εντοπισμό των σχετικών αποσπασμάτων που συμβάλλουν στην παραγωγή της τελικής απάντησης από το LLM.
Στη συνέχεια, το LLM δημιουργεί την απάντησή του με βάση τα ανακτηθέντα αποσπάσματα. Η προτεινόμενη μέθοδος, GNN-RAG, είναι ευέλικτη και μπορεί να αξιοποιηθεί με οποιοδήποτε προεκπαιδευμένο LLM, προσφέροντας μια γενικεύσιμη λύση. Οι πειραματικές αξιολογήσεις σε σύνθετες δοκιμασίες ερωταπόκρισης πολλαπλών βημάτων καταδεικνύουν ότι η μέθοδος GNN-RAG υπερτερεί σημαντικά έναντι των τυπικών προσεγγίσεων πυκνής ανάκτησης, βελτιώνοντας αισθητά τις συλλογιστικές ικανότητες των LLMs.
Επιπλέον, πραγματοποιείται λεπτομερής ανάλυση των διαφόρων σχεδιαστικών επιλογών, παρέχοντας πολύτιμες γνώσεις σχετικά με την αλληλεπίδραση μεταξύ ανάκτησης και δημιουργίας. Η ανάλυση αυτή συμβάλλει στην εμβάθυνση της κατανόησης της βέλτιστης ενσωμάτωσης αυτών των μηχανισμών σε προηγμένα συστήματα συλλογιστικής που αξιοποιούν LLMs. |
el |