HEAL DSpace

Causal transfer learning for personalized recommendation systems

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κόντη, Πολυξένη Ειρήνη el
dc.contributor.author Konti, Polyxeni Eirini en
dc.date.accessioned 2022-11-18T10:22:18Z
dc.date.available 2022-11-18T10:22:18Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56163
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.23861
dc.rights Default License
dc.subject Εξατομικευμένο Σύστημα Συστάσεων el
dc.subject Ομαδοποίηση χρηστών el
dc.subject Συνεργατική μάθηση el
dc.subject Μεταφορά μάθησης el
dc.subject Αιτιότητα el
dc.subject Personalized Recommendation System en
dc.subject Federated Learning en
dc.subject Clustering en
dc.subject Transfer Learning en
dc.subject Causality en
dc.title Causal transfer learning for personalized recommendation systems en
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-07-13
heal.abstract Σε αυτή την εργασία μελετάμε ένα πρόβλημα μεταφοράς μάθησης για εξατομικευμένα συστήματα συστάσεων, που θα επιτρέπει σε διαφορετικές ομάδες χρηστών να μαθαίνουν συνεργατικά τις προτιμήσεις τους χωρίς να μοιράζονται ιδιωτικές πληροφορίες μεταξύ τους. Συγκεκριμένα, θεωρούμε έναν server που έχει πρόσβαση μόνο σε δεδομένα που προκύπτουν από την αλληλεπίδραση των χρηστών με το σύστημα και όχι από τα υπόλοιπα προσωπικά τους χαρακτηριστικά. Μοντελοποιούμε αυτό το σύστημα ως ένα Multi-armed bandit πρόβλημα (MAB) με ξεχωριστές μηχανές συστάσεως για κάθε ομάδα χρηστών. Στόχος του συστήματος είναι να προσδιορίσει τις προτιμήσεις της κάθε ομάδας χρηστών, να κατατάξει τους χρήστες στις ομάδες αυτές, και ανάλογα με την κατάταξη αυτή να τους κάνει τις κατάλληλες συστάσεις ώστε να μεγιστοποιησει την ανταμοιβή τους προς το σύστημα. Ωστόσο, λαμβάνοντας υπόψιν την απουσία γνώσης σχετικά με τα χαρακτηριστικά των ομάδων αλλα και ειδικότερα των χρηστών, γίνεται αντιληπτό ότι ο server δεν μπορεί να υπολογίσει τα πραγματικά rewards της κάθε ομάδας προς τις πιθανές συστάσεις (arms) του συστήματος. Αντ’ αυτού, κρίνεται σκόπιμος ο υπολογισμός causal bounds για το reward που προσίδει στο σύστημα το κάθε arm. Μέσω των ορίων αυτών μπορεί να γίνει μεταφορά γνώσης μεταξύ των ομάδων και να προκύψει έτσι ένας νέος causal-constrained UCB αλγόριθμος, που θα επιτρέπει σε κάθε ομάδα χρηστών να μάθει την καλύτερη επιλογή που μπορεί να της προσφέρει το σύστημα αξιοποιώντας πληροφορίες από τις υπόλοιπες ομάδες. ΄Ενα βασικό χαρακτηριστικό του αλγορίθμου μας είναι η ικανότητά του να αντιμετωπίζει σφάλματα κατά την ομαδοποίηση των χρηστών σε διαφορετικές ομάδες χρηστών, γεγονός πιθανό μιας και η ομάδα στην οποία ανήκει ο κάθε χρήστης θεωρείται πληροφορία άγνωστη στον server. Τέτοια σφάλματα μπορεί να οδηγήσουν σε user selection bias που μπορεί να επηρεάσει την διαδικασία εκμάθησης. Για να αντιμετωπίσουμε αυτήν την πρόκληση, εφαρμόζουμε μια ϵ-greedy μέθοδο, πουκειμένου τόσο να επιτραπεί η δίκαιη εξερεύνηση όων των arms του συστήματος όσο και να βελτιωθεί η ακρίβεια ομαδοποίησης κατά τη διάρκεια της εκμάθησης. Μέσω της διεξαγωγής αριθμητικών πειραμάτων αποδεικνύεται ότι ο προτεινόμενος αλγόριθμος ξεπερνά μεθόδους μάθησης που δεν λαμβάνουν υπόψη ούτε την ύπαρξη αιτιότητας (causality) στο σύστημα, αλλά ούτε και την ύπαρξη λάθους ομαδοποίησης των χρηστών του συστήματος. el
heal.abstract In this paper we study a transfer learning problem for personalized recommendation systems to allow distinct user groups defined by distinct preferences to learn from each other without sharing private information. Specifically, we consider a server that has access only to user-click data points but not to any other personal user attributes. We model this system as a federated multi-armed bandit (MAB) problem with distinct bandit machines for each user group associated with distinct reward functions. The goal is to learn the true user types and rewards while maximizing the user clicks by adapting the arm selection strategy. Since, in the presence of unobserved user group preferences, the server cannot compute the true click-through rates (rewards) for each user group, we instead propose to compute causal bounds on the true click-through rates that by design contain the true values. Transferring these bounds to the different user groups, we obtain a new causal-bound-constrained UCB algorithm that allows each user group to learn their best arm by taking advantage of information from other groups. A key feature of our algorithm is its ability to deal with errors in the clustering of users to different user groups, which is possible since the true user group membership is assumed unknown to the server. Such errors can result in user selection bias and, therefore, bias in the learning process. To address this challenge, we implement an ϵ-greedy method to enable fair exploration and improve clustering accuracy during learning. We present numerical experiments that demonstrate that our proposed algorithm outperforms non-causal federated learning methods that do not account for clustering errors, especially for user types that constitute the minority of a data set. en
heal.sponsor Υποτροφία Λεμός el
heal.advisorName Στάμου, Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Ζαβλανός, Μιχάλης el
heal.committeeMemberName Βουλόδημος, Αθανάσιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 62 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής