H διδακτορική διατριβή τοποθετείται στον χώρο των συστημάτων αποφάσεων και ειδικότερα στην περιοχή των συστημάτων προτάσεων (recommender systems) όπου προτείνει την ανάπτυξη συστημάτων προτάσεων με χρήση πιθανοτικών μοντέλων θεμάτων (probabilistic topic models).
Στο πλαίσιο της διατριβής πραγματοποιήθηκε βιβλιογραφική μελέτη στα γνωστικά πεδία της χρήσης τεχνικών μηχανικής μάθησης και της πιθανοτικής λανθάνουσας σημασιολογικής ανάλυσης (probabilistic latent semantic analysis) για την πραγματοποίηση προτάσεων. Στην παρούσα διατριβή διερευνάται η δυνατότητα για βελτιωμένα συστήματα προτάσεων στο εσωτερικό επιχειρήσεων, κοινοτήτων και στο εμπόριο με βάση λανθάνοντα θέματα.
Παρουσιάζεται μία προσέγγιση για την ενσωμάτωση της υπάρχουσας γνώσης ενός πεδίου σε ένα σύστημα προτάσεων. Ακόμη, προτείνεται μια μεθοδολογία που εκμεταλλεύεται την εξαγωγή πιθανοτικών μοντέλων θεμάτων για την πλήρη και αποτελεσματική μοντελοποίηση της ικανότητας ενός εργαζομένου να αντιμετωπίσει ένα πρόβλημα. Περιγράφεται μια μεθοδολογία εξαγωγής προτιμήσεων για καταναλωτές σε υπεραγορές από ένα σύνολο δεδομένων με χρήση λανθανόντων θεμάτων. Τέλος, προτείνεται και αξιολογείται μια μεθοδολογία για την εκμετάλλευση του μη δομημένου κειμένου που βρίσκεται σε ηλεκτρονικές αγορές δημοπρασιών για την παραγωγή προτάσεων που απευθύνονται σε αγοραστές και πωλητές.
Τα συστήματα προτάσεων που προτείνονται αξιολογήθηκαν με ενθαρρυντικά αποτελέσματα και παρουσίασαν κοινά χαρακτηριστικά:
(1) μειώνουν τις διαστάσεις του προβλήματος και παρέχουν γρήγορα προτάσεις αφού έχει προηγηθεί η εξαγωγή των μοντέλων θεμάτων,
(2) ικανοποιούν τις απαιτήσεις των χρηστών για ακρίβεια και ανάκληση των δεδομένων που τους ενδιαφέρουν,
(3) τα θέματα που εξάγονται μπορούν να αποτελέσουν σημαντική πληροφορία για τον ιδιοκτήτη ή τον διαχειριστή του συστήματος.
This doctoral thesis is positioned in the research area of decision support systems and specifically in recommender systems. It focuses on the design and development of recommender systems based on probabilistic topic models.
In this thesis we have thoroughly examined the literature related to utilizing machine learning techniques and probabilistic latent semantic analysis for providing recommendations. We explore the possibility to design improved recommender systems inside enterprises, communities and in electronic commerce based on latent topics.
An approach is presented for integrating existing domain knowledge in a recommender system. Additionally, a methodology is proposed for utilizing probabilistic topic models for complete and effective modeling of employee expertise on addressing problems. A methodology is described for extracting consumer preferences from datasets using topic models. Finally, we present and evaluate a methodology for utilizing the unstructured text found in electronic auction marketplaces in order to provide recommendations to buyers and sellers.
The recommender systems proposed in this thesis have displayed a number of common characteristics:
1) They reduce the dimensions of the recommendation problem and provide fast online recommendations, having trained the topic models.
2) They satisfy the user needs for accuracy and recall of all interesting objects.
3) The topics extracted can provide significant insight to the system manager or owner.