HEAL DSpace

Μελέτη μεθόδων για την έμμεση αύξηση των δεδομένων εκπαίδευσης συναρτήσεων ταξινόμησης σε αποτελέσματα αναζήτησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Σελλής, Τιμολέων el
dc.contributor.author Πάρχας, Παναγιώτης Γ. el
dc.contributor.author Parchas, Panagiotis G. en
dc.date.accessioned 2011-03-30T06:36:16Z
dc.date.available 2011-03-30T06:36:16Z
dc.date.copyright 2011-03-08
dc.date.issued 2011-03-30T06:36:16Z
dc.date.submitted 2011-03-08
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/3882
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.6273
dc.description 71 σ. el
dc.description.abstract Καθώς ο όγκος πληροφορίας που διακινείται μέσω του διαδικτύου αυξάνεται με εκθετικό ρυθμό, η ανάγκη αποδοτικής αναζήτησης γίνεται όλο και πιο επιβεβλημένη. Η αναζήτηση πλέον διαφοροποιείται ανάλογα με τον χρήστη και τις συνήθειές του. Καθώς ο χρήστης αλλάζει συνεχώς το μοτίβο (pattern) των επιλογών του, δεν μπορεί να κατασκευαστεί ντετερμινιστικός αλγόριθμος που να επιστρέφει την βέλτιστη σειρά αποτελεσμάτων για τον εκάστοτε χρήστη. Μια προσέγγιση για την επίτευξη της προσωποποιημένης αναζήτησης είναι η χρήση νευρωνικών δικτύων. Τα νευρωνικά δίκτυα αποτελούν προσεγγιστικά μοντέλα τα οποία ουσιαστικά ελαχιστοποιούν μια συνάρτηση βάση κάποιων περιορισμών. Για την υλοποίηση τους χρειαζόμαστε κάποιο σύνολο εκμάθησης. Θεωρητικά, όσο μεγαλύτερο και πιο αντιπροσωπευτικό είναι το σύνολο εκμάθησης τόσο καλύτερο είναι το μοντέλο που κατασκευάζεται. Το σύνολο όμως των αποτελεσμάτων που αξιολογούν οι χρήστες σε κάθε αναζήτησή τους είναι μικρό (συνήθως μόνο τα 10 πρώτα αποτελέσματα). Η ιδέα αυτής της διπλωματικής είναι να επεκτείνουμε τις πραγματικές αξιολογήσεις των χρηστών σε αποτελέσματα που είναι συναφή με βάση κάποια συγκεκριμένα χαρακτηριστικά. Υλοποιούμε δηλαδή συσταδοποίηση (clustering) των αποτελεσμάτων, αποφασίζουμε ποιες συστάδες θα κρατήσουμε, ορίζουμε μια ενιαία αξιολόγηση για κάθε συστάδα και την επεκτείνουμε σε όλα τα μέλη του. Επίσης δοκιμάστηκε μεγάλο σύνολο αλγορίθμων για το clustering ώστε να επιτευχθεί το καλύτερο δυνατό αποτέλεσμα. Αυτά τα νέα σύνολα δόθηκαν σαν είσοδος στο νευρωνικό (SVM) και κατασκευάστηκε το μοντέλο που στη συνέχεια ελέγχθηκε με τη χρήση ενός διαφορετικού συνόλου ελέγχου(dataset) που προσομοιώνει την νέα αναζήτηση του χρήστη. Όλη η διαδικασία αναλύεται με λεπτομέρειες στις σελίδες που ακολουθούν. el
dc.description.abstract The vast amount of information traveling through the Internet makes the need of efficient web search crucial. The web search gets personalized and the results of the same query differ among users. There have been stated different approaches for the problem of personalization in web search. Our approach is based οn the training of neural networks so as to boost the result of a new search, considering the user's options of previous searches. We use the click-through data of the user in order to rank the results and provide the most relevant ones, higher in ordering. The problem we face is that there are limited click-through data per query as the user normally checks only the first n results of the thousands provided by the search engine. In our approach we try to expand the judgment of these first results in the unjudged ones so as to have a bigger training set for our SVM. This expansion is basically done through clustering of the results into relevant groups considering different criteria. In our experiments, we use the LETOR benchmark. In the following pages we elaborate on our method and we explain the results of our experiments. en
dc.description.statementofresponsibility Παναγιώτης Γ. Πάρχας el
dc.format.extent 175 bytes
dc.format.mimetype text/xml
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Νευρωνικά δίκτυα el
dc.subject Ανάκτηση πληροφορίας el
dc.subject Συσταδοποίηση el
dc.subject Αξιολόγηση el
dc.subject Εμπλουτισμός δεδομένων εκπαίδευσης el
dc.subject Eπαναταξινόμηση el
dc.subject SVM en
dc.subject Training set enhancement en
dc.subject Information retrieval en
dc.subject Judgments en
dc.subject Clustering en
dc.subject Προσωποποίηση el
dc.subject Personalization en
dc.title Μελέτη μεθόδων για την έμμεση αύξηση των δεδομένων εκπαίδευσης συναρτήσεων ταξινόμησης σε αποτελέσματα αναζήτησης el
dc.title.alternative Study of techniques for the indirect enhancement of training data for neural networks used in search results en
dc.type bachelorThesis el (en)
dc.date.accepted 2011-03-03
dc.date.modified 2011-03-08
dc.contributor.advisorcommitteemember Βασιλείου, Ιωάννης el
dc.contributor.advisorcommitteemember Κοζύρης, Νεκτάριος el
dc.contributor.committeemember Σελλής, Τιμολέων el
dc.contributor.committeemember Βασιλείου, Ιωάννης el
dc.contributor.committeemember Κοζύρης, Νεκτάριος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής & Υπολογιστών el
dc.date.recordmanipulation.recordcreated 2011-03-30
dc.date.recordmanipulation.recordmodified 2011-02-30


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής