dc.contributor.author |
Στάμος, Φίλιππος
|
el |
dc.contributor.author |
Stamos, Filippos
|
en |
dc.date.accessioned |
2018-11-22T12:21:08Z |
|
dc.date.available |
2018-11-22T12:21:08Z |
|
dc.date.issued |
2018-11-22 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/48088 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.16297 |
|
dc.rights |
Default License |
|
dc.subject |
Sponsored search auctions |
en |
dc.subject |
Mechanism design |
en |
dc.subject |
Generalized second-price auctions |
en |
dc.subject |
Vickrey-Clarke-Groves auctions |
en |
dc.subject |
Cascade model |
en |
dc.subject |
Separable model |
en |
dc.subject |
Machine learning |
en |
dc.subject |
Hadoop |
en |
dc.subject |
Σχεδιασμός μηχανισμών |
el |
dc.subject |
Δημοπρασίες επιχορηγούμενων διαφημίσεων |
el |
dc.subject |
Μοντέλο αλληλουχίας |
el |
dc.subject |
Διαχωρίσιμο μοντέλο |
el |
dc.subject |
Μηχανική μάθηση |
el |
dc.title |
Μοντέλα και πρόβλεψη συμπεριφοράς χρηστών σε δημοπρασίες επιχορηγούμενης αναζήτησης |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Algorithms |
el |
heal.language |
el |
|
heal.language |
en |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2018-07-29 |
|
heal.abstract |
This thesis focuses on the experimental evaluation of the user’s behaviour in sponsored search auctions.
The majority of income of the biggest web companies like Google and Yahoo, is earned
through auctions related to the advertisements of products. For example, in 2005, 98%
of Google’s revenue derived from GSP (generalized second prize) auctions. In the first
part of this thesis, we will study these auctions, their properties and we will compare
GSP auctions with VCG (Vickrey-Clarke-Groves) auctions, another widely used type of
auction.
This thesis focuses on the sponsored search auctions problem happening on the web.
Aiming to maximize the company’s revenue and to find the best possible allocation of
ads, it becomes really important to be able to predict user’s behavior while browsing with
the use of search engines. The two most widely used models, the Cascade Model and the
Separable Model are studied and widely analyzed.
The analysis of user’s behavior can be predicted through Machine Learning. That is
why we continue with knowledge on the basics of Machine Learning. Although in the end
Machine Learning methods weren’t used because of limited data, the understanding of
metrics in order to evaluate the analyzed models was crucial during the analysis of the
bibliographic models.
In the last part of this thesis, models are evaluated experimentally. Yandex’s Person-
alized Web Search dataset is used, analyzed with the use of Hadoop. As this data is the
result of organic searches, we make the hypothesis that users behave the same way when
being given organic and sponsored results. Firstly, the two main bibliography models are
analyzed and compared extensively and in the end new models are tried. The model that
we propose has similar accuracy with the other known models but is able to perform better
at predicting when users click, while the rest of the models perform better at predicting
when users don’t click. |
en |
heal.abstract |
Η μελέτη της διπλωματικής αυτής εστιάζει στην πειραματική αξιολόγηση μοντέλων πρόβλεψης
της συμπεριφοράς του χρήστη, κατά τις δημοπρασίες επιδοτούμενων διαφημίσεων στο
διαδίκτυο.
Η πλειοψηφία των εσόδων των μεγαλύτερων διαδικτυακών εταιρειών όπως η Google ή η
Yahoo προέρχεται από διαφορετικών ειδών δημοπρασίες σχετικές με διαφημίσεις προϊόντων.
Ενδεικτικά, το 2005, το 98% των εσόδων της Google προήλθε από δημοπρασίες και πιο ειδικά,
από δημοπρασίες GSP (generalized second prize). Στο πρώτο κομμάτι της διπλωματικής θα
γίνει μελέτη των δημοπρασιών αυτών, των ιδιοτήτων τους, καθώς και θα γίνει σύγκριση τους
με την κατηγορία δημοπρασιών VCG (Vickrey-Clarke-Groves).
Η διπλωματική αυτή εστιάζει στις επιχορηγούμενες διαφημίσεις κατά τις αναζητήσεις των
χρηστών στο διαδίκτυο. Με στόχο την μεγιστοποίηση των κερδών και την εύρεση της βέλτιστης
τοποθέτησης των διαφημίσεων, ιδιαίτερη έμφαση δίνεται στην πρόβλεψη της συμπεριφοράς
του χρήστη κατά την πλοήγηση του στις μηχανές αναζήτησης. Μελετώνται τα δύο βασικά
μοντέλα της βιβλιογραφίας, το Αλληλουχίας και το Διαχωρίσιμο μοντέλο.
Η ανάλυση της συμπεριφοράς του χρήστη μπορεί να πραγματοποιηθεί με χρήση Μηχανικής
Μάθησης γι΄ αυτό στην συνέχεια παρουσιάζονται οι βασικές έννοιες που χρειάζονται για την
ανάλυση των δεδομένων. Παρ΄ ότι εν τέλει δεν χρησιμοποιήθηκε μηχανική μάθηση λόγω των
χαρακτηριστικών των δεδομένων, οι γνώσεις σχετικές με τις διαφορετικές μετρικές για την
αξιολόγηση μοντέλων πρόβλεψης της συμπεριφοράς του χρήστη ήταν απαραίτητες και τεχνικές
αξιολόγησης των μοντέλων χρησιμοποιήθηκαν εκτεταμένα.
Στο τελευταίο κομμάτι της διπλωματικής γίνεται πειραματική αξιολόγηση των μοντέλων
αυτών. Χρησιμοποιούνται τα δεδομένα με τίτλο Personalized Web Search που δημοσιεύτηκαν
από την Yandex στα πλαίσια ενός διαγωνισμού. Τα δεδομένα αυτά είναι οργανικά και γίνεται η
υπόθεση ότι ο χρήστης συμπεριφέρεται με τον ίδιο τρόπο στα οργανικά και στα επιχορηγούμενα
αποτελέσματα. Τα χαρακτηριστικά των δεδομένων αυτών αναλύονται εκτεταμένα με χρήση
Hadoop και γίνεται αναλυτική σύγκριση των δύο βασικών μοντέλων της βιβλιογραφίας. Στο
τέλος, γίνεται μία προσπάθεια εύρεσης και αξιολόγησης νέων μοντέλων. Το μοντέλο στο οποίο
καταλήγουμε βρίσκεται πολύ κοντά στα ποσοστά επιτυχίας των μοντέλων της βιβλιογραφίας,
με αυτό να πετυχαίνει μεγαλύτερη ακρίβεια στην πρόβλεψη των κλικ του χρήστη. |
el |
heal.advisorName |
Φωτάκης, Δημήτρης |
el |
heal.committeeMemberName |
Παπασπύρου, Νικόλαος |
el |
heal.committeeMemberName |
Γκούμας,Γεώργιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
80 σ. |
el |
heal.fullTextAvailability |
true |
|