Η παρούσα διατριβή ασχολείται με μερικές από τις πιο βασικές πτυχές του προβλήματος του συλλέκτη (Coupon Collector's Problem (CCP)), ενός εκ των πιο γνωστών προβλημάτων που προέρχονται από τον χώρο των Πιθανοτήτων. Θεωρούμε έναν πληθυσμό που αποτελείται από Ν διαφορετικά αντικείμενα (ψάρια, λέξεις, κάρτες με παίκτες του baseball, ιοί, κτλ) τα οποία συμβατικά θα αποκαλούμε κουπόνια. Έστω T_Ν ο αριθμός των δοκιμών, που ανεξάρτητα και με επανάθεση απαιτούνται, ώστε ένας συλλέκτης να έχει μία πλήρη συλλογή από τα N διαφορετικά κουπόνια. (Ο αναγνώστης θα αναγνωρίσει, πιθανότατα, στο πρόβλημα αυτό την προσπάθεια ενός παιδιού να συμπληρώσει ένα album με 100 αριθμημένες θέσεις από ποδοσφαιριστές της πρώτης κατηγορίας, όταν αγοράζοντας ένα παγωτό βρίσκει κάθε φορά, και μία φωτογραφία ενός ποδοσφαιριστή που βρίσκεται ως δώρο στο κάτω μέρος της συσκευασίας). Για την μεταβλητή T_Ν εγείρονται, φυσιολογικά, ερωτήματα ως προς την μέση τιμή, τις ροπές ανωτέρας τάξεως, την διασπορά, και, φυσικά, την κατανομή της, καθώς Ν→∞. Τούτη η εργασία αποτελείται από τρία μέρη.
Στο πρώτο μέρος παρουσιάζουμε τεχνικές με τις οποίες υπολογίζουμε εις βάθος την ασυμπτωτική συμπεριφορά της πρώτης και της δεύτερης ροπής της τ.μ. T_Ν καθώς Ν→∞. Στην συνέχεια προκύπτει ο πρωτεύων όρος επί του ασυμπτωτικού αναπτύγματος της διασποράς V[T_Ν ] που αποτελεί το κύριο αποτέλεσμα του πρώτου μέρους. Συνδυάζοντας τα αποτελέσματα αυτά με δύο γνωστά - πλην όμως γενικά – θεωρήματα βρίσκουμε την οριακή κατανομή της ποσότητας T_Ν (καταλλήλως κανονικοποιημένη), η οποία για μία μεγάλη κλάση κατανομών αποδεικνύεται ότι είναι η συνήθης κατανομή Gumbel.
Στο δεύτερο μέρος και για μία μεγάλη κλάση κατανομών υπολογίζουμε τον πρωτεύοντα όρο επί του ασυμπτωτικού αναπτύγματος όλων των ροπών ανωτέρας τάξεως για την τ.μ. T_Ν.
Τέλος στο τρίτο μέρος παραθέτουμε μερικά γενικά παραδείγματα, μέσω των οποίων παρουσιάζουμε τα αποτελέσματα του πρώτου και δεύτερου μέρους.
Προς τον αναγνώστη: Μία πιο αναλυτική περίληψη παραθέτουμε στο τέλος του Κεφαλαίου 5, αφού πρώτα έχουμε μελετήσει αναλυτικά την πιο απλή περίπτωση του προβλήματος (δηλαδή την περίπτωση κατά την οποία όλα τα κουπόνια έχουν ίση πιθανότητα εκλογής), και ενώ έχουμε εισάγει τον απαιτούμενο συμβολισμό για την αντιμετώπιση του γενικού προβλήματος.
Σε όλη την έκταση της διατριβής υπάρχουν συνολικά 19 παρατηρήσεις. Αυτές δεν ακολουθούν αρίθμηση σύμφωνη με την εκάστοτε παραγραφοποίηση, αλλά μία απλή αύξουσα αρίθμηση.
Σχετικά με τα παραπάνω έχουν γίνει οι ακόλουθες δημοσιεύσεις:
• A.V. Doumas and V.G. Papanicolaou, The Coupon Collector's problem revisited: Asymptotics of the Variance, Adv. Appl. Prob., 44 (1) (2012) 166--195.
• A.V. Doumas and V.G. Papanicolaou, Moments Asymptotics for the Coupon Collector's Problem, submitted / Round 2,
και οι ακόλουθες παρουσιάσεις στο 14ο Πανελλήνιο Συνέδριο Μαθηματικής Ανάλυσης που πραγματοποιήθηκε στην Πάτρα το 2012 :
• V.G. Papanicolaou (joint work with A.V. Doumas), Asymptotics and Limit Distributions for the General Collector's Problem.
• V. Doumas (joint work with V. G. Papanicolaou) , Asymptotic Analysis of the Moments for the Coupon Collector's Problem.
Ο γράφων έδωσε ομιλία με θέμα: Asymptotics and Limit Distributions for the General Collector's Problem, στα πλαίσια του Σεμιναρίου Πιθανοτήτων και Στοχαστικής Ανάλυσης, Οικονομικό Πανεπιστήμιο Αθηνών, Μάιος 2012.
Στο περιθώριο του διδακτορικού υπάρχει μία ακόμη δημοσιευμένη εργασία:
• V.G. Papanicolaou, A.V. Doumas, On the discrete one-dimensional inverse transmission eigenvalue problem, Inverse Problems, 27 (2011), no. 1, 015004, 13 pp,
ενώ έχουν υποβληθεί δύο ακόμη εργασίες:
• A.V. Doumas and V.G. Papanicolaou, The Random Coupon Collector's Problem Revisited,
• A.V. Doumas, An alternative approach to a problem by A. de Moivre (expository article), submitted / Round 2.
Αθήνα, 14 Δεκεμβρίου 2012
Αριστείδης Β. Δούμας
This Ph.D. thesis deals with a famous Urn problem. We consider a population whose members are of N different types (e.g. colors, fish, baseball cards, viruses, ants, words, etc). For 1≤ j≤ N we denote by p_j the probability that a member of the population is of type j, where p_j >0 and p_1 + p_2 +… p_N =1. The members of the population are sampled independently with replacement and their types are recorded. The so-called ``coupon collector problem'' (CCP) deals with questions arising in the above procedure. Some key quantities are the moments of the number T_N of trials it takes until all N types are detected (at least once), the variance, and (of course), the distribution of T_N.
Our work here is divided in three parts.
In Part I we develop techniques of computing detailed asymptotics of the first and second moment of the random variable T_N of coupons that a collector has to buy in order to find all N existing different coupons as N→∞. The probabilities (occurring frequencies) of the coupons can be quite arbitrary. From these asymptotics we obtain the leading behavior of the variance V[ T_N ] of T_N. Then, we combine our results with the general limit theorems of P. Neal in order to derive the limit distribution of T_N (appropriately normalized), which, for a large class of probabilities, turns out to be the standard Gumbel distribution.
In Part II, and for a large class of distributions, we arrive at the leading behavior of the (rising) moments of T_N as N→∞.
Finally, in Part III we present several general examples that illustrate the results of the previous chapters.
Results with respect to the present thesis have been published as follows:
• A.V. Doumas and V.G. Papanicolaou, The coupon collector's problem revisited: asymptotics of the variance, Adv. Appl. Prob., 44 (1) (2012) 166--195.
• A.V. Doumas and V.G. Papanicolaou, Moments Asymptotics for the Coupon Collector's Problem, submitted / Round 2.
as well as, the following presentations in the 14th Greek Conference on Mathematical Analysis (Patra, 2012):
• V.G. Papanicolaou (joint work with A.V. Doumas), Asymptotics and Limit Distributions for the General Collector's Problem.
• V. Doumas (joint work with V. G. Papanicolaou) , Asymptotic Analysis of the Moments for the Coupon Collector's Problem.
The author was an invited speaker, at Athens University of Economics and Business, Probability and Stochastic Analysis Seminar. He delivered a talk under the title: Asymptotics and Limit Distributions for the General Collector's Problem, May 2012.
Aside this Ph.D, the author has co--published the following paper:
• V.G. Papanicolaou, A.V. Doumas, On the discrete one-dimensional inverse transmission eigenvalue problem, Inverse Problems, 27 (2011), no. 1, 015004, 13 pp.
Moreover, the following articles have been submitted:
• A.V. Doumas and V.G. Papanicolaou, The Random Coupon Collector's Problem Revisited
• A.V. Doumas, An alternative approach to a problem by A. de Moivre.
Athens 2012, December 14
Aristides V. Doumas