Τα μέτρα απόκλισης χρησιμοποιούνται ως δείκτες της ομοιότητας ή ανομοιότητας μεταξύ δυο πληθυσμών και έχουν αρκετές εφαρμογές στους ελέγχους υποθέσεων και στην κατασκευή κατάλληλων ελεγχοσυναρτήσεων. Σκοπός της παρούσας εργασίας είναι να παρουσιάσει ορισμένα σημαντικά μέτρα απόκλισης και να μελετήσει τις στατιστικές ελεγχοσυναρτήσεις που προκύπτουν από αυτά καθώς και να παρέχει συστάσεις σχετικά με ποιος από αυτούς τους ελέγχους είναι πιο ισχυρός από τους υπόλοιπους, με βάση το μέγεθος και την ισχύ του ελέγχων. Οι κατανομές πιθανότητας που εξετάζουμε κάτω από την μηδενική υπόθεση ή κάτω από διάφορες εναλλακτικές υποθέσεις είναι υπό συνθήκη κατανομές σχεδιασμένες να περιγράφουν την κατανομή παρελθοντικών (past) χρόνων αξιοπιστίας ή επιβίωσης ή την κατανομή υπολειπόμενων (residual) χρόνων αξιοπιστίας ή επιβίωσης .
Στο πρώτο κεφάλαιο κάνουμε μια εισαγωγή στην έννοια των μέτρων απόκλισης και τα κατηγοριοποιούμε. Επιπλέον, συνοψίζουμε κάποιες βασικές έννοιες που θα χρειαστούν στα επόμενα κεφάλαια.
Στο δεύτερο κεφάλαιο θα παρουσιάσουμε μερικά από τα πιο σημαντικά μέτρα απόκλισης μεταξύ δυο κατανομών πιθανότητας, θα επικεντρωθούμε στα μέτρα απόκλισης που ανήκουν στην οικογένεια των φ-μέτρων απόκλισης και θα παρουσιάσουμε τις πιο γνωστές περιπτώσεις αποκλίσεων που ανήκουν στην κατηγορία αυτή δίνοντας του ορισμούς και τις βασικές ιδιότητές τους.
Στο τρίτο κεφάλαιο θα μελετήσουμε ελέγχους υποθέσεων που βασίζονται στα
φ-μέτρα απόκλισης. Αρχικά, στην παράγραφο 3.1 θα παρουσιάσουμε τις κυριότερες στατιστικές ελεγχοσυναρτήσεις που βασίζονται στα φ-μέτρα απόκλισης και χρησιμοποιούνται για τον έλεγχο της μηδενικής υπόθεσης δηλαδή την υπόθεση ότι ένα τυχαίο δείγμα προέρχεται από μια γνωστή κατανομή. Στη συνέχεια, στην παράγραφο 3.2 θα μελετήσουμε την ασυμπτωτική κατανομή των προηγούμενων ελεγχοσυναρτήσεων και την ισχύ των ελέγχων. Τέλος θα ασχοληθούμε με τον έλεγχο της υπόθεσης δηλαδη την υπόθεση οτι το τυχαίο δείγμα προέρχεται από μια γνωστή κατανομή η οποία όμως εξαρτάται από άγνωστες παραμέτρους . Στην περίπτωση αυτή οι άγνωστες παράμετροι εκτιμώνται από τα δεδομένα και παρουσιάζουμε την ασυμπτωτική κατανομή της αντίστοιχης στατιστικής ελεγχοσυνάρτησης. Στο τέλος του κεφαλαίου δίνονται κάποια παραδείγματα και εφαρμογές χρησιμοποιώντας κατάλληλες ελεγχοσυναρτήσεις , οι οποίες μας υποδεικνύουν αν θα πρέπει να απορρίπτουμε ή να αποδεχόμαστε την μηδενική υπόθεση σε κάθε περίπτωση. Επίσης, σε κάποιες εφαρμογές υπολογίζουμε την ελάχιστη εκτιμήτρια της άγνωστης παραμέτρου και την ασυμπτωτική κατανομή της εκτιμήτριας αυτής.
Στο τέταρτο κεφάλαιο προτείνουμε κάποιες ελεγχοσυναρτήσεις βάσει των μέτρων απόκλισης για τον έλεγχο της σύνθετης μηδενικής υπόθεσης που αναφέρεται σε κατανομή παρελθοντικών ή υπολοιπόμενων χρόνων ζωής και παρουσιάζουμε μια μελέτη προσομοίωσης για την ανάλυση της συμπεριφοράς της οικογένειας των στατιστικών ελεγχοσυναρτήσεων απόκλισης. Συγκρίνουμε τους ελέγχους με βαση το μέγεθος και την ισχύ τους και δίνουμε κάποια γενικά συμπεράσματα και προτάσεις για το ποιο μέτρο απόκλισης είναι καλύτερο σε καθε περίπτωση και για διάφορες τιμές του δείγματος. Θα παρουσιάσουμε τα αποτελέσματα των πειραμάτων προσομοίωσης που έγιναν και θα τα ερμηνεύσουμε δίνοντας και κάποια γενικές παρατηρήσεις.
Η εξαγωγή των αποτελεσμάτων του κεφαλαίου 4 εκπονήθηκε με τη βοήθεια ενός προγράμματος που υλοποιήθηκε στην στατιστική γλώσσα προγραμματισμού . Ο κώδικας του προγράμματος δίνεται στο Παράρτημα.
The divergence measures used as indicators of similarity or dissimilarity between two populations and have several applications in hypothesis testing and construction of suitable statistic-tests. The purpose of this paper is to present some important measures of divergence and to study the statistics tests arising therefore and to provide recommendations on which of these tests are more powerful than others, based on the size and power controls. The probability distributions we are considering under the null hypothesis or under various alternative hypotheses are conditional distributions designed to describe the distribution of past time reliability or survival or distribution remaining (residual) time of reliability and survival.
In the first chapter we make an introduction to the concept of divergence measures and categorization of them. In addition, we summarize some basic concepts that will be needed in subsequent chapters.
The second chapter will present some of the most important measures of divergence between two probability distributions, we will focus on measures deviation belonging to the family of phi-divergence measures and present the best known cases of discrepancies in the category that giving definitions and basic properties.
The third chapter will consider hypothesis testing based on
phi-divergence measures. First, in section 3.1 will present the main statistical control functions based on phi-divergence measures used to control the null hypothesis that the assumption of a random sample from a known distribution. Then, in section 3.2 we will study the asymptotic distribution of previous control functions and power controls. Finally we discuss the control of the case is the assumption that the random sample from a known distribution that depends entirely unknown parameters. In this case the unknown parameters are estimated from the data and present the asymptotic distribution of the corresponding statistical control function. At the end of the chapter we give some examples and applications using appropriate statistic tests, which tell us whether to reject or accept the null hypothesis in each case. Also, some applications compute the minimum estimate of the unknown parameter and the asymptotic distribution of this estimator.
In the fourth chapter we propose some statistic tests deviation as measures to control the composite null hypothesis referring to distribution of past or remaining time of life and present a simulation study to analyze the behavior of the family tests statistical deviation. Compare the checks based on the size and power and give some general conclusions and recommendations on the extent to which variation is best in each case and for different values of the sample. We will present the results of simulation experiments conducted and will explain and give some general observations.
Export of the results of Chapter 4 was developed with the help of a program implemented in the statistical programming language. The program code is given in the Appendix.