Βασικός στόχος της στατιστικής είναι η εκτίμηση και η περιγραφή της σχέσης εξάρτησης μεταξύ μεταβλητών. Μάλιστα, τις περισσότερες φορές η σχέση είναι στοχαστική, γεγονός που δυσκολεύει την επιλογή του βέλτιστου μοντέλου. Τα τελευταία χρόνια έχει προταθεί μία νέα μέθοδος ποινικοποιημένης πιθανοφάνειας, που βασίζεται στην εισαγωγή ενός όρου ποινής στην πιθανοφάνεια. Η βασική διαφορά της μεθόδου αυτής είναι το ισχυρό θεωρητικό υπόβαθρο που έχει. Ο όρος ποινής περιλαμβάνει μια παράμετρο, την οποία συμβολίζουμε με "λ" και καλούμε "ρυθμιστική παράμετρο". Η βέλτιστη επιλογή της ρυθμιστικής παραμέτρου έχει σαν αποτέλεσμα την καλύτερη απόδοση των μεθόδων αυτών. Στην παρούσα εργασία παρουσιάζεται ο τρόπος της βέλτιστης επιλογής της ρυθμιστικής παραμέτρου στις διάφορες μεθόδους ποινής,
Στο πρώτο κεφάλαιο, κάνουμε μια εισαγωγή στο Γενικό Γραμμικό Μοντέλο και μια σύντομη αναφορά στη μέθοδο ελαχίστων τετραγώνων και τη μέθοδο μέγιστης πιθανοφάνειας. Στο δεύτερο κεφάλαιο, παρουσιάζεται ο τρόπος επιλογής μεταβλητών μέσω της μη-κοίλης ποινικοποιημένης πιθανοφάνειας. Γίνεται εκτενής αναφορά στην προσέγγιση αυτή καθώς και στις διάφορες συναρτήσεις ποινής που περιλαμβάνουν τη ρυθμιστική παράμετρο. Στο τρίτο κεφάλαιο, αναλύεται η Μέθοδος της Γενικευμένης Διασταυρωμένης Επικύρωσης η οποία είναι μια αποδοτική μέθοδος που εξηγεί τα δεδομένα με θόρυβο, δηλαδή δεδομένα που δεν μπορούν να αναλυθούν. Η μέθοδος αυτή εισάγει μια νέα συνάρτηση η οποία περιέχει τη ρυθμιστική παράμετρο. Παρουσιάζεται ο τρόπος επιλογής της βέλτιστης ρυθμιστικής παραμέτρου καθώς και οι θεωρητικές της ιδιότητες. Στο τέταρτο κεφάλαιο, παρουσιάζεται η μέθοδος SCAD η εφαρμογή της οποίας βασίζεται στην κατάλληλη επιλογή ρυθμιστικής παραμέτρου. Παρουσιάζονται οι δύο βασικοί τρόποι εκτίμησης της παραμέτρου "λ" και συγκρίνονται ως προς την αποδοτικότητά τους. Στο πέμπτο κεφάλαιο, αναλύεται το Κριτήριο Γενικευμένης Πληροφορίας που χρησιμοποιείται για την επιλογή της ρυθμιστικής παραμέτρου σε μη κοίλες συναρτήσεις ποινικοποιημένης πιθανοφάνειας
The main aim of statistics is to estimate and report the dependence in the relation among the variables. Due to the fact that the correlation is commonly stochastic, it is more difficult to choose the optimal model. Over the last years, a new penalized loglikelihood method has been proposed, which is based in the introduction of a penalty term in the likelihood function. The main difference of this method is the strong theoretical background that it imposes. The penalty term contains a parameter, which is represented as "ι" and is called "tuning parameter". As a result, the optimal choice of the tuning parameter has the best efficiency of the method. This paper presents the way choosing the best tuning parameter in various penalized methods.
In the first chapter, we provide an introduction to the General Linear Model and we do a brief report to the Least Squares Method and Likelihood Method. In the second chapter, we present the way of choosing the variable via nonconcave penalized likelihood. This approximation is extensively presented along with the different penalty functions which include the tuning parameter. In the third chapter we define the Generalized Cross Validation Method which is an efficient method for explaining noisy data, which are data that can not be analyzed. This method imports a new function which contains the tuning parameter. We present the way of choosing the optimal tuning parameter and its theoretical properties. In the fourth chapter, we define SCAD which implementation is based in the appropriate choice of tuning parameter. We introduce the two most basic ways of estimating "ι" which are compared in relation to their efficiency. In the last chapter, we elaborate the Generalized Information Criterion which implements the selection of the tuning parameter in nonconcave penalized loglikelihood function.