Υψηλής διάστασης στατιστικά προβλήματα προκύπτουν από διαφορετικούς τομείς της επιστημονικής έρευνας και τεχνολογικής ανάπτυξης. Η επιλογή μεταβλητών διαδραματίζει έναν κεντρικό ρόλο στη σύγχρονη στατιστική μάθηση και στις επιστημονικές ανακαλύψεις. Η περιγραφή των μεθόδων αντιμετώπισης ενός από τα πλέον σημαντικά προβλήματα της γραμμικής παλινδρόμησης: της επιλογής ενός υποσυνόλου από ανεξάρτητες μεταβλητές, έτσι ώστε αφενός μεν να υπάρχει εξοικονόμηση κόστους κατά την πρόβλεψη της εξαρτημένης μεταβλητής και αφετέρου να μην προκύπτει μεγάλη απώλεια στην αποτελεσματικότητα του μοντέλου πρόβλεψης. Σκοπός είναι η σωστή επιλογή των στατιστικά σημαντικών παραγόντων οι οποίοι επηρεάζουν την απόκριση. Θα παρουσιάσουμε ένα σύντομο απολογισμό της πρόσφατης εξέλιξης της θεωρίας, των μεθόδων και των εφαρμογών για την επιλογή μεταβλητών υψηλής διάστασης. Θα μελετήσουμε ποια είναι τα όρια της διάστασης που μπορούν να χειριστούν αυτές οι μέθοδοι, ποιος ο ρόλος των συναρτήσεων ποινής και ποιες είναι οι στατιστικές ιδιότητες που οδηγούν τις εξελίξεις του τομέα. Θα μελετήσουμε ακόμα ορισμένες πρόσφατες εξελίξεις στην υψηλής διάστασης επιλογή μεταβλητών, με έμφαση στο ανεξάρτητο κρησάρισμα. Ένα πεδίο όπου εφαρμόζονται αρκετά αυτές οι μέθοδοι, και θα μελετήσουμε, είναι και τα γενικευμένα γραμμικά μοντέλα. Στην παρούσα εργασία, αναλύεται ένα πλήθος μεθόδων, με εμβάθυνση στις νέες μεθόδους ποινικοποιημένης πιθανοφάνειας. Αυτές σε συνδυασμό με τα γενικευμένα γραμμικά μοντέλα εκτιμούν με ακρίβεια τους συντελεστές του μοντέλου και ταυτόχρονα επιλέγουν τις σημαντικές μεταβλητές.
High dimension statistical problems arising from different areas of scientific research and technological develpment. Variable selection plays a central role in modern statistical learning and scientific discoveries. The description of the methods, dealing with one of the most important problems, of linear regression: selecting a subset of independent variables so that on the one hand to save costs by predicting the dependent variable and on the other hand does not arise large loss in efficiency of the prediction model. The purpose is the right choice of statistically significant factors influencing the response. We will present a brief account of recent developments in the theory, methods and applications for the variable selection in high dimensional problems. We will study the limits of dimension, which can handle these methods, the role of penalty functions and the statistical properties leading to developments in the sector. We will consider even some recent developments in high dimension variables selection, with emphasis on sure independent screening. A field that several of these methods are applied is the generalized linear models. In this paper, we will analyze a number of methods, and provide insight on new methods penalized likelihood. These, combined with the generalized linear models accurately assess the factors of the model and simultaneously select the significant variables.