HEAL DSpace

Μέθοδοι επιλογής μεταβλητών σε δεδομένα υψηλής διάστασης για τα γενικευμένα γραμμικά μοντέλα

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Κουκουβίνος, Χρήστος el
dc.contributor.author Πρίσκα, Ευαγγελία-Ελένη Χ. el
dc.contributor.author Priska, Evangelia-Eleni Ch. en
dc.date.accessioned 2014-10-07T09:34:59Z
dc.date.available 2014-10-07T09:34:59Z
dc.date.copyright 2014-03-17 -
dc.date.issued 2014-10-07
dc.date.submitted 2014-03-17 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/39181
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.2721
dc.description 173 σ. el
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) el
dc.description.abstract Υψηλής διάστασης στατιστικά προβλήματα προκύπτουν από διαφορετικούς τομείς της επιστημονικής έρευνας και τεχνολογικής ανάπτυξης. Η επιλογή μεταβλητών διαδραματίζει έναν κεντρικό ρόλο στη σύγχρονη στατιστική μάθηση και στις επιστημονικές ανακαλύψεις. Η περιγραφή των μεθόδων αντιμετώπισης ενός από τα πλέον σημαντικά προβλήματα της γραμμικής παλινδρόμησης: της επιλογής ενός υποσυνόλου από ανεξάρτητες μεταβλητές, έτσι ώστε αφενός μεν να υπάρχει εξοικονόμηση κόστους κατά την πρόβλεψη της εξαρτημένης μεταβλητής και αφετέρου να μην προκύπτει μεγάλη απώλεια στην αποτελεσματικότητα του μοντέλου πρόβλεψης. Σκοπός είναι η σωστή επιλογή των στατιστικά σημαντικών παραγόντων οι οποίοι επηρεάζουν την απόκριση. Θα παρουσιάσουμε ένα σύντομο απολογισμό της πρόσφατης εξέλιξης της θεωρίας, των μεθόδων και των εφαρμογών για την επιλογή μεταβλητών υψηλής διάστασης. Θα μελετήσουμε ποια είναι τα όρια της διάστασης που μπορούν να χειριστούν αυτές οι μέθοδοι, ποιος ο ρόλος των συναρτήσεων ποινής και ποιες είναι οι στατιστικές ιδιότητες που οδηγούν τις εξελίξεις του τομέα. Θα μελετήσουμε ακόμα ορισμένες πρόσφατες εξελίξεις στην υψηλής διάστασης επιλογή μεταβλητών, με έμφαση στο ανεξάρτητο κρησάρισμα. Ένα πεδίο όπου εφαρμόζονται αρκετά αυτές οι μέθοδοι, και θα μελετήσουμε, είναι και τα γενικευμένα γραμμικά μοντέλα. Στην παρούσα εργασία, αναλύεται ένα πλήθος μεθόδων, με εμβάθυνση στις νέες μεθόδους ποινικοποιημένης πιθανοφάνειας. Αυτές σε συνδυασμό με τα γενικευμένα γραμμικά μοντέλα εκτιμούν με ακρίβεια τους συντελεστές του μοντέλου και ταυτόχρονα επιλέγουν τις σημαντικές μεταβλητές. el
dc.description.abstract High dimension statistical problems arising from different areas of scientific research and technological develpment. Variable selection plays a central role in modern statistical learning and scientific discoveries. The description of the methods, dealing with one of the most important problems, of linear regression: selecting a subset of independent variables so that on the one hand to save costs by predicting the dependent variable and on the other hand does not arise large loss in efficiency of the prediction model. The purpose is the right choice of statistically significant factors influencing the response. We will present a brief account of recent developments in the theory, methods and applications for the variable selection in high dimensional problems. We will study the limits of dimension, which can handle these methods, the role of penalty functions and the statistical properties leading to developments in the sector. We will consider even some recent developments in high dimension variables selection, with emphasis on sure independent screening. A field that several of these methods are applied is the generalized linear models. In this paper, we will analyze a number of methods, and provide insight on new methods penalized likelihood. These, combined with the generalized linear models accurately assess the factors of the model and simultaneously select the significant variables. en
dc.description.statementofresponsibility Ευαγγελία-Ελένη Χρ. Πρίσκα el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Επιλογή μεταβλητών el
dc.subject Μέγιστη πιθανοφάνεια el
dc.subject Ποινικοποιημένες μέθοδοι el
dc.subject Σίγουρο ανεξάρτητο κρησάρισμα el
dc.subject Εκθετική οικογένεια el
dc.subject Γενικευμένα γραμμικά μοντέλα el
dc.subject Poisson-Λογιστική παλινδρόμηση el
dc.subject Variable selection en
dc.subject Maximum likelihood en
dc.subject Penalized methods en
dc.subject Sure independent screening en
dc.subject Exponential family en
dc.subject Generalized linear models en
dc.subject Poisson-Logistic regression en
dc.title Μέθοδοι επιλογής μεταβλητών σε δεδομένα υψηλής διάστασης για τα γενικευμένα γραμμικά μοντέλα el
dc.title.alternative Variable selection methods in high-dimensional space for Generalized Linear Models en
dc.type masterThesis el (en)
dc.date.accepted 2014-03-07 -
dc.date.modified 2014-03-17 -
dc.contributor.advisorcommitteemember Κουκουβίνος Χρήστος el
dc.contributor.advisorcommitteemember Βόντα, Φιλία el
dc.contributor.advisorcommitteemember Σπηλιώτης, Ιωάννης el
dc.contributor.committeemember Κουκουβίνος, Χρήστος el
dc.contributor.committeemember Βόντα, Φιλία el
dc.contributor.committeemember Σπηλιώτης, Ιωάννης el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών & Φυσικών Επιστημών. el
dc.date.recordmanipulation.recordcreated 2014-10-07 -
dc.date.recordmanipulation.recordmodified 2014-10-07 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής