dc.contributor.author | Δημοσθένους, Μάριος | el |
dc.contributor.author | Marios, Demosthenous | en |
dc.date.accessioned | 2023-01-09T08:29:53Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/56547 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.24245 | |
dc.description | Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Μαθηματική Προτυποποίηση σε Σύγχρονες Τεχνολογίες και στα Χρηματοοικονομικά” | el |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Γραμμική Παλινδρόμηση | el |
dc.subject | Επιλογή Μοντέλου | el |
dc.subject | Leaps and Bounds | en |
dc.subject | Branch and Bound | en |
dc.subject | lmSelect | en |
dc.subject | Linear Regression | en |
dc.subject | Best Subset Selection | en |
dc.subject | Μέθοδος Ελαχίστων Τετραγώνων | el |
dc.subject | Παραγοντοποίηση QR | el |
dc.subject | Απαλοιφή Gauss | el |
dc.title | Αποδοτικοί αλγόριθμοι για τον υπολογισμό των βέλτιστων μοντέλων παλινδρόμησης για προβλήματα μεγάλων διαστάσεων | el |
dc.title | Efficient Algorithms for Computing the Best Subset Regression Models for High-Dimensional Problems | en |
heal.type | masterThesis | |
heal.classification | Μαθηματικά, Στατιστική | el |
heal.classification | Mathematics, Statistics | en |
heal.dateAvailable | 2024-01-08T22:00:00Z | |
heal.language | el | |
heal.access | embargo | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2022-10-31 | |
heal.abstract | Η Στατιστική Μοντελοποίηση αποτελεί ένα Μαθηματικό εργαλείο μοντελοποίησης δεδομένων με σκοπό την πρόβλεψη ή τη μελέτη ενός φαινομένου. Με την εξέλιξη της τεχνολογίας είμαστε ικανοί να συλλέξουμε ολοένα και περισσότερα και πιο ακριβή δεδομένα. Αυτό συνεπάγεται στην αύξηση της διαστατικότητας στο πρόβλημα της μοντελοποίησης και την αύξηση του υπολογιστικού κόστους. Επομένως, κρίνεται όλο και πιο σημαντική η δημιουργία αποδοτικών μεθόδων υψηλής ακρίβειας για την προσαρμογή των βέλτιστων μοντέλων. Η παρούσα εργασία πραγματεύεται την προσαρμογή γραμμικών μοντέλων σε κάποιο σύνολο δεδομένων και μελετά ακριβείς και αποδοτικές μεθόδους για την προσαρμογή των μοντέλων καθώς και για την εύρεση βέλτιστων μοντέλων. Στο ΚΕΦΑΛΑΙΟ 1 παρουσιάζουμε το πρόβλημα της γραμμικής παλινδρόμησης καθώς και βασικές μεθόδους προσαρμογής ενός μοντέλου. Στο ΚΕΦΑΛΑΙΟ 2 παρουσιάζουμε διάφορες μεθόδους επίλυσης του προβλήματος ελαχίστων τετραγώνων. Πιο συγκεκριμένα μελετούμε μεθόδους βασισμένες στην απαλοιφή Gauss και άλλες μεθόδους όπως την παραγοντοποίηση Cholesky, QR και SVD. Στο ΚΕΦΑΛΑΙΟ 3 μελετούμε το πρόβλημα της εύρεσης του βέλτιστου μοντέλου. Αρχικά ορίζουμε μερικά μέτρα σύγκρισης μοντέλων όπως το άθροισμα τετραγώνων των υπολοίπων, RSS, ο δείκτης C_p, τα AIC "και" BIC και άλλα. Στη συνέχεια παρουσιάζουμε μερικούς αλγόριθμους για την εύρεση του βέλτιστου μοντέλου. Συγκεκριμένα, παρουσιάζουμε τους αλγόριθμους Leaps-and-Bounds, Branch-and-Bound και lmSelect. Στο τέλος του κεφαλαίου μελετούμε την περίπτωση όπου έχουμε λιγότερες παρατηρήσεις στο σύνολο δεδομένων μας σε σύγκριση με το πλήθος των παραμέτρων του μοντέλου και προτείνουμε μία προσέγγιση σε αυτό το πρόβλημα για την εύρεση του βέλτιστου δυνατού μοντέλου. | el |
heal.abstract | Statistical Modeling is a Mathematical tool which can be used to study a phenomenon or make predictions through statistical models. With the ongoing technological advancements, we are increasingly more able to produce a vast amount of data in more accurate ways. This results in an increase in dimensionality, for the statistical modeling problem, along with increased computational cost. Thus, it is important to develop accurate and efficient methods for extracting the best models. In this Thesis, we study different methods for fitting regression models and for selecting the best models. In Chapter 1, we present the linear regression problem along with basic methods for fitting a regression model. In Chapter 2, we present different methods for solving the least-squares problem. More specifically, we study methods based on Gauss elimination and other methods such as the Cholesky, QR and SVD decompositions. In Chapter 3, we study the problem of finding the best model(s). Initially, we define some evaluation metrics for the regression models, such as the residual sum of squares, RSS, C_p-Mallows, AIC "and" BIC etc. Furthermore, we present different algorithms for finding the best model(s), such as the Leaps-and-Bounds, Branch-and-Bound and lmSelect algorithms. At the end of the Chapter, we study the case where we have fewer observations in our data than variables and we suggest an approach to find the best possible model in this case. | en |
heal.advisorName | Chrysseis, Caroni | en |
heal.advisorName | Χρυσηίς, Καρώνη | el |
heal.committeeMemberName | Chrysseis, Caroni | en |
heal.committeeMemberName | Χρυσηίς, Καρώνη | el |
heal.committeeMemberName | Παπανικολάου, Βασίλης | el |
heal.committeeMemberName | Στεφανέας, Πέτρος | el |
heal.committeeMemberName | Papanicolaou, Vassilis | en |
heal.committeeMemberName | Stefaneas, Petros | en |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών | el |
heal.academicPublisherID | ntua | |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: