HEAL DSpace

Αποδοτικοί αλγόριθμοι για τον υπολογισμό των βέλτιστων μοντέλων παλινδρόμησης για προβλήματα μεγάλων διαστάσεων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Δημοσθένους, Μάριος el
dc.contributor.author Marios, Demosthenous en
dc.date.accessioned 2023-01-09T08:29:53Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56547
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.24245
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Μαθηματική Προτυποποίηση σε Σύγχρονες Τεχνολογίες και στα Χρηματοοικονομικά” el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Γραμμική Παλινδρόμηση el
dc.subject Επιλογή Μοντέλου el
dc.subject Leaps and Bounds en
dc.subject Branch and Bound en
dc.subject lmSelect en
dc.subject Linear Regression en
dc.subject Best Subset Selection en
dc.subject Μέθοδος Ελαχίστων Τετραγώνων el
dc.subject Παραγοντοποίηση QR el
dc.subject Απαλοιφή Gauss el
dc.title Αποδοτικοί αλγόριθμοι για τον υπολογισμό των βέλτιστων μοντέλων παλινδρόμησης για προβλήματα μεγάλων διαστάσεων el
dc.title Efficient Algorithms for Computing the Best Subset Regression Models for High-Dimensional Problems en
heal.type masterThesis
heal.classification Μαθηματικά, Στατιστική el
heal.classification Mathematics, Statistics en
heal.dateAvailable 2024-01-08T22:00:00Z
heal.language el
heal.access embargo
heal.recordProvider ntua el
heal.publicationDate 2022-10-31
heal.abstract Η Στατιστική Μοντελοποίηση αποτελεί ένα Μαθηματικό εργαλείο μοντελοποίησης δεδομένων με σκοπό την πρόβλεψη ή τη μελέτη ενός φαινομένου. Με την εξέλιξη της τεχνολογίας είμαστε ικανοί να συλλέξουμε ολοένα και περισσότερα και πιο ακριβή δεδομένα. Αυτό συνεπάγεται στην αύξηση της διαστατικότητας στο πρόβλημα της μοντελοποίησης και την αύξηση του υπολογιστικού κόστους. Επομένως, κρίνεται όλο και πιο σημαντική η δημιουργία αποδοτικών μεθόδων υψηλής ακρίβειας για την προσαρμογή των βέλτιστων μοντέλων. Η παρούσα εργασία πραγματεύεται την προσαρμογή γραμμικών μοντέλων σε κάποιο σύνολο δεδομένων και μελετά ακριβείς και αποδοτικές μεθόδους για την προσαρμογή των μοντέλων καθώς και για την εύρεση βέλτιστων μοντέλων. Στο ΚΕΦΑΛΑΙΟ 1 παρουσιάζουμε το πρόβλημα της γραμμικής παλινδρόμησης καθώς και βασικές μεθόδους προσαρμογής ενός μοντέλου. Στο ΚΕΦΑΛΑΙΟ 2 παρουσιάζουμε διάφορες μεθόδους επίλυσης του προβλήματος ελαχίστων τετραγώνων. Πιο συγκεκριμένα μελετούμε μεθόδους βασισμένες στην απαλοιφή Gauss και άλλες μεθόδους όπως την παραγοντοποίηση Cholesky, QR και SVD. Στο ΚΕΦΑΛΑΙΟ 3 μελετούμε το πρόβλημα της εύρεσης του βέλτιστου μοντέλου. Αρχικά ορίζουμε μερικά μέτρα σύγκρισης μοντέλων όπως το άθροισμα τετραγώνων των υπολοίπων, RSS, ο δείκτης C_p, τα AIC "και" BIC και άλλα. Στη συνέχεια παρουσιάζουμε μερικούς αλγόριθμους για την εύρεση του βέλτιστου μοντέλου. Συγκεκριμένα, παρουσιάζουμε τους αλγόριθμους Leaps-and-Bounds, Branch-and-Bound και lmSelect. Στο τέλος του κεφαλαίου μελετούμε την περίπτωση όπου έχουμε λιγότερες παρατηρήσεις στο σύνολο δεδομένων μας σε σύγκριση με το πλήθος των παραμέτρων του μοντέλου και προτείνουμε μία προσέγγιση σε αυτό το πρόβλημα για την εύρεση του βέλτιστου δυνατού μοντέλου. el
heal.abstract Statistical Modeling is a Mathematical tool which can be used to study a phenomenon or make predictions through statistical models. With the ongoing technological advancements, we are increasingly more able to produce a vast amount of data in more accurate ways. This results in an increase in dimensionality, for the statistical modeling problem, along with increased computational cost. Thus, it is important to develop accurate and efficient methods for extracting the best models. In this Thesis, we study different methods for fitting regression models and for selecting the best models. In Chapter 1, we present the linear regression problem along with basic methods for fitting a regression model. In Chapter 2, we present different methods for solving the least-squares problem. More specifically, we study methods based on Gauss elimination and other methods such as the Cholesky, QR and SVD decompositions. In Chapter 3, we study the problem of finding the best model(s). Initially, we define some evaluation metrics for the regression models, such as the residual sum of squares, RSS, C_p-Mallows, AIC "and" BIC etc. Furthermore, we present different algorithms for finding the best model(s), such as the Leaps-and-Bounds, Branch-and-Bound and lmSelect algorithms. At the end of the Chapter, we study the case where we have fewer observations in our data than variables and we suggest an approach to find the best possible model in this case. en
heal.advisorName Chrysseis, Caroni en
heal.advisorName Χρυσηίς, Καρώνη el
heal.committeeMemberName Chrysseis, Caroni en
heal.committeeMemberName Χρυσηίς, Καρώνη el
heal.committeeMemberName Παπανικολάου, Βασίλης el
heal.committeeMemberName Στεφανέας, Πέτρος el
heal.committeeMemberName Papanicolaou, Vassilis en
heal.committeeMemberName Stefaneas, Petros en
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα