dc.contributor.author |
Σταμούλης, Ιωάννης
|
el |
dc.contributor.author |
Stamoulis, Ioannis
|
en |
dc.date.accessioned |
2023-03-29T07:24:44Z |
|
dc.date.available |
2023-03-29T07:24:44Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/57352 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.25050 |
|
dc.rights |
Default License |
|
dc.subject |
Πολλαπλή Γραμμική Παλινδρόμηση |
el |
dc.subject |
Πολυσυγγραμμικότητα |
el |
dc.subject |
Ίχνος Κορυφογραμμής |
el |
dc.subject |
Λάσσο |
el |
dc.subject |
Δένδρα Παλινδρόμησης |
el |
dc.subject |
Multiple Linear Regression |
el |
dc.subject |
Multicollinearity |
el |
dc.subject |
Ridge Regression |
el |
dc.subject |
Lasso |
el |
dc.subject |
Regression Trees |
el |
dc.title |
Γραμμική Παλινδρόμηση, Μέθοδοι Ridge και Lasso και Δέντρα Παλινδρόμησης |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Statistics |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2023-01-16 |
|
heal.abstract |
Η εργασία αυτή έχει ως στόχο την μελέτη μοντέλων γραμμικής παλινδρόμησης με την μέθοδο των ελαχίστων τετραγώνων, τις μεθόδους ποινών όπως της Παλινδρόμησης Κορυφογραμμής (Ridge Regression) και της Lasso. Επίσης με μεθόδους μηχανικής μάθησης όπως των δέντρων αποφάσεων και πιο συγκεκριμένα των δέντρων παλινδρόμησης και τέλος με την μέθοδο του αλγορίθμου των τυχαίων δασών (Random Forest).
Στο πρώτο κεφάλαιο θα εστιάσουμε σε έννοιες που θα χρειαστούμε για τις μεθόδους που θα μελετήσουμε και στην συνέχεια θα αναλύσουμε εκτενώς την απλή γραμμική παλινδρόμηση και την πολλαπλή γραμμική παλινδρόμηση με την μέθοδο των ελαχίστων τετραγώνων.
Στο δεύτερο κεφάλαιο της εργασίας θα επικεντρωθούμε στην σημασία που έχει το μοντέλο να είναι ακριβές στην πρόβλεψη του και παράλληλα απλό και κατανοητό. Επίσης θα αναφερθούμε σε μεθόδους επιλογής μεταβλητών του μοντέλου και σε κριτήρια αξιολόγησης και επιλογής του μοντέλου.
Στο τρίτο κεφάλαιο, αφού αναφερθούμε στο πρόβλημα που δημιουργεί το φαινόμενο της πολυσυγγραμμικότητας στα μοντέλα που κατασκευάζονται με την μέθοδο των ελαχίστων τετραγώνων, θα μελετήσουμε μεθόδους που λειτουργούν αποτελεσματικότερα όταν τα δεδομένα μας παρουσιάζουν αυτό το φαινόμενο. Δύο από αυτές τις μεθόδους είναι η Παλινδρόμηση Κορυφογραμμής (Ridge Regression) και η μέθοδος Lasso οι οποίες ανήκουν στην οικογένεια των μεθόδων με ποινή. Τέλος θα αναλύσουμε την μέθοδο κατασκευής μοντέλου με την χρήση των δέντρων παλινδρόμησης και των μεθόδων Bagging, του αλγορίθμου των τυχαίων δασών (Random Forest) και Boosting.
Στο τέταρτο και τελευταίο κεφάλαιο θα εφαρμοστούν οι μέθοδοι που αναλύσαμε σε ένα παράδειγμα πραγματικής ζωής, το οποίο είναι η μελέτη της συσχέτισης του μισθού των ποδοσφαιριστών του Ιταλικού Πρωταθλήματος και των στατιστικών τους για την αγωνιστική περίοδο 2021-2022, αλλά και η πρόβλεψη του μισθού ενός ποδοσφαιριστή δεδομένου τα στατιστικά που είχε. Για το πρόβλημα αυτό θα χρησιμοποιηθούν δεδομένα που λήφθηκαν από το understat.com για τα στατιστικά των ποδοσφαιριστών και από το capology.com για τον μισθό τους. Το συμπέρασμα στο οποίο καταλήγουμε από την μελέτη του μοντέλου που κατασκευάσαμε είναι ότι παραδοσιακά στατιστικά όπως οι ασσίστ και οι πάσες κλειδιά δεν συνεισφέρουν στον μισθό ενός ποδοσφαιριστή ενώ τα γκολ συνεισφέρουν ελάχιστα. Αντίθετα, ο μισθός των ποδοσφαιριστών, καθορίζεται κυρίως από προηγμένα στατιστικά όπως τα αναμενόμενα γκολ xG, το xGChain και το xGBuildup τα οποία είναι στατιστικά που θα επεξηγηθούν εκτενώς στην εργασία. Τέλος, το μοντέλο που κατασκευάσαμε μπορεί να προβλέψει με σχετική ακρίβεια τον μισθό ενός παίκτη δεδομένου τα στατιστικά του. Δύναται να χρησιμοποιηθεί για την απόκτηση ενός παίκτη δελεάζοντάς τον με έναν καλύτερο μισθό ή ακόμα και σε περιπτώσεις ανανέωσης συμβολαίου. |
el |
heal.advisorName |
Καρώνη, Χρυσηίς |
el |
heal.committeeMemberName |
Καρώνη, Χρυσηίς |
el |
heal.committeeMemberName |
Παπανικολάου, Βασίλης |
el |
heal.committeeMemberName |
Παυλοπούλου, Καλλίοπη |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών |
el |
heal.academicPublisherID |
ntua |
|
heal.fullTextAvailability |
false |
|