HEAL DSpace

Γραμμική Παλινδρόμηση, Μέθοδοι Ridge και Lasso και Δέντρα Παλινδρόμησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Σταμούλης, Ιωάννης el
dc.contributor.author Stamoulis, Ioannis en
dc.date.accessioned 2023-03-29T07:24:44Z
dc.date.available 2023-03-29T07:24:44Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/57352
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.25050
dc.rights Default License
dc.subject Πολλαπλή Γραμμική Παλινδρόμηση el
dc.subject Πολυσυγγραμμικότητα el
dc.subject Ίχνος Κορυφογραμμής el
dc.subject Λάσσο el
dc.subject Δένδρα Παλινδρόμησης el
dc.subject Multiple Linear Regression el
dc.subject Multicollinearity el
dc.subject Ridge Regression el
dc.subject Lasso el
dc.subject Regression Trees el
dc.title Γραμμική Παλινδρόμηση, Μέθοδοι Ridge και Lasso και Δέντρα Παλινδρόμησης el
heal.type bachelorThesis
heal.classification Statistics el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-01-16
heal.abstract Η εργασία αυτή έχει ως στόχο την μελέτη μοντέλων γραμμικής παλινδρόμησης με την μέθοδο των ελαχίστων τετραγώνων, τις μεθόδους ποινών όπως της Παλινδρόμησης Κορυφογραμμής (Ridge Regression) και της Lasso. Επίσης με μεθόδους μηχανικής μάθησης όπως των δέντρων αποφάσεων και πιο συγκεκριμένα των δέντρων παλινδρόμησης και τέλος με την μέθοδο του αλγορίθμου των τυχαίων δασών (Random Forest). Στο πρώτο κεφάλαιο θα εστιάσουμε σε έννοιες που θα χρειαστούμε για τις μεθόδους που θα μελετήσουμε και στην συνέχεια θα αναλύσουμε εκτενώς την απλή γραμμική παλινδρόμηση και την πολλαπλή γραμμική παλινδρόμηση με την μέθοδο των ελαχίστων τετραγώνων. Στο δεύτερο κεφάλαιο της εργασίας θα επικεντρωθούμε στην σημασία που έχει το μοντέλο να είναι ακριβές στην πρόβλεψη του και παράλληλα απλό και κατανοητό. Επίσης θα αναφερθούμε σε μεθόδους επιλογής μεταβλητών του μοντέλου και σε κριτήρια αξιολόγησης και επιλογής του μοντέλου. Στο τρίτο κεφάλαιο, αφού αναφερθούμε στο πρόβλημα που δημιουργεί το φαινόμενο της πολυσυγγραμμικότητας στα μοντέλα που κατασκευάζονται με την μέθοδο των ελαχίστων τετραγώνων, θα μελετήσουμε μεθόδους που λειτουργούν αποτελεσματικότερα όταν τα δεδομένα μας παρουσιάζουν αυτό το φαινόμενο. Δύο από αυτές τις μεθόδους είναι η Παλινδρόμηση Κορυφογραμμής (Ridge Regression) και η μέθοδος Lasso οι οποίες ανήκουν στην οικογένεια των μεθόδων με ποινή. Τέλος θα αναλύσουμε την μέθοδο κατασκευής μοντέλου με την χρήση των δέντρων παλινδρόμησης και των μεθόδων Bagging, του αλγορίθμου των τυχαίων δασών (Random Forest) και Boosting. Στο τέταρτο και τελευταίο κεφάλαιο θα εφαρμοστούν οι μέθοδοι που αναλύσαμε σε ένα παράδειγμα πραγματικής ζωής, το οποίο είναι η μελέτη της συσχέτισης του μισθού των ποδοσφαιριστών του Ιταλικού Πρωταθλήματος και των στατιστικών τους για την αγωνιστική περίοδο 2021-2022, αλλά και η πρόβλεψη του μισθού ενός ποδοσφαιριστή δεδομένου τα στατιστικά που είχε. Για το πρόβλημα αυτό θα χρησιμοποιηθούν δεδομένα που λήφθηκαν από το understat.com για τα στατιστικά των ποδοσφαιριστών και από το capology.com για τον μισθό τους. Το συμπέρασμα στο οποίο καταλήγουμε από την μελέτη του μοντέλου που κατασκευάσαμε είναι ότι παραδοσιακά στατιστικά όπως οι ασσίστ και οι πάσες κλειδιά δεν συνεισφέρουν στον μισθό ενός ποδοσφαιριστή ενώ τα γκολ συνεισφέρουν ελάχιστα. Αντίθετα, ο μισθός των ποδοσφαιριστών, καθορίζεται κυρίως από προηγμένα στατιστικά όπως τα αναμενόμενα γκολ xG, το xGChain και το xGBuildup τα οποία είναι στατιστικά που θα επεξηγηθούν εκτενώς στην εργασία. Τέλος, το μοντέλο που κατασκευάσαμε μπορεί να προβλέψει με σχετική ακρίβεια τον μισθό ενός παίκτη δεδομένου τα στατιστικά του. Δύναται να χρησιμοποιηθεί για την απόκτηση ενός παίκτη δελεάζοντάς τον με έναν καλύτερο μισθό ή ακόμα και σε περιπτώσεις ανανέωσης συμβολαίου. el
heal.advisorName Καρώνη, Χρυσηίς el
heal.committeeMemberName Καρώνη, Χρυσηίς el
heal.committeeMemberName Παπανικολάου, Βασίλης el
heal.committeeMemberName Παυλοπούλου, Καλλίοπη el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής