Abstract:
Στην παρούσα εργασία περιγράφεται η μέθοδος της Ανάλυσης Κυρίων Συνιστωσών, μια τεχνική ανάλυσης δεδομένων με σκοπό τη δημιουργία μεταβλητών, οι οποίες είναι γραμμικοί συνδυασμοί των αρχικών μεταβλητών, έτσι ώστε να είναι ασυσχέτιστες μεταξύ τους και να περιέχουν όσο το δυνατόν μεγαλύτερο μέρος της διακύμανσης των αρχικών μεταβλητών. Καταλήγουμε, δηλαδή, σε ένα πιο μικρό αριθμό μεταβλητών από ότι είχαμε αρχικά, που ονομάζονται Κύριες Συνιστώσες, οι οποίες είναι ασυσχέτιστες και μπορούν να ερμηνεύσουν το μεγαλύτερο ποσοστό της διακύμανσης.
Στη συνέχεια περιγράφεται η μέθοδος της ανάλυσης κύριων συνιστωσών με επίβλεψη, που είναι παρόμοια με τη συμβατική ανάλυση κυρίων συνιστωσών με τη διαφορά ότι χρησιμοποιεί ένα υποσύνολο των μεταβλητών πρόβλεψης που έχουν επιλεγεί με βάση τη συσχέτιση τους με το εξαγόμενο αποτέλεσμα. Η τεχνική αυτή αναπτύχθηκε από τους Bair, Hastie και Tibshirani και φαίνεται να έχει καλύτερη απόδοση από τη συμβατική ανάλυση κύριων συνιστωσών.
Τέλος, πραγματοποιείται εφαρμογή σε πραγματικά σεισμολογικά δεδομένα υψηλής διάστασης με τη βοήθεια του πακέτου Clementine. Βρήκαμε τις κύριες συνιστώσες καθώς και ποιες μεταβλητές επηρεάζουν σημαντικά το μοντέλο μας.