heal.abstract |
Η παρούσα διπλωματική εργασία ασχολείται με δύο κύριες τεχνικές, οι οποίες χρησιμοποιούνται ευρέως για τη στατιστική ανάλυση πολυμεταβλητών δεδομένων, εστιάζοντας στη διερεύνηση των μεταβλητών του εκάστοτε δείγματος δεδομένων.
Στο πρώτο κεφάλαιο, εισάγονται οι τεχνικές της Ανάλυσης Κύριων
Συνιστωσών και της Ανάλυσης Συστάδων ως αναπόσπαστα μέρη της μη επιβλεπόμενης μάθησης. Επίσης, αναφέρονται τα πεδία των επιστημών, στα οποία αυτές έχουν εφαρμογή.
Στο δεύτερο κεφάλαιο, παρουσιάζεται θεωρητικά και αναλυτικά η
Ανάλυση Κύριων Συνιστωσών, η οποία θέτει ως στόχο την αντικατάσταση (συνήθως συσχετισμένων) μεταβλητών του αρχικού δείγματος με τις κύριες συνιστώσες, οι οποίες είναι σε αριθμό λιγότερες από αυτόν των αρχικών μεταβλητών και οι οποίες έχουν την ιδιότητα να είναι ασυσχέτιστες μεταξύ τους.
Στο τρίτο κεφάλαιο, παρουσιάζεται η Ανάλυση Συστάδων, που προσφέρει την ομαδοποίηση των παρατηρήσεων σε συστάδες έτσι, ώστε τα στοιχε-
ία, τα οποία ανήκουν στην ίδια συστάδα, να εμφανίζουν μεγάλη ομοιότητα. Στη συνέχεια, αναπτύσσονται οι τεχνικές της Ανάλυσης Συστάδων, οι οποίες διακρίνονται στη μη Ιεραρχική ανάλυση συστάδων, όπως η K-means, στην Ιεραρχική και τέλος στην Ανάλυση Συστάδων βασισμένη σε μοντέλο. Οι πρώτες δύο
δεν προϋποθέτουν την ύπαρξη κατανομών, οι οποίες δύνανται να περιγράψουν το πληθυσμό του δείγματος, σε αντίθεση με την τρίτη, η οποία βασίζεται στην εύρεση στατιστικού μοντέλου, στο οποίο υπακούει το δείγμα. Επιπρόσθετα, παραθέτονται τα πλεονεκτήματα και τα μειονεκτήματα της κάθε τεχνικής.
Στο τελευταίο κεφάλαιο, περιγράφεται πώς εφαρμόζονται οι παραπάνω μέθοδοι με τη βοήθεια του στατιστικού προγράμματος R-studio, αφενός στο δείγμα USArrests, το οποίο αφορά στις συλλήψεις, που έλαβαν χώρα σε 50 πολιτείες των Ηνωμένων Πολιτειών της Αμερικής, και αφετέρου στο δείγμα heptathlon, στο οποίο είναι καταγεγραμμένες οι επιδόσεις 25 αθλητριών στο
έπταθλο στους Ολυμπιακούς Αγώνες στη Σεούλ της Νότιας Κορέας το 1988. Με αυτόν τον τρόπο, εξάγονται συμπεράσματα τόσο για αυτά τα δύο δείγματα όσο και για τις τεχνικές της Ανάλυσης Κύριων Συνιστωσών και της Ανάλυσης
Συστάδων εν γένει. |
el |