Η ομαδοποίηση όμοιων πελατών και αντικειμένων είναι μία θεμελιώδης δραστηριότητα του μάρκετινγκ που διευκολύνει την επικοινωνία. Λόγω του ότι οι εταιρείες δεν μπορούν να συνδεθούν με κάθε πελάτη τους ξεχωριστά, πρέπει να χωρίσουν τις αγορές σε ομάδες καταναλωτών και πελατών με όμοιες ανάγκες και επιθυμίες.
Στην παρούσα εργασία μελετήθηκαν δύο μέθοδοι πολυμεταβλητής στατιστικής ανάλυσης που στοχεύουν στην ομαδοποίηση των παρατηρήσεων έτσι ώστε να είναι ευκολότερη η περαιτέρω μελέτη τους: η ανάλυση κατά συστάδες και η διακριτική ανάλυση.
Στο πρώτο κεφάλαιο περιγράφεται η ανάλυση κατά συστάδες, η δημιουργία δηλαδή ομάδων έτσι ώστε να ελαχιστοποιούνται οι διαφορές των αντικειμένων που ανήκουν στην ίδια ομάδα και να μεγιστοποιούνται οι διαφορές μεταξύ αντικειμένων που ανήκουν σε διαφορετικές ομάδες. Περιγράφονται οι ιεραρχικές μέθοδοι, η μέθοδος k-means και η ομαδοποίηση σε δύο βήματα καθώς και τα μέτρα ομοιότητας ή διαφοράς που μπορούμε να χρησιμοποιήσουμε για τη σύγκριση αντικειμένων.
Στο δεύτερο κεφάλαιο περιγράφεται η διακριτική ανάλυση. Η διακριτική ανάλυση χρησιμοποιείται για να καθορίσει ποιες μεταβλητές διαχωρίζουν τα δεδομένα σε δύο ή περισσότερες αμοιβαία αποκλειόμενες ομάδες και σε ποια συγκεκριμένη ομάδα ανήκει ένα αντικείμενο βάσει των χαρακτηριστικών του. Με τη βοήθεια της διακριτικής ανάλυσης μπορούμε να ταξινομήσουμε μία νέα παρατήρηση, να προβλέψουμε δηλαδή σε ποια ομάδα θα ανήκει με βάση κάποια χαρακτηριστικά της χρησιμοποιώντας την συνάρτηση ταξινόμησης που προκύπτει από την ανάλυση.
Τέλος, στο τρίτο κεφάλαιο γίνονται δύο εφαρμογές σε τραπεζικά δεδομένα. Η πρώτη είναι μία εφαρμογή της ανάλυσης κατά συστάδες και συγκεκριμένα της ανάλυσης με τη μέθοδο διαμέρισης k-means. Η δεύτερη είναι μία εφαρμογή της διακριτικής ανάλυσης (ομαδοποίηση και ταξινόμηση).
Grouping similar customers or products is a fundamental marketing activity that makes communication easier. Companies cannot connect to each customer individually, so they have to divide markets into groups of consumers and customers with similar needs and desires.
In the present study, two methods of multivariate statistical analysis, aiming at grouping observations so that it is easier to study them further, were examined: cluster analysis and discriminant analysis.
In the first chapter the cluster analysis is described, namely the creation of groups so that the differences between objects belonging to the same group are minimized and the differences between objects belonging to different groups are maximized. There is a description of hierarchical methods, the k-means method and two-step clustering and measures of similarity or dissimilarity that can be used to compare objects.
In the second chapter the discriminant analysis is described. The discriminant analysis is used to determine which variables separate the data into two or more mutually exclusive groups and to which specific group an object belongs, based on its characteristics. Using discriminant analysis we can classify a new observation, in other words predict which group it belongs to using the sorting functions resulting from the analysis.
Finally, in the third chapter are two applications on a banking dataset. The first one is an application of cluster analysis, specifically the k-means partitioning method. The second is an application of discriminant analysis (clustering and classification).