HEAL DSpace

Στατιστική ανάλυση πολυμεταβλητών δεομένων και Εφαρμογές

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Σταυρίδης, Αθανάσιος el
dc.contributor.author Stavridis, Athanasios en
dc.date.accessioned 2023-03-27T08:01:19Z
dc.date.available 2023-03-27T08:01:19Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/57320
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.25018
dc.rights Default License
dc.subject Μη επιβλεπόμενη μάθηση el
dc.subject Πολυμεταβλητά δεδομένα el
dc.subject Ανάλυση Κύριων Συνιστωσών el
dc.subject Ανάλυση Συστάδων el
dc.subject Συσταδοποίηση el
dc.subject Unsupervised learning en
dc.subject Multivariate data el
dc.subject Principal Component Analysis el
dc.subject Cluster Analysis el
dc.subject Clustering el
dc.title Στατιστική ανάλυση πολυμεταβλητών δεομένων και Εφαρμογές el
heal.type bachelorThesis
heal.classification Στατιστική el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-02-21
heal.abstract Η παρούσα διπλωματική εργασία ασχολείται με δύο κύριες τεχνικές, οι οποίες χρησιμοποιούνται ευρέως για τη στατιστική ανάλυση πολυμεταβλητών δεδομένων, εστιάζοντας στη διερεύνηση των μεταβλητών του εκάστοτε δείγματος δεδομένων. Στο πρώτο κεφάλαιο, εισάγονται οι τεχνικές της Ανάλυσης Κύριων Συνιστωσών και της Ανάλυσης Συστάδων ως αναπόσπαστα μέρη της μη επιβλεπόμενης μάθησης. Επίσης, αναφέρονται τα πεδία των επιστημών, στα οποία αυτές έχουν εφαρμογή. Στο δεύτερο κεφάλαιο, παρουσιάζεται θεωρητικά και αναλυτικά η Ανάλυση Κύριων Συνιστωσών, η οποία θέτει ως στόχο την αντικατάσταση (συνήθως συσχετισμένων) μεταβλητών του αρχικού δείγματος με τις κύριες συνιστώσες, οι οποίες είναι σε αριθμό λιγότερες από αυτόν των αρχικών μεταβλητών και οι οποίες έχουν την ιδιότητα να είναι ασυσχέτιστες μεταξύ τους. Στο τρίτο κεφάλαιο, παρουσιάζεται η Ανάλυση Συστάδων, που προσφέρει την ομαδοποίηση των παρατηρήσεων σε συστάδες έτσι, ώστε τα στοιχε- ία, τα οποία ανήκουν στην ίδια συστάδα, να εμφανίζουν μεγάλη ομοιότητα. Στη συνέχεια, αναπτύσσονται οι τεχνικές της Ανάλυσης Συστάδων, οι οποίες διακρίνονται στη μη Ιεραρχική ανάλυση συστάδων, όπως η K-means, στην Ιεραρχική και τέλος στην Ανάλυση Συστάδων βασισμένη σε μοντέλο. Οι πρώτες δύο δεν προϋποθέτουν την ύπαρξη κατανομών, οι οποίες δύνανται να περιγράψουν το πληθυσμό του δείγματος, σε αντίθεση με την τρίτη, η οποία βασίζεται στην εύρεση στατιστικού μοντέλου, στο οποίο υπακούει το δείγμα. Επιπρόσθετα, παραθέτονται τα πλεονεκτήματα και τα μειονεκτήματα της κάθε τεχνικής. Στο τελευταίο κεφάλαιο, περιγράφεται πώς εφαρμόζονται οι παραπάνω μέθοδοι με τη βοήθεια του στατιστικού προγράμματος R-studio, αφενός στο δείγμα USArrests, το οποίο αφορά στις συλλήψεις, που έλαβαν χώρα σε 50 πολιτείες των Ηνωμένων Πολιτειών της Αμερικής, και αφετέρου στο δείγμα heptathlon, στο οποίο είναι καταγεγραμμένες οι επιδόσεις 25 αθλητριών στο έπταθλο στους Ολυμπιακούς Αγώνες στη Σεούλ της Νότιας Κορέας το 1988. Με αυτόν τον τρόπο, εξάγονται συμπεράσματα τόσο για αυτά τα δύο δείγματα όσο και για τις τεχνικές της Ανάλυσης Κύριων Συνιστωσών και της Ανάλυσης Συστάδων εν γένει. el
heal.advisorName Καρώνη, Χρυσηΐς el
heal.committeeMemberName Καρώνη, Χρυσηΐς el
heal.committeeMemberName Παυλοπούλου, Καλλιόπη el
heal.committeeMemberName Παπανικολάου, Βασίλης el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής