HEAL DSpace

Ανάλυση συστάδων και εφαρμογή σε βιοϊατρικά δεδομένα

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αγγελίδου, Ιωάννα el
dc.contributor.author Angelidou, Ioanna en
dc.date.accessioned 2018-07-18T09:11:13Z
dc.date.available 2018-07-18T09:11:13Z
dc.date.issued 2018-07-18
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/47329
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.15260
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Συσταδοποίηση el
dc.subject Ανάλυση συστάδων el
dc.subject Στατιστική el
dc.subject Βιοστατιστική el
dc.subject Εφαρμοσμένα μαθηματικά el
dc.subject Clustering en
dc.subject Cluster analysis el
dc.subject Statistics el
dc.subject Biostatistics el
dc.subject Applied mathematics el
dc.title Ανάλυση συστάδων και εφαρμογή σε βιοϊατρικά δεδομένα el
heal.type bachelorThesis
heal.classification Εφαρμοσμένα μαθηματικά el
heal.classification Στατιστική el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2018-07-06
heal.abstract Στην παρούσα διπλωματική εργασία, παρουσιάζεται η μέθοδος «Ανάλυσης κατά Συστάδες». Στόχος της μεθόδου αυτής είναι να ομαδοποιήσει τις παρατηρήσεις σε συστάδες (clusters) με τέτοιο τρόπο, ώστε κάθε συστάδα να παρουσιάζει μεγάλη ομοιογένεια. Στο πρώτο μέρος της εργασίας, γίνεται μια θεωρητική παρουσίαση της μεθόδου. Αρχικά, περιγράφονται οι διάφορες τεχνικές της Συσταδοποίησης και αναλύονται οι πολλαπλές εφαρμογές της Ανάλυσης κατά Συστάδες στις διάφορες επιστήμες. Στη συνέχεια, ακολουθεί μια εκτενής επεξήγηση των μαθηματικών εργαλείων που χρησιμοποιούνται στις τεχνικές αυτής της μεθόδου. Έχοντας αναφερθεί, λοιπόν, σε όλες τις απαραίτητες γνώσεις που πρέπει να έχει κάποιος προς ανάγνωση και κατανόηση της μεθόδου, αναλύονται διεξοδικά οι πιο γνωστές μέθοδοι Ανάλυσης σε Συστάδες, δηλαδή η Ιεραρχική Ανάλυση και η Μη Ιεραρχική Ανάλυση. Στο δεύτερο μέρος της εργασίας, εφαρμόζουμε την Ταξινόμηση κατά Συστάδες, χρησιμοποιώντας το στατιστικό πρόγραμμα R-Studio, στο «Σετ δεδομένων έκφρασης πρωτεΐνης ποντικών», το οποίο δημιουργήθηκε από πειράματα από τους Higuera et al και Ahmed et al. Στο πείραμα συμμετείχαν ποντίκια που έπασχαν από σύνδρομο Down (Down Syndrome- DS) (το DS προκαλείται από την παρουσία ενός επιπρόσθετου χρωμοσώματος, την τρισωμία) και υγιή ποντίκια (control). Ορισμένα ποντίκια διεγέρθηκαν στη μάθηση και άλλα όχι, ενώ σε κάποια από αυτά χορηγήθηκε μεμαντίνη για να διαπιστωθεί αν μπορούν να ανακτήσουν την ικανότητα της μάθησης. Έτσι, τα ποντίκια χωρίστηκαν σε οκτώ κλάσεις. Σκοπός της εργασίας αυτής είναι να διαπιστώσει εάν η γνώση των πρωτεϊνών οδηγεί από μόνη της στο διαχωρισμό των ποντικιών σε κλάσεις, εάν διαχωρίζονται τα υγιή από τα DS ποντίκια ή εάν διαχωρίζονται με κάποιο άλλο τρόπο. Έτσι, μέσα από όλη αυτή τη διαδικασία προκύπτουν συμπεράσματα για το συγκεκριμένο σύνολο δεδομένων, αλλά και γενικά για τη μέθοδο της Ανάλυσης σε Συστάδες και τη χρήση της. el
heal.abstract The present thesis will proceed to examine the method of “Cluster Analysis”. The goal of this method is to group the observations in clusters in such a way that each cluster would display homogeneity to a relatively great extent. In the first part of this thesis, the above mentioned method is examined from a theoretical point of view. Firstly, the different techniques of clustering are utterly described and the multiple applications of Cluster Analysis in different disciplines are mentioned. Furthermore, a detailed demonstration of the mathematical tools that are used in the techniques of this method follows. Having, thus, already referred to all the necessary background one shall have in order to read and understand this method, the most well-known methods of Cluster Analysis will be extensively examined, namely the Hierarchical Analysis and the Non-Hierarchical Analysis. In the second part of this thesis, we apply the Cluster Classification using the R-Studio statistical program to the "Mouse Protein Expression Data Set", which was created by experiments by Higuera et al. and Ahmed et al. The experiment involved mice suffering from Down Syndrome (DS) (the DS is caused by the presence of an additional chromosome, trisomy) and healthy mice (control). Some mice were stimulated to learn and others did not, while some were given memantine to see their ability to adapt to learning. Thus, the mice were divided into eight classes. The purpose of this work is to find out whether protein-only knowledge leads to the separation of mice in these classes, if in general the healthy mice are separated from the DS mice or if they are separated differently. Thus, through this procedure, conclusions for this specific data set but also in general for the method of Cluster Analysis and its use, are drawn. en
heal.advisorName Βόντα, Φιλία el
heal.committeeMemberName Καρώνη, Χρυσιής el
heal.committeeMemberName Κουκουβίνος, Χρήστος el
heal.committeeMemberName Βόντα, Φιλία el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών. Τομέας Μαθηματικών. Εργαστήριο Στατιστικής el
heal.academicPublisherID ntua
heal.numberOfPages 112 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα