dc.contributor.author | Σδράκα, Μαρία | el |
dc.contributor.author | Sdraka, Maria | en |
dc.date.accessioned | 2016-07-12T08:27:16Z | |
dc.date.available | 2016-07-12T08:27:16Z | |
dc.date.issued | 2016-07-12 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/43067 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.12598 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Συσταδοποίηση | el |
dc.subject | Ομαδοποίηση | el |
dc.subject | Καρκίνος ουροδόχου κύστης | el |
dc.subject | Γονιδιακή έκφραση | el |
dc.subject | Μικροσυστοιχίες DNA | el |
dc.subject | Τρισδιάστατος πίνακας | el |
dc.subject | Βιολογία | el |
dc.subject | Χρωμοσώματα | el |
dc.subject | δ-TRIMAX | en |
dc.subject | Machine learning | en |
dc.subject | Clustering | en |
dc.subject | Gene expression | en |
dc.subject | Chromosomes | en |
dc.subject | DNA microarrays | en |
dc.subject | Bladder cancer | en |
dc.subject | K-Means | en |
dc.subject | Biology | en |
dc.title | Τρισδιάστατη ταξινόμηση δεδομένων γονιδιακής έκφρασης με τη χρήση μεθοδολογιών μηχανικής μάθησης: Χρωμοσωμικές ταξινομήσεις σε δύο στάδια | el |
heal.type | bachelorThesis | |
heal.classification | Βασική μηχανική μάθηση | el |
heal.classification | Βιοπληροφορική | el |
heal.classification | Αλγοριθμικές τεχνικές | el |
heal.classificationURI | http://data.seab.gr/concepts/fec24cd140d4b110c225ac68fec062a57fb86360 | |
heal.classificationURI | http://data.seab.gr/concepts/b50bf44af3b24e597323aa84bd26e06a0650789e | |
heal.classificationURI | http://data.seab.gr/concepts/7c49f6117c3f09ee90548ad70960b7a9b716deb8 | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2016-06-29 | |
heal.abstract | Οι μικροσυστοιχίες DNA αποτελούν μία από τις πιο διαδεδομένες πειραματικές μεθόδους στη γονιδιακή ανάλυση ιστολογικών δειγμάτων. Μέσα από αυτές τις διατάξεις γίνεται εφικτή η επισκόπηση της έκφρασης μεγάλου όγκου γονιδίων από πολλαπλά δείγματα ταυτόχρονα. Το γεγονός αυτό τις καθιστά ιδανικό εργαλείο για την ανάλυση και μελέτη καρκινικών ιστών, με στόχο την εξεύρεση των κανόνων που διέπουν γενικά το μηχανισμό της ογκογένεσης και την περαιτέρω κατανόηση της νόσου. Στην παρούσα εργασία εστιάσαμε τις προσπάθειές μας στην αξιοποίηση της πληροφορίας ότι κάθε γονίδιο σε έναν οργανισμό ανήκει αποκλειστικά σε κάποιο χρωμόσωμά του. Έτσι, δημιουργήσαμε μια νέα τρισδιάστατη δομή, διαχωρίζοντας τα γονίδια ανά χρωμοσωμικό ζεύγος, και στη συνέχεια εφαρμόσαμε διάφορες τεχνικές συσταδοποίησης, προκειμένου να απομονώσουμε τις ομάδες γονιδίων που παρουσιάζουν κοινό προφίλ έκφρασης. Πιο συγκεκριμένα, αναπτύξαμε μια παραλλαγή του δημοφιλή αλγορίθμου k-Means, με την ικανότητα να χειρίζεται και να ομαδοποιεί δισδιάστατους πίνακες, αντί διανυσμάτων. Έπειτα εφαρμόσαμε τον κλασικό k-Means στα κεντροειδή του τρισδιάστατου πίνακα και παρατηρήσαμε υψηλότερης ακρίβειας αποτελέσματα και ταχύτερους χρόνους σύγκλισης. Και στις δύο περιπτώσεις εκτελέσαμε τους αλγορίθμους ξεχωριστά στις τρεις πιθανές τομές του πίνακα: (α) κατά τον άξονα των χρωμοσωμάτων, (β) κατά τον άξονα των γονιδίων και (γ) κατά τον άξονα των δειγμάτων. Τέλος, χρησιμοποιήσαμε μια μέθοδο συσταδοποίησης υποχώρου με το όνομα δ-TRIMAX ώστε να εντοπίσουμε συστάδες και στις τρεις διαστάσεις ταυτόχρονα. Όλα τα παραπάνω υλοποιήθηκαν με χρήση της γλώσσας προγραμματισμού Python και πλήθος βιβλιοθηκών της. Στις τελευταίες ενότητες αξιολογήσαμε τα αποτελέσματα των διαφόρων συσταδοποιήσε-ων που επέστρεψαν οι αλγόριθμοι με τυπικές μεθόδους και διαπιστώσαμε την ποιότητα των συστάδων σε κάθε περίπτωση. | el |
heal.abstract | DNA microarrays are amongst the most popular experimental techniques for observing the gene expression of multiple samples simultaneously. Through the use of DNA microarrays on cancerous tissues, researchers are able to study and analyse the behaviour of the genes in various stages of the disease, with the aim to explain some of the rules that govern the process of oncogenesis. The objective of this diploma thesis is to take advantage of the fact that every gene in a living organism belongs exclusively to one of its chromosomes. In this manner, we created a three-dimensional array by dividing the genes obtained by microarray experiments according to their respective chromosome pairs. Afterwards, we applied numerous clustering methods in order to isolate groups of genes that display a common expression profile. More specifically, we developed a variation of the popular k-Means algorithm, which is able to handle and cluster whole arrays instead of single vectors. We also applied the classic k-Means algorithm to the centroids of the three-dimensional array and acquired higher quality results and faster convergence. In both cases, we ran the algorithms for all axes of the array: (a) the chromosome axis, (b) the gene axis and (c) the sample axis. Finally, we used a subspace clustering technique, with the name δ-TRIMAX, in order to reveal clusters in all axes simultaneously. All of the above was implemented using the Python programming language and various libraries. In the last chapters we evaluated the obtained results with standard methods and com-mented on the quality of the clusters in each case. | en |
heal.advisorName | Κουτσούρης, Δημήτριος | el |
heal.committeeMemberName | Κουτσούρης, Δημήτριος | el |
heal.committeeMemberName | Ματσόπουλος, Γιώργος | el |
heal.committeeMemberName | Λάμπρου, Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 157 σ. | el |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: