HEAL DSpace

Τρισδιάστατη ταξινόμηση δεδομένων γονιδιακής έκφρασης με τη χρήση μεθοδολογιών μηχανικής μάθησης: Χρωμοσωμικές ταξινομήσεις σε δύο στάδια

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Σδράκα, Μαρία el
dc.contributor.author Sdraka, Maria en
dc.date.accessioned 2016-07-12T08:27:16Z
dc.date.available 2016-07-12T08:27:16Z
dc.date.issued 2016-07-12
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/43067
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.12598
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by/3.0/gr/ *
dc.subject Μηχανική μάθηση el
dc.subject Συσταδοποίηση el
dc.subject Ομαδοποίηση el
dc.subject Καρκίνος ουροδόχου κύστης el
dc.subject Γονιδιακή έκφραση el
dc.subject Μικροσυστοιχίες DNA el
dc.subject Τρισδιάστατος πίνακας el
dc.subject Βιολογία el
dc.subject Χρωμοσώματα el
dc.subject δ-TRIMAX en
dc.subject Machine learning en
dc.subject Clustering en
dc.subject Gene expression en
dc.subject Chromosomes en
dc.subject DNA microarrays en
dc.subject Bladder cancer en
dc.subject K-Means en
dc.subject Biology en
dc.title Τρισδιάστατη ταξινόμηση δεδομένων γονιδιακής έκφρασης με τη χρήση μεθοδολογιών μηχανικής μάθησης: Χρωμοσωμικές ταξινομήσεις σε δύο στάδια el
heal.type bachelorThesis
heal.classification Βασική μηχανική μάθηση el
heal.classification Βιοπληροφορική el
heal.classification Αλγοριθμικές τεχνικές el
heal.classificationURI http://data.seab.gr/concepts/fec24cd140d4b110c225ac68fec062a57fb86360
heal.classificationURI http://data.seab.gr/concepts/b50bf44af3b24e597323aa84bd26e06a0650789e
heal.classificationURI http://data.seab.gr/concepts/7c49f6117c3f09ee90548ad70960b7a9b716deb8
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2016-06-29
heal.abstract Οι μικροσυστοιχίες DNA αποτελούν μία από τις πιο διαδεδομένες πειραματικές μεθόδους στη γονιδιακή ανάλυση ιστολογικών δειγμάτων. Μέσα από αυτές τις διατάξεις γίνεται εφικτή η επισκόπηση της έκφρασης μεγάλου όγκου γονιδίων από πολλαπλά δείγματα ταυτόχρονα. Το γεγονός αυτό τις καθιστά ιδανικό εργαλείο για την ανάλυση και μελέτη καρκινικών ιστών, με στόχο την εξεύρεση των κανόνων που διέπουν γενικά το μηχανισμό της ογκογένεσης και την περαιτέρω κατανόηση της νόσου. Στην παρούσα εργασία εστιάσαμε τις προσπάθειές μας στην αξιοποίηση της πληροφορίας ότι κάθε γονίδιο σε έναν οργανισμό ανήκει αποκλειστικά σε κάποιο χρωμόσωμά του. Έτσι, δημιουργήσαμε μια νέα τρισδιάστατη δομή, διαχωρίζοντας τα γονίδια ανά χρωμοσωμικό ζεύγος, και στη συνέχεια εφαρμόσαμε διάφορες τεχνικές συσταδοποίησης, προκειμένου να απομονώσουμε τις ομάδες γονιδίων που παρουσιάζουν κοινό προφίλ έκφρασης. Πιο συγκεκριμένα, αναπτύξαμε μια παραλλαγή του δημοφιλή αλγορίθμου k-Means, με την ικανότητα να χειρίζεται και να ομαδοποιεί δισδιάστατους πίνακες, αντί διανυσμάτων. Έπειτα εφαρμόσαμε τον κλασικό k-Means στα κεντροειδή του τρισδιάστατου πίνακα και παρατηρήσαμε υψηλότερης ακρίβειας αποτελέσματα και ταχύτερους χρόνους σύγκλισης. Και στις δύο περιπτώσεις εκτελέσαμε τους αλγορίθμους ξεχωριστά στις τρεις πιθανές τομές του πίνακα: (α) κατά τον άξονα των χρωμοσωμάτων, (β) κατά τον άξονα των γονιδίων και (γ) κατά τον άξονα των δειγμάτων. Τέλος, χρησιμοποιήσαμε μια μέθοδο συσταδοποίησης υποχώρου με το όνομα δ-TRIMAX ώστε να εντοπίσουμε συστάδες και στις τρεις διαστάσεις ταυτόχρονα. Όλα τα παραπάνω υλοποιήθηκαν με χρήση της γλώσσας προγραμματισμού Python και πλήθος βιβλιοθηκών της. Στις τελευταίες ενότητες αξιολογήσαμε τα αποτελέσματα των διαφόρων συσταδοποιήσε-ων που επέστρεψαν οι αλγόριθμοι με τυπικές μεθόδους και διαπιστώσαμε την ποιότητα των συστάδων σε κάθε περίπτωση. el
heal.abstract DNA microarrays are amongst the most popular experimental techniques for observing the gene expression of multiple samples simultaneously. Through the use of DNA microarrays on cancerous tissues, researchers are able to study and analyse the behaviour of the genes in various stages of the disease, with the aim to explain some of the rules that govern the process of oncogenesis. The objective of this diploma thesis is to take advantage of the fact that every gene in a living organism belongs exclusively to one of its chromosomes. In this manner, we created a three-dimensional array by dividing the genes obtained by microarray experiments according to their respective chromosome pairs. Afterwards, we applied numerous clustering methods in order to isolate groups of genes that display a common expression profile. More specifically, we developed a variation of the popular k-Means algorithm, which is able to handle and cluster whole arrays instead of single vectors. We also applied the classic k-Means algorithm to the centroids of the three-dimensional array and acquired higher quality results and faster convergence. In both cases, we ran the algorithms for all axes of the array: (a) the chromosome axis, (b) the gene axis and (c) the sample axis. Finally, we used a subspace clustering technique, with the name δ-TRIMAX, in order to reveal clusters in all axes simultaneously. All of the above was implemented using the Python programming language and various libraries. In the last chapters we evaluated the obtained results with standard methods and com-mented on the quality of the clusters in each case. en
heal.advisorName Κουτσούρης, Δημήτριος el
heal.committeeMemberName Κουτσούρης, Δημήτριος el
heal.committeeMemberName Ματσόπουλος, Γιώργος el
heal.committeeMemberName Λάμπρου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών el
heal.academicPublisherID ntua
heal.numberOfPages 157 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού 3.0 Ελλάδα