HEAL DSpace

Big data στη γενωμική- Μέθοδοι, αλγόριθμοι, μαθηματική προσέγγιση: Μία συστηματική ανασκόπηση

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Δελαπόρτα, Μαρία el
dc.contributor.author Delaporta, Maria en
dc.date.accessioned 2021-11-10T10:38:23Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54055
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.21753
dc.rights Default License
dc.subject Μικροσυστοιχίες el
dc.subject Αλληλουχοποίηση νέας γενιάς el
dc.subject Microarrays en
dc.subject NGS en
dc.subject Βιοστατιστική el
dc.subject Biostatistics en
dc.subject Διαφορικά εκφραζόμενα γονίδια el
dc.subject DEGs en
dc.subject Μεθυλίωση el
dc.subject Methylation en
dc.title Big data στη γενωμική- Μέθοδοι, αλγόριθμοι, μαθηματική προσέγγιση: Μία συστηματική ανασκόπηση el
heal.type bachelorThesis
heal.classification Μαθηματικά el
heal.classification Γενωμική el
heal.classification Βιοπληροφορική el
heal.dateAvailable 2022-11-09T22:00:00Z
heal.language el
heal.access embargo
heal.recordProvider ntua el
heal.publicationDate 2021-10-12
heal.abstract Η χρήση μεθοδολογιών εξαιρετικά υψηλής απόδοσης (high throughput) στη βιολογία έχει αυξηθεί πολύ στις τελευταίες δεκαετίες. Οι δύο κύριες τεχνολογίες, δηλαδή οι Μικροσυστοιχίες και η Αλληλουχοποίηση Νέας Γενιάς (NGS), προσφέρουν απαραίτητες και δημοφιλείς μεθοδολογίες για την ανάλυση των δεδομένων της γενωμικής. Αυτό σημαίνει ότι πλέον απαιτείται η ανάπτυξη και εφαρμογή νέων ή βελτιωμένων βιοστατιστικών μεθόδων και εργαλείων βιοπληροφορικής για την ανάλυσή τους, είτε στην ανάλυση δεδομένων μικροσυστυχιών είτε στην ανάλυση δεδομένων αλληλουχοποίησης. Αυτές οι μέθοδοι χρησιμοποιούνται στις Ωμικές Επιστήμες και αναφέρονται σε ολοκληρωμένες βιολογικές μελέτες. Η παρούσα εργασία έχει ως στόχο την συγκέντρωση των σχετικών πληροφοριών μέσω ανασκόπησης της βιβλιογραφίας για τις μαθηματικές και υπολογιστικές μεθόδους που χρησιμοποιούνται στην ανάλυση γενωμικών δεδομένων, ειδικότερα στις προαναφερθείσες μεθόδους. Η ανάλυση Μικροσυστοιχιών έχει εμφανιστεί πολύ νωρίτερα και τα βιολογικά δεδομένα, που έχουν παραχθεί και συνεχίζουν να παράγoνται από αυτή είναι αμέτρητα. Από την άλλη πλευρά, η ανάλυση NGS μπορεί να γίνει σε άγνωστο βιολογικό δείγμα, με την εκ νέου αλληλούχιση, και γι’αυτό τον λόγο είναι πιο ευρέως εφαρμόσιμη, την τελευταία δεκαετία υπάρχει ραγδαία αύξηση των δεδομένων αλληλουχοποίησης σε βάσεις δεδομένων με ανοιχτή πρόσβαση από διάφορα μέρη του κόσμου. Οι δύο προαναφερθείσες μέθοδοι ανάλυσης χρησιμοποιούνται ευρέως και ανά περίπτωση, ανάλογα με τον σκοπό του ερευνητή. Η ανασκόπηση αναφέρεται την αρχή λειτουργίας και την περιγραφή της πειραματικής διαδικασίας τους, καθώς και σε βασικές έννοιες της βιολογίας, για να γίνει κατανοητή η ορολογία που χρησιμοποιείται. Στην συνέχεια, γίνεται συστηματική ανασκόπηση στατιστικών ελέγχων και υπολογιστικών μεθόδων για την επεξεργασία των διαφορετικών δεδομένων, έτσι ώστε τα αποτελέσματα να είναι σωστά και αναπαράξιμα. Ακόμα, διερευνάται η διαδικασία χαρακτηρισμού γονιδίων και, παράλληλα, αναδεικνύονται εφαρμογές στην γονιδιακή οντολογία και την ανάλυση σηματοδοτικών μονοπατιών. Εμφανίζονται, ακόμα, μερικές εφαρμογές μαθηματικής προτυποποίησης. Το θέμα ολοκληρώνεται με τη μελέτη περιπτώσεων στη χρήση Μεγάλων Δεδομένων στη γενωμική και την σημασία που έχουν η εφαρμογές και το προγραμματιστικό περιβάλλον τους, αφού θα φέρουν την νέα επιστημονική επανάσταση σε πολλούς τομείς, συμπεριλαβανομένου του τομέα της φαρμακολογίας, της γεωπονικής και της προσωποποιημένης ιατρικής. el
heal.abstract The use of high throughput techniques in the life sciences has grown substantially over the past few decades. Τhere is an plethora of popular analysis methods that derive from the two leading technologies, Microarrays and Next-Generation Sequencing (NGS). This means that there is a need for the development of new or improved biostatistics and bioinformatics methods and tools to analyze the biological data, whether we analyze DNA microarray data or RNA-Seq data. Those methods are used in the Omics sciences and refer to biological analysis in a comprehensive way. The goal of this thesis is to gather the pertinent information via a systematic literature review focusing on the mathematical and computational methods in the analysis of genomic data, mainly in those two leading technologies. Microarrays analysis has been around longer and there is no end to the data made available. However, NGS analysis does not require prior knowledge of the biological sample, i.e. de novo sequencing, and is a more thorough analysis than microarrays, therefore over the last decade there is an explosion of sequencing data made available in public repositories all over the world. Both analysis are used widely, always according to the Scientists’ purpose. The review covers their principle and workflow, as well as basic concepts in biology, so that the terminology can be better understood. Following that, there is a systematic review of statistical tests as well as computational methods to process the diverse data so the results are accurate and reproducible. Furthermore, the process of gene annotation is investigated and at the same time Gene Ontology (GO) and Pathway Analysis is showcased. A few examples of Mathematical Modeling are shown. The thesis concludes with case studies in the use of Big Data in Genomics and the importance of the tools and environments that will constitute the next revolution in several fields of study, including pharmacology, agriculture and personalized medicine. en
heal.advisorName Κουτσούρης, Δημήτριος-Διονύσιος
heal.committeeMemberName Ματσόπουλος, Γεώργιος
heal.committeeMemberName Τσανάκας, Παναγιώτης
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 254
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής