HEAL DSpace

Αξιολόγηση αλγορίθμων επεξεργασίας πειραματικών δεδομένων αλληλούχισης νουκλεικών οξέων μεγάλου πλαισίου ανάγνωσης και συγκριτική ανάλυση μεταβλητών

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Στέφανος, Τσαμπανάκης el
dc.contributor.author Stefanos, Tsampanakis en
dc.date.accessioned 2021-11-15T12:30:52Z
dc.date.available 2021-11-15T12:30:52Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54070
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.21768
dc.rights Default License
dc.subject Αξιολόγηση αλγορίθμων el
dc.subject Βιοπληροφορική el
dc.subject Τεχνολογίες αλληλούχισης el
dc.subject Αλγόριθμοι el
dc.subject Σύγκριση μεταβλητών el
dc.subject Algorithm evaluation en
dc.subject Algorithms en
dc.subject Bioinformatics en
dc.subject Comparison of variables en
dc.subject Sequencing technologies en
dc.title Αξιολόγηση αλγορίθμων επεξεργασίας πειραματικών δεδομένων αλληλούχισης νουκλεικών οξέων μεγάλου πλαισίου ανάγνωσης και συγκριτική ανάλυση μεταβλητών el
heal.type bachelorThesis
heal.classification Βιοπληροφορική el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021
heal.abstract The anlysis of the DNA sequence of a genome plays an important role in the field of biology since it offers a plethora of genetic information where scientists and medical professionals have the ability to use these informations as disease diagnostic tool, disease prevention tool as well as the understanding of various mutations. For the creation of an accurate representation of a genome various scientific interests and fields have been established. More specifically the filed of bioinformatics has been established as well as various DNA sequencing technologies where the past years they are constantly optimized offering better representations with fewer errors at faster speeds In this paper we will conduct a bioinformatic analysis of DNA. We will perform a quality check where we will analyze various factors where they can contribute to the quality of the the DNA reads. These factors consists the difference in the quality results whether the DNA was harvested from a human source or from a different organism, the difference in the method where the library preparation was achieved and the difference in the two different basecalling models offered by the program GUPPY. For the assessment of the read quality we will use two different programs FastQC and NanoPack where through these we will calculate the Qscore/N50 values as well as the read length. We will use DNA from Human Retinal Epithelial cell (RPE) and DNA from a ovarian cell originated in a Chinese hamster (CHO). The CHO DNA was prepared using two different library preparations the ligation method and the rapid method and based on the different results which they produced the optimal method will be evaluated. The RPE was prepared using the ligation method but the basecalling was done twice using the two models of GUPPY the high accuracy model( HAC) and FAST model and their results where then evaluated . In the end the results from from CHO and RPE DNA where compared to see which DNA produced the highest quality. en
heal.abstract Η ανάλυση της αλληλουχιας ενός γονιδιώματος αποτελεί ένα πολύ σημαντικό κομμάτι στον κλάδο της βιολογίας αφού προσφέρει μια πληθώρα γενετικών πληροφοριών όπου επιστήμονες και επαγγελματίες στον χώρο της Υγείας έχουν την ικανότητα να την χρησιμοποιήσουν σαν διαγνωστικό μέσο νοσημάτων , μέσο πρόληψης ασθενειών καθώς και κατανόησης διάφορων μεταλλάξεων. Για την ακριβή αναπαράσταση γονιδιωμάτων πολλά ερευνητικά ενδιαφέροντα και επιστημονικοί κλάδοι έχουν δημιουργηθεί. Πιο συγκερκιμένα έχει δημιουργηθεί ο κλάδος της βιοπληροφορικής καθώς και των τεχνολογιών αλληλούχισης που τα τελευταία χρόνια βελτιώνονται συνεχώς προσφέροντας όλα και καλύτερες αναπαραστάσεις με μικρότερα σφάλματα σε μικρότερο χρόνο. Στην παρούσα εργασία έγινε μια βιοπληροφορική ανάλυση του DNA. Πραγματοποιήθηκε δηλαδή ένας ποιοτικός έλεγχος στον οποίο αναλύθηκαν διάφοροι παράγοντες που μπορούν να συμβάλουν στην ποιότητα των παραγόμενων μεγάλων πλαισίων ανάγνωσης (long reads). Πιο συγκεκριμένα οι παράγοντες αυτοί είναι οι διαφορές ανάμεσα στο αν το DNA είναι ανθρώπινο ή όχι, ανάμεσα στον τρόπο που έγινε η προετοιμασία βιβλιοθήκης και τέλος οι διαφορές ανάμεσα σε δύο μοντέλα του προγράμματος GUPPY στο οποίο έγινε η διαδικασία του basecall. Για την εκτίμηση της ποιότητας των reads χρησιμοποιήθηκαν δυο διαφορετικά προγράμματα το FastQC και το NanoPack μέσω των οποίων υπολογίστηκαν οι τιμές Qscore, N50 και τα μήκοι των reads Αρχικά χρησιμοποιήθηκε DNA απο ανθρώπινο επιθηλιακό ιστό (RPE) και DNA από τις ωοθήκες ενός κινέζικου χάμστερ (CHO Chinese Hamster Ovarian). Το CHO DNA προετοιμάστηκε με δύο διαφορετικούς τρόπους προετοιμασίας βιβλιοθήκης την ‘rapid’ μεθοδο και ‘ligation’ και με βάση τα αποτελέσματα τους έγινε εκτίμηση της βέλτιστης μεθόδου προετοιμασίας βιβλιοθήκης . Τo επιθηλιακό DNA προετοιμάστηκε μέσω της ligation μεθόδου, όμως η διαδικασία basecall έγινε δυο φορές. Η πρώτη έγινε με το μοντέλο FAST του GUPPY και η δεύτερη μέσω του High Accuracy (HAC) μοντέλου και μέσω των αποτελεσμάτων τους έγινε μια εκτίμηση . Τέλος ανάμεσα στα αποτελέσματα από το επιθηλιακό και το CHO DNA πραγματοποιήθηκε η τελική εκτίμηση ανάμεσα σε ποιο πρότυπο DNA παρουσιάστηκε η μεγαλύτερη ποιότητα στα μεγάλα πλαίσια ανάγνωσης . el
heal.advisorName Γεωργακίλας, Αλέξανδρος el
heal.committeeMemberName Γεωργακίλας, Αλέξανδρος el
heal.committeeMemberName Αναγνωστόπουλος, Κωνσταντίνος el
heal.committeeMemberName Τερζούδη, Γεωργία el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.numberOfPages 59 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής