HEAL DSpace

Πρόβλεψη δευτεροταγούς δομής πρωτεϊνών με χρήση συνελικτικών νευρωνικών δικτύων προσοχής

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κακολύρης, Αντώνιος el
dc.contributor.author Kakolyris, Antonis en
dc.date.accessioned 2020-12-09T12:33:52Z
dc.date.available 2020-12-09T12:33:52Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/52426
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.20124
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by/3.0/gr/ *
dc.subject Πρόβλεψη δευτεροταγούς δομής πρωτεϊνών el
dc.subject Συνελικτικά νευρωνικά δικτυα el
dc.subject Μοντέλα από ακολουθία-σε-ακολουθία el
dc.subject Βιολογικές ακολουθίες el
dc.subject Αυτο-Προσοχή el
dc.subject Protein secondary structure prediction en
dc.subject Convolutional neural networks en
dc.subject Non local blocks en
dc.subject Biological sequences en
dc.subject Self-Attention en
dc.title Πρόβλεψη δευτεροταγούς δομής πρωτεϊνών με χρήση συνελικτικών νευρωνικών δικτύων προσοχής el
dc.title Protein secondary structure prediction with attentional-convolutional neural networks en
dc.contributor.department Artificial Intelligence and Learning Systems el
heal.type masterThesis
heal.classification Computer Science en
heal.language en
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2020-07-01
heal.abstract Η μελέτη μιας πληθώρας επιστημονικών τομέων σχετικές με βιολογία και ιατρική, με εφαρμογές στην έρευνα ασθενειών και ανάπτυξης φαρμάκων, εξαρτάται από την μελέτη της λειτουργίας των πρωτεϊνών. Οι πρωτεϊνες ειναι βιομόρια υπεύθυνα για τις βασικές λειτουργίες των ζωντανών οργανισμών. Τα δομικά στοιχεία των πρωτεϊνών ονομάζονται αμινοξέα, και η οργάνωση τους σε ακολουθίες ορίζει την τελική τους δομή. Η δομή των πρωτεϊνών σχετίζεται άμεσα με τη λειτουργία τους. Η πρόβλεψη της δομής των πρωτεϊνών είναι ο τομέας της βιοπληροφορικής που ασχολείται με τον υπολογισμό της δομής μιας πρωτεϊνης δεδομένης της σειράς των αμινοξέων εντός της ακολουθίας. Η πρόβλεψη της δομής των πρωτεϊνών είναι σημαντικής επειδή η ακριβής μέτρηση της πρωτεϊνης είναι μια αργή και πολύ ακριβή διαδικασία, ενώ αντίθετα η σειρά των αμινοξέων είναι πειραματικά πιο προσιτή. Τα τελευταία δέκα χρόνια, η πρόβλεψη αυτή προσεγγίστηκε με τεχνικές βαθιάς μηχανικής μάθησης. Μεταξύ των αρχιτεκτονικών που έχουν προταθεί είναι τα επαναλαμβανόμενα νευρωνικά δίκτυα, τα συνελικτικά δίκτυα τα πυκνά νευρωνικά δίκτυα. Σε αυτή τη διπλωματική εργασία, σχεδιάζεται, μελετάται και εκπαιδεύεται ένα συνελικτικό νευρωνικό δίκτυο για την πρόβλεψη της δευτεροταγούς δομής των πρωτεϊνών. Δοκιμάζονται επίσης νευρώνες αυτο-προσοχής και ένας νέος τρόπος αναπαράστασης των ακολουθιών εισόδου. Τα μοντέλα που εκπαιδεύτηκαν, επιτυγχάνουν μια ακρίβεια συγκρινόμενη με τα πιο ακριβή της βιβλιογραφίας, ενώ παρουσιάζονται ιδέες για της επεξήγηση των αποτελεσμάτων χρησιμοποιώντας τους μηχανισμούς προσοχής. el
heal.abstract The study of an array of biological and medical fields, with applications on human disease investigation and medicine, is depended on the study of the function of proteins. Proteins are biomolecules that perform functions that are essential for living organisms. The building blocks of proteins are aminoacids, whose arrangement into sequences defines the overall structures. Protein structure is tightly related to its function. Protein structure prediction, is the field of bioinformatics where the structure of a protein is calculated from the order of aminoacids inside the underlying sequence. The protein structure prediction task is important because the precise measurement of a protein is a slow and very expensive process, while on the contrary, the order of aminoacids is an easier information to extract experimantally. In the last ten years, this task is approached with deep learning techniques. Proposed architectures for this purpose use recurrent neural networks, convolutional neural networks and dense neural networks. In this thesis, a convolutional neural network is designed, studied and trained to predict the secondary structure of proteins. Self attention layers and a novel way to encode input are used. The described single models and enseble models reach an accuracy on par with the state of the art, and ideas on interpretability of the results using the self attention mechanism are also presented. en
heal.advisorName Στάμου, Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 68 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού 3.0 Ελλάδα