HEAL DSpace

Δημιουργία αλγορίθμου μηχανικής μάθησης για την υπολογιστική πρόβλεψη της έκκρισης πρωτεϊνών από το κύτταρο

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Φώτης, Χρήστος el
dc.contributor.author Fotis, Christos en
dc.date.accessioned 2018-05-22T09:25:47Z
dc.date.available 2018-05-22T09:25:47Z
dc.date.issued 2018-05-22
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/46975
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.15433
dc.rights Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nd/3.0/gr/ *
dc.subject Μηχανική μάθηση el
dc.subject Πρωτεϊνες el
dc.subject Βιολογία συστημάτων el
dc.subject Machine learning en
dc.subject Systems biology en
dc.subject Proteins en
dc.title Δημιουργία αλγορίθμου μηχανικής μάθησης για την υπολογιστική πρόβλεψη της έκκρισης πρωτεϊνών από το κύτταρο el
heal.type bachelorThesis
heal.classification Μηχανική μάθηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2018-02-16
heal.abstract Η πληροφορία της έκκρισης μιας πρωτεΐνης είναι ύψιστης σημασίας τόσο για την ανακάλυψη νέων φαρμάκων όσο και για την ανακάλυψη νέων βιοδεικτών ασθένειας. Δυστυχώς όμως για ένα μεγάλο ποσοστό πρωτεΐνων δεν είναι γνωστό αν εκκρίνονται από το κύτταρο ή οχι (~20%). Από τη μοριακή βιολογία όμως είναι γνωστό ότι μια πρωτεΐνη μπορεί να εκκριθεί με δύο τρόπους. Είτε μέσω του συμβατικού μονοπατιού έκκρισης είτε μέσω μη συμβατικών μηχανισμών. Για την έκκριση μέσω του συμβατικού μονοπατιού καθοριστικό ρόλο παίζει η αλληλουχία των αμινοξέων της πρωτεΐνης και πιο συγκεκριμένα ή ύπαρξη χαρακτηριστικών περιοχών απο αμινοξέα που ονομάζονται σηματοδοτικές αλληλουχίες. Έτσι, αν μια πρωτεΐνη περιέχει σηματοδοτική αλληλουχία τότε εισέρχεται στο εκκριτικό μονοπάτι και μπορεί να καταλήξει είτε εκτός του κυττάρου, είτε εντός κάποιας μεμβράνης είτε σε κάποιο οργανίδιο του μονοπατιού εντός του κυττάρου. Είναι φανερό λοιπόν ότι για την πρόβλεψη της συμβατικής έκκρισης μια πρωτεΐνης η γνώση των σηματοδοτικών αλληλουχιών που περιέχει είναι πολύ σημαντική. Στα πλαίσια αυτής της διπλωματικής έρευνας το πρόβλημα της πρόβλεψης της έκκρισης μιας πρωτεΐνης αντιμετωπίστηκε χρησιμοποιώντας την πρόβλεψη διάφορων προγραμμάτων για την ύπαρξη σηματοδοτικών αλληλουχιών ως ενδιάμεση πληροφορία για την τελική πρόβλεψη της έκκρισης. Αφού εξακριβώθηκαν οι καλές επιδόσεις των προγραμμάτων των οποίων οι προβλέψεις χρησιμοποιήθηκαν ως δεδομένα, δημιουργήθηκε ένας αλγόριθμος μηχανικής μάθησης ο οποίος εκπαιδεύτηκε σε αυτά με σκοπό την πρόβλεψη της έκκρισης ή όχι της πρωτεΐνης. Η υλοποίηση του αλγορίθμου έγινε με τη μέθοδο random forest σε γλώσσα προγραμματισμού R και με τη χρήση του πακέτου caret. el
heal.abstract Protein secretion plays a key role in both drug discovery and biomarker discovery by providing a distinguish - ing factor between useful and impractical drug targets and biomarkers. Unfortunately this information is not available for the whole proteome, with around 20% of human proteins still missing their secretion annotation. Molecular biology tells us that a protein can either be secreted through the secretory pathway or through unconventional mechanisms. In order for a protein to enter the secretory pathway, it must possess a char - acteristic domain of amino acids inside it’s sequence, known as a signal sequence. Thus knowing whether or not a protein contains a signal sequence is crucial in predicting its secretion. There are several benchmarked machine learning methods to predict the presence of these domains given the sequence of a protein and our goal is to evaluate those methods and find their optimal combination to predict if a protein is secreted based on the predicted features. On that front, the output of several programs will be used as feature variables to train and test an ensemble model based on random forests for the final prediction of a protein’s secretion en
heal.advisorName Αλεξόπουλος, Λεωνίδας el
heal.committeeMemberName Σπιτάς, Βασίλειος el
heal.committeeMemberName Προβατίδης, Χριστόφορος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Μηχανολόγων Μηχανικών. Τομέας Μηχανολογικών Κατασκευών και Αυτομάτου Ελέγχου.Εργαστήριο Εμβιομηχανικής και Συστημικής Βιολογίας (μη θεσμοθετημένο) el
heal.academicPublisherID ntua
heal.numberOfPages 98 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα