HEAL DSpace

Εύρεση και Μελέτη Ενζύμων Βιοτεχνολογικού Ενδιαφέροντος με τη Χρήση Βιοπληροφορικών Εργαλείων και Αλγόριθμων Μηχανικής Μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Κολίσης, Φραγκίσκος el
dc.contributor.author Κουτσανδρέας, Θεόδωρος Γ. el
dc.contributor.author Koutsandreas, Theodoros G. en
dc.date.accessioned 2013-06-05T09:23:39Z
dc.date.available 2013-06-05T09:23:39Z
dc.date.copyright 2013-04-18 -
dc.date.issued 2013-06-05
dc.date.submitted 2013-04-18 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/8194
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.12785
dc.description 201 σ. el
dc.description.abstract Η εργασία είχε σαν σκοπό τη χρήση γνωστών βιοπληροφορικών εργαλείων και βάσεων δεδομένων για την ανάλυση πρωτεϊνικών αλληλουχιών και τη μελέτη της αποτελεσματικότητας τεχνικών μηχανικής μάθησης (machine learning) στο διαχωρισμό πρωτεϊνών συγκεκριμένων κατηγοριών. Οι αλγόριθμοι αναπτύχθηκαν σε περιβάλλον Linux, χρησιμοποιήθηκε η γλώσσα προγραμματισμού Perl (modules όπως BioPerl, DBI) και εντολές της MySQL. Το τεχνικό μέρος της εργασίας αποτελείται από δυο ενότητες. Στην πρώτη ενότητα αναπτύχθηκε ένας αλγόριθμος πρόβλεψης πρωτεϊνικής λειτουργίας άγνωστων αλληλουχιών. Χρησιμοποιήθηκαν το βιοπληροφορικό εργαλείο BLAST και η βάση δεδομένων UniProt-GOA. Ο χαρακτηρισμός κάθε άγνωστης πρωτεΐνης με λειτουργία, έγινε με τη χρήση του λεξιλογίου της Οντολογίας Γονιδίων (Gene Ontology) και της Ενζυμικής Ονοματολογίας (Enzyme Nomeclature). Ο αλγόριθμος χρησιμοποιήθηκε για την ανάλυση πραγματικών αλληλουχιών από δείγμα μεταγονιδιωματικής ανάλυσης. Στη δεύτερη ενότητα μελετήθηκε η αποτελεσματικότητα πέντε αλγόριθμων μηχανικής μάθησης στο διαχωρισμό υποκατηγοριών των υδρολασών από μη υδρολάσες, με βάση συγκεκριμένα χαρακτηριστικά (λειτουργικά, φυσικοχημικά). Συγκεκριμένα χρησιμοποιήθηκαν οι αλγόριθμοι Naive Bayes Kernel, Decision Trees, Support Vector Machines, Perceptron και k-Nearest-Neighbor. Στη συνέχεια οι αλγόριθμοι με τις μεγαλύτερες αποδόσεις και την καλύτερη συμπεριφορά χρησιμοποιήθηκαν για το διαχωρισμό θερμοανθεκτικών από μη θερμοανθεκτικά ένζυμα. Οι αλγόριθμοι Naive Bayes Kernel και Decision Trees κατάφεραν να διαχωρίσουν ένζυμα ίδιας λειτουργίας αλλά διαφορετικής αντοχής στη θερμοκρασία με απόδοση 80%-85%. el
dc.description.abstract The purpose of this thesis was firstly, the function prediction of unkown protein sequences with the use of well-known bioinformatic tools and secondly, the observation of machine learning algorithms in the classification of enzyme categories. All the algorithms were developed in Linux enviroment, with Perl programming language (modules such as BioPerl, DBI) and MySQL commands. In the first part, an algorithm which include the bioinformatic tool BLAST, the non-iea UniProt-GOA database was developed. This algorithm is able to predict the function of unknown protein sequences with the use of Gene Ontology vocabulary and Enzyme Nomeclature system. Thus it was executed for the prediction of sequences in a sample of metagenomic analysis. In the second part, the aim was the observation of accuracy and performance of five machine learning algorithms, Naïve Bayes Kernel, Decicion Trees, Support Vector Machines, Perceptron and k-Nearest-Neighbor. All these algorithms run with the view to classify different enzyme categories, based on functional and physicochemical properties. After this task, the best algorithms were used to separate thermostable from non-thermostable enzymes. Naïve Bayes Kernel and Decision Trees are able to separate enzymes which realize the same function but they have different levels of thermostability with an approximate accuracy of 80-85%. en
dc.description.statementofresponsibility Θεόδωρος Γ. Κουτσανδρέας el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Βιοπληροφορική el
dc.subject Μηχανική μάθηση el
dc.subject Θερμοανθεκτικότητα el
dc.subject Βιοτεχνολογία el
dc.subject Οντολογία γονιδίων el
dc.subject Ενζυμική ονοματολογία el
dc.subject Μπεϋζιανός ταξινομητής el
dc.subject Μηχανές διανυσμάτων υποστήριξης el
dc.subject Δέντρα απόφασης el
dc.subject Enzyme nomeclature en
dc.subject Naive bayes classifier en
dc.subject Support vector machines en
dc.subject Perceptron en
dc.subject Decision trees en
dc.subject Bioinformatics en
dc.subject Machine learning en
dc.subject Thermostability en
dc.subject Biotechnology en
dc.subject Gene ontology en
dc.title Εύρεση και Μελέτη Ενζύμων Βιοτεχνολογικού Ενδιαφέροντος με τη Χρήση Βιοπληροφορικών Εργαλείων και Αλγόριθμων Μηχανικής Μάθησης el
dc.type bachelorThesis el (en)
dc.date.accepted 2013-03-04 -
dc.date.modified 2013-04-18 -
dc.contributor.advisorcommitteemember Μπουντουβής, Ανδρέας el
dc.contributor.advisorcommitteemember Τόπακας, Ευάγγελος el
dc.contributor.committeemember Κολίσης, Φραγκίσκος el
dc.contributor.committeemember Μπουντουβής, Ανδρέας el
dc.contributor.committeemember Τόπακας, Ευάγγελος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών. Τομέας Σύνθεσης και Ανάπτυξης Βιομηχανικών Διαδικασιών. Εργαστήριο Βιοτεχνολογίας. el
dc.date.recordmanipulation.recordcreated 2013-06-05 -
dc.date.recordmanipulation.recordmodified 2013-06-05 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής