HEAL DSpace

Ανάπτυξη μοντέλων πρόβλεψης ιδιοτήτων μοριακών δομών με αρχιτεκτονικές νευρωνικών δικτύων γραφημάτων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Σάββας, Ιωάννης el
dc.contributor.author Savvas, Ioannis en
dc.date.accessioned 2024-01-22T10:10:54Z
dc.date.available 2024-01-22T10:10:54Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/58608
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.26304
dc.rights Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nd/3.0/gr/ *
dc.subject Βαθιά Μάθηση el
dc.subject Μοριακό γράφημα el
dc.subject Παλινδρόμηση el
dc.subject Νευρωνικά δίκτυα el
dc.subject Deep Learning en
dc.subject Molecular Graph en
dc.subject Regression el
dc.subject Neural Networks el
dc.title Ανάπτυξη μοντέλων πρόβλεψης ιδιοτήτων μοριακών δομών με αρχιτεκτονικές νευρωνικών δικτύων γραφημάτων el
dc.title Development of graph neural networks models for molecular property prediction en
heal.type bachelorThesis
heal.classification Χημική Μηχανική el
heal.classification Βαθιά Μάθηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-07-03
heal.abstract Στην παρούσα διπλωματική εργασία εξετάζεται η χρήση της βαθιάς μάθησης για την ανάπτυξη μοντέλων πρόβλεψης μοριακών ιδιοτήτων. Πιο συγκεκριμένα, διερευνάται η χρήση πέντε διαφορετικών αρχιτεκτονικών νευρωνικών δικτύων γραφημάτων (Graph Neural Network, GNN) για την πρόβλεψη της διαλυτότητας, πολικότητας και της συνθετικής προσβασιμότητας. Τα μοντέλα που αναπτύσσονται δέχονται ως είσοδο χημικά γραφήματα στα οποία οι κορυφές αποτελούν τα άτομα και οι ακμές τους χημικούς δεσμούς. Οι αρχιτεκτονικές αυτές είναι τo συνελικτικό νευρωνικό δίκτυο γραφήματος (Graph Convolutional Network, GCN), το νευρωνικό δίκτυο γραφήματος συγκέντρωσης δείγματος (Graph Sample and Aggregate, GraphSAGE) και το νευρωνικό δίκτυο γραφήματος προσοχής (Graph Attention Network, GAT) με την παραλλαγή του (GATv2). Στο δίκτυο GraphSAGE γίνεται χρήση τελεστή μεγίστου και μέσου όρου ως συνάρτηση συγκέντρωσης. To σύνολο των δεδομένων αποτελείται από 15.000 μικρά οργανικά μόρια τα οποία πάρθηκαν από την χημική βάση δεδομένων ZINC και περιέχουν τις επιθυμητές ιδιότητες υπολογισμένες. Τα μοντέλα εκπαιδεύονται, βελτιστοποιούνται και επικυρώνονται με τη χρήση της γλώσσας προγραμματισμού Python σε περιβάλλον Jupyter Notebook. Κατόπιν εκπαίδευσης αξιολογούνται στα δεδομένα εξέτασης (test data) ως προς το συντελεστή συσχέτισης (R2) και το μέσο τετραγωνικό σφάλμα (MSE). Στο τέλος πραγματοποιείται μια σύγκριση ως προς τις καλύτερες και στιβαρότερες αρχιτεκτονικές και προκύπτουν ενδιαφέροντα συμπεράσματα. Τα αποτελέσματα δείχνουν πως οι πιο καινούριες αρχιτεκτονικές (GraphSAGE, GAT, GATv2) κάνουν καλύτερες προβλέψεις από την κλασσική αρχιτεκτονική GCN. Συγκεκριμένα, ως προς την πρόβλεψη της διαλυτότητας και της συνθετικής προσβασιμότητας, τα μοντέλα προσοχής επιτυγχάνουν καλύτερες προβλέψεις ενώ ως προς την πολικότητα τα μοντέλα GraphSAGE φαίνεται να έχουν υψηλότερη ακρίβεια. el
heal.abstract In the current diploma thesis, the focus is on the use of deep learning for creating models to predict molecular properties. Specifically, the models are based on Graph Neural Networks (GNN) and five different architectures are examined to predict solubility, polarity and synthetic accessibility. The developed models take as input chemical graphs, on which the nodes are the chemical atom symbols and the edges are the chemical bonds. The architectures which were used are the Graph Convolutional Network (GCN), the Graph Sample and Aggregate using maximum and mean as aggregate functions (GraphSAGE) and two Graph Attention Networks (GAT, GATv2). The data used is comprised of 15000 small organic molecules that were obtained from the chemical database ZINC and contain the desirable properties calculated. The models are trained and validated using Python programming language in Jupyter Notebook environment. After training, the models are evaluated on the test data using the Coefficient of determination (R2) and Mean Squared Error (MSE). At the end of model development, a comparison is made in order to see which architectures do better on each of the three properties predicted. The results show that new architectures such as GraphSAGE, GAT and GATv2 are better than GCN in every property that was examined. More specifically, when it comes to predicting solubility and synthetic accessibility, Graph Attention models produce the best results. On the other hand, polarity is better predicted with the use of GraphSAGE. en
heal.advisorName Σαρίμβεης, Χαράλαμπος el
heal.committeeMemberName Τσόπελας, Φώτιος el
heal.committeeMemberName Χαμηλάκης, Στυλιανός el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών. Τομέας Ανάλυσης, Σχεδιασμού και Ανάπτυξης Διεργασιών και Συστημάτων (ΙΙ) el
heal.academicPublisherID ntua
heal.numberOfPages 102 σ el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα