dc.contributor.author | Σάββας, Ιωάννης | el |
dc.contributor.author | Savvas, Ioannis | en |
dc.date.accessioned | 2024-01-22T10:10:54Z | |
dc.date.available | 2024-01-22T10:10:54Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/58608 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.26304 | |
dc.rights | Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nd/3.0/gr/ | * |
dc.subject | Βαθιά Μάθηση | el |
dc.subject | Μοριακό γράφημα | el |
dc.subject | Παλινδρόμηση | el |
dc.subject | Νευρωνικά δίκτυα | el |
dc.subject | Deep Learning | en |
dc.subject | Molecular Graph | en |
dc.subject | Regression | el |
dc.subject | Neural Networks | el |
dc.title | Ανάπτυξη μοντέλων πρόβλεψης ιδιοτήτων μοριακών δομών με αρχιτεκτονικές νευρωνικών δικτύων γραφημάτων | el |
dc.title | Development of graph neural networks models for molecular property prediction | en |
heal.type | bachelorThesis | |
heal.classification | Χημική Μηχανική | el |
heal.classification | Βαθιά Μάθηση | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2023-07-03 | |
heal.abstract | Στην παρούσα διπλωματική εργασία εξετάζεται η χρήση της βαθιάς μάθησης για την ανάπτυξη μοντέλων πρόβλεψης μοριακών ιδιοτήτων. Πιο συγκεκριμένα, διερευνάται η χρήση πέντε διαφορετικών αρχιτεκτονικών νευρωνικών δικτύων γραφημάτων (Graph Neural Network, GNN) για την πρόβλεψη της διαλυτότητας, πολικότητας και της συνθετικής προσβασιμότητας. Τα μοντέλα που αναπτύσσονται δέχονται ως είσοδο χημικά γραφήματα στα οποία οι κορυφές αποτελούν τα άτομα και οι ακμές τους χημικούς δεσμούς. Οι αρχιτεκτονικές αυτές είναι τo συνελικτικό νευρωνικό δίκτυο γραφήματος (Graph Convolutional Network, GCN), το νευρωνικό δίκτυο γραφήματος συγκέντρωσης δείγματος (Graph Sample and Aggregate, GraphSAGE) και το νευρωνικό δίκτυο γραφήματος προσοχής (Graph Attention Network, GAT) με την παραλλαγή του (GATv2). Στο δίκτυο GraphSAGE γίνεται χρήση τελεστή μεγίστου και μέσου όρου ως συνάρτηση συγκέντρωσης. To σύνολο των δεδομένων αποτελείται από 15.000 μικρά οργανικά μόρια τα οποία πάρθηκαν από την χημική βάση δεδομένων ZINC και περιέχουν τις επιθυμητές ιδιότητες υπολογισμένες. Τα μοντέλα εκπαιδεύονται, βελτιστοποιούνται και επικυρώνονται με τη χρήση της γλώσσας προγραμματισμού Python σε περιβάλλον Jupyter Notebook. Κατόπιν εκπαίδευσης αξιολογούνται στα δεδομένα εξέτασης (test data) ως προς το συντελεστή συσχέτισης (R2) και το μέσο τετραγωνικό σφάλμα (MSE). Στο τέλος πραγματοποιείται μια σύγκριση ως προς τις καλύτερες και στιβαρότερες αρχιτεκτονικές και προκύπτουν ενδιαφέροντα συμπεράσματα. Τα αποτελέσματα δείχνουν πως οι πιο καινούριες αρχιτεκτονικές (GraphSAGE, GAT, GATv2) κάνουν καλύτερες προβλέψεις από την κλασσική αρχιτεκτονική GCN. Συγκεκριμένα, ως προς την πρόβλεψη της διαλυτότητας και της συνθετικής προσβασιμότητας, τα μοντέλα προσοχής επιτυγχάνουν καλύτερες προβλέψεις ενώ ως προς την πολικότητα τα μοντέλα GraphSAGE φαίνεται να έχουν υψηλότερη ακρίβεια. | el |
heal.abstract | In the current diploma thesis, the focus is on the use of deep learning for creating models to predict molecular properties. Specifically, the models are based on Graph Neural Networks (GNN) and five different architectures are examined to predict solubility, polarity and synthetic accessibility. The developed models take as input chemical graphs, on which the nodes are the chemical atom symbols and the edges are the chemical bonds. The architectures which were used are the Graph Convolutional Network (GCN), the Graph Sample and Aggregate using maximum and mean as aggregate functions (GraphSAGE) and two Graph Attention Networks (GAT, GATv2). The data used is comprised of 15000 small organic molecules that were obtained from the chemical database ZINC and contain the desirable properties calculated. The models are trained and validated using Python programming language in Jupyter Notebook environment. After training, the models are evaluated on the test data using the Coefficient of determination (R2) and Mean Squared Error (MSE). At the end of model development, a comparison is made in order to see which architectures do better on each of the three properties predicted. The results show that new architectures such as GraphSAGE, GAT and GATv2 are better than GCN in every property that was examined. More specifically, when it comes to predicting solubility and synthetic accessibility, Graph Attention models produce the best results. On the other hand, polarity is better predicted with the use of GraphSAGE. | en |
heal.advisorName | Σαρίμβεης, Χαράλαμπος | el |
heal.committeeMemberName | Τσόπελας, Φώτιος | el |
heal.committeeMemberName | Χαμηλάκης, Στυλιανός | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών. Τομέας Ανάλυσης, Σχεδιασμού και Ανάπτυξης Διεργασιών και Συστημάτων (ΙΙ) | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 102 σ | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: