HEAL DSpace

Network structure vs chemical information in drug-drug interaction prediction

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Κεφάλας, Γεώργιος el
dc.contributor.author Kefalas, George en
dc.date.accessioned 2022-10-31T07:51:43Z
dc.date.available 2022-10-31T07:51:43Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56030
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.23728
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Αλληλεπιδράσεις Φαρμάκων el
dc.subject Δικτυακές Αναπραστάσεις Φαρμάκων el
dc.subject Χημικές Αναπαραστάσεις Φαρμάκων el
dc.subject Γραφοθεωρητικά Χαρακτηριστικά Αλληλεπιδράσεων Φαρμάκων el
dc.subject Δίκτυα Πληροφορίας el
dc.subject Drug-Drug Interaction Prediction en
dc.subject DrugBank en
dc.subject mol2vec en
dc.subject node2vec en
dc.subject Graph Topological Features en
dc.title Network structure vs chemical information in drug-drug interaction prediction en
heal.type bachelorThesis
heal.classification Data Science en
heal.classification Machine Learning en
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-07-12
heal.abstract Σε αυτή την εργασία μελετάμε τις αλληλεπιδράσεις μεταξύ φαρμακευτικών ουσιών. Πιο συγκεκριμένα, εξερευνούμε τη πληροφορία που μπορεί να αντλήσει κάποιος μέσα από τον γράφο γνώσης που προκύπτει αν θεωρήσουμε κάθε φάρμακο ως κόμβο και κάθε αλληλεπίδραση δύο φαρμάκων ως ακμή μεταξύ των αντίστοιχων κόμβων - τη γνώση αυτή ονομάζουμε δικτυακή ή γραφική πληροφορία. Παράλληλα αξιοποιούμε τον χημικό τύπο από τη δραστική ουσία ενός φαρμάκου για να αποτυπώσουμε τις χημικές ιδιότητές του και να εξάγουμε αυτό που ονομάζουμε στη συνέχεια ως χημική πληροφορία. Στόχος μας είναι να συγκρίνουμε τη δικτυακή πληροφορία με την χημική πληροφορία πάνω στο πρόβλημα της εκτίμησης αλληλεπιδράσεων μεταξύ φαρμάκων. Για να το κάνουμε αυτό, επιστρατεύουμε δύο μεθόδους που εμπνεύστηκαν από τον χώρο της μηχανικής μάθησης, και συγκεκριμένα από τον τομέα επεξεργασίας φυσικής γλώσσας: το mol2vec και το node2vec. Οι μέθοδοι αυτοί μας βοηθούν να παράξουμε διανυσματικές αναπαραστάσεις, τόσο βάσει της χημικής πληροφορίας, όσο και της δικτυακής πληροφορίας, από τα φάρμακα που έχουμε στη διάθεσή μας. Αξιοποιούμε αυτές τις αναπαραστάσεις για να αναπτύξουμε και να εκπαιδεύσουμε ταξινομητές βασισμένους σε νευρωνικά δίκτυα οι οποίοι με δεδομένο ένα ζεύγος φαρμάκων ως είσοδο, δίνουν ως έξοδο μια εκτίμηση για το αν τα φάρμακα αυτά αλληλεπιδρούν. Μέσω της σύγκρισης των αποτελεσμάτων των ταξινομητών μας σε ένα κατάλληλο σύνολο ελέγχου κατορθώνουμε να παράξουμε χρήσιμα συμπεράσματα για τα γραφοθεωρητικά χαρακτηριστικά που προσδιορίζουν για ένα φάρμακο του γράφου γνώσης (γράφος γνωστών αλληλεπιδράσεων) αν είναι προτιμότερο να μελετηθεί βάσει της χημικής ή της δικτυακής πληροφορίας που υπάρχει διαθέσιμη για αυτό. Για τα πειράματά μας χρησιμοποιούμε τη βάση δεδομένων DrugBank και στη πορεία της εξόρυξης και προετοιμασίας των δεδομένων μας επιστρατεύουμε διάφορα εργαλεία της υπολογιστικής χημείας, όπως τα RDKit και PubChem καθώς και τη βιβλιοθήκη NetworkX για να επεξεργαστούμε υπολογιστικά γράφους δεδομένων. el
heal.abstract This thesis compares network information against chemical information for the problem of drug interaction prediction. Drug interactions can be studied as a network, with the drugs represented as nodes, and interactions as edges. There is also the additional information of the chemical formula of each drug. We apply two embedding mechanisms, mol2vec and node2vec, on the problem of predicting Drug-Drug Interactions (DDIs). These mechanisms, respectively, convert drugs into vectors using the chemical information of the underlying chemical compound and the network information from the graph of drug interactions. Our goal is to compare Single Link Prediction models that are based on each embedding method by exploring the topological features of the drug interactions graph that make each approach more efficient in making correct predictions. We base our experiments on the DrugBank data set and use various computational chemistry tools such RDKit and PubChem, along with NetworkX, in order to create the chemical and structural embeddings for each drug. en
heal.advisorName Stafylopatis, Andreas-Georgios en
heal.committeeMemberName Stafylopatis, Andreas-Georgios en
heal.committeeMemberName Kollias, Stefanos en
heal.committeeMemberName Stamou, Giorgos en
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 73 σ. el
heal.fullTextAvailability false


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα