Ανάπτυξη υπολογιστικών ροών για την εκπαίδευση μαθηματικών μοντέλων πρόβλεψης ιδιοτήτων υλικών με τεχνικές μηχανικής μάθησης

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Σωτηρόπουλος, Ιάσων el
dc.contributor.author Sotiropoulos, Iason en
dc.date.accessioned 2020-12-04T08:35:48Z
dc.date.available 2020-12-04T08:35:48Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/52247
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.19945
dc.rights Default License
dc.subject Μηχανική μάθηση el
dc.subject Machine learning el
dc.subject Data mining en
dc.subject MWCNTs en
dc.subject SPIONs en
dc.subject Εξόρυξη δεδομένων el
dc.subject Προβλεπτικά μοντέλα el
dc.subject Περιγραφικά μοντέλα el
dc.subject Συσταδοποίηση el
dc.subject Modeling el
dc.title Ανάπτυξη υπολογιστικών ροών για την εκπαίδευση μαθηματικών μοντέλων πρόβλεψης ιδιοτήτων υλικών με τεχνικές μηχανικής μάθησης el
dc.title Development of computational pipelines for training mathematical models predicting properties of materials using machine learning techniques en
dc.contributor.department Τομέας Ανάλυσης, Σχεδιασμού και Ανάπτυξης Διεργασιών και Συστημάτων el
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.classification QSAR en
heal.classification Machine Learning en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2020-10-05
heal.abstract Η παρούσα διπλωματική εργασία εστίασε στις επιστημονικές περιοχές της εξόρυξης δεδομένων (Data mining) και της μηχανικής μάθησης (machine learning), με στόχο την ανάπτυξη υπολογιστικών ροών που συνδέουν την τοξικότητα νανοϋλικών με τις φυσικοχημικές τους ιδιότητες. Συγκεκριμένα, στόχος της εργασίας αυτής ήταν η κατασκευή στατιστικών μοντέλων και μοντέλων μηχανικής μάθησης που περιγράφουν τη συσχέτιση της τοξικότητας με τις ιδιότητες των υλικών (Quantitative structure–activity relationship, QSAR). Έτσι, εφαρμόσαμε μια σειρά αλγορίθμων μηχανικής μάθησης σε δύο διαφορετικά σύνολα δεδομένων με στόχο την κατηγοριοποίηση άγνωστων δειγμάτων ως προς την τοξικότητά τους. Το πρώτο σετ δεδομένων κατασκευάσθηκε αντλώντας πληροφορίες από τη βιβλιογραφία για την τοξικότητα, τις φυσικοχημικές ιδιότητες και τις πειραματικές μετρήσεις 15 νανοσωλήνων άνθρακα πολλαπλών τοιχωμάτων (Multi-Walled Carbon Nanotubes, MWCNTs). Σε αυτό το σύνολο δεδομένων εξετάστηκαν αρκετά μοντέλα μηχανικής μάθησης, και συνδυασμοί αυτών με στόχο την εξαγωγή μιας συναινετικής πρόβλεψης (consensus prediction). Παράλληλα, αναπτύχθηκε μέθοδος ενισχυτικής μάθησης, που στηρίζεται στη μπεϋζιανή στατιστική, με στόχο τη βέλτιστη επιλογή των παραμέτρων βαθμονόμησης των μοντέλων. Το δεύτερο σετ δεδομένων απαρτίζεται από φυσικοχημικές ιδιότητες και δύο κλάσεις τοξικότητας για 16 υπέρ-παραμαγνητικά νανοσωματίδια οξειδίων σιδήρου (Super-Paramagnetic Iron Oxide Nanoparticles, SPIONs). Για την συλλογή αυτών των δεδομένων διεξήχθη μια ενδελεχής έρευνα στην διεθνή βιβλιογραφία, αντλώντας πληροφορίες από 12 διαφορετικές μελέτες. Στην περίπτωση αυτή, χρησιμοποιήθηκε εξειδικευμένο λογισμικό αλγορίθμου γενετικού προγραμματισμού, για την επιλογή του κατάλληλου προβλεπτικού μοντέλου για την τοξικότητα των οξειδίων σιδήρου. Και στα δύο διαφορετικά σύνολα δεδομένων, πριν τη μοντελοποίηση προηγήθηκε η προεπεξεργασία των δεδομένων και ο μετασχηματισμός τους, ώστε να είναι δυνατή η εισαγωγή τους στους αλγορίθμους μηχανικής μάθησης. Τελευταίο στάδιο στην ανάλυση των δεδομένων αποτέλεσε η μείωση του μεγέθους των μοντέλων και ο υπολογισμός του πεδίου εφαρμογής τους. Στη διπλωματική αυτή εργασία αναπτύχθηκαν υπολογιστικές ροές που υλοποιούν και αυτοματοποιούν την ανωτέρω διαδικασία. Τα αποτελέσματα αυτής της διπλωματικής εργασίας έδειξαν πως οι μέθοδοι μηχανικής μάθησης μπορούν να δώσουν απαντήσεις σε προβλήματα τοξικότητας νανοϋλικών, με την ανάπτυξη μοντέλων που καταλήγουν σε υψηλότερη ακρίβεια από αυτή των συμβατικών στατιστικών μεθόδων. el
heal.abstract This diploma thesis focused on the scientific areas of Data Mining and Machine Learning, with aim the development of computational pipelines that connect the toxicity of nanomaterials with their physicochemical properties. Τhe primary aim of this thesis was the construction of several statistical models that describe the connection of toxicity endpoint of materials to their properties (Quantitative structure–activity relationship, QSAR). In order to achieve this, we applied a group of machine learning methods, on two different datasets with respect to the toxicity endpoint. The first dataset was constructed by collecting from the literature toxicity, physicochemical and experimental data of 15 Multi-Walled Carbon Nanotubes (MWCNTs). This dataset contained data for in the literature, in similar studies. Several machine learning models, and combinations of these models were trained on the dataset in order to extract a consensus prediction. A reinforcement learning technique, based in Bayesian statistics, was developed in order to tune the hyperparameters of the models. The second dataset contained data of physicochemical properties and a two-class toxicity endpoint for 16 observations of Super-Paramagnetic Iron Oxide Nanoparticles (SPIONs). An extensive literature search took place and the data were manually extracted from 12 studies. In the case of SPIONs, α genetic programming algorithm was applied to find the appropriate predictive model for the toxicity of the nanoparticles. In both datasets, first step of the pipeline was preprocessing the data in order to fix problematic values and to transform the data to “machine” understandable terms. The last step of the data analysis workflow was the reduction of the models’ dimensionality and the calculation of their domain of applicability. Computational pipelines were developed in order to automate the above analysis. The results of this thesis showed that the machine learning methods are capable of providing solutions to nanomaterials’ toxicity problems, by building models of higher accuracy compared to conventional statistical methods. en
heal.advisorName Σαρίμβεης, Χαράλαμπος el
heal.committeeMemberName Σαρίμβεης, Χαράλαμπος el
heal.committeeMemberName Κυρανούδης, Χρήστος el
heal.committeeMemberName Παυλάτου, Ευαγγελία el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών. Τομέας Ανάλυσης, Σχεδιασμού και Ανάπτυξης Διεργασιών και Συστημάτων (ΙΙ) el
heal.academicPublisherID ntua
heal.numberOfPages 98 σ. el
heal.fullTextAvailability false

Files in this item

This item appears in the following Collection(s)

Show simple item record