HEAL DSpace

Μελέτη και σχεδιασμός μεθόδων εξόρυξης δεδομένων και εφαρμογές σε προβλήματα μεταβολομικής

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Σαρίμβεης, Χαράλαμπος el
dc.contributor.author Χουρδάκης, Γεράσιμος Α. el
dc.contributor.author Chourdakis, Gerasimos A. en
dc.date.accessioned 2014-06-04T08:26:26Z
dc.date.available 2014-06-04T08:26:26Z
dc.date.copyright 2014-02-24 -
dc.date.issued 2014-06-04
dc.date.submitted 2014-02-24 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/38671
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.6417
dc.description 135 σ. el
dc.description.abstract H διπλωματική αυτή εργασία εστίασε στην επιστημονική περιοχή της Εξόρυξης Δεδομένων, με ενδελεχή μελέτη των διαθέσιμων αλγορίθμων, ανάπτυξη αλγόριθμου επιλογής μεταβλητών και εφαρμογές σε προβλήματα Μεταβολομικής. Συγκεκριμένα, μια σειρά μεθόδων μηχανικής μάθησης εφαρμόστηκαν σε δύο αρκετά διαφορετικά σύνολα δεδομένων, με στόχο την ταξινόμηση αγνώστων δειγμάτων σε προκαθορισμένες κλάσεις. Το πρώτο προέρχεται από δημοσιευμένη εργασία σχετικά με την πρόβλεψη της μετεγχειρητικής οξείας νεφρικής βλάβης (AKI). Περιέχει 106 φάσματα NMR από ανθρώπινα ούρα, με 701 χαρακτηριστικά και 2 κλάσεις. Εξετάστηκαν αρχικά αλγόριθμοι ταξινόμησης στο λογισμικό εξόρυξης δεδομένων WEKA και έπειτα εξήχθησαν συναινετικά μοντέλα με βάση τα αποτελέσματα από τα προηγούμενα μοντέλα, δημιουργώντας κατάλληλο λογιστικό φύλλο. Το δεύτερο σύνολο δεδομένων παραχωρήθηκε από το Τμήμα Φαρμακευτικής του Εθνικού Καποδιστριακού Πανεπιστημίου Αθηνών, και αφορά την επίδραση της ολευρωπαΐνης στην χρόνια καρδιακή ανεπάρκεια που προκαλεί η χορήγηση αδριαμυκίνης. Περιέχει 40 φάσματα NMR από εκχυλίσματα ιστών επιμύων, με 38 χαρακτηριστικά και 6 κλάσεις. Αρχικά χρησιμοποιήθηκε το εξειδικευμένο λογισμικό μεταβολομικής ανάλυσης MetaboAnalyst για τη διερεύνηση της ικανότητας διαχωρισμού των δεδομένων με συμβατικές μεθόδους. Στη συνέχεια, εξετάστηκαν αλγόριθμοι ταξινόμησης στη WEKA καθώς και συναινετικά μοντέλα που προέκυψαν χρησιμοποιώντας τα διαθέσιμα σε αυτήν εργαλεία. Τέλος, αναπτύχθηκε ένας αλγόριθμος επιλογής μεταβλητών με γενετική έρευνα και εκπαίδευση μοντέλων με μια υλοποίηση μηχανών διανυσμάτων υποστήριξης (Support Vector Machines, SVM). Τα αποτελέσματα της διπλωματικής εργασίας, έδειξαν ότι οι μέθοδοι μηχανικής μάθησης μπορούν να δώσουν λύσεις σε προβλήματα ανάλυσης δεδομένων Μεταβολομικής, με την ανάπτυξη μοντέλων μεγαλύτερης ακρίβειας σε σχέση με αυτά που παράγονται από συμβατικές στατιστικές μεθόδους. el
dc.description.abstract This diploma thesis focused on the scientific area of Data Mining, with in-depth study of the available algorithms, on the development of a variable selection algorithm and on applications to Metabolomics. Namely, a series of machine learning methods was applied to two very different datasets, in order to classify unknown samples to pre-set classes. The first one comes from a published work about predicting Acute Kidney Injury (AKI). It contains 106 human urine NMR spectra, with 701 attributes and 2 classes. At first, classification algorithms of the data mining software WEKA were used. Then, consensus models were built using the results of the previous models, creating a suitable spreadsheet. The second dataset was given from the faculty of Pharmacy of the University of Athens and concerns the effect of the Oleuropein to chronic doxorubicin-induced cardiomyopathy. It contains 40 NMR spectra of rat tissue extracts, with 38 attributes and 6 classes. At first, the Metabolomics-specific software MetaboAnalyst was used to investigate the ability to separate the data with conventional methods. Then, WEKA classification algorithms were examined, as well as consensus modelling using its tools. Finally, a variable selection algorithm was developed using genetic search and a support vector machines (SVM) implementation. The results of this diploma thesis showed that the machine learning methods can provide solutions to Metabolomics data analysis problems, by building models of higher accuracy than those built from conventional statistical methods. en
dc.description.statementofresponsibility Γεράσιμος Α. Χουρδάκης el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Εξόρυξη δεδομένων el
dc.subject Μεταβολομική el
dc.subject Μεταβονομική el
dc.subject Μηχανική μάθηση el
dc.subject Επιλογή μεταβλητών el
dc.subject Γενετική Έρευνα el
dc.subject WEKA el
dc.subject MetaboAnalyst el
dc.subject Data mining en
dc.subject Metabolomics en
dc.subject Metabonomics en
dc.subject Machine learning en
dc.subject Support Vector Machines en
dc.subject SVM en
dc.subject Variable selection en
dc.subject Genetic Search en
dc.title Μελέτη και σχεδιασμός μεθόδων εξόρυξης δεδομένων και εφαρμογές σε προβλήματα μεταβολομικής el
dc.title.alternative Study and design of data mining methods and applications to metabolomics problems en
dc.type bachelorThesis el (en)
dc.date.accepted 2014-02-19 -
dc.date.modified 2014-02-24 -
dc.contributor.advisorcommitteemember Κυρανούδης, Χρήστος el
dc.contributor.advisorcommitteemember Μικρός, Εμμανουήλ el
dc.contributor.committeemember Σαρίμβεης, Χαράλαμπος el
dc.contributor.committeemember Κυρανούδης, Χρήστος el
dc.contributor.committeemember Μικρός, Εμμανουήλ el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών. Τομέας Ανάλυσης, Σχεδιασμού και Ανάπτυξης Διεργασιών και Συστημάτων. el
dc.date.recordmanipulation.recordcreated 2014-06-04 -
dc.date.recordmanipulation.recordmodified 2014-06-04 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής