dc.contributor.author | Ελευθεριάδης, Βασίλειος | el |
dc.contributor.author | Eleftheriadis, Vasileios | en |
dc.date.accessioned | 2022-02-25T09:38:27Z | |
dc.date.available | 2022-02-25T09:38:27Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/54843 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.22541 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Καρκίνος μαστού | el |
dc.subject | Breast cancer | en |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Ανίχνευση | el |
dc.subject | Αιματολογικές εξετάσεις | el |
dc.subject | Συλλογική μάθηση | el |
dc.subject | Detection | en |
dc.subject | Machine learning | en |
dc.subject | Blood analysis | en |
dc.subject | Ensemble learning | en |
dc.title | Ανάπτυξη μοντέλου υποστήριξης της ανίχνευσης του καρκίνου του μαστού από εξετάσεις αίματος, βασισμένο σε τεχνικές συλλογικής μάθησης. | el |
heal.type | bachelorThesis | |
heal.classification | Βιοιατρική τεχνολογία | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2020-02 | |
heal.abstract | Στην παρούσα διπλωματική εργασία παρουσιάζεται ένα μοντέλο ανίχνευσης του καρκίνου του μαστού εφαρμόζοντας τεχνικές μηχανικής μάθησης σε αποτελέσματα αιματολογικών εξετάσεων και ανθρωπομετρικά δεδομένα. Για την ανάπτυξη και την αξιολόγηση του μοντέλου, χρησιμοποιήθηκε η βάση δεδομένων Coimbra Breast Cancer Dataset, η οποία παραχωρείται μέσω της δημοσίως διαθέσιμης βιβλιοθήκης UCI Machine Learning Repository. Τα δεδομένα περιλαμβάνουν καταγραφές από 116 γυναίκες, για κάθε μία από τις οποίες πραγματοποιήθηκαν αιματολογικές εξετάσεις των επιπέδων γλυκόζης, ινσουλίνης, λεπτίνης, αντιπονεκτίνης, ρεζιστίνης και MCP-1, καθώς και σωματομετρικών δεδομένων όπως η ηλικία και ο δείκτης μάζας σώματος aBMI). Από τις 116 συμμετέχοντες, οι 64 είχαν πρόσφατα διαγνωστεί με καρκίνο του μαστού, ενώ οι 52 αποτέλεσαν την υγιή ομάδα ελέγχου. Για την ανάπτυξη του μοντέλου διερευνήθηκε η χρήση διαφόρων αλγορίθμων μηχανικής μάθησης aSVM, Logistic Regression, Random Forest, XGBoost, Naive Bayes), ενώ πραγματοποιήθηκε εκτενής αναζήτηση βέλτιστου συνδυασμού βιοδεικτών που αντιστοιχούν σε κάθε αλγόριθμο. Για την επίτευξη υψηλής ακρίβειας διερευνήθηκε η χρήση μεθόδων συλλογικής μάθησης, συνδυάζοντας την έξοδο των αρχικών μοντέλων. Το μοντέλο με την βέλτιστη απόδοση βασίστηκε στη συνδυασμένη χρήση των μοντέλων XGBoost, Random Forest, Support Vector Machines και KNN μέσω σταθμισμένης ψηφοφορίας, επιτυγχάνοντας AUC: 0.928 , Ακρίβεια: 92.24%, Ευαισθησία: 93.75% και Ειδικότητα: 90.38%, F1-score 0.930 και Precision 0.923. | el |
heal.abstract | The objective of the present thesis is the design, development and evaluation of a breast cancer detection model through applying machine learning techniques on data from blood analysis and anthropometric data. For the development and evaluation of the model the Coimbra Breast Cancer Dataset has been used, which is publicly available through the UCI Machine Learning Repository. This dataset consists of 116 instances. Out of the 116 women participants, 64 had been diagnosed with breast cancer . For each participant the values of serum Glucose, Leptin, Adiponectin, Resistin and Chemokine Monocyte Chemoattractant Protein 1 aMCP-1), and levels of plasma Insulin were assessed by blood analysis. The Homeostasis Model Assessment aHOMA) index and the Leptin/Antiponectin ratios were calculated. Moreover, anthropometric data such as age and Body Mass Index aBMI) were recorded for each participant. For the development of the model, the use of several machine learning models aSVM, Logistic Regression, Random Forest, XGBoost, Naive Bayes) has been investigated, while extended search of the optimal combination of biomarkers for each model has been conducted. Aiming at achieving high levels of accuracy, ensemble learning techniques have been applied in order to combine the outputs of the primary models towards producing the final decision. The model which achieved the highest accuracy was based on the combined use of the XGBoost, Random Forest, Support Vector Machines and KNN models and the application of the Dynamic Weighted Voting based on Accuracy on the outputs of the primary models. The obtained results demonstrate the effectiveness of the model aAUC : 0.928 , Accuracy : 92.24% , Sensitivity : 93.75%, Specificity 90.38%, F1-score 0.930 and Precision 0.923). | en |
heal.advisorName | Νικήτα, Κωνσταντίνα Σ. | el |
heal.advisorName | Nikita, Konstantina S. | en |
heal.committeeMemberName | Νικήτα, Κωνσταντίνα Σ. | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 130 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: