HEAL DSpace

Ανάπτυξη μοντέλου υποστήριξης της ανίχνευσης του καρκίνου του μαστού από εξετάσεις αίματος, βασισμένο σε τεχνικές συλλογικής μάθησης.

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ελευθεριάδης, Βασίλειος el
dc.contributor.author Eleftheriadis, Vasileios en
dc.date.accessioned 2022-02-25T09:38:27Z
dc.date.available 2022-02-25T09:38:27Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54843
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22541
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by/3.0/gr/ *
dc.subject Καρκίνος μαστού el
dc.subject Breast cancer en
dc.subject Μηχανική μάθηση el
dc.subject Ανίχνευση el
dc.subject Αιματολογικές εξετάσεις el
dc.subject Συλλογική μάθηση el
dc.subject Detection en
dc.subject Machine learning en
dc.subject Blood analysis en
dc.subject Ensemble learning en
dc.title Ανάπτυξη μοντέλου υποστήριξης της ανίχνευσης του καρκίνου του μαστού από εξετάσεις αίματος, βασισμένο σε τεχνικές συλλογικής μάθησης. el
heal.type bachelorThesis
heal.classification Βιοιατρική τεχνολογία el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2020-02
heal.abstract Στην παρούσα διπλωματική εργασία παρουσιάζεται ένα μοντέλο ανίχνευσης του καρκίνου του μαστού εφαρμόζοντας τεχνικές μηχανικής μάθησης σε αποτελέσματα αιματολογικών εξετάσεων και ανθρωπομετρικά δεδομένα. Για την ανάπτυξη και την αξιολόγηση του μοντέλου, χρησιμοποιήθηκε η βάση δεδομένων Coimbra Breast Cancer Dataset, η οποία παραχωρείται μέσω της δημοσίως διαθέσιμης βιβλιοθήκης UCI Machine Learning Repository. Τα δεδομένα περιλαμβάνουν καταγραφές από 116 γυναίκες, για κάθε μία από τις οποίες πραγματοποιήθηκαν αιματολογικές εξετάσεις των επιπέδων γλυκόζης, ινσουλίνης, λεπτίνης, αντιπονεκτίνης, ρεζιστίνης και MCP-1, καθώς και σωματομετρικών δεδομένων όπως η ηλικία και ο δείκτης μάζας σώματος aBMI). Από τις 116 συμμετέχοντες, οι 64 είχαν πρόσφατα διαγνωστεί με καρκίνο του μαστού, ενώ οι 52 αποτέλεσαν την υγιή ομάδα ελέγχου. Για την ανάπτυξη του μοντέλου διερευνήθηκε η χρήση διαφόρων αλγορίθμων μηχανικής μάθησης aSVM, Logistic Regression, Random Forest, XGBoost, Naive Bayes), ενώ πραγματοποιήθηκε εκτενής αναζήτηση βέλτιστου συνδυασμού βιοδεικτών που αντιστοιχούν σε κάθε αλγόριθμο. Για την επίτευξη υψηλής ακρίβειας διερευνήθηκε η χρήση μεθόδων συλλογικής μάθησης, συνδυάζοντας την έξοδο των αρχικών μοντέλων. Το μοντέλο με την βέλτιστη απόδοση βασίστηκε στη συνδυασμένη χρήση των μοντέλων XGBoost, Random Forest, Support Vector Machines και KNN μέσω σταθμισμένης ψηφοφορίας, επιτυγχάνοντας AUC: 0.928 , Ακρίβεια: 92.24%, Ευαισθησία: 93.75% και Ειδικότητα: 90.38%, F1-score 0.930 και Precision 0.923. el
heal.abstract The objective of the present thesis is the design, development and evaluation of a breast cancer detection model through applying machine learning techniques on data from blood analysis and anthropometric data. For the development and evaluation of the model the Coimbra Breast Cancer Dataset has been used, which is publicly available through the UCI Machine Learning Repository. This dataset consists of 116 instances. Out of the 116 women participants, 64 had been diagnosed with breast cancer . For each participant the values of serum Glucose, Leptin, Adiponectin, Resistin and Chemokine Monocyte Chemoattractant Protein 1 aMCP-1), and levels of plasma Insulin were assessed by blood analysis. The Homeostasis Model Assessment aHOMA) index and the Leptin/Antiponectin ratios were calculated. Moreover, anthropometric data such as age and Body Mass Index aBMI) were recorded for each participant. For the development of the model, the use of several machine learning models aSVM, Logistic Regression, Random Forest, XGBoost, Naive Bayes) has been investigated, while extended search of the optimal combination of biomarkers for each model has been conducted. Aiming at achieving high levels of accuracy, ensemble learning techniques have been applied in order to combine the outputs of the primary models towards producing the final decision. The model which achieved the highest accuracy was based on the combined use of the XGBoost, Random Forest, Support Vector Machines and KNN models and the application of the Dynamic Weighted Voting based on Accuracy on the outputs of the primary models. The obtained results demonstrate the effectiveness of the model aAUC : 0.928 , Accuracy : 92.24% , Sensitivity : 93.75%, Specificity 90.38%, F1-score 0.930 and Precision 0.923). en
heal.advisorName Νικήτα, Κωνσταντίνα Σ. el
heal.advisorName Nikita, Konstantina S. en
heal.committeeMemberName Νικήτα, Κωνσταντίνα Σ. el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών el
heal.academicPublisherID ntua
heal.numberOfPages 130 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού 3.0 Ελλάδα