HEAL DSpace

Ανάλυση και σύγκριση αλγορίθμων μηχανικής μάθησης για πρόβλεψη στην διάγνωση διαβήτη

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Πάπαλου, Αντωνία el
dc.contributor.author Papalou, Antonia en
dc.date.accessioned 2025-11-12T06:56:22Z
dc.date.available 2025-11-12T06:56:22Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/62840
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.30536
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Μηχανική μάθηση el
dc.subject Διαβήτης τύπου 2 el
dc.subject Ανισορροπία δεδομένων el
dc.subject Κύρια χαρακτηριστικά el
dc.subject Αλγόριθμοι el
dc.subject Machine learning en
dc.subject Type 2 Diabetes en
dc.subject Smote en
dc.subject Shap en
dc.subject XGBoost en
dc.title Ανάλυση και σύγκριση αλγορίθμων μηχανικής μάθησης για πρόβλεψη στην διάγνωση διαβήτη el
dc.title Analysis and comparative evaluation of machine learning algorithms for predicting diabetes diagnosis en
heal.type bachelorThesis
heal.classification Στατιστική el
heal.classification Μαθηματικά el
heal.classification Μηχανική μάθηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2025-06-18
heal.abstract Ο διαβήτης τύπου 2 αποτελεί μια από τις σοβαρότερες και ταχύτερα αυξανόμενες χρόνιες παθήσεις παγκοσμίως, επηρεάζοντας εκατομμύρια ανθρώπους και επιβαρύνοντας σημαντικά τα συστήματα υγείας. Η έγκαιρη ανίχνευση και πρόβλεψη της νόσου καθίσταται κρίσιμος παράγοντας για την αποτελεσματική πρόληψη και διαχείρισή της. Στο πλαίσιο αυτό, η μηχανική μάθηση αναδεικνύεται ως μια πολλά υποσχόμενη προσέγγιση για την ανάπτυξη διαγνωστικών εργαλείων που μπορούν να αξιοποιηθούν υποστηρικτικά από ιατρούς και φορείς δημόσιας υγείας. Η παρούσα μελέτη επικεντρώνεται στην εφαρμογή και αξιολόγηση αλγορίθμων μηχανικής μάθησης για την ταξινόμηση του διαβήτη τύπου 2, αξιοποιώντας δεδομένα από το Behavioral Risk Factor Surveillance System (BRFSS), μια πραγματική, μεγάλης κλίμακας και δημογραφικά πλούσια ιατρική βάση δεδομένων. Στην εργασία εφαρμόζονται έξι διαφορετικοί ταξινομητές (Logistic Regression,Decision Tree, Random Forest, XGBoost, Support Vector Machine και Multilayer Perceptron), ενώ ενσωματώνεται η τεχνική SMOTE για την αντιστάθμιση της σημαντικής ανισορροπίας μεταξύ των θετικών και αρνητικών τάξεων. Ο σχεδιασμός περιλαμβάνει διαδικασία υπερπαραμετροποίησης μέσω grid search, καθώς και πολυκριτηριακή αξιολόγηση με έμφαση σε μετρικές υψηλής ευαισθησίας,όπως η ανάκληση (recall) και ο δείκτης AUC. Ιδιαίτερη έμφαση δίνεται στην ερμηνευσιμότητα των μοντέλων, που αποτελεί βασική απαίτηση για την αποδοχή της τεχνητής νοημοσύνης στον ιατρικό τομέα. Για τον σκοπό αυτό, εφαρμόζονται δύο σύγχρονες τεχνικές ανάλυσης σημαντικότητας χαρακτηριστικών: η Permutation Feature Importance και η SHAP (SHapley Additive exPlanations), επιτρέποντας τη χαρτογράφηση των πιο καθοριστικών μεταβλητών που επηρεάζουν την εκτίμηση του μοντέλου. Η επιλογή αυτών των εργαλείων επιτρέπει τη σύγκριση διαφορετικών αλγοριθμικών οικογενειών τόσο ως προς την ακρίβεια, όσο και ως προς την ερμηνευσιμότητα και τη δυνατότητα ενσωμάτωσης σε πραγματικά ιατρικά περιβάλλοντα. Η συνεισφορά της παρούσας μελέτης είναι διττή: αφενός, προτείνει μια ολοκληρωμένη μεθοδολογική προσέγγιση για τη διαχείριση και ανάλυση ανισόρροπων ιατρικών δεδομένων, και αφετέρου, προάγει τη σύνδεση των υπολογιστικών ευρημάτων με την υφιστάμενη ιατρική γνώση. Η εργασία φιλοδοξεί να συμβάλει στη διαμόρφωση αξιόπιστων εργαλείων υποστήριξης απόφασης, ενισχύοντας την προληπτική ιατρική και προάγοντας την εφαρμογή διαφανών και ερμηνεύσιμων τεχνολογιών στον χώρο της υγειονομικής περίθαλψης. el
heal.abstract Type 2 diabetes is one of the most severe and rapidly growing chronic diseases globally, affecting millions of individuals and placing a significant burden on healthcare systems. Early detection and prediction are critical for effective prevention and disease management. In this context, machine learning emerges as a promising approach for developing diagnostic tools that can be utilized in a supportive manner by clinicians and public health institutions. This study focuses on the application and evaluation of machine learning algorithms for the classification of type 2 diabetes, leveraging data from the Behavioral Risk Factor Surveillance System (BRFSS), a real-world, large-scale, and demographically rich medical dataset. Six different classification models are implemented (Logistic Regression, Decision Tree, Random Forest, XGBoost, Support Vector Machine, and Multilayer Perceptron), while the SMOTE technique is employed to address the pronounced class imbalance between positive and negative cases. The methodology includes hyperparameter tuning through grid search and multi-metric evaluation with a focus on sensitivity-oriented metrics such as recall and AUC score. Special emphasis is placed on model interpretability, which is a key requirement for the acceptance of artificial intelligence in the medical domain. To this end, two modern techniques for assessing feature importance are employed: Permutation Feature Importance and SHAP (SHapley Additive exPlanations), enabling the identification of the most influential variables driving model predictions. The use of these tools facilitates a comparative analysis of different algorithmic families not only in terms of performance but also in terms of explainability and their potential integration into real-world clinical practice. The contribution of this study is twofold: it provides a comprehensive methodological framework for managing and analyzing imbalanced medical data, and it strengthens the link between computational findings and existing medical knowledge. The work aims to support the development of reliable decision-support tools, enhancing preventive medicine and promoting the implementation of transparent and interpretable technologies in healthcare environments. en
heal.advisorName Κουκουβίνος, Χρήστος el
heal.committeeMemberName Κουκουβίνος, Χρήστος el
heal.committeeMemberName Βόντα, Φιλία el
heal.committeeMemberName Καρώνη, Χρυσηίς el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών el
heal.academicPublisherID ntua
heal.numberOfPages 88
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα