| dc.contributor.author | Πάπαλου, Αντωνία
|
el |
| dc.contributor.author | Papalou, Antonia
|
en |
| dc.date.accessioned | 2025-11-12T06:56:22Z | |
| dc.date.available | 2025-11-12T06:56:22Z | |
| dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/62840 | |
| dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.30536 | |
| dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
| dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
| dc.subject | Μηχανική μάθηση | el |
| dc.subject | Διαβήτης τύπου 2 | el |
| dc.subject | Ανισορροπία δεδομένων | el |
| dc.subject | Κύρια χαρακτηριστικά | el |
| dc.subject | Αλγόριθμοι | el |
| dc.subject | Machine learning | en |
| dc.subject | Type 2 Diabetes | en |
| dc.subject | Smote | en |
| dc.subject | Shap | en |
| dc.subject | XGBoost | en |
| dc.title | Ανάλυση και σύγκριση αλγορίθμων μηχανικής μάθησης για πρόβλεψη στην διάγνωση διαβήτη | el |
| dc.title | Analysis and comparative evaluation of machine learning algorithms for predicting diabetes diagnosis | en |
| heal.type | bachelorThesis | |
| heal.classification | Στατιστική | el |
| heal.classification | Μαθηματικά | el |
| heal.classification | Μηχανική μάθηση | el |
| heal.language | el | |
| heal.access | free | |
| heal.recordProvider | ntua | el |
| heal.publicationDate | 2025-06-18 | |
| heal.abstract | Ο διαβήτης τύπου 2 αποτελεί μια από τις σοβαρότερες και ταχύτερα αυξανόμενες χρόνιες παθήσεις παγκοσμίως, επηρεάζοντας εκατομμύρια ανθρώπους και επιβαρύνοντας σημαντικά τα συστήματα υγείας. Η έγκαιρη ανίχνευση και πρόβλεψη της νόσου καθίσταται κρίσιμος παράγοντας για την αποτελεσματική πρόληψη και διαχείρισή της. Στο πλαίσιο αυτό, η μηχανική μάθηση αναδεικνύεται ως μια πολλά υποσχόμενη προσέγγιση για την ανάπτυξη διαγνωστικών εργαλείων που μπορούν να αξιοποιηθούν υποστηρικτικά από ιατρούς και φορείς δημόσιας υγείας. Η παρούσα μελέτη επικεντρώνεται στην εφαρμογή και αξιολόγηση αλγορίθμων μηχανικής μάθησης για την ταξινόμηση του διαβήτη τύπου 2, αξιοποιώντας δεδομένα από το Behavioral Risk Factor Surveillance System (BRFSS), μια πραγματική, μεγάλης κλίμακας και δημογραφικά πλούσια ιατρική βάση δεδομένων. Στην εργασία εφαρμόζονται έξι διαφορετικοί ταξινομητές (Logistic Regression,Decision Tree, Random Forest, XGBoost, Support Vector Machine και Multilayer Perceptron), ενώ ενσωματώνεται η τεχνική SMOTE για την αντιστάθμιση της σημαντικής ανισορροπίας μεταξύ των θετικών και αρνητικών τάξεων. Ο σχεδιασμός περιλαμβάνει διαδικασία υπερπαραμετροποίησης μέσω grid search, καθώς και πολυκριτηριακή αξιολόγηση με έμφαση σε μετρικές υψηλής ευαισθησίας,όπως η ανάκληση (recall) και ο δείκτης AUC. Ιδιαίτερη έμφαση δίνεται στην ερμηνευσιμότητα των μοντέλων, που αποτελεί βασική απαίτηση για την αποδοχή της τεχνητής νοημοσύνης στον ιατρικό τομέα. Για τον σκοπό αυτό, εφαρμόζονται δύο σύγχρονες τεχνικές ανάλυσης σημαντικότητας χαρακτηριστικών: η Permutation Feature Importance και η SHAP (SHapley Additive exPlanations), επιτρέποντας τη χαρτογράφηση των πιο καθοριστικών μεταβλητών που επηρεάζουν την εκτίμηση του μοντέλου. Η επιλογή αυτών των εργαλείων επιτρέπει τη σύγκριση διαφορετικών αλγοριθμικών οικογενειών τόσο ως προς την ακρίβεια, όσο και ως προς την ερμηνευσιμότητα και τη δυνατότητα ενσωμάτωσης σε πραγματικά ιατρικά περιβάλλοντα. Η συνεισφορά της παρούσας μελέτης είναι διττή: αφενός, προτείνει μια ολοκληρωμένη μεθοδολογική προσέγγιση για τη διαχείριση και ανάλυση ανισόρροπων ιατρικών δεδομένων, και αφετέρου, προάγει τη σύνδεση των υπολογιστικών ευρημάτων με την υφιστάμενη ιατρική γνώση. Η εργασία φιλοδοξεί να συμβάλει στη διαμόρφωση αξιόπιστων εργαλείων υποστήριξης απόφασης, ενισχύοντας την προληπτική ιατρική και προάγοντας την εφαρμογή διαφανών και ερμηνεύσιμων τεχνολογιών στον χώρο της υγειονομικής περίθαλψης. | el |
| heal.abstract | Type 2 diabetes is one of the most severe and rapidly growing chronic diseases globally, affecting millions of individuals and placing a significant burden on healthcare systems. Early detection and prediction are critical for effective prevention and disease management. In this context, machine learning emerges as a promising approach for developing diagnostic tools that can be utilized in a supportive manner by clinicians and public health institutions. This study focuses on the application and evaluation of machine learning algorithms for the classification of type 2 diabetes, leveraging data from the Behavioral Risk Factor Surveillance System (BRFSS), a real-world, large-scale, and demographically rich medical dataset. Six different classification models are implemented (Logistic Regression, Decision Tree, Random Forest, XGBoost, Support Vector Machine, and Multilayer Perceptron), while the SMOTE technique is employed to address the pronounced class imbalance between positive and negative cases. The methodology includes hyperparameter tuning through grid search and multi-metric evaluation with a focus on sensitivity-oriented metrics such as recall and AUC score. Special emphasis is placed on model interpretability, which is a key requirement for the acceptance of artificial intelligence in the medical domain. To this end, two modern techniques for assessing feature importance are employed: Permutation Feature Importance and SHAP (SHapley Additive exPlanations), enabling the identification of the most influential variables driving model predictions. The use of these tools facilitates a comparative analysis of different algorithmic families not only in terms of performance but also in terms of explainability and their potential integration into real-world clinical practice. The contribution of this study is twofold: it provides a comprehensive methodological framework for managing and analyzing imbalanced medical data, and it strengthens the link between computational findings and existing medical knowledge. The work aims to support the development of reliable decision-support tools, enhancing preventive medicine and promoting the implementation of transparent and interpretable technologies in healthcare environments. | en |
| heal.advisorName | Κουκουβίνος, Χρήστος | el |
| heal.committeeMemberName | Κουκουβίνος, Χρήστος | el |
| heal.committeeMemberName | Βόντα, Φιλία | el |
| heal.committeeMemberName | Καρώνη, Χρυσηίς | el |
| heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών και Φυσικών Επιστημών | el |
| heal.academicPublisherID | ntua | |
| heal.numberOfPages | 88 | |
| heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: