dc.contributor.author | Γαλάτης, Ανδρέας | el |
dc.contributor.author | Galatis, Andreas | en |
dc.date.accessioned | 2024-04-24T09:53:33Z | |
dc.date.available | 2024-04-24T09:53:33Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/59276 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.26972 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Παράγοντες κινδύνου στεφανιαίας νόσου | el |
dc.subject | Αλγόριθμοι επιβλεπόμενης μηχανικής μάθησης | el |
dc.subject | Προεπεξεργασία δεδομένων | el |
dc.subject | Χειρισμός μη ισορροπημένου συνόλου δεδομένων | el |
dc.subject | Ερμηνευσιμότητα μοντέλων μηχανικής μάθησης | el |
dc.subject | Coronary heart disease risk factors | en |
dc.subject | Supervised machine learning algorithms | en |
dc.subject | Data preprocessing | en |
dc.subject | Handling unbalanced dataset | en |
dc.subject | Interpretability of machine learning models | en |
dc.title | Πρόβλεψη εμφάνισης στεφανιαίας νόσου με τη χρήση αλγορίθμων μηχανικής μάθησης. | el |
dc.title | Prediction of coronary heart disease using machine learning algorithms. | en |
heal.type | bachelorThesis | |
heal.classification | Μηχανική μάθηση | el |
heal.classification | Ιατρική | el |
heal.language | el | |
heal.language | en | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2023-11-07 | |
heal.abstract | Στον τομέα της υγείας, η μηχανική μάθηση έχει σημαντικό ρόλο στην ανάλυση μεγάλου όγκου δεδομένων, βοηθώντας τους επαγγελματίες υγείας στη διάγνωση ή πρόληψη ασθενειών. Οι καρδιαγγειακές παθήσεις είναι χρόνιες ασθένειες µε παγκόσμια εξάπλωση και σοβαρές επιπλοκές για τους πάσχοντες και αποτελούν την κύρια αιτία θανάτου παγκοσμίως. Η συχνότερη μεταξύ αυτών είναι η στεφανιαία νόσος. Με στόχο την πρόβλεψη και κατ’ επέκταση την πρόληψη της εµφάνισης στεφανιαίας νόσου και των επιπλοκών της, στην παρούσα εργασία αναπτύχθηκε ερμηνεύσιμο μοντέλο εκτίµησης του κινδύνου εµφάνισης καρδιακής νόσου με την χρήση αλγορίθμων μηχανικής μάθησης. Χρησιμοποιήθηκαν δεδομένα 319.795 ατόμων που συλλέχθηκαν από το Κέντρο Ελέγχου και Πρόληψης Ασθενειών των Η.Π.Α. (CDC) και περιλαμβάνουν 18 χαρακτηριστικά που σχετίζονται με τη γενική υγεία και τις συνήθειες των συμμετεχόντων. Για την αποτελεσματική διαχείριση της µη ισορροπημένης φύσης των δεδομένων διερευνήθηκαν ποικίλες τεχνικές εξισορρόπησής τους. Η ανάπτυξη του μοντέλου υλοποιήθηκε σε γλώσσα προγραμματισμού Python με χρήση των αλγορίθμων K-Nearest Neighbors, Naive Bayes, Logistic Regression, Decision Tree, Random Forest και Multi-layer Perceptron (MLP). Το κάθε μοντέλο αξιολογήθηκε ως προς τη διακριτική του ικανότητα, ενώ οι μέθοδοι ερμηνευσιμότητας Permutation Feature Importance και LIME προσέφεραν πολύτιμες πληροφορίες για την βαρύτητα κάθε χαρακτηριστικού στην πρόβλεψη. Μεταξύ των ανωτέρω μοντέλων τα καλύτερα αποτελέσματα έδωσαν τα μοντέλα με Logistic Regression, Random Forest και MLP με ευαισθησία 81% και ειδικότητα 72%, 71% και 72% αντίστοιχα. | el |
heal.abstract | In the healthcare sector, machine learning has an important role in analyzing big data, helping healthcare professionals to diagnose or prevent diseases. Cardiovascular diseases are chronic diseases with a global prevalence and serious complications for patients and are the leading cause of death worldwide. The most common among them is coronary heart disease. In order to predict and thus prevent the occurrence of coronary artery disease and its complications, an interpretive model for estimating the risk of heart disease using machine learning algorithms was developed in this paper. Data of 319.795 individuals collected from the U.S. Centers for Disease Control and Prevention (CDC) were used regarding 18 characteristics related to the participants' general health and habits. A variety of balancing techniques were explored to effectively manage the unbalanced nature of the data. The model was developed in Python programming language and several supervised learning algorithms were used. Each model was evaluated for its discriminative ability, while the Permutation Feature Importance and LIME interpretability methods provided valuable insights into the weight of each feature in the prediction. Among the models tested, the best results were obtained by the models with Logistic Regression, Random Forest and MLP with sensitivity 81% and specificity 72%, 71% and 72% respectively. | en |
heal.advisorName | Ματσόπουλος, Γιώργος | el |
heal.committeeMemberName | Ματσόπουλος, Γιώργος | el |
heal.committeeMemberName | Παναγόπουλος, Αθανάσιος | el |
heal.committeeMemberName | Τσανάκας, Παναγιώτης | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 111 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: