HEAL DSpace

Πρόβλεψη εμφάνισης στεφανιαίας νόσου με τη χρήση αλγορίθμων μηχανικής μάθησης.

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Γαλάτης, Ανδρέας el
dc.contributor.author Galatis, Andreas en
dc.date.accessioned 2024-04-24T09:53:33Z
dc.date.available 2024-04-24T09:53:33Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/59276
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.26972
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Παράγοντες κινδύνου στεφανιαίας νόσου el
dc.subject Αλγόριθμοι επιβλεπόμενης μηχανικής μάθησης el
dc.subject Προεπεξεργασία δεδομένων el
dc.subject Χειρισμός μη ισορροπημένου συνόλου δεδομένων el
dc.subject Ερμηνευσιμότητα μοντέλων μηχανικής μάθησης el
dc.subject Coronary heart disease risk factors en
dc.subject Supervised machine learning algorithms en
dc.subject Data preprocessing en
dc.subject Handling unbalanced dataset en
dc.subject Interpretability of machine learning models en
dc.title Πρόβλεψη εμφάνισης στεφανιαίας νόσου με τη χρήση αλγορίθμων μηχανικής μάθησης. el
dc.title Prediction of coronary heart disease using machine learning algorithms. en
heal.type bachelorThesis
heal.classification Μηχανική μάθηση el
heal.classification Ιατρική el
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-11-07
heal.abstract Στον τομέα της υγείας, η μηχανική μάθηση έχει σημαντικό ρόλο στην ανάλυση μεγάλου όγκου δεδομένων, βοηθώντας τους επαγγελματίες υγείας στη διάγνωση ή πρόληψη ασθενειών. Οι καρδιαγγειακές παθήσεις είναι χρόνιες ασθένειες µε παγκόσμια εξάπλωση και σοβαρές επιπλοκές για τους πάσχοντες και αποτελούν την κύρια αιτία θανάτου παγκοσμίως. Η συχνότερη μεταξύ αυτών είναι η στεφανιαία νόσος. Με στόχο την πρόβλεψη και κατ’ επέκταση την πρόληψη της εµφάνισης στεφανιαίας νόσου και των επιπλοκών της, στην παρούσα εργασία αναπτύχθηκε ερμηνεύσιμο μοντέλο εκτίµησης του κινδύνου εµφάνισης καρδιακής νόσου με την χρήση αλγορίθμων μηχανικής μάθησης. Χρησιμοποιήθηκαν δεδομένα 319.795 ατόμων που συλλέχθηκαν από το Κέντρο Ελέγχου και Πρόληψης Ασθενειών των Η.Π.Α. (CDC) και περιλαμβάνουν 18 χαρακτηριστικά που σχετίζονται με τη γενική υγεία και τις συνήθειες των συμμετεχόντων. Για την αποτελεσματική διαχείριση της µη ισορροπημένης φύσης των δεδομένων διερευνήθηκαν ποικίλες τεχνικές εξισορρόπησής τους. Η ανάπτυξη του μοντέλου υλοποιήθηκε σε γλώσσα προγραμματισμού Python με χρήση των αλγορίθμων K-Nearest Neighbors, Naive Bayes, Logistic Regression, Decision Tree, Random Forest και Multi-layer Perceptron (MLP). Το κάθε μοντέλο αξιολογήθηκε ως προς τη διακριτική του ικανότητα, ενώ οι μέθοδοι ερμηνευσιμότητας Permutation Feature Importance και LIME προσέφεραν πολύτιμες πληροφορίες για την βαρύτητα κάθε χαρακτηριστικού στην πρόβλεψη. Μεταξύ των ανωτέρω μοντέλων τα καλύτερα αποτελέσματα έδωσαν τα μοντέλα με Logistic Regression, Random Forest και MLP με ευαισθησία 81% και ειδικότητα 72%, 71% και 72% αντίστοιχα. el
heal.abstract In the healthcare sector, machine learning has an important role in analyzing big data, helping healthcare professionals to diagnose or prevent diseases. Cardiovascular diseases are chronic diseases with a global prevalence and serious complications for patients and are the leading cause of death worldwide. The most common among them is coronary heart disease. In order to predict and thus prevent the occurrence of coronary artery disease and its complications, an interpretive model for estimating the risk of heart disease using machine learning algorithms was developed in this paper. Data of 319.795 individuals collected from the U.S. Centers for Disease Control and Prevention (CDC) were used regarding 18 characteristics related to the participants' general health and habits. A variety of balancing techniques were explored to effectively manage the unbalanced nature of the data. The model was developed in Python programming language and several supervised learning algorithms were used. Each model was evaluated for its discriminative ability, while the Permutation Feature Importance and LIME interpretability methods provided valuable insights into the weight of each feature in the prediction. Among the models tested, the best results were obtained by the models with Logistic Regression, Random Forest and MLP with sensitivity 81% and specificity 72%, 71% and 72% respectively. en
heal.advisorName Ματσόπουλος, Γιώργος el
heal.committeeMemberName Ματσόπουλος, Γιώργος el
heal.committeeMemberName Παναγόπουλος, Αθανάσιος el
heal.committeeMemberName Τσανάκας, Παναγιώτης el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών el
heal.academicPublisherID ntua
heal.numberOfPages 111 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα