HEAL DSpace

Πρόγνωση covid-19 με χρήση μηχανικής μάθησης σε αξονικές στήθους

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ζερκελίδης, Δημήτριος el
dc.contributor.author Zerkelidis, Dimitrios en
dc.date.accessioned 2021-06-02T08:04:18Z
dc.date.available 2021-06-02T08:04:18Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/53537
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.21235
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση" el
dc.rights Default License
dc.subject Αξονικές στήθους el
dc.subject Μηχανικη μάθηση el
dc.subject Κατάτμηση πνευμόνων el
dc.subject Κορωνοϊός el
dc.subject Εξαγωγή χαρακτηριστικών el
dc.subject Computed Tomography en
dc.subject Δυαδική ταξινόμηση el
dc.subject Πρόγνωση el
dc.subject Επιβλεπόμενη μάθηση el
dc.subject Μη επιβλεπόμενη μάθηση el
dc.subject Ανίχνευση ανωμαλιών el
dc.subject Μη ισορροποημένο σύνολο δεδομένων el
dc.subject Περιοχή ενδιαφέροντος el
dc.subject Binary classification en
dc.subject Επαύξηση δεδομένων el
dc.subject Data augmentation en
dc.subject Anomaly Detetction en
dc.subject Region of interest en
dc.subject Imbalanced dataset en
dc.subject AUROC en
dc.subject F1-score en
dc.subject Machine learning en
dc.subject Feature extraction en
dc.subject Lung segmentation en
dc.subject Supevised learning en
dc.subject Unsupervised learning en
dc.subject Prediction en
dc.title Πρόγνωση covid-19 με χρήση μηχανικής μάθησης σε αξονικές στήθους el
dc.title Covid-19 prediction using machine learning on ct scans en
dc.contributor.department Bio-Medical Imaging Group el
heal.type bachelorThesis
heal.classification Μηχανική μάθηση el
heal.classification Τεχνητή νοημοσύνη el
heal.classification Machine learning en
heal.classification Artificial Intelligence en
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-04-15
heal.abstract In 2020 our world and peoples’ lives changed rapidly due to Corona Virus Disease 19 (Covid-19). The virus was able to spread very fast, forcing the World Health Organisation (WHO) to declare the new disease as a pandemic. As a result, a vast need, for immediate detection of patients that ail from Covid-19, was created very soon. Current tests are usually slow, expensive and prone to mistake. In this endeavor, a dataset from CT scans is collected, which is DICOM image series of each patient. This dataset is consisted of people that tested either positive or negative to Covid-19. At the very beginning, while having the DICOM image series from our patients, a lung-segmentation algorithm is implemented. The algorithm that is chosen for extracting the lung area is multiple thresholding. Also, gaussian smoothing and hole filling is used. Hence, only the Region-Of- Interest (ROI) is used which is the patient’s lung area. This will work as a mask for the real image. Later, this thesis focuses on extracting features in the Region Of Interest (ROI) of the CT scans using medical image processing algorithms. These features can be divided into the next categories: 1)First Order Statistics, 2)GLCM, 3)3D-Shape, 4) GLSZM, 5)GLRLM, 6)NGTDM and 7)GLDM. In the next stage, feature selection is applied to identify the best subset of features that can predict the existence of Covid-19 to a patient. After feature extraction, both supervised and unsupervised machine learning algorithms are implemented for patients’ binary classification is conducted. Supervised methods such as Support Vector Machines, K Nearest Neighbors, Decision Trees with bagging and boosting methods are used. On the other side, as unsupervised models, Isolation Forests, Local Outlier Factor and Auto-encoders with threshold on reconstruction error will be tested. In the unsupervised case, the problem is viewed as anomaly detection because of the high imbalance between the classes. Our metric evaluation will be based on AUROC scores, sensitivity, specificity and F1-score, since our dataset is highly imbalanced. For that reason data augmentation techniques will be tested too. Finally, the features with the best clinical impact will be mentioned. en
heal.abstract Το 2020 ο κόσμος και οι ζωές των ανθρώπων άλλαξαν ραγδαία λόγω της ασθένειας κορωνοϊού 19(Covid-19). Ο ιός μπόρεσε να εξαπλωθεί πολύ γρήγορα, αναγκάζοντας τον Παγκόσμιο Οργανισμό Υγείας (ΠΟΥ) να κηρύξει τη νέα ασθένεια ως πανδημία. Ως αποτέλεσμα, μια τεράστια ανάγκη, για άμεση ανίχνευση ασθενών από τον Covid-19, δημιουργήθηκε πολύ σύντομα. Οι τρέχουσες δοκιμές είναι συνήθως αργές, ακριβές και επιρρεπείς στο σφάλμα. Στην προσπά- θειά αυτή, έχουν συλλεχθεί αξονικές θώρακος, οι οποίες είναι DICOM σειρές εικόνων του κάθε ασθενή. Αυτό το σύνολο δεδομένων αποτελεί- ται από άτομα που έχουν επισημανθεί είτε θετικά είτε αρνητικά στον κορωνοϊό (Covid-19). Στην αρχή, έχοντας ως δεδομένα τις σειρές εικόνων DICOM από τους ασθενείς μας, εφαρμόζεται ένας αλγόριθμο τμηματοποίησης πνευ- μόνων. O αλγόριθμος που επιλέχθηκε για την εξαγωγή της περιοχής των πνευμόνων από τις εικόνες ήταν με χρήση πολλαπλών κατωφλιών. Επί- σης, έγινε χρήση των μεθόδων gaussian smoothing και hole filling. Ως εκ τούτου, λαμβάνονται μόνο οι περιοχές ενδιαφέροντος (ROIs) που είναι η περιοχή των πνευμόνων του ασθενούς. Η περιοχή ενδιαφέροντος θα λειτουργήσει ως μάσκα στην πραγματική εικόνα. Στη συνέχεια, για την εξαγωγή χαρακτηριστικών στην περιοχή εν- διαφέροντος (ROI) από τις αξονικές θώρακος χρησιμοποιούνται ιατρικοί αλγόριθμοι επεξεργασίας εικόνας. Οι αλγόριθμοι αυτοί δίνουν τις εξής κατηγορίες χαρακτηριστικών: 1)First Order Statistics, 2)GLCM, 3)3DShape, 4) GLSZM, 5)GLRLM, 6)NGTDM και 7)GLDM. Στο επόμενο στά- διο, η επιλογή χαρακτηριστικών εφαρμόζεται για τον προσδιορισμό του καλύτερου υποσυνόλου αυτών των χαρακτηριστικών, που μπορούν να προβλέψουν την ύπαρξη του Covid-19 σε ένα ασθενή. Έπειτα από την εξαγωγή των χαρακτηριστικών, εφαρμόζονται αλ- γόριθμοι, επιβλεπόμενης και μη επιβλεπόμενης μάθησης για τη δυα- δική ταξινόμηση των ασθενών. Μέθοδοι επιβλεπόμενης μάθησης επι- στρατεύονται όπως οι αλγόριθμοι, Support Vector Machines, Κ Nearest Neighbor, Decision Trees με μεθόδους bagging ή boosting. Από την άλλη πλευρά, ως μη επιβλεπόμενης μάθησης μέθοδοι αλγόριθμοι όπως, Isolation Forests, Local Outlier Factor και Aυτοκωδικοποιητές με χρήση κατωφλιού το reconstruction error θα δοκιμαστούν. Στην περίπτωση των μη επιβλεπόμενων μεθόδων, το πρόβλημα αντιμετωπίζεται ως πρόβλημα ανίχνευσης ανωμαλιών λόγω της μεγάλης ανισσότητας των κλάσεων. H αξιολόγηση των προγνωστικών μοντέλων θα βασιστούν στις με- τρικές AUROC, ευαισθησία (sensitivity), ειδικότητα (specificity), F1-σκορ, καθώς τα δεδομένα μας χαρακτηρίζονται από μεγάλη ανισορροπία. Για το λόγο αυτό θα δοκιμαστούν κάποιες τεχνικές επαύξησης δεδομένων. el
heal.advisorName Ματσόπουλος, Γεώργιος el
heal.advisorName Matsopoulos, Georgios en
heal.committeeMemberName Ματσόπουλος, Γεώργιος el
heal.committeeMemberName Κουτσούρης, Δημήτριος el
heal.committeeMemberName Τσανάκας, Παναγιώτης el
heal.committeeMemberName Matsopoulos, Georgios en
heal.committeeMemberName Koutsouris, Dimitrios en
heal.committeeMemberName Tsanakas, Panagiotis en
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 141 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής