dc.contributor.author |
Ζερκελίδης, Δημήτριος
|
el |
dc.contributor.author |
Zerkelidis, Dimitrios
|
en |
dc.date.accessioned |
2021-06-02T08:04:18Z |
|
dc.date.available |
2021-06-02T08:04:18Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/53537 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.21235 |
|
dc.description |
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση" |
el |
dc.rights |
Default License |
|
dc.subject |
Αξονικές στήθους |
el |
dc.subject |
Μηχανικη μάθηση |
el |
dc.subject |
Κατάτμηση πνευμόνων |
el |
dc.subject |
Κορωνοϊός |
el |
dc.subject |
Εξαγωγή χαρακτηριστικών |
el |
dc.subject |
Computed Tomography |
en |
dc.subject |
Δυαδική ταξινόμηση |
el |
dc.subject |
Πρόγνωση |
el |
dc.subject |
Επιβλεπόμενη μάθηση |
el |
dc.subject |
Μη επιβλεπόμενη μάθηση |
el |
dc.subject |
Ανίχνευση ανωμαλιών |
el |
dc.subject |
Μη ισορροποημένο σύνολο δεδομένων |
el |
dc.subject |
Περιοχή ενδιαφέροντος |
el |
dc.subject |
Binary classification |
en |
dc.subject |
Επαύξηση δεδομένων |
el |
dc.subject |
Data augmentation |
en |
dc.subject |
Anomaly Detetction |
en |
dc.subject |
Region of interest |
en |
dc.subject |
Imbalanced dataset |
en |
dc.subject |
AUROC |
en |
dc.subject |
F1-score |
en |
dc.subject |
Machine learning |
en |
dc.subject |
Feature extraction |
en |
dc.subject |
Lung segmentation |
en |
dc.subject |
Supevised learning |
en |
dc.subject |
Unsupervised learning |
en |
dc.subject |
Prediction |
en |
dc.title |
Πρόγνωση covid-19 με χρήση μηχανικής μάθησης σε αξονικές στήθους |
el |
dc.title |
Covid-19 prediction using machine learning on ct scans |
en |
dc.contributor.department |
Bio-Medical Imaging Group |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Μηχανική μάθηση |
el |
heal.classification |
Τεχνητή νοημοσύνη |
el |
heal.classification |
Machine learning |
en |
heal.classification |
Artificial Intelligence |
en |
heal.language |
en |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2021-04-15 |
|
heal.abstract |
In 2020 our world and peoples’ lives changed rapidly due to Corona
Virus Disease 19 (Covid-19). The virus was able to spread very fast,
forcing the World Health Organisation (WHO) to declare the new disease
as a pandemic.
As a result, a vast need, for immediate detection of patients that ail
from Covid-19, was created very soon. Current tests are usually slow,
expensive and prone to mistake. In this endeavor, a dataset from CT
scans is collected, which is DICOM image series of each patient. This
dataset is consisted of people that tested either positive or negative to
Covid-19.
At the very beginning, while having the DICOM image series from
our patients, a lung-segmentation algorithm is implemented. The algorithm
that is chosen for extracting the lung area is multiple thresholding. Also,
gaussian smoothing and hole filling is used. Hence, only the Region-Of-
Interest (ROI) is used which is the patient’s lung area. This will work as
a mask for the real image.
Later, this thesis focuses on extracting features in the Region Of
Interest (ROI) of the CT scans using medical image processing algorithms.
These features can be divided into the next categories: 1)First Order
Statistics, 2)GLCM, 3)3D-Shape, 4) GLSZM, 5)GLRLM, 6)NGTDM and
7)GLDM. In the next stage, feature selection is applied to identify the best
subset of features that can predict the existence of Covid-19 to a patient.
After feature extraction, both supervised and unsupervised machine
learning algorithms are implemented for patients’ binary classification
is conducted. Supervised methods such as Support Vector Machines, K
Nearest Neighbors, Decision Trees with bagging and boosting methods
are used. On the other side, as unsupervised models, Isolation Forests,
Local Outlier Factor and Auto-encoders with threshold on reconstruction
error will be tested. In the unsupervised case, the problem is viewed as
anomaly detection because of the high imbalance between the classes.
Our metric evaluation will be based on AUROC scores, sensitivity,
specificity and F1-score, since our dataset is highly imbalanced. For that
reason data augmentation techniques will be tested too. Finally, the
features with the best clinical impact will be mentioned. |
en |
heal.abstract |
Το 2020 ο κόσμος και οι ζωές των ανθρώπων άλλαξαν ραγδαία λόγω της ασθένειας κορωνοϊού 19(Covid-19). Ο ιός μπόρεσε να εξαπλωθεί πολύ γρήγορα, αναγκάζοντας τον Παγκόσμιο Οργανισμό Υγείας (ΠΟΥ) να κηρύξει τη νέα ασθένεια ως πανδημία. Ως αποτέλεσμα, μια τεράστια ανάγκη, για άμεση ανίχνευση ασθενών από τον Covid-19, δημιουργήθηκε πολύ σύντομα. Οι τρέχουσες δοκιμές είναι συνήθως αργές, ακριβές και επιρρεπείς στο σφάλμα. Στην προσπά- θειά αυτή, έχουν συλλεχθεί αξονικές θώρακος, οι οποίες είναι DICOM σειρές εικόνων του κάθε ασθενή. Αυτό το σύνολο δεδομένων αποτελεί- ται από άτομα που έχουν επισημανθεί είτε θετικά είτε αρνητικά στον κορωνοϊό (Covid-19). Στην αρχή, έχοντας ως δεδομένα τις σειρές εικόνων DICOM από τους ασθενείς μας, εφαρμόζεται ένας αλγόριθμο τμηματοποίησης πνευ- μόνων. O αλγόριθμος που επιλέχθηκε για την εξαγωγή της περιοχής των πνευμόνων από τις εικόνες ήταν με χρήση πολλαπλών κατωφλιών. Επί- σης, έγινε χρήση των μεθόδων gaussian smoothing και hole filling. Ως εκ τούτου, λαμβάνονται μόνο οι περιοχές ενδιαφέροντος (ROIs) που είναι η περιοχή των πνευμόνων του ασθενούς. Η περιοχή ενδιαφέροντος θα λειτουργήσει ως μάσκα στην πραγματική εικόνα. Στη συνέχεια, για την εξαγωγή χαρακτηριστικών στην περιοχή εν- διαφέροντος (ROI) από τις αξονικές θώρακος χρησιμοποιούνται ιατρικοί αλγόριθμοι επεξεργασίας εικόνας. Οι αλγόριθμοι αυτοί δίνουν τις εξής κατηγορίες χαρακτηριστικών: 1)First Order Statistics, 2)GLCM, 3)3DShape, 4) GLSZM, 5)GLRLM, 6)NGTDM και 7)GLDM. Στο επόμενο στά- διο, η επιλογή χαρακτηριστικών εφαρμόζεται για τον προσδιορισμό του καλύτερου υποσυνόλου αυτών των χαρακτηριστικών, που μπορούν να προβλέψουν την ύπαρξη του Covid-19 σε ένα ασθενή. Έπειτα από την εξαγωγή των χαρακτηριστικών, εφαρμόζονται αλ- γόριθμοι, επιβλεπόμενης και μη επιβλεπόμενης μάθησης για τη δυα- δική ταξινόμηση των ασθενών. Μέθοδοι επιβλεπόμενης μάθησης επι- στρατεύονται όπως οι αλγόριθμοι, Support Vector Machines, Κ Nearest Neighbor, Decision Trees με μεθόδους bagging ή boosting. Από την άλλη πλευρά, ως μη επιβλεπόμενης μάθησης μέθοδοι αλγόριθμοι όπως, Isolation Forests, Local Outlier Factor και Aυτοκωδικοποιητές με χρήση κατωφλιού το reconstruction error θα δοκιμαστούν. Στην περίπτωση των μη επιβλεπόμενων μεθόδων, το πρόβλημα αντιμετωπίζεται ως πρόβλημα ανίχνευσης ανωμαλιών λόγω της μεγάλης ανισσότητας των κλάσεων. H αξιολόγηση των προγνωστικών μοντέλων θα βασιστούν στις με- τρικές AUROC, ευαισθησία (sensitivity), ειδικότητα (specificity), F1-σκορ, καθώς τα δεδομένα μας χαρακτηρίζονται από μεγάλη ανισορροπία. Για το λόγο αυτό θα δοκιμαστούν κάποιες τεχνικές επαύξησης δεδομένων. |
el |
heal.advisorName |
Ματσόπουλος, Γεώργιος |
el |
heal.advisorName |
Matsopoulos, Georgios |
en |
heal.committeeMemberName |
Ματσόπουλος, Γεώργιος |
el |
heal.committeeMemberName |
Κουτσούρης, Δημήτριος |
el |
heal.committeeMemberName |
Τσανάκας, Παναγιώτης |
el |
heal.committeeMemberName |
Matsopoulos, Georgios |
en |
heal.committeeMemberName |
Koutsouris, Dimitrios |
en |
heal.committeeMemberName |
Tsanakas, Panagiotis |
en |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
141 σ. |
el |
heal.fullTextAvailability |
false |
|