HEAL DSpace

Cough sound analysis using Deep Learning methods for COVID-19 diagnosis

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ντούρμα, Χριστίνα el
dc.contributor.author Ntourma, Christina en
dc.date.accessioned 2022-04-11T09:39:14Z
dc.date.available 2022-04-11T09:39:14Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/55062
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22760
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Ανίχνευση του COVID-19 el
dc.subject Ταξινόμηση Βήχα el
dc.subject Βαθιά Μηχανική Μάθηση el
dc.subject Ανάλυση Ήχου el
dc.subject Ανάλυση Εικόνας el
dc.subject COVID-19 Screening en
dc.subject Cough Classification el
dc.subject Deep Learning el
dc.subject Audio Analysis el
dc.subject Image Analysis el
dc.title Cough sound analysis using Deep Learning methods for COVID-19 diagnosis en
dc.title Ανάλυση αρχείων ήχου βήχα χρησιμοποιώντας μεθόδους Βαθιάς Μηχανικής Μάθησης για την ανίχνευση του COVID-19 el
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.classification Machine Learning en
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-11-04
heal.abstract COVID-19 (COronaVIrus Disease of 2019), caused by severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2), has been challenging humanity for the past one and a half year. It can cause severe illness and dysfunction in multiple human organs, with many patients finally passing away. Although vaccines have been released and are widely used around the globe, the essential amount of immunity in order for the COVID-19 transmission between people to terminate, has not been reached yet. Ever since the beginning of this pandemic, the frequent testing of large portions of the population played a determinant role in the containment of the spread. However, the two widely used testing methods, Nucleic Acid Amplification Tests (NAATs) and antigen tests are time and fund consuming, obstructing the screening process of large groups of people. Moreover, the transmission of possible cases to health structures involves the risk of contaminating both the personnel and the rest of the patients. The current thesis examines a different screening method, which is both time and cost efficient and does not require the transportation of individuals to health facilities. The method used, leverages the success of Machine Learning and especially Convolutional Neural Networks (CNNs) for the detection of COVID-19 through cough samples recorded by the mobile phone of the user or a web application. The cough samples collected are converted to images and fed into a CNN architecture which is trained to classify them between COVID-19 and non-COVID-19. One of the main challenges of COVID-19 cough classification lies in the fact that cough is a symptom of multiple non-COVID-19 related medical conditions. Moreover, the high imbalance of the available datasets, with the COVID-19 samples being significantly less than the non-COVID-19 samples and the fact that the datasets are crowd-sourced, are two important factors making the current task demanding. That is due to the entailed difficulty of using non clean data, with a ground truth based on the declarations of the users. More specifically, the samples provided by each user may contain sounds of low quality, while the validity of the information relative to the user being positive or negative to COVID- 19 cannot be confirmed. To that end, different methods, architectures and datasets were examined. A 5-fold cross validation approach was used examining different combinations of datasets and architectures. In order to deal with the imbalanced nature of the data, an ensemble learning method was implemented. Since Deep Learning architectures are data "hungry", training them with multiple datasets was also examined, providing the highest classification results with an accuracy of 71.60%. The obtained results certify the ability of detecting COVID-19 infection through cough sounds, but more importantly the ability of using Machine Learning for the diagnosis of respiratory diseases. This could play a determining role in the quicker containment of future pandemics. en
heal.abstract Τον τελευταίο ενάμιση χρόνο η ανθρωπότητα δοκιμάζεται από τον COVID-19 (COronaVIrus Disease of 2019) ο οποίος οφείλεται στον ιό SARS-CoV-2 (severe acute respiratory syndrome coronavirus 2) και μπορεί να προκαλέσει βαριά νόσηση και δυσλειτουργία αρκετών ανθρωπίνων οργάνων, με κάποιους από τους ασθενείς τελικά να καταλήγουν. Παρά τη δημιουργία και ευρεία χρήση των εμβολίων ανά την υφήλιο, δεν έχει επιτευχθεί το απαραίτητο ποσοστό ανοσίας του πληθυσμού ώστε να τερματιστεί η διάδοση της νόσου. Από την αρχή της πανδημίας η συχνή διενέργεια διαγνωστικών test σε μεγάλα τμήματα του πληθυσμού διαδραματίζει καθοριστικό ρόλο στον περιορισμό της διασποράς. Ωστόσο, οι δύο πιο διαδεδομένες μέθοδοι ανίχνευσης, η μοριακή μέθοδος ανάλυσης και η ταχεία ανίχνευση του αντιγόνου του ιού, απαιτούν χρόνο και υψηλό κόστος αποτελώντας τροχοπέδη στην εξέταση μεγάλων πληθυσμιακών τμημάτων. Επιπροσθέτως, η μετακίνηση πιθανών κρουσμάτων σε δομές υγείας για τη διενέργεια των test εμπεριέχει τον κίνδυνο διασποράς του ιού. Η παρούσα διπλωματική εργασία εξετάζει μία διαφο- ρετική μέθοδο ανίχνευσης του COVID-19 η οποία δεν καταναλώνει χρόνο και πόρους και δεν απαιτεί τη μετακίνηση του εξεταζόμενου σε κάποια δομή υγείας. Η συγκεκριμένη μέθοδος εκ- μεταλλεύεται τα πλεονεκτήματα της Μηχανικής Μάθησης και συγκεκριμένα των Συνελικτικών Νευρωνικών Δικτύων για την ανίχνευση του COVID-19 μέσω αρχείων ήχου βήχα που κατα- γράφονται με το μικρόφωνο του κινητού τηλεφώνου του χρήστη ή μέσω κάποιας διαδικτυακής εφαρμογής. Τα εν λόγω αρχεία μετατρέπονται σε εικόνες και δίνονται ως είσοδος σε κάποια αρχιτεκτονική Συνελικτικών Νευρωνικών Δικτύων η οποία εκπαιδεύεται για την ταξινόμηση τους σε COVID-19 και όχι COVID-19. Μία από τις βασικότερες προκλήσεις της ανίχνευσης του COVID-19 μέσω ήχων βήχα έγκειται στο γεγονός ότι ο βήχας αποτελεί σύμπτωμα για πληθώρα ιατρικών παθήσεων μη σχετικών με τον COVID-19. Επιπλέον, τα διαθέσιμα σύνολα δεδομένων δεν είναι ισορροπημένα, με τα δείγματα του COVID-19 να είναι σημαντικά λιγότερα από τα υπόλοιπα. Ταυτόχρονα, τα σύνολα δεδομένων είναι crowd-sourced, δηλαδή ο κάθε χρήστης ηχογραφεί ένα δείγμα βήχα σε κάποια εφαρμογή δηλώνοντας εάν νοσεί ή όχι από COVID-19. Ωστόσο, η χρήση τέτοιου είδους δε- δομένων σε συνδυασμό με την πιθανότητα μη ορθής δήλωσης σχετικά με τη νόσηση ή όχι του χρήστη από COVID-19, καθιστούν το συγκεκριμένο πρόβλημα απαιτητικό, με τα δείγματα που παρέχονται να είναι πιθανώς ηχητικά αρχεία χαμηλής ποιότητας, ενώ ταυτόχρονα η πληροφορία σχετικά με το εάν ο χρήστης είναι θετικός στον COVID-19 δε μπορεί να επιβεβαιωθεί. Για αυτό τον λόγο δημιουργείται η ανάγκη διερεύνησης διαφόρων μεθόδων, αρχιτεκτονικών και συ- νόλων δεδομένων. Για την επίλυση του προβλήματος εφαρμόστηκε η μέθοδος διασταυρούμενης επικύρωσης και συγκεκριμένα μια 5-fold cross validation προσέγγιση, δοκιμάζοντας διαφορε- τικούς συνδυασμούς συνόλων δεδομένων και αρχιτεκτονικών. Για την εξάλειψη των αρνητικών επιπτώσεων της ανισορροπίας των δεδομένων εφαρμόστηκε η μέθοδος συλλογικής μάθησης, ensemble learning, η οποία συνδυάζει τις προβλέψεις μοντέλων εκπαιδευμένων με διαφορετικά υποσύνολα ενός συνόλου δεδομένων. Δεδομένου ότι οι αρχιτεκτονικές Βαθιάς Μάθησης απαι- τούν μεγάλο πλήθος δεδομένων εξετάστηκε η εκπαίδευσή τους με πολλαπλά διαφορετικά σύνολα δεδομένων, το οποίο προσέφερε και τα υψηλότερα αποτελέσματα, με την ακρίβεια του μοντέλου να φτάνει το 71.60%. Τα αποτελέσματα αυτά επιβεβαιώνουν τη δυνατότητα ανίχνευσης του COVID-19 μέσω αρχείων ήχου βήχα, επιβεβαιώνοντας ταυτόχρονα τη δυνατότητα χρήσης της Μηχανικής Μάθησης για την ανίχνευση και άλλων ασθενειών του αναπνευστικού συστήμα- τος, γεγονός που θα μπορούσε να διαδραματίσει καταλυτικό ρόλο στην ταχύτερη αντιμετώπιση μελλοντικών πανδημιών. el
heal.advisorName Νικήτα, Κωνσταντίνα el
heal.committeeMemberName Στάμου, Γιώργος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών el
heal.academicPublisherID ntua
heal.numberOfPages 107 σ.
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα