Το ροχαλητό είναι το κύριο σύμπτωμα του συνδρόμου της αποφρακτικής άπνοιας - υπόπνοιας (Obstructive sleep apnea hypopnea syndrome - OSAHS). Η μέθοδος που χρησιμοποιείται αποκλειστικά μέχρι σήμερα, για διάγνωση του OSAHS, είναι το πολυσωματογράφημα (polysomnogram - PSG) το οποίο είναι χρονοβόρο και οικονομικά ασύμφορο. Σύμφωνα με μελέτες που έχουν γίνει, υπάρχουν ενδείξεις ότι τα ηχητικά σήματα ροχαλητού περιέχουν αρκετή πληροφορία για τη διάγνωση του συνδρόμου.
Σε αυτή την εργασία αναπτύχθηκε στο MATLAB® το πακέτο γραφικού διαδραστικού περιβάλλοντος Snor-Lux, το οποίο περιλαμβάνει αλγορίθμους για αποθορυβοποίηση σημάτων ροχαλητού, κατάτμησή τους σε επιμέρους ροχαλητά και ακολούθως επεξεργασία και εξαγωγή διαφόρων χαρακτηριστικών των σημάτων τόσο στο πεδίο του χρόνου όσο και στο πεδίο της συχνότητας. Σκοπός του πακέτου είναι η χρήση του στην διπλωματική εργασία καθώς και στην υποβοήθηση της αυτόματης διάγνωσης του OSAHS.
Στη συνέχεια χρησιμοποιήθηκαν οι αλγόριθμοι σε δύο επιμέρους μελέτες σε σήματα ροχαλητού που ηχογραφήθηκαν στο Κέντρο Μελέτης Ύπνου του νοσοκομείου Ευαγγελισμός. Η πρώτη μελέτη διεξάγεται από το Κέντρο Μελέτης Ύπνου και αφορά την επίδραση του συνδυασμού ρινικού αποσυμφορητικού και κορτικοστεροειδών σε ασθενείς με OSAHS. Έγινε αποθορυβοποίηση των σημάτων, κατάτμησή τους και εξαγωγή της μέγιστης και μέσης έντασης καθώς και της συχνότητας ροχαλητών ως κριτήρια αξιολόγησης της μελέτης. Η δεύτερη μελέτη αφορά την ικανότητα διάγνωσης του OSAHS μέσω χρονοσυχνοτικών χαρακτηριστικών των σημάτων ροχαλητού. Συγκεκριμένα μελετήθηκε η διαγνωστική ικανότητα των συχνοτήτων φωνοσυντονισμού μεμονωμένων ροχαλητών (formant frequencies F1, F2, F3) και τριών ενδεικτικών συχνοτήτων του φάσματος (μέση συχνότητα f50%, μέγιστη συχνότητα: f90%, και συχνότητα κορυφής fpeak), με τη βοήθεια καμπυλών ROC. Η ομαδοποίηση των εξεταζομένων σε υγιείς - απνοϊκούς έγινε χρησιμοποιώντας δύο διαφορετικές τιμές κατωφλίου AHI (ΑΗΙ ≥ 10 ε/ώ και ΑΗΙ ≥ 15 ε/ώ).
Τα αποτελέσματα έδειξαν ότι για την κατηγοριοποίηση ΑΗΙ ≥ 10 ε/ώ οι συχνότητες F1, f50% και f90% είναι ικανές να διαγνώσουν το OSAHS. Συγκεκριμένα στην ανάλυση ROC για την F1 το κατώφλι διαχωρισμού είναι F1=470 Hz με ευαισθησία 97.7% και ειδικότητα 99.5%, για την f50% το κατώφλι διαχωρισμού είναι f50%=113 Hz με ευαισθησία 96% και ειδικότητα 98% και για την f90% το κατώφλι διαχωρισμού είναι f90%=344 Hz με ευαισθησία 94.5% και ειδικότητα 97%. Οι άλλες τρεις αναλύσεις με κριτήριο διαχωρισμού ΑΗΙ ≥ 10 ε/ώ, καθώς και οι έξι αναλύσεις με κριτήριο διαχωρισμού ΑΗΙ ≥ 15 ε/ώ κρίθηκαν αναξιόπιστες και δεν καταλήγουν σε αξιοποιήσιμο συμπέρασμα.
Μελετώντας τα αποτελέσματα καταλήγουμε στο συμπέρασμα ότι η διάγνωση του OSAHS μέσω χρονοσυχνοτικών χαρακτηριστικών των ακουστικών σημάτων ροχαλητού είναι εφικτή, απαιτεί όμως περαιτέρω μελέτη και ανάλυση μεγαλύτερου όγκου δεδομένων με περισσότερους υγιείς εξεταζόμενους ώστε να γίνει μπορεί να γίνει η σύγκριση των χαρακτηριστικών υγιών και απνοϊκών εξεταζομένων με περισσότερη αξιοπιστία.
Snoring is the primary symptom of obstructive sleep apnea hypopnea syndrome (OSAHS). The gold standard used so far for diagnosing OSAHS is an overnight polysomnogram, which is time consuming and economically expensive. According to studies, there is evidence that snoring sound signals contain enough information and are able to diagnose the syndrome.
In this thesis a Graphical User Interface package was developed in MATLAB®, called Snor-Lux. Snor-Lux includes algorithms for denoising snoring sound signals, partitioning large signals into individual snores, processing them and extracting information concerning both the time and frequency domain. The aim of this package is to be used for the needs of the thesis and to assist the automatic diagnosis of OSAHS.
The algorithms developed where then used in two separate clinic trials, with data from snoring sound signals recorded at the Sleep Center of "Evaggelismos" hospital. The first study is conducted by the Sleep Center and examines the effect of the combination of nasal decongestants and corticosteroids in patients with OSAHS. The signals where initially denoised and segmented. The maximum and average intensity was extracted as well as the snoring frequency as evaluation criteria for the study. The second study examines the diagnostic ability of six time-frequency domain features: the formant frequencies (F1, F2, F3) and three indicative frequencies of the snoring signals' spectrum (mean frequency f50%, maximal frequency f90% and peak frequency fpeak), using ROC curve analysis. The clustering of the examinees into a healthy and an apneic group was performed using two different thresholds for AHI (AHI ≥ 10 e/h and AHI ≥ 15 e/h).
The results for the first clustering (AHI ≥ 10 e/h) where encouraging as frequencies F1, f50% and f90% were found able to diagnose OSAHS. Specifically, the results of the ROC curve analysis for these frequencies are: F1 - Threshold 470 Hz, sensitivity 97.7%, specificity 99.5%, f50% - Threshold 113 Hz, sensitivity 96%, specificity 98%, f90% - Threshold 344 Hz, sensitivity 94.5%, specificity 97%. The ROC curve analysis of the rest three frequencies in the clustering with AHI ≥ 10 e/h as well as all six frequencies in the clustering with AHI ≥ 15 e/h where inconclusive and thus we cannot extract useful information for their diagnostic ability of OSAHS.
The conclusion is that the diagnosis of OSAHS using time-frequency features of snoring sound signals is feasible but requires further study. A larger dataset is required, containing more examinees, especially healthy, so that the comparison of healthy and apneic examinees is more reliable.