HEAL DSpace

Speech-based Depression Estimation

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Πυλαρινού, Άρτεμις el
dc.contributor.author Pylarinou, Artemis en
dc.date.accessioned 2026-03-06T05:58:12Z
dc.date.available 2026-03-06T05:58:12Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/63847
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.31542
dc.rights Default License
dc.subject Κατάθλιψη el
dc.subject Ανάλυση Κειμένου el
dc.subject Ανάλυση Ομιλίας el
dc.subject Μηχανική Μάθηση el
dc.subject Αυτόματη Εκτίμηση Κατάθλιψης el
dc.subject Depression en
dc.subject Speech Analysis en
dc.subject Text Analysis en
dc.subject Machine Learning en
dc.subject Automatic Depression Estimation en
dc.title Speech-based Depression Estimation en
dc.contributor.department Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2025-07-03
heal.abstract This thesis focuses on using machine learning to develop objective methods for estimating depression, thus addressing the limitations in current diagnostic practices. The research introduces a novel pipeline for extracting audio features and text embeddings from the DAIC-WOZ dataset. Specifically the PyAudioAnalysis library was utilized for audio feature extraction and GloVe embeddings for text features. A role-based extraction method was implemented to independently process features for the participant and the interviewer, providing insights into the significance of each role in depression estimation and the influence of interaction dynamics on predictive accuracy. In this study machine learning techniques are applied such as Support Vector Machines (SVM) and XGBoost models, to improve depression detection. The primary goal is to identify the most effective combination of features and algorithms that can enhance the accuracy and reliability of depression prediction models. Key findings indicate that text-based features, particularly GloVe embeddings, outperform traditional audio features, achieving an AUC score of 0.74 for text-based models compared to 0.66 for audio-based models. The study also explores balancing techniques, noting that while SMOTE improved model performance, the choice of features remains critical. en
heal.abstract Η παρούσα διπλωματική εστιάζει στη χρήση της μηχανικής μάθησης για την ανάπτυξη αντικειμενικών μεθόδων εκτίμησης της κατάθλιψης, αντιμετωπίζοντας τους περιορισμούς στις τρέχουσες διαγνωστικές πρακτικές. Η έρευνα εισάγει μια καινοτόμο διαδικασία για την εξαγωγή χαρακτηριστικών ήχου και embeddings κειμένου από το σύνολο δε- δομένων DAIC-WOZ. Συγκεκριμένα, η βιβλιοθήκη PyAudioAnalysis χρησιμοποιήθηκε για την εξαγωγή χαρακτηριστικών ήχου και τα GloVe embeddings για τα χαρακτηριστικά κειμένου. Παράλληλα εφαρμόστηκε μια μέθοδος εξαγωγής βάσει ρόλων, με σκοπό την ανεξάρτητη επεξεργασία των χαρακτηριστικών του συμμετέχοντα και του συνεντευκτή, ώστε να αναδειχθεί η σημασία κάθε ρόλου στην εκτίμηση της κατάθλιψης και η επίδραση της δυναμικής της αλληλεπίδρασης στην ακρίβεια της πρόβλεψης. Σε αυτή τη μελέτη εφαρμόζονται τεχνικές μηχανικής μάθησης όπως τα Support Vector Machines (SVM) και τα μοντέλα XGBoost. Ο πρωταρχικός στόχος είναι η αναγνώριση του πιο αποτελεσ- ματικού συνδυασμού χαρακτηριστικών και αλγορίθμων που μπορούν να ενισχύσουν την ακρίβεια και την αξιοπιστία των μοντέλων πρόβλεψης της κατάθλιψης. Τα βασικά ευ- ρήματα δείχνουν ότι τα χαρακτηριστικά βασισμένα στο κείμενο, ιδιαίτερα τα embeddings GloVe, υπερέχουν των παραδοσιακών χαρακτηριστικών ήχου, επιτυγχάνοντας βαθμολογία AUC 0.74 για τα μοντέλα βασισμένα στο κείμενο έναντι 0.66 για τα μοντέλα βασισμένα στον ήχο. Η μελέτη διερευνά επίσης τεχνικές εξισορρόπησης, επισημαίνοντας ότι ενώ η μέθοδος SMOTE βελτίωσε την απόδοση των μοντέλων, η επιλογή των χαρακτηριστικών παραμένει κρίσιμη el
heal.advisorName Στάμου, Γεώργιος
heal.advisorName Γιαννακόπουλος, Θεόδωρος
heal.committeeMemberName Στάμου, Γεώργιος
heal.committeeMemberName Βουλόδημος, Αθανάσιος
heal.committeeMemberName Σταφυλοπάτης, Α.-Γ.
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 107
heal.fullTextAvailability false


Files in this item

This item appears in the following Collection(s)

Show simple item record