Σε αυτή την εργασία περιγράφονται βασικές μέθοδοι επεξεργασίας ομιλίας,
καθώς και τεχνικές που χρησιμοποιούνται σε μία από τις κύριες εφαρμογές της,
το Διαχωρισμό Ομιλητών, όπου καλούμαστε να απαντήσουμε στο ερώτημα ”ποιος
μίλησε πότε;”. Παρουσιάζονται τεχνικές που έχουν χρησιμοποιηθεί στο παρελθόν,
ενώ σημείο αναφοράς είναι μία από τις πιο πρόσφατες μεθόδους που αναπτύ-
χθηκε τα τελευταία χρόνια στο ΕΚΕΦΕ Δημόκριτος. Παράλληλα με τη συγγραφή
του κειμένου, αναπτύχθηκε και το σχετικό λογισμικό diarx σε γλώσσα C++, με
το οποίο έγιναν δοκιμές σε αρχεία της βιβλιοθήκης του Canal9. Τμήματά του
μπορούν να βρεθούν στην ηλεκτρονική διεύθυνση (αποθετήριο git)
https://gntikos@bitbucket.org/gntikos/diarx.git
We describe some basic techniques for speech processing and one of its main
applications, Speaker Diarization, where we try to answer the question ”who spoke
when?”. We present some techniques traditionally used for this task, while we focus on
a state-of-the-art diarization method developed in IIT Demokritos during the last years.
We also developed the relevant software diarx in C++ language, which was used to
test the method in real-world speech content taken from the Canal9 corpus. Parts of
the software are available through its git repository
https://gntikos@bitbucket.org/gntikos/diarx.git