Η συγκεκριμένη διπλωματική πραγματεύεται το θέμα της Σύνθεσης φωνής από κείμενο με Στατιστική Μοντελοποίηση Κρυφών Μαρκοβιανών Μοντέλων. Το συγκεκριμένο θέμα εντάσσεται στη συνδυαστική ερευνητική περιοχή της επεξεργασίας φωνής και της αναγνώρισης προτύπων. Σταδιακά στα πρώτ6α κεφάλαια ανλύεται όλο το απαιτούμενο θεωρητικό υπόβαθρο που αφορά το συγκεκριμένο πρόβλημα. Ιδιαίτερη έμφαση δίνεται στη μελέτη και υλοποίηση διαφορετικών vocoders για την επιλογή των κατάλληλων χαρακτηριστικών. Στο τελευταίο Κεφάλαιο περιγράφονται αναλυτικά τα στάδια που ακολουθήθηκαν για την υλοποίηση του συνθέτη φωνής από κείμενο περιλαμβάνοντας και τα πειραματικά αποτελέσματα τα οποία είναι ιδιαίτερα ενθαρρυντικά.
The goal of this Thesis is the study and the implementation of an HMM
Text to Speech Synthesizer. This applications is part of the combinational
research area of Speech Processing and Pattern Recognition. In the
first part the thesis focuses on the theoretical framework of dealing with
the problem of HMM Text to Speech Synthesis. Additionally, there is a
special research on implementing different Vocoders, in order to figure out
which are the best characteristics. Finally, this thesis describes the main
steps of the HMM TTS system implementation, including very encouraging
experimental results.