HEAL DSpace

Στατιστική Επεξεργασία Σήματος Ομιλίας με Εφαρμογή στο Διαχωρισμό Ομιλητών

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Βόντα, Φιλία el
dc.contributor.author Σιαντίκος, Γεώργιος Α. el
dc.contributor.author Siantikos, Georgios A. en
dc.date.accessioned 2014-05-05T07:51:07Z
dc.date.available 2014-05-05T07:51:07Z
dc.date.copyright 2014-01-07 -
dc.date.issued 2014-05-05
dc.date.submitted 2014-01-07 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/38386
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.7048
dc.description 121 σ. el
dc.description.abstract Σε αυτή την εργασία περιγράφονται βασικές μέθοδοι επεξεργασίας ομιλίας, καθώς και τεχνικές που χρησιμοποιούνται σε μία από τις κύριες εφαρμογές της, το Διαχωρισμό Ομιλητών, όπου καλούμαστε να απαντήσουμε στο ερώτημα ”ποιος μίλησε πότε;”. Παρουσιάζονται τεχνικές που έχουν χρησιμοποιηθεί στο παρελθόν, ενώ σημείο αναφοράς είναι μία από τις πιο πρόσφατες μεθόδους που αναπτύ- χθηκε τα τελευταία χρόνια στο ΕΚΕΦΕ Δημόκριτος. Παράλληλα με τη συγγραφή του κειμένου, αναπτύχθηκε και το σχετικό λογισμικό diarx σε γλώσσα C++, με το οποίο έγιναν δοκιμές σε αρχεία της βιβλιοθήκης του Canal9. Τμήματά του μπορούν να βρεθούν στην ηλεκτρονική διεύθυνση (αποθετήριο git) https://gntikos@bitbucket.org/gntikos/diarx.git el
dc.description.abstract We describe some basic techniques for speech processing and one of its main applications, Speaker Diarization, where we try to answer the question ”who spoke when?”. We present some techniques traditionally used for this task, while we focus on a state-of-the-art diarization method developed in IIT Demokritos during the last years. We also developed the relevant software diarx in C++ language, which was used to test the method in real-world speech content taken from the Canal9 corpus. Parts of the software are available through its git repository https://gntikos@bitbucket.org/gntikos/diarx.git en
dc.description.statementofresponsibility Γεώργιος Α. Σιαντίκος el
dc.language.iso el en
dc.rights ETDRestricted-policy.xml en
dc.subject Επεξεργασία Ομιλίας el
dc.subject Διαχωρισμός Ομιλητών el
dc.subject Υπόχωρος Χαρακτηριστικών el
dc.subject Γραμμική Διαχωριστική Ανάλυση el
dc.subject Ομαδοποίηση el
dc.subject Speech Processing en
dc.subject Speaker Diarization en
dc.subject Feature Subspace en
dc.subject Linear Discriminant Analysis en
dc.subject Clustering en
dc.title Στατιστική Επεξεργασία Σήματος Ομιλίας με Εφαρμογή στο Διαχωρισμό Ομιλητών el
dc.title.alternative Statistical Speech Processing with Application to Speaker Diarization en
dc.type bachelorThesis el (en)
dc.date.accepted 2014-01-07 -
dc.date.modified 2014-01-07 -
dc.contributor.advisorcommitteemember Καραγρηγορίου, Αλέξανδρος el
dc.contributor.advisorcommitteemember Κουκουβίνος, Χρήστος el
dc.contributor.committeemember Βόντα, Φιλία el
dc.contributor.committeemember Καραγρηγορίου, Αλέξανδρος el
dc.contributor.committeemember Κουκουβίνος, Χρήστος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών & Φυσικών Επιστημών el
dc.date.recordmanipulation.recordcreated 2014-05-05 -
dc.date.recordmanipulation.recordmodified 2014-05-05 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής