dc.contributor.advisor |
Βόντα, Φιλία |
el |
dc.contributor.author |
Σιαντίκος, Γεώργιος Α.
|
el |
dc.contributor.author |
Siantikos, Georgios A.
|
en |
dc.date.accessioned |
2014-05-05T07:51:07Z |
|
dc.date.available |
2014-05-05T07:51:07Z |
|
dc.date.copyright |
2014-01-07 |
- |
dc.date.issued |
2014-05-05 |
|
dc.date.submitted |
2014-01-07 |
- |
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/38386 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.7048 |
|
dc.description |
121 σ. |
el |
dc.description.abstract |
Σε αυτή την εργασία περιγράφονται βασικές μέθοδοι επεξεργασίας ομιλίας,
καθώς και τεχνικές που χρησιμοποιούνται σε μία από τις κύριες εφαρμογές της,
το Διαχωρισμό Ομιλητών, όπου καλούμαστε να απαντήσουμε στο ερώτημα ”ποιος
μίλησε πότε;”. Παρουσιάζονται τεχνικές που έχουν χρησιμοποιηθεί στο παρελθόν,
ενώ σημείο αναφοράς είναι μία από τις πιο πρόσφατες μεθόδους που αναπτύ-
χθηκε τα τελευταία χρόνια στο ΕΚΕΦΕ Δημόκριτος. Παράλληλα με τη συγγραφή
του κειμένου, αναπτύχθηκε και το σχετικό λογισμικό diarx σε γλώσσα C++, με
το οποίο έγιναν δοκιμές σε αρχεία της βιβλιοθήκης του Canal9. Τμήματά του
μπορούν να βρεθούν στην ηλεκτρονική διεύθυνση (αποθετήριο git)
https://gntikos@bitbucket.org/gntikos/diarx.git |
el |
dc.description.abstract |
We describe some basic techniques for speech processing and one of its main
applications, Speaker Diarization, where we try to answer the question ”who spoke
when?”. We present some techniques traditionally used for this task, while we focus on
a state-of-the-art diarization method developed in IIT Demokritos during the last years.
We also developed the relevant software diarx in C++ language, which was used to
test the method in real-world speech content taken from the Canal9 corpus. Parts of
the software are available through its git repository
https://gntikos@bitbucket.org/gntikos/diarx.git |
en |
dc.description.statementofresponsibility |
Γεώργιος Α. Σιαντίκος |
el |
dc.language.iso |
el |
en |
dc.rights |
ETDRestricted-policy.xml |
en |
dc.subject |
Επεξεργασία Ομιλίας |
el |
dc.subject |
Διαχωρισμός Ομιλητών |
el |
dc.subject |
Υπόχωρος Χαρακτηριστικών |
el |
dc.subject |
Γραμμική Διαχωριστική Ανάλυση |
el |
dc.subject |
Ομαδοποίηση |
el |
dc.subject |
Speech Processing |
en |
dc.subject |
Speaker Diarization |
en |
dc.subject |
Feature Subspace |
en |
dc.subject |
Linear Discriminant Analysis |
en |
dc.subject |
Clustering |
en |
dc.title |
Στατιστική Επεξεργασία Σήματος Ομιλίας με Εφαρμογή στο Διαχωρισμό Ομιλητών |
el |
dc.title.alternative |
Statistical Speech Processing with Application to Speaker Diarization |
en |
dc.type |
bachelorThesis |
el (en) |
dc.date.accepted |
2014-01-07 |
- |
dc.date.modified |
2014-01-07 |
- |
dc.contributor.advisorcommitteemember |
Καραγρηγορίου, Αλέξανδρος |
el |
dc.contributor.advisorcommitteemember |
Κουκουβίνος, Χρήστος |
el |
dc.contributor.committeemember |
Βόντα, Φιλία |
el |
dc.contributor.committeemember |
Καραγρηγορίου, Αλέξανδρος |
el |
dc.contributor.committeemember |
Κουκουβίνος, Χρήστος |
el |
dc.contributor.department |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Εφαρμοσμένων Μαθηματικών & Φυσικών Επιστημών |
el |
dc.date.recordmanipulation.recordcreated |
2014-05-05 |
- |
dc.date.recordmanipulation.recordmodified |
2014-05-05 |
- |