dc.contributor.author | Κουρεμένος, Δημήτρης | el |
dc.contributor.author | Kouremenos, Dimitris | en |
dc.date.accessioned | 2021-02-02T09:08:20Z | |
dc.date.available | 2021-02-02T09:08:20Z | |
dc.date.issued | 2021-02-02 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/52849 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.20547 | |
dc.description.abstract | Η παρούσα διατριβή τοποθετείται στο πλαίσιο της αυτόματης Μηχανικής Μετάφρασης, στην διαπροσωπίας ανθρώπου και μηχανής για τα άτομα με προβλήματα ακοής κάνοντας χρήση την γλώσσα των Κωφών, τηn Ελληνική Νοηματική Γλώσσα. Σε αυτή τη εργασία παρουσιάζουμε ένα πρωτότυπο σύστημα βασισμένο σε κανόνες μηχανικής μετάφρασης με σκοπό τη δημιουργία μεγάλων παράλληλων εύρωστων γραπτών σωμάτων ελληνικού κειμένου και της Ελληνικής Νοηματικής Γλώσσας κάνοντας χρήση της Σύντομης Μεταγραφής της Ελληνικής Νοηματικής Γλώσσας (ΣΜΕΝΓ) (text glosses). Στη συνέχεια, τα σώματα κειμένου χρησιμοποιούνται ως δεδομένα κατάρτισης για την παραγωγή / δημιουργία γλωσσικών μοντέλων ν-γραμμάτων (n-gram Language Model). Επίσης χρησιμοποιούνται και ως δεδομένα εκπαίδευσης για το σύστημα MOSES Στατιστικής Μηχανικής Μετάφρασης. Πρέπει να σημειωθεί ότι όλη η διαδικασία είναι ισχυρή και ευέλικτη, καθώς δεν απαιτεί βαθιά γνώση γραμματικής της ΕΝΓ. Στην εργασία μας παρουσιάζουμε μετρήσεις χρονικές εκτιμήσεις για την δημιουργία των γλωσσικών πόρων, αξιολογούμε τα γλωσσικά μοντέλα της ΕΝΓ μέσω της περιπλοκής και τέλος χρησιμοποιώντας τη μετρική βαθμολογία BiLingual Understudy Assessment (BLEU) για την αξιολόγηση της μηχανικής μετάφρασης, το πρωτότυπο σύστημα MT μας επιτυγχάνει ελπιδοφόρες επιδόσεις και συγκεκριμένα μια μέση βαθμολογία 60,53% και 85,1% / 65,5% / 53,8% / 44,8% για 1-gram / 2 -gram / 3-gram / 4-gram. | el |
dc.rights | Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/gr/ | * |
dc.subject | Στατιστική μηχανική μετάφραση | el |
dc.subject | Ελληνική γλώσσα | el |
dc.subject | Ελληνική νοηματική γλώσσα (ΕΝΓ) | el |
dc.subject | Επικοινωνία κωφού-μηχανής | el |
dc.subject | MOSES | en |
dc.subject | Μοντέλο φράσης | el |
dc.subject | Γλωσσικά Μοντέλα | el |
dc.title | Μοντελοποίηση της ελληνικής νοηματικής γλώσσας για τα συστήματα στατιστικής μηχανικής μετάφρασης | el |
dc.contributor.department | Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Συστημάτων Τεχνητής Νοημοσύνης και Μάθησης | el |
heal.type | doctoralThesis | |
heal.secondaryTitle | Language modeling of the greek sign language for statistical machine translation systems | en |
heal.classification | Επεξεργασία φυσικής γλώσσας | el |
heal.classification | Επικοινωνία ανθρώπου μηχανής | el |
heal.classification | Επιστήμες Ηλεκτρονικών Υπολογιστών & Πληροφορικής | el |
heal.classification | Τεχνολογίες Νοηματικής Γλώσσας | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2020-07-08 | |
heal.abstract | This thesis is located in the framework of Automatic Machine Translation and in the human and machine software interface for hearing disabled people using the Greek Sign Language. In this work we present a novel prototype Rule Based Machine Translation (RBMT) system for the creation of large quality written Greek Sign Language (GSL) glossed corpora. In particular, the proposed RBMT system supports the professional translator of GSL to produce different kinds of GSL glossed corpus. Then the glossed corpus is used as training data for the production/creation of Language Model (LM) n-gram. With the GSL glossed corpus and for any domain, we can build, test and evaluate different kinds of Language Models for different kinds of glossed GSL corpus, even if there is no real written GSL large corpus. These GSL parallel corpus and languages models also will be used as training data by the Statistical Machine Translation (SMT) MOSES application system. It should be noted that the whole process is robust and flexible, since it does not demand deep grammar knowledge of GSL. By using the BiLingual Evaluation Understudy (BLEU) metric score, our prototyped MT system achieves a very promising performance, and in particular an average score of 60,53% και 85,1% / 65,5% / 53,8% / 44,8% για 1-gram / 2 -gram / 3-gram / 4-gram. | en |
heal.advisorName | Κόλλιας, Στέφανος | |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Μαραγκός, Μαραγκός | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας - Γεώργιος | el |
heal.committeeMemberName | Καρυδάκης, Γεώργιος | el |
heal.committeeMemberName | Καρπούζης, Κωνσταντίνος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Νταλιάνης, Κλήμης | el |
heal.academicPublisher | Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 149 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: