HEAL DSpace

Μοντελοποίηση της ελληνικής νοηματικής γλώσσας για τα συστήματα στατιστικής μηχανικής μετάφρασης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κουρεμένος, Δημήτρης el
dc.contributor.author Kouremenos, Dimitris en
dc.date.accessioned 2021-02-02T09:08:20Z
dc.date.available 2021-02-02T09:08:20Z
dc.date.issued 2021-02-02
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/52849
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.20547
dc.description.abstract Η παρούσα διατριβή τοποθετείται στο πλαίσιο της αυτόματης Μηχανικής Μετάφρασης, στην διαπροσωπίας ανθρώπου και μηχανής για τα άτομα με προβλήματα ακοής κάνοντας χρήση την γλώσσα των Κωφών, τηn Ελληνική Νοηματική Γλώσσα. Σε αυτή τη εργασία παρουσιάζουμε ένα πρωτότυπο σύστημα βασισμένο σε κανόνες μηχανικής μετάφρασης με σκοπό τη δημιουργία μεγάλων παράλληλων εύρωστων γραπτών σωμάτων ελληνικού κειμένου και της Ελληνικής Νοηματικής Γλώσσας κάνοντας χρήση της Σύντομης Μεταγραφής της Ελληνικής Νοηματικής Γλώσσας (ΣΜΕΝΓ) (text glosses). Στη συνέχεια, τα σώματα κειμένου χρησιμοποιούνται ως δεδομένα κατάρτισης για την παραγωγή / δημιουργία γλωσσικών μοντέλων ν-γραμμάτων (n-gram Language Model). Επίσης χρησιμοποιούνται και ως δεδομένα εκπαίδευσης για το σύστημα MOSES Στατιστικής Μηχανικής Μετάφρασης. Πρέπει να σημειωθεί ότι όλη η διαδικασία είναι ισχυρή και ευέλικτη, καθώς δεν απαιτεί βαθιά γνώση γραμματικής της ΕΝΓ. Στην εργασία μας παρουσιάζουμε μετρήσεις χρονικές εκτιμήσεις για την δημιουργία των γλωσσικών πόρων, αξιολογούμε τα γλωσσικά μοντέλα της ΕΝΓ μέσω της περιπλοκής και τέλος χρησιμοποιώντας τη μετρική βαθμολογία BiLingual Understudy Assessment (BLEU) για την αξιολόγηση της μηχανικής μετάφρασης, το πρωτότυπο σύστημα MT μας επιτυγχάνει ελπιδοφόρες επιδόσεις και συγκεκριμένα μια μέση βαθμολογία 60,53% και 85,1% / 65,5% / 53,8% / 44,8% για 1-gram / 2 -gram / 3-gram / 4-gram. el
dc.rights Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-sa/3.0/gr/ *
dc.subject Στατιστική μηχανική μετάφραση el
dc.subject Ελληνική γλώσσα el
dc.subject Ελληνική νοηματική γλώσσα (ΕΝΓ) el
dc.subject Επικοινωνία κωφού-μηχανής el
dc.subject MOSES en
dc.subject Μοντέλο φράσης el
dc.subject Γλωσσικά Μοντέλα el
dc.title Μοντελοποίηση της ελληνικής νοηματικής γλώσσας για τα συστήματα στατιστικής μηχανικής μετάφρασης el
dc.contributor.department Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Συστημάτων Τεχνητής Νοημοσύνης και Μάθησης el
heal.type doctoralThesis
heal.secondaryTitle Language modeling of the greek sign language for statistical machine translation systems en
heal.classification Επεξεργασία φυσικής γλώσσας el
heal.classification Επικοινωνία ανθρώπου μηχανής el
heal.classification Επιστήμες Ηλεκτρονικών Υπολογιστών & Πληροφορικής el
heal.classification Τεχνολογίες Νοηματικής Γλώσσας el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2020-07-08
heal.abstract This thesis is located in the framework of Automatic Machine Translation and in the human and machine software interface for hearing disabled people using the Greek Sign Language. In this work we present a novel prototype Rule Based Machine Translation (RBMT) system for the creation of large quality written Greek Sign Language (GSL) glossed corpora. In particular, the proposed RBMT system supports the professional translator of GSL to produce different kinds of GSL glossed corpus. Then the glossed corpus is used as training data for the production/creation of Language Model (LM) n-gram. With the GSL glossed corpus and for any domain, we can build, test and evaluate different kinds of Language Models for different kinds of glossed GSL corpus, even if there is no real written GSL large corpus. These GSL parallel corpus and languages models also will be used as training data by the Statistical Machine Translation (SMT) MOSES application system. It should be noted that the whole process is robust and flexible, since it does not demand deep grammar knowledge of GSL. By using the BiLingual Evaluation Understudy (BLEU) metric score, our prototyped MT system achieves a very promising performance, and in particular an average score of 60,53% και 85,1% / 65,5% / 53,8% / 44,8% για 1-gram / 2 -gram / 3-gram / 4-gram. en
heal.advisorName Κόλλιας, Στέφανος
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Μαραγκός, Μαραγκός el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας - Γεώργιος el
heal.committeeMemberName Καρυδάκης, Γεώργιος el
heal.committeeMemberName Καρπούζης, Κωνσταντίνος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Νταλιάνης, Κλήμης el
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 149 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα