HEAL DSpace

Ευφυής Σήμανση και Λημματισμός Αρχαίων Ελληνικών Κειμένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Σταφυλοπάτης, Ανδρέας-Γεώργιος el
dc.contributor.author Λιόσσης, Εμμανουήλ Μ. el
dc.contributor.author Liossis, Emmanuel M. en
dc.date.accessioned 2014-12-08T11:26:09Z
dc.date.available 2014-12-08T11:26:09Z
dc.date.copyright 2014-08-28 -
dc.date.issued 2014-12-08
dc.date.submitted 2014-08-28 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/39856
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.7059
dc.description 94 σ. el
dc.description.abstract Η παρούσα διπλωματική εργασία πραγματεύεται μία γενική μέθοδο σημάνσεως λέξεων κειμένων και ευρέσεως των λημμάτων τους, με εφαρμογή τα αρχαία ελληνικά. Συγκεκριμένα, πρώτον, εκτιμάται το μέρος τού λόγου και η μορφολογία κάθε λέξεως στο κείμενο, δηλαδή αναγνωρίζεται η κλίση της. Δεύτερον, για κάθε μορφή λέξεως στο κείμενο εκτιμάται το λήμμα της, δηλαδή η κανονική της μορφή όπως την βρίσκουμε σ’ ένα λεξικό. Η προσέγγιση δεν στηρίζεται σε αυθαιρέτους κανόνες αλλά σε ευφυείς μεθόδους μηχανικής μαθήσεως. Το σύστημα δεν είναι προσδεδεμένο στα αρχαία ελληνικά αλλά είναι σχεδιασμένο ώστε να μπορεί να εφαρμοσθεί σε όλες τις γλώσσες, ιδιαιτέρως σε αυτές που εμφανίζουν πλουσία μορφολογία όπου υπάρχει δυσκολία επεξεργασίας. Έχουν επιστρατευθεί οι κατάλληλες μεθοδολογίες τεχνολογίας λογισμικού ώστε να αντιμετωπίζεται η κάθε γλώσσα σε αφαιρετικό επίπεδο καθ’ ενιαίο τρόπο. Το σύστημα αυτό είναι το πρώτο στρώμα στο οποίο μπορούν να βασισθούν υπηρεσίες όπως αναζήτηση υψηλής ποιότητος, μηχανική μετάφραση, συστήματα γνώσεων οντοτήτων και σημαντική αναζήτηση. el
dc.description.abstract This thesis presents a general method for labeling words within texts and finding their lemmata. The method is applied to ancient greek. More specifically, first, the part of speech and the inflection type is estimated for each word. Second, for each word form found in the text, the corresponding lemma is estimated, that is, the canonical form of the word as it is typically found in a dictionary. The approach does not rely on arbitrary rules but uses intelligent methods and machine learning. The system is not bound to ancient greek but it is designed in order to be able to serve all languages, especially the ones with rich morphological features, which present the most processing difficulty. The appropriate software engineering methodologies have been employed in order to address each language in an abstract and uniform way. This system is the first layer where higher services can be built upon, such as high quality search, machine translation, entity knowledge systems and semantic search. en
dc.description.statementofresponsibility Εμμανουήλ Μ. Λιόσσης el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Σήμανση μερών του λόγου el
dc.subject Λημματισμός el
dc.subject Επεξεργασία φυσικής γλώσσας el
dc.subject Μέθοδοι πυρήνων el
dc.subject Γενικευμένοι πυρήνες συμβολοσειρών el
dc.subject Μηχανές διανυσμάτων υποστηρίξεως el
dc.subject Υπό συνθήκη μαρκοβιανά πεδία el
dc.subject Part of speech tagging en
dc.subject Lemmatization en
dc.subject Natural language processing en
dc.subject Kernel methods en
dc.subject Generalized string Kernels en
dc.subject Support vector machines en
dc.subject Conditional random fields en
dc.title Ευφυής Σήμανση και Λημματισμός Αρχαίων Ελληνικών Κειμένων el
dc.title.alternative Intelligent Tagging and Lemmatization of Ancient Greek Texts en
dc.type bachelorThesis el (en)
dc.date.accepted 2014-08-26 -
dc.date.modified 2014-08-28 -
dc.contributor.advisorcommitteemember Κόλλιας, Στέφανος el
dc.contributor.advisorcommitteemember Στάμου, Γεώργιος el
dc.contributor.committeemember Σταφυλοπάτης, Ανδρέας-Γεώργιος el
dc.contributor.committeemember Κόλλιας, Στέφανος el
dc.contributor.committeemember Στάμου, Γεώργιος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Η/Υ. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. el
dc.date.recordmanipulation.recordcreated 2014-12-08 -
dc.date.recordmanipulation.recordmodified 2014-12-08 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής