HEAL DSpace

Εξαγωγή σχέσεων μεταξύ οντοτήτων από το αρχείο της εφημερίδας "ΤΑ ΝΕΑ" με χρήση τεχνικών μη επιβλεπόμενης μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Σταφυλοπάτης, Ανδρέας el
dc.contributor.author Παπασαραντόπουλος, Νικόλαος Π. el
dc.contributor.author Papasarantopoulos, Nikolaos P. en
dc.contributor.author Θεοφίλου, Γεώργιος Γ.
dc.contributor.author Theofilou, Giorgios G.
dc.date.accessioned 2013-02-15T08:41:46Z
dc.date.available 2013-02-15T08:41:46Z
dc.date.copyright 2012-11-26 -
dc.date.issued 2013-02-15
dc.date.submitted 2012-11-26 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/7658
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.3477
dc.description 113 σ. el
dc.description.abstract Η παρούσα διπλωματική εργασία έχει ως αντικείμενο τη μελέτη και την ανάπτυξη ενός συστήματος εξαγωγής σχέσεων μεταξύ οντοτήτων από αδόμητο, ποικίλης θεματολογίας και δομής κείμενο, με χρήση τεχνικών μη επιβλεπόμενης μάθησης. Το σύστημα ακολουθεί το πρότυπο του open relation extraction, δηλαδή δεν απαιτεί καμία πληροφορία εισόδου πέρα από το σώμα κειμένου από το οποίο επιχειρεί να εξάγει σχέσεις. Η εξαγωγή σχέσεων μεταξύ οντοτήτων συνίσταται στην συστηματική εξαγωγή τριάδων της μορφής (e1 , r, e2), όπου e1, e2 οντότητες και r η (ρηματική) σχέση με την οποία συνδέονται. Το σύστημα αντιμετωπίζει κείμενα τα οποία είναι γραμμένα στην ελληνική γλώσσα. Για την υλοποίηση και τον έλεγχο ορθής λειτουργίας του χρησιμοποιήθηκε το αρχείο της εφημερίδας «ΤΑ ΝΕΑ» · μια επιλογή η οποία εξασφάλισε ένα μεγάλου μεγέθους και ποικίλης θεματολογίας και μορφής σώμα κειμένου. Η εξαγωγή σχέσεων επιτυγχάνεται με τη χρήση τεχνικών συντακτικής ανάλυσης κειμένου και ο διαχωρισμός τους σε θετικές (σημασιολογικά ορθές) ή μη γίνεται με τη χρήση ταξινομητή. Ο ταξινομητής εκπαιδεύεται με ένα σύνολο επισημειωμένων δεδομένων, τα οποία προκύπτουν από την εφαρμογή ενός συνόλου κανόνων. el
dc.description.abstract The main object of the present thesis is the study and development of a system that attempts to extract relations between entities from large, unstructured and multiple-topic corpora, using non-supervised learning techniques. The system follows the open relation extraction paradigm; hence it does not require additional input data, except the text corpus. Relation extraction is oriented towards the extraction of tuples (e1, r, e2), where e1, e2 denote entities and r denotes the (verbal) relation that connects the two entities. The system addresses texts written in greek language. The corpus used as test set was the archive of the greek newspaper “TA NEA”, which offered a multiple topic and multiple structure amount of text as input data. The system first extracts a large number of relations from the input text using parsing techniques and then each relation gets classified as positive (semantically true) or negative by a classifier. The classifier is trained by a training set of data tagged by the system, using a set of rules. en
dc.description.statementofresponsibility Νικόλαος Π. Παπασαραντόπουλος el
dc.description.statementofresponsibility Γεώργιος Γ. Θεοφίλου
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Εξαγωγή σχέσεων μεταξύ οντοτήτων el
dc.subject Εξαγωγή πληροφορίας el
dc.subject Ταξινόμηση el
dc.subject Ομαδοποίηση el
dc.subject Μηχανική μάθηση el
dc.subject Γραμματική επισημείωση όρων el
dc.subject Open relation extraction en
dc.subject Open information retrieval en
dc.subject Classification en
dc.subject Clustering en
dc.subject Machine learning en
dc.subject Part of speech tagging en
dc.title Εξαγωγή σχέσεων μεταξύ οντοτήτων από το αρχείο της εφημερίδας "ΤΑ ΝΕΑ" με χρήση τεχνικών μη επιβλεπόμενης μάθησης el
dc.title.alternative Relation extraction between entities from the "TA NEA" newspaper archive using non-supervised techinques en
dc.type bachelorThesis el (en)
dc.date.accepted 2012-11-09 -
dc.date.modified 2012-11-26 -
dc.contributor.advisorcommitteemember Κόλλιας, Στέφανος el
dc.contributor.advisorcommitteemember Στάμου, Γεώργιος el
dc.contributor.committeemember Σταφυλοπάτης, Ανδρέας el
dc.contributor.committeemember Κόλλιας, Στέφανος el
dc.contributor.committeemember Στάμου, Γεώργιος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
dc.date.recordmanipulation.recordcreated 2013-02-15 -
dc.date.recordmanipulation.recordmodified 2013-02-15 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής