HEAL DSpace

Αξιολόγηση επισημειώσεων με τη μέθοδο της συσταδοποίησης κειμένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Παπακωνσταντίνου, Χαράλαμπος el
dc.contributor.author Papakonstantinou, Charalampos en
dc.date.accessioned 2018-05-18T10:53:25Z
dc.date.available 2018-05-18T10:53:25Z
dc.date.issued 2018-05-18
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/46968
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.15418
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Συσταδοποίηση κειμένων el
dc.subject Λέξη κλειδί el
dc.subject Επισημείωση el
dc.subject Ιεραρχική οντολογία el
dc.subject Αξιολόγηση επισημειώσεων el
dc.subject Document clustering en
dc.subject Keyword en
dc.subject Tag en
dc.subject Hierarchical ontology en
dc.subject Tag evaluation en
dc.title Αξιολόγηση επισημειώσεων με τη μέθοδο της συσταδοποίησης κειμένων el
heal.type bachelorThesis
heal.classification Τεχνητή νοημοσύνη el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2017-11-29
heal.abstract Σε αυτήν την εργασία προτείνεται ένα σύστημα αξιολόγησης των επισημειώσεων ενός συνόλου εγγράφων. Αρχικά γίνεται μία συσταδοποίηση αναφοράς του συνόλου των εγγράφων σε επιμέρους συστάδες με βάση το περιεχόμενο των κειμένων, τα οποία αναπαρίστανται στο μοντέλο διανυσματικού χώρου με τεχνική αναπαράστασης tf-idf. Στη συνέχεια γίνεται νέα συσταδοποίηση των εγγράφων με βάση τις ετικέτες με τις οποίες αυτά έχουν επισημειωθεί. Ακολουθεί σύγκριση της νέας συσταδοποίησης τη συσταδοποίηση αναφοράς με χρήση το δείκτη Rand Index. Τέλος, οι επισημειώσεις των εγγράφων εμπλουτίζονται μέσω της αντιστοίχισης των ελεύθερων λέξεων – κλειδιών που έχουν ορίσει οι συγγραφείς των εγγράφων σε έννοιες της ιεραρχικής οντολογίας από την οποία προέρχονται και οι αρχικές επισημειώσεις. Γίνεται εκ νέου συσταδοποίηση με βάση τις εμπλουτισμένες ετικέτες και η τελική συσταδοποίηση συγκρίνεται και πάλι με τη συσταδοποίηση αναφοράς. el
heal.abstract In this thesis, a system for the evaluation of the tags of a document dataset is recommended. Initially, a reference clustering of the document dataset into clusters is performed, based on the content of the documents, which are represented in the vector space model with the tf-idf technique. Subsequently, a new clustering of the document set is performed, based on the labels the documents have been tagged with. Next, the new clustering is compared to the initial reference clustering with the Rand Index similarity measure. Finally, the labels of the documents are enriched by matching the authors’ free keywords to concepts of the hierarchical ontology the initial document labels originate from. A final clustering of the document set is performed, based on the enriched labels of the documents, and it is compared again with the initial reference clustering. en
heal.advisorName Στάμου, Γεώργιος el
heal.committeeMemberName Νικήτα, Κωνσταντίνα el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών. Εργαστήριο Ευφυών Επικοινωνιών και Δικτύων Ευρείας Ζώνης el
heal.academicPublisherID ntua
heal.numberOfPages 67 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα