dc.contributor.author | Παπακωνσταντίνου, Χαράλαμπος | el |
dc.contributor.author | Papakonstantinou, Charalampos | en |
dc.date.accessioned | 2018-05-18T10:53:25Z | |
dc.date.available | 2018-05-18T10:53:25Z | |
dc.date.issued | 2018-05-18 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/46968 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.15418 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Συσταδοποίηση κειμένων | el |
dc.subject | Λέξη κλειδί | el |
dc.subject | Επισημείωση | el |
dc.subject | Ιεραρχική οντολογία | el |
dc.subject | Αξιολόγηση επισημειώσεων | el |
dc.subject | Document clustering | en |
dc.subject | Keyword | en |
dc.subject | Tag | en |
dc.subject | Hierarchical ontology | en |
dc.subject | Tag evaluation | en |
dc.title | Αξιολόγηση επισημειώσεων με τη μέθοδο της συσταδοποίησης κειμένων | el |
heal.type | bachelorThesis | |
heal.classification | Τεχνητή νοημοσύνη | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2017-11-29 | |
heal.abstract | Σε αυτήν την εργασία προτείνεται ένα σύστημα αξιολόγησης των επισημειώσεων ενός συνόλου εγγράφων. Αρχικά γίνεται μία συσταδοποίηση αναφοράς του συνόλου των εγγράφων σε επιμέρους συστάδες με βάση το περιεχόμενο των κειμένων, τα οποία αναπαρίστανται στο μοντέλο διανυσματικού χώρου με τεχνική αναπαράστασης tf-idf. Στη συνέχεια γίνεται νέα συσταδοποίηση των εγγράφων με βάση τις ετικέτες με τις οποίες αυτά έχουν επισημειωθεί. Ακολουθεί σύγκριση της νέας συσταδοποίησης τη συσταδοποίηση αναφοράς με χρήση το δείκτη Rand Index. Τέλος, οι επισημειώσεις των εγγράφων εμπλουτίζονται μέσω της αντιστοίχισης των ελεύθερων λέξεων – κλειδιών που έχουν ορίσει οι συγγραφείς των εγγράφων σε έννοιες της ιεραρχικής οντολογίας από την οποία προέρχονται και οι αρχικές επισημειώσεις. Γίνεται εκ νέου συσταδοποίηση με βάση τις εμπλουτισμένες ετικέτες και η τελική συσταδοποίηση συγκρίνεται και πάλι με τη συσταδοποίηση αναφοράς. | el |
heal.abstract | In this thesis, a system for the evaluation of the tags of a document dataset is recommended. Initially, a reference clustering of the document dataset into clusters is performed, based on the content of the documents, which are represented in the vector space model with the tf-idf technique. Subsequently, a new clustering of the document set is performed, based on the labels the documents have been tagged with. Next, the new clustering is compared to the initial reference clustering with the Rand Index similarity measure. Finally, the labels of the documents are enriched by matching the authors’ free keywords to concepts of the hierarchical ontology the initial document labels originate from. A final clustering of the document set is performed, based on the enriched labels of the documents, and it is compared again with the initial reference clustering. | en |
heal.advisorName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Νικήτα, Κωνσταντίνα | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών. Εργαστήριο Ευφυών Επικοινωνιών και Δικτύων Ευρείας Ζώνης | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 67 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: