HEAL DSpace

Αυτόµατη ΘεµατΙκή ΚατηγορΙΟποίηση καΙ ΣηµασΙολογΙκή ∆ιεύρυνση Ερωτηµάτων γΙα Μηχανή Αναζήτησης µε Οντολογίες

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κούρτη, Αμαλία
dc.contributor.author Kourti, Amalia
dc.date.accessioned 2025-06-17T05:46:00Z
dc.date.available 2025-06-17T05:46:00Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/62060
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.29756
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject µηχανική µάθηση el
dc.subject αναζήτηση εγγύτητας el
dc.subject οντολογία el
dc.subject σηµασιολογικός χαρακτηρισµός el
dc.subject Classification en
dc.subject machine learning en
dc.subject k-NN en
dc.subject , proximity search en
dc.subject semantic annotation en
dc.title Αυτόµατη ΘεµατΙκή ΚατηγορΙΟποίηση καΙ ΣηµασΙολογΙκή ∆ιεύρυνση Ερωτηµάτων γΙα Μηχανή Αναζήτησης µε Οντολογίες el
dc.contributor.department Τομέας τεχνολογίας πληροφορικής και υπολογιστών el
heal.type bachelorThesis
heal.classification Κατηγοριοποίηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2008-09-01
heal.abstract Σκοπός της παρούσας διπλωµατικής είναι η επέκταση του συστήµατος GoNTogle, µίας µηχανής αναζήτησης που συνδυάζει λέξεις κλειδιά και σηµασιολογία και αναπτύχθηκε στο Εργαστήριο ΣΒΓ∆. Για να είναι χρηστικό το σύστηµα αναζήτησης του GoNTogle, απαιτείται η ύπαρξη σηµασιολογικών επισηµειώσεων επί των εγγράφων µιας συλλογής ή τµηµάτων τους, ως προς τους κόµβους µιας οντολογίας. Επειδή η χειροκίνητη δηµιουργία αυτών των χαρακτηρισµών είναι έργο επίπονο, υλοποιήθηκε υποσύστηµα αυτόµατου σηµασιολογικού χαρακτηρισµού εγγράφων µε χρήση τεχνικών µηχανικής µάθησης. Το σύστηµα προτείνει στο χρήστη τους πιο υποσχόµενους χαρακτηρισµούς για κάθε κείµενο, µαθαίνει από τα λάθη του και επιτυγχάνει υψηλή απόδοση. Ένα άλλο συχνό πρόβληµα που παρατηρείται σε αναζητήσεις, είναι η επιστροφή µη επαρκούς αριθµού αποτελεσµάτων, για παράδειγµα αν το ερώτηµα αναζήτησης είναι υπερβολικά περιοριστικό. Για την αντιµετώπιση αυτού του προβλήµατος προτείνουµε τεχνικές επέκτασης του ερωτήµατος στο σηµασιολογικό άξονα, υπό το γενικό τίτλο «αναζήτηση σηµασιολογικής γειτονίας». Με τις µεθόδους αυτές ο χρήστης µπορεί να εξερευνήσει αποδοτικά τον χώρο των σηµασιολογικά συναφών αποτελεσµάτων σχετικά µε το αρχικό του ερώτηµα. Επίσης υλοποιήθηκαν επεκτάσεις του συστήµατος GoNTogle, που αφορούν στην ευρετηριοποίηση εγγράφων. Τέλος, δηµιουργήθηκε οντολογία για την κατηγοριοποίηση επιστηµονικών δηµοσιεύσεων Πληροφορικής βασισµένη στην κατάταξη ACM. Πειράµατα µε πραγµατικά δεδοµένα µε χρήση αυτής της οντολογίας αναδεικνύουν την αποδοτικότητα των µεθόδων µας. el
heal.abstract This thesis extends the GoNTogle system, a search engine combining keywords and semantics developed at KDBSL. For search to be effective in GoNTogle, documents or fragments thereof need to be semantically marked up wrt. concepts in an ontology. Manual creation of such annotations is an assiduous task, thus an automatic semantic annotation subsystem was developed using machine learning techniques. The system suggests the most promising concepts for every document, learns from its mistakes and achieves high performance. Another frequent problem in the context of search is an insufficient number of results being returned, for instance in cases of an overly restrictive query. To alleviate this problem we propose techniques for extending the query along the semantic axis, under the general title of “semantic proximity search”. Our methods allow for the effective exploration of results semantically affine to the initial query. GoNTogle was also extended wrt. indexing capacities. Finally, an ontology for classifying scientific publications in Computer Science was created, based on the ACM classification system. Experiments with real data and this ontology demonstrate the effectiveness of our approach. en
heal.sponsor ΕΜΠ el
heal.advisorName Βασιλείου, Ιωάννης
heal.committeeMemberName Βασιλείου, Ιωάννης
heal.committeeMemberName Σελλής, Τίµος
heal.committeeMemberName Κοζύρης, Νεκτάριος
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 96 σ.
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα