HEAL DSpace

Εκμάθηση σχέσεων από γράφους γνώσης με τεχνολογίες μηχανικής μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κατσούλη, Νικολέττα el
dc.contributor.author Katsouli, Nikoletta en
dc.date.accessioned 2020-04-01T15:00:09Z
dc.date.available 2020-04-01T15:00:09Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/50008
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.17706
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Γράφος γνώσης el
dc.subject Στατιστική σχεσιακή μάθηση el
dc.subject Μηχανική μάθηση el
dc.subject Link prediction en
dc.subject Translational distance models en
dc.subject Translational distance models en
dc.subject Link prediction en
dc.subject Knowledge graph en
dc.subject Statistical relational learning en
dc.subject Machine learning en
dc.title Εκμάθηση σχέσεων από γράφους γνώσης με τεχνολογίες μηχανικής μάθησης el
heal.type bachelorThesis
heal.classification Computer science en
heal.classification Machine learning en
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2019-07-12
heal.abstract Οι γράφοι γνώσης περιέχουν σημαντικές πληροφορίες για τον κόσμο με τη μορφή οντοτήτων και σχέσεων μεταξύ αυτών. Ωστόσο, όχι μόνο είναι δύσκολο να χρησιμοποιηθούν σε εφαρμογές Μηχανικής Μάθησης, αλλά έχουν και ελάττωμα σχετικά με την πληρότητα και την ορθότητα των δεδομένων τους. Το Link Prediction ασχολείται με την πρόβλεψη της ύπαρξης ή της πιθανότητας ορθότητας των πληροφοριών σε έναν Γράφο Γνώσης, καθώς το Statistical Relational Learning επικεντρώνεται στη δημιουργία στατιστικών μοντέλων για σχεσιακά δεδομένα. Τα Translational Distance Models είναι μια μέθοδος που χρησιμοποιείται ευρέως για την αντιμετώπιση αυτών των προβλημάτων, η οποία χρησιμοποιεί βασίζεται σε scoring functions με κριτήριο την απόσταση και υπολογίζει την αξιοπιστία ενός γεγονότος ως την απόσταση μεταξύ των embeddings των οντοτήτων. Το TransE είναι ένα απλό και αποδοτικό μοντέλο, το οποίο λαμβάνει υπόψη μόνο τις άμεσες σχέσεις μεταξύ οντοτήτων. Από την άλλη πλευρά, το Path-based TransE (PTransE) δημιουργεί, επιπλέον, μονοπάτια σχέσεων πολλαπλών βημάτων στον Γράφο Γνώσης, αλλά υστερεί στην χρονική πολυπλοκότητα. Σε αυτή τη διπλωματική εργασία, προτείνουμε ένα συνδυασμό αυτών των δύο μοντέλων. Στόχος μας είναι να διατηρήσουμε την αποτελεσματικότητα του TransE και να επωφεληθούμε από τις πρόσθετες γνώσεις του PTransE. Ως εκ τούτου, προτού προχωρήσουμε στην εκπαίδευση, προσθέτουμε τις συνθέσεις σχέσεων και τις αντίστροφες σχέσεις στον Γράφο Γνώσης, υπολογίζουμε την αξιοπιστία κάθε διαδρομής και τροποποιούμε κατάλληλα το margin-based loss function του TransE. Αξιολογούμε την προτεινόμενη μέθοδο σε δύο σύνολα δεδομένων, FB15K και SNOMED CT. Το δευτέρο βασίζεται σε αξιώματα Web Ontology Language που παρέχουν έναν τυπικό λογικό ορισμό των εννοιών. Η αξιολόγηση στο FB15K δεν επιτυγχάνει ιδιαίτερα καλά αποτελέσματα, αλλά στο SNOMED CT το μοντέλο μας παρουσιάζει σημαντική και συνεπή βελτίωση. el
heal.abstract Knowledge Graphs contain rich information about the world in the form of entities and relationships between them. However, not only it is difficult to take advantage of them in Machine Learning tasks, but also they have flaws in correctness and completeness. Therefore, Link Prediction is concerned with predicting the existence or probability of correctness of information in a Knowledge Graph, while Statistical Relational Learning is focused on the creation of statistical models for relational data. Translational Distance Models are a widely used method to tackle these problems, which exploits distance-based scoring functions and measure the plausibility of a fact as the distance between the entities' embeddings, usually after a translation carried out by the relation's one. TransE is a simple and efficient model, which takes into consideration only direct relations between entities. On the other hand, Path-based TransE (PTransE) builds also multiple-step relation paths on Knowledge Graph, but it has disadvantages in time complexity. In this diploma thesis, we propose a combination of these two models. We aim to maintain the efficiency of TransE and take advantage of the PTransE’s extra knowledge. Hence, before training, we add relation paths and reverse relations to the Knowledge Graph, calculate the reliability of each path and modify appropriately the TransE’s margin-based loss function. We evaluate the proposed method on two data sets, FB15K and SNOMED CT. The second one contains Web Ontology Language axioms that provide a formal logical definition of the concept. Evaluation on FB15K do not achieve particularly better results, but on SNOMED CT our model provides significant and consistent improvement. en
heal.advisorName Στάμου, Γιώργος el
heal.committeeMemberName Παπασπύρου, Νικόλαος el
heal.committeeMemberName Στάμου, Γιώργος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 79 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα