Ο Παγκόσμιος Ιστός αποτελεί πλέον αναπόσπαστο κομμάτι της καθημερινότητας, έχοντας αλλάξει τον τρόπο με τον οποίο επικοινωνούμε με τους συνανθρώπους μας, δημιουργούμε, μοιραζόμαστε και αναζητούμε πληροφορία. Ο Σημασιολογικός Ιστός φιλοδοξεί να φέρει μια αντίστοιχη επανάσταση στη χρήση αυτού του τεράστιου όγκου διαθέσιμης πληροφορίας, επιτρέποντας σε προγραμματιστικές διαδικασίες να αξιοποιήσουν τη σημασία της, να εξάγουν συμπεράσματα από αυτήν και να τη συνδυάσουν με άλλη πληροφορία με τρόπο ωφέλιμο για τον ανθρώπινο χρήστη. Ωστόσο, το όραμα του Σημασιολογικού Ιστού δεν έχει ακόμα υλοποιηθεί στον επιθυμητό βαθμό και μια αιτία για αυτό αποτελεί η έλλειψη ικανής ποσότητας δεδομένων άμεσα αξιοποιήσιμων από σημασιολογικές εφαρμογές. Στην παρούσα διατριβή, εξετάζεται το πρόβλημα της παραγωγής σημασιολογικού περιεχομένου από υπάρχουσες δομημένες και ημιδομημένες πηγές δεδομένων, με απώτερο στόχο τη μεταφορά του πλούτου της πληροφορίας που ενυπάρχει σε αυτές στο Σημασιολογικό Ιστό. Αρχικά, εξετάζεται το πρόβλημα της συμμετοχής και αξιοποίησης σχεσιακών ΒΔ στο πλαίσιο του Σημασιολογικού Ιστού και πραγματοποιείται μια εκτεταμένη βιβλιογραφική επισκόπηση, η οποία μεταξύ άλλων περιλαμβάνει τα προβλήματα της παραγωγής οντολογίας από μια σχεσιακή ΒΔ, της εξαγωγής των περιεχομένων μιας σχεσιακής ΒΔ σε έναν RDF γράφο, καθώς και το πρόβλημα της ανακάλυψης αντιστοιχιών μεταξύ σχεσιακής ΒΔ και οντολογίας. Στη συνέχεια, περιγράφεται ένα απλό σύστημα αντιστοιχίας μιας σχεσιακής βάσης δεδομένων με μια οντολογία, το οποίο προτείνει τη χρήση της SQL για τον ορισμό της αντιστοιχίας, και τονίζονται οι θεωρητικές αδυναμίες και ελλείψεις μιας τέτοιας προσέγγισης. Επίσης, αναλύεται ένας αλγόριθμος για τη μετεγγραφή SPARQL ερωτημάτων σε σημασιολογικά ισοδύναμα SQL υπό την παρουσία μιας R2RML αντιστοιχίας, δυνατότητα που επιτρέπει τη δυναμική πρόσβαση στα περιεχόμενα μιας βάσης δεδομένων μέσω γλωσσών σημασιολογικών ερωτημάτων. Τέλος, εξετάζεται το πρόβλημα της σημασιολογικής επισημείωσης και επεξεργασίας ημιδομημένων δεδομένων από δυναμικές πηγές όπως δίκτυα αισθητήρων και προτείνεται κατάλληλη επέκταση σε ένα υλοποιημένο σύστημα επίγνωσης περιβάλλοντος, η οποία εφαρμόζει παραθυρικές τεχνικές προκειμένου να διατηρήσει το χρόνο απόκρισής του εντός αποδεκτών ορίων.
The World Wide Web has become a part of everyday life, having changed the way people communicate, as well as the way we create, share and search for information. The Semantic Web seeks to revolutionize the way this huge amount of available information is used, allowing automated procedures to make use of its meaning, infer new facts and integrate it with other information in a way that is meaningful to the end user. However, the Semantic Web vision has not been fully materialized yet and one of many possible reasons is the lack of an adequate critical mass of data that can be readily used by semantic applications. Therefore, this thesis investigates the issue of semantic content generation from existing structured and semistructured data sources, with the ultimate goal of bringing this entire wealth of information in the Semantic Web. First of all, an extended literature survey is carried out in order to clarify the various aspects of relational database usage in the Semantic Web context and identify all relevant issues, such as ontology generation from a relational schema, the export of relational database contents in the form of an RDF graph and the discovery of mappings between a relational database and an ontology. A simplified mapping system that merely uses SQL queries for the mapping definition is then proposed and the theoretical and practical shortcomings of this approach are pointed out. Furthermore, an algorithm for the rewriting of SPARQL queries to semantically equivalent SQL ones in the presence of an R2RML mapping is analysed, allowing for dynamic access of relational database contents via semantic queries. Finally, the problem of semantic annotation and processing of semistructured data from dynamic sources is investigated and an appropriate extension to an already implemented context-aware system is proposed. This extension applies windowing techniques in the incoming data stream in order to keep the response time of the system under acceptable levels.