Η ευρεία εξάπλωση και χρήση του διαδικτύου έχει ως αποτέλεσμα την διάθεση και διακίνηση μεγάλου όγκου πληροφοριών και την ανάπτυξη εφαρμογών οι οποίες έχουν μεταμορφώσει τον τρόπο με τον οποίο οι άνθρωποι συναλλάσσονται και επικοινωνούν μεταξύ τους. Όμως αυτό τείνει να αποτελέσει και το πρόβλημα του διαδικτύου στην σημερινή του μορφή: μεγάλος όγκος πληροφοριών, κατακερματισμένος κυρίως σε μη-διασυνδεδεμένα συστήματα, που είναι κατάλληλος για επεξεργασία μόνο από τον άνθρωπο, αφού δεν υπάρχει η δυνατότητα σημασιολογικής ερμηνείας από τις μηχανές και επακόλουθα οποιαδήποτε αυτοματοποίηση της επεξεργασίας αυτών των πληροφοριών.
Προς την κατεύθυνση επίλυσης του συγκεκριμένου προβλήματος, αναπτύχθηκε η γλώσσα XML (eXtensible Markup Language), η οποία αποτελεί σήμερα το κυρίαρχο πρότυπο ανταλλαγής δεδομένων μεταξύ πληροφοριακών συστημάτων. Η γλώσσα XML Schema χρησιμοποιείται για τον ορισμό της δομής των XML εγγράφων. Η XML σε συνδυασμό με την XML Schema αποτελούν τη βάση της συντακτικής και δομικής διαλειτουργικότητας (Structural and Syntactic Interoperability) στο Διαδίκτυο.
Την ανάγκη για σημασιολογική διαλειτουργικότητα (Semantic interoperability) έρχεται να καλύψει ο Σημασιολογικός Ιστός, δίνοντας την δυνατότητα “μετασχηματισμού” του παγκόσμιου ιστού σε πλούσιες πλέον σημασιολογικές φόρμες με τη χρήση σημασιολογικών τεχνολογιών (RDF, OWL). Η επικρατέστερη γλώσσα σημασιολογικών ερωτήσεων στο περιβάλλον αυτό είναι η γλώσσα SPARQL (Simple Protocol and RDF Query Language).
Ταυτόχρονα, με την ανάπτυξη τεχνολογιών που ασχολούνται με τον σημασιολογικό ιστό, παρατηρείται μια αλματώδης ανάπτυξη των τεχνολογιών που σχετίζονται με την δημιουργία ηλεκτρονικών χαρτών, προκειμένου να προσδιοριστεί η επακριβής θέση διαθέσιμων πληροφοριών που έχουν χωρική διάσταση. Κυρίαρχη θέση στον συγκεκριμένο χώρο έχει αποκτήσει η εταιρεία Google.
Στο πλαίσιο της παρούσας διπλωματικής, αναπτύχθηκε μία εφαρμογή με σκοπό την αξιοποίηση της γλώσσας SPARQL για την άντληση δεδομένων από τον σημασιολογικό ιστό, σύμφωνα με τις προτιμήσεις του χρήστη καθώς και την χωροθέτηση των δεδομένων αυτών σε σχέση με την θέση του χρήστη.
Πιο συγκεκριμένα, αξιοποιώντας την τεχνολογία Google Latitude, προσδιορίζεται η θέση του χρήστη. Στην συνέχεια, αφού ο χρήστης επιλέξει την κατηγορία των πληροφοριών που ενδιαφέρεται να εντοπίσει γύρω του, σε μια ακτίνα που θα καθορίσει, εκτελείται ένα ερώτημα σε SPARQL για την άντληση των επιθυμητών πληροφοριών από την DBpedia. Η DBpedia αποτελεί μια προσπάθεια για την εξαγωγή, διασύνδεση και επαναχρησιμοποίηση δομημένης πληροφορίας διαμέσου του Web από την εγκυκλοπαίδεια Wikipedia. Τα αποτελέσματα της αναζήτησης απεικονίζονται με την βοήθεια των Google Maps στην δικτυακή θέση http://worth2c.info που αναπτύχθηκε για τους σκοπούς της παρούσας διπλωματικής με χρήση τεχνολογιών PHP και Javascript.
The wide use and expansion of Internet has resulted to the production and exchange of huge amount of information as well as the development of computer applications that have transformed the ways people perform business and communicate. But exactly these characteristics seem to be the main problems that the Internet is facing nowadays: huge amount of information, dispersed across sytems that are not interconnected, suitable only for human-processing while the real-meaning of this information, the semantics, is opaque to the machines which therefore are unable to assist users in the processing of this information.
To resolve these problems the XML (eXtensible Markup Language) was developed which is the dominant data-exchange standard between information systems. Along with XML, XML Schema is used for the definition of the structure of XML documents. XML in conjunction with XML Schema form the basis for the structural and syntactic interoperability across the Internet.
Semantic interoperability is the purpose of the Semantic Web. Semantic Web transforms the World Wide Web into reach semantic forms through the use of relevant technologies (RDF, OWL). The main language for addressing semantic queries in the Semantic Web is SPARQL (Simple Protocol and RDF Query Language).
Along with the evolution of technologies in the semantic web area, a rapid development is observed in technologies concerning electronic maps and the ability to visualize on them available information with spatial dimension. The leader in this field is Google Company.
In the context of this thesis, an application has been developed utilizing SPARQL language with the purpose of extracting data from the Semantic Web, according to a user’s preferences and the location of the data relevant to the user’s position.
More specifically, the user’s position is located with the Google Latitude technology. At the next step, after the user selects the category of information that is interested to locate and specify the maximum radius (distance) of this information, a SPARQL query is executed for the retrieval of the relevant information from DBpedia. DBpedia is a project aiming to extract structured content from the information created as part of the Wikipedia project. This structured information is then made available on the World Wide Web.
At the final step, the returned results are visualized on Google Maps at the website under URL http://worth2c.info that was developed in the context of this thesis using PHP and Javascript.