HEAL DSpace

Data science for social good: development of a knowledge graph targeted to sustainable development goals

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Stamou, Filomena en
dc.contributor.author Στάμου, Φιλομένα el
dc.date.accessioned 2022-02-15T14:06:01Z
dc.date.available 2022-02-15T14:06:01Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54713
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22411
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση"
dc.rights Default License
dc.subject Sustainable development goals en
dc.subject Semantic Web el
dc.subject Knowledge graph en
dc.subject Data integration en
dc.subject Wikidata en
dc.subject Στόχοι βιώσιμης ανάπτυξης el
dc.subject Σημασιολογικός ιστός el
dc.subject Γράφος γνώσης el
dc.subject Αναπαράσταση γνώσης el
dc.subject Ανάλυση χωροχρονικών δεδομένων el
dc.title Data science for social good: development of a knowledge graph targeted to sustainable development goals en
heal.type masterThesis
heal.classification Data Science & Machine Learning en
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-12-03
heal.abstract This document aims to uncover the contribution of Knowledge Graphs and Data Science techniques in Sustainable Development Goals (SDGs) achievement. The SDGs were set up in 2015 by the United Nations General Assembly and are intended to be achieved by the year 2030. They form a collection of 17 interlinked global goals designed to be a ’blueprint to achieve a better and more sustainable future for all’. Consisting of 244 indicators across 17 goals, measuring the SDGs progress is a huge challenge. Governments, organizations and researchers have recognized the potential of Data Science to enhance evidence-based decision making at global, national, and local levels and to drive the implementation of SDGs. The dissertation focuses on building a Knowledge Graph that gathers information from multiple sources and provides a structure to it. A knowledge graph is a semantic network whose structure is composed of nodes and edges. It can be considered as a relational network connecting data and concepts. The knowledge graph is initially formed based on SDG taxonomy and is further enriched with different ways. Space-time content retrieved from Wikidata and some publicly available World Wide News are inserted to the graph. Also, entity extraction is performed using techniques of the Natural Language Processing and articles are linked with the SDGs by taking advantage of an Application Programming Interface (API) created for this purpose. As a result, a structured graph is created, which can be used to explore how the problems and solutions of sustainability issues are interlinked. Because of strong knowledge inference, knowledge graph is a perfect way to describe the complex relationships between concepts and entities in the SDGs world. It helps to effectively manage the great amounts of knowledge, visualize the diverse knowledge translation and get useful insights. This survey is centered but not limited to knowledge graphs. A detailed Exploratory Data Analysis is performed based on available time series, which is a collection of observations about 244 SDGs indicators for different time periods and countries. Understanding how these indicators are evolving in time contributes to measuring their progress separately for each country or continent. The importance of time series analysis lies in predicting the future, as it enables forecasting by looking at past behavior of data and extending those patterns into the future. In addition, visualization methods can reveal forms or patterns in the data to give it meaning. This document ends up with a description of the effort to correlate the SDG indicators and the progress of countries towards achieving them, in order to highlight priorities for integrated policy. If mutually reinforcing actions are taken and trade-offs minimized, the 2030 SDGs agenda will be able to deliver on its potential. en
heal.abstract Η διπλωματική αυτή εργασία εξετάζει τη συμβολή της Επιστήμης των Δεδομένων στην επίτευξη των Στόχων Βιώσιμης Ανάπτυξης. Πρόκειται για ένα σύνολο 17 στόχων-προτάσεων που θεσπίστηκαν το 2015 από τον Οργανισμό Ηνωμένων Εθνών και υιοθετήθηκαν από τα κράτη-μέλη με σκοπό να τους πραγματοποιήσουν σε μία χρονική κλίμακα 15 ετών. Η παρακολούθηση της προόδου των χωρών πραγματοποιείται μέσω 244 αριθμητικών δεικτών αναφορικά με την προσέγγιση ή την απόκλισή τους από τους προαναφερθέντες στόχους. Εστιάζοντας σε καίρια ζητήματα όπως η φτώχεια, η υγεία και η ισότητα των φύλων, τίθενται έτσι τα θεμέλια για ένα καλύτερο και βιώσιμο μέλλον. Η εργασία πραγματεύεται την κατασκευή ενός Γράφου Γνώσης με σκοπό τη συγκέντρωση πληροφορίας από διαφορετικές πηγές. Τα δεδομένα αυτά απεικονίζονται με ένα δομημένο τρόπο, με αποτέλεσμα να γίνεται κατανοητή η εννοιολογική σύνδεσή τους. Επιπλέον, μέσω του γράφου επιτυγχάνεται η αποτελεσματική διαχείριση μεγάλου όγκου πληροφορίας, η οπτικοποίησή της καθώς και η εξαγωγή χρήσιμων συμπερασμάτων. Στα Σημασιολογικά Δίκτυα η συγγενική πληροφορία αναπαρίσταται με χρήση κόμβων και ακμών. Αξιοποιώντας την αναπαράσταση γνώσης και μία συλλογή στοιχείων, όπως αυτά έχουν δημοσιευτεί από τον Οργανισμό Ηνωμένων Εθνών και αναφέρονται στους Στόχους Βιώσιμης Ανάπτυξης, διαμορφώνεται ο σκελετός του γράφου ο οποίος εμπλουτίζεται με ποικίλους τρόπους. ΄Ενα μέρος των δεδομένων που εισάγονται προέρχεται από τη βάση δεδομένων της Βικιπαίδεια και έχει χωροχρονικό περιεχόμενο. Παράλληλα, χρησιμοποιούνται άρθρα του Παγκόσμιου Ιστού και αξιοποιούνται τεχνικές της Επεξεργασίας Φυσικής Γλώσσας. Τέλος, σημαντικό ρόλο διαδραματίζει η σύνδεση της κειμενικής πληροφορίας του γράφου με τους 17 στόχους, μέσω μίας Διεπαφής Προγραμματισμού Εφαρμογών. Η αξία του Γράφου Γνώσης έγκειται στην ενσωμάτωση πληροφορίας και στην παρατήρηση της διασύνδεσης των δεδομένων. Επιπρόσθετα, επιδιώκεται η κατανόηση του τρόπου με τον οποίο οι 244 δείκτες εξελίσσονται στον χρόνο, ώστε να μελετηθεί η πρόοδος της κάθε χώρας ή ηπείρου και να προσδιοριστεί η μελλοντική τους πορεία. ΄Ετσι, αξιοποιούνται τα στοιχεία που συγκεντρώνονται στον γράφο και υποβάλλονται σε επεξεργασία μέσω διαφορετικών τεχνικών της Επιστήμης των Δεδομένων. Η έρευνα ολοκληρώνεται με τη συσχέτιση των δεικτών και των χωρών βάσει της πορείας που σημειώνουν, έχοντας ως αποτέλεσμα την ανάδειξη προτεραιοτήτων για μια ενοποιημένη πολιτική. Η παράλληλη ενίσχυση δράσεων δύναται να συνεισφέρει στην έγκαιρη και έγκυρη επίτευξη των Στόχων Βιώσιμης Ανάπτυξης μέχρι το 2030. el
heal.advisorName Papavassiliou, Symeon en
heal.committeeMemberName Papavassiliou, Symeon en
heal.committeeMemberName Roussaki, Ioanna en
heal.committeeMemberName Matsopoulos, George en
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 86 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής