dc.contributor.author |
Δημητρίου, Αικατερίνη
|
|
dc.contributor.author |
Dimitriou, Aikaterini
|
|
dc.date.accessioned |
2020-03-09T10:37:06Z |
|
dc.date.available |
2020-03-09T10:37:06Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/49881 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.17579 |
|
dc.description |
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Τεχνο-Οικονομικά Συστήματα (ΜΒΑ)” |
el |
dc.rights |
Default License |
|
dc.subject |
Μεγάλα Δεδομένα |
el |
dc.subject |
Διερεύνηση Δεδομένων |
el |
dc.subject |
Σημασιολογικός Ιστός |
el |
dc.subject |
Γράφοι Γνώσης |
el |
dc.subject |
Big Data |
en |
dc.subject |
Ανοιχτά Διασυνδεδεμένα Δεδομένα |
el |
dc.subject |
Data mining |
en |
dc.subject |
Linked Open Data |
en |
dc.subject |
Semantic Web |
en |
dc.subject |
Knowledge Graphs |
en |
dc.title |
Επισκόπηση μεθόδων ανάλυσης δεδομένων με χρήση Σημασιολογικών Στοιχείων και Γράφων Γνώσης |
el |
heal.type |
masterThesis |
|
heal.classification |
Ανάλυση Δεδομένων |
el |
heal.classification |
Data mining |
en |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2019-10-14 |
|
heal.abstract |
O όγκος των δεδομένων και των πληροφοριών που συναλλάσσονται καθημερινά οι χρήστες του Διαδικτύου είναι ασύλληπτα μεγάλος και ποικιλόμορφος. Αναλύοντας αυτά τα δεδομένα, μπορεί κανείς να συλλέξει αμέτρητες και ανεκτίμητες πληροφορίες, που σε διαφορετική περίπτωση θα ήταν μη προσβάσιμη γνώση.
Την τελευταία δεκαετία, κυρίως, η επιστήμη της ανάλυσης των Μεγάλων Δεδομένων (Big Data) έχει επικεντρωθεί σε αυτό ακριβώς το ζήτημα, προσπαθώντας με διάφορους τρόπους να βελτιώσουν διάφορες μεθόδους Ανάκτησης πληροφοριών (Information Retrieval) από το Διαδίκτυο. Αυτό καθίσταται ευκολότερο με την υιοθέτηση του σημασιολογικού ιστού (Semantic Web), ο οποίος παρουσιάζει τα δεδομένα που υπάρχουν στο διαδίκτυο σε μορφή κατανοητή από τους υπολογιστές ώστε να υποστηρίζονται δυνατότητες μηχανικής εκμάθησης.
Προς την κατεύθυνση αυτή, η παρούσα διπλωματική εργασία μελετά μεθόδους οι οποίες χρησιμοποιούν τη σημασιολογία (Semantics) και τα γραφήματα γνώσης (Knowledge Graphs) για την επεξεργασία και ανάλυση των Μεγάλων Δεδομένων.
Στο 1ο μέρος της παρούσας εργασίας, παρουσιάζονται οι βασικές αρχές πάνω στη Διερεύνηση Δεδομένων (Data Mining) και στην Ανάκτηση πληροφοριών. Γίνεται αναφορά στα Διασυνδεδεμένα Ανοιχτά Δεδομένα (Linked Open Data), στη Διερεύνηση του Διαδικτύου (Web Mining) και ειδικότερα στη Διερεύνηση Δεδομένων του Σημασιολογικού Ιστού (Semantic Web Data Mining).
Στο 2ο μέρος παρουσιάζονται διαφορετικές μέθοδοι για την επεξεργασία των Μεγάλων Δεδομένων. Πρώτα αναλύονται προσεγγίσεις που χρησιμοποιούν το Σημασιολογικό Ιστό για την Διερεύνηση του Διαδικτύου (Semantic web approaches to Web Mining). Στη συνέχεια διερευνάται μια μέθοδος που χρησιμοποιεί τα σημασιολογικά δεδομένα σε συνδυασμό με τις παραδοσιακές μεθόδους αναζήτησης πληροφοριών (Semantics & Traditional Search System) για την αναζήτηση αποτελεσμάτων κατά την ανάλυση των δεδομένων. Ακολουθούν μια προσέγγιση που δίνει έμφαση στη χρήση Οντολογιών για την Διερεύνηση Δεδομένων (Semantic based Ontology approach) και μια μέθοδος που χρησιμοποιεί τα σημασιολογικά δεδομένα μαζί με τα Διασυνδεδεμένα Ανοιχτά Δεδομένα (Semantics & Linked Open Data) για την εξατομίκευση αποτελεσμάτων κατά την επεξεργασία των Μεγάλων Δεδομένων. Τέλος, παρουσιάζονται μέθοδοι που χρησιμοποιούν γράφους γνώσης για την επεξεργασία των Μεγάλων Δεδομένων: εννοιολογικοί γράφοι με μέτρο ομοιότητας (Graphs of Concepts with a Similarity Measure), γράφοι σημασιολογικής συγγένειας (Semantics Relatedness Graphs) και προσέγγιση που ενσωματώνει τους γράφους γνώσης σε συστήματα συστάσεων (Graph based Methods for Recommender Systems). |
el |
heal.abstract |
The amount of data and information that Internet users handle daily is innumerable and diverse. By analyzing this data, one can collect countless and invaluable information that would otherwise be inaccessible.
In the last decade in particular, the science of Big Data Analytics has focused on this very issue, trying different ways of improving the various methods of retrieving information from the Internet. This is made easier by adopting the Semantic Web, which present data available online in a comprehensible format by computers, to support machine learning capabilities.
To this end, this thesis studies methods that use Semantics and Knowledge graphs to process and analyze Big Data.
The first part of this paper presents the basic knowledge on Data Mining and Information Retrieval. Reference is made to Linked Open Data, Web Mining and Semantic Web Mining.
The second part presents different methods of processing Big Data. First, an approach that uses Semantics for Data Analysis is presented. Next, a method that uses semantic data in conjunction with traditional search system to search for results in data analysis is explored. Following, a Semantic based Ontology approach is presented as well as a method that uses semantic data along with Linked Open Data to personalize the results during Big Data Analysis is considered. Finally, methods that use Knowledge Graphs for Big Data Analysis are presented: Graphs of concepts along with a similarity measure, Semantic relatedness graphs and Graph-based Method for Recommender systems. |
en |
heal.advisorName |
Ασκούνης, Δημήτριος |
|
heal.committeeMemberName |
Ψαρράς, Ιωάννης |
|
heal.committeeMemberName |
Δούκας, Χρυσόστομος |
|
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.fullTextAvailability |
false |
|