dc.contributor.author |
Λιαγούρης, Ιωάννης
|
el |
dc.contributor.author |
Liagouris, John
|
el |
dc.date.accessioned |
2015-09-08T08:23:55Z |
|
dc.date.available |
2015-09-08T08:23:55Z |
|
dc.date.issued |
2015-09-08 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/41210 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.1304 |
|
dc.rights |
Default License |
|
dc.subject |
Προστασία της Ιδιωτικότητας |
el |
dc.subject |
Δεδομένα Αναζήτησης στον Ιστό |
el |
dc.subject |
Ιατρικά Δεδομένα |
el |
dc.subject |
Σημασιολογία |
el |
dc.subject |
Privacy |
en |
dc.subject |
Web Search Query Logs |
el |
dc.subject |
Electronic Health Records |
el |
dc.subject |
Semantics |
el |
dc.title |
Σημασιολογικές Προσεγγίσεις στην Προστασία της Ιδιωτικότητας σε Δεδομένα Καταγραφών Συμπεριφοράς στον Ιστό |
el |
dc.title |
Web Data Management with Applications in Privacy |
en |
dc.contributor.department |
Εργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων |
el |
heal.type |
doctoralThesis |
|
heal.classification |
Επιστήμη των Υπολογιστών |
el |
heal.classification |
Computer science |
en |
heal.classificationURI |
http://id.loc.gov/authorities/subjects/sh89003285 |
|
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2015-03-07 |
|
heal.abstract |
Η διαφύλαξη της ιδιωτικότητας κατά τη δημοσίευση δεδομένων έχει αποκτήσει ιδιαίτερο ενδιαφέρον τα τελευταία χρόνια, λόγω της ανάγκης των διαφόρων φορέων να μοιράζονται δεδομένα που περιέχουν ευαίσθητες πληροφορίες για φυσικά ή νομικά
πρόσωπα. Αντιπροσωπευτικά παραδείγματα τέτοιων δεδομένων είναι οι βάσεις πελατών
που τηρούνται από επιχειρήσεις, τα δεδομένα από τις κλινικές δοκιμές που διεξάγονται
σε νοσοκομεία, τα αρχεία καταγραφής ερωτημάτων από μηχανές αναζήτησης στον Ιστό
όπως αυτή της Google, τα οικονομικά στοιχεία των πολιτών από το Δημόσιο Τομέα, τα
δεδομένα που παράγονται από τη συμμετοχή των χρηστών σε κοινωνικά δίκτυα όπως
το Facebook, τα δεδομένα από τηλεπικοινωνιακούς παρόχους όπως η Vodafone, κλπ.
Τα στοιχεία που περιλαμβάνονται σε αυτά τα δεδομένα είναι πολύτιμα όχι μόνο για
τους ιδιοκτήτες των δεδομένων, αλλά και για πληθώρα επιχειρήσεων, πανεπιστημίων
και οργανισμών. Η δωρεάν διάθεση πραγματικών δεδομένων στο κοινό είναι απαραίτητη προϋποθεση για τη χρήση τους σε μεγάλης κλίμακας αναλύσεις αγοράς, σε ιατρικές
και κοινωνολογικές μελέτες, σε πειραματικές αξιολογήσεις αλγορίθμων από την έρευνα,
κλπ. Ωστόσο, τα πραγματικά δεδομένα παράγονται από τις δραστηριότητες ανθρώπων
που συνήθως γίνονται υπό καθεστώς ανωνυμίας και, κατά συνέπεια, είναι πολύ πιθανό
να περιέχουν ευαίσθητες πληροφορίες σχετικά με φυσικά πρόσωπα (π.χ. ιατρικά και
οικονομικά στοιχεία, πολιτικές πεποιθήσεις, σεξουαλικές προτιμήσεις, κ.λπ.) οι οποίες
μπορεί να διαρρεύσουν ακόμη και αν τα δεδομένα δημοσιοποιηθούν χωρίς τα χαρακτηριστικά που προσδιορίζουν άμεσα ένα άτομο (π.χ. το όνομα του ατόμου, ο ΑΦΜ, ή
η IP ενός web server. Ακόμη και χωρίς αυτά τα χαρακτηριστικά, η αποκάλυψη ευαίσθητων πληροφοριών για ένα άτομο επιτυγχάνεται όταν: (i) ο ‘αντίπαλοσ’ έχει εκ των
προτέρων κάποια γνώση σχετικά με ένα άτομο (π.χ., γνωρίζει τις μουσικές προτιμήσεις
του), και/ή (ii) τα δημοσιευμένα δεδομένα διασταυρώνονται με άλλες δημόσιες πηγές
δεδομένων (π.χ. δημογραφικά στοιχεία, κοινωνικά προφίλ που εξάγονται από προσωπικές ιστοσελίδες, κλπ). |
el |
heal.abstract |
Privacy preservation in data publishing has gained considerable attention during
the last years due to the need of several organizations to share their data without
revealing sensitive information about real persons or legal entities included in them.
Representative examples of such datasets are the so-called customers' databases
kept by enterprises, the data produced by clinical tests and experiments conducted
in hospitals and related institutes, the query logs held by search engine providers
like Google, the financial data from the public sector information systems, the social
data produced by the participation of individuals in social networks like Facebook,
the location data from telecom providers like Vodafone, and so forth. On the one
hand, the records included in these datasets carry valuable information not only for
their owners, but also for a plethora of enterprises, universities and institutions. The
evaluation of the proposed information retrieval and data mining techniques through
realistic experiments, the ability to perform large-scale market analysis, and the feasibility of conducting medical, social, and multidisciplinary studies based on these
datasets are only a few examples that demonstrate the importance for the latter to
be publicly available. On the other, taking into account that the actual data are
produced by the activities of “real” people, which in the usual case are performed
in private, they are likely to capture sensitive information about them (e.g. medical and financial information, political beliefs, sexual preferences, etc.) that can be
disclosed even if they are published without the attributes that directly identify an
entity; for instance, the person's name, the social ID number, or the IP of a web
server. Even without these attributes, the disclosure of sensitive information about
an individual, or an entity in general, is achieved when: (i) the “adversary” has a
priori some form of background knowledge about the entity (e.g., knows a person's music preferences), and/or (ii) the published dataset is cross-checked with other
publicly available data sources (e.g., demographic data, social profiles extracted from
personal web pages, etc.). |
en |
heal.sponsor |
Η παρούσα έρευνα έχει συγχρηματοδοτηθεί από την Ευρωπαϊκή ́Ενωση (Ευρωπαϊκό Κοινωνικό Ταμείο - ΕΚΤ) και από εθνικούς πόρους μέσω του Επιχειρησιακού Προγράμματος ‘Εκπαίδευση και Δια Βίου Μάθηση’ του Εθνικού Στρατηγικού Πλαισίου Αναφοράς (ΕΣΠΑ) - Ερευνητικό Xρηματοδοτούμενο ́Εργο: Ηράκλειτος ΙΙ. Επένδυση στην κοινωνία της γνώσης μέσω του Ευρωπαϊκού Κοινωνικού Ταμείου. |
el |
heal.advisorName |
Βασιλείου, Ιωάννης |
el |
heal.advisorName |
Vassiliou, Yannis |
en |
heal.committeeMemberName |
Βασιλείου, Ιωάννης |
el |
heal.committeeMemberName |
Σελλής, Τιμολέων |
el |
heal.committeeMemberName |
Σταύρακας, Ιωάννης |
el |
heal.committeeMemberName |
Κοντογιάννης, Κωνσταντίνος |
el |
heal.committeeMemberName |
Στάμου, Γεώργιος |
el |
heal.committeeMemberName |
Σκιαδόπουλος, Σπυρίδων |
el |
heal.committeeMemberName |
Μαμουλής, Νικόλαος |
el |
heal.committeeMemberName |
Vassilioy, Yannis |
en |
heal.committeeMemberName |
Sellis, Timos |
el |
heal.committeeMemberName |
Stavrakas, Yannis |
el |
heal.committeeMemberName |
Kontogiannis, Kostas |
el |
heal.committeeMemberName |
Stamou, Giorgios |
el |
heal.committeeMemberName |
Skiadopoulos, Spiros |
el |
heal.committeeMemberName |
Mamoulis, Nikos |
el |
heal.academicPublisher |
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
110 |
|
heal.fullTextAvailability |
true |
|