HEAL DSpace

Προστασία Της Ιδιωτικότητας Στην Δημοσίευση Μη Σχεσιακών Δεδομένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Γκουντούνα, Όλγα el
dc.contributor.author Gkountouna, Olga en
dc.date.accessioned 2015-11-25T08:15:33Z
dc.date.available 2015-11-25T08:15:33Z
dc.date.issued 2015-11-25
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/41625
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.1933
dc.rights Default License
dc.subject Ιδιωτικότητα el
dc.subject Προστασία Ιδιωτικότητας el
dc.subject Ανωνυμία el
dc.subject Ανώνυμη δημοσίευση δεδομένων el
dc.subject Μη-Σχεσιακά Δεδομένα el
dc.subject Privacy en
dc.subject Privacy Preservation en
dc.subject Anonymity en
dc.subject Anonymous Data Publishing en
dc.subject Non-Relational Data en
dc.title Προστασία Της Ιδιωτικότητας Στην Δημοσίευση Μη Σχεσιακών Δεδομένων el
dc.title Privacy-Preserving Publications of Non-Relational Data en
dc.contributor.department Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών - Εργαστήριο Συστημάτων Βάσεων Γνώσεων και Δεδομένων el
heal.type doctoralThesis
heal.classification Πληροφορική el
heal.classification Computer Science en
heal.classification Προστασία Ιδιωτικότητας el
heal.classification Privacy Preservation en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-10-29
heal.abstract Η παρούσα διδακτορική διατριβή πραγματεύεται ζητήματα προστασίας της ιδιωτικότητας σε δημοσιεύσεις μη σχεσιακών δεδομένων. Η σχετική έρευνα αφορά σε ανάπτυξη και υλοποίηση αλγορίθμων οι οποίοι τροποποιούν τα προς δημοσίευση δεδομένα κατά τέτοιο τρόπο ώστε να μην αποκαλύπτεται η ταυτότητα των εγγραφών και η ευαίσθητη πληροφορία των ατόμων. Μεγάλο εύρος καθημερινών ανθρώπινων δραστηριοτήτων όπως οι ιατρικές εξετάσεις, οι αγορές μέσω πιστωτικών καρτών, οι ιστοσελίδες κοινωνικής δικτύωσης, η χρήση μηχανών αναζήτησης στο διαδίκτυο, κτλ. προκαλούν την καταγραφή πληροφορίας. Η δημοσίευση ή διανομή αυτή των δεδομένων θέτει σε κίνδυνο την ιδιωτικότητα των χρηστών, καθώς ακόμα και μετά την απαλοιφή μόνο των μοναδικών αναγνωριστικών (ΑΦΜ, ονοματεπώνυμο), συνδυασμοί άλλων γνωρισμάτων (π.χ. φύλο, ηλικία, ΤΚ) μπορεί να είναι σπάνιοι και να λειτουργήσουν ως ψευδο-αναγνωριστικά, αποκαλύπτοντας την ταυτότητα των εγγραφών. Σκοπός των μεθόδων ανωνυμοποίησης είναι να αποφευχθεί η ταυτοποίηση εγγραφών από κακόβουλους επιτιθέμενους, ώστε να μην μπορεί να αποκαλυφθεί ευαίσθητη πληροφορία ατόμων. Αυτό επιτυγχάνεται με μετασχηματισμό των δεδομένων ώστε να μην είναι δυνατή η παραβίαση κάποιας εγγύησης ιδιωτικότητας. Η διαδικασία αυτή επιφέρει κάποια απώλεια πληροφορίας στα τελικά δεδομένα διότι αποκρύπτει ή αλλοιώνει μέρος της πληροφορίας των ψευδο-αναγνωριστικών. Οι αλγόριθμοι ανωνυμοποίησης έχουν ως στόχο την εύρεση της χρυσής τομής ανάμεσα στην προστασία της ιδιωτικότητας και στην χρησιμότητα των δεδομένων. Στη σχετική βιβλιογραφία έχουν γίνει πολλά βήματα στην προστασία της ιδιωτικότητας σχεσιακών δεδομένων. Στα πλαίσια της παρούσας διατριβής επικεντρωνόμαστε στην ανωνυμοποίηση (α) δεδομένων με δενδρική δομή, όπως είναι τα XML δεδομένα αλλά και οι σχεσιακές βάσεις με πολλούς πίνακες που συνδέονται μεταξύ τους με ξένα κλειδιά, (β) δεδομένων με δομή γράφου με έμφαση στα διασυνδεδεμένα δεδομένα και ειδικά τα δεδομένα RDF λόγω της ευρείας διάδοσής τους στον Παγκόσμιο Ιστό, και (γ) αραιών πολυδιάστατων δεδομένων χωρίς δομή που αποτελούνται από σύνολα συνεχών αριθμητικών τιμών, όπως π.χ. τα οικονομικά δεδομένα από σύνολα πληρωμών ή αγορών από πιστωτικές κάρτες. Επίσης, μελετήθηκαν διαφορετικά μοντέλα επίθεσης, όπως (i) το σενάριο όπου συναθροιστική γνώση των αριθμητικών τιμών των γνωρισμάτων κάποιας εγγραφής δεδομένων (π.χ. άθροισμα, μέσος όρος) μπορεί να χρησιμοποιηθεί για να γίνει ταυτοποίησή της, και (ii) πιο πολύπλοκα σενάρια επίθεσης που περιλαμβάνουν την γνώση πολλαπλών συναρτήσεων που καθεμία ορίζεται πάνω σε οποιοδήποτε υποσύνολο των πραγματικών τιμών των γνωρισμάτων μιας εγγραφής. el
heal.abstract This doctoral thesis addresses issues of privacy preservation on the publications of non-relational datasets. The research focuses on proposing and implementing anonymization algorithms which transform the datasets to be published, so that the identity of each record and the personal information of individuals are not revealed. A broad spectrum of human activities, such as medical examinations, credit card purchases, internet searching, webpage browsing, etc. produce massive amounts of data. Their publication or sharing is posing a threat to the privacy of users; even after the elimination of direct identifiers (SSN, full name) the combinations of other attributes (such as gender, age, or zip code) may be rare enough to act as quasi-identifiers, thus revealing the identity of records. Anonymization methods aim at preventing the identification of records by malicious attackers, so that the sensitive information concerning individuals will not be revealed. This can be achieved by transforming the data in order to ensure that a given privacy guarantee is not violated. This process causes an information loss of the released data as it alters or conceals part of the quasi-identifier values. The goal of anonymization algorithms is to achieve the best balance between the privacy preservation of individuals and the utility of the released data. Several steps have been made in the related literature on the privacy of relational data. The main focus of this thesis is the anonymization of (a) tree-structured data, such as XML data, as well as joined records from a relational database which includes many tables linked together via foreign keys, (b) graph-structured data such as linked and RDF data which are popular on the Web, and (c) unstructured sparse multidimensional data where every record is a bag of continuous numerical values, such as financial payment data or credit card purchases. Furthermore, alternative attack models were studied, such as (i) the scenario where the aggregate knowledge of the numerical data values (e.g. sum, average) can lead to the identification of a personal record, and (ii) more complex attack scenarios which include the knowledge of multiple functions, each being defined on any subset of the numerical attributes of a record. en
heal.sponsor H παρούσα έρευνα έχει συγχρηματοδοτηθεί από την Ευρωπαϊκή Ένωση (Ευρωπαϊκό Κοινωνικό Ταμείο - ΕΚΤ) και από εθνικούς πόρους μέσω του Επιχειρησιακού Προγράμματος "Εκπαίδευση και Δια Βίου Μάθηση" του Εθνικού Στρατηγικού Πλαισίου Αναφοράς (ΕΣΠΑ) - Ερευνητικό Χρηματοδοτούμενο Έργο: Ηράκλειτος ΙΙ . Επένδυση στην κοινωνία της γνώσης μέσω του Ευρωπαϊκού Κοινωνικού Ταμείου. el
heal.advisorName Βασιλείου, Ιωάννης el
heal.advisorName Vassiliou, Yannis en
heal.committeeMemberName Βασιλείου, Ιωάννης el
heal.committeeMemberName Σελλής, Τιμολέων el
heal.committeeMemberName Δαλαμάγκας, Θεόδωρος el
heal.committeeMemberName Κοντογιάννης, Κώστας el
heal.committeeMemberName Στάμου, Γιώργος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Βασιλειάδης, Παναγιώτης el
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 174
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής