HEAL DSpace

Εκτίμηση Παραμέτρων Γραφημάτων από Θορυβώδη Δείγματα και Ερωτήματα

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Πήττας, Αθανάσιος el
dc.contributor.author Pittas, Athanasios en
dc.date.accessioned 2020-05-07T15:41:32Z
dc.date.available 2020-05-07T15:41:32Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/50417
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.18115
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by/3.0/gr/ *
dc.subject Εκτιμητική el
dc.subject Τρίγωνα el
dc.subject Μάθηση el
dc.subject Θεωρία Πληροφορίας el
dc.subject Αλγόριθμοι el
dc.subject Estimation en
dc.subject Triangles el
dc.subject Learning el
dc.subject Information Theory el
dc.subject Algorithms el
dc.title Εκτίμηση Παραμέτρων Γραφημάτων από Θορυβώδη Δείγματα και Ερωτήματα el
dc.title Estimation of Graph Parameters from Noisy Samples and Queries en
heal.type bachelorThesis
heal.classification Θεωρητική Πληροφορική el
heal.classification Computer Science en
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2019-10-18
heal.abstract Η μέτρηση του πλήθους εμφανίσεων μικρών υπογραφημάτων σε μεγαλύτερα γραφήματα είναι μια κρίσιμη εργασία για πολλές εφαρμογές. Πιο συγκεκριμένα, τα τρίγωνα εμπλέκονται στον ορισμό μετρικών όπως ο συντελεστής ομαδοποίησης (clustering coefficient) και ο λόγος μεταβατικότητας (transitivity ratio), που είναι θεμελιώδεις στη μελέτη σύνθετων δικτύων. Μια δυσκολία στον υπολογισμό αυτών των παραμέτρων είναι ότι συχνά τα γραφήματα προς μελέτη δεν είναι πλήρως διαθέσιμα για διάφορους λόγους. Σε αυτή την διπλωματική εργασία, ορίζουμε ένα μοντέλο θορύβου παρακινούμενοι από την ιδιωτικότητα στα κοινωνικά δίκτυα, δηλαδή το γεγονός ότι οι χρήστες μπορούν να θέτουν τους φίλους τους ως κρυφούς. Ειδικότερα, έχουμε ένα αυθεντικό γράφημα όπου κάθε κορυφή εκτελεί ένα πείραμα Bernoulli με κάποια γνωστή πιθανότητα επιτυχίας και το θορυβώδες δείγμα ορίζεται αφαιρώντας τις ακμές για τις οποίες και τα δύο άκρα σημειώνουν επιτυχία στα πειράματα. Ο στόχος είναι η εκτίμηση του πλήθους ακμών και τριγώνων του αυθεντικού γραφήματος εντός μικρού πολλαπλασιαστικού σφάλματος, με μεγάλη πιθανότητα. Αρχικά, βρίσκουμε τέτοιες εκτιμήτριες και αποδεικνύουμε αντίστοιχα κάτω φράγματα για το απαιτούμενο πλήθος δειγμάτων, βασισμένα στην θεωρία πληροφορίας. Έπειτα, επιτρέπουμε στους αλγορίθμους μας να έχουν επιπλέον πρόσβαση στο αυθεντικό γράφημα μέσω μαντείου που αποκαλύπτει την πραγματική γειτονιά κορυφών και επεκτείνουμε τις προηγούμενες εκτιμήτριες για αυτή την περίπτωση. Ο αριθμός των δειγμάτων που χρειάζονται γίνεται σταθερός και το πλήθος των ερωτημάτων προς το μαντείο εξαρτάται μόνο από τις παραμέτρους ακρίβειας και όχι από το μέγεθος του γραφήματος. el
heal.abstract Counting the number of occurrences of fixed subgraphs in larger graphs is a crucial task for many applications. More specifically, triangles are involved in the definition of metrics such as the clustering coefficient and the transitivity ratio, which are fundamental in complex network analysis. A difficulty for the calculation of these parameters is that input graphs are often incomplete for various reasons. In this thesis we introduce a noise model motivated by the privacy constraints in social networks, that is, the fact that users can mark their friends as hidden from the public. More precisely, we have an underlying graph where each vertex performs a Bernoulli trial with some known probability of success and the noisy sample graph is defined by removing the edges for which both endpoints succeed in the trials. The goal is to estimate the number of edges and triangles of the underlying graph within a small relative error, with high probability. First, we derive such estimators and prove matching information theoretic lower bounds for the sample complexity of these tasks. Then, we allow our algorithms to have additional query access to the underlying graph by asking vertices to reveal their true neighborhood and we extend the previous estimators in this setting. The number of samples required becomes constant and the number of queries depends only on the accuracy parameters and not the size of the graph. en
heal.advisorName Φωτάκης, Δημήτρης el
heal.committeeMemberName Φωτάκης, Δημήτρης el
heal.committeeMemberName Παγουρτζής, Άρης el
heal.committeeMemberName Παπασπύρου, Νικόλαος
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 82 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού 3.0 Ελλάδα