dc.contributor.author | Πήττας, Αθανάσιος | el |
dc.contributor.author | Pittas, Athanasios | en |
dc.date.accessioned | 2020-05-07T15:41:32Z | |
dc.date.available | 2020-05-07T15:41:32Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/50417 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.18115 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Εκτιμητική | el |
dc.subject | Τρίγωνα | el |
dc.subject | Μάθηση | el |
dc.subject | Θεωρία Πληροφορίας | el |
dc.subject | Αλγόριθμοι | el |
dc.subject | Estimation | en |
dc.subject | Triangles | el |
dc.subject | Learning | el |
dc.subject | Information Theory | el |
dc.subject | Algorithms | el |
dc.title | Εκτίμηση Παραμέτρων Γραφημάτων από Θορυβώδη Δείγματα και Ερωτήματα | el |
dc.title | Estimation of Graph Parameters from Noisy Samples and Queries | en |
heal.type | bachelorThesis | |
heal.classification | Θεωρητική Πληροφορική | el |
heal.classification | Computer Science | en |
heal.language | el | |
heal.language | en | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2019-10-18 | |
heal.abstract | Η μέτρηση του πλήθους εμφανίσεων μικρών υπογραφημάτων σε μεγαλύτερα γραφήματα είναι μια κρίσιμη εργασία για πολλές εφαρμογές. Πιο συγκεκριμένα, τα τρίγωνα εμπλέκονται στον ορισμό μετρικών όπως ο συντελεστής ομαδοποίησης (clustering coefficient) και ο λόγος μεταβατικότητας (transitivity ratio), που είναι θεμελιώδεις στη μελέτη σύνθετων δικτύων. Μια δυσκολία στον υπολογισμό αυτών των παραμέτρων είναι ότι συχνά τα γραφήματα προς μελέτη δεν είναι πλήρως διαθέσιμα για διάφορους λόγους. Σε αυτή την διπλωματική εργασία, ορίζουμε ένα μοντέλο θορύβου παρακινούμενοι από την ιδιωτικότητα στα κοινωνικά δίκτυα, δηλαδή το γεγονός ότι οι χρήστες μπορούν να θέτουν τους φίλους τους ως κρυφούς. Ειδικότερα, έχουμε ένα αυθεντικό γράφημα όπου κάθε κορυφή εκτελεί ένα πείραμα Bernoulli με κάποια γνωστή πιθανότητα επιτυχίας και το θορυβώδες δείγμα ορίζεται αφαιρώντας τις ακμές για τις οποίες και τα δύο άκρα σημειώνουν επιτυχία στα πειράματα. Ο στόχος είναι η εκτίμηση του πλήθους ακμών και τριγώνων του αυθεντικού γραφήματος εντός μικρού πολλαπλασιαστικού σφάλματος, με μεγάλη πιθανότητα. Αρχικά, βρίσκουμε τέτοιες εκτιμήτριες και αποδεικνύουμε αντίστοιχα κάτω φράγματα για το απαιτούμενο πλήθος δειγμάτων, βασισμένα στην θεωρία πληροφορίας. Έπειτα, επιτρέπουμε στους αλγορίθμους μας να έχουν επιπλέον πρόσβαση στο αυθεντικό γράφημα μέσω μαντείου που αποκαλύπτει την πραγματική γειτονιά κορυφών και επεκτείνουμε τις προηγούμενες εκτιμήτριες για αυτή την περίπτωση. Ο αριθμός των δειγμάτων που χρειάζονται γίνεται σταθερός και το πλήθος των ερωτημάτων προς το μαντείο εξαρτάται μόνο από τις παραμέτρους ακρίβειας και όχι από το μέγεθος του γραφήματος. | el |
heal.abstract | Counting the number of occurrences of fixed subgraphs in larger graphs is a crucial task for many applications. More specifically, triangles are involved in the definition of metrics such as the clustering coefficient and the transitivity ratio, which are fundamental in complex network analysis. A difficulty for the calculation of these parameters is that input graphs are often incomplete for various reasons. In this thesis we introduce a noise model motivated by the privacy constraints in social networks, that is, the fact that users can mark their friends as hidden from the public. More precisely, we have an underlying graph where each vertex performs a Bernoulli trial with some known probability of success and the noisy sample graph is defined by removing the edges for which both endpoints succeed in the trials. The goal is to estimate the number of edges and triangles of the underlying graph within a small relative error, with high probability. First, we derive such estimators and prove matching information theoretic lower bounds for the sample complexity of these tasks. Then, we allow our algorithms to have additional query access to the underlying graph by asking vertices to reveal their true neighborhood and we extend the previous estimators in this setting. The number of samples required becomes constant and the number of queries depends only on the accuracy parameters and not the size of the graph. | en |
heal.advisorName | Φωτάκης, Δημήτρης | el |
heal.committeeMemberName | Φωτάκης, Δημήτρης | el |
heal.committeeMemberName | Παγουρτζής, Άρης | el |
heal.committeeMemberName | Παπασπύρου, Νικόλαος | |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 82 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: