dc.contributor.author |
Μιχελακάκη, Ειρήνη
|
el |
dc.contributor.author |
Michelakaki, Eirini
|
en |
dc.date.accessioned |
2018-09-18T09:58:58Z |
|
dc.date.available |
2018-09-18T09:58:58Z |
|
dc.date.issued |
2018-09-18 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/47617 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.15533 |
|
dc.rights |
Default License |
|
dc.subject |
Προσεγγιστική επεξεργασία ερωτημάτων |
el |
dc.subject |
Βάσεις δεδομένων |
el |
dc.subject |
Κατανεμημένα συστήματα |
el |
dc.subject |
Διαδραστική αναλυτική επεξεργασία |
el |
dc.subject |
Δειγματοληψία |
el |
dc.subject |
Διαδραστική συνάθροιση |
el |
dc.subject |
Approximate query processing |
en |
dc.subject |
Databases |
en |
dc.subject |
Distributed systems |
en |
dc.subject |
Online analytical pro-cessing |
en |
dc.subject |
Sampling |
en |
dc.subject |
Online aggregation |
en |
dc.subject |
Data exploration |
en |
dc.title |
Πειραματική αξιολόγηση προσεγγιστικών βάσεων δεδομένων |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Παράλληλος και κατανεμημένος υπολογισμός |
el |
heal.classificationURI |
http://data.seab.gr/concepts/c1d404f10706d40f4217b57d522765f22fec3f43 |
|
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2018-03-28 |
|
heal.abstract |
Η μεγάλη αύξηση των παραγόμενων δεδομένων την περασμένη δεκαετία δημιούργησε πρωτοφανείς ευκαιρίες τόσο στην ανάπτυξη ερευνητικών ιδεών όσο και στη λήψη αποφάσεων στον επιχειρηματικό κόσμο. Τελευταία δίνεται ακόμα μεγαλύτερη έμφαση στη διαδραστική αλληλεπίδραση με μεγάλους όγκους δεδομένων. Δοθέντος ενός συνόλου δεδομένων, ο αναλυτής που καλείται να τα επεξεργαστεί, θα πρέπει ιδανικά να είναι σε θέση να εξάγει πληροφορία από αυτά εντός μερικών milliseconds ή λίγων δευτερολέπτων. Έχει παρατηρηθεί ότι όταν το σύνολο των δεδομένων είναι αρκετά μεγάλο, η κλιμάκωση της αρχιτεκτονικής και του hardware δεν είναι ικανή από μόνη της για να ικανοποιήσει αυτόν τον περιορισμό. Στο πλαίσιο αυτό έχουν αναπτυχθεί τεχνικές που βασίζονται στην προσεγγιστική επεξεργασία των ερωτημάτων. Τα συστήματα προσεγγιστικής επεξεργασίας επιτυγχάνουν υψηλή διαδραστικότητα θυσιάζοντας την ακρίβεια του αποτελέσματος που επιστρέφουν. Στην διπλωματική αυτή, μελετάμε τη συμπεριφορά τριών διαφορετικών συστημάτων προσεγγιστικής επεξεργασίας που βασίζονται σε αλγορίθμους δειγματοληψίας. Τα συστήματα αξιολογούνται (i) ως προς τον χρόνο απόκρισης σε απλά συναθροιστικά ερωτήματα και (ii) ως προς την ακρίβεια που επιτυγχάνουν κατά την προσέγγιση του αποτελέσματος. Τα πειράματά μας έδειξαν πως πράγματι, για ορισμένες κατανομές δεδομένων ή όταν υπάρχει πρότερη γνώση της κατανομής των ερωτημάτων, τα συστήματα αυτά είναι ικανά να παρέχουν σχεδόν ακριβείς απαντήσεις ενώ παράλληλα διατηρούν διαδραστική απόκριση. |
el |
heal.abstract |
The data deluge of the last decade created new opportunities for both the academic and the business world. New ideas and techniques were flourished and decision making adopted a data-oriented fashion. As these decisions should often be taken in real-time, nowadays, more emphasis is put on the interactive processing of large data volumes. Ide- ally, an analyst should be able to extract information from a dataset within a few seconds. Satisfying this constraint by scaling only the hardware falls short when large datasets are the case. To this end, approximate query processing proves to be a very useful technique. In approximate systems, result quality is traded for interactive responses. In this diplo- ma thesis, we study the behavior of three sampling-based approximate query processing systems. Our evaluation is carried out with respect to: (i) the response time in simple aggregate SQL queries and (ii) the achieved accuracy of the approximate answers. Our experiments show that these systems are highly favored by some data distributions or in the case where workload is known a-priori. In these two cases, interactive yet accurate results can be provided for arbitrary dataset sizes. |
en |
heal.advisorName |
Κοζύρης, Νεκτάριος |
el |
heal.committeeMemberName |
Τσουμάκος, Δημήτριος |
el |
heal.committeeMemberName |
Καντερέ, Βασιλική |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
60 σ. |
el |
heal.fullTextAvailability |
true |
|