dc.contributor.advisor |
Αφράτη, Φώτω |
el |
dc.contributor.author |
Δαμίγος, Ματθαίος Γ.
|
el |
dc.contributor.author |
Damigos, Matτheos G.
|
en |
dc.date.accessioned |
2011-05-13T07:27:51Z |
|
dc.date.available |
2011-05-13T07:27:51Z |
|
dc.date.copyright |
2011-05-12 |
|
dc.date.issued |
2011-05-13T07:27:51Z |
|
dc.date.submitted |
2012-05-12 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/4025 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.137 |
|
dc.description |
184 σ. |
el |
dc.description.abstract |
Στην συγκεκριμένη διατριβή, μελετάμε ανάπτυξη τεχνικών βελτιστοποίησης ερωτημάτων με την χρήση όψεων, σε σχεσιακές και XML βάσεις δεδομένων. Ειδικότερα, επικεντρωνόμαστε στα ακόλουθα βασικά προβλήματα βελτιστοποίησης ερωτημάτων: την περιεκτικότητα ερωτημάτων, την αναδιατύπωση ερωτημάτων και την επιλογή όψεων. Στις σχεσιακές βάσεις δεδομένων, επικεντρωνόμαστε στα συζευκτικά ερωτήματα (εν συντομία CQs), που αντιστοιχούν σε SQL ερωτήματα με χρήση των τελεστών select, project και join. Επίσης, χρησιμοποιούμε σημασιολογίες πολυσυνόλου (οι βασικές σχέσεις και οι απαντήσεις των ερωτημάτων είναι πολυσύνολα) και συνόλου-πολυσυνόλου (οι βασικές σχέσεις είναι σύνολα, ενώ οι απαντήσεις είναι πολυσύνολα) για να περιγράψουμε, θεωρητικά, την σημασιολογία της SQL. Για ερωτήματα σε XML δεδομένα χρησιμοποιούμε την γλώσσα XPath, και ειδικότερα επικεντρωνόμαστε στις τρεις βασικές υποκλάσεις της γλώσσας, που σχηματίζεται από την χρήση δύο από τα τρία βασικά συστατικά: wildcard ετικέτες (*), ακμές απογόνου (//) και κλαδιά ([ ]). Στο πλαίσιο της περιεκτικότητας ερωτημάτων μελετάμε το πρόβλημα, καθώς και την πολυπλοκότητα του, για βασικές υποκλάσεις των CQs. Για την γενική κλάση των CQs το πρόβλημα παραμένει ανοικτό εδώ και μια δεκαετία. Επιπλέον, μελετάμε τα προβλήματα περιεκτικότητας και ισοδυναμίας για ενώσεις XPath ερωτημάτων. Για την αναδιατύπωση CQ ερωτημάτων, περιγράφουμε βασικές συνθήκες που πρέπει να πληρούν οι όψεις έτσι ώστε να υπάρχει μία ισοδύναμη αναδιατύπωση. Για τα XPath ερωτήματα που σχηματίζονται από // και *, δείχνουμε ότι η χρήση του τελεστή ένωσης απαιτείται για την εύρεση ισοδύναμης αναδιατύπωσης. Το πρόβλημα επιλογής όψεων μελετάται για CQ ερωτήματα, όπου επικεντρωνόμαστε στον περιορισμό του χώρου αναζήτησης βέλτιστων λύσεων. Ειδικότερα, δείχνομαι ότι εάν η επιλογή του συνόλου όψεων γίνεται βάσει συγκεκριμένων συνθηκών (ως προς την μορφή των όψεων), τότε εξασφαλίζεται η εύρεση τουλάχιστον μίας βέλτιστης λύσης για το πρόβλημα. Έπειτα, επικεντρωνόμενοι σε υποκλάσεις των CQ ερωτημάτων, δείχνουμε ότι για ένα σύνολο ερωτημάτων αλυσίδας, και για τις δύο σημασιολογίες, όψεις που ορίζονται, και αυτές, από ερωτήματα αλυσίδας δεν επαρκούν, πάντα, για την εύρεση βέλτιστης λύσης. Στην περίπτωση, όμως, των ερωτημάτων μονοπατιού, και θεωρώντας σημασιολογία πολυσυνόλου, δείχνουμε ότι οι όψεις που ορίζονται από ερωτήματα μονοπατιού μας εξασφαλίζουν την εύρεση τουλάχιστον μίας βέλτιστης λύσης για το πρόβλημα επιλογής όψεων. |
el |
dc.description.abstract |
In this thesis, we investigate techniques for query optimization using a set of views, considering both relational and XML databases. In particular, we focus on three fundamental problems of query optimization; which are the query containment, the query rewriting and the view selection. For relational databases we focus on the class of select-project-join SQL queries with equality comparisons, a.k.a. conjunctive queries (CQs for short). We consider two kinds of semantics to theoretically approximate the SQL semantics: the bag (multiple occurrences of the same tuple are allowed in both base relations and answers of queries) and bag-set semantics (the base relations are sets and the operators are liable for bag-results). For XML databases, we focus on XPath. Especially, we focus on the major fragments of XPath which contain two of the constructs: wildcard, descendant edge and branches. Query containment under both bag and bag-set semantics is investigated through a detailed analysis of special cases of CQs. The complexity in each case is given, as well. For the general case, the problem remains open for more than a decade. Moreover, we give necessary and sufficient conditions for deciding both containment and equivalence for unions of XPath queries; a problem which was not investigated in depth, in the past. The problem of finding an equivalent rewriting is also investigated for both relational and XPath queries. In particular, for relational queries, we describe the requirements that a set of views have to satisfy in order to give an equivalent rewriting of a CQ under both bag and bag-set semantics. In the case of XML databases, we investigate the problem of rewriting an XPath query using multiple views, and prove that in the case that the query contains both descendant edges and wildcards, the union operator may be required for finding an equivalent rewriting. The view selection is investigated for workloads of CQs under both bag and bag-set semantics. Especially, we aim to limit the search space of candidate viewsets. We start with the general case, where we give a tight condition that candidate views can satisfy and still the search space does contain at least one optimal solution. Then we study special cases. We show that for chain query workloads under both bag and bag-set semantics, taking only chain views may miss optimal solution, whereas, if we further limit the queries to be path queries, then under bag semantics, path views suffice. |
en |
dc.description.statementofresponsibility |
Ματθαίος Γ. Δαμίγος |
el |
dc.format.extent |
175 bytes |
|
dc.format.mimetype |
text/xml |
|
dc.language.iso |
en |
en |
dc.rights |
ETDFree-policy.xml |
en |
dc.subject |
Βελτιστοποίηση ερωτημάτων |
el |
dc.subject |
Σημασιολογία πολυσυνόλου |
el |
dc.subject |
Σημασιολογία συνόλου-πολυσυνόλου |
el |
dc.subject |
Συζευκτικά ερωτήματα |
el |
dc.subject |
Επιλογή όψεων |
el |
dc.subject |
Μετασχηματισμός ερωτημάτων |
el |
dc.subject |
Περιεκτικότητα ερωτημάτων |
el |
dc.subject |
Ισοδυναμία ερωτημάτων |
el |
dc.subject |
Ημιδομημένα δεδομένα |
el |
dc.subject |
Ετερογενείς πηγές πληροφόρησης |
el |
dc.subject |
Query optimization |
en |
dc.subject |
Bag semantics |
en |
dc.subject |
Bag-set semantics |
en |
dc.subject |
Conjunctive queries |
en |
dc.subject |
View selection |
en |
dc.subject |
Query rewriting |
en |
dc.subject |
Query containment |
en |
dc.subject |
Query equivalence |
en |
dc.subject |
XML data |
en |
dc.subject |
Heterogeneous data sources |
en |
dc.title |
Query optimization under bag and bag-set semantics for multiple heterogeneous data sources |
en |
dc.title.alternative |
Βελτιστοποίηση ερωτημάτων χρησιμοποιώντας σημασιολογία πολυσυνόλου και συνόλου-πολυσυνόλου σε περιβάλλον ετερογενών πηγών πληροφόρησης |
el |
dc.type |
doctoralThesis |
el (en) |
dc.date.accepted |
2011-03-03 |
|
dc.date.modified |
2011-05-12 |
|
dc.contributor.advisorcommitteemember |
Γεργατσούλης, Μανόλης |
el |
dc.contributor.advisorcommitteemember |
Βασιλείου, Ιωάννης |
el |
dc.contributor.committeemember |
Αφράτη, Φώτω |
el |
dc.contributor.committeemember |
Γεργατσούλης, Μανόλης |
el |
dc.contributor.committeemember |
Βασιλείου, Ιωάννης |
el |
dc.contributor.committeemember |
Σελλής, Τιμολέων |
el |
dc.contributor.committeemember |
Ροντογιάννης, Παναγιώτης |
el |
dc.contributor.committeemember |
Ζησιμόπουλος, Βασίλειος |
el |
dc.contributor.committeemember |
Παπασπύρου, Νικόλαος |
el |
dc.contributor.department |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής & Συστημάτων Πληροφορικής |
el |
dc.date.recordmanipulation.recordcreated |
2011-05-13 |
|
dc.date.recordmanipulation.recordmodified |
2011-05-13 |
|