HEAL DSpace

Query optimization under bag and bag-set semantics for multiple heterogeneous data sources

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Αφράτη, Φώτω el
dc.contributor.author Δαμίγος, Ματθαίος Γ. el
dc.contributor.author Damigos, Matτheos G. en
dc.date.accessioned 2011-05-13T07:27:51Z
dc.date.available 2011-05-13T07:27:51Z
dc.date.copyright 2011-05-12
dc.date.issued 2011-05-13T07:27:51Z
dc.date.submitted 2012-05-12
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/4025
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.137
dc.description 184 σ. el
dc.description.abstract Στην συγκεκριμένη διατριβή, μελετάμε ανάπτυξη τεχνικών βελτιστοποίησης ερωτημάτων με την χρήση όψεων, σε σχεσιακές και XML βάσεις δεδομένων. Ειδικότερα, επικεντρωνόμαστε στα ακόλουθα βασικά προβλήματα βελτιστοποίησης ερωτημάτων: την περιεκτικότητα ερωτημάτων, την αναδιατύπωση ερωτημάτων και την επιλογή όψεων. Στις σχεσιακές βάσεις δεδομένων, επικεντρωνόμαστε στα συζευκτικά ερωτήματα (εν συντομία CQs), που αντιστοιχούν σε SQL ερωτήματα με χρήση των τελεστών select, project και join. Επίσης, χρησιμοποιούμε σημασιολογίες πολυσυνόλου (οι βασικές σχέσεις και οι απαντήσεις των ερωτημάτων είναι πολυσύνολα) και συνόλου-πολυσυνόλου (οι βασικές σχέσεις είναι σύνολα, ενώ οι απαντήσεις είναι πολυσύνολα) για να περιγράψουμε, θεωρητικά, την σημασιολογία της SQL. Για ερωτήματα σε XML δεδομένα χρησιμοποιούμε την γλώσσα XPath, και ειδικότερα επικεντρωνόμαστε στις τρεις βασικές υποκλάσεις της γλώσσας, που σχηματίζεται από την χρήση δύο από τα τρία βασικά συστατικά: wildcard ετικέτες (*), ακμές απογόνου (//) και κλαδιά ([ ]). Στο πλαίσιο της περιεκτικότητας ερωτημάτων μελετάμε το πρόβλημα, καθώς και την πολυπλοκότητα του, για βασικές υποκλάσεις των CQs. Για την γενική κλάση των CQs το πρόβλημα παραμένει ανοικτό εδώ και μια δεκαετία. Επιπλέον, μελετάμε τα προβλήματα περιεκτικότητας και ισοδυναμίας για ενώσεις XPath ερωτημάτων. Για την αναδιατύπωση CQ ερωτημάτων, περιγράφουμε βασικές συνθήκες που πρέπει να πληρούν οι όψεις έτσι ώστε να υπάρχει μία ισοδύναμη αναδιατύπωση. Για τα XPath ερωτήματα που σχηματίζονται από // και *, δείχνουμε ότι η χρήση του τελεστή ένωσης απαιτείται για την εύρεση ισοδύναμης αναδιατύπωσης. Το πρόβλημα επιλογής όψεων μελετάται για CQ ερωτήματα, όπου επικεντρωνόμαστε στον περιορισμό του χώρου αναζήτησης βέλτιστων λύσεων. Ειδικότερα, δείχνομαι ότι εάν η επιλογή του συνόλου όψεων γίνεται βάσει συγκεκριμένων συνθηκών (ως προς την μορφή των όψεων), τότε εξασφαλίζεται η εύρεση τουλάχιστον μίας βέλτιστης λύσης για το πρόβλημα. Έπειτα, επικεντρωνόμενοι σε υποκλάσεις των CQ ερωτημάτων, δείχνουμε ότι για ένα σύνολο ερωτημάτων αλυσίδας, και για τις δύο σημασιολογίες, όψεις που ορίζονται, και αυτές, από ερωτήματα αλυσίδας δεν επαρκούν, πάντα, για την εύρεση βέλτιστης λύσης. Στην περίπτωση, όμως, των ερωτημάτων μονοπατιού, και θεωρώντας σημασιολογία πολυσυνόλου, δείχνουμε ότι οι όψεις που ορίζονται από ερωτήματα μονοπατιού μας εξασφαλίζουν την εύρεση τουλάχιστον μίας βέλτιστης λύσης για το πρόβλημα επιλογής όψεων. el
dc.description.abstract In this thesis, we investigate techniques for query optimization using a set of views, considering both relational and XML databases. In particular, we focus on three fundamental problems of query optimization; which are the query containment, the query rewriting and the view selection. For relational databases we focus on the class of select-project-join SQL queries with equality comparisons, a.k.a. conjunctive queries (CQs for short). We consider two kinds of semantics to theoretically approximate the SQL semantics: the bag (multiple occurrences of the same tuple are allowed in both base relations and answers of queries) and bag-set semantics (the base relations are sets and the operators are liable for bag-results). For XML databases, we focus on XPath. Especially, we focus on the major fragments of XPath which contain two of the constructs: wildcard, descendant edge and branches. Query containment under both bag and bag-set semantics is investigated through a detailed analysis of special cases of CQs. The complexity in each case is given, as well. For the general case, the problem remains open for more than a decade. Moreover, we give necessary and sufficient conditions for deciding both containment and equivalence for unions of XPath queries; a problem which was not investigated in depth, in the past. The problem of finding an equivalent rewriting is also investigated for both relational and XPath queries. In particular, for relational queries, we describe the requirements that a set of views have to satisfy in order to give an equivalent rewriting of a CQ under both bag and bag-set semantics. In the case of XML databases, we investigate the problem of rewriting an XPath query using multiple views, and prove that in the case that the query contains both descendant edges and wildcards, the union operator may be required for finding an equivalent rewriting. The view selection is investigated for workloads of CQs under both bag and bag-set semantics. Especially, we aim to limit the search space of candidate viewsets. We start with the general case, where we give a tight condition that candidate views can satisfy and still the search space does contain at least one optimal solution. Then we study special cases. We show that for chain query workloads under both bag and bag-set semantics, taking only chain views may miss optimal solution, whereas, if we further limit the queries to be path queries, then under bag semantics, path views suffice. en
dc.description.statementofresponsibility Ματθαίος Γ. Δαμίγος el
dc.format.extent 175 bytes
dc.format.mimetype text/xml
dc.language.iso en en
dc.rights ETDFree-policy.xml en
dc.subject Βελτιστοποίηση ερωτημάτων el
dc.subject Σημασιολογία πολυσυνόλου el
dc.subject Σημασιολογία συνόλου-πολυσυνόλου el
dc.subject Συζευκτικά ερωτήματα el
dc.subject Επιλογή όψεων el
dc.subject Μετασχηματισμός ερωτημάτων el
dc.subject Περιεκτικότητα ερωτημάτων el
dc.subject Ισοδυναμία ερωτημάτων el
dc.subject Ημιδομημένα δεδομένα el
dc.subject Ετερογενείς πηγές πληροφόρησης el
dc.subject Query optimization en
dc.subject Bag semantics en
dc.subject Bag-set semantics en
dc.subject Conjunctive queries en
dc.subject View selection en
dc.subject Query rewriting en
dc.subject Query containment en
dc.subject Query equivalence en
dc.subject XML data en
dc.subject Heterogeneous data sources en
dc.title Query optimization under bag and bag-set semantics for multiple heterogeneous data sources en
dc.title.alternative Βελτιστοποίηση ερωτημάτων χρησιμοποιώντας σημασιολογία πολυσυνόλου και συνόλου-πολυσυνόλου σε περιβάλλον ετερογενών πηγών πληροφόρησης el
dc.type doctoralThesis el (en)
dc.date.accepted 2011-03-03
dc.date.modified 2011-05-12
dc.contributor.advisorcommitteemember Γεργατσούλης, Μανόλης el
dc.contributor.advisorcommitteemember Βασιλείου, Ιωάννης el
dc.contributor.committeemember Αφράτη, Φώτω el
dc.contributor.committeemember Γεργατσούλης, Μανόλης el
dc.contributor.committeemember Βασιλείου, Ιωάννης el
dc.contributor.committeemember Σελλής, Τιμολέων el
dc.contributor.committeemember Ροντογιάννης, Παναγιώτης el
dc.contributor.committeemember Ζησιμόπουλος, Βασίλειος el
dc.contributor.committeemember Παπασπύρου, Νικόλαος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής & Συστημάτων Πληροφορικής el
dc.date.recordmanipulation.recordcreated 2011-05-13
dc.date.recordmanipulation.recordmodified 2011-05-13


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής