HEAL DSpace

Optimizing SQL-based unbounded regular path queries in a relational database

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κοσμάς, Γεώργιος el
dc.contributor.author Kosmas, Georgios en
dc.date.accessioned 2024-08-28T12:07:38Z
dc.date.available 2024-08-28T12:07:38Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/60026
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.27722
dc.rights Default License
dc.subject Graph databases en
dc.subject Graph queries en
dc.subject Graph analytics en
dc.subject Regular path queries en
dc.title Optimizing SQL-based unbounded regular path queries in a relational database en
heal.type bachelorThesis
heal.classification Data management en
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2024-03-26
heal.abstract Graph processing within relational databases is increasingly gaining attention, as data scientists seek to retrieve information from graphs that are stored in tabular format inside RDBMSs. One particularly challenging class of graph queries that is applicable to a number of scenarios, such as money laundering detection, is unbounded regular path queries (RPQs). However, despite the importance of unbounded RPQs, existing techniques fail to provide sufficient performance, mainly for a lack of integration with the internals of the database engine. To address this problem, a new specialized kernel that is embedded in a relational database was developed. The kernel operates by issuing internal SQL statements during its runtime. This SQL statements are critical for its performance, it is thus imperative to handle them efficiently. We propose and implement several techniques to optimize the SQL-based execution of the kernel. Our optimizations yield remarkable results, achieving up to a 67-fold improvement in end-to-end performance compared to the original version of the kernel. en
heal.abstract Η επεξεργασία γραφημάτων μέσα σε σχεσιακές βάσεις δεδομένων κερδίζει ολοένα και περισσότερο προσοχή, καθώς οι επιστήμονες δεδομένων προσπαθούν να ανακτήσουν πληροφορίες από γραφήματα που είναι αποθηκευμένα σε μορφή πίνακα μέσα σε RDBMS. Μια ιδιαίτερα απαιτητική κατηγορία ερωτημάτων που μπορεί να εφαρμοστεί σε πολλές περιπτώσεις, όπως για παράδειγμα στην ανίχνευση νομιμοποίησης εσόδων από παράνομες δραστηριότητες, είναι τα ερωτήματα κανονικής διαδρομής χωρίς περιορισμούς (RPQ). Ωστόσο, παρά τη σημασία των απεριόριστων RPQ, οι υπάρχουσες τεχνικές δεν καταφέρνουν να παρέχουν επαρκή απόδοση, κυρίως λόγω έλλειψης ενοποίησης με το εσωτερικό της βάσης δεδομένων. Για την αντιμετώπιση αυτού του προβλήματος, αναπτύχθηκε ένας νέος εξειδικευμένος πυρήνας που είναι ενσωματωμένος σε μια σχεσιακή βάση δεδομένων. Ο πυρήνας αυτός λειτουργεί με την έκδοση SQL statements κατά τη διάρκεια του χρόνου εκτέλεσης του. Αυτά τα SQL statements είναι κρίσιμα για την απόδοσή του, επομένως είναι επιτακτική ανάγκη να τα χειριστούμε αποτελεσματικά. Σε αυτή τη διπλωματική προτείνουμε και εφαρμόζουμε διάφορες τεχνικές για τη βελτιστοποίηση της εκτέλεσης αυτού του πυρήνα. Οι βελτιστοποιήσεις μας αποδίδουν αξιοσημείωτα αποτελέσματα, επιτυγχάνοντας έως και 67 φορές βελτίωση στην απόδοση από άκρο σε άκρο σε σύγκριση με την αρχική έκδοση του πυρήνα. el
heal.advisorName Τσουμάκος, Δημήτριος el
heal.committeeMemberName Γκούμας, Γεώργιος el
heal.committeeMemberName Κοζύρης, Νεκτάριος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 76 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής