dc.contributor.author |
Κοσμάς, Γεώργιος
|
el |
dc.contributor.author |
Kosmas, Georgios
|
en |
dc.date.accessioned |
2024-08-28T12:07:38Z |
|
dc.date.available |
2024-08-28T12:07:38Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/60026 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.27722 |
|
dc.rights |
Default License |
|
dc.subject |
Graph databases |
en |
dc.subject |
Graph queries |
en |
dc.subject |
Graph analytics |
en |
dc.subject |
Regular path queries |
en |
dc.title |
Optimizing SQL-based unbounded regular path queries in
a relational database |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Data management |
en |
heal.language |
en |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2024-03-26 |
|
heal.abstract |
Graph processing within relational databases is increasingly gaining attention, as data scientists seek to retrieve information from graphs that are stored in tabular format inside RDBMSs. One particularly challenging class of graph queries that is applicable to a number of scenarios, such as money laundering detection, is unbounded regular path queries (RPQs). However, despite the importance of unbounded RPQs, existing techniques fail to provide sufficient performance, mainly for a lack of integration with the internals of the database engine. To address this problem, a new specialized kernel that is embedded in a relational database was developed. The kernel operates by issuing internal SQL statements during its runtime. This SQL statements are critical for its performance, it is thus imperative to handle them efficiently. We propose and implement several techniques to optimize the SQL-based execution of the kernel. Our optimizations yield remarkable results, achieving up to a 67-fold improvement in end-to-end performance compared to the original version of the kernel. |
en |
heal.abstract |
Η επεξεργασία γραφημάτων μέσα σε σχεσιακές βάσεις δεδομένων κερδίζει ολοένα και περισσότερο προσοχή, καθώς οι επιστήμονες δεδομένων προσπαθούν να ανακτήσουν πληροφορίες από γραφήματα που είναι αποθηκευμένα σε μορφή πίνακα μέσα σε RDBMS. Μια ιδιαίτερα απαιτητική κατηγορία ερωτημάτων που μπορεί να εφαρμοστεί σε πολλές περιπτώσεις, όπως για παράδειγμα στην ανίχνευση νομιμοποίησης εσόδων από παράνομες δραστηριότητες, είναι τα ερωτήματα κανονικής διαδρομής χωρίς περιορισμούς (RPQ). Ωστόσο, παρά τη σημασία των απεριόριστων RPQ, οι υπάρχουσες τεχνικές δεν καταφέρνουν να παρέχουν επαρκή απόδοση, κυρίως λόγω έλλειψης ενοποίησης με το εσωτερικό της βάσης δεδομένων. Για την αντιμετώπιση αυτού του προβλήματος, αναπτύχθηκε ένας νέος εξειδικευμένος πυρήνας που είναι ενσωματωμένος σε μια σχεσιακή βάση δεδομένων. Ο πυρήνας αυτός λειτουργεί με την έκδοση SQL statements κατά τη διάρκεια του χρόνου εκτέλεσης του. Αυτά τα SQL statements είναι κρίσιμα για την απόδοσή του, επομένως είναι επιτακτική ανάγκη να τα χειριστούμε αποτελεσματικά. Σε αυτή τη διπλωματική προτείνουμε και εφαρμόζουμε διάφορες τεχνικές για τη βελτιστοποίηση της εκτέλεσης αυτού του πυρήνα. Οι βελτιστοποιήσεις μας αποδίδουν αξιοσημείωτα αποτελέσματα, επιτυγχάνοντας έως και 67 φορές βελτίωση στην απόδοση από άκρο σε άκρο σε σύγκριση με την αρχική έκδοση του πυρήνα. |
el |
heal.advisorName |
Τσουμάκος, Δημήτριος |
el |
heal.committeeMemberName |
Γκούμας, Γεώργιος |
el |
heal.committeeMemberName |
Κοζύρης, Νεκτάριος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
76 σ. |
el |
heal.fullTextAvailability |
false |
|