| dc.contributor.author |
Βόγκας, Ιωάννης
|
el |
| dc.contributor.author |
Vogkas, Ioannis
|
en |
| dc.date.accessioned |
2026-02-12T10:48:04Z |
|
| dc.date.available |
2026-02-12T10:48:04Z |
|
| dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/63432 |
|
| dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.31127 |
|
| dc.description |
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση" |
el |
| dc.rights |
Default License |
|
| dc.subject |
Delta lake |
en |
| dc.subject |
Apache iceberg |
en |
| dc.subject |
Apache hudi |
en |
| dc.subject |
Spark |
en |
| dc.subject |
log structured tables |
en |
| dc.subject |
Συστήματα αποθήκευσης δεδομένων |
el |
| dc.title |
Delta lake, apache iceberg και apache hudi: συγκριτική ανάλυση και πειραματική αποτίμηση συστημάτων αποθήκευσης δεδομένων |
el |
| heal.type |
masterThesis |
|
| heal.classification |
Επιστήμη δεδομένων |
el |
| heal.language |
el |
|
| heal.access |
free |
|
| heal.recordProvider |
ntua |
el |
| heal.publicationDate |
2025-07-04 |
|
| heal.abstract |
Καθώς οι ανάγκες αποθήκευσης και επεξεργασίας δεδομένων αυξάνονται, έχουν εμφανιστεί νέες τεχνολογίες που επιχειρούν να ξεπεράσουν τους περιορισμούς των παραδοσιακών αποθηκών δεδομένων, ενσωματώνοντας πιο αποδοτικά μοντέλα αποθήκευσης και προηγμένες λειτουργίες διαχείρισης. Η παρούσα διπλωματική εργασία επικεντρώνεται στη μελέτη και συγκριτική αξιολόγηση τριών σύγχρονων συστημάτων αποθήκευσης δεδομένων, τα οποία στοχεύουν να συνδυάσουν την αποδοτικότητα της αποθήκευσης σε στήλες με δυνατότητες τροποποίησης των δεδομένων και διαχείρισης ιστορικότητας. Πιο συγκεκριμένα, εξετάζονται τα συστήματα Delta Lake, Apache Iceberg και Apache Hudi, τα οποία σχεδιάστηκαν με σκοπό να
ξεπεράσουν τους περιορισμούς τόσο των παραδοσιακών αποθηκών δεδομένων όσο και των
μορφών αποθήκευσης ανά στήλη. Αρχικά, πραγματοποιήθηκε θεωρητική ανάλυση της αρχιτεκτονικής και των βασικών χαρακτηριστικών του κάθε συστήματος. Στη συνέχεια, υλοποιή-
θηκε μία πειραματική αποτίμηση της απόδοσης των συστημάτων, με τη χρήση του εργαλείου
LST-Bench, σε διαφορετικά workloads που προσομοιώνουν ρεαλιστικά σενάρια χρήσης. Τα
πειράματα υλοποιήθηκαν σε ένα κατανεμημένο περιβάλλον, στο οποίο χρησιμοποιήθηκαν οι
τεχνολογίες Apache Spark για την επεξεργασία και Apache Hadoop για την αποθήκευση των δεδομένων. Τα αποτελέσματα προσφέρουν χρήσιμα συμπεράσματα σχετικά με τις επιδόσεις,
τα πλεονεκτήματα και τους περιορισμούς του κάθε συστήματος, αναδεικνύοντας σε ποιες περιπτώσεις το καθένα αποδίδει καλύτερα. Έτσι, η εργασία προσφέρει πρακτική καθοδήγηση για την επιλογή του κατάλληλου συστήματος, ανάλογα με τις ανάγκες και τον τύπο της εφαρμογής. |
el |
| heal.advisorName |
Κοζύρης, Νεκτάριος |
el |
| heal.committeeMemberName |
Κωνσταντίνου, Ιωάννης |
el |
| heal.committeeMemberName |
Τσουμάκος, Δημήτριος |
el |
| heal.committeeMemberName |
Κοζύρης, Νεκτάριος |
el |
| heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών |
el |
| heal.academicPublisherID |
ntua |
|
| heal.numberOfPages |
70 σ. |
el |
| heal.fullTextAvailability |
false |
|