HEAL DSpace

Delta lake, apache iceberg και apache hudi: συγκριτική ανάλυση και πειραματική αποτίμηση συστημάτων αποθήκευσης δεδομένων

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Βόγκας, Ιωάννης el
dc.contributor.author Vogkas, Ioannis en
dc.date.accessioned 2026-02-12T10:48:04Z
dc.date.available 2026-02-12T10:48:04Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/63432
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.31127
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση" el
dc.rights Default License
dc.subject Delta lake en
dc.subject Apache iceberg en
dc.subject Apache hudi en
dc.subject Spark en
dc.subject log structured tables en
dc.subject Συστήματα αποθήκευσης δεδομένων el
dc.title Delta lake, apache iceberg και apache hudi: συγκριτική ανάλυση και πειραματική αποτίμηση συστημάτων αποθήκευσης δεδομένων el
heal.type masterThesis
heal.classification Επιστήμη δεδομένων el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2025-07-04
heal.abstract Καθώς οι ανάγκες αποθήκευσης και επεξεργασίας δεδομένων αυξάνονται, έχουν εμφανιστεί νέες τεχνολογίες που επιχειρούν να ξεπεράσουν τους περιορισμούς των παραδοσιακών αποθηκών δεδομένων, ενσωματώνοντας πιο αποδοτικά μοντέλα αποθήκευσης και προηγμένες λειτουργίες διαχείρισης. Η παρούσα διπλωματική εργασία επικεντρώνεται στη μελέτη και συγκριτική αξιολόγηση τριών σύγχρονων συστημάτων αποθήκευσης δεδομένων, τα οποία στοχεύουν να συνδυάσουν την αποδοτικότητα της αποθήκευσης σε στήλες με δυνατότητες τροποποίησης των δεδομένων και διαχείρισης ιστορικότητας. Πιο συγκεκριμένα, εξετάζονται τα συστήματα Delta Lake, Apache Iceberg και Apache Hudi, τα οποία σχεδιάστηκαν με σκοπό να ξεπεράσουν τους περιορισμούς τόσο των παραδοσιακών αποθηκών δεδομένων όσο και των μορφών αποθήκευσης ανά στήλη. Αρχικά, πραγματοποιήθηκε θεωρητική ανάλυση της αρχιτεκτονικής και των βασικών χαρακτηριστικών του κάθε συστήματος. Στη συνέχεια, υλοποιή- θηκε μία πειραματική αποτίμηση της απόδοσης των συστημάτων, με τη χρήση του εργαλείου LST-Bench, σε διαφορετικά workloads που προσομοιώνουν ρεαλιστικά σενάρια χρήσης. Τα πειράματα υλοποιήθηκαν σε ένα κατανεμημένο περιβάλλον, στο οποίο χρησιμοποιήθηκαν οι τεχνολογίες Apache Spark για την επεξεργασία και Apache Hadoop για την αποθήκευση των δεδομένων. Τα αποτελέσματα προσφέρουν χρήσιμα συμπεράσματα σχετικά με τις επιδόσεις, τα πλεονεκτήματα και τους περιορισμούς του κάθε συστήματος, αναδεικνύοντας σε ποιες περιπτώσεις το καθένα αποδίδει καλύτερα. Έτσι, η εργασία προσφέρει πρακτική καθοδήγηση για την επιλογή του κατάλληλου συστήματος, ανάλογα με τις ανάγκες και τον τύπο της εφαρμογής. el
heal.advisorName Κοζύρης, Νεκτάριος el
heal.committeeMemberName Κωνσταντίνου, Ιωάννης el
heal.committeeMemberName Τσουμάκος, Δημήτριος el
heal.committeeMemberName Κοζύρης, Νεκτάριος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 70 σ. el
heal.fullTextAvailability false


Files in this item

This item appears in the following Collection(s)

Show simple item record