HEAL DSpace

Σχεδιασμός και υλοποίηση πλατφόρμας ελαστικής διαχείρισης εργαλείων επεξεργασίας μεγάλων δεδομένων σε υπολογιστικά νέφη

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Χαλβαντζής, Νικόλαος el
dc.contributor.author Chalvantzis, Nikolaos en
dc.date.accessioned 2016-02-26T13:08:57Z
dc.date.available 2016-02-26T13:08:57Z
dc.date.issued 2016-02-26
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/42067
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.8418
dc.rights Default License
dc.subject Υπολογιστικά νέφη el
dc.subject Hadoop en
dc.subject Ελαστικότητα el
dc.subject Μεγάλα δεδομένα el
dc.subject MapReduce en
dc.subject YARN en
dc.subject Computing clouds en
dc.subject Cloud provisioning en
dc.subject TIRAMOLA en
dc.subject Profiling en
dc.title Σχεδιασμός και υλοποίηση πλατφόρμας ελαστικής διαχείρισης εργαλείων επεξεργασίας μεγάλων δεδομένων σε υπολογιστικά νέφη el
dc.title Design and implementation of an elastic platform for big data analysis tools on a cloud en
heal.type bachelorThesis
heal.classification Computer engineering en
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-07-14
heal.abstract Οι εφαρμογές Μεγάλων Δεδομένων απαιτούν την ύπαρξη σημαντικών σε όγκο υποδομών προκειμένου να πραγματοποιήσουν αποδοτική επεξεργασία σε ένα εύλογο χρονικό διάστημα. Ωστόσο, η ποσότητα των υπολογιστικών πόρων που απαιτούνται δεν είναι πάντα γνωστή εκ των προτέρων και εξαρτάται τόσο από τον όγκο των δεδομένων που υποβάλλονται σε επεξεργασία όσο και από το είδος της επεξεργασίας αυτής. Τα υπολογιστικά νέφη προσφέρουν την ευελιξία της απόκτησης πόρων κατά παραγγελία, με άμεσο τρόπο καθώς και της χρησιμοποίησης τους για όσο χρόνο αυτό είναι απαραίτητο με το ανάλογο κόστος. Ως εκ τούτου, συχνά οι εφαρμογές επεξεργασίας Μεγάλων Δεδομένων χρησιμοποιούν υποδομές υπολογιστικού νέφους. Σε αυτή την εργασία παρουσιάζουμε το BARBECUE (a joB AwaRe Big-data Elasticity CloUd managEment system) – μια πλατφόρμα ελαστικής διαχείρισης πόρων σε υπολογιστικά νέφη για εφαρμογές Μεγάλων Δεδομένων. Επεκτείνουμε τις υπάρχουσες τεχνολογίες, Apache Hadoop και YARN ώστε να έχουν επίγνωση των εργασιών που τους υποβάλλονται προς εκτέλεση, υλοποιώντας μια μορφή αυτόματης, ελαστικής και άμεσης απόδοσης πόρων βασισμένη στη λειτουργία του TIRAMOLA, ένα εργαλείο ελαστικής διαχείρισης πόρων υπολογιστικών νεφών. Το σύστημα BBQ χρησιμοποιεί μια μέθοδο δημιουργίας προφίλ για κάθε πρόγραμμα επεξεργασίας Μεγάλων Δεδομένων. Χρησιμοποιώντας τα συγκεκριμένα προφίλ, μπορεί να προβλέπει πόσοι πόροι απαιτούνται για την εκτέλεση μιας συγκεκριμένης εργασίας (σε συγκεκριμένο χρόνο), ‘παγώνει’ την εκτέλεση της τελευταίας ώστε να αποκτήσει πρόσβαση σε αυτούς ζητώντας τους από τον εκάστοτε πάροχο της υπηρεσίας του νέφους μέσω του TIRAMOLA, τους μορφοποιεί ώστε να είναι έτοιμοι για χρήση και στη συνέχεια εκτελεί την υποβληθείσα εργασία. Μετά το πέρας αυτής οι επιπλέον πόροι επιστρέφονται στο υπολογιστικό νέφος. Στην παρούσα δουλειά παρουσιάζουμε τις εσωτερικές λειτουργίες των Hadoop και YARN και περιγράφουμε τις τροποποιήσεις στη διαδικασία εκτέλεσης που μας επέτρεψαν την απρόσκοπτη απόκτηση και ενσωμάτωση των επιπλέον υπολογιστικών πόρων. Επιπροσθέτως, τροποποιούμε τον TIRAMOLA ώστε να είναι σε θέση με τη χρήση των προφίλ διάφορων προγραμμάτων ανάλυσης Μεγάλων Δεδομένων να υπολογίζει τους απαιτούμενους πόρους. Τέλος, διενεργούμε μια πειραματική αξιολόγηση του συστήματος και αποδεικνύουμε τη λειτουργικότητά του. Προσφέρουμε το σύστημα ως λογισμικό ανοιχτού κώδικα. el
heal.abstract Big Data applications require vast amounts of infrastructural resources in order to perform efficient processing in a timely manner. Nevertheless, the amount of required resources is not known a-priory and depends on both the size of the processed data and the type of the required processing. Cloud computing offers the flexibility of acquiring on-the-fly infrastructural resources and utilize them for as long as they are needed in an elastic and pay-as-you go manner. Therefore, Big Data Applications are typically deployed in a cloud setting. In this thesis we present BARBECUE, a joB AwaRe Big-data Elasticity CloUd managEment system by expanding Apache Hadoop and YARN, to perform job-aware on-the-fly resource allocation utilizing cloud elasticity based on TIRAMOLA, a state of the art elasticity framework. BBQ utilizes profiling to detect the correct amount of resources for a specific job, stalls its execution to acquire them from the cloud using TIRAMOLA, configure them, executes the job and after its completion returns the extra resources to the cloud. In this work we present the internals of job execution and scheduling of Hadoop and YARN and we describe our exact modifications in the job execution workflow to allow seamless acquisition and deployment of extra needed resources. We modify TIRAMOLA to employ profiling in order to detect the correct amount of resources. We perform a thorough experimental evaluation in an actual cloud deployment in which we showcase BBQ’s functionality and we offer the entire BBQ system as open source. en
heal.advisorName Κοζύρης, Νεκτάριος el
heal.committeeMemberName Κοζύρης, Νεκτάριος el
heal.committeeMemberName Γκούμας, Γεώργιος el
heal.committeeMemberName Τσουμάκος, Δημήτριος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων el
heal.academicPublisherID ntua
heal.numberOfPages 84 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής