HEAL DSpace

Μελέτη κι υλοποίηση αλγορίθμων για τη βέλτιστη δυνατή εκτέλεση

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Αφράτη, Φώτω el
dc.contributor.author Παπαϊωάννου, Βασίλειος Κ. el
dc.contributor.author Papaioannou, Vassileios K. en
dc.date.accessioned 2014-10-20T08:02:45Z
dc.date.available 2014-10-20T08:02:45Z
dc.date.copyright 2014-04-07 -
dc.date.issued 2014-10-20
dc.date.submitted 2014-04-07 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/39232
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.5569
dc.description el
dc.description.abstract Ένα πολύ σημαντικό πρόβλημα του σύγχρονου κόσμου αποτελεί η διαχείριση κι η επεξεργασία των δεδομένων όσο το δυνατόν γρηγορότερα. Τα δεδομένα αυτά ακόμα και στον χρονικό ορίζοντα μιας ημέρας έχουν έναν τεράστιο όγκο εμπεριέχοντας όμως χρησιμότατη πληροφορία για την πρόοδο κι εξέλιξη της ανθρωπότητας. Ένας τρόπος για την άντληση αυτής της πληροφορίας αποτελεί ο λεγόμενος σύνδεσμος και μάλιστα ο πολλαπλός. Ο σύνδεσμος δεν είναι τίποτα άλλο παρά μια τεχνική, μια μέθοδος, ένας αλγόριθμος που συνδυάζει τα δεδομένα, εξάγει την πληροφορία και την παρουσιάζει με κατανοητό τρόπο στον χρήστη. Ο πολλαπλός σύνδεσμος συνδυάζει πολλές πηγές δεδομένων ταυτόχρονα. Στην παρούσα διπλωματική eξετάζεται αρχικά κι εν συντομία η έννοια του πολλαπλού συνδέσμου κι αναδεικνύεται η σημασία του. Έπειτα μελετώνται μερικές σημαντικές και σύγχρονες τεχνικές που είτε εφαρμόζονται ήδη είτε βρίσκονται σε στάδιο ανάπτυξης. Οι τεχνικές αυτές αφορούν σε ποικίλα περιβάλλοντα ώστε να καλυφθεί το θέμα πλήρως. Άλλωστε συνηθίζεται οι καλύτερες τεχνικές να συγκερνούν ένα πλήθος άλλων. Η τελευταία από όλες τις τεχνικές μελετάται εκτεταμένα κι αποτελεί το κύριο αντικείμενο της παρούσας εργασίας. Η τεχνική αυτή αφορά στην απόδοση ενός συνδέσμου όταν αυτός υλοποιείται στο περιβάλλον του Map – Reduce. Μετά την θεωρητική ανάλυση της μεθόδου αυτής παρουσιάζονται μια σειρά από πειράματα όπου δοκιμάζεται η απόδοση της έναντι πιο παραδοσιακών τεχνικών σε σχέση με διάφορους παράγοντες όπως ο χρόνος εκτέλεσης και το κόστος επικοινωνίας. Το προγραμματιστικό περιβάλλον στο οποίο γίνονται τα πειράματα είναι αυτό του Hadoop της Apache, μια ανοικτού κώδικα υλοποίηση του Map – Reduce. Τέλος, παρουσιάζονται τα πειραματικά δεδομένα και τα συνεπαγόμενα συμπεράσματα προκειμένου να οριοθετηθεί το πεδίο της περαιτέρω βελτίωσης του συνδέσμου. el
dc.description.abstract Data management and processing as fast as possible is one very important problem of modern world. Data, even in the time horizon of a day, have a massive volume, including however very useful information for the progress and evolution of humanity. Join and particular multi – way join is one way to obtain this information. A join is a technique, a method, an algorithm that combines data, extracts information and presents this information to the user. The multi – way join combines many data sources simultaneously. In this diploma thesis, in the beginning the meaning of multi – way is briefly examined and its value is exposed. Then some important and modern techniques are studied which either are already applied or are on a developing stage. These techniques concern various environments with the intention to fully cover the subject. The last of these techniques is studied extensively and it is the main subject of this thesis. This technique concerns the output of a multi – way join when it is implemented in a Map – Reduce environment. After the theoretical analysis of this method, a series of experiments is presented where the efficiency of this method is tested against more traditional techniques in dependence of various factors such as execution time and communication cost. The programing environment where these experiments take place is that of Hadoop, from Apache, which is an open source implementation of Map – Reduce. In the end, the experimental data and the consequent conclusions are presented in order to set the record of join's further improvement. en
dc.description.statementofresponsibility Παπαϊωάννου Κ.Βασίλειος el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Πολλαπλός σύνδεσμος el
dc.subject Κόστος επικοινωνίας el
dc.subject Map - Reduce en
dc.subject Hadoop en
dc.subject Multiway join en
dc.subject Join en
dc.subject Communication cost en
dc.subject Big Data en
dc.title Μελέτη κι υλοποίηση αλγορίθμων για τη βέλτιστη δυνατή εκτέλεση el
dc.title.alternative Study and implementation of algorithms for the optimum possible execution of a join with many relations in a Map - Reduce environment. en
dc.type bachelorThesis el (en)
dc.date.accepted 2014-03-28 -
dc.date.modified 2014-04-07 -
dc.contributor.advisorcommitteemember Παπασπύρου, Νικόλαος el
dc.contributor.advisorcommitteemember Φωτάκης, Δημήτριος el
dc.contributor.committeemember Αφράτη, Φώτω el
dc.contributor.committeemember Παπασπύρου, Νικόλαος el
dc.contributor.committeemember Φωτάκης, Δημήτριος el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής. el
dc.date.recordmanipulation.recordcreated 2014-10-20 -
dc.date.recordmanipulation.recordmodified 2014-10-20 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής