HEAL DSpace

Dataflow acceleration with Maxeler technologies for machine learning applications

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Δούκας, Μιχαήλ-Χρήστος el
dc.contributor.author Doukas, Michail-Christos en
dc.date.accessioned 2016-07-28T11:09:56Z
dc.date.issued 2016-07-28
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/43323
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.12692
dc.rights Default License
dc.subject Μηχανική μάθηση el
dc.subject Υπολογιστικό μοντέλο ροής δεδομένων el
dc.subject Machine learning en
dc.subject Dataflow computing en
dc.subject Maxeler technologies en
dc.subject DFE acceleration en
dc.subject Scikit-learn acceleration en
dc.title Dataflow acceleration with Maxeler technologies for machine learning applications en
heal.type bachelorThesis
heal.classification Computer science el
heal.classificationURI http://id.loc.gov/authorities/subjects/sh89003285
heal.dateAvailable 2017-07-27T21:00:00Z
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2016-06-30
heal.abstract Στις μέρες μας οι επιχειρήσεις και οι οργανώσεις συλλέγουν δεδομένα από πλήθος πηγών, όπως επιχειρησιακές δοσοληψίες, μέσα κοινωνικής δικτύωσης και αισθητήρες. Ο όρος Big data περιγράφει αυτόν τον μεγάλο όγκο δεδομένων, τα οποία μπορούν να αναλυθούν ώστε να παρθούν έξυπνες αποφάσεις βασιζόμενες σε μοτίβα των δεδομένων. Η ανάλυση των Big data βοηθά τις επιχειρήσεις και τους οργανισμούς να εμεταλλευτούν τα δεδομένα τους και να τα χρησιμοποιήσουν ώστε να εντοπίσουν αποδοτικότερες επιχειρησιακές κινήνεις, αποτελεσματικότερες δράσεις, καλύτερες υπηρεσίες και να αποκομίσουν μεγαλύτερα κέρδη. Ο μεγάλος αυτός όγκος δεδομένων που παράγεται συνεχώς έχει πυροδοτήσει την ευρεία χρήση της μηχανικής μάθησης (machine learning), η οποία είναι μια μέθοδος ανάλυσης δεδομένων. Οι διεργασίες μηχανικής μάθησης είναι πολύ απαιτητικές από άποψη υπολογιστικής ισχύος. Η αποθήκευση και η επεξεργασία μεγάλου όγκου δεδομένων σε ένα λογικό χρονικό διάστημα είναι πολύ σημαντικές, και το γεγονός αυτό πιέζει τους προγραμματιστές και τους αρχιτέκτονες υπολογιστών να αναπτύξουν αποδοτικότερα υπολογιστικά συστήματα που να ανταποκρίνονται στις απαιτήσεις υψηλής απόδοσης. Πολλές λύσεις έχουν προταθεί, συμπεριλαμαμβανομένων και τών επιταχυντών GPU, παρ’ολα αυτά ο παράγοντας της χαμηλής κατανάλωσης ισχύος δεν έχει ληφθεί υπόψιν. Μια πιθανή λύση θα μπορούσε να είναι το υπολογιστικό μοντέλο ροής δεδομένων (dataflow computing), ένας εντελώς διαφορετικός τρόπος επεξεργασίας δεδομένων. Η εταιρία Maxeler Technologies χρησιμοποιεί ολοκληρωμένα κυκλώματα FPGAs για να υλοποίησει το υπολογιστικό μοντέλο ροής δεδομένων και παρέχει τάξεις μεγέθους βελτίωση στην απόδοση και την κατανάλωση ισχύος. Σκοπός της εργασίας αυτής είναι η χρήση του υπολογιστικού μοντέλου ροής δεδομένων της Maxeler Technologies, για την επιτάχυνση επιλεγμένων προγραμμάτων μηχανικής μάθησης της Python βιβλιοθήκης scikit-learn, με στόχο την επίτευξη υψηλότερης απόδοσης και χαμηλότερης κατανάλωσης ισχύος. Αρχικά, εκτελούμε μια ανάλυση του χρόνου εκτέλεσης διάφορων αλγορίθμων μηχανικής μάθησης, ώστε να εντοπίσουμε τους υπολογιστικά απαιτητικότερους. Στη συνέχεια, παρουσιάζουμε το μαθηματικό μοντέλο και τους αλγορίθμους των Gaussian process regression, Gaussian process classification και Kernel ridge regression, τα οποία προγμάμματα επιλέχθηκαν να επιταχυνθούν. Ύστερα, αναλύουμε τα προγμάμματα αυτά και εντοπίζουμε ποιές συναρτήσεις των Python βιβλιοθηκών numpy και scipy μπορούν να υλοποιηθούν στο υπολογιστικό μοντέλο ροής δεδομένων της Maxeler. Τέλος περιγράφουμε τις υλοποιήσεις στο μοντέλο ροής δεδομένων και παρουσιάζουμε τα αποτελέσματα του χρόνου εκτέσης των προγραμμάτων. el
heal.abstract Nowadays, organizations collect data from a variety of sources, including business transac-tions, social media and sensors. Big data is a term that describes this large volume of data, which can be analysed to make intelligent decisions based on patterns. Big data analytics helps organizations exploit their data and use it to identify smarter business moves, more efficient operations, better services and achieve higher profits. The huge amount of data being constantly generated has sparked the widespread use of ma- chine learning, which is a data analysis method. Machine learning tasks are highly demanding in terms of computation power. Storing and analysing massive data in a reasonable amount of time has become very important, and this fact stresses software developers and computer architects to deliver more efficient design solutions able to address the increased performance requirements. Many solutions have been proposed including GPU accelerators, which deliver high speedup, however the power efficiency factor has been neglected. A possible solution is dataflow computing, a revolutionary way of performing computa- tion, completely different to computing with conventional CPUs. Maxeler Technologies uses FPGA devices to exploit dataflow computing and provide order of magnitude benefits in performance, space and power consumption. The purpose of this thesis is the utilization of Maxeler’s dataflow model for the acceleration of selected machine learning programs from scikit-learn Python library in order to achieve high performance and low power consumption. First, we perform an execution time analysis on various machine learning algorithms, to de- termine the most computationally demanding applications of scikit-learn. Next, we present the mathematical model and algorithms of Gaussian process regression and classification (GPR, GPC) and Kernel ridge regression (KRR), which were selected for acceleration. Sub- sequently, we demonstrate the profiling results of these machine learning techniques and point out which NumPy and SciPy functions should be implemented in a dataflow engine. Finally, we present and describe the dataflow accelerated applications, and demonstrate the speedup results. en
heal.advisorName Σούντρης, Δημήτριος el
heal.committeeMemberName Σούντρης, Δημήτριος el
heal.committeeMemberName Πεκμεστζή, Κιαμάλ el
heal.committeeMemberName Οικονομάκος, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 77 σ.
heal.fullTextAvailability true


Files in this item

This item appears in the following Collection(s)

Show simple item record