dc.contributor.author |
Δούκας, Μιχαήλ-Χρήστος
|
el |
dc.contributor.author |
Doukas, Michail-Christos
|
en |
dc.date.accessioned |
2016-07-28T11:09:56Z |
|
dc.date.issued |
2016-07-28 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/43323 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.12692 |
|
dc.rights |
Default License |
|
dc.subject |
Μηχανική μάθηση |
el |
dc.subject |
Υπολογιστικό μοντέλο ροής δεδομένων |
el |
dc.subject |
Machine learning |
en |
dc.subject |
Dataflow computing |
en |
dc.subject |
Maxeler technologies |
en |
dc.subject |
DFE acceleration |
en |
dc.subject |
Scikit-learn acceleration |
en |
dc.title |
Dataflow acceleration with Maxeler technologies for machine learning applications |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Computer science |
el |
heal.classificationURI |
http://id.loc.gov/authorities/subjects/sh89003285 |
|
heal.dateAvailable |
2017-07-27T21:00:00Z |
|
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2016-06-30 |
|
heal.abstract |
Στις μέρες μας οι επιχειρήσεις και οι οργανώσεις συλλέγουν δεδομένα από πλήθος πηγών, όπως επιχειρησιακές δοσοληψίες, μέσα κοινωνικής δικτύωσης και αισθητήρες. Ο όρος Big data περιγράφει αυτόν τον μεγάλο όγκο δεδομένων, τα οποία μπορούν να αναλυθούν ώστε να παρθούν έξυπνες αποφάσεις βασιζόμενες σε μοτίβα των δεδομένων. Η ανάλυση των Big data βοηθά τις επιχειρήσεις και τους οργανισμούς να εμεταλλευτούν τα δεδομένα τους και να τα χρησιμοποιήσουν ώστε να εντοπίσουν αποδοτικότερες επιχειρησιακές κινήνεις, αποτελεσματικότερες δράσεις, καλύτερες υπηρεσίες και να αποκομίσουν μεγαλύτερα κέρδη. Ο μεγάλος αυτός όγκος δεδομένων που παράγεται συνεχώς έχει πυροδοτήσει την ευρεία χρήση της μηχανικής μάθησης (machine learning), η οποία είναι μια μέθοδος ανάλυσης δεδομένων. Οι διεργασίες μηχανικής μάθησης είναι πολύ απαιτητικές από άποψη υπολογιστικής ισχύος. Η αποθήκευση και η επεξεργασία μεγάλου όγκου δεδομένων σε ένα λογικό χρονικό διάστημα είναι πολύ σημαντικές, και το γεγονός αυτό πιέζει τους προγραμματιστές και τους αρχιτέκτονες υπολογιστών να αναπτύξουν αποδοτικότερα υπολογιστικά συστήματα που να
ανταποκρίνονται στις απαιτήσεις υψηλής απόδοσης. Πολλές λύσεις έχουν προταθεί, συμπεριλαμαμβανομένων και τών επιταχυντών GPU, παρ’ολα αυτά ο παράγοντας της χαμηλής
κατανάλωσης ισχύος δεν έχει ληφθεί υπόψιν. Μια πιθανή λύση θα μπορούσε να είναι το υπολογιστικό μοντέλο ροής δεδομένων (dataflow computing), ένας εντελώς διαφορετικός τρόπος επεξεργασίας δεδομένων. Η εταιρία Maxeler Technologies χρησιμοποιεί ολοκληρωμένα κυκλώματα FPGAs για να υλοποίησει το υπολογιστικό μοντέλο ροής δεδομένων και παρέχει τάξεις μεγέθους βελτίωση στην απόδοση και την κατανάλωση ισχύος. Σκοπός της εργασίας αυτής είναι η χρήση του υπολογιστικού μοντέλου ροής δεδομένων της Maxeler Technologies, για την επιτάχυνση επιλεγμένων προγραμμάτων μηχανικής μάθησης της Python βιβλιοθήκης scikit-learn, με στόχο την επίτευξη υψηλότερης απόδοσης και χαμηλότερης κατανάλωσης ισχύος. Αρχικά, εκτελούμε μια ανάλυση του χρόνου εκτέλεσης διάφορων αλγορίθμων μηχανικής μάθησης, ώστε να εντοπίσουμε τους υπολογιστικά απαιτητικότερους. Στη συνέχεια, παρουσιάζουμε το μαθηματικό μοντέλο και τους αλγορίθμους των Gaussian process regression, Gaussian process classification και Kernel ridge regression, τα οποία προγμάμματα επιλέχθηκαν να επιταχυνθούν. Ύστερα, αναλύουμε τα προγμάμματα αυτά και εντοπίζουμε ποιές συναρτήσεις των Python βιβλιοθηκών numpy και scipy μπορούν να υλοποιηθούν στο υπολογιστικό μοντέλο ροής δεδομένων της Maxeler. Τέλος περιγράφουμε τις υλοποιήσεις στο μοντέλο ροής δεδομένων και παρουσιάζουμε τα αποτελέσματα του χρόνου εκτέσης των προγραμμάτων. |
el |
heal.abstract |
Nowadays, organizations collect data from a variety of sources, including business transac-tions, social media and sensors. Big data is a term that describes this large volume of data, which can be analysed to make intelligent decisions based on patterns. Big data analytics helps organizations exploit their data and use it to identify smarter business moves, more
efficient operations, better services and achieve higher profits.
The huge amount of data being constantly generated has sparked the widespread use of ma-
chine learning, which is a data analysis method. Machine learning tasks are highly demanding
in terms of computation power. Storing and analysing massive data in a reasonable amount
of time has become very important, and this fact stresses software developers and computer
architects to deliver more efficient design solutions able to address the increased performance
requirements. Many solutions have been proposed including GPU accelerators, which deliver
high speedup, however the power efficiency factor has been neglected.
A possible solution is dataflow computing, a revolutionary way of performing computa-
tion, completely different to computing with conventional CPUs. Maxeler Technologies uses
FPGA devices to exploit dataflow computing and provide order of magnitude benefits in
performance, space and power consumption. The purpose of this thesis is the utilization of
Maxeler’s dataflow model for the acceleration of selected machine learning programs from
scikit-learn Python library in order to achieve high performance and low power consumption.
First, we perform an execution time analysis on various machine learning algorithms, to de-
termine the most computationally demanding applications of scikit-learn. Next, we present
the mathematical model and algorithms of Gaussian process regression and classification
(GPR, GPC) and Kernel ridge regression (KRR), which were selected for acceleration. Sub-
sequently, we demonstrate the profiling results of these machine learning techniques and
point out which NumPy and SciPy functions should be implemented in a dataflow engine.
Finally, we present and describe the dataflow accelerated applications, and demonstrate the
speedup results. |
en |
heal.advisorName |
Σούντρης, Δημήτριος |
el |
heal.committeeMemberName |
Σούντρης, Δημήτριος |
el |
heal.committeeMemberName |
Πεκμεστζή, Κιαμάλ |
el |
heal.committeeMemberName |
Οικονομάκος, Γεώργιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
77 σ. |
|
heal.fullTextAvailability |
true |
|