HEAL DSpace

FPGA-Acceleration of machine learning in cloud computing, a case study using logistic regression

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κορομηλάς, Ηλίας el
dc.contributor.author Koromilas, Ilias en
dc.date.accessioned 2017-11-29T08:44:11Z
dc.date.issued 2017-11-29
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/45993
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.14770
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Machine learning en
dc.subject Μηχανική μάθηση el
dc.subject Apache spark en
dc.subject Zynq apsoc en
dc.subject High-level synthesis en
dc.subject Σύνθεση υψηλού-επιπέδου el
dc.subject Logistic regression en
dc.subject Λογιστική παλινδρόμηση el
dc.subject Ετερογενής συστάδα el
dc.subject Υπολογιστικό νέφος el
dc.title FPGA-Acceleration of machine learning in cloud computing, a case study using logistic regression en
heal.type bachelorThesis
heal.classification Hardware acceleration en
heal.dateAvailable 2018-11-28T22:00:00Z
heal.language el
heal.language en
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2017-07-04
heal.abstract Machine Learning (ML) tasks have revolutionized the ways in which we interact with large-scale, imperfect, real-world data and are becoming pervasive in a broad range of applications, and in a broad range of systems (from embedded systems to data centers). However, it turns out that traditional compute systems are not well-suited to the incredibly high computational requirements of modern ML approaches. As computer architectures evolve toward heterogeneous multi-cores composed of a mix of cores and hardware accelerators, designing hardware accelerators for ML techniques can simultaneously achieve high efficiency and broad application scope. In cloud computing, one of the most widely used frameworks for data analytics applications, like ML, is Apache Spark. As part of this study we evaluate a new framework, SPynq: A framework for the efficient mapping and acceleration of Spark applications on heterogeneous All-Programmable SoC-based platforms, such as Zynq. For this evaluation, we use Logistic Regression (LR) which is a widely used ML classification technique. In this work we mainly focus on utilizing High-Level Synthesis (HLS) capabilities to produce an efficient hardware accelerator for LR, as well as developing the required libraries in Spark that enable the seamless utilization of the programmable logic. Our case study is a handwritten digit recognition problem using the famous MNIST database. A cluster of 4 worker nodes based on the Zynq All-Programmable SoC, on PYNQ-Z1 board, has been implemented and is compared to a high-performance Xeon processor that is typically used in cloud computing. The performance evaluation shows that the heterogeneous accelerator-based cluster can achieve up to 2x system speedup compared to a Xeon system and 18x better energy-efficiency. For embedded applications, the proposed system can achieve up to 36x speedup compared to the software only implementation on low-power embedded processors and 29x lower energy consumption. en
heal.abstract Η Μηχανική Μάθηση έχει φέρει επανάσταση στους τρόπους με τους οποίους αλληλεπιδρούμε με τα μεγάλης κλίμακας, ατελή δεδομένα του πραγματικού κόσμου και χρησιμοποιείται όλο και πιο εκτεταμένα σε ένα ευρύ φάσμα εφαρμογών, και σε ένα ευρύ φάσμα συστημάτων (από ενσωματωμένα συστήματα μέχρι κέντρα δεδομένων). Ωστόσο, αποδεικνύεται ότι τα παραδοσιακά υπολογιστικά συστήματα δεν ταιριάζουν στις απίστευτα υψηλές υπολογιστικές απαιτήσεις των σύγχρονων προσεγγίσεων Μηχανικής Μάθησης. Καθώς οι αρχιτεκτονικές ηλεκτρονικών υπολογιστών εξελίσσονται σε ετερογενείς πολυπύρηνες που αποτελούνται από ένα μίγμα από πυρήνες και επιταχυντές υλικού, ο σχεδιασμός επιταχυντών υλικού για τεχνικές Μηχανικής Μάθησης μπορεί ταυτόχρονα να επιτύχει υψηλή απόδοση αλλά και ευρύ πεδίο εφαρμογής. Στο υπολογιστικό νέφος, ένα από τα πιο ευρέως χρησιμοποιούμενα πλαίσια για εφαρμογές ανάλυσης δεδομένων, όπως αυτές της Μηχανικής Μάθησης, είναι το Apache Spark. Στο πλαίσιο αυτής της μελέτης αξιολογούμε ένα νέο σχήμα, το SPynq: Ένα πλαίσιο για την αποτελεσματική δρομολόγηση και επιτάχυνση εφαρμογών του Spark σε ετερογενείς πλατφόρμες που βασίζονται σε επαναπρογραμματιζόμενα συστήματα σε ψηφίδα, όπως το Zynq. Για αυτή την αξιολόγηση, χρησιμοποιούμε τη Λογιστική Παλινδρόμηση, η οποία είναι μια ευρέως χρησιμοποιούμενη τεχνική Μηχανικής Μάθησης για ταξινόμηση. Σε αυτή την εργασία εστιάζουμε κυρίως στη χρήση των δυνατοτήτων Σύνθεσης Υψηλού-Επιπέδου για την παραγωγή ενός αποδοτικού επιταχυντή υλικού για τη Λογιστική Παλινδρόμηση, καθώς και στην ανάπτυξη των απαιτούμενων βιβλιοθηκών στο Spark που επιτρέπουν την απρόσκοπτη χρήση της επαναπρογραμματιζόμενης λογικής. Η μελέτη περίπτωσής μας είναι ένα πρόβλημα αναγνώρισης χειρόγραφων ψηφίων χρησιμοποιώντας τη γνωστή βάση δεδομένων MNIST. Έχει υλοποιηθεί μια συστάδα τεσσάρων worker κόμβων με βάση το Zynq All-Programmable SoC, στην πλακέτα PYNQ-Z1, και συγκρίνεται με έναν επεξεργαστή Xeon υψηλής απόδοσης που συχνά χρησιμοποιείται στο υπολογιστικό νέφος. Η αξιολόγηση της απόδοσης δείχνει ότι η ετερογενής συστάδα μπορεί να επιτύχει έως και 2 φορές επιτάχυνση συστήματος σε σύγκριση με ένα σύστημα Xeon και 18 φορές καλύτερη ενεργειακή απόδοση. Για εφαρμογές σε ενσωματωμένα συστήματα, το προτεινόμενο σύστημα μπορεί να επιτύχει μέχρι και 36 φορές επιτάχυνση σε σύγκριση με τους ενσωματωμένους επεξεργαστές χαμηλής ισχύος και 29 φορές χαμηλότερη κατανάλωση ενέργειας. el
heal.advisorName Σούντρης, Δημήτριος el
heal.committeeMemberName Σούντρης, Δημήτριος el
heal.committeeMemberName Πεκμεστζή, Κιαμάλ el
heal.committeeMemberName Γκούμας, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Μικροϋπολογιστών και Ψηφιακών Συστημάτων VLSI el
heal.academicPublisherID ntua
heal.numberOfPages 148 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα