dc.contributor.author | Κορομηλάς, Ηλίας | el |
dc.contributor.author | Koromilas, Ilias | en |
dc.date.accessioned | 2017-11-29T08:44:11Z | |
dc.date.issued | 2017-11-29 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/45993 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.14770 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Machine learning | en |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Apache spark | en |
dc.subject | Zynq apsoc | en |
dc.subject | High-level synthesis | en |
dc.subject | Σύνθεση υψηλού-επιπέδου | el |
dc.subject | Logistic regression | en |
dc.subject | Λογιστική παλινδρόμηση | el |
dc.subject | Ετερογενής συστάδα | el |
dc.subject | Υπολογιστικό νέφος | el |
dc.title | FPGA-Acceleration of machine learning in cloud computing, a case study using logistic regression | en |
heal.type | bachelorThesis | |
heal.classification | Hardware acceleration | en |
heal.dateAvailable | 2018-11-28T22:00:00Z | |
heal.language | el | |
heal.language | en | |
heal.access | campus | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2017-07-04 | |
heal.abstract | Machine Learning (ML) tasks have revolutionized the ways in which we interact with large-scale, imperfect, real-world data and are becoming pervasive in a broad range of applications, and in a broad range of systems (from embedded systems to data centers). However, it turns out that traditional compute systems are not well-suited to the incredibly high computational requirements of modern ML approaches. As computer architectures evolve toward heterogeneous multi-cores composed of a mix of cores and hardware accelerators, designing hardware accelerators for ML techniques can simultaneously achieve high efficiency and broad application scope. In cloud computing, one of the most widely used frameworks for data analytics applications, like ML, is Apache Spark. As part of this study we evaluate a new framework, SPynq: A framework for the efficient mapping and acceleration of Spark applications on heterogeneous All-Programmable SoC-based platforms, such as Zynq. For this evaluation, we use Logistic Regression (LR) which is a widely used ML classification technique. In this work we mainly focus on utilizing High-Level Synthesis (HLS) capabilities to produce an efficient hardware accelerator for LR, as well as developing the required libraries in Spark that enable the seamless utilization of the programmable logic. Our case study is a handwritten digit recognition problem using the famous MNIST database. A cluster of 4 worker nodes based on the Zynq All-Programmable SoC, on PYNQ-Z1 board, has been implemented and is compared to a high-performance Xeon processor that is typically used in cloud computing. The performance evaluation shows that the heterogeneous accelerator-based cluster can achieve up to 2x system speedup compared to a Xeon system and 18x better energy-efficiency. For embedded applications, the proposed system can achieve up to 36x speedup compared to the software only implementation on low-power embedded processors and 29x lower energy consumption. | en |
heal.abstract | Η Μηχανική Μάθηση έχει φέρει επανάσταση στους τρόπους με τους οποίους αλληλεπιδρούμε με τα μεγάλης κλίμακας, ατελή δεδομένα του πραγματικού κόσμου και χρησιμοποιείται όλο και πιο εκτεταμένα σε ένα ευρύ φάσμα εφαρμογών, και σε ένα ευρύ φάσμα συστημάτων (από ενσωματωμένα συστήματα μέχρι κέντρα δεδομένων). Ωστόσο, αποδεικνύεται ότι τα παραδοσιακά υπολογιστικά συστήματα δεν ταιριάζουν στις απίστευτα υψηλές υπολογιστικές απαιτήσεις των σύγχρονων προσεγγίσεων Μηχανικής Μάθησης. Καθώς οι αρχιτεκτονικές ηλεκτρονικών υπολογιστών εξελίσσονται σε ετερογενείς πολυπύρηνες που αποτελούνται από ένα μίγμα από πυρήνες και επιταχυντές υλικού, ο σχεδιασμός επιταχυντών υλικού για τεχνικές Μηχανικής Μάθησης μπορεί ταυτόχρονα να επιτύχει υψηλή απόδοση αλλά και ευρύ πεδίο εφαρμογής. Στο υπολογιστικό νέφος, ένα από τα πιο ευρέως χρησιμοποιούμενα πλαίσια για εφαρμογές ανάλυσης δεδομένων, όπως αυτές της Μηχανικής Μάθησης, είναι το Apache Spark. Στο πλαίσιο αυτής της μελέτης αξιολογούμε ένα νέο σχήμα, το SPynq: Ένα πλαίσιο για την αποτελεσματική δρομολόγηση και επιτάχυνση εφαρμογών του Spark σε ετερογενείς πλατφόρμες που βασίζονται σε επαναπρογραμματιζόμενα συστήματα σε ψηφίδα, όπως το Zynq. Για αυτή την αξιολόγηση, χρησιμοποιούμε τη Λογιστική Παλινδρόμηση, η οποία είναι μια ευρέως χρησιμοποιούμενη τεχνική Μηχανικής Μάθησης για ταξινόμηση. Σε αυτή την εργασία εστιάζουμε κυρίως στη χρήση των δυνατοτήτων Σύνθεσης Υψηλού-Επιπέδου για την παραγωγή ενός αποδοτικού επιταχυντή υλικού για τη Λογιστική Παλινδρόμηση, καθώς και στην ανάπτυξη των απαιτούμενων βιβλιοθηκών στο Spark που επιτρέπουν την απρόσκοπτη χρήση της επαναπρογραμματιζόμενης λογικής. Η μελέτη περίπτωσής μας είναι ένα πρόβλημα αναγνώρισης χειρόγραφων ψηφίων χρησιμοποιώντας τη γνωστή βάση δεδομένων MNIST. Έχει υλοποιηθεί μια συστάδα τεσσάρων worker κόμβων με βάση το Zynq All-Programmable SoC, στην πλακέτα PYNQ-Z1, και συγκρίνεται με έναν επεξεργαστή Xeon υψηλής απόδοσης που συχνά χρησιμοποιείται στο υπολογιστικό νέφος. Η αξιολόγηση της απόδοσης δείχνει ότι η ετερογενής συστάδα μπορεί να επιτύχει έως και 2 φορές επιτάχυνση συστήματος σε σύγκριση με ένα σύστημα Xeon και 18 φορές καλύτερη ενεργειακή απόδοση. Για εφαρμογές σε ενσωματωμένα συστήματα, το προτεινόμενο σύστημα μπορεί να επιτύχει μέχρι και 36 φορές επιτάχυνση σε σύγκριση με τους ενσωματωμένους επεξεργαστές χαμηλής ισχύος και 29 φορές χαμηλότερη κατανάλωση ενέργειας. | el |
heal.advisorName | Σούντρης, Δημήτριος | el |
heal.committeeMemberName | Σούντρης, Δημήτριος | el |
heal.committeeMemberName | Πεκμεστζή, Κιαμάλ | el |
heal.committeeMemberName | Γκούμας, Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Μικροϋπολογιστών και Ψηφιακών Συστημάτων VLSI | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 148 σ. | el |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: