dc.contributor.author | Κατσαντώνης, Κωνσταντίνος | el |
dc.contributor.author | Katsantonis, Konstantinos | en |
dc.date.accessioned | 2018-03-27T07:28:52Z | |
dc.date.available | 2018-03-27T07:28:52Z | |
dc.date.issued | 2018-03-27 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/46783 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.14023 | |
dc.rights | Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/gr/ | * |
dc.subject | Alternating least squares ALS | en |
dc.subject | FPGA | en |
dc.subject | Recommender systems | en |
dc.subject | Apache spark | en |
dc.subject | Acceleration | en |
dc.subject | Επιτάχυνση | el |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Συστήματα συστάσεων | el |
dc.subject | Σύνθεση υψηλού επιπέδου | el |
dc.subject | Νέφος | el |
dc.title | Επιτάχυνση συστημάτων συστάσεων βασισμένη σε FPGA | el |
dc.title | Accelerating recommender systems on multiple FPGA platforms | el |
heal.type | bachelorThesis | |
heal.classification | Field programmable gate arrays | el |
heal.classification | High performance computing | el |
heal.classification | Integrated circuits--Very large scale integration | el |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh93009062 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh95008935 | |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh85067125 | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2017-11-01 | |
heal.abstract | Η ραγδαία αύξηση των δεδομένων τα τελευταία χρόνια έχει οδηγήσει σε άνθιση κλάδο της μηχανικής μάθησης και γενικότερα της τεχνητής νοημοσύνης. Ωστόσο πατης αυξανόμενες ανάγκες για επεξεργασία όλο και μεγαλύτερου όγκου δεδομένων σκέντρα δεδομένων ο τρόπος που τα επεξεργαζόμαστε δεν έχει αλλάξει ιδιαίτερα εκαι αρκετά χρόνια και ο μόνος λόγος που η επεξεργαστική ισχύς συμβαδίζει με αύξηση των δεδομένων είναι ότι προς το παρών δεν μας έχει εγκαταλείψει ο νόμος τMoore κάτι που σύντομα ενδεχομένως να σταματήσει να ισχύει. Το εναλλακτικό μονοπάτι μέχρι τώρα έναντι του κλασικού CPU server αποτελοοι αρχιτεκτονικές που διαμοιράζουν το υπολογιστικό έργο εκτός απο τις CPU καιGPU με τις τελευταίες να πετυχαίνουν εξαιρετικά αποτελέσματα όσον αφορά την χνική επίδοση. Ωστόσο αν και οι χρονικές επιδόσεις των GPU είναι εξαιρετικές όσαφορά την ενεργειακή απόδοση οδηγούν σε περαιτέρω αύξηση της κατανάλωσης ισχύΣκοπός αυτής της διπλωματικής είναι να αναδείξει ένα ακόμα εναλλακτικό υλογιστικό μονοπάτι που στοχεύει όχι στην αντικατάσταση των υπολοίπων αλλά σνα καλύψει κάποιες ανάγκες που οι υπάρχουσες μέθοδοι αδυνατούν. Στόχος αυτης διπλωματικής είναι να δείξουμε πως μπορούν τα FPGAs να ενσωματωθούν σκέντρα δεδομένων κάνοντας χρήση υπαρχουσών τεχνολογιών με στόχο ταυτόχροτην αύξηση της ενεργειακής και χρονικής επίδοσης. Για τον σκοπό αυτό στην γκεκριμένη διπλωματική χρησιμοποιήσαμε τον αλγόριθμο Εναλλασόμενων ΕλάχιστΤετραγώνων για Παραγοντοποίηση Πίνακα (Alternating Least Squares For MatFactorization) με στόχο να παρουσιάσουμε ένα διάγραμμα εργασιακής ροής σχετμε το πώς κάποιος μπορεί να ξεκινήσει να τρέχει αλγορίθμους υποβοηθούμενους αFPGA σε ενα Datacenter. H διπλωματική αυτή εντάσσεται σε ένα γενικότερο πλαίσιο μιας προσπάθειας να τασκευαστούν βιβλιοθήκες οι οποίες θα περιέχουν βασικές εργασίες ενός Datacenκαι θα είναι επιταχυμένες σε FPGA και έτοιμες για χρήση από τον εκάστοτε προγρματιστή. Οι πλακέτες που χρησιμοποιήσαμε έιναι οι Xilinx ZedBoard, Xilinx Zc702 Digilent Pynq Z1, ενώ όσον αφορά το λογισμικό χρησιμοποιήσαμε τα Xilinx SDSoXilinc Vivado HLS,Apache Spark. Η ροη εργασίας που ακολουθήσαμε ήταν η εξήαρχικά γράψαμε τον αλγόριθμο των εναλλασόμενων ελαχίστων τετραγώνων σε C έπειτα καταγράψαμε το χρονικό του προφίλ. Στην συνέχεια με τη βοήθεια του XilSDSoC και του Vivado HLS κατασκευάσαμε μερικούς πυρήνες επιτάχυνσης γιαέντονο υπολογιστικά κομμάτι του αλγορίθμου. Δοκιμάσαμε την χρονική επίδοση τπυρήνων πάνω στο zedboard και στην συνέχεια την ενεργειακή τους επίδοση πάστο zc702. Στην συνέχεια επιλέξαμε τον καλύτερο απο τους πυρήνες τόσο ενεργειαi όσο και χρονικά και τον ενσωματώσαμε σε περιβάλλον Python στην πλακέτα Pynq-Z1 κάνοντας χρήση των βιβλιοθηκών που παρέχονται για την τελευταία. Η μετάβαση απο C σε Python έγινε διότι επιζητούσαμε να δημιουργήσουμε μια υλοποίηση σε μια γλώσσα που να χρησιμοποιείτε ευρέως στα κενταρα δεδομένων απο τους προγραμματιστές. Τέλος για τον σκοπό της διπλωματικής κατασκευάσαμε ένα Cluster απο Pynqs το οποίο προσομοίωσε ένα μικρό κέντρο δεδομένων πάνω στο οποίο, με την βοήθεια του Apache Spark, τρέξαμε κατανεμημένα τον επιταχυμένο αλγόριθμο. | el |
heal.advisorName | Σούντρης, Δημήτριος | el |
heal.committeeMemberName | Γκούμας, Γεώργιος | el |
heal.committeeMemberName | Πεκμεστζή, Κιαμάλ | el |
heal.committeeMemberName | Σούντρης, Δημήτριος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Μικροϋπολογιστών και Ψηφιακών Συστημάτων VLSI | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 110 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: