Υλοποίηση multi-GPU L3 BLAS βιβλιοθήκης με POSIX
Threads και HIP

Πούτας, Σωκράτης; Poutas, Sokratis

dc.contributor.author	Πούτας, Σωκράτης	el
dc.contributor.author	Poutas, Sokratis	en
dc.date.accessioned	2024-01-29T08:28:00Z
dc.date.available	2024-01-29T08:28:00Z
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/58703
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.26399
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.subject	Επεξεργαστές γραφικών	el
dc.subject	Παράλληλη εκτέλεση	el
dc.subject	Ουρές εργασιών	el
dc.subject	Γεγονότα	el
dc.subject	Γραμμική άλγεβρα	el
dc.subject	GPU	en
dc.subject	Multi-GPU BLAS	en
dc.subject	CUDA	en
dc.subject	Pthreads	en
dc.subject	HIP	en
dc.title	Υλοποίηση multi-GPU L3 BLAS βιβλιοθήκης με POSIX Threads και HIP	el
heal.type	bachelorThesis
heal.classification	Συστήματα Παράλληλης Επεξεργασίας	el
heal.classification	GPGPU	en
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2023-09-14
heal.abstract	Σκοπός της παρούσας διπλωματικής εργασίας είναι η εξερεύνηση διαφορετικών υλοποιήσεων μιας βιβλιοθήκης δρομολόγησης υπο-προβλημάτων γραμμικής άλγεβρας σε συστήματα με πολλαπλούς επεξεργαστές γραφικών (multi-GPU BLAS), στοχεύοντας στην επιτάχυνση που προσφέρει η επικάλυψη του υπολογισμού σε GPU και της μεταφοράς δεδομένων μεταξύ CPU και GPU. Αυτό επιτυγχάνεται μέσω ουρών εργασιών και ενός συστήματος συγχρονισμού με βάση γεγονότα (events). Οι προηγούμενες εκδόσεις της βιβλιοθήκης χρησιμοποιούσαν CUDA, κάτι που την καθιστούσε λειτουργική μόνο σε συστήματα με Nvidia GPUs. Σε αυτή την εργασία υλοποιούμε δύο νέες εκδόσεις της βιβλιοθήκης: μία βασισμένη στα POSIX threads και μία που χρησιμοποιεί το HIP. Τέλος, συγκρίνουμε τις προγραμματιστικές δυνατότητες κάθε υλοποίησης και τις επιπτώσεις τους στην επίδοση της βιβλιοθήκης, συμπεραίνοντας ότι οι δικές μας υλοποιήσεις επεκτείνουν τις δυνατότητες εφαρμογής της βιβλιοθήκης και επιτυγχάνουν παρόμοιες ή καλύτερες επιδόσεις.	el
heal.abstract	This thesis explores different library implementations for routing linear algebra sub-problems in multi-GPU systems, with the aim of achieving speedup through overlapping CPU-GPU communication with GPU computation. This is accomplished through task queues and an event-based synchronization system. The previous versions of the library utilized a CUDA back-end, limiting its functionality to Nvidia systems. In this thesis, we implement two new versions of the library: one based on POSIX threads and another that uses HIP. We then compare the programming capabilities of each implementation and their impact on library performance, concluding that our implementation extends the applicability of the library and achieves similar or superior performance.	en
heal.advisorName	Γκούμας, Γεώργιος	el
heal.committeeMemberName	Κοζύρης, Νεκτάριος	el
heal.committeeMemberName	Πνευματικάτος, Διονύσιος	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων	el
heal.academicPublisherID	ntua
heal.numberOfPages	107 σ.	el
heal.fullTextAvailability	false