HEAL DSpace

Υλοποίηση multi-GPU L3 BLAS βιβλιοθήκης με POSIX Threads και HIP

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Πούτας, Σωκράτης el
dc.contributor.author Poutas, Sokratis en
dc.date.accessioned 2024-01-29T08:28:00Z
dc.date.available 2024-01-29T08:28:00Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/58703
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.26399
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Επεξεργαστές γραφικών el
dc.subject Παράλληλη εκτέλεση el
dc.subject Ουρές εργασιών el
dc.subject Γεγονότα el
dc.subject Γραμμική άλγεβρα el
dc.subject GPU en
dc.subject Multi-GPU BLAS en
dc.subject CUDA en
dc.subject Pthreads en
dc.subject HIP en
dc.title Υλοποίηση multi-GPU L3 BLAS βιβλιοθήκης με POSIX Threads και HIP el
heal.type bachelorThesis
heal.classification Συστήματα Παράλληλης Επεξεργασίας el
heal.classification GPGPU en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2023-09-14
heal.abstract Σκοπός της παρούσας διπλωματικής εργασίας είναι η εξερεύνηση διαφορετικών υλοποιήσεων μιας βιβλιοθήκης δρομολόγησης υπο-προβλημάτων γραμμικής άλγεβρας σε συστήματα με πολλαπλούς επεξεργαστές γραφικών (multi-GPU BLAS), στοχεύοντας στην επιτάχυνση που προσφέρει η επικάλυψη του υπολογισμού σε GPU και της μεταφοράς δεδομένων μεταξύ CPU και GPU. Αυτό επιτυγχάνεται μέσω ουρών εργασιών και ενός συστήματος συγχρονισμού με βάση γεγονότα (events). Οι προηγούμενες εκδόσεις της βιβλιοθήκης χρησιμοποιούσαν CUDA, κάτι που την καθιστούσε λειτουργική μόνο σε συστήματα με Nvidia GPUs. Σε αυτή την εργασία υλοποιούμε δύο νέες εκδόσεις της βιβλιοθήκης: μία βασισμένη στα POSIX threads και μία που χρησιμοποιεί το HIP. Τέλος, συγκρίνουμε τις προγραμματιστικές δυνατότητες κάθε υλοποίησης και τις επιπτώσεις τους στην επίδοση της βιβλιοθήκης, συμπεραίνοντας ότι οι δικές μας υλοποιήσεις επεκτείνουν τις δυνατότητες εφαρμογής της βιβλιοθήκης και επιτυγχάνουν παρόμοιες ή καλύτερες επιδόσεις. el
heal.abstract This thesis explores different library implementations for routing linear algebra sub-problems in multi-GPU systems, with the aim of achieving speedup through overlapping CPU-GPU communication with GPU computation. This is accomplished through task queues and an event-based synchronization system. The previous versions of the library utilized a CUDA back-end, limiting its functionality to Nvidia systems. In this thesis, we implement two new versions of the library: one based on POSIX threads and another that uses HIP. We then compare the programming capabilities of each implementation and their impact on library performance, concluding that our implementation extends the applicability of the library and achieves similar or superior performance. en
heal.advisorName Γκούμας, Γεώργιος el
heal.committeeMemberName Κοζύρης, Νεκτάριος el
heal.committeeMemberName Πνευματικάτος, Διονύσιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων el
heal.academicPublisherID ntua
heal.numberOfPages 107 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα