heal.abstract |
Καθώς η μηχανική μάθηση (ML) συνεχίζει να φέρνει επανάσταση στον τρόπο με
τον οποίο οι οργανισμοί επεξεργάζονται και αναλύουν δεδομένα, η ανάγκη για εξ-
ειδικευμένους υπολογιστικούς πόρους γίνεται όλο και πιο σημαντική. Οι μονάδες
επεξεργασίας γραφικών (GPU) έχουν αναδειχθεί ως μια δημοφιλής λύση για την
επιτάχυνση των φορτίων εργασίας ML, προσφέροντας σημαντικά πλεονεκτήματα
απόδοσης σε σχέση με τα παραδοσιακά συστήματα που βασίζονται σε CPU. Το
νέφος έχει γίνει μια δημοφιλής επιλογή ανάπτυξης για τα φορτία εργασίας ML,
προσφέροντας διάφορα πλεονεκτήματα, όπως η επεκτασιμότητα, η ευελιξία και
η οικονομική αποδοτικότητα. Το Kubernetes, μια πλατφόρμα ενορχήστρωσης
containers ανοικτού κώδικα, έχει γίνει μια δημοφιλής λύση για τη διαχείριση των
φορτίων εργασίας που απαιτούν επιτάχυνση σε GPU. Ο συνδυασμός των GPU και
του Kubernetes επιτρέπει στους οργανισμούς να κλιμακώνουν τα φορτία εργασίας
ML κατά παραγγελία και να κατανέμουν αποτελεσματικά τους πόρους ώστε να αν-
ταποκρίνονται στις απαιτήσεις των φορτίων εργασίας. Ωστόσο, η ανάπτυξη και η
διαχείριση των φορτίων εργασίας που βασίζονται σε GPU στο Kubernetes μπορεί
να αποτελέσει πρόκληση λόγω της εξειδικευμένης φύσης αυτών των πόρων. Οι ορ-
γανισμοί πρέπει να διαχειρίζονται και να κατανέμουν προσεκτικά τους πόρους GPU
για να διασφαλίζουν βέλτιστη απόδοση και αποτελεσματική χρήση των πόρων.
Αυτό μπορεί να περιλαμβάνει την εφαρμογή πολιτικών και διαδικασιών για την
ιεράρχηση της πρόσβασης στους πόρους με βάση τις απαιτήσεις του φόρτου ερ-
γασίας, όπως ο τύπος του φόρτου εργασίας, η χρήση των πόρων και οι απαιτήσεις
απόδοσης. Επιπλέον, η διασφάλιση της συμβατότητας και της διαλειτουργικότητας
μεταξύ διαφορετικών στοιχείων υλικού και λογισμικού είναι κρίσιμη κατά την ανάπ-
τυξη φορτίων εργασίας που βασίζονται σε GPU στο Kubernetes. Το Kubernetes
υποστηρίζει διάφορους τύπους GPU, ο καθένας με τις δικές του προδιαγραφές και
απαιτήσεις, και η ενσωμάτωση στοιχείων λογισμικού και υλικού τρίτων μπορεί να
αποτελέσει πρόκληση.
Σε αυτή τη διατριβή, σχεδιάζουμε ένα σύστημα χρονοπρογραμματισμού GPU
με επίγνωση πόρων και παρεμβολών με στόχο τον αποτελεσματικό χρονοπρο-
γραμματισμό και/ή την παράλληλη τοποθέτηση εισερχόμενων εφαρμογών σε διά-
φορα ετερογενή τμήματα των GPU κέντρων δεδομένων. Ενσωματώνουμε τη λύση
στο Kubernetes, ένα από τα πιο ευρέως χρησιμοποιούμενα πλαίσια ενορχήστρω-
σης νέφους. Δείχνουμε ότι ο χρονοπρογραμματιστής μας μπορεί να καλύψει πιο
5αποτελεσματικά τους περιορισμούς ποιότητας υπηρεσιών (QoS) των χρηστών, με
υψηλότερη αξιοποίηση των πόρων σε σύγκριση με τους σύγχρονους χρονοπρο-
γραμματιστές, για μια ποικιλία φόρτων εργασίας ML στο νέφος, διατηρώντας
παράλληλα χαμηλά τις καθυστερήσεις και την κατανάλωση ενέργειας. |
el |