dc.contributor.author |
Αποστολάκης, Σωτήριος
|
el |
dc.contributor.author |
Apostolakis, Sotirios
|
en |
dc.date.accessioned |
2016-04-12T08:16:22Z |
|
dc.date.available |
2016-04-12T08:16:22Z |
|
dc.date.issued |
2016-04-12 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/42362 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.10720 |
|
dc.rights |
Default License |
|
dc.subject |
Πρόβλεψη επίδοσης |
el |
dc.subject |
Χρόνος επικοινωνίας |
el |
dc.subject |
Μηχανική μάθηση |
el |
dc.subject |
Performance prediction |
en |
dc.subject |
Communication time |
en |
dc.subject |
Machine learning |
en |
dc.title |
Πρόβλεψη χρόνου επικοινωνίας παράλληλων εφαρμογών με τεχνικές μηχανικής μάθησης |
el |
dc.title |
Prediction of communication time of large-scale applications using machine learning techniques |
en |
dc.contributor.department |
Computing Systems lab |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Computer science |
en |
heal.language |
el |
|
heal.language |
en |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2015-07-22 |
|
heal.abstract |
Ο χρόνος επικοινωνίας είναι ένα αναπόσπαστο κομμάτι του συνολικού χρόνου εκτέλεσης εφαρμογών μεγάλης κλίμακας και εξαρτάται από ένα ευρύ φάσμα παραγόντων, συμπεριλαμβανομένων της αρχιτεκτονικής και του λογισμικού του συστήματος, τα χαρακτηριστικά της εφαρμογής και
δυσνόητα δικτυακά φαινόμενα. Η πρόβλεψη του κόστους επικοινωνίας είναι ένα ζήτημα που έχει
μελετηθεί από πολλούς από διάφορες οπτικές γωνίες. Με τη δουλειά μας αποσκοπούμε να συνεισφέρουμε σε αυτή την προσπάθεια και να παρουσιάσουμε μία πρωτοποριακή προσέγγιση αυτού του θέματος. Προτείνουμε μία machine learning μεθοδολογία για την πρόβλεψη του συνολικού χρόνου
επικοινωνίας παράλληλων εφαρμογών. Ορίσαμε ένα σύνολο από παραμέτρους, προερχόμενες από τα χαρακτηριστικά της εφαρμογής, το μέγεθος των χρησιμοποιούμενων πόρων, την αντιστοίχηση των διεργασιών στους πυρήνες του συστήματος και την αρχιτεκτονική του δικτύου. Κατόπιν, συγκεντρώνοντας μετρήσεις, που καλύπτουν όλο το φάσμα των χρησιμοποιούμενων παραμέτρων, με την εκτέλεση μιας απλής γενικευμένης εφαρμογής, αποκτήσαμε μία εικόνα της συμπεριφοράς του
υπό εξέταση δικτύου. Ο αλγόριθμος forests of extremely randomized trees χρησιμοποιήθηκε για να προβλέψουμε τον χρόνο επικοινωνίας στηριζόμενοι στα δεδομένα επικοινωνίας που συλλέξαμε με την προηγούμενη διαδικασία. Το μοντέλο πρόβλεψης μας πετυχαίνει αξιοσημείωτα αποτελέσματα στην πρόβλεψη επίδοσης δύο διαφορετικών εφαρμογών για ποικίλα μεγέθη προβλήματος και ρυθμίσεις συστήματος. Επίσης, διαλέγουμε επιτυχώς τις βέλτιστες ρυθμίσεις εκτέλεσης σε ένα
σενάριο λήψης αποφάσεων. Τέλος, πέρα από τις προβλέψεις, η δουλειά μας πετυχαίνει να αναγνωρίσει τα αίτια της διαφοροποίησης της επίδοσης σε δύο αρκετά διαφορετικά δίκτυα μεγάλης κλίμακας. |
el |
heal.abstract |
Communication time is an integral part of the execution time of large-scale applications and
depends on a wide set of factors, including system architecture and software, application's features
and obscure network effects. Its prediction is a subject which was studied by many from
various perspectives. With our work, we wish to contribute and add a novel approach to this
matter. We propose a machine-learning scheme to predict the total communication time of
parallel applications. We define a set of features extracted from application's characteristics,
allocation size, process mapping and system's architecture, and devise a simple benchmark
which sweeps over the parameter space and provides valuable insight on the network effects.
Forests of extremely randomized trees - a supervised learning algorithm - is applied to perform
regression analysis on communication data, derived from the benchmark, and application
execution time. Our prediction model achieves noteworthy results in making predictions for
two different communication kernels with various problem sizes and system configurations, and
successfully selects optimal execution configurations in a decision-making scenario. Finally, except
for making predictions, our work succeeded in identifying the culprits behind performance
variability for two dissimilar network architectures. |
en |
heal.advisorName |
Κοζύρης, Νεκτάριος |
el |
heal.committeeMemberName |
Κοζύρης, Νεκτάριος |
el |
heal.committeeMemberName |
Γκούμας, Γεώργιος |
el |
heal.committeeMemberName |
Σταφυλοπάτης, Ανδρέας-Γεώργιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
112 σ. |
|
heal.fullTextAvailability |
true |
|