Η αριθμητική προσομοίωση κατασκευών και άλλων φορέων πρέπει να γίνεται με ένα τρόπο που προσφέρει ικανοποιητική ακρίβεια ενώ είναι υπολογιστικά εφικτός. Σε περιπτώσεις πολύπλοκης γεωμετρίας, η ακριβής προσομοίωση του φορέα είναι ένα από τα σημαντικότερα προβλήματα που αντιμετωπίζουν οι μηχανικοί. Οι σύγχρονες μέθοδοι προσομοίωσης μπορούν να προσφέρουν την επιθυμητή ακρίβεια αλλά πολλές φορές έχουν υψηλό υπολογιστικό κόστος. Για να είναι μια προσομοίωση εφαρμόσιμη σε πραγματικά προβλήματα, θα πρέπει να πραγματοποιείται σε λογικά υπολογιστικά χρονικά πλαίσια. Επομένως, ένας σημαντικός παράγοντας για την εφαρμογή των προσομοιώσεων στην πράξη είναι η αποδοτική υλοποίηση τους, η οποία θα επιτρέψει την εφαρμογή τους σε προβλήματα μεγάλης κλίμακας. Στις κλασικές μεθόδους πεπερασμένων στοιχείων (FEA) το μεγαλύτερο κόστος βρίσκεται στην επίλυση των αλγεβρικών εξισώσεων. Σε μη πλεγματικές μεθόδους (MMs) καθώς και στην ισογεωμετρική ανάλυση (IGA), το κόστος για την κατασκευή των χαρακτηριστικών μητρώων (π.χ. μητρώο στιβαρότητας) είναι ιδιαίτερα υψηλό. Επομένως, για να μπορούν αυτές οι μέθοδοι να αξιοποιηθούν σε προβλήματα μεγάλης κλίμακας, απαιτούνται τεχνικές μαζικής πολυεπεξεργασίας όχι μόνο για την επίλυση αλλά και για τη φάση κατασκευής των χαρακτηριστικών μητρώων, τα οποία απαιτούν αριθμητική ολοκλήρωση.
Ο σκοπός της παρούσας διατριβής είναι η επιτάχυνση των υπολογιστικά απαιτητικών φάσεων των μεθόδων αριθμητικής προσομοίωσης με βασικά κριτήρια την αποδοτικότητα και επεκτασιμότητα σε παράλληλο υπολογιστικό περιβάλλον. Για την επίλυση των εξισώσεων, οι μέθοδοι υποφορέων είναι ιδιαίτερα ελκυστικές καθώς χωρίζουν το φορέα σε πολλούς υποφορείς και επιτρέπουν την ταυτόχρονη επίλυσή τους. Όσον αφορά τη φάση κατασκευής των χαρακτηριστικών μητρών, ο υπολογισμός με βάση τα μη μηδενικά στοιχεία του μητρώου επιτρέπει την παράλληλη υλοποίησή τους. Οι αριθμητικές πράξεις που πραγματοποιούνται κατά την εκτέλεση ενός αλγορίθμου πρέπει να γίνονται αποδοτικά. Επομένως, υπολογισμοί όπως πράξεις με μητρώα θέλουν ιδιαίτερη προσοχή. Κάθε τύπος μητρώου είναι κατάλληλος για διαφορετικές λειτουργίες και πρέπει να χρησιμοποιείται κατάλληλα. Όλα τα παραπάνω συνδυάζονται με τις κάρτες γραφικών (GPUs) οι οποίες έχουμε εξαιρετικές δυνατότητες για παράλληλους υπολογισμούς. Σε αυτή τη διατριβή υλοποιούνται κώδικες για κάρτες γραφικών για τη φάση επίλυσης στη μέθοδο των πεπερασμένων στοιχείων καθώς και τη φάση κατασκευής των χαρακτηριστικών μητρώων στις μη-πλεγματικές και στις ισογεωμετρικές μεθόδους με σκοπό τη σημαντική μείωση του χρόνου εκτέλεσης της προσομοίωσης.
Η διατριβή οργανώνεται ως εξής: στο εισαγωγικό κεφάλαιο 1 παρουσιάζονται οι στόχοι και το αντικείμενο της διατριβής. Το κεφάλαιο 2 περιγράφει τις τρεις αριθμητικές μεθόδους που χρησιμοποιούνται, δηλαδή η μέθοδος πεπερασμένων στοιχείων, οι μη-πλεγματικές μέθοδοι καθώς και η μέθοδος ισογεωμετρικής ανάλυσης, ενώ παρουσιάζονται και τα παραδείγματα που θα χρησιμοποιηθούν και χρονομετρηθούν στα επόμενα κεφάλαια. Το κεφάλαιο 3 είναι αφιερωμένο στις μεθόδους υποφορέων. Το κεφάλαιο 4 παρουσιάζει τις κάρτες γραφικών και τα χαρακτηριστικά τους στοιχεία ενώ το κεφάλαιο 5 αναλύει το χειρισμό των μητρώων και τα διάφορα είδη που χρησιμοποιούνται. Το κεφάλαιο 6 περιλαμβάνει την υλοποίηση της μεθόδου υποφορέων FETI σε υβριδικό (CPU-GPU) περιβάλλον. Οι σχέσεις μεταξύ των βασικών οντοτήτων (κόμβοι, σημεία Gauss, σημεία ελέγχου) αναλύονται στο κεφάλαιο 7. Το κεφάλαιο 8 εστιάζει στη μορφοποίηση των χαρακτηριστικών μητρώων των μεθόδων προσομοίωσης. Το κεφάλαιο 9 κλείνει με μια ανακεφαλαίωση αυτής της διατριβής και ακολουθεί παράρτημα με υποστηρικτικό υλικό και βιβλιογραφία.
The primary purpose of engineering analysis is to provide a numerical simulation of a physical phenomenon in a way that is accurate but also computationally feasible. The need to accurately simulate various physical processes in complex geometries is important, and has perplexed scientists for many years. The up-to-date simulation methods can accurately model the physical domain but often require high computational effort. A simulation needs to be performed within a reasonable time-frame with the given computational resources in order to be affordable in real-world applications. Thus, an important aspect in terms of feasibility is the efficient implementation of a simulation method that enables its application in large-scale problems. While the prevailing cost in traditional finite element analysis (FEA) is in the solution phase, the main drawback of meshless methods (MMs) and isogeometric analysis (IGA) when addressing real-world problems is the high cost for the formulation of the characteristic matrices. Therefore, in order to make them efficient in large-scale simulations, these methods require massively parallel algorithms not only for the solution phase but also for the assembly phase.
The aim of this work is to accelerate computationally expensive parts of simulation methods in a manner that is both efficient and scalable. Algorithms in the context of this aim are explored and implemented in this work. For the solution phase, domain decomposition is an attractive option as it splits the domain into several subdomains and allows their concurrent solution. As for the formulation phase, assembling the matrix by non-zero allows different parts of the matrix to be calculated in parallel. The calculations involved in a particular algorithm must be performed efficiently. Hence, calculations like matrix operations, which are omnipresent in the simulation, should be handled appropriately. Each matrix format has its own strengths and weaknesses and should be used for the task it is most suitable for. All of the above are combined with GPUs (graphics processing units), which have been attracting a lot of attention in recent years due to their remarkable performance features. GPU implementations are developed, for the solution phase in FEA and the formulation phase of MMs and IGA, which led to a great reduction of the time required for the simulation of a particular model.
The Ph.D. dissertation is organized a follows: Chapter 1 introduces the aims and objectives. Chapter 2 describes the three methods used in this work, i.e. FEM, MMs (focusing on element-free Galerkin methods - EFG) and IGA. The test examples that are used throughout this work are outlined here. Chapter 3 is dedicated to domain decomposition solution methods. Chapter 4 presents graphics processing units (GPUs) and their characteristic properties, while Chapter 5 deals with the handling of matrices that are frequently encountered in simulation implementations. Chapter 6 contains the hybrid CPU-GPU implementation of the FETI domain decomposition method along with supporting numerical results. Relations between the basic entities (nodes, Gauss points, control points) are discussed in Chapter 7. Chapter 8 is dedicated to the formulation of the characteristic matrices of the simulation methods. Chapter 9 concludes with an overview of the present work, followed by the appendix, which includes supporting material, and bibliography.