Σκοπός της παρούσης διατριβής είναι η μελέτη των κατανεμημένων περιβαλλόντων Πλέγματος (Grid) και Νέφους (Cloud) και ιδιαιτέρως οι μηχανισμοί ελέγχου και εκτέλεσης ροών εργασίας (workflows) σε εικονικοποιημένα (virtualized) περιβάλλοντα. Ιδιαίτερη σημασία δίνεται στην ανάγκη παροχής εκ μέρους των συστημάτων αυτών εγγυήσεων Ποιότητας Υπηρεσίας ώστε να μπορούν να εκτελεστούν εφαρμογές ελαστικού πραγματικού χρόνου (soft real-time). Για τον λόγο αυτό, αναλύονται οι απαιτήσεις που έχουν οι διαδραστικές εφαρμογές, τα υπάρχοντα συστήματα διαχείρισης ροών εργασίας καθώς και οι δυνατότητες που παρέχουν τα σύγχρονα λειτουργικά συστήματα για εκτέλεση εφαρμογών πραγματικού χρόνου. Στη συνέχεια παρουσιάζεται μία αρχιτεκτονική λύση η οποία μπορεί να παρέχει τις απαιτούμενες υπηρεσίες και μηχανισμούς που επιτρέπουν την μοντελοποίηση και εκτέλεση διαδραστικών εφαρμογών σε κατανεμημένα περιβάλλοντα Νέφους. Η προτεινόμενη λύση επαληθεύεται και αξιολογείται μέσω σειράς πειραμάτων καθώς και μέσω πραγματικών εφαρμογών και παρουσιάζονται τα πλεονεκτήματα. Τέλος, παρουσιάζεται μία λύση για την επίβλεψη κατανεμημένων συστημάτων που εμφανίζει σημαντικές δυνατότητες κλιμάκωσης και συνάθροισης των παρατηρούμενων μετρικών.
The aim of this thesis is the study of distributed Grid and Cloud environments and particularly the mechanisms needed to manage and execute business workflows in virtualized environments. Particular attention is given to the QoS guarantees that these systems need to provide in order for soft real-time applications to be deployed, managed and executed. For this reason, the requirements that interactive applications have are analyzed, existing workflow management systems are studied and the real-time offerings of modern operating systems are researched. Following, we present an architectural solution that can provide the necessary services and tools that enable modeling and execution of interactive applications in distributed Cloud environments. The proposed solution is verified and evaluated through a series of experiments as well as through real-life applications and its advantages are presented. Finally, a scalable monitoring solution able to perform aggregation is presented and evaluated.