HEAL DSpace

Βελτιστοποίηση ροών εργασίας μηχανικής μάθησης με την ενσωμάτωση ενός αποθετηρίου χαρακτηριστικών στην πλατφόρμα Kubeflow

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Παπαϊωάννου, Κωνσταντίνος el
dc.contributor.author Papaioannou, Konstantinos en
dc.date.accessioned 2022-11-16T10:19:01Z
dc.date.available 2022-11-16T10:19:01Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56150
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.23848
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Feast en
dc.subject Kubeflow en
dc.subject Kubernetes en
dc.subject Αποθετήριο Χαρακτηριστικών el
dc.subject Διαμοιρασμός Χαρακτηριστικών el
dc.subject Συνέπεια Χαρακτηριστικών el
dc.subject Μηχανική Μάθηση el
dc.subject Νέφος el
dc.subject Cloud en
dc.subject Machine Learning en
dc.subject Feature Store en
dc.subject Features Sharing en
dc.subject Features Consistency en
dc.title Βελτιστοποίηση ροών εργασίας μηχανικής μάθησης με την ενσωμάτωση ενός αποθετηρίου χαρακτηριστικών στην πλατφόρμα Kubeflow el
dc.title Optimizing ML Workflows by Integrating a Feature Store into Kubeflow en
heal.type bachelorThesis
heal.classification Συστήματα Υπολογιστών el
heal.classification Μηχανική Μάθηση el
heal.classification Computer Systems en
heal.classification Machine Learning en
heal.language el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-07-15
heal.abstract Η μηχανική μάθηση (ΜΜ) είναι σημαντική για τις επιχειρήσεις, γιατί βοηθάει στην επίλυση ποικίλων προβλημάτων, ενώ η ποιότητα των λύσεων που προσφέρει συμβαδίζει με αυτή των χαρακτηριστικών που χρησιμοποιούν τα μοντέλα ΜΜ. Οι επιστήμονες δεδομένων καταπιάνονται με την υλοποίηση ροών εργασίας που υποστηρίζουν ολόκληρο τον κύκλο ζωής της ΜΜ, μέρος του οποίου αφορά τη δημιουργία και τη διάθεση χαρακτηριστικών κατά την εκπαίδευση μοντέλων και την εξαγωγή συμπερασμάτων. Τα χαρακτηριστικά είναι μεταβλητές εισόδου σε ένα μοντέλο και είναι συνήθως ακατέργαστα δεδομένα που αναπαρίστανται ή κωδικοποιούνται σε διαφορετικές μορφές. Η διαδικασία αυτή απαιτεί πολύ χρόνο και προσπάθεια και συνεπάγεται διάφορες προκλήσεις. Οι πηγές δεδομένων έχουν διαφορετικά χαρακτηριστικά και απαιτούν διαφορετικές προσεγγίσεις στην κατανάλωση και τη διαχείρισή τους. Επιπλέον, η διάθεση χαρακτηριστικών με συνεπή τρόπο στη χρονοβόρα εκπαίδευση μοντέλων και την αστραπιαία εξαγωγή συμπερασμάτων είναι δύσκολη και οδηγεί συχνά στο πρόβλημα της στρέβλωσης μεταξύ εκπαίδευσης και διάθεσης ενός μοντέλου. Ένα αποθετήριο χαρακτηριστικών, όπως το Feast, λύνει αυτές τις προκλήσεις τυποποιώντας τους ορισμούς των χαρακτηριστικών, καταχωρώντας τα σε ένα κεντρικό αποθετήριο και κάνοντάς τα διαθέσιμα με συνέπεια κατά την εκπαίδευση μοντέλων και την εξαγωγή συμπερασμάτων. Η ενσωμάτωση του στο Kubeflow επιτρέπει την κοινή χρήση και επαναχρησιμοποίηση αυτών από πολλούς χρήστες και ομάδες. Η λύση μας μετατρέπει το Feast σε ένα νεφο-εγγενές σύστημα πελάτη-εξυπηρετητή. Δημιουργούμε έναν διακομιστή REST API που διαχειρίζεται και αποθηκεύει τους ορισμούς χαρακτηριστικών και τα μεταδεδομένα τους σε ποικίλες βάσεις δεδομένων SQL οι οποίες υποστηρίζονται μέσω του μηχανισμού Object-Relational Mapping (ORM). Επιπλέον, επιβάλλουμε έλεγχο πρόσβασης με τον μηχανισμό RBAC του Κυβερνήτη και επεκτείνουμε τον πελάτη του Feast ώστε να χρησιμοποιεί το νέο API. el
heal.abstract Machine learning (ML) is a core piece of businesses’ daily life, as it proves to be valuable for solving various real-world problems. What is more, the quality of solutions it offers goes hand in hand with the quality of data and features used by ML models and applications. Data scientists put a lot of effort in designing and implementing workflows that support the entire ML lifecycle, a large part of which deals with creating and extracting features from raw data, as well as serving these features during model training and inference. Features are variables that act as input in a model. They are usually data represented or encoded in different forms, but we can also find them in the form of raw data. This part of the process requires a lot of time and effort and entails various challenges. Data sources have different characteristics and require different approaches in their consumption and management. In addition, making features available both for time-consuming model training and lightning-fast model inference in a consistent way is tough and may result in the very common training-serving skew problem. A feature store such as Feast can solve these challenges by standardizing feature definitions, registering them in a central repository and making them consistently available during model training and inference. Integrating a feature store into Kubeflow, which is a complete ML platform, also allows sharing and reuse of features by multiple users and teams. The solution we propose turns Feast into a cloud native client-server system. We create a REST API server which manages and stores all feature definitions and their metadata in an SQL database. We support different SQL databases through the use of ObjectRelational Mapping (ORM) mechanism and we enforce access control using Kubernetes RBAC mechanism. Finally, we extend Feast’s client to use the new API in order to access feature definitions through the server. en
heal.advisorName Κοζύρης, Νεκτάριος el
heal.advisorName Koziris, Nectarios en
heal.committeeMemberName Κοζύρης, Νεκτάριος el
heal.committeeMemberName Koziris, Nectarios en
heal.committeeMemberName Γκούμας, Γεώργιος el
heal.committeeMemberName Πνευματικάτος, Διονύσιος el
heal.committeeMemberName Goumas, Georgios en
heal.committeeMemberName Pnevmatikatos, Dionisios en
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων el
heal.academicPublisherID ntua
heal.numberOfPages 173 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα