dc.contributor.author |
Ηλιοπούλου, Χρυσοβαλάντω-Θεοδώρα
|
el |
dc.contributor.author |
Iliopoulou, Chrysovalanto-Theodora
|
en |
dc.date.accessioned |
2021-05-30T16:08:48Z |
|
dc.date.available |
2021-05-30T16:08:48Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/53523 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.21221 |
|
dc.rights |
Default License |
|
dc.subject |
Machine learning in production |
en |
dc.subject |
Data science |
en |
dc.subject |
ML operations |
en |
dc.subject |
Deployment pipelines |
en |
dc.subject |
Μηχανική μάθηση στην παραγωγή |
el |
dc.subject |
Επιστήμη Δεδομένων |
el |
dc.subject |
Διαδικασίες μηχανικής μάθησης |
el |
dc.subject |
Σωληνώσεις συνεχούς ενσωμάτωσης |
el |
dc.subject |
Σωληνώσεις εγκατάστασης |
el |
dc.subject |
Continuous integration pipelines |
en |
dc.title |
Υλοποίηση και αξιολόγηση συστημάτων μηχανικής μάθησης παραγωγής με εφαρμογή στη σημασιολογική κατάτμηση
γεωχωρικών δεδομένων |
el |
dc.title |
Implementation and assessment of machine learning
production systems for geospatial data classification tasks |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Μηχανική Μάθηση |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2021-03-30 |
|
heal.abstract |
Το πεδίο της μηχανικής μάθησης έχει παρουσιάσει τεράστια πρόοδο τα τελευταία
χρόνια. Χάρη στη συνεχή εξέλιξη των τεχνικών και μεθόδων ταξινόμησης και πρόβλεψης και
την ικανοποιητική τους απόδοση, η χρήση τους και η ενσωμάτωσή τους στο βιομηχανικό
χώρο κρίνεται αναγκαία. Είναι σημαντικό η ενσωμάτωσή τους σε ένα παραγωγικό
περιβάλλον να γίνεται με τρόπο που συμβάλλει στην ομαλή συνεργασία του ανθρώπινου
δυναμικού που εξειδικεύεται στην ανάπτυξη εφαρμογών αλλά και τη γρήγορη και ορθώς
καθορισμένη διαδικασία ανάπτυξης και ενημέρωσης των εφαρμογών.
Μέχρι σήμερα, έχουν αναπτυχθεί τεχνικές και εργαλεία που αυτοματοποιούν τις
επαναλαμβανόμενες διαδικασίες που απαιτούνται στη φάση ανάπτυξης νέου κώδικα και
εγκατάστασής του σε ζωντανό περιβάλλον. Ωστόσο, η εφαρμογή τους δεν είναι αρκετή για
το χώρο της μηχανικής μάθησης. Οι τρεις βασικές συνιστώσες της μηχανικής μάθησης είναι
ο κώδικας, τα δεδομένα και τα μοντέλα. Η αλλαγή έστω και μιας από τις τρεις συνιστώσες
μπορεί να οδηγήσει σε διαφορετική πρόβλεψη από το σύστημα που αυτές παράγουν.
Συνεπώς, είναι απαραίτητη η ταυτόχρονη διαχείριση και των τριών συνιστωσών ως προς την
αποθήκευση, την ιστορικότητα και την προώθηση στο παραγωγικό περιβάλλον του
βέλτιστου μοντέλου που προκύπτει από το συνδυασμό τους.
Σκοπός της παρούσας μεταπτυχιακής εργασίας είναι η διερεύνηση και η μελέτη
μερικών από τα πολυάριθμα εργαλεία που έχουν αναπτυχθεί για την αντιμετώπιση των
δυσκολιών της μηχανικής μάθησης σε παραγωγικό περιβάλλον. Επιλέγονται μερικά εξ αυτών
και ελέγχεται ο συνδυασμός τους, με στόχο το σχεδιασμό και την ανάπτυξη μιας υποδομής,
ικανής να καλύψει τις προκλήσεις που αντιμετωπίζει η ένταξη και η διαχείριση μοντέλων
μηχανικής μάθησης σε παραγωγικές εφαρμογές. Αντικείμενο εφαρμογής των εργαλείων
αυτών αποτελεί το πρόβλημα ταξινόμησης των στοιχείων μιας γεωχωρικής εικόνας, που
απεικονίζει υποθαλάσσιο έδαφος, σε ορισμένες κλάσεις συγκεκριμένης σύστασης.
Προσεγγίζοντας το πρόβλημα με διαφορετικές λύσεις αλλά και με διαφορετικά
σύνολα δεδομένων, αξιολογούνται τα επιλεγμένα εργαλεία και τονίζονται τα οφέλη της
χρήσης τους για την εύρεση της καλύτερης δυνατής λύσης, τόσο κατά τη διάρκεια ανάπτυξης
νέων μεθόδων ταξινόμησης όσο και στη φάση συνεχούς ενημέρωσης ενός εγκαταστημένου
μοντέλου σε μια παραγωγική εφαρμογή. |
el |
heal.abstract |
Machine learning as a field has evolved significantly over the last years. Due to the
continuous evolution of classification and prediction methods, but also to their satisfying
efficiency, the models’ usage and integration in industry have become a necessity. It is
important that their integration into a production environment occurs in a way that
contributes to smooth cooperation of the human resources specializing in developing
applications, but also in quick and properly defined operations associated with developing
and updating applications.
Up till today, many techniques and tools have been produced, for automating
repeated operations needed for phases of developing new code and deploying it into a live
environment. However, they can not be simply applied for machine learning applications.
Machine learning’s three main components are code (algorithms), data and models. Changing
one of them may lead to different classification results. Therefore, it is necessary that all the
components are handled simultaneously concerning the storage, history and forwarding to
the production environment of the optimal model that comes from their combination.
The purpose of the present master thesis is to investigate and study some of the
numerous tools that have been developed for coping with the struggles of machine learning
when productising. Some of them are chosen in order to check the adequacy of their
combination aiming at the design and implementation of an infrastructure, appropriate for
handling the challenges of deploying and operating machine learning models in production.
These tools are assessed considering the classification of backscatter images of the seabed
into certain classes of specific composition.
Approaching the problem according to different solutions but also to different
datasets, the tools considered are evaluated. At the same time, the benefits of using them for
finding the best possible solution during the development of new classification methods but
also during continuous integration of the deployed model, are noticed. |
en |
heal.advisorName |
Καράντζαλος, Κωνσταντίνος |
el |
heal.committeeMemberName |
Γκούμας, Γεώργιος |
el |
heal.committeeMemberName |
Στάμου, Γεώργιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
86 σ. |
el |
heal.fullTextAvailability |
false |
|