HEAL DSpace

RiskML: Εφαρμογή προβλέψεων ρίσκου κυβερνοασφάλειας με αξιοποίηση τεχνολογιών διαδικασιών μηχανικής μάθησης στον κλάδο της υγείας

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Πελέκης, Σωτήρης el
dc.contributor.author Pelekis, Sotirios en
dc.date.accessioned 2022-06-17T08:23:39Z
dc.date.available 2022-06-17T08:23:39Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/55296
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22994
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) "Επιστήμη Δεδομένων και Μηχανική Μάθηση" el
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Machine learning operations en
dc.subject Διαδικασίες μηχανικής μάθησης el
dc.subject Υγεία el
dc.subject Κυβερνοασφάλεια el
dc.subject Cybersecurity en
dc.subject Healthcare en
dc.title RiskML: Εφαρμογή προβλέψεων ρίσκου κυβερνοασφάλειας με αξιοποίηση τεχνολογιών διαδικασιών μηχανικής μάθησης στον κλάδο της υγείας el
dc.title RiskML: Data‐Driven Cyber‐Risk Predictions Leveraging State‐of‐the‐Art Machine Learning Operations in the Healthcare Domain en
dc.contributor.department Decision Support Systems Laboratory el
heal.type masterThesis
heal.classification Machine Learning, Cyber security, Risk Assessment, Healthcare en
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-12-29
heal.abstract Ο πυρήνας της παρούσας διπλωματικής εργασίας είναι μια εφαρμογή λογισμικού μηχανικής μάθησης που ονομάζεται RiskML. Το RiskML διεξάγει προβλέψεις ρίσκου κυβερνοασφάλειας με χρήση της βάσης δεδομένων της κοινότητας Veris. Η εφαρμογή απευθύνεται σε όλα τα στάδια του κύκλου ζωής του ML και βασίζεται σε εργαλεία αιχμής του κλάδου των διαδικασιών μηχανικής μάθησης (MLOps). Κατα αυτόν τον τρόπο, μέσω αρχιτεκτονικών σωλήνωσης (pipelines), φέρνει τις μεθοδολογίες πρόβλεψης ρίσκου κυβερνοασφάλειας στην παραγωγή, πράγμα ιδιαίτερα καινοτόμο για τον κλάδο. Ένα σημαντικό κομμάτι της ερευνητικής προσπάθειας της παρούσας διπλωματικής εργασίας αποτελεί η ανάλυση της βάσης VCDB ως βασική πηγή δεδομένων για πειραματισμό και υλοποιήση μοντέλων. Η VCDB στοχεύει στη συλλογή και τη διάδοση πληροφοριών παραβίασης δεδομένων για όλα τα σχετικά συμβάντα που αποκαλύπτονται δημόσια. Τα δεδομένα κωδικοποιούνται υπό το λεξιλόγιο VERIS και είναι διαθέσιμα για δημόσια χρήση. Προκειμένου να εξερευνηθεί το status quo της επιχειρησιακής κυβερνοασφάλειας και να αναδειχθούν οι πιθανές προσεγγίσεις μηχανικής μάθησης, διεξάγεται μια εκτενής διερευνητική ανάλυση στο σύνολο δεδομένων, εστιάζοντας κυρίως στον τομέα της υγειονομικής περίθαλψης, ο οποίος βρίσκεται στο επίκεντρο αυτής της εργασίας. Όσον αφορά την πειραματική φάση, δίνεται έμφαση στην επίλυση πολλαπλων εργασιών εκτίμησης ρίσκου στον κυβερνοχώρο που σχετίζονται κυρίως με τα περιουσιακά στοιχεία των επιχειρήσεων, χρησιμοποιώντας μια αρχιτεκτονική σωλήνωσης μηχανικής μάθησης. Τέτοιες εργασίες μπορεί να είναι χρήσιμες για πολλαπλα ενδιαφερόμενα μέρη (όπως ερευνητές, επιστήμονες δεδομένων και αναλυτές κυβερνοασφάλειας) και ειδικά στο πλαίσιο υποδομών ζωτικής σημασίας, όπως είναι οι οργανισμοί υγειονομικής περίθαλψης. Πιο συγκεκριμένα, στη φάση αυτή αναπτύσεται μια αρχιτεκτονική σωλήνωσης μηχανικής μάθησης, που βασίζεται στο MLflow, και έχει δημιουργηθεί για την αυτοματοποίηση πειραμάτων μηχανικής μάθησης που αποτελούνται από ένα βήμα μετασχηματισμών, ένα βήμα εκπαίδευσης και ένα βήμα αξιολόγησης. Αναλύονται δύο ενδεικτικές περιπτώσεις χρήσης εκτίμησης ρίσκου, ως proof-of-concept για το προτεινόμενο πλαίσιο πειραματισμού MLOps και τις δυνατότητες αυτοματοποίησής τους. Η πρώτη αναφέρεται στο ρίσκο απώλειας διαθεσιμότητας δεδομένων και η δεύτερη στο ρίσκο στοχοποίησης ενός διακομιστή κατά τη διάρκεια ενός συμβάντος κυβερνοασφάλειας. Στο στάδιο αυτό, εκπαιδεύονται και αξιολογούνται πολλαπλοί αλγόριθμοι μηχανικής μάθησης. Σε ότι αφορά την υλοποίηση και την αρχιτεκτονική της υπό ανάπτυξης εφαρμογής, το RiskML επιτρέπει στους τελικούς χρήστες να εγκαταστήσουν τα μοντέλα πρόβλεψης κινδύνου της προτίμησής τους στην παραγωγή προκειμένου να «λύσουν» τα αντίστοιχα προβλήματα μηχανικής μάθησης με γρήγορο και αυτοματοποιημένο τρόπο. Οι προβλέψεις που παράγονται από το RiskML είναι πλήρως παραμετροποιήσιμες από τον τελικό χρήστη και μπορούν να καταναλωθούν μέσω διεπαφής προγραμματισμού εφαρμογών (API) από οποιονδήποτε προγραμματικό πράκτορα ανάλυσης και αξιολόγησης ρίσκου. Τεχνολογίες αιχμής όπως το MLflow, το Docker και το Swagger χρησιμοποιούνται από την εφαρμογή. Σε επίπεδο επίδειξης, το RiskML συμπεριλήφθηκε σε ένα πλαισίο / εργαλείο αξιολόγησης ρίσκου κυβερνοασφάλειας σε πραγματικό χρόνο στο πλαίσιο του ερευνητικού ευρωπαϊκού έργου SPHINX ως κομμάτι μιας εργαλειοθήκης κυβερνοασφάλειας που στοχεύει στο νοσοκομειακό τομέα. el
heal.abstract The main output of the current project is a machine learning software application, namely RiskML, that conducts cyber-risk predictions based on the Veris Community Database. RiskML addresses all the stages of the ML lifecycle and is based on state-of-the-art Machine Learning Operations (MLOps) tools. Such a technological approach, that puts cyber-risk prediction methodologies in practice, by deploying them within machine learning pipelines in production, is beyond the current state-of-the-art in the risk assessment research landscape. A significant part of the research refers to the analysis of VCDB as the core data source of the research and implementation work. VCDB aims to collect and disseminate data breach information for all publicly disclosed data breaches. The data are coded into the VERIS format and are available for public use. To shed light on the status quo of corporate cybersecurity and unlock potential machine learning challenges an extensive data exploratory analysis is conducted on the dataset, mainly focusing on the healthcare domain, which is in the spotlight of this dissertation. Regarding the experimental phase of the dissertation, it focuses on the conceptualization of multiple asset-related cyber-risk estimation tasks, based on self-developed machine learning pipelines, that can be useful for various corporate stakeholders (such as researchers, data scientists, security analysts, IT staff) especially within critical infrastructures, such as healthcare organizations. A machine learning pipeline, based on MLflow, is built for automating machine learning experiments consisting of an ETL step, a training step and an evaluation step. Two indicative risk prediction use cases are analysed, as proof-of-concept for the MLOps experimentation framework, and its automation capabilities. One of them refers to the risk of loss of data availability and the other to the risk of a server being compromised during an incident. Several machine learning algorithms are trained and evaluated. In practice, the RiskML application allows end-users to deploy the implemented MLOps pipelines in production to "solve" the risk prediction tasks of their preference in a quick and automated manner and then serve the best models in production. The predictions produced by RiskML are fully configurable by the end-user and can be consumed through API by any programmatical risk assessment agent and be used for holistic and even real-time risk assessment of infrastructures. State-of-the-art technologies such as MLflow, Docker, and Swagger empower the deployment. As proof-of-concept, RiskML has also been deployed as part of a real-time cyber-risk assessment agent in the context of the SPHINX EU project, within a cybersecurity toolkit aimed at the healthcare sector. The implementation code of RiskML is publicly available on Github en
heal.advisorName Askounis, Dimitris en
heal.advisorName Ασκούνης, Δημήτρης el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Stamou, George en
heal.committeeMemberName Ψαρράς, Ιωάννης
heal.committeeMemberName Psarras, John en
heal.committeeMemberName Ασκούνης, Δημήτρης el
heal.committeeMemberName Askounis, Dimitris en
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 70 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα