dc.contributor.author |
Μπέτζελος, Χρήστος
|
|
dc.contributor.author |
Betzelos, Christos
|
en |
dc.date.accessioned |
2022-07-20T09:17:52Z |
|
dc.date.available |
2022-07-20T09:17:52Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/55441 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.23139 |
|
dc.rights |
Default License |
|
dc.subject |
Ταξινόμηση |
el |
dc.subject |
Classification |
en |
dc.subject |
Προσομοίωση |
el |
dc.subject |
Simulation |
en |
dc.subject |
Μηχανική μάθηση |
el |
dc.subject |
Machine learning |
en |
dc.subject |
Μοντέλα μείξης |
el |
dc.subject |
Mixture models |
en |
dc.subject |
Παρακολούθηση δικτυακών ροών |
el |
dc.subject |
NetFlow monitoring |
en |
dc.title |
Ταξινόμηση και προσομοίωση νοσοκομειακών δικτυακών δεδομένων ροής με χρήση μοντέλων μηχανικής μάθησης |
el |
dc.title |
NetFlow-based classification and simulation of healthcare data using machine learning models |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Μηχανική μάθηση |
el |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2022-03-08 |
|
heal.abstract |
Αντικείμενο της διπλωματικής εργασίας είναι η ανάλυση και η προσομοίωση δικτυακών
δεδομένων ροής νοσοκομειακής και υγειονομική περίθαλψης, με χρήση παραγωγικών μοντέλων
και μοντέλων μηχανικής μάθησης. Ιδιαίτερα χρήσιμη στην ανάλυση της συμπεριφοράς ενός
παρακολουθούμενου δικτύου αποτελεί η δημιουργία προφίλ συμπεριφοράς χρηστών. Δηλαδή,
η δημιουργία ομάδων χρηστών με παρόμοιες δικτυακές και επικονωνιακές συμπεριφορές που
αντιπροσωπεύουν ένα συγκεκριμένο πρότυπο κίνησης.
Το σύνολο δεδομένων ροής που χρησιμοποιείται στην παρούσα εργασία συλλέχθηκε α πό πραγματική νοσοκομειακή υποδομή, ανωνυμοποιήθηκε και αναλύθηκε διερευνητικά μέσω
διαφόρων τεχνικών εξόρυξης δεδομένων, οπτικοποιήσεων και στατιστικών στοιχείων. Εν συ νεχεία, η διπλωματική επικεντρώθηκε στη δημιουργία προφίλ συμπεριφοράς χρηστών και στη
παραγωγή τεχνητών ρεαλιστικών δεδομένων με βάση αυτά τα προφίλ. Η προσομοίωση δεδο μένων ροής για κάθε ένα ξεχωριστό προφίλ πραγματοποιήθηκε με χρήση μη επιβλεπόμενης
μηχανικής μάθησης και συγκεκριμένα μοντέλων μείξης. Προκειμένου όμως να γίνει εφικτή
η παραπάνω προσέγγιση, απαραίτητη ήταν η κατηγοριοποίηση των νοσοκομειακών χρηστών
με βάση την εργασιακή τους θέση (ιατροί, νοσοκόμοι, γραμματεία κτλ). Η ταξινόμηση αυτή
πραγματοποιήθηκε τόσο με εμπειρικούς κανόνες, όσο και με μοντέλα μηχανικής μάθησης και
νευρωνικά δίκτυα.
Επομένως, η συνεισφορά της εργασίας είναι τόσο στον τομέα της ανάλυσης των δικτυακών
ροών και των χαρακτηριστικών τους, όσο και στον τομέα της παραγωγής τεχνητών δεδομένων
ροής μέσω των προφίλ συμπεριφοράς. Οι ρεαλιστικές αυτές κατανομές χαρακτηριστικών ρο ής, οι οποίες δεν υπάρχουν ευρέως διαθέσιμες, θα μπορούσαν να φανούν ιδιαίτερα χρήσιμες
ακόμα και στην αξιολόγηση - αξιοπιστία των μοντέλων ανίχνευσης ανωμαλιών - επιθέσων που
κυριαρχούν τα τελευταία χρόνια την επιστημονική κοινότητα. |
el |
heal.abstract |
The purpose of this diploma thesis is the analysis and simulation of network flows of hospital and health care data, using generative and machine learning models. Profiling users’ behavior is particularly useful in analyzing the behavior of a monitored network. That is, creating user groups with similar network and communication behaviors that represent a specific traffic pattern. The dataset of NetFlows used in the current work was collected from real hospital infrastructure, anonymized and analyzed exploratory through various data mining techniques, visualizations and statistics. The thesis then focuses on creating user behavior profiles and generating artificial realistic data based on those profiles. The flow-based data simulation for each individual profile was performed using unsupervised machine learning and in particular mixture models. However, in order for the above approach to be achievable, it was necessary to categorize the hospital users based on their job position (doctors, nurses, secretariat, etc.). This classification was performed both with empirical rules and with machine learning models - artificial neural networks. Therefore, the contribution of the diploma thesis is both in the field of network flow analysis and its characteristics, as well as in the field of simulation of realistic artificial flow-based data through behavioral profiles. These realistic distributions of flow characteristics, which are not widely available, could be particularly useful even in evaluating the reliability of anomaly detection models, that have dominated the scientific community in recent years. |
en |
heal.advisorName |
Ασκούνης, Δημήτριος |
el |
heal.committeeMemberName |
Ασκούνης, Δημήτριος |
el |
heal.committeeMemberName |
Ψαρράς, Ιωάννης |
el |
heal.committeeMemberName |
Δούκας, Χρυσόστομος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Ηλεκτρικών Βιομηχανικών Διατάξεων και Συστημάτων Αποφάσεων |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
159 σ. |
el |
heal.fullTextAvailability |
false |
|