heal.abstract |
Σκοπός της παρούσας διπλωματικής εργασίας είναι η ανάλυση δεδομένων έξυπνων μετρητών για ανίχνευση απάτης. Τα δεδομένα, τα οποία είναι διαθέσιμα, αφορούν μετρήσεις για πάνω από 5000 καταναλωτές για ενάμιση χρόνο. Ο μεγάλος αριθμός και η ποικιλία καταναλωτών, οι μεγάλων περιόδων μετρήσεις και η διαθεσιμότητά τους δημόσια καθιστά αυτά τα δεδομένα μία εξαιρετική πηγή για ανάλυση δεδομένων έξυπνων μετρητών.
Γίνεται μια εισαγωγή στους έξυπνους μετρητές και τα πλεονεκτήματά τους έναντι των συμβατικών, αναλογικών μετρητών, καθώς επίσης και της σημασίας του έξυπνου δικτύου και της υποδομής προηγμένων μετρήσεων (Advanced Metering Infrastructure,AMI). Στα συστήματα μεταφοράς και διανομής ηλεκτρικής ενέργειας κατέχει σημαντικό ρόλο η παρουσία των τεχνικών και των μη τεχνικών απωλειών. Οι τεχνικές απώλειες αναφέρονται στις φυσικές απώλειες, όπως στις απώλειες των αντιστάσεων γραμμών μεταφοράς και μετασχηματιστών διανομής. Οι μη τεχνικές απώλειες από την άλλη, όταν παρουσιάζονται, προέρχονται συνηθέστερα από ενέργειες δόλιων επεμβάσεων στα συστήματα. Για αυτό το λόγο, καθίσταται επιτακτική ανάγκη εύρεσης αποδοτικών λύσεων για την ανίχνευση τους. Οι εταιρείες παροχής ηλεκτρισμού παγκοσμίως χάνουν τεράστια ποσά χρημάτων λόγω κλοπών στην ενέργεια. Το γεγονός αυτό, έχει αντίκτυπο τόσο στην εκάστοτε εταιρεία όσο και στην ποιότητα της ενέργειας που διοχετεύεται στους καταναλωτές.
Παρουσιάζεται βιβλιογραφική έρευνα για τις τεχνικές εντοπισμού απάτης. Οι τεχνικές αυτές, βασίζονται στην ταξινόμηση, στην εκτίμηση κατάστασης και τελευταία, στην θεωρία παιγνίων. Στην παρούσα διπλωματική εργασία χρησιμοποιείται η τεχνική βάσει ταξινόμησης και συγκεκριμένα των Μηχανών Διανυσμάτων Υποστήριξης (Support Vector Machines, SVM). Σε αυτήν την τεχνική, εκπαιδεύεται το μοντέλο ταξινόμησης σε γνωστά δεδομένα και δοκιμάζεται σε νέα δεδομένα, αφού γίνει πρώτα βελτιστοποίηση των παραμέτρων του. Τα δεδομένα στην είσοδο του μοντέλου είναι στη μορφή ετήσιων πινάκων για κάθε καταναλωτή. Σκοπός του ταξινομητή είναι να διαχωρίσει τα ημερήσια διανύσματα των καταναλωτών με παρουσία κάποιας απάτης και εκείνων χωρίς απάτη. Λόγω του ότι τα αρχικά δεδομένα είναι άρτια, χωρίς κάποια παραβίαση, γίνεται προσομοίωση απάτης, δοκιμάζοντας και αναλύοντας κάθε φορά τον βαθμό αλλοίωσης των δεδομένων. Στην συνέχεια εξάγονται τα αποτελέσματα της ταξινόμησης για τα συμπεράσματα σχετικά με την απόδοσή της. Για την υλοποίηση του αλγόριθμου χρησιμοποιήθηκε το προγραμματιστικό περιβάλλον MATLAB |
el |