HEAL DSpace

Εφαρμογή της Μηχανικής Μάθησης στην Αντιμετώπιση Προβλημάτων της Διεργασίας Παραγωγής Αλουμινίου

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αντωνόπουλος, Ιωάννης el
dc.contributor.author Antonopoulos, Ioannis en
dc.contributor.author Αντωνόπουλος, Γιάννης
dc.date.accessioned 2020-12-30T08:19:58Z
dc.date.available 2020-12-30T08:19:58Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/52711
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.20409
dc.description Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακών Σπουδών (Δ.Π.Μ.Σ.) “Υπολογιστική Μηχανική” en
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Μηχανική Μάθηση el
dc.subject Παραγωγή Αλουμινίου el
dc.subject Δέντρο Αποφάσεων el
dc.subject Τυχαίο Δάσος el
dc.subject Επιστήμη Δεδομένων el
dc.subject Machine Learning en
dc.subject Aluminum Production en
dc.subject Decision Tree en
dc.subject Random Forest en
dc.subject Data Science en
dc.title Εφαρμογή της Μηχανικής Μάθησης στην Αντιμετώπιση Προβλημάτων της Διεργασίας Παραγωγής Αλουμινίου el
dc.title Application of Machine Learning to Tackling Problems in the Aluminum Production Process en
heal.type masterThesis
heal.classification Επιστήμη Δεδομένων el
heal.classification Μηχανική Μάθηση el
heal.classification Χημική Μηχανική el
heal.classification Υπολογιστική Μηχανική el
heal.classification Data Science en
heal.classification Machine Learning en
heal.classification Chemical Engineering en
heal.classification Computational Engineering en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2020-10-23
heal.abstract Στην παρούσα μελέτη επιδιώκεται η ανάπτυξη ενός συστήματος πρόβλεψης προβλημάτων που παρουσιάζονται κατά τη διεργασία παραγωγής αλουμινίου στο εργοστάσιο του Αλουμινίου της Ελλάδος, το οποίο ανήκει στον Τομέα Μεταλλουργίας του Ομίλου Μυτιληναίος. Αυτή η διεργασία είναι μια διεργασία ηλεκτρόλυσης, στην οποία αλουμίνιο παράγεται από αλουμίνα σε κατάλληλα ηλεκτρολυτικά κελιά, τα οποία καλούνται λεκάνες. Τα προβλήματα που ζητείται να προβλεφθούν είναι εξογκώματα στις ανόδους των ηλεκτρολυτικών αυτών κελιών, τα οποία καλούνται μανιτάρια και επηρεάζουν αρνητικά τη διεργασία της ηλεκτρόλυσης. Έως τώρα, ένα σύστημα το οποίο έχει αναπτυχθεί από τους μηχανικούς της Δραστηριότητας Ηλεκτρόλυσης του εργοστασίου προβλέπει την ύπαρξη μανιταριών στις λεκάνες, εξετάζοντας το αν οι τιμές συγκεκριμένων μετρούμενων μεγεθών που χαρακτηρίζουν τις λεκάνες υπερβαίνουν προκαθορισμένα όρια. Τα όρια αυτά έχουν οριστεί από τους μηχανικούς με βάση μη αυτόματη στατιστική ανάλυση επί ενός περιορισμένου όγκου δεδομένων. Η διαφορά της προσέγγισης που ακολουθείται στην παρούσα μελέτη έγκειται στην αποτελεσματικότερη αξιοποίηση της πληροφορίας που περιέχεται στα δεδομένα μέσω τεχνικών Μηχανικής Μάθησης. Μια τέτοια προσέγγιση επιτρέπει την καλύτερη αυτοματοποιημένη εξαγωγή γνώσης από δεδομένα, η οποία με τη σειρά της θα έχει ως αποτέλεσμα τη βελτίωση της αντιμετώπισης του εξεταζόμενου προβλήματος στην πράξη. Στη μελέτη επιλέγονται να εξεταστούν ηλεκτρικά μεγέθη τα οποία καταγράφονται αυτόματα από αισθητήρες, σε συνδυασμό με την πληροφορία περί παρουσίας μανιταριών, όπως αυτή προκύπτει από δειγματοληπτικούς ελέγχους. Πραγματοποιείται μια προεπεξεργασία των δεδομένων ώστε αυτά να έρθουν σε κατάλληλη μορφή, ενώ επιλέγεται τόσο η στρατηγική συνδυασμού των δεδομένων μεταξύ τους, αφού συνίστανται σε χρονοσειρές με διαφορετική συχνότητα δειγματοληψίας, όσο και η στρατηγική αποτύπωσης της πληροφορίας περί ιστορικής εξέλιξής τους. Επίσης αναπτύσσεται μια τακτική τροποποίησης των αποτελεσμάτων των δειγματοληπτικών ελέγχων για παρουσία μανιταριών πριν αυτά αναπτυχθούν, έτσι ώστε ο τρόπος με τον οποίο λαμβάνονται υπόψη να αντιστοιχεί περισσότερο στην πραγματική κατάσταση. Τα δεδομένα αντιμετωπίζονται με τη χρήση δύο διαφορετικών αλγορίθμων Μηχανικής Μάθησης, των Δέντρων Αποφάσεων (Decision Trees) και Τυχαίων Δασών (Random Forests). Για κάθε εκδοχή των δεδομένων και κάθε έναν από τους αλγόριθμούς εξετάζεται ένα ευρύ σύνολο από συνδυασμούς παραμέτρων. Tο αποτέλεσμα κάθε προσπάθειας αξιολογείται με ένα κατάλληλο δείκτη αξιολόγησης, συγκεκριμένα του εμβαδού κάτω από την Χαρακτηριστική Καμπύλη Λειτουργίας Δέκτη (Receiver Operating Characteristic, ROC), το οποίο είναι γνωστό απλά ως AUC (εκ του Area Under the Curve). Όλοι οι υπολογισμοί της μελέτης, καθώς επίσης η προεπεξεργασία των δεδομένων αλλά και η ανάλυση των αποτελεσμάτων, πραγματοποιούνται με κώδικα που έχει συνταχθεί σε γλώσσα προγραμματισμού Python 3 και αξιοποιεί διάφορες βιβλιοθήκες, η πιο χρήσιμη εκ των οποίων είναι το scikit-learn. Από τα παραπάνω προκύπτει ο βέλτιστος συνδυασμός παραμέτρων για κάθε εκδοχή των δεδομένων, καθώς και μια γενικότερη εικόνα της εξάρτησης της επίδοσης των μοντέλων από τις παραμέτρους. Προκύπτει επίσης το καλύτερο μοντέλο, το οποίο είναι βασισμένο στα Τυχαία Δάση, που γενικά υπερέχουν των Δέντρων Αποφάσεων. Η επίδοση του μοντέλου αυτού όσον αφορά το AUC είναι 0.72, έναντι του 0.5 που αντιστοιχεί στην τυχαία πρόβλεψη. Αν και η επίδοση χαρακτηρίζεται ως μέτρια, αποτελεί σημαντική βελτίωση έναντι της υφιστάμενης κατάστασης και αποτελεί ένα σημαντικό πρώτο βήμα στη σωστή κατεύθυνση, καθώς το μοντέλο μπορεί να χρησιμοποιηθεί για την πιο αξιόπιστη πρόβλεψη της παρουσίας μανιταριών, με αποτέλεσμα και τα διαθέσιμα δεδομένα στην πορεία να βελτιωθούν. Επιπλέον, η μελέτη είχε ως παράπλευρο αποτέλεσμα να βρεθούν πολλά στοιχεία που αφορούν στην μέτρηση και την καταγραφή των δεδομένων τα οποία μπορούν να βελτιωθούν, έτσι ώστε καλύτερα αποτελέσματα να προκύψουν χωρίς τροποποιήσεις στην μεθοδολογία που έχει υιοθετηθεί. el
heal.abstract The aim of the present study is to develop a system that is able to predict problems that occur during the aluminum production process at the Aluminium of Greece plant that belongs to the Metallurgy sector of Mytilineos Group. This is an electrolytic process, in which aluminum is produced from aluminum oxide in appropriate electrolytic cells. The problem sought to be predicted is the evolution of spikes, called mushrooms, on the anodes of the cells, which have a detrimental effect on the electrolytic process. Until now, a system developed by the engineers of the plant's Electrolysis Division predicts the presence of mushrooms in the cells, by testing whether the values of certain measured variables that describe the condition of the cells exceed certain limits. These limits have been set by the engineers based on manual statistical analysis on a limited volume of data. The methodology followed in the present study differs in that the information contained in the data is exploited more efficiently by using Machine Learning techniques. Such an approach allows for a better and finally automated extraction of knowledge from data, which in turn will result in the amelioration of the way the problem under study is addressed. In the study, certain electrical measures which are automatically recorded by sensors, along with information on the presence of mushrooms, acquired by sample checks, are chosen for examination. The data is preprocessed so that it is in the proper format, while a data combination strategy is devised to account for the fact that the data come in the form of time series of different frequencies. Furthermore, a way to extract the information on the evolution of each measure is also devised. Last but not least, the results of the sample checks for mushrooms are modified prior to further use, so that the way in which they are taken into account better corresponds to the true condition of the system. The data are processed by two different Machine Learning algorithms, Decision Trees and Random Forests. For each version of the data and each one of the two algorithms, a wide range of parameters is investigated. The result of each attempt is evaluated using an appropriate evaluation metric, specifically the Area Under the Curve (AUC), which is, as the name implies, tha area under the Receiver Operating Characteristic (ROC) curve. Every computation in the study, as well as data preprocessing and result analysis are conducted with code written in the Python programming language, making use of various libraries, the most important of which is scikit-learn. After the described procedure, the best combination of parameters for each version of the data, as well as a general perspective of the effect of the parameters on model performance is acquired. The best model, based on Random Forests, is also found. In general, Random Forest-based models outperform the Decision Tree-based ones. The performance of the best model in terms of AUC is 0.72 and can be compared to 0.5, corresponding to random predictions. Even though this performance is considered mediocre, it presents a drastic improvement compared with the present condition. Furthermore, it is an important first step in the right direction, as this model can be employed to predict the presence of mushrooms more accurately compared to the present practice, leading to an improvement in the quality of available data. Finally, the study also helped identify many aspects of data acquisition and storage that may be improved, so that the better results are achieved without changes in the adopted methodology. en
heal.advisorName Καβουσανάκης, Μιχάλης el
heal.advisorName Kavousanakis, Michalis en
heal.committeeMemberName Καβουσανάκης, Μιχάλης el
heal.committeeMemberName Μπουντουβής, Ανδρέας el
heal.committeeMemberName Σαρίμβεης, Χαράλαμπος
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Χημικών Μηχανικών el
heal.academicPublisherID ntua
heal.numberOfPages 91 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα