dc.contributor.author | Βάσιος, Δημήτριος![]() |
el |
dc.contributor.author | Vasios, Dimitrios![]() |
en |
dc.date.accessioned | 2025-03-21T08:46:37Z | |
dc.date.available | 2025-03-21T08:46:37Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/61392 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.29088 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Αυτοματοποιημένη Μηχανική Μάθηση | el |
dc.subject | Αυτοματοποιημένη Προεπεξεργασία Δεδομένων | el |
dc.subject | Βελτιστοποίηση Αναζήτησης | el |
dc.subject | Γενικευμένη Διάταξη Προεπεξεργασίας Δεδομένων | el |
dc.subject | Automated Data Preprocessing | en |
dc.subject | Bayesian Optimization | en |
dc.subject | Generalized Data Preprocessing Framework | en |
dc.subject | Automated Machine Learning | en |
dc.title | Αυτοματοποιημένη Αναλυτική Προεπεξεργασίας Δεδομένων | el |
dc.title | Automated Data Preprocessing Analytics | en |
heal.type | bachelorThesis | |
heal.classification | Automated Machine Learning | en |
heal.classification | Automated Machine Learning | en |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2024-10-15 | |
heal.abstract | Η παρούσα διπλωματική εστιάζει στο κρίσιμο πρόβλημα της αυτοματοποίησης της επεξεργασίας δεδομένων, σε προβλήματα που αφορούν την επιβλεπόμενη μηχανική μάθηση. Στόχος της έρευνας αποτελεί η εις βάθος μελέτη και εξερεύνηση των προκλήσεων του πεδίου της αυτοματοποίησης των διαδικασιών προεπεξεργασίας δεδομένων και η ανάδειξη μεθόδων και τεχνικών που θα συνεισφέρουν στο έργο των ερευνητών δεδομένων. Για την επίτευξη αυτού του στόχου, προτείνεται μία γενικευμένη διάταξη προεπεξεργασίας δεδομένων, η οποία περιλαμβάνει μία προκαθορισμένη σειρά μετασχηματισμών προεπεξεργασίας. Παράλληλα, αναπτύσσεται ένα εργαλείο με την ονομασία Auto Analysis, το οποίο παρέχει τη δυνατότητα στους χρήστες να αξιοποιούν επαληθευμένες λειτουργίες μετασχηματισμού, με σκοπό να εκτελούν τις αναλύσεις τους ταχύτερα και αποδοτικότερα για τα σύνολα δεδομένων που διαθέτουν. Η μεθοδολογία περιλαμβάνει τη χρήση τεχνικών βελτιστοποίησης, όπως η μπεϋζιανή αναζήτηση, για την αναζήτηση των βέλτιστων λειτουργιών μετασχηματισμού. Πραγματοποιήθηκαν πειράματα με δέκα διαφορετικά σύνολα δεδομένων, τα οποία κάλυψαν μία ευρεία γκάμα περιπτώσεων και προκλήσεων, αποδεικνύοντας την αξιοπιστία και αποδοτικότητα της αρχιτεκτονικής. Τα αποτελέσματα της έρευνας υποδεικνύουν ότι η εφαρμογή της γενικευμένης διάταξης προεπεξεργασίας σε συνδυασμό με τις προτεινόμενες λειτουργίες μετασχηματισμού, οδηγεί σε βελτίωση της απόδοσης των μοντέλων μηχανικής μάθησης και βοηθά το χρήστη να ενσωματώσει τις βέλτιστες λειτουργίες μετασχηματισμού για τη προεπεξεργασία των δεδομένων του. | el |
heal.abstract | This thesis focuses on the critical issue of automating data preprocessing, with particular emphasis on supervised machine learning problems. The aim of the research is to conduct an in-depth study and exploration of the challenges faced in the field of automating preprocessing procedures. Furthermore, it seeks to highlight innovative methods and techniques that will significantly contribute to the work of data researchers. To achieve this goal, a generalized data preprocessing framework is proposed, which includes a predefined sequence of transformations. Additionally, a tool named Auto Analysis is developed, providing users with the capability to utilize verified transformation functions, enabling them to execute their analyses more quickly and efficiently for the available datasets. The research methodology includes the use of optimization techniques, such as Bayesian optimization, to identify the best transformation functions. Experiments were conducted using ten different datasets, covering a wide range of characteristics and challenges, thus demonstrating the reliability and efficiency of the model. The results of the research indicate that the application of the generalized preprocessing framework, in conjunction with the proposed transformation functions, leads to significant improvements in the performance of machine learning models. This approach not only facilitates the analysis process but also assists the user in integrating the best transformation functions into their data preprocessing, thereby enhancing the quality and reliability of the final outcomes. | en |
heal.advisorName | Μέντζας, Γρηγόριος | el |
heal.committeeMemberName | Μέντζας, Γρηγόριος | el |
heal.committeeMemberName | Ασκούνης, Δημήτριος | el |
heal.committeeMemberName | Ψαρράς, Ιωάννης | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Ηλεκτρικών Βιομηχανικών Διατάξεων και Συστημάτων Αποφάσεων | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 107 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: