HEAL DSpace

Σύγκριση Μεθόδων Deep Learning και Reinforcement Learning για την επίλυση του προβλήματος του Περιοδεύοντος Πωλητή

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Μπούγας, Γεώργιος
dc.contributor.author Bougas, Georgios
dc.date.accessioned 2022-05-19T08:58:04Z
dc.date.available 2022-05-19T08:58:04Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/55169
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.22867
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Μηχανική Μάθηση el
dc.subject Ενισχυμένη Μάθηση el
dc.subject Βαθιά Μάθηση el
dc.subject Συνδυαστική Βελτιστοποίηση el
dc.subject Πρόβλημα του Περιοδεύοντος Πωλητή el
dc.subject Machine Learning en
dc.subject Reinforcement Learning en
dc.subject Deep Learning en
dc.subject Combinatorial Optimization en
dc.subject Traveling Salesman problem en
dc.title Σύγκριση Μεθόδων Deep Learning και Reinforcement Learning για την επίλυση του προβλήματος του Περιοδεύοντος Πωλητή el
dc.title Method Comparison for Solving the Traveling Salesman Problem using Deep Learning and Reinforcement Learning en
dc.contributor.department Γεωπληροφορική el
heal.type masterThesis
heal.classification Μηχανική Μάθηση el
heal.classification Machine Learning en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-02-18
heal.abstract Στην καθημερινότητα μας καλούμαστε να επιλέξουμε τις συντομότερες διαδρομές για ποικίλες δραστηριότητες που ερχόμαστε αντιμέτωποι. Είναι στη φύση μας να θέλουμε να ολοκληρώσουμε οποιαδήποτε διαδικασία όσο το δυνατόν γρηγορότερα και με το λιγότερο κουραστικό τρόπο. Όλα αυτά που περιγράψαμε συναντώνται στο πρόβλημα του περιοδεύοντος πωλητή (TSP) το οποίο αποτελεί το πιο κοινό πρόβλημα συνδυαστικής βελτιστοποίησης που καλούμαστε διερευνήσουμε. Η παρούσα μεταπτυχιακή εργασία έχει ως σκοπό να ερευνήσει τις πρόσφατες προσπάθειες, τόσο από τις κοινότητες μηχανικής μάθησης όσο και από τις κοινότητες επιχειρησιακής έρευνας, για την εκμετάλλευση μεθόδων μηχανικής μάθησης στην επίλυση προβλημάτων συνδυαστικής βελτιστοποίησης. Η συνδυαστική βελτιστοποίηση (CO) είναι το εργαλείο πολλών σημαντικών εφαρμογών στην επιχειρησιακή έρευνα, τη μηχανική και άλλους τομείς και, ως εκ τούτου, έχει προσελκύσει τεράστια προσοχή από την ερευνητική κοινότητα πρόσφατα. Δεδομένης της δύσκαμπτης φύσης αυτών των προβλημάτων, οι αλγόριθμοι τελευταίας τεχνολογίας βασίζονται σε χειροποίητες ευρετικές για τη λήψη αποφάσεων που κατά τα άλλα είναι πολύ δαπανηρές για να υπολογιστούν ή δεν καθορίζονται ορθά από μαθηματική άποψη. Έτσι, η μηχανική μάθηση φαίνεται σαν ένας φυσικός υποψήφιος για τη λήψη τέτοιων αποφάσεων με έναν πιο στιβαρό και βελτιστοποιημένο τρόπο. Γενικά, θεωρούμε αρκετά σημαντική την περαιτέρω προώθηση της ενσωμάτωσης της μηχανικής μάθησης και της συνδυαστικής βελτιστοποίησης και θα περιγράψουμε λεπτομερώς μια μεθοδολογία για να στηρίξουμε αυτή τη θέση. Όπως αναφέρθηκε παραπάνω, ορισμένες αποτελεσματικές προσεγγίσεις σε κοινά προβλήματα περιλαμβάνουν τη χρήση χειροποίητων ευρετικών για τη διαδοχική κατασκευή μιας λύσης. Ως εκ τούτου, είναι ενδιαφέρον να δούμε πώς ένα πρόβλημα CO και πιο συγκεκριμένα το πρόβλημα TSP μπορεί να αναδιατυπωθεί ως μια διαδοχική διαδικασία λήψης αποφάσεων και εάν αυτές οι ευρετικές μπορούν να μαθευτούν στο παρασκήνιο από έναν πράκτορα ενισχυτικής μάθησης (RL). Εν κατακλείδι, η παρούσα εργασία θα διερευνήσει και τη συνέργεια μεταξύ των πλαισίων CO και RL, η οποία μπορεί να γίνει μια πολλά υποσχόμενη κατεύθυνση για την επίλυση συνδυαστικών προβλημάτων. el
heal.abstract We are called to choose the shortest routes for various activities in our daily lives. It is in our nature to want to complete any process as quickly as possible and in the least tedious way. Everything we have described is encountered in the traveling salesman (TSP) problem, the most common combinatorial optimization problem. The present dissertation aims to investigate recent efforts, both by the machine learning communities and by the operational research communities, to exploit machine learning methods in solving combinatorial optimization problems. Combinatorial optimization (CO) is the tool of many important applications in operational research, engineering, and other fields and, therefore, has attracted a lot of attention from the research community recently. Given the rigid nature of these problems, state-of-the-art algorithms rely on handcrafted decision-making heuristics that are otherwise too expensive to calculate or determine mathematically. Thus, machine learning seems like a natural candidate for making such decisions in a more robust and optimized way. In general, we consider it quite important to further promote the integration of machine learning and combinatorial optimization and we will describe in detail a methodology to support this position. As mentioned above, some effective approaches to common problems include the use of handcrafted heuristics to sequentially construct a solution. Therefore, it is interesting to see how a CO problem, especially the TSP problem, can be restructured as a sequential decision-making process and whether these heuristics can be learned in the background by an auxiliary learning agent (RL). In conclusion, our work will also explore the synergy between the CO and RL frameworks, which can become a very promising direction for solving combinatorial optimization problems. en
heal.advisorName Βεσκούκης, Βασίλειος
heal.committeeMemberName Δουλάμης, Αναστάσιος
heal.committeeMemberName Δουλάμης, Νικόλαος
heal.committeeMemberName Βεσκούκης, Βασίλειος
heal.academicPublisher Σχολή Αγρονόμων και Τοπογράφων Μηχανικών el
heal.academicPublisherID ntua
heal.numberOfPages 83
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα