Πάρκινγκ αυτόνομου οχήματος  με χρήση αλγορίθμων βαθιάς ενισχυτικής μάθησης

Κόρδα, Ζωή; Korda, Zoi

dc.contributor.author	Κόρδα, Ζωή	el
dc.contributor.author	Korda, Zoi	en
dc.date.accessioned	2022-09-27T10:35:14Z
dc.date.available	2022-09-27T10:35:14Z
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/55773
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.23471
dc.rights	Default License
dc.subject	Ενισχυτική Μάθηση	el
dc.subject	Αυτόνομη Πλοήγηση	el
dc.subject	Νευρωνικά Δίκτυα	el
dc.subject	Exploration- Exploitation dilemma	en
dc.subject	Parking	en
dc.subject	Βαθιά Ενισχυτική Μάθηση	el
dc.subject	Τεχνητή Νοημοσύνη	el
dc.subject	DQN	en
dc.subject	HER	en
dc.subject	Actor-Critic	en
dc.title	Πάρκινγκ αυτόνομου οχήματος με χρήση αλγορίθμων βαθιάς ενισχυτικής μάθησης	el
heal.type	bachelorThesis
heal.classification	Machine learning	en
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2022-02-14
heal.abstract	Ένα ρομποτικό όχημα που πλοηγείται αυτόνομα αποτελεί έναν μακροχρόνιο στόχο τεχνητής νοημοσύνης. Γενικότερα, η οδήγηση ενός οχήματος είναι μια εργασία που απαιτεί υψηλό επίπεδο δεξιοτήτων, προσοχής και εμπειρίας από έναν άνθρωπο οδηγό. Αν και οι υπολογιστές έχουν αναπτύξει οξύτερες ικανότητες εστίασης από αυτές των ανθρώπων, η πλήρως αυτόνομη οδήγηση απαιτεί ένα επίπεδο πληροφοριών που ξεπερνούν αυτό που έχει επιτευχθεί μέχρι στιγμής από πράκτορες τεχνητής νοημοσύνης. Εντούτοις, ο τομέας της ενισχυτικής μάθησης (RL) συνιστά ένα ισχυρό μαθησιακό εργαλείο, ικανό πλέον να μαθαίνει πολύπλοκες πολιτικές σε περιβάλλοντα υψηλών διαστάσεων. Στην παρούσα διπλωματική εργασία, μελετάται η λειτουργία πάρκινγκ ενός αυτόνομου οχήματος στο περιβάλλον προσομοίωσης highway-env με τη χρήση αλγορίθμων βαθιάς ενισχυτικής μάθησης. Για τον σκοπό αυτό, σχεδιάστηκαν τέσσερις πράκτορες: ένας βελτιστοποιητής τροχιάς βασισμένος σε μοντέλο (model-based CEM planner) και τρεις πράκτορες ενισχυτικής μάθησης χωρίς μοντέλο (DQN, SAC, SAC with HER). Ειδικότερα, μελετήθηκε η συμπεριφορά καθενός από τους παραπάνω πράκτορες στο περιβάλλον, όπως και τα αποτελέσματα των προσομοιώσεων με βάση τις επιβραβεύσεις των επιμέρους πρακτόρων κατά την προσέγγιση κάποιας τυχαίας θέσης-στόχου, χωρίς την ύπαρξη άλλων πρακτόρων ή εμποδίων.	el
heal.advisorName	Σταφυλοπάτης, Ανδρέας-Γεώργιος	el
heal.committeeMemberName	Στάμου, Γεώργιος	el
heal.committeeMemberName	Κόλλιας, Στέφανος	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών	el
heal.academicPublisherID	ntua
heal.numberOfPages	85 σ.	el
heal.fullTextAvailability	false