HEAL DSpace

Real-time semantic reasoning for autonomous driving

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Σταθόπουλος, Αναστάσιος el
dc.contributor.author Stathopoulos, Anastasios en
dc.date.accessioned 2018-09-03T08:37:21Z
dc.date.available 2018-09-03T08:37:21Z
dc.date.issued 2018-09-03
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/47480
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.15799
dc.rights Default License
dc.subject Αυτόνομη οδήγηση el
dc.subject Όραση υπολογιστών el
dc.subject Βαθιά μάθηση el
dc.subject Σημασιολογική κατάτμιση el
dc.subject Αναγνώριση αντικειμένων en
dc.subject Autonomous driving en
dc.subject Computer vision en
dc.subject Deep learning en
dc.subject Semantic segmentation en
dc.subject Object detection en
dc.title Real-time semantic reasoning for autonomous driving en
heal.type bachelorThesis
heal.classification Όραση υπολογιστών el
heal.classification Μηχανική μάθηση el
heal.language el
heal.language en
heal.access campus
heal.recordProvider ntua el
heal.publicationDate 2018-07-10
heal.abstract Σκοπός της παρούσας διπλωματικής εργασίας είναι η προσέγγιση δύο πολύ σημαντικών προβλημάτων που οποιαδήποτε σύστημα αυτόνομης οδήγησης χρειάζεται να επιλύσει. Τα προβλήματα αυτά είναι η κατάτμηση του δρόμου και ανίχνευση οχημάτων σε εικόνες που έχουν ληφθεί από κάμερες προσαρμοσμένες σε κάποιο όχημα και αντιστοιχούν σε μια ποικιλία από διαφορετικές καταστάσεις οδήγησης. Τα δύο προβλήματα είναι αρκετά διαφορετικά μεταξύ τους και μπορούν να μοντελοποιηθούν σαν δύο κλασικά προβλήματα του ερευνητικού πεδίου της Όρασης Υπολογιστών. Το πρόβλημα της κατάτμησης του δρόμου αποτελεί το γνωστό πρόβλημα της σημασιολογικής κατάτμησης εικόνας, ενώ αυτό της ανίχνευσης οχημάτων μπορεί να μοντελοποιηθεί ως ένα πρόβλημα ανίχνευσης αντικειμένων. Οι σύγχρονες μέθοδοι επίλυσης των προβλημάτων αυτών χρησιμοποιούν τεχνικές Βαθειάς Μηχανικής Μάθησης. Επομένως, ο στόχος της διπλωματικής αυτής είναι η κατασκευή ενός νευρωνικού δικτύου για κάθε ένα από τα δύο αυτά προβλημάτα. Ενώ οι περισσότερες σύγχρονες προσεγγίσεις σχετικά με τη σημασιολογική κατάτμηση και την ανίχνευση αντικειμένων επικεντρώνονται στη βελτίωση της απόδοσης των μοντέλων που χρησιμοποιούνται, σε αυτή την εργασία εξηγούμε πως ο χρόνος εκτέλεσης είναι μια πολύ σημαντική παράμετρος για τη σχεδίαση εφαρμογών πραγματικού χρόνου όπως αυτές που χρησιμοποιούνται για την αυτόνομη οδήγηση. Συνεπώς, τα μοντέλα που θα υλοποιήσουμε θα πρέπει να κινούνται προς αυτή την κατεύθυνση. Πιο συγκεκριμένα, θέλουμε να σχεδιάσουμε μοντέλα τα οποία να είναι όσο το δυνατόν πιο απλά και να μπορούν να κάνουν προβλέψεις σε πραγματικό χρόνο διατηρώντας παράλληλα ικανοποιητική απόδοση. Επίσης, επιθυμούμε τα μοντέλα που θα σχεδιάσουμε να μπορούν να ενοποιηθούν σε μια κοινή αρχιτεκτονική που να μπορεί να επιλύει και τα δύο προβλήματα ταυτόχρονα. Προς αυτή την κατεύθυνση, και τα δύο νευρωνικά δίκτυα που χρησιμοποιούνται έχουν αρχιτεκτονική κωδικοποιητή-αποκωδικοποιητή. Ο κωδικοποιητής είναι κοινός και στα δύο νευρωνικά δίκτυα, ενώ ο αποκωδικοποιητής είναι ξεχωριστός. Τα μοντέλα που αναπτύχθηκαν είναι αρκετά απλά και μπορούν να εκπαιδευτούν end-to-end. el
heal.abstract In the context of this diploma thesis we approach two problems associated with autonomous driving. Those problems are road segmentation and vehicle detection. Although one might think that those problems will be solved using the same approach, they are very diferent and can be modeled as distinct computer vision tasks. The problem of road segmentation can be viewed as an image semantic segmentation problem, while that of vehicle detection is a typical object detection problem. Current state-of-the-art approaches for solving both problems make use of neural networks and deep learning. Therefore, the goal of this thesis is to construct a deep learning model for tackling each one of the above problems. While most approaches to semantic segmentation and object detection have focused on improving performance, in this thesis we argue that computational times are very important in order to enable real time applications such as autonomous driving. Towards this goal, the models used should not be very complex, while at the same time performing very well on both tasks. In addition, we want to have a unifed architecture which is able to perform both tasks jointly. For those reasons, both networks are designed in an encoder-decoder architecture, in which the encoder (the frst 13 layers of the VGG-16 network) is the same for both tasks, while the decoder is task specifc. Our approach is inspired by the work of Marvin Teichmann et al. It is very simple, can be trained end-to-end and performs very well in the challenging KITTI dataset . en
heal.advisorName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Τσανάκας, Παναγιώτης el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 104 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής