dc.contributor.author |
Σταθόπουλος, Αναστάσιος
|
el |
dc.contributor.author |
Stathopoulos, Anastasios
|
en |
dc.date.accessioned |
2018-09-03T08:37:21Z |
|
dc.date.available |
2018-09-03T08:37:21Z |
|
dc.date.issued |
2018-09-03 |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/47480 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.15799 |
|
dc.rights |
Default License |
|
dc.subject |
Αυτόνομη οδήγηση |
el |
dc.subject |
Όραση υπολογιστών |
el |
dc.subject |
Βαθιά μάθηση |
el |
dc.subject |
Σημασιολογική κατάτμιση |
el |
dc.subject |
Αναγνώριση αντικειμένων |
en |
dc.subject |
Autonomous driving |
en |
dc.subject |
Computer vision |
en |
dc.subject |
Deep learning |
en |
dc.subject |
Semantic segmentation |
en |
dc.subject |
Object detection |
en |
dc.title |
Real-time semantic reasoning for autonomous driving |
en |
heal.type |
bachelorThesis |
|
heal.classification |
Όραση υπολογιστών |
el |
heal.classification |
Μηχανική μάθηση |
el |
heal.language |
el |
|
heal.language |
en |
|
heal.access |
campus |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2018-07-10 |
|
heal.abstract |
Σκοπός της παρούσας διπλωματικής εργασίας είναι η προσέγγιση δύο πολύ σημαντικών προβλημάτων που οποιαδήποτε σύστημα αυτόνομης οδήγησης χρειάζεται να επιλύσει. Τα προβλήματα αυτά
είναι η κατάτμηση του δρόμου και ανίχνευση οχημάτων σε εικόνες που έχουν ληφθεί από κάμερες προσαρμοσμένες σε κάποιο όχημα και αντιστοιχούν σε μια ποικιλία από διαφορετικές καταστάσεις
οδήγησης. Τα δύο προβλήματα είναι αρκετά διαφορετικά μεταξύ τους και μπορούν να μοντελοποιηθούν σαν δύο κλασικά προβλήματα του ερευνητικού πεδίου της Όρασης Υπολογιστών. Το πρόβλημα της κατάτμησης του δρόμου αποτελεί το γνωστό πρόβλημα της σημασιολογικής κατάτμησης εικόνας, ενώ αυτό
της ανίχνευσης οχημάτων μπορεί να μοντελοποιηθεί ως ένα πρόβλημα ανίχνευσης αντικειμένων. Οι σύγχρονες μέθοδοι επίλυσης των προβλημάτων αυτών χρησιμοποιούν τεχνικές Βαθειάς Μηχανικής Μάθησης. Επομένως, ο στόχος της διπλωματικής αυτής είναι η κατασκευή ενός νευρωνικού δικτύου
για κάθε ένα από τα δύο αυτά προβλημάτα. Ενώ οι περισσότερες σύγχρονες προσεγγίσεις σχετικά με τη σημασιολογική κατάτμηση και την ανίχνευση αντικειμένων επικεντρώνονται στη βελτίωση της απόδοσης των μοντέλων που χρησιμοποιούνται, σε αυτή την εργασία εξηγούμε πως ο χρόνος εκτέλεσης είναι μια πολύ σημαντική παράμετρος για τη σχεδίαση εφαρμογών πραγματικού χρόνου όπως αυτές που χρησιμοποιούνται για την αυτόνομη οδήγηση. Συνεπώς, τα μοντέλα που θα υλοποιήσουμε θα πρέπει να κινούνται προς αυτή την κατεύθυνση. Πιο συγκεκριμένα, θέλουμε να σχεδιάσουμε μοντέλα τα οποία να είναι όσο το δυνατόν πιο απλά και να μπορούν να κάνουν προβλέψεις σε πραγματικό χρόνο διατηρώντας παράλληλα ικανοποιητική απόδοση. Επίσης, επιθυμούμε τα μοντέλα που θα σχεδιάσουμε να μπορούν να ενοποιηθούν σε μια κοινή αρχιτεκτονική που να μπορεί να επιλύει και τα δύο προβλήματα ταυτόχρονα. Προς αυτή την κατεύθυνση, και τα δύο νευρωνικά δίκτυα που χρησιμοποιούνται έχουν αρχιτεκτονική κωδικοποιητή-αποκωδικοποιητή. Ο κωδικοποιητής είναι κοινός και στα δύο νευρωνικά δίκτυα, ενώ ο αποκωδικοποιητής είναι ξεχωριστός. Τα μοντέλα που αναπτύχθηκαν είναι αρκετά απλά και μπορούν να εκπαιδευτούν end-to-end. |
el |
heal.abstract |
In the context of this diploma thesis we approach two problems associated with autonomous driving. Those problems are road segmentation and vehicle detection. Although one might think that those problems will be solved using the same approach, they are very diferent and can be modeled as distinct computer vision tasks. The problem of road segmentation can be viewed as an image semantic segmentation problem, while that of vehicle detection is a typical object detection problem. Current state-of-the-art approaches for solving both problems make use of neural networks and deep learning. Therefore, the goal of this thesis is to construct a deep learning model for tackling each one of the above problems. While most approaches to semantic segmentation and object detection have focused on improving performance, in this thesis we argue that computational times are very important in order to enable real time applications such as autonomous driving. Towards this goal, the models used should not be very complex, while at the same time performing very well on both tasks. In addition, we want to have a unifed architecture which is able to perform both tasks jointly. For those reasons, both networks are designed in an encoder-decoder architecture, in which the encoder (the frst 13 layers of the VGG-16 network) is the same for both tasks, while the decoder is task specifc. Our approach is inspired by the work of Marvin Teichmann et al. It is very simple, can be trained end-to-end and performs very well in the challenging KITTI dataset . |
en |
heal.advisorName |
Σταφυλοπάτης, Ανδρέας-Γεώργιος |
el |
heal.committeeMemberName |
Τσανάκας, Παναγιώτης |
el |
heal.committeeMemberName |
Στάμου, Γεώργιος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
104 σ. |
|
heal.fullTextAvailability |
true |
|