HEAL DSpace

Εντοπισμός αυτοκινήτων σε τρισδιάστατα νέφη σημείων μέσω συνελικτικών νευρωνικών δικτύων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κώτσης, Ευστάθιος el
dc.contributor.author Kotsis, Efstathios en
dc.date.accessioned 2022-12-14T08:15:22Z
dc.date.available 2022-12-14T08:15:22Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/56443
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.24141
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Εντοπισμός Τρισδιάστατων Αντικειμένων el
dc.subject Συνελικτικά Νευρωνικά Δίκτυα el
dc.subject Μηχανική Μάθηση el
dc.subject Όραση Υπολογιστών el
dc.subject Αυτόνομη οδήγηση el
dc.subject 3D Object Detection en
dc.subject Convolutional Neural Networks en
dc.subject Machine Learning en
dc.subject Computer Vision en
dc.subject Autonomous Driving en
dc.title Εντοπισμός αυτοκινήτων σε τρισδιάστατα νέφη σημείων μέσω συνελικτικών νευρωνικών δικτύων el
dc.title Detection of cars in 3D point clouds using convolutional neural networks en
heal.type bachelorThesis
heal.classification Πληροφορική και Υπολογιστές el
heal.classification Όραση Υπολογιστών el
heal.classification Computer Science en
heal.classification Computer Vision en
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2022-08-31
heal.abstract Ο εντοπισμός αντικειμένων αποτελεί έναν από τους πιο δημοφιλείς τομείς της Όρασης Υπολογιστών. Ο τομέας αποσκοπεί στην κατασκευή μοντέλων, ικανά να διακρίνουν την κλάση ενδιαφέροντος από όλα τα υπόλοιπα αντικείμενα που εμφανίζονται. Ενώ ο εντοπισμός αντικειμένων σε δύο διαστάσεις έχει σημειώσει μεγάλες επιτυχίες, ο απευθείας εντοπισμός τρισδιάστατων αντικειμένων αποτελεί πολύ μεγαλύτερη πρόκληση. Ειδικότερα ο εντοπισμός τρισδιάστατων αντικειμένων σε Νέφη Σημείων αποκτά ιδιαίτερο ενδιαφέρον λόγω των εφαρμογών του σε οικιακά ρομπότ, στην εικονική πραγματικότητα και στα συστήματα αυτόνομης οδήγησης. Όσον αφορά τον τελευταίο τομέα, ο εντοπισμός αυτοκινήτων σε Νέφη Σημείων αποτελεί επιτακτική ανάγκη για την πρόοδο της αυτόνομης οδήγησης και την καθιέρωση της ως μία ασφαλή βιώσιμη εναλλακτική πρόταση στην οδήγηση. Για τον εντοπισμό των σημαντικών χαρακτηριστικών που υπάρχουν στα Νέφη Σημείων, ένα μεγάλο μέρος της βιβλιογραφίας στηρίζεται στην χρήση χειροκίνητων αναπαραστάσεων τους. Στην εργασία αυτή γίνεται χρήση μίας ολοκληρωμένης αρχιτεκτονικής εντοπισμού αντικειμένων σε τρεις διαστάσεις καθώς και δοκιμές τροποποίησης της, με στόχο τον εντοπισμό αυτοκινήτων, αντλούμενα από τρισδιάστατα Νέφη Σημείων, τα οποία έχουν συλλεχθεί από συσκευές λέιζερ lidar (Light Detection And Ranging) οι οποίες προσφέρουν την δυνατότητα υπολογισμού του βάθους των αντικειμένων, κρίσιμο στοιχείο που στερούνται οι τεχνικές χειρισμού εικόνων. Η συγκεκριμένη αρχιτεκτονική κάνει χρήση τριών υποσυστημάτων. Πιο συγκεκριμένα, ένα Σύστημα Εκμάθησης Χαρακτηριστικών, το οποίο αφού χωρίσει το Νέφος Σημείων σε τρισδιάστατα Βόξελ, μεταμορφώνει το σύνολο των σημείων κάθε Βόξελ σε μία αραιή αναπαράσταση χαρακτηριστικών, μέσω μίας Αλυσίδας Επιπέδων Κωδικοποίησης. Στην συνέχεια η αραιή αναπαράσταση του Νέφους σημείων τροφοδοτεί επιπλέον Συνελικτικά Επίπεδα και τέλος ένα Δίκτυο Προτάσεων Περιοχής που στηρίζεται σε συνελικτικά νευρωνικά δίκτυα, το οποίο κάνει τις τελικές προβλέψεις για την ύπαρξη ή όχι αυτοκινήτων στην εκάστοτε υποπεριοχή του Νέφους, ενώ ταυτόχρονα επιχειρεί να τελειοποιήσει την θέση και τον προσανατολισμό των επιτυχημένων προβλέψεων. Η εκπαίδευση του μοντέλου είναι επιβλεπόμενη και γίνεται με ετικέτες που δίνονται για συγκεκριμένα χαρακτηριστικά του Cloud, ενώ η συνάρτηση απωλειών αποτελείται από τις απώλειες για την κατηγοριοποίηση σε κλάση ενδιαφέροντος ή όχι και τις απώλειες για την διόρθωση των προβλέψεων. Τα πειράματα, σε κατάλληλο σύνολο δεδομένων αποτελούμενο από Νέφη Σημείων οδικού ιστού, δείχνουν πως το μοντέλο είναι ικανό να κατασκευάζει την αναπαράσταση των αντικειμένων στον χώρο και να μαθαίνει την δομή τους, κατορθώνοντας γενικά προβλέψεις υψηλής ποιότητας, οι οποίες περιορίζονται κατά βάση από την ποικιλομορφία του προσανατολισμού των αυτοκινήτων και την δυσκολία διάκρισης παρόμοιων οχημάτων. el
heal.abstract The task of Object Detection is arguably one of the most active tasks in the field of Computer Vision. The task is primarily concerned with the design and implementation of models with the ability to detect instances of specific classes. In contrast to 2d object detection, which has enjoyed great success over the years, 3d detection constitutes a much bigger challenge but also bears great interest due to the numerous applications in household robots, autonomous driving and virtual reality as well. Specifically for the autonomous driving task, the detection of cars in Point Clouds has immense scientific value and is a deciding factor for the success of autonomous driving as a lasting and safe driving alternative. For the encoding of the important features in a Point Cloud, a great number of methods make use of handcrafted features. In this thesis a complete end-to-end 3d object detection architecture is deployed, as well as modifications, in order to detect cars from Point Cloud representations, collected from ‘lidar’ (Light Detection And Ranging) laser devices, which help encode the important element of ‘depth’ as well, in contrast to image based methods. Specifically, the architecture used makes use of three subsystems. Firstly, a Feature Learning Network is responsible for the partitioning of the Point Cloud into voxels and the encoding of the points of each voxel into feature representations, with the help of a chain of Feature Encoding Layers. This sparse feature representation is then feed to some Convolutional Layers and then a Region Proposal Network based upon convolutional neural networks, which makes the final predictions and regresses the predicted targets to improve the position and the orientation of the predictions. Model training is supervised and is achieved with labels for specific parameters that accompany the Point Clouds, whereas the Loss Function is the sum of the Classification Loss (detected or not) and the Regression Loss. The experiments are conducted on a specific Point Cloud dataset which encodes roads into Point Cloud representations. It is demonstrated that the model is able to construct a high level representation of the objects in the Point Cloud and learn their shape and features, thus achieving high quality predictions, limited mostly by the the multitude of possible car orientations and the existing and inevitable resemblance between many road trucks. en
heal.advisorName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 142 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα