Πρότυπα υπολογιστικής όρασης για την αναγνώριση κυκλοφοριακών συνθηκών από μη επανδρωμένο αεροσκάφος

Δάβος, Γεώργιος; Davos, Georgios

dc.contributor.author	Δάβος, Γεώργιος	el
dc.contributor.author	Davos, Georgios	en
dc.date.accessioned	2019-07-23T08:42:31Z
dc.date.available	2019-07-23T08:42:31Z
dc.date.issued	2019-07-23
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/49125
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.16792
dc.rights	Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/3.0/gr/	*
dc.subject	Μη επανδρωμένο αεροσκάφος	el
dc.subject	Συνελικτικά νευρωνικά δίκτυα	el
dc.subject	Υπολογιστική όραση	el
dc.subject	Κυκλοφοριακές συνθήκες	el
dc.subject	Βαθιά μάθηση	el
dc.subject	Unmanned aerial vehicle	en
dc.subject	Convolutional neural networks	en
dc.subject	Computer vision	en
dc.subject	Traffic conditions	en
dc.subject	Deep learning	en
dc.title	Πρότυπα υπολογιστικής όρασης για την αναγνώριση κυκλοφοριακών συνθηκών από μη επανδρωμένο αεροσκάφος	el
heal.type	bachelorThesis
heal.classification	Συγκοινωνιολογία	el
heal.language	el
heal.access	campus
heal.recordProvider	ntua	el
heal.publicationDate	2019-03-21
heal.abstract	Τα τελευταία χρόνια η κοινωνία έχει δει απότομη ανάπτυξη της τεχνολογίας. Αυτό έχει ως αποτέλεσμα να έχει γίνει αναπόσπαστο κομμάτι της καθημερινότητας σχεδόν σε κάθε τομέα του σύγχρονου ανθρώπου. Επόμενο είναι αυτή η ανάπτυξη να έχει επηρεάσει σημαντικά και τον συγκοινωνιακό τομέα προσφέροντας νέες τεχνολογίες και εναλλακτικές σε πληθώρα ζητημάτων. Πιο συγκεκριμένα έχουν εμφανιστεί νέες εφαρμογές συλλογής και επεξεργασίας κυκλοφοριακών δεδομένων και φαινομένων. Η ανάλυση εικόνας που προέρχεται από μη επανδρωμένο αεροσκάφος (Unmanned Aerial Vehicles – UAV ή Drone) εμφανίζει μεγάλο ενδιαφέρον καθώς τα τελευταία χρόνια έχει οδηγήσει σε σημαντικές προόδους στην συλλογή και κατανόηση της κυκλοφορίας από οπτικά μέσα. Επιπλέον η υπολογιστική όραση έχει θεμελιώσει τη θέση της στον τομέα της μηχανικής μάθησης. Με χρήση αλγόριθμων και προ-εκπαιδευμένων μοντέλων βαθιάς μάθησης αναλύεται τεράστιος εικόνας και βίντεο. Αυτά τα μοντέλα πλέον εμφανίζονται σε πολλές εφαρμογές της κυκλοφορίας και των μεταφορών λόγω της εξαιρετικής δυνατότητας ανάλυσης μεγάλου όγκου δεδομένων. Από την ανασκόπηση της βιβλιογραφίας, αναδεικνύονται τα πλεονεκτήματα και οι περιορισμοί των εφαρμογών που αξιοποιούν μη επανδρωμένα αεροσκάφη και τεχνικές υπολογιστικής όρασης, ενώ παρατηρείται πως οι υπάρχουσες εφαρμογές που αξιοποιούν μη επανδρωμένα αεροσκάφη σε συνδυασμό με εφαρμογές βαθιάς μάθησης για την επεξεργασία των δεδομένων, είναι περιορισμένες και δεν ασχολούνται με εφαρμογές στην κυκλοφορία. H παρούσα εργασία αποσκοπεί στην ανάπτυξη και αξιολόγηση αξιόπιστων προτύπων βαθιάς μάθησης και υπολογιστικής όρασης για τον εντοπισμό κυκλοφοριακών συνθήκων από βίντεο καταγεγραμμένα με μη επανδρωμένο αεροσκάφος. Στο πλαίσιο της εργασίας θα εξεταστούν δύο προσεγγίσεις που ακολουθούν διαφορετικές μεθοδολογίες οι οποίες διαφέρουν στην χρήση τους αλλά και στα χαρακτηριστικά τους. Η πρώτη προσέγγιση αποσκοπεί στην αξιολόγηση, σε πραγματικό χρόνο, κυκλοφοριακών συνθηκών ενός τμήματος οδού σε δύο κατηγορίες (κορεσμένο ή μη κορεσμένο), με ελάχιστο υπολογιστικό κόστος. Ο σκοπός της δεύτερης προσέγγισης είναι να εντοπίσει, να κατηγοριοποιήσει τα οχήματα και να εκτιμήσει κυκλοφοριακά μεγέθη από ένα βίντεο ενός οδικού τμήματος. Και στις δύο προσεγγίσεις αξιοποιήθηκαν δεδομένα μορφής βίντεο που έχουν καταγράψει την κυκλοφορία επι την οδό Κατεχάκη, Αθήνα από μη επανδρωμένο αεροσκάφος. Κάθε προσέγγιση υποστηρίζεται από ξεχωριστή προεπεξεργασία των δεδομένων. Πρώτο βήμα είναι η κατάλληλη μετατροπή του βίντεο σε εικόνες για δημιουργία βάσεων δεδομένων. Για το πρώτο πρότυπο απομονώνεται ένα τμήμα από την οδό και εξάγονται εικόνες που χωρίζονται σε δύο κατηγορίες, Χαμηλής/Καθόλου Κυκλοφορίας και Υψηλής Κυκλοφορίας με κριτήρια τον αριθμό και θέση των οχημάτων στις εικόνες. Για την δεύτερη μεθοδολογική προσέγγιση απομονώνονται επίσης επιθυμητά τμήματα της οδού από τα βίντεο, όπου ακολουθώντας μετατρέπονται σε εικόνες στις οποίες επισημαίνεται με κατάλληλη μορφή η θέση και κατηγορία των οχημάτων που βρίσκονται εντός αυτών. Στο δεύτερο στάδιο της εργασίας, εξετάζονται αρχικά διαφορετικές μεθοδολογίες για κάθε μια από τις δυο προσεγγίσεις. Για την επίτευξη του στόχου της πρώτης προσέγγισης IV αναπτύσσονται, εκπαιδεύονται και αξιολογούνται συνελικτικά νευρωνικά δίκτυα με διαφορετικές δομές. Επίσης εξετάζεται η εφαρμογή διαβιβαστικής μάθησης από προ-εκπαιδευμένα δίκτυα. Η επιλογή της βέλτιστης δομής βασίζεται στην ελαχιστοποίηση του σφάλματος στο δείγμα αξιολόγησης και στην μεγιστοποίηση ακρίβειας. Το βέλτιστο δίκτυο χαρακτηρίζεται από υψηλή ακρίβεια (91%), ενώ η εφαρμογή διαβιβαστικής μάθησης, παρά την υψηλή ακρίβεια (89%) της, κρίνεται μη ιδανική για την συγκεκριμένη προσέγγιση, για λόγους όπως οι υπολογιστικές απαιτήσεις. Τελικά το μοντέλο εφαρμόζεται σε βίντεο με δεδομένα που δεν έχουν χρησιμοποιηθεί στην εκπαίδευση, για την αξιολόγηση της δυνατότητας γενίκευσης σε δεδομένα που θα λαμβάνει σε πραγματικό χρόνο. Για τις απαιτήσεις της δεύτερης προσέγγισης αξιοποιούνται προ-εκπαιδευμένα συνελικτικά νευρωνικά δίκτυα για εντοπισμό αντικειμένων, ρυθμισμένα καταλλήλως για τα βίντεο από το μη επανδρωμένο αεροσκάφος. Το τελικό μοντέλο εντοπίζει και κατηγοριοποιεί τα οχήματα σε ένα τμήμα οδού με ικανοποιητική ακρίβεια (89% F1 Score), στη συνέχεια εφαρμόζεται σε βίντεο για την προσέγγιση κυκλοφοριακών μεγεθών και αξιολογείτε με βάση τις υπολογιστικές και χρονικές απαιτήσεις του. Κατά την διεξαγωγή της διπλωματικής εργασίας εντοπίστηκαν κάποιοι περιορισμοί όπως, η αξιόπιστη αξιολόγηση των μοντέλων λόγω υψηλής ομοιότητας των δεδομένων εκπαίδευσης και αξιολόγησης. Για την αντιμετώπιση τους είναι προφανής η ανάγκη για περισσότερα και καλύτερης ποιότητας δεδομένα, καθώς είναι η κυριότερη προϋπόθεση για την διαμόρφωση αξιόπιστων προτύπων βαθιάς μάθησης. Επίσης σημαντικός περιοριστικός παράγοντας είναι οι υψηλές υπολογιστικές απαιτήσεις των μεθοδολογιών υπολογιστικής όρασης και βαθιάς μάθησης σε σχέση με άλλες μεθόδους. Επομένως πρέπει να γίνουν κατάλληλες επιλογές και ρυθμίσεις για την βέλτιστη αξιοποίηση των διαθέσιμων δεδομένων και εξοπλισμού. Συνοψίζοντας, συνιστάται περαιτέρω ερευνά, με περισσότερα δεδομένα και επανεξέταση των προτύπων για την κατάλληλη, πιο γενικευμένη, εφαρμογή τους στις περιπτώσεις που εξετάστηκαν με μη επανδρωμένα αεροσκάφη και στα ακόλουθα βήματα τους. Επίσης αναφέρεται η δυνατότητα διαφορετικών εφαρμογών όπως, για παράδειγμα, ο εντοπισμός θέσεων στάθμευσης, μήκος ουρών αναμονής σε διασταυρώσεις και παρακολούθηση κυκλοφορίας πεζών από εναέρια λήψη. Τελικά οι εφαρμογές βαθιάς μάθησης σε συνδυασμό την αξιοποίηση μη επανδρωμένων αεροσκαφών παρουσιάζουν πληθώρα δυνατών εφαρμογών με τη συνεχή ανάπτυξη της τεχνολογίας και περαιτέρω έρευνα.	el
heal.abstract	The rapid development of unmanned aerial vehicles (UAV/Drones) technology in recent years has resulted in significant advancements in collecting, understanding and modeling traffic based on large video streams. In addition, Computer Vision (CV) is now at the forefront of Machine Learning; algorithms and pre-trained deep learning networks exist for analyzing huge volumes of images with enormous detection capabilities. These networks are emerging in transportation problems. The purpose of this diploma thesis is to provide a consistent methodological framework to detect traffic conditions based on deep learning models and video data captured from an unmanned aerial vehicle. The first approach followed aims to evaluate in real time, with minimal computation cost, the general traffic conditions of a road segment in two categories. To achieve that, many convolutional neural networks with different structures are developed and evaluated. The identification of the optimal structure is based on the minimization of the detection error on the evaluation sample. The purpose of the second approach is to localize, classify vehicles and approximate traffic metrics and conditions in a video of a road segment. This method takes advantage of pre-trained convolutional neural networks modified to be used with the video data from the unmanned aerial vehicle. The two approaches are implemented on video data captured from an unmanned aerial vehicle (UAV/Drone) equipped with a camera, over Katehaki Street, Athens. Both approaches are then compared based on their accuracy and feasibility in implementation and possible applications in the field of transportation and traffic monitoring are discussed.	en
heal.advisorName	Βλαχογιάννη, Ελένη	el
heal.committeeMemberName	Γιαννής, Γεώργιος	el
heal.committeeMemberName	Γκόλιας, Ιωάννης	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Πολιτικών Μηχανικών. Τομέας Μεταφορών και Συγκοινωνιακής Υποδομής	el
heal.academicPublisherID	ntua
heal.numberOfPages	99 σ.
heal.fullTextAvailability	true