Παρακολούθηση πολλαπλών αντικειμένων με χρήση συνελικτικών δικτύων

Κακολύρης, Αντώνιος; Kakolyris, Antonios

dc.contributor.author	Κακολύρης, Αντώνιος	el
dc.contributor.author	Kakolyris, Antonios	en
dc.date.accessioned	2019-03-07T11:43:49Z
dc.date.available	2019-03-07T11:43:49Z
dc.date.issued	2019-03-07
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/48399
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.15911
dc.rights	Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by-nc-nd/3.0/gr/	*
dc.subject	Συνελικτικά νευρωνικά δίκτυα	el
dc.subject	Παρακολούθηση πολλαπλών αντικειμένων	el
dc.subject	Βαθιά χαρακτηριστικά	el
dc.subject	Κατάτμηση εικόνας	el
dc.subject	Επεξεργασία εικόνας	el
dc.subject	Convolutional neural networks	en
dc.subject	Multiple object tracking	el
dc.subject	Deep features	el
dc.subject	Image processing	el
dc.subject	Image segmentation	el
dc.title	Παρακολούθηση πολλαπλών αντικειμένων με χρήση συνελικτικών δικτύων	el
heal.type	bachelorThesis
heal.classification	Αντίληψη και όραση υπολογιστών	el
heal.classificationURI	http://data.seab.gr/concepts/12c1c913dbe758d67c4c509a6768bdbc7905830c
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2018-10-12
heal.abstract	Σύγχρονα συστήματα που βασίζονται σε Συνελικτικά Νευρωνικά Δίκτυα έχουν δώσει αποτελεσματικές και αποδοτικές λύσεις για εργασίες ανίχνευσης αντικειμένων από εικόνα. Η τρέχουσες εξελίξεις υλισμικού και λογισμικού έχουν συντελέσει σε αρκετά σύντομους χρόνους εκτέλεσης, δίνοντας τη δυνατότητα για ανίχνευση αντικειμένων από βίντεο σε πραγματικό χρόνο. Μια συχνή σχετική ερώτηση είναι πώς μπορούν να συσχετιστούν ανιχνεύσεις μεταξύ διαδοχικών καρέ. Η αντίστοιχη περιοχή έρευνας είναι η οπτική Παρακολούθηση Πολλαπλών Αντικειμένων, η οποία θα μπορούσε να είναι ένα βασικό σύστημα για ανάλυση βίντεο σε πραγματικό χρόνο. Η Παρακολούθηση Πολλαπλών Αντικειμένων, σύμφωνα με το παράδειγμα της παρακολούθησης από ανίχνευση, συσχετίζει αντικείμενα που βρέθηκαν στο τρέχον καρέ με αντικείμενα υπό παρακολούθηση από προηγούμενα καρέ. Τα προτεινόμενα συστήματα για αυτό το σκοπό χρησιμοποιούν ενδείξεις εμφάνισης ή κίνησης για να επιλύσουν αυτό το πρόβλημα συσχέτισης δεδομένων. Πρόσφατες εργασίες επιστρατεύουν εύρωστες ενδείξεις εμφάνισης βελτιώνοντας την σύγχρονη επίδοση των συστημάτων παρακολούθησης. Ακολουθώντας τη φιλοσοφία των εύρωστων περιγραφών εμφάνισης, αυτή η διπλωματική εργασία περιγράφει μια νέα προσέγγιση για Παρακολούθηση Πολλαπλών Αντικειμένων, σύμφωνα με την οποία εξάγονται περιγραφές των αντικειμένων από τις ήδη υπολογισμένες εσωτερικές αναπαραστάσεις του Συνελικτικού Νευρωνικού Δικτύου του συστήματος ανίχνευσης. Χρησιμοποιώντας το σύστημα Mask-RCNN, ένα σύγχρονο δίκτυο κατάτμησης στιγμιοτύπων, και εύρωστες μετρικές ομοιότητας από τον τομέα της Όρασης Υπολογιστών, το τελικό σύστημα είναι αποτελεσματικό σε απαιτητικά σενάρια πραγματικών εφαρμογών, όπως οι μερικές αποκρύψεις, οι γρήγορες αλλαγές στη φωτεινότητα και οι ολικές αποκρύψεις πολλαπλών καρέ. Το σύστημα Παρακολούθησης Πολλαπλών Αντικειμένων που περιγράφεται αξιολογείται σε σχετικά σύνολα δεδομένων, υποστηρίζεται από στατιστικά δεδομένα και δοκιμάζεται σε βίντεο προτείνοντας εφαρμογές.	el
heal.abstract	Modern systems based on Convolutional Neural Networks have given effective and efficient solutions for the task of object detection in a single image. The ongoing hardware and programming improvements have lead to adequately short execution times, giving the capability of real time object detection from video frames. A common question asked in this context is how to relate detections between consecutive frames. The corresponding research area is visual Multiple Object Tracking, which could potentially be a core system for real time video analysis. Multiple Object Tracking, according to the tracking by detection paradigm, relates detections in the present frames with tracked object instances from previous frames. Proposed systems for this purpose use appearance and motion cues to solve this data association problem. Recent works employing robust appearance cues have improved the state of the art performance of trackers. In the spirit of robust appearance descriptions, this thesis describes a novel approach for Multiple Object Tracking, in which object instance descriptions are extracted from the already computed Convolutional Neural Network internal representations of the object detector. By using Mask-RCNN, a state of the art instance segmentation network, and robust similarity metrics used in Computer Vision, the resulting system is effective in difficult real world scenarios such as partial occlusions, rapid illumination changes and long term occlusions. The described Multiple Object Tracking System is evaluated in standard benchmarks, supported with statistical data and tested in videos to propose applications.	en
heal.advisorName	Σταφυλοπάτης, Ανδρέας-Γεώργιος	el
heal.committeeMemberName	Σταφυλοπάτης, Ανδρέας-Γεώργιος	el
heal.committeeMemberName	Στάμου, Γεώργιος	el
heal.committeeMemberName	Καρπούζης, Κωνσταντίνος	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών	el
heal.academicPublisherID	ntua
heal.numberOfPages	76 σ.
heal.fullTextAvailability	true