HEAL DSpace

Παρακολούθηση πολλαπλών αντικειμένων με χρήση συνελικτικών δικτύων

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Κακολύρης, Αντώνιος el
dc.contributor.author Kakolyris, Antonios en
dc.date.accessioned 2019-03-07T11:43:49Z
dc.date.available 2019-03-07T11:43:49Z
dc.date.issued 2019-03-07
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/48399
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.15911
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Συνελικτικά νευρωνικά δίκτυα el
dc.subject Παρακολούθηση πολλαπλών αντικειμένων el
dc.subject Βαθιά χαρακτηριστικά el
dc.subject Κατάτμηση εικόνας el
dc.subject Επεξεργασία εικόνας el
dc.subject Convolutional neural networks en
dc.subject Multiple object tracking el
dc.subject Deep features el
dc.subject Image processing el
dc.subject Image segmentation el
dc.title Παρακολούθηση πολλαπλών αντικειμένων με χρήση συνελικτικών δικτύων el
heal.type bachelorThesis
heal.classification Αντίληψη και όραση υπολογιστών el
heal.classificationURI http://data.seab.gr/concepts/12c1c913dbe758d67c4c509a6768bdbc7905830c
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2018-10-12
heal.abstract Σύγχρονα συστήματα που βασίζονται σε Συνελικτικά Νευρωνικά Δίκτυα έχουν δώσει αποτελεσματικές και αποδοτικές λύσεις για εργασίες ανίχνευσης αντικειμένων από εικόνα. Η τρέχουσες εξελίξεις υλισμικού και λογισμικού έχουν συντελέσει σε αρκετά σύντομους χρόνους εκτέλεσης, δίνοντας τη δυνατότητα για ανίχνευση αντικειμένων από βίντεο σε πραγματικό χρόνο. Μια συχνή σχετική ερώτηση είναι πώς μπορούν να συσχετιστούν ανιχνεύσεις μεταξύ διαδοχικών καρέ. Η αντίστοιχη περιοχή έρευνας είναι η οπτική Παρακολούθηση Πολλαπλών Αντικειμένων, η οποία θα μπορούσε να είναι ένα βασικό σύστημα για ανάλυση βίντεο σε πραγματικό χρόνο. Η Παρακολούθηση Πολλαπλών Αντικειμένων, σύμφωνα με το παράδειγμα της παρακολούθησης από ανίχνευση, συσχετίζει αντικείμενα που βρέθηκαν στο τρέχον καρέ με αντικείμενα υπό παρακολούθηση από προηγούμενα καρέ. Τα προτεινόμενα συστήματα για αυτό το σκοπό χρησιμοποιούν ενδείξεις εμφάνισης ή κίνησης για να επιλύσουν αυτό το πρόβλημα συσχέτισης δεδομένων. Πρόσφατες εργασίες επιστρατεύουν εύρωστες ενδείξεις εμφάνισης βελτιώνοντας την σύγχρονη επίδοση των συστημάτων παρακολούθησης. Ακολουθώντας τη φιλοσοφία των εύρωστων περιγραφών εμφάνισης, αυτή η διπλωματική εργασία περιγράφει μια νέα προσέγγιση για Παρακολούθηση Πολλαπλών Αντικειμένων, σύμφωνα με την οποία εξάγονται περιγραφές των αντικειμένων από τις ήδη υπολογισμένες εσωτερικές αναπαραστάσεις του Συνελικτικού Νευρωνικού Δικτύου του συστήματος ανίχνευσης. Χρησιμοποιώντας το σύστημα Mask-RCNN, ένα σύγχρονο δίκτυο κατάτμησης στιγμιοτύπων, και εύρωστες μετρικές ομοιότητας από τον τομέα της Όρασης Υπολογιστών, το τελικό σύστημα είναι αποτελεσματικό σε απαιτητικά σενάρια πραγματικών εφαρμογών, όπως οι μερικές αποκρύψεις, οι γρήγορες αλλαγές στη φωτεινότητα και οι ολικές αποκρύψεις πολλαπλών καρέ. Το σύστημα Παρακολούθησης Πολλαπλών Αντικειμένων που περιγράφεται αξιολογείται σε σχετικά σύνολα δεδομένων, υποστηρίζεται από στατιστικά δεδομένα και δοκιμάζεται σε βίντεο προτείνοντας εφαρμογές. el
heal.abstract Modern systems based on Convolutional Neural Networks have given effective and efficient solutions for the task of object detection in a single image. The ongoing hardware and programming improvements have lead to adequately short execution times, giving the capability of real time object detection from video frames. A common question asked in this context is how to relate detections between consecutive frames. The corresponding research area is visual Multiple Object Tracking, which could potentially be a core system for real time video analysis. Multiple Object Tracking, according to the tracking by detection paradigm, relates detections in the present frames with tracked object instances from previous frames. Proposed systems for this purpose use appearance and motion cues to solve this data association problem. Recent works employing robust appearance cues have improved the state of the art performance of trackers. In the spirit of robust appearance descriptions, this thesis describes a novel approach for Multiple Object Tracking, in which object instance descriptions are extracted from the already computed Convolutional Neural Network internal representations of the object detector. By using Mask-RCNN, a state of the art instance segmentation network, and robust similarity metrics used in Computer Vision, the resulting system is effective in difficult real world scenarios such as partial occlusions, rapid illumination changes and long term occlusions. The described Multiple Object Tracking System is evaluated in standard benchmarks, supported with statistical data and tested in videos to propose applications. en
heal.advisorName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.committeeMemberName Καρπούζης, Κωνσταντίνος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 76 σ.
heal.fullTextAvailability true


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα