Ταχεία ανίχνευση αντικειμένων σε εικόνες

Μήτσης, Γεώργος; Mitsis, Georgos

dc.contributor.author	Μήτσης, Γεώργος	el
dc.contributor.author	Mitsis, Georgos	en
dc.date.accessioned	2015-09-07T10:37:12Z
dc.date.available	2015-09-07T10:37:12Z
dc.date.issued	2015-09-07
dc.identifier.uri	https://dspace.lib.ntua.gr/xmlui/handle/123456789/41191
dc.identifier.uri	http://dx.doi.org/10.26240/heal.ntua.10162
dc.rights	Αναφορά Δημιουργού 3.0 Ελλάδα	*
dc.rights.uri	http://creativecommons.org/licenses/by/3.0/gr/	*
dc.subject	Ανίχνευση αντικειμένων	el
dc.subject	Όραση υπολογιστών	el
dc.subject	Υποψήφιες θέσεις αντικειμένων	el
dc.subject	Κατάτμηση	el
dc.subject	Segment boxes	el
dc.subject	Computer vision	en
dc.subject	Segmentation	en
dc.subject	Object detection	en
dc.subject	Object proposals	en
dc.subject	Segment boxes	en
dc.title	Ταχεία ανίχνευση αντικειμένων σε εικόνες	el
dc.title	Fast object detection on images	en
heal.type	bachelorThesis
heal.classification	Computer vision	el
heal.language	el
heal.access	free
heal.recordProvider	ntua	el
heal.publicationDate	2015-07-14
heal.abstract	Η ανίχνευση υποψήφιων θέσεων αντικειμένων είναι ένα σχετικά πρόσφατο πρόβλημα που προέκυψε λόγω της πολυπλοκότητας των αλγορίθμων ανίχνευσης αντικειμένων και του μεγάλου χρόνου εκτέλεσής τους. Σκοπός είναι με ταχείς υπολογισμούς να ανιχνεύονται όλα τα αντικείμενα στην εικόνα ανεξάρτητα από την κλάση στην οποία ανήκουν. Οι ανιχνεύσεις αυτές τροφοδοτούνται στους ανιχνευτές αντικειμένων έτσι ώστε οι τελευταίοι να αποφύγουν την εξαντλητική αναζήτηση με την μέθοδο κινούμενουπαραθύρου. Με αυτόν τον τρόπο μειώνεται ο χρόνοςπου χρειάζονται για να ταυτοποιήσουν μια εικόνα ενώ ταυτόχρονα μπορούν να χρησιμοποιήσουν πιο πολύπλοκους και αποτελεσματικούς αλγορίθμους. Όλοι οι σύγχρονοι ανιχνευτές αντικειμένων χρησιμοποιούν τις υποψήφιες θέσεις αντικειμένων. Στην διπλωματική μας παρουσιάζουμε όλες τις σύγχρονες μεθόδους για την παραγωγή των υποψήφιων θέσεων αντικειμένων και προτείνουμε μια νέα μέθοδο, την Segment Boxes. Στην μέθοδο αυτή χρησιμοποιούμε κατάτμηση της εικόνας και με βάση τα τμήματα που προκύπτουν βαθμολογούμε παράθυρα μέσα στην εικόνα ανάλογα με την πιθανότητα να υπάρχουν σε αυτά αντικείμενα. Προσπαθούμε να ενσωματώσουμε καλές ιδέες άλλων μεθόδων καθώς και δικές μας για την επίτευξη βέλτιστου αποτελέσματος, κάτι που έχει σαν αποτέλεσμα να καταλήξουμε σε διάφορες προσεγγίσεις της μεθόδου μας.Συγκρίνουμε τις διάφορες προσεγγίσεις μας και τις καλύτερες τις συγκρίνουμε με τις σύγχρονες μεθόδους με την χρήση κατάλληλων μετρικών πάνω σε εικόνες από τις βάσεις εικόνων PASCAL VOC07 και ImageNet 2013. Στην συνέχεια ενσωματώνουμε την μέθοδό μας σε έναν σύγχρονο ανιχνευτή αντικειμένων που χρησιμοποιεί βαθιά μάθηση (deep learning) και συνελικτικά νευρωνικά δίκτυα, τον Fast R-CNN, και συγκρίνουμε και πάλι τα αποτελέσματά μας με αυτά των άλλων μεθόδων, στο πραγματικό πλέον πρόβλημα της ανίχνευσης αντικειμένων. Στόχος μας ήταν να εξετάσουμε τις δυνατότητες της κατάτμησης για το πρόβλημα της ανίχνευσης υποψήφιων θέσεων αντικειμένων. Τα αποτελέσματα της μεθόδου μας είναι ανταγωνίσιμα και σε μερικές περιπτώσεις ξεπερνούν τα αποτελέσματα των σύγχρονων μεθόδων, επιτυγχάνοντας μικρό χρόνο εκτέλεσης (μέχρι και 0.3 δευτερόλεπτα ανά εικόνα)	el
heal.abstract	Object proposals is a relatively new problem which appeared due to the complexity of modern object detectors and their high execution time. The purpose of object proposal algorithms is the high speed class-agnostic detection of all objects in the image. The proposals are then passed to the object detectors so that they avoid the exhaustive search of the image using the sliding window approach. This way, the time needed to detect objects is drastically reduced which enables them to use more complex and effective algorithms. Modern object detectors use object proposals. In our thesis we present most modern methods for the extraction of object proposals and we propose a new method, Segment Boxes. This method uses segmentation of the image and by using the resulting segments we score windows inside the image based on the possibility that they contain objects. We try to encapsulate good ideas of other methods as well as some of our own to achieve best results, so we end up with several approaches of our method. We compare those different approaches and the best ones are compared with the state-of-the-art methods, using the appropriate metrics, on images from datasets PASCAL VOC07 and ImageNet2013. We then use our proposals with a modern object detector which uses deep learning and convolutional neural networks, Fast R-CNN, and we compare again our results with those of other methods, this time on the problem of object detection. Our goal was to examine the potential of segmentation on the problem of object proposals. The results of our method are competitive and in some cases exceed those of the state-of-the-art methods, while achieving low execution time (one of our approaches runs on 0.3 seconds per image).	en
heal.advisorName	Κόλλιας, Στέφανος	el
heal.committeeMemberName	Κόλλιας, Στέφανος	el
heal.committeeMemberName	Σταφυλοπάτης, Ανδρέας-Γεώργιος	el
heal.committeeMemberName	Στάμου, Γεώργιος	el
heal.academicPublisher	Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής. Εργαστήριο Τεχνολογίας Πολυμέσων	el
heal.academicPublisherID	ntua
heal.numberOfPages	85 σ.
heal.fullTextAvailability	true