HEAL DSpace

Ταχεία ανίχνευση αντικειμένων σε εικόνες

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Μήτσης, Γεώργος el
dc.contributor.author Mitsis, Georgos en
dc.date.accessioned 2015-09-07T10:37:12Z
dc.date.available 2015-09-07T10:37:12Z
dc.date.issued 2015-09-07
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/41191
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.10162
dc.rights Αναφορά Δημιουργού 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by/3.0/gr/ *
dc.subject Ανίχνευση αντικειμένων el
dc.subject Όραση υπολογιστών el
dc.subject Υποψήφιες θέσεις αντικειμένων el
dc.subject Κατάτμηση el
dc.subject Segment boxes el
dc.subject Computer vision en
dc.subject Segmentation en
dc.subject Object detection en
dc.subject Object proposals en
dc.subject Segment boxes en
dc.title Ταχεία ανίχνευση αντικειμένων σε εικόνες el
dc.title Fast object detection on images en
heal.type bachelorThesis
heal.classification Computer vision el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-07-14
heal.abstract Η ανίχνευση υποψήφιων θέσεων αντικειμένων είναι ένα σχετικά πρόσφατο πρόβλημα που προέκυψε λόγω της πολυπλοκότητας των αλγορίθμων ανίχνευσης αντικειμένων και του μεγάλου χρόνου εκτέλεσής τους. Σκοπός είναι με ταχείς υπολογισμούς να ανιχνεύονται όλα τα αντικείμενα στην εικόνα ανεξάρτητα από την κλάση στην οποία ανήκουν. Οι ανιχνεύσεις αυτές τροφοδοτούνται στους ανιχνευτές αντικειμένων έτσι ώστε οι τελευταίοι να αποφύγουν την εξαντλητική αναζήτηση με την μέθοδο κινούμενουπαραθύρου. Με αυτόν τον τρόπο μειώνεται ο χρόνοςπου χρειάζονται για να ταυτοποιήσουν μια εικόνα ενώ ταυτόχρονα μπορούν να χρησιμοποιήσουν πιο πολύπλοκους και αποτελεσματικούς αλγορίθμους. Όλοι οι σύγχρονοι ανιχνευτές αντικειμένων χρησιμοποιούν τις υποψήφιες θέσεις αντικειμένων. Στην διπλωματική μας παρουσιάζουμε όλες τις σύγχρονες μεθόδους για την παραγωγή των υποψήφιων θέσεων αντικειμένων και προτείνουμε μια νέα μέθοδο, την Segment Boxes. Στην μέθοδο αυτή χρησιμοποιούμε κατάτμηση της εικόνας και με βάση τα τμήματα που προκύπτουν βαθμολογούμε παράθυρα μέσα στην εικόνα ανάλογα με την πιθανότητα να υπάρχουν σε αυτά αντικείμενα. Προσπαθούμε να ενσωματώσουμε καλές ιδέες άλλων μεθόδων καθώς και δικές μας για την επίτευξη βέλτιστου αποτελέσματος, κάτι που έχει σαν αποτέλεσμα να καταλήξουμε σε διάφορες προσεγγίσεις της μεθόδου μας.Συγκρίνουμε τις διάφορες προσεγγίσεις μας και τις καλύτερες τις συγκρίνουμε με τις σύγχρονες μεθόδους με την χρήση κατάλληλων μετρικών πάνω σε εικόνες από τις βάσεις εικόνων PASCAL VOC07 και ImageNet 2013. Στην συνέχεια ενσωματώνουμε την μέθοδό μας σε έναν σύγχρονο ανιχνευτή αντικειμένων που χρησιμοποιεί βαθιά μάθηση (deep learning) και συνελικτικά νευρωνικά δίκτυα, τον Fast R-CNN, και συγκρίνουμε και πάλι τα αποτελέσματά μας με αυτά των άλλων μεθόδων, στο πραγματικό πλέον πρόβλημα της ανίχνευσης αντικειμένων. Στόχος μας ήταν να εξετάσουμε τις δυνατότητες της κατάτμησης για το πρόβλημα της ανίχνευσης υποψήφιων θέσεων αντικειμένων. Τα αποτελέσματα της μεθόδου μας είναι ανταγωνίσιμα και σε μερικές περιπτώσεις ξεπερνούν τα αποτελέσματα των σύγχρονων μεθόδων, επιτυγχάνοντας μικρό χρόνο εκτέλεσης (μέχρι και 0.3 δευτερόλεπτα ανά εικόνα) el
heal.abstract Object proposals is a relatively new problem which appeared due to the complexity of modern object detectors and their high execution time. The purpose of object proposal algorithms is the high speed class-agnostic detection of all objects in the image. The proposals are then passed to the object detectors so that they avoid the exhaustive search of the image using the sliding window approach. This way, the time needed to detect objects is drastically reduced which enables them to use more complex and effective algorithms. Modern object detectors use object proposals. In our thesis we present most modern methods for the extraction of object proposals and we propose a new method, Segment Boxes. This method uses segmentation of the image and by using the resulting segments we score windows inside the image based on the possibility that they contain objects. We try to encapsulate good ideas of other methods as well as some of our own to achieve best results, so we end up with several approaches of our method. We compare those different approaches and the best ones are compared with the state-of-the-art methods, using the appropriate metrics, on images from datasets PASCAL VOC07 and ImageNet2013. We then use our proposals with a modern object detector which uses deep learning and convolutional neural networks, Fast R-CNN, and we compare again our results with those of other methods, this time on the problem of object detection. Our goal was to examine the potential of segmentation on the problem of object proposals. The results of our method are competitive and in some cases exceed those of the state-of-the-art methods, while achieving low execution time (one of our approaches runs on 0.3 seconds per image). en
heal.advisorName Κόλλιας, Στέφανος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής. Εργαστήριο Τεχνολογίας Πολυμέσων el
heal.academicPublisherID ntua
heal.numberOfPages 85 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού 3.0 Ελλάδα