dc.contributor.author | Μήτσης, Γεώργος | el |
dc.contributor.author | Mitsis, Georgos | en |
dc.date.accessioned | 2015-09-07T10:37:12Z | |
dc.date.available | 2015-09-07T10:37:12Z | |
dc.date.issued | 2015-09-07 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/41191 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.10162 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Ανίχνευση αντικειμένων | el |
dc.subject | Όραση υπολογιστών | el |
dc.subject | Υποψήφιες θέσεις αντικειμένων | el |
dc.subject | Κατάτμηση | el |
dc.subject | Segment boxes | el |
dc.subject | Computer vision | en |
dc.subject | Segmentation | en |
dc.subject | Object detection | en |
dc.subject | Object proposals | en |
dc.subject | Segment boxes | en |
dc.title | Ταχεία ανίχνευση αντικειμένων σε εικόνες | el |
dc.title | Fast object detection on images | en |
heal.type | bachelorThesis | |
heal.classification | Computer vision | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2015-07-14 | |
heal.abstract | Η ανίχνευση υποψήφιων θέσεων αντικειμένων είναι ένα σχετικά πρόσφατο πρόβλημα που προέκυψε λόγω της πολυπλοκότητας των αλγορίθμων ανίχνευσης αντικειμένων και του μεγάλου χρόνου εκτέλεσής τους. Σκοπός είναι με ταχείς υπολογισμούς να ανιχνεύονται όλα τα αντικείμενα στην εικόνα ανεξάρτητα από την κλάση στην οποία ανήκουν. Οι ανιχνεύσεις αυτές τροφοδοτούνται στους ανιχνευτές αντικειμένων έτσι ώστε οι τελευταίοι να αποφύγουν την εξαντλητική αναζήτηση με την μέθοδο κινούμενουπαραθύρου. Με αυτόν τον τρόπο μειώνεται ο χρόνοςπου χρειάζονται για να ταυτοποιήσουν μια εικόνα ενώ ταυτόχρονα μπορούν να χρησιμοποιήσουν πιο πολύπλοκους και αποτελεσματικούς αλγορίθμους. Όλοι οι σύγχρονοι ανιχνευτές αντικειμένων χρησιμοποιούν τις υποψήφιες θέσεις αντικειμένων. Στην διπλωματική μας παρουσιάζουμε όλες τις σύγχρονες μεθόδους για την παραγωγή των υποψήφιων θέσεων αντικειμένων και προτείνουμε μια νέα μέθοδο, την Segment Boxes. Στην μέθοδο αυτή χρησιμοποιούμε κατάτμηση της εικόνας και με βάση τα τμήματα που προκύπτουν βαθμολογούμε παράθυρα μέσα στην εικόνα ανάλογα με την πιθανότητα να υπάρχουν σε αυτά αντικείμενα. Προσπαθούμε να ενσωματώσουμε καλές ιδέες άλλων μεθόδων καθώς και δικές μας για την επίτευξη βέλτιστου αποτελέσματος, κάτι που έχει σαν αποτέλεσμα να καταλήξουμε σε διάφορες προσεγγίσεις της μεθόδου μας.Συγκρίνουμε τις διάφορες προσεγγίσεις μας και τις καλύτερες τις συγκρίνουμε με τις σύγχρονες μεθόδους με την χρήση κατάλληλων μετρικών πάνω σε εικόνες από τις βάσεις εικόνων PASCAL VOC07 και ImageNet 2013. Στην συνέχεια ενσωματώνουμε την μέθοδό μας σε έναν σύγχρονο ανιχνευτή αντικειμένων που χρησιμοποιεί βαθιά μάθηση (deep learning) και συνελικτικά νευρωνικά δίκτυα, τον Fast R-CNN, και συγκρίνουμε και πάλι τα αποτελέσματά μας με αυτά των άλλων μεθόδων, στο πραγματικό πλέον πρόβλημα της ανίχνευσης αντικειμένων. Στόχος μας ήταν να εξετάσουμε τις δυνατότητες της κατάτμησης για το πρόβλημα της ανίχνευσης υποψήφιων θέσεων αντικειμένων. Τα αποτελέσματα της μεθόδου μας είναι ανταγωνίσιμα και σε μερικές περιπτώσεις ξεπερνούν τα αποτελέσματα των σύγχρονων μεθόδων, επιτυγχάνοντας μικρό χρόνο εκτέλεσης (μέχρι και 0.3 δευτερόλεπτα ανά εικόνα) | el |
heal.abstract | Object proposals is a relatively new problem which appeared due to the complexity of modern object detectors and their high execution time. The purpose of object proposal algorithms is the high speed class-agnostic detection of all objects in the image. The proposals are then passed to the object detectors so that they avoid the exhaustive search of the image using the sliding window approach. This way, the time needed to detect objects is drastically reduced which enables them to use more complex and effective algorithms. Modern object detectors use object proposals. In our thesis we present most modern methods for the extraction of object proposals and we propose a new method, Segment Boxes. This method uses segmentation of the image and by using the resulting segments we score windows inside the image based on the possibility that they contain objects. We try to encapsulate good ideas of other methods as well as some of our own to achieve best results, so we end up with several approaches of our method. We compare those different approaches and the best ones are compared with the state-of-the-art methods, using the appropriate metrics, on images from datasets PASCAL VOC07 and ImageNet2013. We then use our proposals with a modern object detector which uses deep learning and convolutional neural networks, Fast R-CNN, and we compare again our results with those of other methods, this time on the problem of object detection. Our goal was to examine the potential of segmentation on the problem of object proposals. The results of our method are competitive and in some cases exceed those of the state-of-the-art methods, while achieving low execution time (one of our approaches runs on 0.3 seconds per image). | en |
heal.advisorName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής. Εργαστήριο Τεχνολογίας Πολυμέσων | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 85 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: