dc.contributor.advisor |
Κόλλιας, Στέφανος |
el |
dc.contributor.author |
Τόλιας, Γεώργιος Κ.
|
el |
dc.contributor.author |
Tolias, Georgios K.
|
en |
dc.date.accessioned |
2014-04-03T09:27:31Z |
|
dc.date.available |
2014-04-03T09:27:31Z |
|
dc.date.copyright |
2013-12-18 |
- |
dc.date.issued |
2014-04-03 |
|
dc.date.submitted |
2013-12-18 |
- |
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/38299 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.3129 |
|
dc.description |
130 σ. |
el |
dc.description.abstract |
Ένα μεγάλο εύρος από ιδιότητες και υποθέσεις καθορίζουν το πιο κατάλληλο μοντέλο γεωμετρικού ταιριάσματος για εφαρμογές όπως η αναγνώριση κι ο εντοπισμός αντικειμένων, η ευθυγράμμιση εικόνων, ή η ανάκτηση από μεγάλες βάσεις εικόνων. Πιο σημαντικές από αυτές είναι το γεωμετρικά αναλλοίωτο, οι περιορισμοί ακαμψίας, οι περιορισμοί στις αντιστοιχίες, οι υποθέσεις σχετικά με τα χρησιμοποιούμενα τοπικά χαρακτηριστικά ή περιγραφείς, η διακριτική τους ικανότητα και φυσικά το υπολογιστικό κόστος. Στην παρούσα διατριβή θα ασχοληθούμε με το πρόβλημα της ανάκτησης από μεγάλη βάση εικόνων με χρήση εικόνας ερωτήματος. Σκοπός είναι η εύρεση εικόνων οι οποίες απεικονίζουν το ίδιο αντικείμενο από διαφορετικές οπτικές γωνίες ακόμα κι αν αυτό δεν είναι πλήρως ορατό. Για τον σκοπό αυτό προτείνουμε δύο μεθόδους ανάκτησης με χρήση γεωμετρικής πληροφορίας είτε στην δομή δεικτοδότησης είτε σε ένα δεύτερο στάδιο ανακατάταξης των εικόνων με γεωμετρικά κριτήρια. Επίσης προτείνουμε τρόπους με τους οποίους το γεωμετρικό ταίριασμα μπορεί να χρησιμοποιηθεί για επιλογή χαρακτηριστικών. Τέλος αναπτύσσουμε μία μέθοδο για επέκταση ερωτήματος η οποία εμπλουτίζει την τοπική αναπαράσταση της εικόνας, επιτυγχάνοντας υψηλή απόδοση και σε χαμηλούς χρόνους.
Παρουσιάζουμε μία νέα μέθοδο για δεικτοδότηση και ανάκτηση εικόνων, η οποία ενσωματώνει την εμφάνιση των τοπικών χαρακτηριστικών μαζί με πληροφορία καθολικής γεωμετρίας στην διαδικασία δεικτοδότησης. Χρησιμοποιούμε τις παραμέτρους σχήματος των τοπικών χαρακτηριστικών για να πάρουμε μία εκτίμηση της ευθυγράμμισης των εικόνων από μονές αντιστοιχίες χαρακτηριστικών. Για κάθε χαρακτηριστικό κατασκευάζουμε έναν αραιό χωρικό χάρτη ο οποίος κωδικοποιεί την κανονικοποιημένη θέση όλων των υπολοίπων χαρακτηριστικών. Μία εικόνα αναπαρίσταται τελικά από ένα σύνολο τέτοιων χαρτών χαρακτηριστικών και τελικά ένα ταίριασμα εικόνων παρόμοιο με εκείνο του αλγόριθμου RANSAC ανάγεται σε έναν αριθμό από εσωτερικά γινόμενα ή τομές συνόλων. Χρησιμοποιούμε την μέθοδο των ανεξάρτητων αντιμεταθέσεων και προτείνουμε ένα μέτρο ομοιότητας για συλλογές χαρτών χαρακτηριστικών. Εκτός από την τυχαία επιλογή χαρακτηριστικών προχωράμε και σε επιλογή τους με βάση το γεωμετρικό ταίριασμα ανάμεσα σε διαφορετικές όψεις του ίδιου αντικειμένου. Αυτή η τεχνική μας επιτρέπει να κατορθώσουμε δεικτοδότηση γεωμετρίας για 1Μ εικόνες. Εκμεταλλευόμενοι την αραιότητα της αναπαράστασής μας χρησιμοποιούμε ανάστροφο αρχείο ως δομή δεικτοδότησης μετατρέποντας την αναζήτηση σε διαδικασία υπο-γραμμική ως προς το μέγεθος της βάσης εικόνων.
Επιπλέον προτείνουμε ένα πολύ απλό μοντέλο γεωμετρικού ταιριάσματος (ταίριασμα πυραμίδων Hough) με έμπνευση από τον μετασχηματισμό Hough στον χώρο των γεωμετρικών μετασχηματισμών. Οι ψήφοι Hough, προκύπτουν και πάλι από μονές αντιστοιχίες χαρακτηριστικών. Ο αλγόριθμός μας χρησιμοποιεί χαλαρό γεωμετρικό ταίριασμα το οποίο επιτρέπει το ταίριασμα πολλαπλών αντικειμένων ή επιφανειών, επιβάλλοντας παράλληλα αντιστοίχιση ένα προς ένα με πολυπλοκότητα γραμμική ως προς το πλήθος των αρχικών αντιστοιχιών. Τον εφαρμόζουμε σε ανάκτηση από βάση 2 εκατομμυρίων εικόνων επιδεικνύοντας υψηλότερη απόδοση αλλά και ταχύτερη εκτέλεση από σύγχρονες μεθόδους.
Επεκτείνουμε και χρησιμοποιούμε την μέθοδο ταιριάσματος πυραμίδων Hough για τον εντοπισμό συμμετρικών κι επαναλαμβανόμενων δομών μέσα στην ίδια εικόνα. Υποστηρίζουμε πως τοπικά χαρακτηριστικά τα οποία συμμετέχουν σε τέτοιες δομές έχουν μεγαλύτερη πιθανότητα να ταιριάξουν και μεταξύ διαφορετικών εικόνων. Το αποτέλεσμα του γεωμετρικού ταιριάσματος της εικόνας με τον εαυτό της και το αντικατοπτρισμένο είδωλο της μας δίνει την πληροφορία για την επιλογή χαρακτηριστικών από μοναδικές εικόνες.
Σε αντίθεση με όλες τις προηγούμενες μεθόδους με τις οποίες ασχοληθήκαμε και προτείναμε, οι οποίες χρησιμοποιούν μόνο τις οπτικές λέξεις για ταίριασμα μεταξύ τοπικών χαρακτηριστικών, ασχολούμαστε και με την μέθοδο Hamming Embedding (HE) η οποία κάνει επιπλέον χρήση πληροφορίας του τοπικού περιγραφέα. Κάθε τοπικό χαρακτηριστικό περιγράφεται από μία οπτική λέξη αλλά και μία δυαδική υπογραφή. Προτείνουμε μία μέθοδο για επέκταση ερωτήματος η οποία χρησιμοποιεί την βασική αναπαράσταση της μεθόδου HE και είναι εναρμονισμένη με αυτή. Καταφέρνουμε να βελτιώσουμε την απόδοση ακόμα και χωρίς την χρήση γεωμετρικής πληροφορίας και να πετύχουμε έτσι πολύ χαμηλούς χρόνους εκτέλεσης. Τελικά δείχνουμε πως με επιπλέον γεωμετρικό ταίριασμα η απόδοση βελτιώνεται ακόμα περισσότερο. |
el |
dc.description.abstract |
A wide range of properties and assumptions determine the most appropriate spatial matching model for an application, e.g. recognition, detection, registration, or large scale image retrieval. Most notably, these include discriminative power, geometric invariance, rigidity constraints, mapping constraints, assumptions made on the underlying features or descriptors and, of course, computational complexity.
We present a new approach to image indexing and retrieval, which integrates appearance with global image geometry in the indexing process, while enjoying robustness against viewpoint change, photometric variations, occlusion, and background clutter. We exploit shape parameters of local features to estimate image alignment via a single correspondence. Then, for each feature, we construct a sparse spatial map of all remaining features, encoding their normalized position and appearance, typically vector quantized to visual word. An image is represented by a collection of such feature mapsand RANSAC-like matching is reduced to a number of set intersections. We use min-wise independent permutations and derive a similarity measure for feature map collections. In addition to random selection, we have further exploited multiple view matching for feature selection. This allows us to scale geometry indexing up to 1M images. We then exploit sparseness to build an inverted file whereby the retrieval process is sub-linear in the total number of images, ideally linear in the number of relevant ones.
We further present a very simple model inspired by Hough voting in the transformation space, where votes arise from single feature correspondences. A relaxed matching process allows for multiple matching surfaces or non-rigid objects under one-to-one mapping, yet is linear in the number of correspondences. We apply it to geometry re-ranking in a search engine, yielding superior performance with the same space requirements but a dramatic speed-up compared to the state of the art.
We further extend and use our relaxed spatial matching for self-matching and symmetry detection. We assume that features participating in symmetric and repeating structures have higher probability to be matched between different views of the same object. Information from geometric self-matching and matching of the image with its mirrored counterpart is used for feature selection of single images.
In contrast to the previous methods that we discussed or proposed, which all use only visual word information to perform feature matching, we further exploit the Hamming Embedding (ΗΕ) technique, which further use descriptor information. HE employs each feature with visual word and a binary signature which allows more precise feature matching. We develop a novel query expansion strategy which is aligned with the HE representation. We achieve to improve performance even without geometry matching, in contrast to previous query expansion methods, along with low query times. We finally show that combining our scheme with geometry matching can further boost performance and outperform state of the art methods. |
en |
dc.description.statementofresponsibility |
Γεώργιος Κ. Τόλιας |
el |
dc.language.iso |
el |
en |
dc.rights |
ETDFree-policy.xml |
en |
dc.subject |
Αναζήτηση εικόνων |
el |
dc.subject |
Ανάκτηση εικόνων |
el |
dc.subject |
Γεωμετρικό ταίριασμα |
el |
dc.subject |
Γεωμετρικοί περιορισμοί |
el |
dc.subject |
Ταίριασμα πυραμίδας Hough |
el |
dc.subject |
Δεικτοδότηση εικόνων |
el |
dc.subject |
Γεωμετρική ανακατατάξη |
el |
dc.subject |
Bag-of-words |
en |
dc.subject |
Bow |
en |
dc.subject |
Large scale image retrieval thesis |
en |
dc.subject |
Large scale image retrieval |
en |
dc.subject |
Geometric verification |
en |
dc.subject |
Spatial verification |
en |
dc.subject |
Visual query expansion |
en |
dc.subject |
Geometry indexing |
en |
dc.subject |
Feature selection |
en |
dc.title |
Αναζήτηση εικόνων με γεωμετρικά κριτήρια |
el |
dc.title.alternative |
Large scale image retrieval using geometric constraints |
en |
dc.type |
doctoralThesis |
el (en) |
dc.date.accepted |
2013-12-18 |
- |
dc.date.modified |
2013-12-18 |
- |
dc.contributor.advisorcommitteemember |
Σταφυλοπάτης, Ανδρέας |
el |
dc.contributor.advisorcommitteemember |
Στάμου, Γεώργιος |
el |
dc.contributor.committeemember |
Κόλλιας, Στέφανος |
el |
dc.contributor.committeemember |
Σταφυλοπάτης, Ανδρέας |
el |
dc.contributor.committeemember |
Στάμου, Γεώργιος |
el |
dc.contributor.committeemember |
Μαραγκός, Πέτρος |
el |
dc.contributor.committeemember |
Ιωάννης, Εμίρης |
el |
dc.contributor.committeemember |
Παναγιώτης, Τσανάκας |
el |
dc.contributor.committeemember |
Νεκτάριος, Κοζύρης |
el |
dc.contributor.department |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Ψηφιακής Επεξεργασίας Σημάτων και Εικόνων |
el |
dc.date.recordmanipulation.recordcreated |
2014-04-03 |
- |
dc.date.recordmanipulation.recordmodified |
2014-04-03 |
- |