Σε αυτή τη διπλωματική εργασία εξερευνούμε το πρόβλημα της ανίχνευσης αξόνων συμμετρίας και κορυφογραμμών (ridges) σε εικόνες, από μια νέα σκοπιά, χρησιμοποιώντας επιβλεπόμενη μάθηση (supervised learning). Εφόσον δεν υπάρχει κάποιο σύνολο δεδομένων επαλήθευσης (ground truth) για κορυφογραμμές, αρχικά κατασκευάζουμε ένα για προκαταρκτική χρήση, βασιζόμενοι στο σύνολο δεδομένων κατάτμησης του Berkeley (Berkley segmentation dataset-BSDS300). Ακολουθώντας τα βήματα των Martin et al. για ανίχνευση συνόρων, χρησιμοποιούμε διαφορετικούς συνδυασμούς χαρακτηριστικών φωτεινότητας, χρώματος και υφής, τα οποία συλλέγονται σε πολλαπλές κλίμακες και κατευθύνσεις, για την εκμάθηση του ανιχνευτή κορυφογραμμών. Οι αλγόριθμοι που χρησιμοποιούμε είναι λογιστική παλινδρόμηση (logistic regression) και εκμάθηση από πολλά στιγμιότυπα (multiple instance learning), ενώ το σύνολο δεδομένων εκπαίδευσης αποτελείται από φυσικές εικόνες του BSDS300.
Για την αξιολόγηση της μεθόδου μας χρησιμοποιούμε καμπύλες ακρίβειας-επανάκλησης (precision-recall curves). Επιπρόσθετα, παρουσιάζονται ποιοτικά και ποσοτικά αποτελέσματα για τους διαφορετικούς αλγόριθμους και συνδυασμούς χαρακτηριστικών που χρησιμοποιούνται. Συγκρίνουμε επίσης τα αποτελέσματά μας με αυτά που δίνει η εφαρμογή ανίχνευσης κορυφογραμμών με χρήση της μεθόδου με αυτόματη επιλογής κλίμακας, του LIndeberg, και παρατηρούμε ότι ηπροσέγγισή μας αποδίδει καλύτερα. Τέλος, συζητούμε πιθανές εφαρμογές υψηλότερου επιπέδου όπου η μέθοδός μας θαμπορούσε να αποδειχθεί χρήσιμη ως ένα αρχικό βήμα προεργασίας.
In this diploma thesis we introduce a novel framework for detecting ridges and bilateral
symmetry in natural images using supervised learning. Since there is no existing
ground truth dataset for ridges, we begin by constructing a preliminary one
automatically, using images from the Berkeley segmentation dataset(BSDS300).
Motivated by the work of Martin et al. on boundary detection, we use different
combinations of low-level brightness, color and texture cues, collected at multiple
scales and orientations, to train a ridge classifier. The learning algorithms we consider
are logistic regression and multiple instance learning, and the training data
consist of natural images taken from the Berkeley segmentation dataset.
For the evaluation of our method we use precision-recall curves. Qualitative
and quantitative results for the various algorithms and feature combinations used
are presented. We also compare our results to those obtained by the ridge detection
with automated scale selection algorithm by Lindeberg, and we observe that
our approach performs better. Finally, we discuss possible higher-level applications
where our method could prove useful as a front-end step.