dc.contributor.author | Μαρινέλλης, Γεώργιος | el |
dc.contributor.author | Marinellis, Georgios | en |
dc.date.accessioned | 2019-03-07T11:15:30Z | |
dc.date.available | 2019-03-07T11:15:30Z | |
dc.date.issued | 2019-03-07 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/48395 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.16115 | |
dc.rights | Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-sa/3.0/gr/ | * |
dc.subject | Μηχανική μάθηση | el |
dc.subject | Νευρωνικά δίκτυα | el |
dc.subject | Αναγνώριση προσώπου | el |
dc.subject | Ανίχνευση αντικειμένου | el |
dc.subject | Machine learning | en |
dc.subject | Convolutional neural networks | en |
dc.subject | Object detection | en |
dc.subject | Face detection | en |
dc.subject | Face recognition | en |
dc.title | Αυτόματη προσθήκη επισημάνσεων για πρόσωπα και αντικείμενα σε πολυμεσικό περιεχόμενο | el |
dc.title | Automatic extraction of annotations for faces and objects from multimedia content | en |
heal.type | bachelorThesis | |
heal.classification | Αντίληψη και όραση υπολογιστών | el |
heal.classificationURI | http://data.seab.gr/concepts/12c1c913dbe758d67c4c509a6768bdbc7905830c | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2018-10-17 | |
heal.abstract | Στις μέρες μας, ο όλο και μεγαλύτερος όγκος πολυμεσικών δεδομένων που δημιουργείται καθιστά τα δεδομένα μη διαχειρίσιμα και αναξιοποίητα. Εμφανίζεται έτσι η ανάγκη της επισή μανσης και ταξινόμησης του πολυμεσικού αυτού περιεχομένου για την καλύτερη αξιοποίησή του τόσο από απλούς χρήστες όσο και από άλλους επαγγελματικούς κλάδους. Η προσθήκη αυτόματων επισημάνσεων στο περιεχόμενο είναι κάτι παραπάνω από απαραίτητη καθώς ,όπως είπαμε, ο όγκος των δεδομένων δε αφήνει χώρο και χρόνο για χειροκίνητες προσθήκες. Στα πλαίσια της συγκεκριμένης εργασίας, επιλέξαμε να παράγουμε αυτόματες επισημάνσεις χρησιμοποιώντας αλγορίθμους του κλάδου της όρασης των υπολογιστών. Πιο συγκεκριμένα υλοποιήθηκε μια εφαρμογή η οποία πραγματοποιεί ανίχνευση και αναγνώριση προσώπων και αντικειμένων. Στο κείμενό παρουσιάζουμε όλες τις σύγχρονες μεθόδους για την ανίχνευση και αναγνώριση προσώπων και αντικειμένων, αναλύουμε τα πλεονεκτήματα και τα μειονεκτήματα της καθεμίας καθώς και τους λόγους που επιλέξαμε να χρησιμοποιήσουμε συγκεκριμένες από αυτές. Χρησιμοποιούμε επίσης και μια παραλλαγή της μεθόδου Local Binary Patterns Histogram για την αναγνώριση προσώπων η οποία σχεδιάστηκε και τροποποιήθηκε από εμάς. Στο τέλος γίνεται μια αποτίμηση της παραλλαγμένης αυτής μεθόδου χρησιμοποιώντας κατάλληλες μετρικές πάνω σε εικόνες από τις βάσεις εικόνων προσώπων AT&T Facedatabe, Yale Facedatabase A, Extended Yale Facedatabase B και MyLucce Facedatabase. Οι εικόνες για την τελευταία βάση συλλέχθηκαν από εμάς. Τα αποτελέσματα που συλλέξαμε παρουσιάζουν ενδιαφέρον και δίνουν μια συνολικότερη αντίληψη πάνω στο γενικότερο πρόβλημα της αναγνώρισης προσώπων. | el |
heal.abstract | Nowadays, the continuously growing amount of multimedia data makes them unmanagable and useless. Shows up thus the need to mark and classify this multimedia content for better use by both simple and professional users. The extraction of automatic annotations though from this content is an essential process because the volume of data is such that there is no space to add manual annotations. In the context of this thesis, we decided to extract automatic annotations using computer vision algorithms. More specifically, we implemented an application which performs face and object detection and recognition. In the following text we present all the state-of-the art methods for face and object detection and recognition, we analyse each method's pros and cons and we explain the reasons we choosed to use the particular ones. We also use a modified version of the Local Binary Patterns Histogram method for face recognition. Finally, we perform an evaluation of the modified method using well known face databases such as AT&T Facedatabase, Yale Facedabase A, Extended Yale Facedatabase B and MyLucce Facedatabase. The last one was created by us. The results are promising and provide a complete overview over the general problem of face recognition. | en |
heal.advisorName | Παπαβασιλείου, Συμεών | el |
heal.committeeMemberName | Ρουσσάκη, Ιωάννα | el |
heal.committeeMemberName | Βαρβαρίγου, Θεοδώρα | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής. Εργαστήριο Διαχείρισης και Βέλτιστου Σχεδιασμού Δικτύων | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 69 σ. | el |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: