HEAL DSpace

Αυτόματη προσθήκη επισημάνσεων για πρόσωπα και αντικείμενα σε πολυμεσικό περιεχόμενο

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Μαρινέλλης, Γεώργιος el
dc.contributor.author Marinellis, Georgios en
dc.date.accessioned 2019-03-07T11:15:30Z
dc.date.available 2019-03-07T11:15:30Z
dc.date.issued 2019-03-07
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/48395
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.16115
dc.rights Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-sa/3.0/gr/ *
dc.subject Μηχανική μάθηση el
dc.subject Νευρωνικά δίκτυα el
dc.subject Αναγνώριση προσώπου el
dc.subject Ανίχνευση αντικειμένου el
dc.subject Machine learning en
dc.subject Convolutional neural networks en
dc.subject Object detection en
dc.subject Face detection en
dc.subject Face recognition en
dc.title Αυτόματη προσθήκη επισημάνσεων για πρόσωπα και αντικείμενα σε πολυμεσικό περιεχόμενο el
dc.title Automatic extraction of annotations for faces and objects from multimedia content en
heal.type bachelorThesis
heal.classification Αντίληψη και όραση υπολογιστών el
heal.classificationURI http://data.seab.gr/concepts/12c1c913dbe758d67c4c509a6768bdbc7905830c
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2018-10-17
heal.abstract Στις μέρες μας, ο όλο και μεγαλύτερος όγκος πολυμεσικών δεδομένων που δημιουργείται καθιστά τα δεδομένα μη διαχειρίσιμα και αναξιοποίητα. Εμφανίζεται έτσι η ανάγκη της επισή μανσης και ταξινόμησης του πολυμεσικού αυτού περιεχομένου για την καλύτερη αξιοποίησή του τόσο από απλούς χρήστες όσο και από άλλους επαγγελματικούς κλάδους. Η προσθήκη αυτόματων επισημάνσεων στο περιεχόμενο είναι κάτι παραπάνω από απαραίτητη καθώς ,όπως είπαμε, ο όγκος των δεδομένων δε αφήνει χώρο και χρόνο για χειροκίνητες προσθήκες. Στα πλαίσια της συγκεκριμένης εργασίας, επιλέξαμε να παράγουμε αυτόματες επισημάνσεις χρησιμοποιώντας αλγορίθμους του κλάδου της όρασης των υπολογιστών. Πιο συγκεκριμένα υλοποιήθηκε μια εφαρμογή η οποία πραγματοποιεί ανίχνευση και αναγνώριση προσώπων και αντικειμένων. Στο κείμενό παρουσιάζουμε όλες τις σύγχρονες μεθόδους για την ανίχνευση και αναγνώριση προσώπων και αντικειμένων, αναλύουμε τα πλεονεκτήματα και τα μειονεκτήματα της καθεμίας καθώς και τους λόγους που επιλέξαμε να χρησιμοποιήσουμε συγκεκριμένες από αυτές. Χρησιμοποιούμε επίσης και μια παραλλαγή της μεθόδου Local Binary Patterns Histogram για την αναγνώριση προσώπων η οποία σχεδιάστηκε και τροποποιήθηκε από εμάς. Στο τέλος γίνεται μια αποτίμηση της παραλλαγμένης αυτής μεθόδου χρησιμοποιώντας κατάλληλες μετρικές πάνω σε εικόνες από τις βάσεις εικόνων προσώπων AT&T Facedatabe, Yale Facedatabase A, Extended Yale Facedatabase B και MyLucce Facedatabase. Οι εικόνες για την τελευταία βάση συλλέχθηκαν από εμάς. Τα αποτελέσματα που συλλέξαμε παρουσιάζουν ενδιαφέρον και δίνουν μια συνολικότερη αντίληψη πάνω στο γενικότερο πρόβλημα της αναγνώρισης προσώπων. el
heal.abstract Nowadays, the continuously growing amount of multimedia data makes them unmanagable and useless. Shows up thus the need to mark and classify this multimedia content for better use by both simple and professional users. The extraction of automatic annotations though from this content is an essential process because the volume of data is such that there is no space to add manual annotations. In the context of this thesis, we decided to extract automatic annotations using computer vision algorithms. More specifically, we implemented an application which performs face and object detection and recognition. In the following text we present all the state-of-the art methods for face and object detection and recognition, we analyse each method's pros and cons and we explain the reasons we choosed to use the particular ones. We also use a modified version of the Local Binary Patterns Histogram method for face recognition. Finally, we perform an evaluation of the modified method using well known face databases such as AT&T Facedatabase, Yale Facedabase A, Extended Yale Facedatabase B and MyLucce Facedatabase. The last one was created by us. The results are promising and provide a complete overview over the general problem of face recognition. en
heal.advisorName Παπαβασιλείου, Συμεών el
heal.committeeMemberName Ρουσσάκη, Ιωάννα el
heal.committeeMemberName Βαρβαρίγου, Θεοδώρα el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής. Εργαστήριο Διαχείρισης και Βέλτιστου Σχεδιασμού Δικτύων el
heal.academicPublisherID ntua
heal.numberOfPages 69 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού - Μη Εμπορική Χρήση - Παρόμοια Διανομή 3.0 Ελλάδα