dc.contributor.author | Καραθάνου, Ολίβια | el |
dc.contributor.author | Karathanou, Olivia | en |
dc.date.accessioned | 2016-04-12T07:31:29Z | |
dc.date.available | 2016-04-12T07:31:29Z | |
dc.date.issued | 2016-04-12 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/42357 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.10824 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Κατάτμηση σε λήψεις | el |
dc.subject | Κατάτμηση σε σκηνές | el |
dc.subject | Αντιπροσωπευτικά καρέ | el |
dc.subject | Διαμερισμός γράφων | el |
dc.subject | Κριτήριο πληροφορίας Bayes | el |
dc.subject | Shot segmentation | en |
dc.subject | Scene segmentation | el |
dc.subject | Key franes | el |
dc.subject | Graph partitioning | el |
dc.subject | Bayesian information criterion | el |
dc.title | Πολυτροπική κατάτμηση ταινιών σε σκηνές | el |
heal.type | bachelorThesis | |
heal.classification | Computer vision | en |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh85029549 | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2015-07-20 | |
heal.abstract | Σκοπός της παρούσας διπλωματικής εργασίας είναι η αυτόματη κατάτμηση μιας ταινίας σε σκηνές, αξιοποιώντας την εικόνα, τον ήχο και την πληροφορία από το σενάριο της ταινίας. Πρόκειται για ένα πρόβλημα που μελετάται ευρέως και έχει ιδιαίτερο ενδιαφέρον, καθώς η κατάτμηση μιας ταινίας σε στοιχειώδεις θεματικές ενότητες αποτελεί βασικό στάδιο προεπεξεργασίας σε εφαρμογές video indexing, μη γραμμικής πλοήγησης, ταξινόμησης βίντεο κ.α. Η κατάτμηση της ταινίας σε σκηνές προϋποθέτει την κατάτμησή της σε λήψεις. Η προσέγγιση που εφαρμόζεται στο πλαίσιο της παρούσας διπλωματικής για την κατάτμηση σε λήψεις επικεντρώνεται αποκλειστικά σε χαμηλού επιπέδου χαρακτηριστικά, όπως είναι τα ιστογράμματα χρώματος και οι ακμές της εικόνας (καρέ της ταινίας). Στη συνέχεια, δοκιμάζονται υπάρχοντες αλγόριθμοι της βιβλιογραφίας για την κατάτμηση σε σκηνές, που βασίζονται είτε στην κατασκευή ενός συνεκτικού γράφου μεταβάσεων είτε στην ομαδοποίηση λήψεων με βάση τη φασματική τους ομοιότητα (Spectral Clustering). Αφού γίνει η αρχική αυτή κατάτμηση, προτείνονται τρόποι βελτίωσης του αποτελέσματος, εμπνευσμένοι από τη θεωρία πληροφορίας (Bayesian Information Criterion) ή τη γλωσσική μοντελοποίηση (Bag of Words). Στο στάδιο αυτό εισάγεται η ακουστική πληροφορία (συντελεστές MFCC) καθώς και βελτιωμένοι περιγραφητές της οπτικής πληροφορίας (GIST ή SIFT). Για την αξιοποίηση του σεναρίου, παρουσιάζεται μια μεθοδολογία για τη χρονική ευθυγράμμιση του με τους υπότιτλους, ώστε να αποδοθούν χρονικές ετικέτες σε γεγονότα και ομιλητές από το σενάριο. | el |
heal.abstract | The aim of this diploma thesis is to deal with the problem of multi-modal movie scene segmentation. This task is widely studied and its interest lies in the fact that segmentation of a video into fundamental semantic units is an essential pre-processing stage in applications such as video indexing, non-linear browsing, classification etc. Shot segmentation is a prerequisite for scene segmentation. Our approach focuses on low-level features, such as color histograms and edges of the image (movie frames), in order to initially segment the movie into shots. Subsequently, existing algorithms, based on the construction of a connected graph or the grouping of shots using Spectral Clustering, are tested. Initial segmentation results are further refined through our proposed methods, based on the Bayesian Information Criterion and Bag of Words techniques. At this point acoustic information is also used (MFCCs) and improved descriptors of visual information (GIST or SIFT features). To exploit information from the movie script, a temporal alignment of the subtitles and the script is performed, in order to assign temporal labels to events and speakers. | en |
heal.advisorName | Μαραγκός, Πέτρος | el |
heal.committeeMemberName | Ποταμιάνος, Γεράσιμος | el |
heal.committeeMemberName | Φωτεινέα, Ευίτα-Σταυρούλα | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής. Εργαστήριο Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 100 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: