HEAL DSpace

Πολυτροπική κατάτμηση ταινιών σε σκηνές

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Καραθάνου, Ολίβια el
dc.contributor.author Karathanou, Olivia en
dc.date.accessioned 2016-04-12T07:31:29Z
dc.date.available 2016-04-12T07:31:29Z
dc.date.issued 2016-04-12
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/42357
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.10824
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Κατάτμηση σε λήψεις el
dc.subject Κατάτμηση σε σκηνές el
dc.subject Αντιπροσωπευτικά καρέ el
dc.subject Διαμερισμός γράφων el
dc.subject Κριτήριο πληροφορίας Bayes el
dc.subject Shot segmentation en
dc.subject Scene segmentation el
dc.subject Key franes el
dc.subject Graph partitioning el
dc.subject Bayesian information criterion el
dc.title Πολυτροπική κατάτμηση ταινιών σε σκηνές el
heal.type bachelorThesis
heal.classification Computer vision en
heal.classificationURI http://id.loc.gov/authorities/subjects/sh85029549
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2015-07-20
heal.abstract Σκοπός της παρούσας διπλωματικής εργασίας είναι η αυτόματη κατάτμηση μιας ταινίας σε σκηνές, αξιοποιώντας την εικόνα, τον ήχο και την πληροφορία από το σενάριο της ταινίας. Πρόκειται για ένα πρόβλημα που μελετάται ευρέως και έχει ιδιαίτερο ενδιαφέρον, καθώς η κατάτμηση μιας ταινίας σε στοιχειώδεις θεματικές ενότητες αποτελεί βασικό στάδιο προεπεξεργασίας σε εφαρμογές video indexing, μη γραμμικής πλοήγησης, ταξινόμησης βίντεο κ.α. Η κατάτμηση της ταινίας σε σκηνές προϋποθέτει την κατάτμησή της σε λήψεις. Η προσέγγιση που εφαρμόζεται στο πλαίσιο της παρούσας διπλωματικής για την κατάτμηση σε λήψεις επικεντρώνεται αποκλειστικά σε χαμηλού επιπέδου χαρακτηριστικά, όπως είναι τα ιστογράμματα χρώματος και οι ακμές της εικόνας (καρέ της ταινίας). Στη συνέχεια, δοκιμάζονται υπάρχοντες αλγόριθμοι της βιβλιογραφίας για την κατάτμηση σε σκηνές, που βασίζονται είτε στην κατασκευή ενός συνεκτικού γράφου μεταβάσεων είτε στην ομαδοποίηση λήψεων με βάση τη φασματική τους ομοιότητα (Spectral Clustering). Αφού γίνει η αρχική αυτή κατάτμηση, προτείνονται τρόποι βελτίωσης του αποτελέσματος, εμπνευσμένοι από τη θεωρία πληροφορίας (Bayesian Information Criterion) ή τη γλωσσική μοντελοποίηση (Bag of Words). Στο στάδιο αυτό εισάγεται η ακουστική πληροφορία (συντελεστές MFCC) καθώς και βελτιωμένοι περιγραφητές της οπτικής πληροφορίας (GIST ή SIFT). Για την αξιοποίηση του σεναρίου, παρουσιάζεται μια μεθοδολογία για τη χρονική ευθυγράμμιση του με τους υπότιτλους, ώστε να αποδοθούν χρονικές ετικέτες σε γεγονότα και ομιλητές από το σενάριο. el
heal.abstract The aim of this diploma thesis is to deal with the problem of multi-modal movie scene segmentation. This task is widely studied and its interest lies in the fact that segmentation of a video into fundamental semantic units is an essential pre-processing stage in applications such as video indexing, non-linear browsing, classification etc. Shot segmentation is a prerequisite for scene segmentation. Our approach focuses on low-level features, such as color histograms and edges of the image (movie frames), in order to initially segment the movie into shots. Subsequently, existing algorithms, based on the construction of a connected graph or the grouping of shots using Spectral Clustering, are tested. Initial segmentation results are further refined through our proposed methods, based on the Bayesian Information Criterion and Bag of Words techniques. At this point acoustic information is also used (MFCCs) and improved descriptors of visual information (GIST or SIFT features). To exploit information from the movie script, a temporal alignment of the subtitles and the script is performed, in order to assign temporal labels to events and speakers. en
heal.advisorName Μαραγκός, Πέτρος el
heal.committeeMemberName Ποταμιάνος, Γεράσιμος el
heal.committeeMemberName Φωτεινέα, Ευίτα-Σταυρούλα el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής. Εργαστήριο Όρασης Υπολογιστών, Επικοινωνίας Λόγου και Επεξεργασίας Σημάτων el
heal.academicPublisherID ntua
heal.numberOfPages 100 σ.
heal.fullTextAvailability true


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα