HEAL DSpace

Μη-γραμμική Διάχυση στην Όραση Υπολογιστών και Στατιστικά Μοντέλα Σχήματος με Εφαρμογές στην Ανάλυση Εικόνων Αρθρωτών Φωνητικού και Νοηματικού Λόγου

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.advisor Μαραγκός, Πέτρος el
dc.contributor.author Roussos, Anastasios N. en
dc.contributor.author Ρούσσος, Αναστάστιος Ν. el
dc.date.accessioned 2011-09-09T08:07:59Z
dc.date.available 2011-09-09T08:07:59Z
dc.date.copyright 2011-09-01 -
dc.date.issued 2011-09-09
dc.date.submitted 2011-09-01 -
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/4987
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.256
dc.description 122 σ. el
dc.description.abstract Στην παρούσα έρευνα, αναπτύσσονται μοντέλα Μερικών Διαφορικών Εξισώσεων τύπου Μη-γραμμικής Διάχυσης για την απλοποίηση και την βελτίωση της ποιότητας εικόνων. Χρησιμοποιούνται επίσης μεθοδολογίες Στατιστικών Μοντέλων Σχήματος για τον οπτικό εντοπισμό και αναγνώριση αντικειμένων. Οι κύριες εφαρμογές που μελετώνται αφορούν την ανάλυση οπτικών δεδομένων των αρθρωτών λόγου, σε δύο διαφορετικές μορφές του: τον φωνητικό λόγο, του οποίου οι αρθρωτές βρίσκονται στην φωνητική οδό, και τον νοηματικό λόγο, του οποίου οι αρθρωτές είναι κυρίως τα χέρια, τα χείλη και τα μάτια. Η ανάλυση τέτοιων οπτικών δεδομένων συνεισφέρει στην έρευνα και την τεχνολογία που σχετίζονται με την ομιλία και την νοηματική γλώσσα. Πιο συγκεκριμένα, σχεδιάζεται μία μέθοδος μη-γραμμικής διάχυσης για την βελτίωση της ευκρίνειας διανυσματικών εικόνων, η οποία αποδίδει αποτελέσματα υψηλής ακρίβειας, με περιορισμένα ανεπιθύμητα ψεύδεργα (artifacts). Επίσης, εισάγεται ένα θεωρητικό πλαίσιο το οποίο βασίζεται στον δομικό τανυστή της εικόνας και γενικεύει διάφορες μεταβολικές μεθόδους μη-γραμμικής διάχυσης για την αποκατάσταση εικόνων. Με βάση το πλαίσιο αυτό, προτείνονται νέες μέθοδοι διάχυσης, οι οποίες συνδυάζουν τα πλεονεκτήματα διαφόρων προηγούμενων προσεγγίσεων. Ακόμα, σχεδιάζεται ένα στατιστικό μοντέλο για την καμπύλη της γλώσσας ομιλητή, το οποίο ενσωματώνει πρότερη γνώση σχήματος και μπορεί να εκτιμήσει ολόκληρη την καμπύλη της γλώσσας σε ακολουθίες εικόνων υπερήχων. Τέλος, παρουσιάζεται μία νέα μοντελοποίηση χειρομορφών νοηματικής γλώσσας, η οποία προσφέρει μία περιγραφική και συμπαγή αναπαράσταση των διαμορφώσεων του χεριού του νοηματιστή και έχει εφαρμοστεί με επιτυχία στην ταξινόμηση χειρομορφών. Αναπτύσσεται μία διαδικασία εύρωστου ταιριάσματος του μοντέλου αυτού σε βίντεο συνεχούς νοηματισμού, ενσωματώνοντας πρότερη στατική και δυναμική πληροφορία σχετικά με τις χειρομορφές. el
dc.description.abstract In this work, Nonlinear Diffusion models for image simplification and image restoration are developed. In addition, the framework of Statistical Shape Models is used for object detection and recognition. The main applications that are studied are related to the image analysis of speech articulators, for two different speech types: voiced speech, whose articulators are located in the vocal tract, and signed speech, whose main articulators are the hands, lips and eyes. This kind of image analysis contributes to the voiced and signed speech research and technology. More precisely, we design a nonlinear diffusion method for vector-valued image interpolation, which yields accurate results with reduced artifacts. In addition, we introduce a theoretical framework that is based on the image structure tensor and generalizes several variational methods of nonlinear diffusion for image restoration. Based on this framework, we propose some new diffusion methods that combine the advantages of various existing approaches. Furthermore, we design a statistical model for the tongue contour of a speaker, model which incorporates prior shape knowledge and is able to robustly estimate the tongue contour in ultrasound image sequences. Finally, we present a new modeling of sign language handshapes, which offers a descriptive and compact representation of hand configurations and has been successfully applied on the handshape classification. We develop a robust model fitting process in continuous signing videos, by incorporating static and dynamic prior handshape information. en
dc.description.statementofresponsibility Αναστάσιος Ν. Ρούσσος el
dc.language.iso el en
dc.rights ETDFree-policy.xml en
dc.subject Όραση Υπολογιστών el
dc.subject Επεξεργασία Εικόνας el
dc.subject Μη-γραμμική Διάχυση el
dc.subject Μερικές Διαφορικές Εξισώσεις el
dc.subject Στατιστικά Μοντέλα Σχήματος el
dc.subject Αυτόματη Αναγνώριση Νοηματικής Γλώσσας el
dc.subject Αρθρωτή Σύνθεση Φωνής el
dc.subject Οπτικοακουστική Αντιστροφή Φωνής el
dc.subject Computer Vision en
dc.subject Image Processing en
dc.subject Nonlinear Diffusion en
dc.subject Partial Differential Equations en
dc.subject Statistical Shape Models en
dc.subject Automatic Sign Language Recognition en
dc.subject Articulatory Speech Synthesis en
dc.subject Audio-Visual Speech Inversion en
dc.title Μη-γραμμική Διάχυση στην Όραση Υπολογιστών και Στατιστικά Μοντέλα Σχήματος με Εφαρμογές στην Ανάλυση Εικόνων Αρθρωτών Φωνητικού και Νοηματικού Λόγου el
dc.title.alternative Nonlinear Diffusion in Computer Vision and Statistical Shape Models, with Applications in Image Analysis of Articulators of Voiced and Signed Speech en
dc.type doctoralThesis el (en)
dc.date.accepted 2010-10-06 -
dc.date.modified 2011-09-01 -
dc.contributor.advisorcommitteemember Κόλλιας, Στέφανος el
dc.contributor.advisorcommitteemember Τζαφέστας, Κωνσταντίνος el
dc.contributor.committeemember Μαραγκός, Πέτρος el
dc.contributor.committeemember Κόλλιας, Στέφανος el
dc.contributor.committeemember Τζαφέστας, Κωνσταντίνος el
dc.contributor.committeemember Γιόβα, Διδώ el
dc.contributor.committeemember Σταυρακάκης, Νικόλαος el
dc.contributor.committeemember Ποταμιάνος, Γεράσιμος el
dc.contributor.committeemember Κόκκινος, Ιάσονας el
dc.contributor.department Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών & Μηχανικών Υπολογιστών. Τομέας Σημάτων, Ελέγχου και Ρομποτικής el
dc.date.recordmanipulation.recordcreated 2011-09-09 -
dc.date.recordmanipulation.recordmodified 2011-09-09 -


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής