HEAL DSpace

Πολυ-Αισθητηριακή Ακουστική Ανάλυση Περιβάλλοντος

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Γιαννούλης, Παναγιώτης el
dc.contributor.author Giannoulis, Panagiotis en
dc.date.accessioned 2022-10-03T09:29:40Z
dc.date.available 2022-10-03T09:29:40Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/55832
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.23530
dc.rights Default License
dc.subject Εντοπισμός ακουστικών γεγονότων el
dc.subject Πολυ-καναλική επεξεργασία el
dc.subject Επικαλυπτόμενα γεγονότα el
dc.subject Εξυπνα σπίτια el
dc.subject Εντοπισμός φωνής el
dc.subject Acoustic event detection en
dc.subject Multi-channel processing en
dc.subject Overlapped acoustic events en
dc.subject Smart homes en
dc.subject Speech activity detection en
dc.title Πολυ-Αισθητηριακή Ακουστική Ανάλυση Περιβάλλοντος el
dc.contributor.department Τομέας Σημάτων, Ελέγχου και Ρομποτικής el
heal.type doctoralThesis
heal.classification Εντοπισμός Ακουστικών Γεγονότων el
heal.language en
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-11-26
heal.abstract Στη Διατριβή μας εξετάζουμε το πρόβλημα του εντοπισμού ακουστικών γεγονότων σε «έξυπνα» περιβάλλοντα με πολλαπλά μικρόφωνα. Ο εντοπισμός ακουστικών γεγονότων αποτελεί σημαντικό τμήμα του ευρύτερου πεδίου της υπολογιστικής ανάλυσης ακουστικής σκηνής, και στόχος του είναι ο αυτόματος εντοπισμός στον χρόνο και η αναγνώριση των ακουστικών γεγονότων που περιέχονται σε ένα ηχητικό στιγμιότυπο. Στην έρευνά μας εστιάζουμε στην ανάπτυξη μεθόδων για την αξιοποίηση της πληροφορίας από πολλαπλά μικρόφωνα για τον εντοπισμό γεγονότων σε απαιτητικές συνθήκες με φαινόμενα επικάλυψης. Αρχικά, δίνουμε έμφαση στο πρόβλημα του εντοπισμού της ανθρώπινης φωνής, και στα πλαίσια ενός «έξυπνου» οικιακού περιβάλλοντος με πολλαπλά δωμάτια αναπτύσσουμε ένα σύστημα χωρο-χρονικού εντοπισμού φωνής δύο σταδίων, κατάλληλο για διαλογικά συστήματα φωνητικών εντολών. Στο πρώτο στάδιο, το σύστημά μας συνδυάζει αποτελεσματικά τα σήματα από πολλαπλά μικρόφωνα για να πετύχει τον χρονικό εντοπισμό της φωνής, και στο δεύτερο, καινοτόμα πολυκαναλικά χαρακτηριστικά εξάγονται για τον χωρικό εντοπισμό της φωνής σε επίπεδο δωματίου. Το σύστημά μας επιδεικνύει εύρωστη απόδοση και συγκρίνεται ευνοϊκά με μεθόδους βαθιάς μηχανικής μάθησης. Στη συνέχεια, στο ευρύτερο πρόβλημα του εντοπισμού ακουστικών γεγονότων, δίνουμε έμφαση στο απαιτητικό σενάριο των επικαλυπτόμενων γεγονότων και πειραματιζόμαστε με μεθόδους παραγοντοποίησης μη-αρνητικών πινάκων (NMF). Στα πλαίσια αυτής της έρευνας, διερευνούμε μεθόδους για την βελτίωση του σταδίου εντοπισμού σε βασικές μεθόδους NMF, την αύξηση της αποδοτικότητας σε δύσκολες επικαλυπτόμενες συνθήκες συστημάτων NMF που συνδυάζονται με ταξινομητές, και τέλος την ανάπτυξη αποτελεσματικών πολυ-καναλικών συστημάτων NMF για προβλήματα εντοπισμού γεγονότων. Τέλος, πειραματιζόμαστε με μεθόδους βαθιάς μηχανικής μάθησης για τον εντοπισμό επικαλυπτόμενων γεγονότων σε περιπτώσεις όπου υπάρχει μεγάλη ποικιλία πιθανών κλάσεων. Σε αυτή την κατεύθυνση, προτείνουμε τον συνδυασμό και την από κοινού εκπαίδευση ενός πολυ-καναλικού νευρωνικού δικτύου διαχωρισμού γεγονότων με ένα νευρωνικό δίκτυο ταξινόμησης ακουστικών γεγονότων, πετυχαίνοντας βελτιωμένη απόδοση σε σχέση με παραδοσιακές τεχνικές. Για την αξιολόγηση των μεθόδων μας, χρησιμοποιούμε διάφορες συνθετικές και πραγματικές βάσεις δεδομένων που δημιουργήθηκαν/ηχογραφήθηκαν σε κατάλληλα πολυ-καναλικά «έξυπνα» περιβάλλοντα. el
heal.advisorName Μαραγκός, Πέτρος
heal.committeeMemberName Μαραγκός, Πέτρος
heal.committeeMemberName Ποταμιάνος, Γεράσιμος
heal.committeeMemberName Τζαφέστας, Κωνσταντίνος
heal.committeeMemberName Κόλλιας, Στέφανος
heal.committeeMemberName Τσανάκας, Παναγιώτης
heal.committeeMemberName Κατσαμάνης, Αθανάσιος
heal.committeeMemberName Φωτεινέα, Ευΐτα-Σταυρούλα
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 144 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής