Η διδακτορική αυτή έρευνα ασχολείται με το ϑέμα της ψηφιακής επεξεργασίας
μουσικών σημάτων και την ανάλυσή τους με υπολογιστικές μεθόδους με στόχο την
εξαγωγή χρήσιμης πληροφορίας για την αναγνώρισή τους. Συγκεκριμένα μελετάμε και
αναπτύσσουμε αποτελεσματικούς αλγορίθμους, με τη χρήση μη-γραμμικών μοντέλων,
για την επεξεργασία των σημάτων μουσικής, την κατανόηση μουσικών ϕαινομένων και τη
μοντελοποίηση τους. Εστιάζουμε στη διερεύνηση και την ανάλυση των σχέσεων μεταξύ
των μουσικών οργάνων για την κατανόηση της λειτουργίας και των χαρακτηριστικών τους.
Εξετάζουμε τα γνωρίσματα των διαφορετικών ειδών μουσικής, ενώ επιπλέον αξιολογούμε
την αποτελεσματικότητα των μη-γραμμικών μοντέλων για την ανίχνευση σημαντικών
μουσικών και γενικά ακουστικών γεγονότων.
Η ανάλυση αυτή συνεισφέρει στην έρευνα και στην τεχνολογία αιχμής που σχετίζεται
με την αυτόματη κατηγοριοποίηση μουσικής μέσω των διαφορετικών αυτών πλαισίων,
αλλά και στη δημιουργία περιλήψεων των ηχητικών σημάτων. Τέτοιες εφαρμογές στις
μέρες μας συναντώνται ευρέως σε εφαρμογές από το λογισμικό υπολογιστών έως τα
κινητά τηλέφωνα τρίτης γενιάς. Λόγω της πληθώρας των ηχητικών, μουσικών, αλλά και
πολυμεσικών δεδομένων, η χρησιμότητα της μελέτης αυτής διαφαίνεται σε εφαρμογές
όπως η αυτόματη αναζήτηση μουσικής με ϐάση το είδος, η αναγνώριση ϐασικών δομών
της μουσικής, όπως για παράδειγμα τα μουσικά όργανα, και η δημιουργία περιλήψεων.
Με ϐάση το πλαίσιο αυτό προτείνουμε νέα χαρακτηριστικά για τη μοντελοποίηση
των σημάτων μουσικής. Η πειραματική αξιολόγηση τους τεκμηριώνει τη δυναμική
των μεθόδων που ακολουθούμε καθώς τα αποτελέσματα παρουσιάζονται ιδιαίτερα
ενθαρρυντικά. Συγκεκριμένα, η έρευνα αυτή δείχνει πως τα προτεινόμενα χαρακτηριστικά
δύνανται να περιγράψουν σημαντικά ϕαινόμενα των μουσικών σημάτων όπως για
παράδειγμα τις μικρο-μεταβολές των δομών τους. Επιπλέον, αναπαραστάσεις που
ϐασίζονται στις μακροδομές των σημάτων επιφέρουν μείωση της πολυπλοκότητας του
συστήματος κατηγοριοποίησης, εφόσον ικανοποιητικά αποτελέσματα επιτυγχάνονται με
απλούστερα στατιστικά μοντέλα. Τέλος, η εισαγωγή ιδεών όπως η «μουσική» συστοιχία
ϕίλτρων επιδεικνύει ιδιαίτερη διακριτική ικανότητα στην κατηγοριοποίηση των μουσικών
σημάτων.
This thesis lays in the area of signal processing and analysis ofmusic signals using
computational methods for the extraction of effective representations for automatic
recognition. We explore and develop efficient algorithms using nonlinear methods
for the analysis of the structure of music signals, which is of importance for their
modeling. Our main research directions deals with the analysis of the structure and
the characteristics of musical instruments in order to gain insight about their function
and properties. We study the characteristics of the different genres of music. Finally,
we evaluate the effectiveness of the proposed nonlinear models for the detection of
perceptually important music and audio events.
The approach we follow contributes to state-of-the-art technologies related to
automatic computer-based recognition of musical signals and audio summarization,
which nowadays are essential in everyday life. Because of the vast amount of music,
audio and multimedia data in the web and our personal computers, the use of this
study could be shown in applications such as automatic genre classification, automatic
recognition of music’s basic structures, such as musical instruments, and audio
content analysis for music and audio summarization.
The above mentioned applications require robust solutions to information
processing problems. Toward this goal, the development of efficient digital signal
processing methods and the extraction of relevant features is of importance. In this
thesis we propose such methods and algorithms for feature extraction with interesting
results that render the descriptors of direct applicability. The proposed methods
are applied on classification experiments illustrating that they can capture important
aspects of music, such as the micro-variations of their structure. Descriptors based
on macro-structures may reduce the complexity of the classification system, since
satisfactory results can be achieved using simpler statistical models. Finally, the
introduction of a ‘‘music’’ filterbank appears to be promising for automatic genre
classification.