Η παρούσα διπλωματική συνιστά μία μελέτη ενός πολύ σημαντικού προβλήματος στο χώρο της ψηφιακής επεξεργασίας μουσικών συνθέσεων. Συγκεκριμένα στην παρούσα διπλωματική μελετάται η αυτόματη ταυτοποίηση μιας μουσικής σύνθεσης ανεξαρτήτως του εκτελεστή και του μουσικού οργάνου εκτέλεσης. Κατά τη διάρκεια της μελέτης αυτής διαπιστώθηκε ότι η απεικόνιση, τόσο στο πεδίο της συχνότητας όσο και στο πεδίο του χρόνου, μιας μουσικής σύνθεσης παιγμένης από διαφορετικούς εκτελεστές κατά κανόνα εμφανίζει πολύ σημαντικές διαφορές.
Εντούτοις, ο ακροατής συνήθως αναγνωρίζει και ταυτοποιεί τη μουσική σύνθεση ανεξαρτήτως εκτελεστή και οργάνου εκτέλεσης. Αυτό το γεγονός σημαίνει ότι υπάρχει ένας πυρήνας σε όλες τις διαφορετικές εκτελέσεις μιας μουσικής σύνθεσης, ο οποίος παραμένει αναλλοίωτος μετά την υποσυνείδητη επεξεργασία που υφίσταται στον ανθρώπινο εγκέφαλο. Αυτός ο πυρήνας εκτιμούμε ότι πρέπει να έχει μαθηματική υπόσταση είτε στο πεδίο του χρόνου είτε στο πεδίο της συχνότητας. Η παρούσα διπλωματική επιθυμεί να συμβάλλει στον εντοπισμό αυτού του πυρήνα. Ειδικότερα, σε αυτή την εργασία εφαρμόστηκαν τεχνικές που σχετίζονται με το συχνοτικό περιεχόμενο μιας μουσικής σύνθεσης και εντοπίστηκαν κριτήρια ομοιότητας μεταξύ συνθέσεων παιγμένων από συμφωνική ορχήστρα αφενός και από σόλο όργανα αφετέρου. Οι τεχνικές αυτές περιελάμβαναν α) εντοπισμό των σημαντικότερων κορυφών του φάσματος κάθε μουσικής σύνθεσης, β) κατάλληλη σταχυολόγηση των κορυφών με χρήση της διαδικασίας masking, γ) κατάταξη των κορυφών που τελικά επελέγησαν σε ειδικά επιλεγμένα διαστήματα που προσομοιάζουν τη μουσική εκθετική κλίμακα, δ) πολλαπλή εφαρμογή της διαδικασίας μετά από ομοιοθεσία στη συχνότητα, ε) μερικές νέες πρωτοποριακές τεχνικές. Η προσέγγιση εφαρμόστηκε σε τρεις κλασικές μουσικές συνθέσεις και τα αποτελέσματα κρίνονται ιδιαιτέρως ενθαρρυντικά.
The present dissertation deals with the study of the automatic identification of a musical composition, independently of the performer and the instruments used for the performance. The study manifested that there are substantial differences between two performances of the same musical composition, both in the time and the frequency domain.
However, as a rule, a listener identifies a musical composition independently of the performer and the employed instruments. This fact suggests that there is a common kernel in all different performances of a musical composition that listeners recognize as the same one. This kernel must reflect on the time and on the frequency domain. The purpose of the present work is to contribute towards the understanding of the various mathematical characteristics that may form this kernel. More specifically, a number of algorithms and related techniques have been tested and/or developed associated with:
a) the determination of the dominant peaks in the spectrum of a musical composition
b) further selection of the dominant peaks by application of a proper masking procedure
c) classification of the selected peaks in proper intervals that simulate the exponential music scale
d) multiple application of the previous steps after “stretching”, i.e. after scaling in the frequency domain
e) a number of novel approaches associated with the octave, the masking procedure and the number of selected peaks
Using the aforementioned techniques and algorithms, proper criteria have been developed for the determination of similarities between musical composition performed by an orchestra in one hand and by two solo instruments on the other.
The methodology has been applied in three distinct classical compositions offering statistically satisfactory and promising results.