HEAL DSpace

Αυτόματη μετάφραση μουσικής με χρήση νευρωνικών δικτύων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αποστολίδης, Παναγιώτης el
dc.contributor.author Apostolidis, Panagiotis en
dc.date.accessioned 2021-12-17T08:26:43Z
dc.date.available 2021-12-17T08:26:43Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/54183
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.21881
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject Βαθιά μάθηση el
dc.subject Παραγωγικά αντιπαραθετικά δίκτυα el
dc.subject Αχιτεκτονική κωδικοποιητή - αποκωδικοποιητή el
dc.subject Τεχνητά Νευρωνικά Δίκτυα el
dc.subject Μουσικά όργανα el
dc.subject Artificial Neural Networks en
dc.subject Deep earning en
dc.subject Generative adversarial networks en
dc.subject Encoder-Decoder architecture en
dc.subject Musical instruments en
dc.title Αυτόματη μετάφραση μουσικής με χρήση νευρωνικών δικτύων el
dc.title Music Translation with Neural Networks en
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.classification Νευρωνικά Δίκτυα el
heal.classification Neural Networks en
heal.classification Ανάκτηση Μουσικής Πληροφορίας el
heal.classification Machine Learning el
heal.classification Music Information Retrieval el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2021-10-27
heal.abstract Η Αυτόματη Σύνθεση Μουσικής αποτελεί ένα από τα πλέον κομβικά, αλλά και δύσκολα έργα στον τομέα της ανάκτησης μουσικής πληροφορίας. Ειδικότερα, η Αυτόματη Μετάφραση Μουσικής, η οποία υπάγεται στο πρόβλημα της Αυτόματης Σύνθεσης Μουσικής, παρουσιάζει αρκετό ενδιαφέρον, καθώς είναι ένα έργο που δεν έχει διερευνηθεί ακόμα σε ικανοποιητικό βαθμό. Ως όρος μπορεί να ερμηνευθεί με δύο διαφορετικούς τρόπους: Ως μετάφραση από ένα είδος μουσικής σε κάποιο άλλο (π.χ. από κλασική μουσική σε Τζαζ), ή ως μετάφραση μουσικής από ένα μουσικό όργανο ή μια ομάδα οργάνων σε κάποιο άλλο μουσικό όργανο. Στην παρούσα διπλωματική εργασία θα μελετήσουμε τη δεύτερη ερμηνεία, δηλαδή την αυτόματη μετάφραση μουσικής από ένα μουσικό όργανο σε κάποιο άλλο. Κατά μια έννοια, η μεταφορά μουσικής μπορεί να θεωρηθεί ως το μουσικό αντίστοιχο της μετάφρασης ενός λογοτεχνικού έργου. Οι διάφορες φωνές και τα όργανα αποτελούν την "γλώσσα", με την οποία ο συνθέτης εξωτερικεύει τις σκέψεις και τα συναισθήματα του. Συνεπώς, σκοπός της μεταφοράς μουσικής είναι να γίνει κατανοητό ένα μουσικό έργο σε κάποια διαφορετική "γλώσσα". Από την πλευρά του συνθέτη η διαδικασία αυτή απαιτεί ένα είδος προσαρμογής/διασκευής της αρχικής σύνθεσης, ώστε να ταιριάζει στο νέο μέσο, δηλαδή στα μουσικά όργανα απ' τα οποία θα εκτελεστεί. Για το λόγο αυτό, του δίνεται η ελευθερία να διαφοροποιήσει την εναρμόνιση των φωνών, την ενορχήστρωση, αλλά και την ανάπτυξη του μουσικού θέματος σε σχέση με την πρωτότυπη μουσική σύνθεση. Από την πλευρά των υπολογιστών, η Αυτόματη Μετάφραση Μουσικής αποτελεί ένα εξίσου απαιτητικό πρόβλημα. Τα τελευταία χρόνια, με την ανάπτυξη νέων βαθιών νευρωνικών δικτύων και τεχνικών εκπαίδευσης, έχουν αναπτυχθεί ορισμένα μοντέλα με υποσχόμενα αποτελέσματα. Τα χαρακτηριστικότερα εξ’ αυτών αποτελούν το “ A Universal Music Translation Network” και το “MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis”. Στο πειραματικό μέρος της εργασίας δημιουργήθηκε και εκπαιδεύθηκε ένα μοντέλο που προέκυψε από έναν συνδυασμό των προαναφερθέντων δικτύων. Ως σύνολο δεδομένων χρησιμοποιήθηκε το MusicNet και πιο συγκεκριμένα όσα δεδομένα του συνόλου αυτού αποτελούν μουσικές συνθέσεις του Μπετόβεν για πιάνο el
heal.abstract Automatic Music Generation is one of the most crucial, but also demanding tasks in the field of Music Information Retrieval. More specifically, Automatic Music Translation is a promising sub-task of Automatic Music Generation that has not yet been developed to a satisfactory level. The term of Music Translation can be interpreted either as a Music Transfer from one music genre to another, or as a Music Transfer from one set of musical instruments to another. In this project we will delve into the second interpretation, meaning the task of translating music from one set of musical instruments to another. In a sense, the art of Music Arrangement can be considered as the equivalent of the translation of a literary piece. Composers use voices and instruments as their “language”, in order to communicate their emotions to the rest of the world. Thus, the purpose of arrangement is to make that which was written in one musical language intelligible in another. On the composer’s side, this procedure requires some sort of adaptation of the original piece so as to fit in the new medium, meaning the musical instruments for which it is arranged. Hence, the composer is given the freedom to modify the voicings and harmonization, as well as the development of the musical theme, compared to the original. On the other hand, the task of Automatic Translation is equally challenging for computers. However, there has been great progress in the past years, due to the growth of new deep neural networks and training methods. As a result, certain Machine Learning models with promising results have been introduced. Two of the most noteworthy networks are “A Universal Music Translation Network” and “MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis”. For the experimental part of this thesis, a model combining the aforementioned networks has been created and trained. The Dataset “MusicNet” was selected for the training of the model. More precisely, the network was trained only using MusicNet data that are included in the domain “Beethoven Solo Piano”. en
heal.advisorName Στάμου, Γεώργιος el
heal.committeeMemberName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 80 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα