dc.contributor.author | Αποστολίδης, Παναγιώτης | el |
dc.contributor.author | Apostolidis, Panagiotis | en |
dc.date.accessioned | 2021-12-17T08:26:43Z | |
dc.date.available | 2021-12-17T08:26:43Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/54183 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.21881 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc/3.0/gr/ | * |
dc.subject | Βαθιά μάθηση | el |
dc.subject | Παραγωγικά αντιπαραθετικά δίκτυα | el |
dc.subject | Αχιτεκτονική κωδικοποιητή - αποκωδικοποιητή | el |
dc.subject | Τεχνητά Νευρωνικά Δίκτυα | el |
dc.subject | Μουσικά όργανα | el |
dc.subject | Artificial Neural Networks | en |
dc.subject | Deep earning | en |
dc.subject | Generative adversarial networks | en |
dc.subject | Encoder-Decoder architecture | en |
dc.subject | Musical instruments | en |
dc.title | Αυτόματη μετάφραση μουσικής με χρήση νευρωνικών δικτύων | el |
dc.title | Music Translation with Neural Networks | en |
heal.type | bachelorThesis | |
heal.classification | Μηχανική Μάθηση | el |
heal.classification | Νευρωνικά Δίκτυα | el |
heal.classification | Neural Networks | en |
heal.classification | Ανάκτηση Μουσικής Πληροφορίας | el |
heal.classification | Machine Learning | el |
heal.classification | Music Information Retrieval | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2021-10-27 | |
heal.abstract | Η Αυτόματη Σύνθεση Μουσικής αποτελεί ένα από τα πλέον κομβικά, αλλά και δύσκολα έργα στον τομέα της ανάκτησης μουσικής πληροφορίας. Ειδικότερα, η Αυτόματη Μετάφραση Μουσικής, η οποία υπάγεται στο πρόβλημα της Αυτόματης Σύνθεσης Μουσικής, παρουσιάζει αρκετό ενδιαφέρον, καθώς είναι ένα έργο που δεν έχει διερευνηθεί ακόμα σε ικανοποιητικό βαθμό. Ως όρος μπορεί να ερμηνευθεί με δύο διαφορετικούς τρόπους: Ως μετάφραση από ένα είδος μουσικής σε κάποιο άλλο (π.χ. από κλασική μουσική σε Τζαζ), ή ως μετάφραση μουσικής από ένα μουσικό όργανο ή μια ομάδα οργάνων σε κάποιο άλλο μουσικό όργανο. Στην παρούσα διπλωματική εργασία θα μελετήσουμε τη δεύτερη ερμηνεία, δηλαδή την αυτόματη μετάφραση μουσικής από ένα μουσικό όργανο σε κάποιο άλλο. Κατά μια έννοια, η μεταφορά μουσικής μπορεί να θεωρηθεί ως το μουσικό αντίστοιχο της μετάφρασης ενός λογοτεχνικού έργου. Οι διάφορες φωνές και τα όργανα αποτελούν την "γλώσσα", με την οποία ο συνθέτης εξωτερικεύει τις σκέψεις και τα συναισθήματα του. Συνεπώς, σκοπός της μεταφοράς μουσικής είναι να γίνει κατανοητό ένα μουσικό έργο σε κάποια διαφορετική "γλώσσα". Από την πλευρά του συνθέτη η διαδικασία αυτή απαιτεί ένα είδος προσαρμογής/διασκευής της αρχικής σύνθεσης, ώστε να ταιριάζει στο νέο μέσο, δηλαδή στα μουσικά όργανα απ' τα οποία θα εκτελεστεί. Για το λόγο αυτό, του δίνεται η ελευθερία να διαφοροποιήσει την εναρμόνιση των φωνών, την ενορχήστρωση, αλλά και την ανάπτυξη του μουσικού θέματος σε σχέση με την πρωτότυπη μουσική σύνθεση. Από την πλευρά των υπολογιστών, η Αυτόματη Μετάφραση Μουσικής αποτελεί ένα εξίσου απαιτητικό πρόβλημα. Τα τελευταία χρόνια, με την ανάπτυξη νέων βαθιών νευρωνικών δικτύων και τεχνικών εκπαίδευσης, έχουν αναπτυχθεί ορισμένα μοντέλα με υποσχόμενα αποτελέσματα. Τα χαρακτηριστικότερα εξ’ αυτών αποτελούν το “ A Universal Music Translation Network” και το “MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis”. Στο πειραματικό μέρος της εργασίας δημιουργήθηκε και εκπαιδεύθηκε ένα μοντέλο που προέκυψε από έναν συνδυασμό των προαναφερθέντων δικτύων. Ως σύνολο δεδομένων χρησιμοποιήθηκε το MusicNet και πιο συγκεκριμένα όσα δεδομένα του συνόλου αυτού αποτελούν μουσικές συνθέσεις του Μπετόβεν για πιάνο | el |
heal.abstract | Automatic Music Generation is one of the most crucial, but also demanding tasks in the field of Music Information Retrieval. More specifically, Automatic Music Translation is a promising sub-task of Automatic Music Generation that has not yet been developed to a satisfactory level. The term of Music Translation can be interpreted either as a Music Transfer from one music genre to another, or as a Music Transfer from one set of musical instruments to another. In this project we will delve into the second interpretation, meaning the task of translating music from one set of musical instruments to another. In a sense, the art of Music Arrangement can be considered as the equivalent of the translation of a literary piece. Composers use voices and instruments as their “language”, in order to communicate their emotions to the rest of the world. Thus, the purpose of arrangement is to make that which was written in one musical language intelligible in another. On the composer’s side, this procedure requires some sort of adaptation of the original piece so as to fit in the new medium, meaning the musical instruments for which it is arranged. Hence, the composer is given the freedom to modify the voicings and harmonization, as well as the development of the musical theme, compared to the original. On the other hand, the task of Automatic Translation is equally challenging for computers. However, there has been great progress in the past years, due to the growth of new deep neural networks and training methods. As a result, certain Machine Learning models with promising results have been introduced. Two of the most noteworthy networks are “A Universal Music Translation Network” and “MelGAN: Generative Adversarial Networks for Conditional Waveform Synthesis”. For the experimental part of this thesis, a model combining the aforementioned networks has been created and trained. The Dataset “MusicNet” was selected for the training of the model. More precisely, the network was trained only using MusicNet data that are included in the domain “Beethoven Solo Piano”. | en |
heal.advisorName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 80 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: