dc.contributor.author | Στάης, Άγγελος | el |
dc.contributor.author | Stais, Angelos | en |
dc.date.accessioned | 2023-05-12T08:34:18Z | |
dc.date.available | 2023-05-12T08:34:18Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/57687 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.25384 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Βαθιά Μάθηση | el |
dc.subject | Βαθιά Νευρωνικά Δίκτυα | el |
dc.subject | Μουσική | el |
dc.subject | Σύνθεση Μουσικής | el |
dc.subject | Πιάνο | el |
dc.subject | Deep Learning | en |
dc.subject | Deep Neural Networks | en |
dc.subject | Music | en |
dc.subject | Music Generation | en |
dc.subject | Piano | en |
dc.title | Piano music generation with deep learning transformer models | en |
heal.type | bachelorThesis | |
heal.classification | Μηχανική Μάθηση | el |
heal.classification | Βαθιά Μάθηση | el |
heal.classification | Μουσική | el |
heal.classification | Σύνθεση Μουσικής | el |
heal.classification | Machine Learning | en |
heal.classification | Deep Learning | en |
heal.classification | Music | en |
heal.classification | Music Generation | en |
heal.language | el | |
heal.language | en | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2023-03-13 | |
heal.abstract | William Wordsworth famously wrote in "The Solitary Reaper": "The music in my heart I bore, long after it was heard no more". The emotional impact of music, particularly piano music, has transcended cultural barriers and touched people from all walks of life for centuries. In recent years, the composition of music with the assistance of artificial intelligence has become a notable area of interest that has garnered significant attention. Among multiple deep learning models proposed, the Transformer has been a prominent approach for generating longer piano performances. This thesis delves into the capabilities of symbolic piano music generation with two noteworthy Transformer models, Music Transformer and Perceiver-AR. We explore training these models in six different datasets of various sizes and musical genres, generate large-scale number of outputs for each trained model and evaluate them objectively and subjectively. We investigate the impact of training datasets, model types and trained models on the music generation process. We also examine the correlations of objective and subjective evaluation metrics and propose a set of primary subjective quality indicators for music generated by artificial intelligence models. Finally, we suggest possible improvements and areas for future research. | en |
heal.abstract | Ο William Wordsworth έγραψε στο "The Solitary Reaper": "Τη μουσική στη καρδιά μου την έφερνα, πολύ μετά που δεν ακουγόταν πια". Ο συναισθηματικός αντίκτυπος της μουσικής, ιδίως της μουσικής για πιάνο, ξεπερνά τα πολιτισμικά σύνορα και αγγίζει ανθρώπους από όλα τα μονοπάτια της ζωής εδώ και αιώνες. Τα τελευταία χρόνια, η σύνθεση μουσικής με τη βοήθεια της τεχνητής νοημοσύνης έχει αναδυθεί ως επιστημονικός τομέας έχοντας συγκεντρώσει σημαντική προσοχή. Μεταξύ των πολλαπλών μοντέλων βαθιάς μάθησης που προτείνονται, το Transformer αποτελεί μια εξέχουσα αρχιτεκτονική για τη δημιουργία μεγαλύτερης διάρκειας συνθέσεων πιάνου. Η παρούσα εργασία εμβαθύνει στις δυνατότητες σύνθεσης συμβολικής μουσικής για πιάνο με δύο αξιοσημείωτα μοντέλα Transformer, το Music Transformer και το Perceiver-AR. Διερευνούμε την εκπαίδευση αυτών των μοντέλων σε έξι διαφορετικά σύνολα δεδομένων διαφόρων μεγεθών και μουσικών ειδών, παράγουμε ένα μεγάλο αριθμό συνθέσεων για κάθε εκπαιδευμένο μοντέλο και τα αξιολογούμε αντικειμενικά και υποκειμενικά. Εξετάζουμε την επίδραση των συνόλων δεδομένων, των ειδών μοντέλων και των συγκεκριμένων εκπαιδευμένων μοντέλων στη διαδικασία σύνθεσης μουσικής. Υπολογίζουμε επίσης τις συσχετίσεις των αντικειμενικών και υποκειμενικών μετρικών αξιολόγησης και προτείνουμε ένα σύνολο πρωταρχικών υποκειμενικών δεικτών ποιότητας για τη παραγόμενη μουσική από μοντέλα τεχνητής νοημοσύνης. Τέλος, συζητάμε για πιθανές βελτιώσεις και πεδία μελλοντικής έρευνας. | el |
heal.advisorName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας- Γεώργιος | el |
heal.committeeMemberName | Βουλόδημος, Αθανάσιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 130 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: