dc.contributor.author |
Φιλανδριανός, Γεώργιος
|
el |
dc.contributor.author |
Filandrianos, Georgios
|
en |
dc.date.accessioned |
2019-10-22T10:44:20Z |
|
dc.date.available |
2019-10-22T10:44:20Z |
|
dc.identifier.uri |
https://dspace.lib.ntua.gr/xmlui/handle/123456789/49338 |
|
dc.identifier.uri |
http://dx.doi.org/10.26240/heal.ntua.17036 |
|
dc.rights |
Default License |
|
dc.subject |
Data preprocessing |
en |
dc.subject |
Machine learning |
en |
dc.subject |
Deep learning |
en |
dc.subject |
Music composition |
en |
dc.subject |
Recurrent neural networks |
en |
dc.subject |
Αναδρομικά νευρωνικά δίκτυα |
el |
dc.subject |
Αυτόματη σύνθεση μουσικής |
el |
dc.subject |
Βαθιά μάθηση |
el |
dc.subject |
Μηχανική μάθηση |
el |
dc.subject |
Προεπεξεργασία δεδομέμων |
el |
dc.title |
Αυτόματη σύνθεση μουσικής σε συμβολική μορφή με αναδρομικά νευρωνικά δίκτυα |
el |
heal.type |
bachelorThesis |
|
heal.classification |
Μηχανική μάθηση |
el |
heal.classification |
Αυτόματη σύνθεση μουσικής |
el |
heal.classification |
Νευρωνικά δίκτυα |
el |
heal.classification |
Machine learning |
en |
heal.classification |
Deep learning |
en |
heal.language |
el |
|
heal.access |
free |
|
heal.recordProvider |
ntua |
el |
heal.publicationDate |
2019-07-16 |
|
heal.abstract |
Η Αυτόματη Σύνθεση Μουσικής αποτελεί ίσως ένα από τα πλέον κομβικά αλλά και δύσκολα έργα στον τομέα της ανακατασκευής πληροφορίας. Για τους ειδικούς αποτελεί το αποδοτικότερο μέσο επικοινωνίας τους ενώ για τους υπολοίπους χρήστες είναι ένα από τα καλύτερα μέσα έκφρασης των συναισθημάτων τους.
Παρόλα αυτά η σύνθεση νέων και ενδιαφέροντών κομματιών είναι μια διεργασία η όποια απαιτεί βαθιά γνώση, εμπειρία και εξειδίκευση. Αντίστοιχη δυσκολία συναντάται και στους υπολογιστές όπου, παρόλες τις προσπάθειες, έχει αποδειχθεί μια εργασία ιδιαίτερα απαιτητική η όποια έχει γνωρίσει ως την ώρα επιτυχία μόνο σε μερικές κατηγορίες ακουσμάτων.
Όπως και με τα περισσότερα έργα ανάκτησης και ανακατασκευής πληροφορίας στον τομέα της μουσικής, έτσι και τα συστήματα αυτόματης σύνθεσης που κατασκευάστηκαν στα πλαίσια αυτής της διατριβής ακολουθούν την τάση να αντικαθιστούν τα στάδια επεξεργασίας σήματος και εξαγωγής χαρακτηριστικών από στατιστικά μοντέλα με αρχιτεκτονικές βαθιάς μηχανικής μάθησης. Για τον λόγο αυτόν στην παρούσα εργασία επιλέχθηκε ο παραδοσιακός δρόμος όσο αναφορά την αναπαράσταση της μουσικής, ο οποίος είναι η κωδικοποίησή της σε ακολουθιακή μορφή και συγκεκριμένα η κωδικοποίησή της με το πρωτόκολλο Midi.
Για το πειραματικό μέρος της εργασίας εκπαιδεύτηκαν διαφορετικές αρχιτεκτονικές νευρωνικών δικτύων με σκοπό δοσμένης μιας αρχικής μελωδίας να συνθέτουν κάποια πρωτότυπη συνέχειά της. Συγκεκριμένα χρησιμοποιήθηκαν: ένα Αναδρομικό Νευρωνικό Δίκτυο Βαθιάς Μακροπρόθεσμής Μνήμης (LSTM) με Πολλαπλά επίπεδα, μια αρχιτεκτονική Κωδικοποιητή- Αποκωδικοποιητή (LSTM Encoder- Decoder) καθώς και μια Αρχιτεκτονική Κωδικοποιητή- Αποκωδικοποιητή με Συγκέντρωση (LSTM Encoder- Decoder with Attention).
Παράλληλα με την αρχιτεκτονική άλλαζε και το σύνολό εκπαίδευσης όπου χρησιμοποιήθηκαν σύνολα: πιάνου, κιθάρας καθώς και συνδυασμοί αλλά και παραλλαγές αυτών. Τέλος στα παραπάνω δίκτυα αλλάχθηκαν και ορισμένες υπερπαράμετροι τους όπως: το μέγεθος της μνήμης του LSTM και η μέθοδος πρόβλεψης, με σκοπό μα διερευνηθεί ο ρόλος και η επίδρασή τους στις παραγόμενες συνθέσεις. |
el |
heal.advisorName |
Στάμου, Γεώργιος |
el |
heal.committeeMemberName |
Στάμου, Γεώγιος |
el |
heal.committeeMemberName |
Σταφυλοπάτης, Ανδρέας- Γεώργιος |
el |
heal.committeeMemberName |
Φωτάκης, Δημήτριος |
el |
heal.academicPublisher |
Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών |
el |
heal.academicPublisherID |
ntua |
|
heal.numberOfPages |
87 σ. |
|
heal.fullTextAvailability |
true |
|