dc.contributor.author | Νικόπουλος, Αλέξανδρος | el |
dc.contributor.author | Nikopoulos, Alexandros | en |
dc.date.accessioned | 2019-05-21T08:35:46Z | |
dc.date.available | 2019-05-21T08:35:46Z | |
dc.date.issued | 2019-05-21 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/48795 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.16447 | |
dc.rights | Αναφορά Δημιουργού-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Αυτόματη περίληψη κειμένου | el |
dc.subject | Νευρωνικά δίκτυα βαθιάς μάθησης | el |
dc.subject | Αρχιτεκτονική κωδικοποιητή-αποκωδικοποιητή | el |
dc.subject | Μετρήσεις Rouge | el |
dc.subject | Automatic text summarization | en |
dc.subject | Deep learning neural networks | en |
dc.subject | Encoder-decoder architecture | en |
dc.subject | Rouge package | en |
dc.title | Αυτόματη περίληψη κειμένου με χρήση νευρωνικών δικτύων βαθιάς μάθησης | el |
heal.type | bachelorThesis | |
heal.classification | Επεξεργασία φυσικής γλώσσας | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2019-03-13 | |
heal.abstract | Αυτόματη περίληψη κειμένου ονομάζεται η διαδικασία παραγωγής περίληψης με χρήση κάποιου λογισμικού, ώστε να διατηρείται το αρχικό και κύριο νόημα του κειμένου. Στην σημερινή εποχή όπου ο όγκος της πληροφορίας ολοένα και αυξάνεται, η ανάπτυξη αποτελεσματικού λογισμικού για αυτόματη περίληψη καθιστά εφικτή τη προσπέλαση μεγάλου όγκου πληροφορίας με αποδοτικό τρόπο. Για την παραγωγή νοηματικά σωστής περίληψης κειμένου, που παράλληλα θα διατηρεί ορθή σύνταξη και γραμματική, έχουν αναπτυχθεί διάφορα εργαλεία λογισμικού τα οποία βρίσκονται ακόμα υπό έρευνα. Λόγω της εγγενώς δύσκολης φύσης του προβλήματος τα εργαλεία που έχουν αναπτυχθεί έως σήμερα απέχουν αρκετά από την παραγωγή μιας ιδανικής περίληψης. Ωστόσο, η πρόσφατη έξαρση συγκεκριμένων ευφυών τεχνικών έχει επιφέρει κάποια βελτίωση στην αυτόματη παραγωγή περίληψης. Στην συγκεκριμένη διπλωματική εργασία σχεδιάζεται ένας μηχανισμός που βασίζεται σε νευρωνικά δίκτυα βαθιάς μάθησης για την αντιμετώπιση του προβλήματος της αυτόματης περίληψης κειμένου. Στα πλαίσια αυτού του μηχανισμού, διερευνώνται και συγκρίνονται μεταξύ τους διάφορες σχεδιαστικές επιλογές με στόχο την μεγιστοποίηση της επίδοσης. Πιο συγκεκριμένα, αρχικά πραγματοποιείται επεξεργασία των συνόλων δεδομένων που χρησιμοποιούνται με στόχο την ελαχιστοποίηση του θορύβου που περιέχουν. Στη συνέχεια παρουσιάζεται η αρχιτεκτονική του μηχανισμού παραγωγής της περίληψης και μελετάται ως προς τις διάφορες κρίσιμες παραμέτρους. Στα πλαίσια αντιμετώπισης της εγγενούς δυσκολίας που υπάρχει στο συγκεκριμένο πρόβλημα λόγω της αναγκαιότητας χειρισμού πολύ μεγάλου πλήθους λέξεων, παρουσιάζεται και αναλύεται ένας καινοφανής μηχανισμός αντιμετώπισης των πιθανών άγνωστων λέξεων που εμφανίζονται κατά την διαδικασία παραγωγής της περίληψης. Για την εφαρμογή και αξιολόγηση του συστήματος αυτόματης περίληψης κειμένου χρησιμοποιούνται δύο γνωστά σύνολα δεδομένων. Οι μετρήσεις επίδοσης βασίζονται στην καθιερωμένη μετρική Rouge η οποία πραγματοποιεί συγκρίσεις ομοιότητας μεταξύ των παραγόμενων και των δοσμένων περιλήψεων. Από τα πειραματικά αποτελέσματα εξάγονται χρήσιμα συμπεράσματα για τη βελτίωση της απόδοσης ενός συστήματος αυτόματης περίληψης κειμένου. Τέλος, παρουσιάζονται κάποιες μελλοντικές κατευθύνσεις για την περαιτέρω προώθηση της έρευνας. | el |
heal.abstract | Automatic text summarization refers to the process of shortening a text document with software, so that its main point and topics are preserved. Nowadays, the volume of information rapidly increases and effective pieces of software for text summarization can allow more information to be processed efficiently. Many pieces of software have been manufactured which aim to produce meaningful summariza- tions of text, while also preserving correct syntax and grammar, but they are still under research. Due to the difficult nature of the problem these pieces of software are far from being able to produce an ideal summarization. However, due to the fact that new revolutionary and intelligent techniques have recently emerged, there has been some improvement to automatic text summarization. In this thesis, a deep learning neural netowrk for automatic text summarization is designed. Within this design process, different configurations are implemented and compared, aiming to maximize per- formance. More specifically, data preprocessing procedure for noise reduction of the used datasets is described at first. After that, the summarization mechanism’s architecture is described and its perfor- mance is measured, for a set of its critical parameters. Trying to overcome the inherent problem of dealing with huge amounts of different words, a novel mechanism is introduced and analyzed, that aims to handle the uknown words that appear in the automatic summarization process. In order to evaluate the implemented text summarization mechanism correctly, two well known text summarization datasets are used. The performance metrics on these datasets are based on the well established Rouge metric for text summarization tasks. Via analyzing the best occuring results through this metric, various conclusions are extracted, aiming to improve the efficiency of text summarization systems. Finally, future directions are presented in this thesis, in an attempt to forward the research in automatic text summarization. | en |
heal.advisorName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.committeeMemberName | Τσανάκας, Παναγιώτης | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 84 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: