HEAL DSpace

Αυτόματη Περίληψη Κειμένου με Χρήση Νευρωνικών Δικτύων Βαθιάς Μάθησης

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αλέξανδρος, Νικόπουλος el
dc.contributor.author Alexandros, Nikopoulos en
dc.date.accessioned 2020-05-07T15:46:38Z
dc.date.available 2020-05-07T15:46:38Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/50419
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.18117
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Αυτόματη Περίληψη Κειμένου el
dc.subject Νευρωνικά Δίκτυα Βαθιάς Μάθησης el
dc.subject Αρχιτεκτονική Κωδικοποιητή el
dc.subject Μετρήσεις Rouge el
dc.subject Aποκωδικοποιητής el
dc.subject Encoder-Decoder Architecture el
dc.subject Deep Learning Neural Networks el
dc.subject Automatic Text Summarization el
dc.subject Rouge package el
dc.title Αυτόματη Περίληψη Κειμένου με Χρήση Νευρωνικών Δικτύων Βαθιάς Μάθησης el
dc.title Αυτόματη Περίληψη Κειμένου με Χρήση Νευρωνικών Δικτύων Βαθιάς Μάθησης el
dc.contributor.department islab el
heal.type bachelorThesis
heal.classification Natural Languange Processing el
heal.classification Natural Languange Processing el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2019-03-13
heal.abstract Αυτόματη περίληψη κειμένου ονομάζεται η διαδικασία παραγωγής περίληψης με χρήση κάποιου λογισμικού, ώστε να διατηρείται το αρχικό και κύριο νόημα του κειμένου. Στην σημερινή εποχή όπου ο όγκος της πληροφορίας ολοένα και αυξάνεται, η ανάπτυξη αποτελεσματικού λογισμικού για αυτόματη περίληψη καθιστά εφικτή τη προσπέλαση μεγάλου όγκου πληροφορίας με αποδοτικό τρόπο. Για την παραγωγή νοηματικά σωστής περίληψης κειμένου, που παράλληλα θα διατηρεί ορθή σύνταξη και γραμματική, έχουν αναπτυχθεί διάφορα εργαλεία λογισμικού τα οποία βρίσκονται ακόμα υπό έρευνα. Λόγω της εγγενώς δύσκολης φύσης του προβλήματος τα εργαλεία που έχουν αναπτυχθεί έως σήμερα απέχουν αρκετά από την παραγωγή μιας ιδανικής περίληψης. Ωστόσο, η πρόσφατη έξαρση συγκεκριμένων ευφυών τεχνικών έχει επιφέρει κάποια βελτίωση στην αυτόματη παραγωγή περίληψης. Στην συγκεκριμένη διπλωματική εργασία σχεδιάζεται ένας μηχανισμός που βασίζεται σε νευρωνικά δίκτυα βαθιάς μάθησης για την αντιμετώπιση του προβλήματος της αυτόματης περίληψης κειμένου. Στα πλαίσια αυτού του μηχανισμού, διερευνώνται και συγκρίνονται μεταξύ τους διάφορες σχεδιαστικές επιλογές με στόχο την μεγιστοποίηση της επίδοσης. Πιο συγκεκριμένα, αρχικά πραγματοποιείται επεξεργασία των συνόλων δεδομένων που χρησιμοποιούνται με στόχο την ελαχιστοποίηση του θορύβου που περιέχουν. Στη συνέχεια παρουσιάζεται η αρχιτεκτονική του μηχανισμού παραγωγής της περίληψης και μελετάται ως προς τις διάφορες κρίσιμες παραμέτρους. Στα πλαίσια αντιμετώπισης της εγγενούς δυσκολίας που υπάρχει στο συγκεκριμένο πρόβλημα λόγω της αναγκαιότητας χειρισμού πολύ μεγάλου πλήθους λέξεων, παρουσιάζεται και αναλύεται ένας καινοφανής μηχανισμός αντιμετώπισης των πιθανών άγνωστων λέξεων που εμφανίζονται κατά την διαδικασία παραγωγής της περίληψης. Για την εφαρμογή και αξιολόγηση του συστήματος αυτόματης περίληψης κειμένου χρησιμοποιούνται δύο γνωστά σύνολα δεδομένων. Οι μετρήσεις επίδοσης βασίζονται στην καθιερωμένη μετρική Rouge η οποία πραγματοποιεί συγκρίσεις ομοιότητας μεταξύ των παραγόμενων και των δοσμένων περιλήψεων. Από τα πειραματικά αποτελέσματα εξάγονται χρήσιμα συμπεράσματα για τη βελτίωση της απόδοσης ενός συστήματος αυτόματης περίληψης κειμένου. Τέλος, παρουσιάζονται κάποιες μελλοντικές κατευθύνσεις για την περαιτέρω προώθηση της έρευνας. el
heal.abstract Automatic text summarization refers to the process of shortening a text document with software, so that its main point and topics are preserved. Nowadays, the volume of information rapidly increases and effective pieces of software for text summarization can allow more information to be processed efficiently. Many pieces of software have been manufactured which aim to produce meaningful summarizations of text, while also preserving correct syntax and grammar, but they are still under research. Due to the difficult nature of the problem these pieces of software are far from being able to produce an ideal summarization. However, due to the fact that new revolutionary and intelligent techniques have recently emerged, there has been some improvement to automatic text summarization. In this thesis, a deep learning neural netowrk for automatic text summarization is designed. Within this design process, different configurations are implemented and compared, aiming to maximize performance. More specifically, data preprocessing procedure for noise reduction of the used datasets is described at first. After that, the summarization mechanism’s architecture is described and its performance is measured, for a set of its critical parameters. Trying to overcome the inherent problem of dealing with huge amounts of different words, a novel mechanism is introduced and analyzed, that aims to handle the uknown words that appear in the automatic summarization process. In order to evaluate the implemented text summarization mechanism correctly, two well known text summarization datasets are used. The performance metrics on these datasets are based on the well established Rouge metric for text summarization tasks. Via analyzing the best occuring results through this metric, various conclusions are extracted, aiming to improve the efficiency of text summarization systems. Finally, future directions are presented in this thesis, in an attempt to forward the research in automatic text summarization.
heal.advisorName Σταφυλοπάτης, Ανδρέας Γεώργιος el
heal.committeeMemberName Τσανάκας, Παναγιώτης el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 84 σ. el
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα