HEAL DSpace

Διερεύνηση μεθόδων αυτόματης αναγνώρισης ελληνικών χαρακτήρων σε εικόνες αρχαίων επιγραφών

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Ψωμάς, Βασίλειος el
dc.contributor.author Psomas, Vasileios en
dc.date.accessioned 2018-10-22T08:29:16Z
dc.date.available 2018-10-22T08:29:16Z
dc.date.issued 2018-10-22
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/47812
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.15850
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc/3.0/gr/ *
dc.subject Αντικειμενοστρεφής ανάλυση εικόνας el
dc.subject Μηχανική μάθηση el
dc.subject Ελληνικοί χαρακτήρες el
dc.subject Ταξινόμηση εικόνας el
dc.subject Κατάτμηση εικόνας el
dc.subject Ιωνικό αλφάβητο el
dc.subject SVM en
dc.subject Ασαφής λογική el
dc.subject Αναγνώριση προτύπων el
dc.subject Αυτόματη αναγνώριση χαρακτήρων el
dc.subject Machine learning en
dc.subject Pattern recognition el
dc.subject Image segmentation el
dc.subject Image classification el
dc.title Διερεύνηση μεθόδων αυτόματης αναγνώρισης ελληνικών χαρακτήρων σε εικόνες αρχαίων επιγραφών el
heal.type bachelorThesis
heal.classification Computer vision en
heal.classification Αντίληψη και όραση υπολογιστών el
heal.classificationURI http://id.loc.gov/authorities/subjects/sh85029549
heal.classificationURI http://data.seab.gr/concepts/12c1c913dbe758d67c4c509a6768bdbc7905830c
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2018-03-22
heal.abstract Η παρούσα διπλωματική εργασία αφορά τη διερεύνηση μεθόδων αυτόματης αναγνώρισης ελληνικών χαρακτήρων σε εικόνες αρχαίων επιγραφών. Οι επιγραφές είναι ένα αναπόσπαστο κομμάτι του αρχαίου ελληνικού πολιτισμού και η σημασία τους είναι τεράστια. Στις επιγραφές συναντώνται ανά τους αιώνες και ανά περιοχή διαφορετικά αλφάβητα. Το αλφάβητο που επιλέχθηκε να αναγνωριστεί είναι το ιωνικό, το οποίο καθιερώθηκε στον ελλαδικό χώρο μετά τον 4ο αιώνα π.χ. Αφότου βρέθηκαν οι κατάλληλες εικόνες επιγραφών, ήταν αναγκαίο να προ-επεξεργαστούν με τέτοιο τρόπο, ώστε να διευκολυνθεί η πολυπόθητη αναγνώρισή τους. Διαπιστώθηκε ότι το βέλτιστο ήταν οι εικόνες να γίνουν binary, δίνοντας μια τιμή στο φόντο και την άλλη τιμή στα γράμματα, ώστε να διαχωρίζονται πλήρως μεταξύ τους. Δημιουργήθηκαν δυο διαφορετικές μεθοδολογίες προ-επεξεργασίας, από τις οποίες η δεύτερη απέδωσε καλύτερα, και γι’ αυτό ήταν αυτή που χρησιμοποιήθηκε στη συνέχεια. Έχοντας κάνει binary τις εικόνες, η διαδικασία της αναγνώρισης μπορούσε να ξεκινήσει. Αναπτύχθηκαν πέντε μέθοδοι αναγνώρισης. Η πρώτη μέθοδος αναγνώρισης είναι η μέθοδος των 4ων περιοχών, η οποία περικλείει το κάθε γράμμα στο ελάχιστο περιγεγραμμένο ορθογώνιο του, το διαιρεί σε 4 ίσες περιοχές και υπολογίζει όλους τους λόγους μέσης φωτεινότητας μεταξύ των περιοχών αυτών. Δημιουργούνται, με βάση αυτούς τους λόγους, κανόνες που περιγράφουν τις κλάσεις τις αντίστοιχες των γραμμάτων κι έτσι επιτυγχάνεται η αναγνώριση των γραμμάτων. Η μέθοδος αυτή δεν αναπτύχθηκε πλήρως. Η δεύτερη κι η τρίτη μέθοδος, η δομική κι η γεωμετρική αντίστοιχα, είναι μέθοδοι που χρησιμοποιούν την Αντικειμενοστρεφή Ανάλυση Εικόνας και μέσω κατατμήσεων και ταξινομήσεων επιχειρούν την επιθυμητή αναγνώριση. Η δομική βασίζεται σε 4 πρωτόγονα, 4 βασικά συστατικά, από τα οποία αποτελούνται όλα τα γράμματα, αλλά με διαφορετικό συνδυασμό τους. Η γεωμετρική προσπαθεί να περιγράψει το κάθε γράμμα με βάση κάποια γεωμετρικά χαρακτηριστικά. Κι οι δύο μέθοδοι αποτελούνται από ασαφείς κανόνες που περιγράφουν τις κλάσεις, στις οποίες γίνεται η ταξινόμηση των αντικειμένων της κατάτμησης. Η τέταρτη μέθοδος είναι η μέθοδος που χρησιμοποιεί τον ταξινομητή SVM, έναν ταξινομητή επιβλεπόμενης Μηχανικής Μάθησης, ο οποίος για την εκπαίδευση του τροφοδοτείται με δείγματα των κλάσεων και γεωμετρικά χαρακτηριστικά. Αφότου πραγματοποιηθεί η εκπαίδευση, ο ταξινομητής είναι σε θέση να ταξινομήσει τα γράμματα στις αντίστοιχες κλάσεις τους, δηλαδή να τα αναγνωρίσει. Η πέμπτη και τελευταία μέθοδος είναι η μικτή, η οποία δεν αποτελεί μόνο μια απλή ένωση της λογικής της δομικής και της γεωμετρικής μεθόδου, μα πολύ περισσότερο μια βελτιστοποίηση και των δυο, για τη δημιουργία μιας γενικευμένης μεθόδου αυτόματης αναγνώρισης ασαφούς λογικής. Η αξιολόγηση των μεθόδων έγινε με τη χρήση των δεικτών Πληρότητα, Ορθότητα και Ποιότητα. Τα καλύτερα αποτελέσματα παρατηρούνται στη μέθοδο SVM και στη μικτή μέθοδο. Οι μέθοδοι αυτοί είναι και οι πιο εις βάθος ανεπτυγμένες, καθώς και οι μόνες για τις οποίες έγιναν case studies. Η μέθοδος SVM εμφανίζει μεγαλύτερη Πληρότητα, μα μικρότερη Ορθότητα κι εν τέλει μικρότερη Ποιότητα από την μικτή μέθοδο, καθιστώντας έτσι την μικτή μέθοδο τη βέλτιστη για την αναγνώριση των γραμμάτων. el
heal.abstract The present diploma thesis develops various approaches for Greek character automatic recognition on Ancient Greek epigraphic images. Epigraphs are an integral part of the Ancient Greek civilization and undoubtedly of great historical importance. Across the centuries and various regions, evidence for many local variants of the Greek alphabet is found in epigraphs. In this study, the form of alphabet selected for the automatic recognition was the Ionic, which was established in the Greek world after the 4th century BC. Once the appropriate epigraphic images were selected, it was necessary to preprocess them in such a way, as to facilitate their recognition. It was found that the best method was to make the images binary, giving one value to the background and the other value to the letters, in order to separate them completely. Two different preprocessing approaches were developed, from which the latter was more efficient, and thus it was used. Having transformed the images into binary, five recognition methods were developed. The first is the method of the 4 regions. According to this, each character is bounded in the minimum bounding rectangle, which is thereafter divided in four equal regions. For each region the mean brightness is calculated and afterwards comparisons are made among the regions based on the mean brightness ratios. Taking into account these mean brightness ratios, rules that describe the classes named after the Greek characters are made, and so character recognition is accomplished. This method was not fully developed. The second and third method, the structural and geometric respectively, are methods in which the Object-Based Image Analysis is used and the pattern recognition takes place through the processes of segmentation and classification. The structural method is based on four primitives, which all characters are represented of, but in different combinations. According to the geometric method each character is described by using geometric features. Both methods are governed by fuzzy rules that describe the classes, in which the objects of segmentation are classified. In the fourth method, the SVM classifier, a supervised Machine Learning classifier, is used, which, for its training needs, is provided with samples and geometric features. After training has taken place, the classifier is able to classify the characters in the equivalent categories, and thus to recognize them. The fifth method is a mixed one. It is not just a simple association of the structural and geometric method logic, but, all the more, the improvement of both of them, with a view to developing a generalized automatic recognition method of fuzzy logic. The assessment of the developed methods took place with the use of the indicators of Completeness, Correctness and Quality. The SVM and the mixed method were proved to be the most effective. A detailed examination has been carried out based on these two methods through case studies. The SVM method results indicated higher Completeness but lower Correctness, and eventually lower Quality, than the mixed method. Thereby, the mixed method was finally proved to be the most effective character automatic recognition method. en
heal.advisorName Αργιαλάς, Δημήτριος el
heal.committeeMemberName Καραθανάση, Βασιλεία el
heal.committeeMemberName Κολοκούσης, Πολυχρόνης el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Αγρονόμων και Τοπογράφων Μηχανικών. Τομέας Τοπογραφίας. Εργαστήριο Τηλεπισκόπησης el
heal.academicPublisherID ntua
heal.numberOfPages 223 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση 3.0 Ελλάδα