HEAL DSpace

Εξαγωγή Γεωγραφικής Πληροφορίας από Ημιδομημένο Κείμενο

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Αντζελ, Αλβέρτου - Δαυίδ
dc.contributor.author Angel, Albert-David
dc.date.accessioned 2025-03-27T09:24:47Z
dc.date.available 2025-03-27T09:24:47Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/61499
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.29195
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject γεωκωδικοποίηση el
dc.subject αλγόριθμοι προσεγγιστικού και φωνητικού ταιριάγματος el
dc.subject καθαρισμός δεδομένων el
dc.subject γεωγραφική αναζήτηση el
dc.subject geoparsing, en
dc.subject geocoding en
dc.subject imprecise and phonetic string matching en
dc.subject data cleaning en
dc.subject geographic information extraction en
dc.title Εξαγωγή Γεωγραφικής Πληροφορίας από Ημιδομημένο Κείμενο el
dc.contributor.department Τομέας τεχνολογίας πληροφορικής και υπολογιστών el
heal.type bachelorThesis
heal.classification εξαγωγή γεωγραφικής πληροφορίας el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2006-09-01
heal.abstract Η αναζήτηση, πλοήγηση, ευρετηριοποίηση, οργάνωση του παγκόσμιου ιστού μπορεί να γίνει πάνω σε διάφορους άξονες χαρακτηριστικών (π.χ. με λέξεις κλειδιά, τοπολογικά-μέσω υπερσυνδέσμων, θεματικά, χρονολογικά, γεωγραφικά). Στην διπλωματική εργασία αυτή, μελετώνται διάφορες προσεγγίσεις ανακάλυψης γεωγραφικής-χωρικής πληροφορίας σε ιστοσελίδες (geoparsing), και απόδοσης ακριβών συντεταγμένων στην πληροφορία αυτή (γεωκωδικοποίηση). Για την πραγματοποίηση των στόχων αυτών, απαιτούνται αποδοτικοί αλγόριθμοι προσεγγιστικού και φωνητικού ταιριάγματος συμβολοσειρών (για παράδειγμα, για το ταίριαγμα πιθανών τοπωνυμίων από μια ιστοσελίδα με μια μεγάλη βάση τοπωνυμίων, ή για τον καθαρισμό των δεδομένων στης βάσης αυτής). Γι'αυτό, εξετάζονται οι υπάρχοντες αλγόριθμοι ταιριάγματος, και προτείνονται νέοι, καθώς και παραλλαγές τους για την Ελληνική γλώσσα. Οι ιδιοτροπίες που προκύπτουν από την χρήση της τελευταίας (π.χ. ύπαρξη μεγάλου όγκου πληροφορίας σε greeklish), επισημαίνονται παράλληλα με τους τρόπους αντιμετώπισής τους. Επίσης, για έναν τέτοιο στόχο, απαιτούνται υψηλής ποιότητας γεωγραφικά δεδομένα. Προτείνονται διάφορες μέθοδοι απόκτησης και καθαρισμού αυτών, προσαρμοσμένες στην Ελληνική πραγματικότητα. Τέλος, αναπτύσσουμε ένα πρωτότυπο εργαλείο για την γεωγραφική ευρετηριοποίηση του Ελληνικού ιστοχώρου, που υλοποιεί τις παραπάνω ιδέες, και προσφέρεται για ποικίλες εφαρμογές (π.χ. γεωγραφική αναζήτηση, εύρεση σημείων ενδιαφέροντος στην εγγύτητα κ.λ.π.) el
heal.abstract Web pages may be organized, indexed, searched, and navigated along several different feature dimensions (e.g. keywords, theme, geography, time). In this thesis we investigate different approaches of discovering spatial context for web pages (geoparsing), as well as for providing accurate coordinates for said spatial context (geocoding). For both of these goals to be realised, efficient algorithms for imprecise and phonetic string matching are needed (e.g. for matching potential feature names encountered in a web page with a large feature name database, or for cleaning geographic data in said database). Thus, existing matching algorithms are examined. In addition, several new variants are proposed, and are customised for use in a Greek context; the peculiarities presented by the latter are explored as well. Furthermore, high-quality geographic datasets are required for such a task. Alternative methods of obtaining and cleaning these are presented. Finally, a prototype tool for the geographic indexing of the Greek web is developed, implementing the aforementioned concepts and allowing for a multitude of applications (e.g. searching, or ranking search results by geographic relevance, finding points of interest in the vicinity e.t.c.) en
heal.sponsor ΕΜΠ el
heal.advisorName Σελλής, Τιμολέων
heal.committeeMemberName Σελλής, Τιμολέων
heal.committeeMemberName Βασιλείου, Ιωάννης
heal.committeeMemberName Σαγώνας, Κων/νος
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 117 σ.
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα