dc.contributor.author | Αντζελ, Αλβέρτου - Δαυίδ![]() |
|
dc.contributor.author | Angel, Albert-David![]() |
|
dc.date.accessioned | 2025-03-27T09:24:47Z | |
dc.date.available | 2025-03-27T09:24:47Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/61499 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.29195 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | γεωκωδικοποίηση | el |
dc.subject | αλγόριθμοι προσεγγιστικού και φωνητικού ταιριάγματος | el |
dc.subject | καθαρισμός δεδομένων | el |
dc.subject | γεωγραφική αναζήτηση | el |
dc.subject | geoparsing, | en |
dc.subject | geocoding | en |
dc.subject | imprecise and phonetic string matching | en |
dc.subject | data cleaning | en |
dc.subject | geographic information extraction | en |
dc.title | Εξαγωγή Γεωγραφικής Πληροφορίας από Ημιδομημένο Κείμενο | el |
dc.contributor.department | Τομέας τεχνολογίας πληροφορικής και υπολογιστών | el |
heal.type | bachelorThesis | |
heal.classification | εξαγωγή γεωγραφικής πληροφορίας | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2006-09-01 | |
heal.abstract | Η αναζήτηση, πλοήγηση, ευρετηριοποίηση, οργάνωση του παγκόσμιου ιστού μπορεί να γίνει πάνω σε διάφορους άξονες χαρακτηριστικών (π.χ. με λέξεις κλειδιά, τοπολογικά-μέσω υπερσυνδέσμων, θεματικά, χρονολογικά, γεωγραφικά). Στην διπλωματική εργασία αυτή, μελετώνται διάφορες προσεγγίσεις ανακάλυψης γεωγραφικής-χωρικής πληροφορίας σε ιστοσελίδες (geoparsing), και απόδοσης ακριβών συντεταγμένων στην πληροφορία αυτή (γεωκωδικοποίηση). Για την πραγματοποίηση των στόχων αυτών, απαιτούνται αποδοτικοί αλγόριθμοι προσεγγιστικού και φωνητικού ταιριάγματος συμβολοσειρών (για παράδειγμα, για το ταίριαγμα πιθανών τοπωνυμίων από μια ιστοσελίδα με μια μεγάλη βάση τοπωνυμίων, ή για τον καθαρισμό των δεδομένων στης βάσης αυτής). Γι'αυτό, εξετάζονται οι υπάρχοντες αλγόριθμοι ταιριάγματος, και προτείνονται νέοι, καθώς και παραλλαγές τους για την Ελληνική γλώσσα. Οι ιδιοτροπίες που προκύπτουν από την χρήση της τελευταίας (π.χ. ύπαρξη μεγάλου όγκου πληροφορίας σε greeklish), επισημαίνονται παράλληλα με τους τρόπους αντιμετώπισής τους. Επίσης, για έναν τέτοιο στόχο, απαιτούνται υψηλής ποιότητας γεωγραφικά δεδομένα. Προτείνονται διάφορες μέθοδοι απόκτησης και καθαρισμού αυτών, προσαρμοσμένες στην Ελληνική πραγματικότητα. Τέλος, αναπτύσσουμε ένα πρωτότυπο εργαλείο για την γεωγραφική ευρετηριοποίηση του Ελληνικού ιστοχώρου, που υλοποιεί τις παραπάνω ιδέες, και προσφέρεται για ποικίλες εφαρμογές (π.χ. γεωγραφική αναζήτηση, εύρεση σημείων ενδιαφέροντος στην εγγύτητα κ.λ.π.) | el |
heal.abstract | Web pages may be organized, indexed, searched, and navigated along several different feature dimensions (e.g. keywords, theme, geography, time). In this thesis we investigate different approaches of discovering spatial context for web pages (geoparsing), as well as for providing accurate coordinates for said spatial context (geocoding). For both of these goals to be realised, efficient algorithms for imprecise and phonetic string matching are needed (e.g. for matching potential feature names encountered in a web page with a large feature name database, or for cleaning geographic data in said database). Thus, existing matching algorithms are examined. In addition, several new variants are proposed, and are customised for use in a Greek context; the peculiarities presented by the latter are explored as well. Furthermore, high-quality geographic datasets are required for such a task. Alternative methods of obtaining and cleaning these are presented. Finally, a prototype tool for the geographic indexing of the Greek web is developed, implementing the aforementioned concepts and allowing for a multitude of applications (e.g. searching, or ranking search results by geographic relevance, finding points of interest in the vicinity e.t.c.) | en |
heal.sponsor | ΕΜΠ | el |
heal.advisorName | Σελλής, Τιμολέων | |
heal.committeeMemberName | Σελλής, Τιμολέων | |
heal.committeeMemberName | Βασιλείου, Ιωάννης | |
heal.committeeMemberName | Σαγώνας, Κων/νος | |
heal.academicPublisher | Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 117 σ. | |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: