HEAL DSpace

Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση µεθόδων Συµπερασµού Γραµµατικών

DSpace/Manakin Repository

Show simple item record

dc.contributor.author Κορφιάτης, Γεώργιος Λ.
dc.date.accessioned 2025-10-03T09:47:46Z
dc.date.available 2025-10-03T09:47:46Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/62603
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.30299
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Μοντελοποίηση της Χρήσης του Ιστού el
dc.subject Συµπερασµός Γραµµατικών el
dc.subject Ανάκτηση Πληροφοριών el
dc.subject Οµαδοποίηση el
dc.subject οµοιότητα των ιστοσελίδων el
dc.subject Machine Learning en
dc.subject Web Usage Modeling en
dc.subject Grammatical Inference en
dc.subject Information Retrieval en
dc.subject Clustering en
dc.title Μοντελοποίηση της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό µε χρήση µεθόδων Συµπερασµού Γραµµατικών el
dc.contributor.department Τομέας τεχνολογίας πληροφορικής και υπολογιστών el
heal.type bachelorThesis
heal.classification Μηχανική Μάθηση el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2006-09-01
heal.abstract Η έλλειψη δοµής του Παγκόσµιου Ιστού και το πρόβληµα της υπερσυσσώρευσης πληροφοριών καθιστούν δυσχερή την πλοήγηση σε αυτόν. Στην παρούσα εργασία προτείνεται µία µέθοδος µοντελοποίησης της πλοήγησης των χρηστών στον Παγκόσµιο Ιστό, µε στόχο τη διευκόλυνση του χρήστη µέσω της πρότασης ενδιαφερουσών σελίδων σε αυτόν. Για το σκοπό αυτό, επεκτάθηκαν οι µέθοδοι Συµπερασµού Γραµµατικών Alergia και Blue Fringe µε την εισαγωγή ενός επιπλέον κριτηρίου, που ελέγχει την οµοιότητα των ιστοσελίδων ως προς το περιεχόµενό τους. Επίσης χρησιµοποιήθηκε µία τεχνική µείωσης διαστασιµότητας πριν την εφαρµογή της επαγωγικής µεθόδου. Στο πλαίσιο του Συµπερασµού Γραµµατικών, οι ιστοσελίδες θεωρούνται σύµβολα µίας πιθανοτικής κανονικής γραµµατικής και οι αλληλουχίες σελίδων συµβολοσειρές της αντίστοιχης γλώσσας. Επιπλέον, το περιεχόµενο της κάθε σελίδας εκφράζεται µε το διάνυσµα των λέξεων-κλειδιών της. Από τα δεδοµένα χρήσης που λαµβάνονται από αρχεία καταγραφής µιας εταιρείας παροχής υπηρεσιών διαδικτύου κατασκευάζεται αρχικά µία δενδρική δοµή, τέτοια ώστε κάθε σύνοδος χρήσης των υπαρχόντων δεδοµένων να αντιστοιχεί σε ένα µονοπάτι στο δέντρο. Στη συνέχεια, η µέθοδος επάγει από το αρχικό δέντρο ένα γράφο µικρότερης τάξης, που επιχειρεί να µοντελοποιήσει την πλοήγηση των χρηστών. Αυτό επιτυγχάνεται µε τη συγχώνευση καταστάσεων (κόµβων του γράφου) που είναι συµβατές τόσο ως προς τη χρήση (όµοιες µεταβάσεις) όσο και ως προς το περιεχόµενο (οµοιότητα του περιεχοµένου των σελίδων). Ο τελικός γράφος χρησιµοποιείται για την πρόταση ενδιαφερόντων συνδέσµων σελίδων σε χρήστες που περιηγούνται στον Παγκόσµιο Ιστό. Τα πειραµατικά αποτελέσµατα έδειξαν ότι η γνώση της σειράς µε την οποία ένας χρήστης επισκέπτεται ορισµένες σελίδες του Παγκόσµιου Ιστού δε συµβάλλει στη διαδικασία πρότασης σελίδων, κάτι που οφείλεται στη µεγάλη ανοµοιογένεια των δεδοµένων χρήσης. Γενικά, φαίνεται ότι η πλοήγηση ενός χρήστη στον Παγκόσµιο Ιστό περιορίζεται κατά κύριο λόγο σε ένα σύνολο σελίδων της ίδιας θεµατικής κατηγορίας, ενώ οι λίγες µεταβάσεις σε άλλες θεµατικές κατηγορίες είναι δύσκολο να προβλεφθούν. Εκτιµάται πάντως ότι µία προσέγγιση που θα βασίζεται στην οµοιότητα περιεχοµένου και θα χρησιµοποιεί τα δεδοµένα χρήσης σε επιλεκτική βάση ενδέχεται να αποδίδει καλύτερα. Επίσης, προέκυψε ότι η µέθοδος που βασίζεται στην Blue Fringe αποδίδει καλύτερα, καθότι αυτή επιλέγει µε πιο έξυπνο τρόπο τις καλύτερες συγχωνεύσεις καταστάσεων. Η µείωση διαστασιµότητας δε φάνηκε τέλος να βελτιώνει τη διαδικασία πρότασης σελίδων. el
heal.abstract The lack of structure of the World Wide Web and the information overload problem make the navigation through it a difficult task. In this dissertation, a method that models the Web user navigation is presented, which aims at assisting a user by recommending pages. For that purpose, the Grammatical Inference methods Alergia and Blue Fringe have been extended, by introducing an extra criterion, which examines the content similarity of the Web pages. A dimensionality reduction technique has also been employed before applying the inductive method. In the context of Grammatical Inference, the Web pages are considered as symbols of a probabilistic regular grammar and the sequences of pages as strings of the respective language. Moreover, the content of each page is represented by a vector of its keywords. Based on the usage data that are taken from log files of an Internet Service Provider we construct initially a tree structure, such that each session of the existing usage data corresponds to a path on the tree. Then the method infers from the initial tree a graph of lower order, which attempts to model the user navigation. This is achieved by merging states (nodes of the graph) which are compatible with respect to both the usage (similar transitions) and the content (content similarity of the pages). The final graph is used for the recommendation of useful page links to users who navigate through the World Wide Web. The experimental results showed that the knowledge of the order in which a user visits some pages on the Web does not contribute to the page recommendation process, due to the diversity of the usage data. It seems in general that the navigation of a user through the Web is mainly restricted to a set of pages of a single thematic category, while it is difficult for the few transitions to other thematic categories to be predicted. However, it is possible that an approach based on content similarity that would exploit the usage data selectively might perform better. Moreover, it turned out that the method based on Blue Fringe performs better, since it chooses the best merges in a more clever way. Finally, dimensionality reduction did not seem to improve the page recommendation process. en
heal.sponsor ΕΜΠ el
heal.advisorName Σελλής, Τιµολέων
heal.committeeMemberName Σελλής, Τιµολέων
heal.committeeMemberName Βασιλείου, Ιωάννης
heal.committeeMemberName Κοζύρης, Νεκτάριος
heal.academicPublisher Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών el
heal.academicPublisherID ntua
heal.numberOfPages 90 σ.
heal.fullTextAvailability false


Files in this item

The following license files are associated with this item:

This item appears in the following Collection(s)

Show simple item record

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Except where otherwise noted, this item's license is described as Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα