dc.contributor.author | Κουτσούκος, Δημήτριος | el |
dc.contributor.author | Koutsoukos, Dimitrios | en |
dc.date.accessioned | 2016-06-10T11:11:27Z | |
dc.date.available | 2016-06-10T11:11:27Z | |
dc.date.issued | 2016-06-10 | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/42665 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.12066 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Εξόρυξη χρήσεων του διαδικτύου | el |
dc.subject | Αναγνώριση συνεδρίας χρήστη | el |
dc.subject | Εξόρυξη κανόνων συσχέτισης | el |
dc.subject | Web usage mining | en |
dc.subject | Session identification | en |
dc.subject | Association rule mining | en |
dc.title | Ευφϋείς τεχνικές εξόρυξης δεδομένων για χρήσεις του διαδικτύου | el |
heal.type | bachelorThesis | |
heal.classification | Πληροφορική | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2016-03-22 | |
heal.abstract | Ο Παγκόσμιος Ιστός έχει πολύ μεγάλη ανάπτυξη στις μέρες μας. Εκατομμύρια σελίδες δέχονται επίσκεψη καθημερινά από δισεκατομμύρια χρήστες. Οι προσβάσεις τους καταγράφονται στα αρχεία καταγραφής των εξυπηρετητών. Η εξόρυξη χρήσεων του διαδικτύου εφαρμόζει τεχνικές εξόρυξης δεδομένων για να εξαγάγει την συμπεριφορά των χρηστών και να ανακαλύψει χρήσιμα μοτίβα πρόσβασης στο διαδίκτυο. Η ανακάλυψη αυτών των μοτίβων μπορεί να είναι χρήσιμη με μία πληθώρα τρόπων, όπως για παράδειγμα την εξατομίκευση μιας ιστοσελίδας, την προανάκληση συνδέσμων και τη βελτίωση της επίδοσης των εξυπηρετητών. Όμως, για την ανακάλυψη μοτίβων τα αρχεία καταγραφής πρέπει να υποστούν προεπεξεργασία προκειμένου να αφαιρεθεί ο “θόρυβος”. Σε αυτή τη διπλωματική εργασία, εξερευνάται η φάση της προεπεξεργασίας των δεδομένων και προτείνεται ένας νέος αλγόριθμος για την αναγνώριση της συνεδρίας χρήστη, που χρησιμοποιεί την ασαφή συσταδοποίηση c-κέντρων. Έπειτα, γίνεται μια έρευνα στους τρόπους που μπορούν να εξαχθούν μοτίβα και εφαρμόζεται η εξόρυξη κανόνων συσχέτισης σε πραγματικά αρχεία καταγραφής για την εξαγωγή ουσιωδών κανόνων προκειμένου να προβλεφθεί το επόμενο αίτημα ενός χρήστη από τα προηγούμενά του. | el |
heal.abstract | World Wide Web has an enormous growth during these days. Millions of pages are added daily and billions of users access them. Their accesses are recorded in web server logs. Web Usage Mining applies data mining techniques in server logs in order to extract the behaviour of users and dis- cover web access paterns. Discovering these paterns can be useful in a number of ways such as personalizing a website, prefetching links and improving the web server performance. However, for patern discovery the web logs have to be preprocessed in order to remove “noise”. In this diploma thesis, the preprocessing phase is being explored and a new algorithm for session identification us- ing Fuzzy C-Means Clustering is being proposed. Following, a survey on the techniques of patern discovery is being done and association rule mining is being applied on real web logs in order to extract meaningful rules and to “guess” a user’s next request based on his previous ones. | en |
heal.advisorName | Σταφυλοπάτης, Ανδρέας-Γεώργιος | el |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.committeeMemberName | Στάμου, Γεώργιος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 106 σ. | |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: