HEAL DSpace

Ευφϋείς τεχνικές εξόρυξης δεδομένων για χρήσεις του διαδικτύου

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Κουτσούκος, Δημήτριος el
dc.contributor.author Koutsoukos, Dimitrios en
dc.date.accessioned 2016-06-10T11:11:27Z
dc.date.available 2016-06-10T11:11:27Z
dc.date.issued 2016-06-10
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/42665
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.12066
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Εξόρυξη χρήσεων του διαδικτύου el
dc.subject Αναγνώριση συνεδρίας χρήστη el
dc.subject Εξόρυξη κανόνων συσχέτισης el
dc.subject Web usage mining en
dc.subject Session identification en
dc.subject Association rule mining en
dc.title Ευφϋείς τεχνικές εξόρυξης δεδομένων για χρήσεις του διαδικτύου el
heal.type bachelorThesis
heal.classification Πληροφορική el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2016-03-22
heal.abstract Ο Παγκόσμιος Ιστός έχει πολύ μεγάλη ανάπτυξη στις μέρες μας. Εκατομμύρια σελίδες δέχονται επίσκεψη καθημερινά από δισεκατομμύρια χρήστες. Οι προσβάσεις τους καταγράφονται στα αρχεία καταγραφής των εξυπηρετητών. Η εξόρυξη χρήσεων του διαδικτύου εφαρμόζει τεχνικές εξόρυξης δεδομένων για να εξαγάγει την συμπεριφορά των χρηστών και να ανακαλύψει χρήσιμα μοτίβα πρόσβασης στο διαδίκτυο. Η ανακάλυψη αυτών των μοτίβων μπορεί να είναι χρήσιμη με μία πληθώρα τρόπων, όπως για παράδειγμα την εξατομίκευση μιας ιστοσελίδας, την προανάκληση συνδέσμων και τη βελτίωση της επίδοσης των εξυπηρετητών. Όμως, για την ανακάλυψη μοτίβων τα αρχεία καταγραφής πρέπει να υποστούν προεπεξεργασία προκειμένου να αφαιρεθεί ο “θόρυβος”. Σε αυτή τη διπλωματική εργασία, εξερευνάται η φάση της προεπεξεργασίας των δεδομένων και προτείνεται ένας νέος αλγόριθμος για την αναγνώριση της συνεδρίας χρήστη, που χρησιμοποιεί την ασαφή συσταδοποίηση c-κέντρων. Έπειτα, γίνεται μια έρευνα στους τρόπους που μπορούν να εξαχθούν μοτίβα και εφαρμόζεται η εξόρυξη κανόνων συσχέτισης σε πραγματικά αρχεία καταγραφής για την εξαγωγή ουσιωδών κανόνων προκειμένου να προβλεφθεί το επόμενο αίτημα ενός χρήστη από τα προηγούμενά του. el
heal.abstract World Wide Web has an enormous growth during these days. Millions of pages are added daily and billions of users access them. Their accesses are recorded in web server logs. Web Usage Mining applies data mining techniques in server logs in order to extract the behaviour of users and dis- cover web access paterns. Discovering these paterns can be useful in a number of ways such as personalizing a website, prefetching links and improving the web server performance. However, for patern discovery the web logs have to be preprocessed in order to remove “noise”. In this diploma thesis, the preprocessing phase is being explored and a new algorithm for session identification us- ing Fuzzy C-Means Clustering is being proposed. Following, a survey on the techniques of patern discovery is being done and association rule mining is being applied on real web logs in order to extract meaningful rules and to “guess” a user’s next request based on his previous ones. en
heal.advisorName Σταφυλοπάτης, Ανδρέας-Γεώργιος el
heal.committeeMemberName Κόλλιας, Στέφανος el
heal.committeeMemberName Στάμου, Γεώργιος el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Επικοινωνιών, Ηλεκτρονικής και Συστημάτων Πληροφορικής el
heal.academicPublisherID ntua
heal.numberOfPages 106 σ.
heal.fullTextAvailability true


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα