dc.contributor.author | Κώστας, Βαγγέλης | el |
dc.date.accessioned | 2021-03-22T09:13:48Z | |
dc.date.available | 2021-03-22T09:13:48Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/53116 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.20814 | |
dc.rights | Αναφορά Δημιουργού 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by/3.0/gr/ | * |
dc.subject | Som cluster analysis lsi lsa svd metasearch engine | en |
dc.title | Ομαδοποίηση αποτελεσμάτων μηχανών αναζήτησης και επέκταση ερωτήματος με χρήση αυτο-οργανούμενων χαρτών | el |
dc.contributor.department | Εργαστήριο Ευφυών Συστημάτων | el |
heal.type | bachelorThesis | |
heal.classification | Document clustering | el |
heal.classificationURI | http://id.loc.gov/authorities/subjects/sh2007004888 | |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2014-10-30 | |
heal.abstract | Μια μηχανή αναζήτησης είναι σχεδιασμένη να ψάχνει πληροφορία στο διαδίκτυο και να αναπαριστά τα αποτελέσματα σε μια λίστα. Η λίστα ταξινομείται με την χρήση ενός κριτηρίου που εισήγαγε πρώτη η google το 2000 και λέγετε PageRank. Αυτός είναι και ένας από τους λόγους που έφεραν την google στην σημερινή της θέση στην αγορά. Ο αριθμός PageRank ενός ιστότοπου υπολογίζετε με την χρήση των PageRanks των ιστοτοπων που συνδέουν προς αυτόν και των συνδέσεων που έχει ο ίδιος προς όλους ιστότοπους. Αλλοι αλγόριθμοι που έχουν προταθεί απο την microsoft για τον υπολογισμό του PageRank λαμβάνουν υπ- όψιν και τον μέσο χρόνο που περνάει ένας επισκέπης στον συγκεκριμένο ιστότοπο. ́Ενας εναλλακτικώς τρόπος παρουσίασης των αποτελεσμάτων είναι αυτός που τα παρουσιάζει μέσα σε κατηγορίες με τίτλους και ιεραρχία, αυτό προσπαθούν να πετύχουν οι μεταμηχανες αναζήτησης. Για να συμβεί η ιεραρχική παρουσίαση πρέπει να υπολογιστεί ενα ιεραρχικό clustering των αποτελεσμάτων, Με την παραπανω προσέγγιση συμφωνούν οι περισσοτερες σημερινές μεταμηχανες αναζήτησης αν και χρησιμοποιούν διαφορετικούς αλγορίθμους. Ο διευθυντής έρευνας της google Peter Norvig είπε για αυτό clustering technology is the PageRank of the future . Η αποφυγή του PageRank ως το μόνο μέτρο ποιότητας ιστότοπου θα αποφύγει σχεδόν εξ ολοκλήρου την προκατάληψη μηχανής αναζήτησης(Search En- gine Bias[9])η του λεγομένου google bombing . Στην παρούσα εργασία θα προσπαθήσουμε να δώσουμε περισσότερη πληροφορία στον χρήστη για τα αποτελέσματα δίνοντας όχι μόνο την ιεραρχία αλλά και το μέτρο ομοιότητας μεταξύ διαφορετικών κατηγοριών. Για να κάνουμε την παραπάνω πληροφορία ευκολότερα προσβάσιμη στον μέσο χρήστη θα πρέπει να παραστήσουμε τα αποτελέσματα σε δισδιάστατο χώρο με την απόσταση να εκπροσωπεί την ομοιότητα. Για να το πετύχουμε αυτό θα πρέπει να επιλέξουμε έναν αλγόριθμο για clustering που να διαφυλάσσει την τοπολογία των αποτελεσμάτων. | el |
heal.advisorName | Siolas, Giorgos | en |
heal.advisorName | Σταφυλοπάτης, Ανδρέας | el |
heal.committeeMemberName | Σταφυλοπάτης, Ανδρέας | el |
heal.committeeMemberName | Στάμου, Γιώργος | el |
heal.committeeMemberName | Κόλλιας, Στέφανος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 50 σ. | el |
heal.fullTextAvailability | true |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: