dc.contributor.author | Κεφάλας, Γιώργος | el |
dc.contributor.author | Kefalas, Giorgos | en |
dc.date.accessioned | 2020-11-25T09:14:43Z | |
dc.date.available | 2020-11-25T09:14:43Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/52056 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.19754 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Εξόρυξη γνώσης | el |
dc.subject | Διάσχιση γράφων | el |
dc.subject | Σχεσιακή άλγεβρα | el |
dc.subject | Ερωτήματα συσχετίσεων | el |
dc.subject | Βιοϊατρικά δεδομένα | el |
dc.subject | SQL | en |
dc.subject | PubMed | en |
dc.subject | Knowledge discovery | en |
dc.subject | Biomedical literature | en |
dc.subject | OLAP scenarios | en |
dc.title | Βελτιστοποίηση ερωτημάτων συσχετίσεων με εφαρμογές στη βιοϊατρική βιβλιογραφία | el |
heal.type | bachelorThesis | |
heal.classification | Βάσεις δεδομένων | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2020-03-10 | |
heal.abstract | Η σύγχρονη τάση στον τομέα της μηχανικής μάθησης και της εξόρυξης δεδομένων οδηγεί στην ανάγκη για καλύτερες επιδόσεις στα προβλήματα αναλυτικής επεξεργασίας άμεσης επικοινωνίας (OLAP scenarios). Οι συμβατικές βάσεις δεδομένων αποθήκευσης κατά γραμμή και κατά στήλη, καθώς και οι βάσεις γράφων, δεν μπορούν να ανταποκριθούν ικανοποιητικά στις απαιτήσεις των προβλημάτων αυτών. Στην εργασία αυτή μελετάμε τη δομή και τη λειτουργία της GQ-Fast, μιας βάσης δεδομένων βασισμένης σε δείκτες. Η GQ-Fast φτιάχτηκε για να ανταποκρίνεται σε μια κατηγορία ερωτημάτων που ονομάζουμε “ερωτήματα συσχετίσεων”, τα οποία ασχολούνται με την ανάλυση γράφων σε μοτίβα δεντρικών δομών καθώς και στον έλεγχο της προσβασιμότητας μεταξύ διαφόρων κόμβων. Συγκεντρώνει τα πλεονεκτήματα της οργάνωσης κατά στήλη (column organizing), της δεικτοδότησης και της συμπίεσης δεδομένων, ενώ κατασκευάζει με έξυπνο τρόπο πίνακες γειτνίασης για να μοντελοποιήσει τα δεδομένα που της δίνονται. Το ιδιαίτερο χαρακτηριστικό της είναι η εξαγωγή πηγαίου κώδικα σε C++ για κάθε ένα από τα ερωτήματα που επιλύει. Tα ερωτήματα αυτά είναι πολύ σημαντικά για την επίλυση προβλημάτων αναλυτικής επεξεργασίας άμεσης επικοινωνίας (OLAP scenarios). Στόχος μας είναι να περιγράψουμε τις λειτουργικές επεκτάσεις που προσθέσαμε στη GQ-Fast, καθώς και τις εφαρμογές που αυτές έχουν στην εξόρυξη δεδομένων στη Βιοϊατρική βιβλιογραφία. Για το σκοπό αυτό χρησιμοποιούμε τη βάση δεδομένων PubMed, επεξεργάζοντας τα δεδομένα της και εφαρμόζοντας σε αυτά μια ομάδα από ερωτήματα SQL τα οποία επιστρέφουν χρήσιμη ερευνητική πληροφορία με τρόπο σαφώς πιο αποδοτικό από τις συμβατικές μεθόδους που έχουμε για να την ανακαλύψουμε. Παραθέτουμε αναλυτικά πειραματικά δεδομένα εστιασμένα σε αλληλεπιδραστικά ερωτήματα που απαιτούν ταχύτατη απόκριση αναφορικά με τις επιδόσεις της GQ-Fast έναντι της βάσης PostgreSQL, όταν όλες οι βάσεις είναι φορτωμένες στη μνήμη RAM του δοκιμαστικού συστήματος. Επιδεικνύουμε τις παραπάνω επεκτάσεις μέσω ενός γραφικού περιβάλλοντος χρήστη (User Interface) που σχεδιάσαμε και υλοποιήσαμε για τον φυλλομετρητή ιστού. Στο περιβάλλον αυτό, εφαρμόζονται άμεσα οι δυνατότητες της GQ-Fast για την ταχύτατη ανάκτηση πληροφοριών σχετικά με την Βιοϊατρική βιβλιογραφία καθώς και η αποτελεσματική απεικόνισή τους. | el |
heal.advisorName | Κωνσταντίνου, Ιωάννης | el |
heal.advisorName | Κοζύρης, Νεκτάριος | el |
heal.committeeMemberName | Κοζύρης, Νεκτάριος | el |
heal.committeeMemberName | Γκούμας, Γεώργιος | el |
heal.committeeMemberName | Τσουμάκος, Δημήτριος | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Τεχνολογίας Πληροφορικής και Υπολογιστών. Εργαστήριο Υπολογιστικών Συστημάτων | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 85 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: