Στην παρούσα πτυχιακή ασχολούμαστε με την εξαγωγή πληροφορίας από νοσοκομειακές βάσεις δεδομένων στις οποίες καταγράφονται αστοχίες ιατροτεχνολογικών προϊόντων δυνάμενες να προκαλέσουν δυσμενή περιστατικά ασθενών, εξαρτώμενων από τα προϊόντα. Στόχος είναι η εκπαίδευση ταξινομητών με τη βοήθεια των διαθέσιμων δεδομένων ώστε να γίνεται αυτόματη κατηγοριοποίηση των νέων αστοχιών ως προς το είδος της δυσλειτουργίας του προϊόντος στην οποία οφείλονται. Η δυσλειτουργία μπορεί να είναι του υλικού του προϊόντος (hardware) ή του λογισμικού (software). Στα πρώτα τρία κεφάλαια γίνεται αναφορά σε τεχνικές εξόρυξης δεδομένων, σε εξόρυξη δεδομένων από κείμενα καθώς και στο πρόγραμμα εξόρυξης πληροφορίας Weka με το οποίο θα γίνει η εκπαίδευση των ταξινομητών. Στο τελευταίο κεφάλαιο χρησιμοποιούμε διαφορετικούς αλγορίθμους για την εκπαίδευση ταξινομητών και συγκρίνουμε τις αποδόσεις των εξαγομένων μοντέλων.
In the current project we use data mining techniques in medical databases which record different medical product errors capable of causing adverse patient events. The goal is to train classifiers using the available data for the automatic classification of newly recorded errors to the malfunction cause that are connected with. The malfunction is due to either product’s hardware or software. The first three chapters describe data mining techniques, text mining techniques and contain a tutorial of the program WEKA with which the classifiers are going to be trained. In the last chapter we use different algorithms for the classifier training and compare the output models.