Σκοπός της διπλωματικής αυτής είναι η μελέτη και ανάπτυξη τεχνικών εντοπισμού τάσεων στο χώρο της ιατρικής μέσω της ανάλυσης άρθρων και δημοσιεύσεων.
Ένας μεγάλος αριθμός επιστημονικών πληροφοριών δημοσιεύεται καθημερινά σε διάφορα μέσα, με τη δυσκολία εύρεσης, πρόσβασης, κατανόησης, αξιολόγησης αλλά και σύνδεσης αυτών να είναι σημαντική. Ειδικότερα στο χώρο της κλινικής και μη κλινικής έρευνας, η συγκέντρωση και ανάλυση υφιστάμενων δεδομένων που δημοσιοποιούνται ανοικτά και μη μέσα από τη βιβλιογραφία, τις κλινικές δοκιμές και τα ερευνητικά πειράματα, μεταξύ άλλων, μπορεί να αποκαλύψει νέα ευρήματα που θα μπορούσαν να έχουν μεγάλη αξία.
Αν και σημαντικές ερευνητικές προσπάθειες γίνονται για τον εντοπισμό και την ανάλυση τάσεων στην έρευνα, τα αποτελέσματά τους έχουν ακόμη μόνο περιορισμένη χρήση σε σχετικές δραστηριότητες της επιστημονικής και βιομηχανικής έρευνας. Επομένως, είναι αναγκαία η ανάπτυξη μηχανισμών για την αυτόματη ανάλυση επιστημονικών άρθρων οι οποίοι θα μπορούν να τα κατηγοριοποιήσουν ποικιλοτρόπως αλλά και να εντοπίσουν νέες και ανερχόμενες τάσεις στην έρευνα.
Στα πλαίσια αυτά, μελετήθηκε το πεδίο της εύρεσης τάσεων με μια ανασκόπηση στην τρέχουσα τεχνολογική κατάσταση και τις ήδη υπάρχουσες εφαρμογές αλλά και το πεδίο της εξόρυξης δεδομένων, δεδομένης της ανάγκης εξαγωγής των δεδομένων ενδιαφέροντος από ελεύθερα κείμενα δημοσιεύσεων. Ακολούθως, αναπτύχθηκε η προτεινόμενη μεθοδολογία για τον εντοπισμό των τάσεων και εστιάσαμε στην ανάπτυξη της τεχνικής των άμεσων βιβλιογραφικών αναφορών. Χρησιμοποιώντας σύγχρονες τεχνολογίες, δημιουργήσαμε μια υλοποίηση της εν λόγω μεθοδολογίας.
The purpose of this thesis is to study and develop techniques to identify trends in the field of medicine through analysis of articles and publications.
There is an excessive amount of dispersed scientific information published daily, at a variety of data sources, which is difficult to find, access, comprehend, evaluate and link. Notably in the area of clinical and non-clinical research, the collection and analysis of existing data, openly published or not, through the literature, clinical trials and research experiments, among others, can reveal new findings that could be of great value.
Although significant research efforts are made to identify and analyze trends in research, their results still have only limited use in related activities of scientific and industrial research. It is therefore necessary to develop mechanisms for the automatic analysis of scientific articles which they will categorize this articles accordingly and to identify new and emerging trends in research.
In this context, we studied the scope of identifying trends by looking at the current technological situation and existing applications but also the scope of the field of data mining, given the need to export data of interest from the texts of free publications. Subsequently we developed the proposed methodology to identify trends and focused on the development of the technique of direct citations. Using modern technology, we have created an implementation of this methodology.