Στην παρούσα διδακτορική διατριβή αναπτύσσουμε μεθοδολογίες που μπορούν να χρησιμοποιηθούν σε ένα αυτόματο σύστημα υποβοηθούμενης διάγνωσης (CADx) για συμπλέγματα μικροασβεστώσεων που εντοπίζονται σε μαστογραφικές εικόνες. Οι μικροασβεστώσεις είναι μικροσκοπικά άλατα ασβεστίου που είναι πιθανόν να εντοπιστούν σε ολόκληρη την περιοχή του μαστού και η εμφάνιση τους σχετίζεται με την ανάπτυξη καρκίνου του μαστού. Η υλοποίηση του συστήματος περιλαμβάνει μία σειρά αυτόνομων σταδίων όπως την προ-επεξεργασία της εικόνας, στοχεύοντας στη βελτίωση της ποιότητάς της και στον εντοπισμό σημαντικών ανατομικών δομών του μαστού, την κατάτμηση των μικροασβεστώσεων από την αρχική εικόνα, με σκοπό την απομόνωση των ευρημάτων ενδιαφέροντος, την εξαγωγή χαρακτηριστικών περιγραφής των ευρημάτων και τέλος την επιλογή εύρωστων χαρακτηριστικών και την εφαρμογή μεθόδου ταξινόμησης ώστε να επιτευχθεί με αυτόματο τρόπο διαχωρισμός μεταξύ καλόηθων και κακόηθων ευρημάτων. Παρουσιάζουμε λοιπόν ακολουθιακά τις μεθοδολογίες που ακολουθήσαμε για την ανάπτυξη κάθε διαφορετικού σταδίου του συστήματος υποβοηθούμενης διάγνωσης. Προσεγγίσαμε πολυπλεύρως την ανάλυση ενός συμπλέγματος μικροασβεστώσεων, εξάγοντας αρχικά χαρακτηριστικά που περιγράφουν τη μορφολογία και τη φωτεινότητα των ευρημάτων, την κατανομή τους μέσα στο σύμπλεγμα, το σχήμα του συμπλέγματος και την υφή του περιβάλλοντος ιστού. Επίσης, αξιολογήθηκαν και συγκρίθηκαν διαφορετικές μέθοδοι επιλογής χαρακτηριστικών και ποικίλα σχήματα ταξινόμησης, προκειμένου να καταλήξουμε στον πιο αποδοτικό συνδυασμό που οδηγεί σε βελτιστοποίηση των επιδόσεων διαχωρισμού. Ύστερα από την ανάπτυξη όλων των αυτόνομων σταδίων του συστήματος, προχωράμε στην αξιολόγησή του με σκοπό να διερευνήσουμε την αποτελεσματικότητά του και τη δυνατότητα εφαρμογής του σε συνθήκες κλινικής πρακτικής. Για την αξιολόγηση του συστήματος χρησιμοποιήθηκαν εικόνες από πραγματικές περιπτώσεις ασθενών, αξιοποιώντας ελεύθερα διαθέσιμες βάσεις δεδομένων. Συνολικά, χρησιμοποιήσαμε 22 μαστογραφίες από τη βάση MIAS και 1715 διαφορετικές μαστογραφίες από τη βάση DDSM, εξασφαλίζοντας κατ’ αυτόν τον τρόπο αντικειμενικά αποτελέσματα, μιας και πρόκειται για το μεγαλύτερο πλήθος περιπτώσεων που έχει χρησιμοποιηθεί για την υπολογιστική διάγνωση συμπλεγμάτων μικροασβεστώσεων. Μέσα από τα υπολογιστικά πειράματα με το συγκεκριμένο σύνολο δεδομένων, οδηγούμαστε σε συμπεράσματα που αφορούν τους παράγοντες που επηρεάζουν την ανάλυση μιας μαστογραφίας, ελέγχουμε την επίδοση του συστήματος σε μαστογραφίες διαφορετικών ιδιοτήτων, συγκρίνουμε διαφορετικές ομάδες χαρακτηριστικών και εντοπίζουμε τα καλύτερα υποσύνολα για τη διάγνωση των συμπλεγμάτων, ενώ συγκρίνουμε τις επιδόσεις του συστήματος με τις επιδόσεις ακτινολόγων που εξέτασαν το ίδιο σύνολο δεδομένων. Τα αποτελέσματα είναι ενθαρρυντικά καθώς υπάρχουν υποσύνολα μαστογραφιών για τα οποία επιτυγχάνουμε υψηλές επιδόσεις διαχωρισμού (Az=0.91), ενώ υπερέχουμε στη σύγκριση έναντι των επιδόσεων των ακτινολόγων. Μάλιστα, αναλογιζόμενοι και το μεγάλο πλήθος χρησιμοποιούμενων μαστογραφιών, τα αποτελέσματα ταξινόμησης που επιτυγχάνουμε είναι και από τα υψηλότερα που αναφέρονται στη βιβλιογραφία. Αξιοποιώντας τα συγκεκριμένα αποτελέσματα, προχωράμε στη διερεύνηση δύο νέων σταδίων: το πρώτο αφορά την ενίσχυσης της αρχικής περιοχής ενδιαφέροντος στοχεύοντας στη βελτίωση της αντίθεσής της, ενώ το δεύτερο αφορά την εισαγωγή χαρακτηριστικών θέσης για την περαιτέρω περιγραφή του ευρήματος. Σχετικά με το πρώτο στάδιο, αναπτύσσονται και συγκρίνονται διαφορετικές μέθοδοι ενίσχυσης εικόνας σε υποσύνολα μαστογραφιών που περιέχουν περιπτώσεις διαφορετικής πυκνότητας μαστού και βαθμού δυσκολίας. Τα αποτελέσματα της σύγκρισης φανερώνουν πως συγκεκριμένοι παράγοντες της μαστογραφίας καθορίζουν την ανάγκη εφαρμογής διαφορετικών αλγορίθμων προκειμένου να καταλήξουμε σε βελτιστοποίηση της διαγνωστικής διαδικασίας. Όσον αφορά το δεύτερο στάδιο, αναπτύσσουμε μεθοδολογίες για τον εντοπισμό κρίσιμων ανατομικών δομών του μαστού (περιφέρεια μαστού, θωρακικός μυς, θηλή) προκειμένου να εξάγουμε χαρακτηριστικά για την περιγραφή της σχετικής θέσης του ευρήματος μέσα στο μαστό. Τα χαρακτηριστικά αυτά αξιοποιούνται περαιτέρω για την ανάπτυξη ενός μαστογραφικού άτλαντα, που παρουσιάζει περιοχές του μαστού με αυξημένη συχνότητα εμφάνισης των ευρημάτων, ενώ παράλληλα εισάγουμε τη χρήση πιθανοτικών χαρτών όπου αναδεικνύονται περιοχές με αυξημένη πιθανότητα για κακοήθεια. Οι συγκεκριμένοι χάρτες αξιοποιούνται για τη δημιουργία ενός μοντέλου που θα παρέχει εκ των προτέρων εκτίμηση της επικινδυνότητας ενός συμπλέγματος μικροασβεστώσεων σε μια νέα μαστογραφία, εξάγοντας πληροφορίες από τη σχετική θέση του συμπλέγματος μέσα στο μαστό. Στο τελευταίο λοιπόν στάδιο, αξιοποιούμε τα συμπεράσματα που έχουμε εξάγει στα προηγούμενα κεφάλαια και συνδυάζουμε τις προτεινόμενες μεθοδολογίες προκειμένου να καταλήξουμε σε ένα σενάριο χρήσης του CADx συστήματος σε συνθήκες κλινικής πρακτικής, προσομοιώνοντας την αλληλεπίδραση μεταξύ ακτινολόγων και CADx συστήματος. Το προτεινόμενο σενάριο περιλαμβάνει αξιοποίηση του CADx συστήματος, όπου όμως οι υποδείξεις του ακτινολόγου καθορίζουν την επιλογή των καταλληλότερων μεθοδολογιών για την ανάλυση της περιοχής ενδιαφέροντος. Τα μοντέλα του μαστογραφικού άτλαντα και των πιθανοτικών χαρτών αξιοποιούνται προκειμένου να εξαχθεί ένα ποσοστό επικινδυνότητας που σχετίζεται αποκλειστικά με τη θέση του ευρήματος στη μαστογραφία. Παράλληλα, υπολογίζεται ένα ποσοστό επικινδυνότητας που προκύπτει από την περιγραφή του ευρήματος σύμφωνα με το πρότυπο BIRADS, ενώ συνεκτιμάται και η ηλικία της ασθενούς που μπορεί να προσδώσει επιπλέον διαγνωστική αξία. Το προτεινόμενο σενάριο αξιολογείται σε ένα σύνολο ελέγχου 481 περιπτώσεων όπου επιτυγχάνεται τιμή διαχωρισμού μεταξύ καλόηθων και κακόηθων περιπτώσεων Az=0.861. O συνδυασμός μάλιστα της διάγνωσης του ακτινολόγου και του CADx συστήματος οδηγεί σε υψηλά επίπεδα ευαισθησίας (97.2%) και ειδικότητας (41.1%), βελτιώνοντας τις επιδόσεις των ακτινολόγων που παρατηρήθηκαν χωρίς χρήση του CADx συστήματος (ευαισθησία 93.5%, ειδικότητα 16.6%).
In the present PhD thesis, we develop methodologies which may be integrated in a computer aided diagnosis system (CADx) for clusters of microcalcifications detected in mammographic images. Microcalcifications are tiny deposits of calcium that can be located anywhere inside the breast and their presence is associated to the existence of breast cancer. The development of the system includes various independent steps such as image preprocessing, aiming to the enhancement of image quality and the detection of important mammographic structures, the segmentation of the microcalcifications from the original image, in order to isolate the findings from the background, the extraction of features describing the findings and finally the application of feature selection and classification methods for the discrimination between benign and malignant findings. Thus, we present the methods implemented for each different stage of the computer aided diagnosis system. We performed the analysis of a microcalcifications cluster by extracting features concerning the morphology and the brightness of the findings, their distribution inside the cluster, the morphology of the cluster and the texture of the surrounding tissue. We also evaluated and compared different feature selection methods and classification schemes, in order to find the most efficient combination which leads to optimization of the classification results. After developing all subunits of the system, we proceed on its evaluation in order to investigate its efficacy and its potential to be adopted in daily clinical practice. For the evaluation of the system we used images from real-life cases provided by public databases. A subset of 22 cases from the MIAS database and 1715 cases from the DDSM database was used, achieving consequently objective results, as it is the greatest subset of images used in studies concerning the automated diagnosis of clusters of microcalcifications. Through our measurements, we extract valuable conclusions concerning the factors that influence the analysis of mammograms, we investigate the performance using subsets of cases of different properties, we compare different feature extraction methodologies in order to locate the best subsets of features for the discrimination of clusters and finally we compare the classification results of the system with the corresponding results obtained by the radiologists that analyzed the same dataset. The results are encouraging, since there are subsets of cases where we achieve high classification results (Az=0.91), while we outperformed the results achieved by the radiologists. Additionally, the classification results of the present study are comparable or even superior to those reported in the literature. Based on the previous results and conclusions, we investigate two new stages: the first concerns the enhancement of the initial region of interest aiming at the improvement of its contrast, while the second stage concerns the introduction of location features for the diagnosis of the finding. As far as the first stage is concerned, we implemented and compared different image enhancement techniques on subsets of mammograms of varying breast density and subtlety. The results of the comparison reveal that specific properties of the mammogram determine the need of different algorithms in order to optimize the diagnostic process. Concerning the second stage, we develop methodologies for the identification of important breast landmarks (breast periphery, pectoral muscle and nipple) in order to extract features that describe the relative location of the cluster inside the breast. These features are used to develop a mammographic atlas which presents regions of the breast with high occurrence of clusters of microcalcifications. We also introduce the use of probabilistic maps which reveal areas of the breast with increased probability for malignancy. The specific maps are used for the development of a classification model able to provide a priori risk estimation for a cluster of microcalcifications, based absolutely on information extracted from the relative location of the cluster inside the breast. At the last chapter, we use the conclusions that we extracted previously and we combine the proposed methodologies, in order to form a scenario for the use of the CADx system in the daily clinical practice, by simulating the interaction between the radiologists and the CADx system. The proposed scenario includes the use of the CADx system where the suggestions of the radiologist determine the selection of the most appropriate methodologies to analyze the region of interest. The mammographic atlas and the probabilistic maps are used to extract a risk estimation related absolutely to the location of the cluster. Additionally, an extra risk estimation is calculated which is based on the description of the finding following terms described in the BIRADS standard, while the age of the patient is also used to add extra diagnostic information. The proposed scenario is evaluated using a subset of 481 cases and the Az value achieved is 0.861. If the diagnoses of both the radiologists and the CADx system are combined, we achieve high levels of sensitivity (97.2%) and specificity (41.1%), improving consequently the performance of the radiologist without using the CADx system (sensitivity 93.5%, specificity 16.6%).