dc.contributor.author | Συρρή, Αγγελική Εμμανουέλα | el |
dc.contributor.author | Syrri, Angeliki Emmanouela | en |
dc.date.accessioned | 2025-01-17T11:31:56Z | |
dc.date.available | 2025-01-17T11:31:56Z | |
dc.identifier.uri | https://dspace.lib.ntua.gr/xmlui/handle/123456789/60870 | |
dc.identifier.uri | http://dx.doi.org/10.26240/heal.ntua.28566 | |
dc.rights | Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ | * |
dc.subject | Καρκίνος του μαστού | el |
dc.subject | Μηχανική Μάθηση | el |
dc.subject | Νευρωνικά Δίκτυα | el |
dc.subject | Σταδιοποίηση | el |
dc.subject | Ταξινόμηση | el |
dc.subject | Breast cancer | en |
dc.subject | Classification | en |
dc.subject | Machine Learning | en |
dc.subject | Neural Networks | en |
dc.subject | Staging | en |
dc.title | Διερεύνηση και ταξινόμηση σταδίων καρκίνου του μαστού ϐάσει γονιδιακών δεδομένων | el |
dc.title | Exploration and classification of breast cancer stages based on genomic data | en |
heal.type | bachelorThesis | |
heal.classification | Βιοϊατρική | el |
heal.language | el | |
heal.access | free | |
heal.recordProvider | ntua | el |
heal.publicationDate | 2024-07-15 | |
heal.abstract | Η σταδιοποίηση του καρκίνου είναι η διαδικασία προσδιορισμού της ανάπτυξης και της εξάπλωσής του καρκίνου σε όλο το σώμα, και χρησιμεύει ως κρίσιμη προϋπόθεση στην κλινική πρακτική για τον σχεδιασμό της θεραπείας και την αξιολόγηση της πρόγνωσης. Οι ασθενείς που ταξινομούνται στο ίδιο στάδιο έχουν συνήθως παρόμοιες προγνώσεις και επωφελούνται από παρόμοια πλάνα θεραπείας. Παρά τις υπάρχουσες μεθόδους ανίχνευσης σταδίου καρκίνου, παρουσιάζονται περιορισμοί που καθιστούν αναγκαία την εξερεύνηση καινοτόμων προσεγγίσεων. Η παρούσα διπλωματική εργασία διερευνά την ανάπτυξη ενός μοντέλου βασισμένου σε γονιδιακά δεδομένα για την ταξινόμηση των παθολογικών σταδίων των ασθενών. Η εστίαση είναι στη διαφοροποίηση μεταξύ των σταδίων I, II και III του καρκίνου του μαστού. Στο πλαίσιο αυτό, εξετάστηκαν πέντε διαφορετικές μεθοδολογίες για την επίλυση του προβλήματος, χρησιμοποιώντας τόσο κλασσικούς αλγόριθμους μηχανικής μάθησης όσο και τεχνικές νευρωνικών δικτύων, τύπου Πολλαπλών Επιπέδων Perceptrons (MLP). Τα έμφυτα προβλήματα των βιοϊατρικών δεδομένων, και ειδικότερα των δεδομένων γονιδιακής έκφρασης, περιλαμβάνουν την υψηλή διαστασιμότητα και την άνιση κατανομή των κλάσεων. Για την αντιμετώπιση αυτών των προκλήσεων, χρησιμοποιούνται τεχνικές επιλογής χαρακτηριστικών, όπως η μετατροπή των γονιδιακών δεδομένων σε βιολογικά μονοπάτια με ανάλυση εμπλουτισμού συνόλων γονιδίων (GSE), καθώς και η χρήση των κλινικών μεταδεδομένων των ασθενών για τη μείωση της ετερογένειας εντός του συνόλου. Επιπλέον, για τον εμπλουτισμό του συνόλου εκπαίδευσης, εφαρμόζονται τεχνικές δημιουργίας συνθετικών δεδομένων. Παράλληλα, μια άλλη μέθοδος αφορά τον μετασχηματισμό του προβλήματος ταξινόμησης σταδίων σε πρόβλημα ταξινόμησης μεταβάσεων σταδίων. Τα αποτελέσματα της μελέτης υπογραμμίζουν τις εγγενείς προκλήσεις και τους περιορισμούς στην επίτευξη του επιθυμητού επιπέδου ακρίβειας και αξιοπιστίας στην ταξινόμηση σταδίων βάσει γονιδιωματικών δεδομένων. Παρά τις δυσκολίες, η προτεινόμενη μεθοδολογία μπορεί να επεκταθεί σε άλλα είδη καρκίνων που παρουσιάζουν μικρότερο βαθμό ετερογένειας σε σχέση με τον καρκίνο του μαστού. Συνοψίζοντας, η παρούσα εργασία προτείνει ένα σύνολο μοντέλων πρόγνωσης σταδίων του καρκίνου του μαστού που βασίζονται σε γονιδιακά δεδομένα και παράγωγα τους, αξιολογώντας την αποτελεσματικότητα και τους περιορισμούς διαφορετικών μεθοδολογιών και τεχνολογιών, και παρέχει μια βάση για μελλοντική έρευνα και βελτιώσεις των αλγορίθμων και των τεχνικών επιλογής χαρακτηριστικών. | el |
heal.abstract | Cancer staging is the process of determining the growth and spread of cancer throughout the body. It serves as a critical prerequisite in clinical practice for treatment planning and prognosis assessment. Patients in the same stage share similar prognosis and hence, benefit from similar treatment plans. Despite existing methods for cancer staging detection, limitations persist, necessitating the exploration of innovative approaches. This thesis investigates the development of a model based on genomic data for classification of patients' pathological stages, focusing on distinguishing between stages I, II, and III of breast cancer. To address this problem, five different methodologies were examined, utilizing both classical machine learning algorithms and neural network techniques, such as Multi-Layer Perceptrons (MLP). The inherent challenges of biomedical data, particularly gene expression data, include high dimensionality and imbalanced class distribution. To tackle these challenges, feature engineering techniques are employed, such as transforming genomic data into biological pathways using Gene Set Enrichment Analysis (GSEA), and leveraging patients' clinical metadata to reduce heterogeneity within the dataset. Additionally, synthetic data generation techniques are applied to augment the training set. Another method tested involves the transformation of the problem into a stage transition classification task to refine the focus on changes between consecutive stages. The study's results highlight the inherent challenges and limitations in achieving the desired level of accuracy and reliability in stage classification based on genomic data. Despite the difficulties, the proposed methodology can be extended to other cancer types with lower heterogeneity compared to breast cancer. In summary, this thesis proposes a set of models for breast cancer staging classification based on genomic data and derived biological insights. It evaluates the effectiveness and limitations of various methodologies and technologies, offering a basis for future research and potential advancements in the field. | en |
heal.advisorName | Ματσόπουλος, Γεώργιος | el |
heal.committeeMemberName | Ματσόπουλος, Γεώργιος | el |
heal.committeeMemberName | Παναγόπουλος, Αθανάσιος Δ. | el |
heal.committeeMemberName | Τσανάκας, Παναγιώτης | el |
heal.academicPublisher | Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών | el |
heal.academicPublisherID | ntua | |
heal.numberOfPages | 112 σ. | el |
heal.fullTextAvailability | false |
Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο: