HEAL DSpace

Διερεύνηση και ταξινόμηση σταδίων καρκίνου του μαστού ϐάσει γονιδιακών δεδομένων

Αποθετήριο DSpace/Manakin

Εμφάνιση απλής εγγραφής

dc.contributor.author Συρρή, Αγγελική Εμμανουέλα el
dc.contributor.author Syrri, Angeliki Emmanouela en
dc.date.accessioned 2025-01-17T11:31:56Z
dc.date.available 2025-01-17T11:31:56Z
dc.identifier.uri https://dspace.lib.ntua.gr/xmlui/handle/123456789/60870
dc.identifier.uri http://dx.doi.org/10.26240/heal.ntua.28566
dc.rights Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα *
dc.rights.uri http://creativecommons.org/licenses/by-nc-nd/3.0/gr/ *
dc.subject Καρκίνος του μαστού el
dc.subject Μηχανική Μάθηση el
dc.subject Νευρωνικά Δίκτυα el
dc.subject Σταδιοποίηση el
dc.subject Ταξινόμηση el
dc.subject Breast cancer en
dc.subject Classification en
dc.subject Machine Learning en
dc.subject Neural Networks en
dc.subject Staging en
dc.title Διερεύνηση και ταξινόμηση σταδίων καρκίνου του μαστού ϐάσει γονιδιακών δεδομένων el
dc.title Exploration and classification of breast cancer stages based on genomic data en
heal.type bachelorThesis
heal.classification Βιοϊατρική el
heal.language el
heal.access free
heal.recordProvider ntua el
heal.publicationDate 2024-07-15
heal.abstract Η σταδιοποίηση του καρκίνου είναι η διαδικασία προσδιορισμού της ανάπτυξης και της εξάπλωσής του καρκίνου σε όλο το σώμα, και χρησιμεύει ως κρίσιμη προϋπόθεση στην κλινική πρακτική για τον σχεδιασμό της θεραπείας και την αξιολόγηση της πρόγνωσης. Οι ασθενείς που ταξινομούνται στο ίδιο στάδιο έχουν συνήθως παρόμοιες προγνώσεις και επωφελούνται από παρόμοια πλάνα θεραπείας. Παρά τις υπάρχουσες μεθόδους ανίχνευσης σταδίου καρκίνου, παρουσιάζονται περιορισμοί που καθιστούν αναγκαία την εξερεύνηση καινοτόμων προσεγγίσεων. Η παρούσα διπλωματική εργασία διερευνά την ανάπτυξη ενός μοντέλου βασισμένου σε γονιδιακά δεδομένα για την ταξινόμηση των παθολογικών σταδίων των ασθενών. Η εστίαση είναι στη διαφοροποίηση μεταξύ των σταδίων I, II και III του καρκίνου του μαστού. Στο πλαίσιο αυτό, εξετάστηκαν πέντε διαφορετικές μεθοδολογίες για την επίλυση του προβλήματος, χρησιμοποιώντας τόσο κλασσικούς αλγόριθμους μηχανικής μάθησης όσο και τεχνικές νευρωνικών δικτύων, τύπου Πολλαπλών Επιπέδων Perceptrons (MLP). Τα έμφυτα προβλήματα των βιοϊατρικών δεδομένων, και ειδικότερα των δεδομένων γονιδιακής έκφρασης, περιλαμβάνουν την υψηλή διαστασιμότητα και την άνιση κατανομή των κλάσεων. Για την αντιμετώπιση αυτών των προκλήσεων, χρησιμοποιούνται τεχνικές επιλογής χαρακτηριστικών, όπως η μετατροπή των γονιδιακών δεδομένων σε βιολογικά μονοπάτια με ανάλυση εμπλουτισμού συνόλων γονιδίων (GSE), καθώς και η χρήση των κλινικών μεταδεδομένων των ασθενών για τη μείωση της ετερογένειας εντός του συνόλου. Επιπλέον, για τον εμπλουτισμό του συνόλου εκπαίδευσης, εφαρμόζονται τεχνικές δημιουργίας συνθετικών δεδομένων. Παράλληλα, μια άλλη μέθοδος αφορά τον μετασχηματισμό του προβλήματος ταξινόμησης σταδίων σε πρόβλημα ταξινόμησης μεταβάσεων σταδίων. Τα αποτελέσματα της μελέτης υπογραμμίζουν τις εγγενείς προκλήσεις και τους περιορισμούς στην επίτευξη του επιθυμητού επιπέδου ακρίβειας και αξιοπιστίας στην ταξινόμηση σταδίων βάσει γονιδιωματικών δεδομένων. Παρά τις δυσκολίες, η προτεινόμενη μεθοδολογία μπορεί να επεκταθεί σε άλλα είδη καρκίνων που παρουσιάζουν μικρότερο βαθμό ετερογένειας σε σχέση με τον καρκίνο του μαστού. Συνοψίζοντας, η παρούσα εργασία προτείνει ένα σύνολο μοντέλων πρόγνωσης σταδίων του καρκίνου του μαστού που βασίζονται σε γονιδιακά δεδομένα και παράγωγα τους, αξιολογώντας την αποτελεσματικότητα και τους περιορισμούς διαφορετικών μεθοδολογιών και τεχνολογιών, και παρέχει μια βάση για μελλοντική έρευνα και βελτιώσεις των αλγορίθμων και των τεχνικών επιλογής χαρακτηριστικών. el
heal.abstract Cancer staging is the process of determining the growth and spread of cancer throughout the body. It serves as a critical prerequisite in clinical practice for treatment planning and prognosis assessment. Patients in the same stage share similar prognosis and hence, benefit from similar treatment plans. Despite existing methods for cancer staging detection, limitations persist, necessitating the exploration of innovative approaches. This thesis investigates the development of a model based on genomic data for classification of patients' pathological stages, focusing on distinguishing between stages I, II, and III of breast cancer. To address this problem, five different methodologies were examined, utilizing both classical machine learning algorithms and neural network techniques, such as Multi-Layer Perceptrons (MLP). The inherent challenges of biomedical data, particularly gene expression data, include high dimensionality and imbalanced class distribution. To tackle these challenges, feature engineering techniques are employed, such as transforming genomic data into biological pathways using Gene Set Enrichment Analysis (GSEA), and leveraging patients' clinical metadata to reduce heterogeneity within the dataset. Additionally, synthetic data generation techniques are applied to augment the training set. Another method tested involves the transformation of the problem into a stage transition classification task to refine the focus on changes between consecutive stages. The study's results highlight the inherent challenges and limitations in achieving the desired level of accuracy and reliability in stage classification based on genomic data. Despite the difficulties, the proposed methodology can be extended to other cancer types with lower heterogeneity compared to breast cancer. In summary, this thesis proposes a set of models for breast cancer staging classification based on genomic data and derived biological insights. It evaluates the effectiveness and limitations of various methodologies and technologies, offering a basis for future research and potential advancements in the field. en
heal.advisorName Ματσόπουλος, Γεώργιος el
heal.committeeMemberName Ματσόπουλος, Γεώργιος el
heal.committeeMemberName Παναγόπουλος, Αθανάσιος Δ. el
heal.committeeMemberName Τσανάκας, Παναγιώτης el
heal.academicPublisher Εθνικό Μετσόβιο Πολυτεχνείο. Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών. Τομέας Συστημάτων Μετάδοσης Πληροφορίας και Τεχνολογίας Υλικών el
heal.academicPublisherID ntua
heal.numberOfPages 112 σ. el
heal.fullTextAvailability false


Αρχεία σε αυτό το τεκμήριο

Οι παρακάτω άδειες σχετίζονται με αυτό το τεκμήριο:

Αυτό το τεκμήριο εμφανίζεται στην ακόλουθη συλλογή(ές)

Εμφάνιση απλής εγγραφής

Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα Εκτός από όπου ορίζεται κάτι διαφορετικό, αυτή η άδεια περιγράφεται ως Αναφορά Δημιουργού-Μη Εμπορική Χρήση-Όχι Παράγωγα Έργα 3.0 Ελλάδα