Αντικείμενο της παρούσης διδακτορικής διατριβής είναι η μελέτη των μηχανισμών ρύθμισης δυο οργανισμών βιοτεχνολογικού ενδιαφέροντος, του φυτού της ελαιοκράμβης και του βακτηρίου Escherichia coli, με μεθοδολογίες Βιολογίας Συστημάτων. Προκειμένου οι βιολογικοί μηχανισμοί να γίνουν κατανοητοί με την έννοια του συστήματος, είναι απαραίτητη η ολιστική εξέταση των βιολογικών δομών σε διάφορα επίπεδα οργάνωσης (γονιδιώματος, κυττάρου, ιστού κ.α.) καθώς και των δυναμικών ιδιοτήτων τους, αντί για τη μελέτη των χαρακτηριστικών των μεμονωμένων μερών ενός κυττάρου ή ενός οργανισμού.
Αρχικά, παρουσιάζεται η ανάπτυξη υπολογιστικού μοντέλου μεγάλης κλίμακας του κεντρικού μεταβολισμού του εμβρύου της ελαιοκράμβης (Brassica napus) που θεωρείται κυτταρικό εργοστάσιο παραγωγής ελαίου υψηλής προστιθέμενης αξίας. Η ανάπτυξη μοντέλων για την εφαρμογή προσομοιώσεων επιτρέπει τη συστηματική εισαγωγή διαταραχών και συνεπακόλουθη μελέτη των επιπτώσεών τους. Στο υπολογιστικό μοντέλο εφαρμόστηκαν μαθηματικές μέθοδοι μείωσης της πολυπλοκότητας έτσι ώστε οι ιδιότητες του μεταβολικού δικτύου να αναχθούν σε μικρό αριθμό σημαντικών ρυθμιστικών αντιδράσεων. Συνεπώς, επετεύχθη η ποσοτικοποίηση του ρυθμιστικού ρόλου των ενζυμικών δραστικοτήτων και αναδείχθηκαν οι πιο σημαντικοί εν δυνάμει ενζυμικοί στόχοι για την ρύθμιση του μεταβολισμού, με έμφαση στη βιοσύνθεση των λιπιδίων. Οι υπολογιστικές προσομοιώσεις της ανάπτυξης του εμβρύου που πραγματοποιήθηκαν, ήταν σύμφωνες με πειραματικές παρατηρήσεις από τη βιβλιογραφία και απέδειξαν τη λειτουργικότητα του μοντέλου αλλά και τη χρησιμότητά του για τη μελέτη του ρυθμιστικού ρόλου μεταγραφικών παραγόντων. Επίσης, πιθανοί ενζυμικοί στόχοι για την ρύθμιση της βιοσύνθεσης των λιπιδίων εξετάστηκαν μέσω της εφαρμογής υπολογιστικής προσομοίωσης γενετικών τροποποιήσεων.
Στο δεύτερο μέρος της διατριβής παρουσιάζεται η ανάπτυξη μιας υπολογιστικής διαδικασίας πρόβλεψης στόχων μεταγραφικών παραγόντων, σε επίπεδο ολόκληρου γονιδιώματος του βακτηρίου Escherichia coli. Οι μεταγραφικοί παράγοντες αποτελούν το κύριο μέσο ρύθμισης της έκφρασης των γονιδίων και μετάδοσης σήματος στο κύτταρο. Μια κατηγορία μεταγραφικών παραγόντων, οι ρυθμιστές απόκρισης, αποτελούν μέρη των συστημάτων δυο συστατικών και ελέγχουν την μεταγραφική απόκριση των βακτηριακών κυττάρων στα εξωτερικά ερεθίσματα του περιβάλλοντος. Η μελέτη των συστημάτων δυο συστατικών παρουσιάζει ιδιαίτερο ενδιαφέρον στη Βιοτεχνολογία, καθώς αυτά αποτελούν τη μοριακή βάση μιας σειράς βασικών βακτηριακών ιδιοτήτων (χημειόταξη, αντίσταση στα αντιβιοτικά, βιοσύνθεση μεταβολικών προϊόντων υψηλής προστιθέμενης αξίας κ.α). Η υπολογιστική διαδικασία που αναπτύχθηκε στα πλαίσια της διατριβής επιτρέπει την αυτόματη ανίχνευση πολλαπλών θέσεων πρόσδεσης μεταγραφικών παραγόντων και συνεπακόλουθης στατιστικής ανάλυσης Όρων Γονιδιακών Οντολογιών, με σκοπό τη σύνδεση των θέσεων πρόσδεσης με βιοχημικά μονοπάτια. Η διαδικασία αυτή εφαρμόστηκε στη μελέτη του συστήματος δυο συστατικών AtoSC και ανέδειξε πιθανούς γονιδιακούς στόχους, εκ των οποίων 21 επιβεβαιώθηκαν και πειραματικά. Συνεπώς, η υπολογιστική διαδικασία που παρουσιάζεται, εκτός από την ανάδειξη της μοριακής βάσης λειτουργιών του AtoSC, αποτελεί συμβολή στη διαλεύκανση των πολύπλοκων δικτύων των βακτηριακών σηματοδοτικών μηχανισμών ρύθμισης, μέσω της στατιστικής σύνδεσης βιολογικών μονοπατιών με ελάχιστα διατηρημένες ρυθμιστικές αλληλουχίες DNA.
The scope of the present thesis is the study of regulatory mechanisms of two organisms of great biotechnological interest, the plant rapeseed and the bacterium Escherichia coli, by applying Systems Biology methodologies. In order to understand a biological mechanism as a system, it is necessary to examine the biological structures and their dynamic properties in a holistic manner and in different levels of organization (genomic, cellular, tissue etc.), instead of investigating the properties of isolated components.
Firstly, the development of a large-scale computational model is presented, which describes the central metabolism of the rapeseed embryo (Brassica napus) that is considered as a cellular factory of production of oil with high added value. The computational modeling permits the simulation of the systematic application of perturbations and the subsequent investigation of their effect. The developed computational model was subjected to mathematical methods for complexity reduction in order to reduce the metabolic network properties to a small number of important regulatory reactions. Therefore, the quantification of the regulatory role of the enzymatic activities was achieved, resulting to the highlight of the most important potential enzymatic targets for the regulation of metabolism, with emphasis to lipid biosynthesis. The computational simulations of seed development were consistent with experimental measurements from the literature and they hence confirmed the model functionality as well as its usefulness to the study of the regulatory role of transcription factors. Further, potential enzymatic targets for lipid biosynthesis regulation were investigated by applying computational simulations of genetic modifications.
In the second part, a computational procedure is presented, which performs automatic detection of transcription factor binding sites in the level of the whole genome of the bacterium Escherichia coli. The transcription factors are the main mechanism of gene expression regulation and signal transduction in the cell. A particular category of transcription factors, the response regulators, control the transcriptional response of the bacterial cells to external environmental stimuli, as parts of Two-Component Systems. The study of these systems is important to Biotechnology as they are behind the molecular basis of main bacterial properties (chemiotaxis, resistance to antibiotics, biosynthesis of high added-value products etc). The developed computational procedure permits the automatic detection of multiple transcription factor binding sites and the subsequent statistical analysis of Gene Ontology Terms, in order to correlate the binding sites with biochemical pathways. The procedure was applied to the study of the Two-Component System AtoSC and detected many potential gene targets, 21 of which were experimentally confirmed. Thus, the presented computational procedure not only revealed the molecular basis of AtoSC functions, but it also represents an important contribution to the examination of networks of bacterial signal transduction regulatory mechanisms, by statistically correlating biological functions with weakly conserved regulatory DNA sequences.