Soutenances de thèses :
Le 13 décembre 2022 à 14h - Campus de La Gaillarde - Amphi Philippe Lamour
Présentée par Cassan Océane - IPSiM
Inférence statistique des réseaux de régulation de gènes chez Arabidopsis thaliana en réponse à l'élévation des teneurs en CO2 atmosphériques
L'activité humaine provoque une élévation des niveaux de CO2 dans l'atmosphère, qui devraient passer de 420 ppm à environ 1000 ppm d'ici la fin du siècle. Les plantes en C3, qui constituent une grande partie des plantes cultivées, sont particulièrement touchées par l'augmentation des niveaux de CO2. Bien que l'on s'attende à une stimulation de la production de biomasse dans des conditions de CO2 élevé (eCO2), ce gain s'accompagne d'un appauvrissement marqué de la composition minérale des plantes et d'une diminution particulièrement forte de leur teneur en azote (N). Cela constitue une menace majeure pour la nutrition humaine, que nous proposons de commencer à traiter par des approches de biologie des systèmes. Les hypothèses prometteuses pour expliquer ce déclin invoquent une perturbation des voies de signalisation associées à l'absorption et à l'assimilation de l'azote, ce qui motive l'étude à l'échelle génomique de la reprogrammation de l'expression des gènes dans les racines de la plante modèle Arabidopsis thaliana sous eCO2. Pour découvrir les régulateurs encore inconnus qui orchestrent ces réseaux, nous avons développé des méthodes statistiques pour l'inférence des réseaux de régulation de gènes (GRN). La modélisation des dépendances transcriptionnelles à partir de données d'expression peut être effectuée par des techniques basées sur la régression, une tâche difficile entravée par le phénomène de grande dimension et par le manque de données de validation. Nous proposons deux nouvelles approches : (i) l'extension d'une méthode basée sur les forêts aléatoires, GENIE3, via une procédure par permutations évaluant la significativité des interactions de régulation que nous incluons dans une suite complète pour l'inférence de GRN (DIANE), et (ii) deux méthodes d'inférence de GRN intégratives basées sur les forêts aléatoires et sur la régression linéaire sparse avec sélection de stabilité, intégrant les sites de fixation des facteurs de transcription (TFBS) aux données d'expression. Nous comparons ces méthodes à des gold-standards expérimentaux et montrons qu'elles améliorent la pertinence biologique des GRNs inférés chez Arabidopsis thaliana. Nous avons appliqué ces approches d'inférence à un jeu de données transcriptomiques combinatoires de tissus racinaires dans des conditions contrastées en niveaux de CO2 en apports nutritionnels, et aux racines de plantes exposées à un gradient de concentrations de CO2. Les GRNs inférés ont fourni des gènes candidats pour le contrôle de cette réponse, et nous démontrons que certains d'entre eux régulent la stimulation de la croissance sous eCO2 sans pénaliser la teneur en nutriments des parties aériennes. Globalement, nos résultats indiquent que les gènes clés de la nutrition en nitrate et en fer et leurs régulateurs connus sont dérégulés par l'augmentation du CO2, et que les voies associées aux systèmes de transport de nitrate à haute affinité sont particulièrement altérées. Le dernier objectif de ce travail était de tirer parti de la variabilité génétique naturelle pour identifier les gènes contrôlant la réponse du ionome à l'élévation du CO2. Nous avons confirmé une baisse du contenu minéral dans trois populations d'Arabidopsis à différentes échelles géographiques, et montré que la variabilité de cette réponse peut être expliquée par des déterminants génétiques dans le panel mondial via des modèles linéaires mixtes. Nous avons mis en avant un autre ensemble de gènes candidats, fortement associés à l'appauvrissement en fer, N et zinc dans les pousses sous eCO2, qui ouvrent la voie à la conception de plantes à valeur nutritionnelle préservée pour le futur proche.