Informations

Gènes paralogues dans les études d'association à l'échelle du génome ?

Gènes paralogues dans les études d'association à l'échelle du génome ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Quelqu'un a-t-il testé si les gènes paralogues sont surreprésentés parmi les gènes identifiés par les études d'association pangénomique (GWAS) ?

Par exemple, si une étude GWAS trouve 200 gènes associés à la maladie/au trait, et qu'un certain nombre X de ceux-ci peuvent être classés comme appartenant à Y familles de gènes différentes, existe-t-il un test pour voir si X et Y sont plus gros que prévu, étant donné le nombre total de gènes et de paralogies de gènes dans un génome ? Ici, je parle de copies établies de longue date au sein d'une espèce, et non de CNV chez différents individus de la même espèce.

Je pense qu'il y a une question intéressante derrière cela : si un gène s'est dupliqué au cours de l'évolution d'un génome, et que les différentes copies de gènes ont joué des rôles spécialisés, mais liés, une analyse impartiale comme GWAS devrait être capable de trouver des cas où différents les copies paralogues s'associent à différentes sous-maladies/sous-traits au sein d'une même maladie/caractère global.


Il n'y a aucun rapport de littérature disant une telle chose. Cependant, j'ai fait une vérification rapide de l'étude GWAS sur le neuroblastome.

  • SNP sélectionnés avec une valeur p> 0,05
  • Valeurs p converties en score -
    -Journal10(valeur p)
  • Mappé les SNP aux gènes tout en calculant le score cumulatif pour un gène

J'ai juste trié les gènes en fonction de leurs noms, en supposant que de nombreux paralogues ont des noms similaires. Je sais que ce n'est pas la bonne façon de procéder. Cependant, j'ai trouvé de nombreux groupes nommés similaires dans la liste.

Maintenant, la prochaine étape consiste à trouver des paralogues réels et à marquer le score cumulé pour un groupe de paralogues. C'est une petite tâche :

  • Obtenir des séquences de gènes
  • Exécutez une recherche BLAST pour trouver des paralogues
  • Attribuez des gènes à des groupes et trouvez des scores

Je peux partager le fichier avec les gènes et les scores. Cependant, je ne continuerais que si quelqu'un est réellement intéressé à poursuivre cela - cela pourrait être un document de recherche.

PS: Si vous voulez le fichier, commentez simplement votre identifiant de messagerie. Un idiot d'administrateur informatique a bloqué rapidshare/4shared, etc.


Les sources génétiques de variation phénotypique ont été au centre des études sur les plantes et les animaux visant à identifier les causes des maladies, à améliorer l'agriculture et à comprendre les processus d'adaptation. Chez les plantes, les loci de caractères quantitatifs (QTL) ont été cartographiés à l'origine dans des croisements biparentaux, mais ils étaient limités en diversité allélique et en ayant une résolution génomique limitée [1]. L'approche d'association à l'échelle du génome (GWAS) surmonte plusieurs limitations de la cartographie génique traditionnelle en (i) fournissant une résolution plus élevée, souvent au niveau du gène, et (ii) en utilisant des échantillons de populations précédemment bien étudiées dans lesquelles les variations génétiques courantes peuvent être associée à une variation phénotypique. L'avènement du typage du polymorphisme mononucléotidique (SNP) à haute densité a permis aux analyses du génome entier d'identifier souvent de petits blocs d'haplotypes qui sont significativement corrélés avec la variation quantitative des traits. Ces approches ont permis à la fois de vastes études sur les maladies humaines, qui ont identifié des loci importants [2], et des études récentes sur les plantes qui ont réussi à identifier des loci qui expliquent une grande partie de la variation phénotypique.

Des associations significatives entre les variations génétiques et la diversité phénotypique ont été trouvées dans certaines études humaines, mais elles n'expliquent que quelques pour cent de la diversité phénotypique, amenant de nombreux généticiens à se demander « Où est l'héritabilité manquante ? » [3, 4]. Cette question a plusieurs réponses possibles. Premièrement, des variants rares [3–5], des allèles majeurs uniques aux familles locales, ne peuvent être détectés que lorsque l'échantillonnage est adéquat au niveau local. Deuxièmement, l'hétérogénéité allélique, le phénomène dans lequel plusieurs allèles fonctionnels du même gène existent et sont associés à différents phénotypes, est courant, en particulier dans de larges échantillons de population [6-8]. Troisièmement, les approches à marqueur unique souffrent d'hétérogénéité génétique lorsque plusieurs loci majeurs sont impliqués et en déséquilibre de liaison (LD) entre eux [9]. Quatrièmement, les variations résultant des interactions épistatiques entre les gènes pourraient ne pas être découvertes car l'épistasie ne peut être étudiée pratiquement que dans une analyse séquentielle des principaux loci communs et du génome [10]. Enfin, la variation épigénétique, qui nécessite un génotypage sophistiqué, est susceptible d'être une source d'héritabilité manquante [11]. L'influence de chacun de ces facteurs sur l'héritabilité dépend fortement de la population échantillonnée. Ainsi, même les vrais positifs échoueront souvent à se répliquer dans les populations. En raison de l'effet confusionnel de la structure de la population, les vrais SNP causals sont difficiles à identifier car ils sont en LD (c'est-à-dire en association non aléatoire) avec de nombreux loci dans le génome [6].

Lorsque les GWAS humains trouvent des associations qui ont une signification à l'échelle du génome, les SNP n'expliquent qu'une infime fraction de la variation phénotypique révélée par les études familiales [12]. Mais les résultats des récents GWAS dans les plantes (en Arabidopsis thaliana, riz et maïs) ont expliqué une proportion beaucoup plus importante de la variation phénotypique que celle expliquée par les études GWAS humaines. Il semble que, chez les plantes au moins, l'hypothèse selon laquelle la variation génétique commune explique la variation phénotypique commune est valable. Chez les plantes, une variation rare peut devenir suffisamment courante dans les grandes familles ou les populations pour être identifiable par GWAS. Par exemple, GWAS a identifié des SNP et une structure de population qui peuvent expliquer jusqu'à 45% de la variation phénotypique de la période de floraison [13]. Cependant, la période de floraison a une héritabilité encore plus élevée (environ 90 %), laissant 45 % supplémentaires de variation héréditaire inexpliquée.

Dans cette revue, nous examinons pourquoi les GWAS dans les plantes ont réussi, en nous concentrant sur les conceptions expérimentales et les stratégies d'échantillonnage utilisées dans ces études. Ceux qui travaillent sur GWAS dans la génétique humaine et dans les plantes ont beaucoup à apprendre les uns des autres. Nous discutons ensuite des développements futurs des GWAS généralisés chez les plantes, en prenant en compte les leçons apprises chez les espèces modèles. La connaissance géographique empirique du flux de gènes et de la structure de la population, ainsi que des hypothèses sur les zones écologiques qui ont imposé la sélection, permettent l'échantillonnage de différentes populations dans lesquelles les mêmes traits adaptatifs ou différents sont hérités. Une approche générale de restructuration de la population peut ensuite être utilisée pour découpler la variation adaptative du contexte génomique par le biais d'un croisement synthétique entre des lignées qui ont une diversité génétique équilibrée.


Pourquoi de telles études sont-elles possibles maintenant?

Avec l'achèvement du projet du génome humain en 2003 et du projet international HapMap en 2005, les chercheurs disposent désormais d'un ensemble d'outils de recherche qui permettent de trouver les contributions génétiques aux maladies courantes. Les outils comprennent des bases de données informatisées qui contiennent la séquence de référence du génome humain, une carte de la variation génétique humaine et un ensemble de nouvelles technologies qui peuvent analyser rapidement et avec précision des échantillons du génome entier pour les variations génétiques qui contribuent à l'apparition d'une maladie.

Avec l'achèvement du projet du génome humain en 2003 et du projet international HapMap en 2005, les chercheurs disposent désormais d'un ensemble d'outils de recherche qui permettent de trouver les contributions génétiques aux maladies courantes. Les outils comprennent des bases de données informatisées qui contiennent la séquence de référence du génome humain, une carte de la variation génétique humaine et un ensemble de nouvelles technologies qui peuvent analyser rapidement et avec précision des échantillons du génome entier pour les variations génétiques qui contribuent à l'apparition d'une maladie.


Combinant l'étude d'association à l'échelle du génome et FSTapproches basées sur l'identification des cibles de Borrelia-sélection médiée chez les hôtes naturels des rongeurs

Barbara Tschirren, Centre pour l'écologie et la conservation, Université d'Exeter, Penryn, Royaume-Uni.

Département de biologie évolutive et d'études environnementales, Université de Zurich, Zurich, Suisse

Institut zoologique, Université de Bâle, Bâle, Suisse

Centre d'écologie et de conservation, Université d'Exeter, Penryn, Royaume-Uni

Barbara Tschirren, Centre d'écologie et de conservation, Université d'Exeter, Penryn, Royaume-Uni.

Résumé

Les progrès récents dans les technologies de séquençage à haut débit offrent des opportunités d'acquérir de nouvelles connaissances sur la base génétique de la variation des traits phénotypiques. Pourtant, à ce jour, les progrès dans notre compréhension des associations génotype-phénotype chez les organismes non modèles en général et les populations de vertébrés naturels en particulier ont été entravés par la petite taille des échantillons généralement disponibles pour les populations d'animaux sauvages et par un manque de puissance statistique qui en résulte, ainsi qu'une capacité limitée. pour contrôler les signaux faussement positifs. Nous proposons ici de combiner une étude d'association pangénomique (GWAS) et FSTapproche basée sur la réplication au niveau de la population pour surmonter en partie ces limitations. Nous présentons une étude de cas dans laquelle nous avons utilisé cette approche en combinaison avec des données de polymorphisme de nucléotide unique (SNP) de génotypage par séquençage (GBS) pour identifier les régions génomiques associées à Borrelia afzelii résistance ou sensibilité chez le rongeur naturel hôte de ce spirochète responsable de la maladie de Lyme, le campagnol des champs (Myodes glaréoles). En utilisant cette approche combinée, nous avons identifié quatre SNP consensus situés dans les régions exoniques des gènes Slc26a4, Tns3, Wscd1 et Espnl, qui étaient significativement associés aux campagnols Borrelia statut infectieux au sein et entre les populations. Des liens fonctionnels entre les réponses de l'hôte aux infections bactériennes et la plupart de ces gènes ont déjà été démontrés dans d'autres systèmes de rongeurs, ce qui en fait de nouveaux candidats prometteurs pour l'étude des réponses évolutives de l'hôte à Borrelia émergence. Notre approche est applicable à d'autres systèmes et peut faciliter l'identification de variantes génétiques sous-jacentes à la résistance ou à la sensibilité aux maladies, ainsi que d'autres traits écologiquement pertinents, dans les populations d'animaux sauvages.


Discussion

Nous avons effectué la première analyse de la distribution des variants de séquences d'ADN dans les portions codant pour les protéines des gènes paralogues. Nos données montrent que (1) les variantes de séquences protéiques, à la fois synonymes et non synonymes, ont tendance à se produire avec une fréquence élevée à des positions homologues au sein des protéines paralogues (2) que différentes sous-classes de variantes ont des distributions distinctes le long des protéines alignées et (3) que les variantes causant la maladie ont également tendance à s'apparier les unes aux autres. Dans l'ensemble, l'amplitude de la corrélation dans les positions variantes est corrélée à la similarité de séquence des deux protéines. Ces faits suggèrent que des modèles similaires d'utilisation des codons et des contraintes fonctionnelles se combinent pour produire des corrélations dans les emplacements des variantes le long des longueurs des protéines paralogues. Cette coordination comprend non seulement des variants communs (MAFϢ%), sans conséquences phénotypiques, mais s'étend également à des allèles rares et pathogènes.

Nous avons également découvert que différentes sous-classes de variants ont des distributions distinctes le long des longueurs des protéines paralogues. Deux faits appuient cette conclusion. Premièrement, nous avons observé des tendances différentes des sous-classes variantes à s'apparier (tableau 1). Parmi les protéines paralogues les plus touchées, les scores ODD pour les variantes synonymes, non synonymes, conservatrices et non conservatrices sont respectivement de 32,2, 31,3, 62,1 et 89,3. Deuxièmement, la combinaison de classes déprime toujours le score ODD. Ainsi, il semble que chaque sous-classe de variant se présente selon un schéma spécifique le long des longueurs des protéines paralogues, les variants non conservateurs ayant la distribution la plus fortement corrélée. Une explication possible des différentes distributions est que la sélection purificatrice agit pour restreindre les substitutions non synonymes à un sous-ensemble de positions dans les deux protéines, tandis que les variantes synonymes sont libres de se produire à un plus grand nombre de positions, d'où le score ODDS inférieur pour les paires synonymes.

Les variantes causant des maladies ont également tendance à s'aligner les unes sur les autres. De plus, ils le font à l'exclusion des variants phénotypiquement non caractérisés dans le dbSNP. Dans l'ensemble, les variantes pathogènes sont 6,6 fois (Pρ휐 𢄤) plus susceptibles de s'apparier qu'avec les variantes dbSNP non-synonymes. Lorsque les variantes causant la maladie produisant des modifications conservatrices et non conservatrices des acides aminés sont considérées séparément, l'enrichissement est encore plus prononcé : 14 et 19 fois, respectivement. Comme la base de données dbSNP contient probablement des variantes non découvertes causant des maladies, ces rapports de cotes sont probablement des limites inférieures, la tendance est donc assez robuste. Bien que spéculative, une explication possible de ces faits est que des contraintes fonctionnelles similaires dans les protéines paralogues restreignent les variantes rares causant la maladie à quelques positions homologues où des substitutions d'acides aminés particulières produisent le phénotype de la maladie. Dans tous les cas, comme d'autres classes de variants, les variants rares et pathogènes des protéines paralogues ont également tendance à s'apparier.

Les alignements de protéines paralogues et leurs variations fournissent une nouvelle ressource pour la génomique fonctionnelle. Considérez que les paires de variations alignées peuvent être divisées en trois classes de base selon que leurs membres sont connus pour être pathogènes ou non. La figure 2 fournit un résumé de ce système de classification. Chaque paire de classe 1, par exemple, concerne une paire de maladies connues, toutes deux causées par des mutations à des positions équivalentes dans deux protéines paralogues. Le tableau 3 montre un exemple d'ensemble de paires de classe 1. Des changements similaires dans des protéines similaires suggèrent des étiologies biochimiques similaires et, dans certains cas, des phénotypes de maladies qui se chevauchent. Les patients atteints de la maladie de Menkes et de Wilson, par exemple, souffrent tous deux d'anomalies du métabolisme du cuivre [17]–[19]. De même, les syndromes d'Alagille et de Marfan de type I sont tous deux associés à des anomalies de la colonne vertébrale, de la vision et de la circulation [20]–[25]. Ces faits démontrent comment les paires de variantes peuvent être utilisées comme points de départ dans la recherche de connaissances latentes dans la littérature et les bases de données sur les maladies. En d'autres termes, les thérapies et les médicaments utilisés pour traiter les symptômes de la maladie causés par des mutations chez un membre d'une paire pourraient également s'avérer efficaces pour traiter l'autre maladie. Sans aucun doute, une myriade de problèmes, y compris le temps et le lieu de l'expression des gènes, compliqueront ces conclusions simples. Néanmoins, ces données montrent comment les gènes de maladies paralogues et leurs paires de variantes peuvent être utilisés pour la génération d'hypothèses et comme points de départ pour d'autres recherches cliniques. De même, l'extension de cette procédure pour inclure des paralogues de gènes de maladie connus, qui ne sont pas encore associés à une maladie, pourrait être utilisée pour identifier de nouveaux candidats de gènes de maladie et pour identifier des variantes non caractérisées en leur sein susceptibles d'avoir des conséquences phénotypiques.


Identification à l'échelle du génome et analyse comparative de la famille de gènes de la 3-hydroxy-3-méthylglutaryl coenzyme A réductase (HMGR) chez Gossypium

Les terpènes sont la classe la plus importante et la plus diversifiée de métabolites secondaires chez les plantes et jouent un rôle très important dans l'adaptation des plantes à l'environnement. La 3-hydroxy-3-méthylglutaryl coenzyme A réductase (HMGR) est une enzyme limitant la vitesse du processus de biosynthèse des terpènes dans le cytosol. Une étude précédente a trouvé le HMGR les gènes ont subi une expansion génétique dans Gossypium raimondii, mais les caractéristiques et l'évolution de la HMGR famille de gènes dans Gossypium genre ne sont pas clairs. Dans cette étude, l'identification à l'échelle du génome et l'étude comparative des HMGR famille de gènes ont été réalisées dans trois Gossypium espèces avec des séquences génomiques, c'est-à-dire, G. raimondii, Gossypium arboreum, et Gossypium hirsutum. Au total, neuf, neuf et 18 HMGR les gènes ont été identifiés dans G. raimondii, G. arboreum, et G. hirsutum, respectivement. Les résultats ont indiqué que le HMGR gènes ont subi une expansion génétique et un groupe de gènes unique contenant quatre HMGR gènes a été trouvé dans les trois Gossypium espèce. L'analyse phylogénétique a suggéré que l'expansion de HMGR gènes s'étaient produits dans leur ancêtre commun. Il y avait un pseudogène qui avait une délétion de 10 pb entraînant une mutation de décalage du cadre de lecture et ne pouvait pas être traduit en protéines fonctionnelles dans G. arboreum et le sous-génome A de G. hirsutum. Les profils d'expression des deux pseudogènes ont montré qu'ils avaient une expression tissu-spécifique. De plus, le modèle d'expression du pseudogène dans le sous-génome A de G. hirsutum était similaire à son gène paralogue dans le sous-génome D de G. hirsutum. Nos résultats fournissent des informations utiles pour comprendre la biosynthèse des terpènes cytosoliques dans Gossypium espèce.

Mots clés: Gossypium HMGR expansion du gène pseudogène biosynthèse des terpènes.

Déclaration de conflit d'intérêts

Les auteurs déclarent ne pas avoir d'intérêts concurrents.

Les figures

Relation phylogénétique de HMGS, MK,…

Relation phylogénétique des protéines HMGS, MK, PMK, MVD et HMGR de G. raimondii…

Emplacements et relations homologues de…

Emplacements et relations homologues des gènes de la voie MVA dans G. raimondii et…

Les HMGR clusters de gènes dans…

Les HMGR clusters de gènes dans G. raimondii , G. arboreum et G. hirsutum…

Relation phylogénétique, structure des gènes et…

Relation phylogénétique, structure des gènes et motifs conservés de HMGR gènes de G. raimondii…

Les HMGR pseudogènes dans G.…

Les HMGR pseudogènes dans G. arboreum et G. hirsutum . ( une )…

Modèles d'expression de GaHMGR1 ,…

Modèles d'expression de GaHMGR1 , GhHMGR1A et GhHMGR1D dans différents tissus. ( une…


INTRODUCTION

La pourriture de l'épi du maïs est une maladie fongique dévastatrice qui menace la production de maïs dans le monde entier. Signalée pour la première fois aux États-Unis en 1946 ( Ullstrup 1946 ), la pourriture de l'épi du maïs a maintenant été détectée dans de nombreux autres pays, dont l'Afrique du Sud, le Mexique, le Brésil, le Canada, l'Allemagne et l'Inde ( Logrieco et al. 2002 Van Egmond et al. 2007). La menace de pourriture de l'épi de maïs est devenue de plus en plus grave dans le monde entier en raison de la culture de variétés sensibles, de l'abondance accrue des champignons responsables et de l'humidité élevée pendant les périodes de remplissage et de stockage tardif. En Chine, la pourriture de l'épi du maïs a été signalée pour la première fois dans la province du Henan ( Pan et Zhang 1987 ) puis s'est propagée à toutes les régions productrices de maïs du pays. La pourriture de l'épi du maïs réduit le rendement d'environ 10 à 20 %, et de 50 % ou plus dans certaines régions gravement infectées ( Ren 1993 ). De plus, Fusarium spp., le principal agent causal de la pourriture de l'épi de maïs, produit un éventail de mycotoxines, telles que le déoxynivalénol (DON), le nivalénol (NIV), la zéaralénone (ZEA) et les fumonisines (FM). Ces mycotoxines peuvent causer des anomalies congénitales du tube neural chez le bétail et, agissant comme cancérogènes, peuvent être mortelles pour les humains ( Rheeder 1992 Chu et Li 1994 Norhayati et al. 1998 Missmer et al. 2006 ).

Plus de 10 espèces de Fusarium peut provoquer la pourriture de l'épi de maïs, et chaque champignon a ses propres conditions favorables à l'infection. Par exemple, F. verticillioides préfère un environnement avec de faibles précipitations mais une humidité élevée, alors que Fusarium graminearum préfère un environnement frais avec de fortes précipitations ( Munkvold 2003). Jusque là, Fusarium pourriture des oreilles, Gibberella pourriture de l'épi, avec Aspergillus pourriture de l'épi, sont parmi les maladies de pourriture de l'épi les plus graves et les plus répandues dans le monde ( Li et al. 2007 Chen et al. 2009 Mesterházy et al. 2012 ). Au champ, la pourriture de l'épi de maïs est généralement causée par un mélange de champignons plutôt que par un seul champignon. La pourriture de l'épi de maïs est devenue le principal obstacle à une application à grande échelle de la récolte mécanique, car les grains de maïs peuvent être contaminés par les mycotoxines des épis infectés.

La résistance à la pourriture de l'épi du maïs est contrôlée par de multiples loci de caractères quantitatifs à faible effet (QTL). Ces QTL présentent des interactions additives, dominantes et additives/dominantes, dont cette dernière joue un rôle clé dans la résistance à la pourriture de l'épi au champ ( Boling et Grogan 1965 Robertson et al. 2006 Ding et al. 2008 Chen et al. 2012). De nombreuses analyses de QTL ont été réalisées au cours des dernières décennies, et des QTL de résistance ont été identifiés sur les 10 chromosomes du maïs. Chen et al. (2012) ont identifié trois QTL de résistance sur les chromosomes 4, 5 et 10, le QTL sur le chromosome 4 expliquant 17,95 % de la variation phénotypique totale. En deux F2:3 populations qui partagent un parent sensible commun, Pérez et al. (2001) ont identifié neuf et sept QTL de résistance pour Fusarium la pourriture de l'épi, qui, ensemble, expliquait 11 à 44 % de la variation phénotypique cumulative. Parmi ceux-ci, trois QTL ont été détectés dans les deux populations, un sur le chromosome 3 et deux sur le chromosome 6. Une étude utilisant une population de lignées recombinantes (RIL), issues d'un croisement entre les lignées 87-1 et Zong 3, a révélé des QTL sur les chromosomes 3, 5, 8 et 10, dont deux dans le bac 3.04 ont été détectés de manière cohérente dans tous les environnements et chacun a expliqué 13 % à 22 % de la variation phénotypique ( Ding et al. 2008 ). Maschietto et al. (2017) ont identifié 15 QTL pour Fusarium pourriture de l'épi et 17 QTL pour la contamination par la fumonisine B1 (un Fusarium-mycotoxine produite). Huit de ces QTL, situés sur les chromosomes 1, 2, 3, 6, 7 et 9, ont affecté les deux phénotypes, permettant de sélectionner des génotypes présentant à la fois une faible gravité de la maladie et une contamination réduite par les fumonisines. Des travaux récents ont montré qu'un gène de protéine régulatrice de l'auxine, ZmAuxRP1, a amélioré la résistance du maïs à la pourriture de la tige et de l'épi en régulant l'équilibre entre la croissance des racines et la résistance aux maladies ( Ye et al. 2018 ).

Comme le coût du séquençage a diminué, des marqueurs moléculaires à haute densité ont été générés à grande échelle, facilitant la détection de QTL à faible effet. De même, les marqueurs à haute densité sont indispensables pour identifier les allèles naturels dans les études d'association pangénomique (GWAS). Zila et al. (2013) ont mené une GWAS d'un panel de base de 267 lignées pures de maïs diverses et 47 445 polymorphismes mononucléotidiques (SNP), et ont identifié trois SNP qui étaient significativement associés à la résistance à la pourriture de l'épi et pourraient expliquer 3 % à 12 % du génotypage total. variation. Deux de ces SNP sont colocalisés avec des gènes responsables de la mort cellulaire programmée (Zila et al. 2013). En 2014, une GWAS à grande échelle a été menée par le même groupe avec 1 687 lignées consanguines diverses et 200 978 SNP. Sept SNP significatifs ont été identifiés dans les deux populations, tous localisés dans des exons et associés à des gènes liés à une variété de processus cellulaires (Zila et al. 2014). Plus récemment, Chen et al. (2016) ont mené une GWAS sur un panel de 818 lignées tropicales consanguines avec 43 424 SNP. Ils ont détecté 45 SNP significativement associés à Fusarium la pourriture de l'épi, située à l'intérieur ou à côté de 38 gènes candidats. Six loci, dans les groupes 3.06, 4.04, 4.08, 5.03, 5.04 et 10.03, se trouvent dans des régions qui ont déjà été signalées comme étant associées à Fusarium résistance à la pourriture de l'épi, et deux autres loci, dans les cases 4.04 et 9.01, contiennent des gènes de fonction inconnue ( Chen et al. 2016 ). GWAS est un outil puissant pour révéler des SNP significatifs associés à des gènes de résistance potentiels, mais pas assez pour affiner à lui seul les gènes candidats. Des travaux supplémentaires, tels que la cartographie des liaisons et l'analyse du transcriptome, sont nécessaires pour identifier les gènes de résistance candidats.

Pour se défendre contre l'invasion d'agents pathogènes, les plantes doivent coordonner un ensemble complexe de stratégies de défense. Inoculation avec Fusarium provoque une reprogrammation du transcriptome dans les lignées de maïs résistantes et sensibles. Les gènes différentiellement exprimés (DEG) se répartissent en plus de 10 catégories, la plupart étant des gènes de « sauvetage, de défense et de virulence cellulaires » et codant pour des protéines liées à la pathogenèse (PR), des enzymes de détoxification, des -glucosidases, entre autres ( Alessandra et al. . 2010 ). Yuan et al. (2013) ont analysé un grand nombre de DEG identifiés dans la bractée de lignées résistantes et sensibles inoculées avec Fusarium. Gènes codant pour des protéines associées à des réponses de défense, telles que la protéine liée à la pathogenèse 1 (PR-1), l'osmotine (PR-5), la liaison RAB GTP (RAB), le petit modificateur de type ubiquitine (SUM), la protéine sensible à l'éthylène (ERF ), Sl'adénosylméthionine synthase (SAMS), la protéine de stress de l'acide abscissique (ABA) et un facteur de transcription de la famille MYB ont été fortement induits dans le génotype résistant ( Yuan et al. 2013 ). Dans une autre étude, l'inoculation d'une lignée de maïs résistante a provoqué une expression accrue de gènes liés au métabolisme secondaire, tels que ceux impliqués dans la production de shikimate, de lignine, de flavonoïdes et de terpénoïdes ( Lanubile et al. 2014 ). Les 15 gènes de la voie lipoxygénase (LOX) étaient fortement induits dans la lignée résistante à 3 ou 7 jours post-inoculation (dpi), alors que leur expression était réduite ou retardée dans la lignée sensible à 14 dpi. La lignée résistante a restreint à la fois la croissance fongique et l'accumulation de fumonisine, ce qui peut être associé à l'activation de gènes pour la biosynthèse de l'acide jasmonique ( Maschietto et al. 2015 ). De plus, l'expression de RP gènes est constitutivement plus élevé dans les lignées résistantes (CO441 et CO433) que dans les lignées sensibles (CO354 et CO389) avant et après inoculation ( Maschietto et al. 2016 ). Fait intéressant, il a également été rapporté que l'infection fongique induisait des modifications massives du transcriptome dans une lignée sensible, mais pas dans une lignée résistante, en particulier dans les voies liées au métabolisme du carbone et des acides aminés ( Campos-Bermudez et al. 2013 ).

La collecte et l'évaluation de matériel génétique résistant sont essentielles pour la sélection de maïs résistant à la pourriture de l'épi. Jusqu'à présent, des centaines de lignées de maïs résistantes ont été identifiées par différentes institutions, telles que CO387, CO388 et CO441 (Département canadien de l'agriculture) ( Duan et al. 2015 ) GE440 et NC300 (North Carolina State University) ( Clements et White 2004 ) 87-1 (Université agricole de Chine) ( Ding et al. 2008 ) et BT-1 (Université agricole du Henan) ( Chen et al. 2002 ). Ces lignées résistantes ont été utilisées pour produire des hybrides résistants aux maladies, un effort qui s'est remarquablement accéléré au cours de la dernière décennie ( Santiago et al. 2013 ). En raison de leurs petits effets et de la grande influence des conditions environnementales, il a été très difficile de cartographier finement les QTL de résistance. Jusqu'ici, ZmAuxRP1 est le seul gène du maïs qui a été cloné et dont il a été démontré qu'il confère une résistance à la pourriture de l'épi ( Ye et al. 2018 ).

Néanmoins, la lutte génétique est un moyen efficace de réduire la pourriture de l'épi du maïs. Par conséquent, il est important d'isoler autant de QTL de résistance que possible afin que plusieurs gènes de résistance puissent être empilés via une sélection assistée par marqueurs pour améliorer la résistance du maïs à la pourriture de l'épi. Dans la présente étude, nous avons effectué une GWAS qui a identifié 69 gènes potentiels de résistance à Fusarium pourriture de l'épi chez le maïs. Nous avons ensuite analysé les transcriptomes de lignées résistantes et sensibles inoculées avec F. verticillioides et a montré que les DEG étaient enrichis dans les voies de transduction du signal des hormones végétales et de la biosynthèse des phénylpropanoïdes. L'intégration des données GWAS et du transcriptome nous a permis d'identifier un certain nombre de gènes de résistance candidats. Nous supposons que les plants de maïs renforcent leur défense contre Fusarium pourriture de l'épi principalement par un compromis croissance-défense.


Études d'associations pangénomiques

Résumé

Les études d'association à l'échelle du génome (GWAS) sont une conception d'étude couramment utilisée pour identifier les associations entre les variations courantes de la séquence d'ADN et les traits humains. Souvent menée à l'aide de milliers de participants à l'étude, la GWAS capture la variation génétique sous la forme de polymorphismes nucléotidiques simples (SNP) à travers le génome humain. Chacun de ces SNP - qui peuvent compter des centaines de milliers - est évalué statistiquement pour identifier les relations avec un phénotype bien défini à l'étude. Les données GWAS doivent être analysées en tenant compte d'un taux gonflé de faux positifs parmi les nombreux tests statistiques effectués. Des ajustements supplémentaires sont nécessaires pour les stratifications systématiques qui peuvent exister sur plusieurs milliers de facteurs génétiques, notamment en raison des différences dans l'ascendance génétique des participants à l'étude. En utilisant des techniques supplémentaires, les résultats de plusieurs GWAS peuvent être combinés pour améliorer la capacité à détecter les SNP avec de très petits effets sur le phénotype. Bien que la conception de GWAS n'ait pas considérablement amélioré la prédiction des traits de maladie communs, GWAS a entraîné plusieurs milliers de nouvelles associations entre les changements de paires de bases d'ADN et les traits qu'ils influencent.


Les références

Godfray HC, Beddington JR, Crute IR, Haddad L, Lawrence D, Muir JF, Pretty J, Robinson S, Thomas SM, Toulmin C. Sécurité alimentaire : le défi de nourrir 9 milliards de personnes. Science. 2010327 : 812-8.

Andorf C, Beavis WD, Hufford M, Smith S, Suza WP, Wang K, Woodhouse M, Yu J, Lubberstedt T. Avancées technologiques dans la sélection du maïs : passé, présent et futur. Théor Appl Genet. 2019132 : 817–49.

Chia JM, Song C, Bradbury PJ, Costich D, de Leon N, Doebley J, Elshire RJ, Gaut B, Geller L, Glaubitz JC, et al. Maize HapMap2 identifie la variation existante d'un génome en flux. Nat Genet. 201244 : 803-7.

Lobell DB, Roberts MJ, Schlenker W, Braun N, Little BB, Rejesus RM, Hammer GL. Une plus grande sensibilité à la sécheresse accompagne l'augmentation du rendement du maïs dans le Midwest américain. Science. 2014344 : 516-9.

Yang W, Guo Z, Huang C, Duan L, Chen G, Jiang N, Fang W, Feng H, Xie W, Lian X, et al. Combiner le phénotypage à haut débit et des études d'association à l'échelle du génome pour révéler la variation génétique naturelle du riz. Nat Commun. 20145:5087.

Wang X, Wang H, Liu S, Ferjani A, Li J, Yan J, Yang X, Qin F. La variation génétique de ZmVPP1 contribue à la tolérance à la sécheresse des plantules de maïs. Nat Genet. 201648 : 1233-41.

Jang HS, Shah NM, Du AY, Dailey ZZ, Pehrsson EC, Godoy PM, Zhang D, Li D, Xing X, Kim S, et al. Les éléments transposables entraînent une expression généralisée des oncogènes dans les cancers humains. Nat Genet. 201951:611-7.

Studer A, Zhao Q, Ross-Ibarra J, Doebley J. Identification d'une insertion fonctionnelle de transposon dans le gène de domestication du maïs tb1. Nat Genet. 201143:1160-3.

Salvi S, Sponza G, Morgante M, Tomes D, Niu X, Fengler KA, Meeley R, Ananiev EV, Svitashev S, Bruggemann E, et al. Séquences génomiques non codantes conservées associées à un locus de caractère quantitatif de floraison chez le maïs. Proc Natl Acad Sci U S A. 2007104:11376-81.

Mao H, Wang H, Liu S, Li Z, Yang X, Yan J, Li J, Tran LS, Qin F. Un élément transposable dans un gène NAC est associé à la tolérance à la sécheresse chez les plantules de maïs. Nat Commun. 20156:8326.

Tian J, Wang C, Xia J, Wu L, Xu G, Wu W, Li D, Qin W, Han X, Chen Q, et al. L'allèle téosinte ligule rétrécit l'architecture de la plante et améliore les rendements de maïs à haute densité. Science. 2019365 : 658–64.

Keurentjes JJ, Fu J, Terpstra IR, Garcia JM, van den Ackerveken G, Snoek LB, Peeters AJ, Vreugdenhil D, Koornneef M, Jansen RC. Construction d'un réseau de régulation chez Arabidopsis en utilisant des loci de traits quantitatifs d'expression génique à l'échelle du génome. Proc Natl Acad Sci U S A. 2007104 : 1708-13.

Francesconi M, Lehner B. Les effets de la variation génétique sur la dynamique de l'expression des gènes au cours du développement. La nature. 2014505 : 208–11.

Huang W, Carbone MA, Magwire MM, Peiffer JA, Lyman RF, Stone EA, Anholt RR, Mackay TF. Base génétique de la diversité du transcriptome chez Drosophila melanogaster. Proc Natl Acad Sci U S A. 2015112: E6010-9.

Yu J, Buckler ES. Cartographie des associations génétiques et organisation du génome du maïs. Curr Opin Biotechnol. 200617 : 155-160.

Liu H, Luo X, Niu L, Xiao Y, Chen L, Liu J, Wang X, Jin M, Li W, Zhang Q, et al. Les eQTL distants et les séquences non codantes jouent un rôle essentiel dans la régulation de l'expression des gènes et de la variation des caractères quantitatifs chez le maïs. Usine de Mol. 201710 : 414-26.

Li H, Peng Z, Yang X, Wang W, Fu J, Wang J, Han Y, Chai Y, Guo T, Yang N, et al. Genome-wide association study dissects the genetic architecture of oil biosynthesis in maize kernels. Nat Genet. 201345:43–50.

Consortium G. Genetic effects on gene expression across human tissues. Nature. 2017550:204–13.

Albert FW, Kruglyak L. The role of regulatory variation in complex traits and disease. Nat Rev Genet. 201516:197–212.

Gusev A, Ko A, Shi H, Bhatia G, Chung W, Penninx BW, Jansen R, de Geus EJ, Boomsma DI, Wright FA, et al. Integrative approaches for large-scale transcriptome-wide association studies. Nat Genet. 201648:245–52.

Zhu Z, Zhang F, Hu H, Bakshi A, Robinson MR, Powell JE, Montgomery GW, Goddard ME, Wray NR, Visscher PM, et al. Integration of summary data from GWAS and eQTL studies predicts complex trait gene targets. Nat Genet. 201648:481–7.

Yang X, Gao S, Xu S, Zhang Z, Prasanna B, Li L, Li J, Yan J. Characterization of a global germplasm collection and its potential utilization for analysis of complex quantitative traits in maize. Mol Breed. 201128:511–26.

Yang Q, Li Z, Li W, Ku L, Wang C, Ye J, Li K, Yang N, Li Y, Zhong T, et al. CACTA-like transposable element in ZmCCT attenuated photoperiod sensitivity and accelerated the postdomestication spread of maize. Proc Natl Acad Sci U S A. 2013110:16969–74.

Wen W, Li D, Li X, Gao Y, Li W, Li H, Liu J, Liu H, Chen W, Luo J, et al. Metabolome-based genome-wide association study of maize kernel leads to novel biochemical insights. Nat Commun. 20145:3438.

Jiao Y, Peluso P, Shi J, Liang T, Stitzer MC, Wang B, Campbell MS, Stein JC, Wei X, Chin CS, et al. Improved maize reference genome with single-molecule technologies. Nature. 2017546:524–7.

Chiang HH, Hwang I, Goodman HM. Isolation of the Arabidopsis GA4 locus. Plant Cell. 19957:195–201.

Tanaka K, Asami T, Yoshida S, Nakamura Y, Matsuo T, Okamoto S. Brassinosteroid homeostasis in Arabidopsis is ensured by feedback expressions of multiple genes involved in its metabolism. Plant Physiol. 2005138:1117–25.

Su H, Cao Y, Ku L, Yao W, Ren Z, Dou D, Wang H, Liu H, Tian L, Zheng Y, et al. Dual functions of ZmNF-YA3 in photoperiod-dependent flowering and abiotic stress responses in maize. J Exp Bot. 201869:5177–89.

Larson ER, Van Zelm E, Roux C, Marion-Poll A, Blatt MR. Clathrin heavy chain subunits coordinate endo- and exocytic traffic and affect Stomatal movement. Plant Physiol. 2017175:708–20.

Liu D, Gong Q, Ma Y, Li P, Li J, Yang S, Yuan L, Yu Y, Pan D, Xu F, et al. cpSecA, a thylakoid protein translocase subunit, is essential for photosynthetic development in Arabidopsis. J Exp Bot. 201061:1655–69.

Moneo-Sanchez M, Alonso-Chico A, Knox JP, Dopico B, Labrador E, Martin I. β-(1,4)-Galactan remodelling in Arabidopsis cell walls affects the xyloglucan structure during elongation. Planta. 2019249:351–62.

Matiolli CC, Tomaz JP, Duarte GT, Prado FM, Del Bem LE, Silveira AB, Gauer L, Correa LG, Drumond RD, Viana AJ, et al. The Arabidopsis bZIP gene AtbZIP63 is a sensitive integrator of transient abscisic acid and glucose signals. Plant Physiol. 2011157:692–705.

Yang Y, Qin Y, Xie C, Zhao F, Zhao J, Liu D, Chen S, Fuglsang AT, Palmgren MG, Schumaker KS, et al. The Arabidopsis chaperone J3 regulates the plasma membrane H + -ATPase through interaction with the PKS5 kinase. Plant Cell. 201022:1313–32.

Zhu JK. Abiotic stress signaling and responses in plants. Cell. 2016167:313–24.

Song L, Huang SC, Wise A, Castanon R, Nery JR, Chen H, Watanabe M, Thomas J, Bar-Joseph Z, Ecker JR. A transcription factor hierarchy defines an environmental stress response network. Science. 2016354:aag1550.

Chen H, Wang JP, Liu H, Li H, Lin YJ, Shi R, Yang C, Gao J, Zhou C, Li Q, et al. Hierarchical transcription factor and chromatin binding network for wood formation in black cottonwood (Populus trichocarpa). Plant Cell. 201931:602–26.

Peng Z, Serino G, Deng XW. Molecular characterization of subunit 6 of the COP9 signalosome and its role in multifaceted developmental processes in Arabidopsis. Plant Cell. 200113:2393–407.

Yoshida T, Fujita Y, Maruyama K, Mogami J, Todaka D, Shinozaki K, Yamaguchi-Shinozaki K. Four Arabidopsis AREB/ABF transcription factors function predominantly in gene expression downstream of SnRK2 kinases in abscisic acid signalling in response to osmotic stress. Plant Cell Environ. 201538:35–49.

Gondolf VM, Stoppel R, Ebert B, Rautengarten C, Liwanag AJ, Loque D, Scheller HV. A gene stacking approach leads to engineered plants with highly increased galactan levels in Arabidopsis. BMC Plant Biol. 201414:344.

Nziengui H, Bouhidel K, Pillon D, Der C, Marty F, Schoefs B. Reticulon-like proteins in Arabidopsis thaliana: structural organization and ER localization. FEBS Lett. 2007581:3356–62.

Okamoto M, Tanaka Y, Abrams SR, Kamiya Y, Seki M, Nambara E. High humidity induces abscisic acid 8′-hydroxylase in stomata and vasculature to regulate local and systemic abscisic acid responses in Arabidopsis. Plant Physiol. 2009149:825–34.

Gao MJ, Lydiate DJ, Li X, Lui H, Gjetvaj B, Hegedus DD, Rozwadowski K. Repression of seed maturation genes by a trihelix transcriptional repressor in Arabidopsis seedlings. Plant Cell. 200921:54–71.

Lee HK, Cho SK, Son O, Xu Z, Hwang I, Kim WT. Drought stress-induced Rma1H1, a RING membrane-anchor E3 ubiquitin ligase homolog, regulates aquaporin levels via ubiquitination in transgenic Arabidopsis plants. Plant Cell. 200921:622–41.

Chen HY, Huh JH, Yu YC, Ho LH, Chen LQ, Tholl D, Frommer WB, Guo WJ. The Arabidopsis vacuolar sugar transporter SWEET2 limits carbon sequestration from roots and restricts Pythium infection. Plant J. 201583:1046–58.

Yamaguchi-Shinozaki K, Shinozaki K. Transcriptional regulatory networks in cellular responses and tolerance to dehydration and cold stresses. Annu Rev Plant Biol. 200657:781–803.

Sun S, Zhou Y, Chen J, Shi J, Zhao H, Song W, Zhang M, Cui Y, Dong X, Liu H, et al. Extensive intraspecific gene order and gene structural variations between Mo17 and other maize genomes. Nat Genet. 201850:1289–95.

Yang N, Liu J, Gao Q, Gui S, Chen L, Yang L, Huang J, Deng T, Luo J, He L, et al. Genome assembly of a tropical maize inbred line provides insights into structural variation and crop improvement. Nat Genet. 201951:1052–9.

Su W, Gu X, Peterson T. TIR-learner, a new ensemble method for TIR transposable element annotation, provides evidence for abundant new transposable elements in the maize genome. Mol Plant. 201912:447–60.

Peng Y, Xiong D, Zhao L, Ouyang W, Wang S, Sun J, Zhang Q, Guan P, Xie L, Li W, et al. Chromatin interaction maps reveal genetic regulation for quantitative traits in maize. Nat Commun. 201910:2632.

Dong T, Park Y, Hwang I. Abscisic acid: biosynthesis, inactivation, homoeostasis and signalling. Essays Biochem. 201558:29–48.

Thatcher SR, Zhou W, Leonard A, Wang BB, Beatty M, Zastrow-Hayes G, Zhao X, Baumgarten A, Li B. Genome-wide analysis of alternative splicing in Zea mays: landscape and genetic regulation. Plant Cell. 201426:3472–87.

Pertea M, Kim D, Pertea GM, Leek JT, Salzberg SL. Transcript-level expression analysis of RNA-seq experiments with HISAT, StringTie and Ballgown. Nat Protoc. 201611:1650–67.

Kim D, Langmead B, Salzberg SL. HISAT: a fast spliced aligner with low memory requirements. Nat Methods. 201512:357–60.

Liao Y, Smyth GK, Shi W. featureCounts: an efficient general purpose program for assigning sequence reads to genomic features. Bioinformatics. 201430:923–30.

Robinson MD, McCarthy DJ, Smyth GK. edgeR: a bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 201026:139–40.

Pertea M, Pertea GM, Antonescu CM, Chang TC, Mendell JT, Salzberg SL. StringTie enables improved reconstruction of a transcriptome from RNA-seq reads. Nat Biotechnol. 201533:290–5.

McKenna A, Hanna M, Banks E, Sivachenko A, Cibulskis K, Kernytsky A, Garimella K, Altshuler D, Gabriel S, Daly M, et al. The genome analysis toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data. Génome Res. 201020:1297–303.

Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, Marth G, Abecasis G, Durbin R. The sequence alignment/map format and SAMtools. Bioinformatics. 200925:2078–9.

Zhang Z, Ersoz E, Lai CQ, Todhunter RJ, Tiwari HK, Gore MA, Bradbury PJ, Yu J, Arnett DK, Ordovas JM, et al. Mixed linear model approach adapted for genome-wide association studies. Nat Genet. 201042:355–60.

Raj A, Stephens M, Pritchard JK. fastSTRUCTURE: variational inference of population structure in large SNP data sets. Genetics. 2014197:573–89.

Stegle O, Parts L, Piipari M, Winn J, Durbin R. Using probabilistic estimation of expression residuals (PEER) to obtain increased power and interpretability of gene expression analyses. Nat Protoc. 20127:500–7.

Bradbury PJ, Zhang Z, Kroon DE, Casstevens TM, Ramdoss Y, Buckler ES. TASSEL: software for association mapping of complex traits in diverse samples. Bioinformatics. 200723:2633–5.

Barrett JC, Fry B, Maller J, Daly MJ. Haploview: analysis and visualization of LD and haplotype maps. Bioinformatics. 200521:263–5.

Xing HL, Dong L, Wang ZP, Zhang HY, Han CY, Liu B, Wang XC, Chen QJ. A CRISPR/Cas9 toolkit for multiplex genome editing in plants. BMC Plant Biol. 201414:327.

Wang Y, Song F, Zhu J, Zhang S, Yang Y, Chen T, Tang B, Dong L, Ding N, Zhang Q, et al. GSA: genome sequence archive * . Genomics Proteomics Bioinformatics. 201715:14–8.

Song S, Tian D, Li C, Tang B, Dong L, Xiao J, Bao Y, Zhao W, He H, Zhang Z. Genome variation map: a data repository of genome variations in BIG Data Center. Nucleic Acids Res. 201846:D944–D49.

Members BDC. Database resources of the BIG Data Center in 2019. Nucleic Acids Res. 201947:D8–D14.

Liu S, Li C, Wang H, Wang S, Yang S, Liu X, Yan J, Li B, Beatty M, Zastrow-Hayes G, Song S, Qin F. Mapping regulatory variants controlling gene expression in drought response and tolerance in maize. RNA-sequencing data, BIGD: GSA: CRA000334. https://bigd.big.ac.cn/gsa/browse/CRA000334 (2020a). Accessed 9 Aug 2017.

Liu S, Li C, Wang H, Wang S, Yang S, Liu X, Yan J, Li B, Beatty M, Zastrow-Hayes G, Song S, Qin F. Mapping regulatory variants controlling gene expression in drought response and tolerance in maize. RNA-sequencing reads and gene expression level (FPKM) in each sample, BIGD: GSA: CRA002002. https://bigd.big.ac.cn/gsa/browse/CRA002002 (2020b). Accessed 24 Sept 2019.

Liu S, Li C, Wang H, Wang S, Yang S, Liu X, Yan J, Li B, Beatty M, Zastrow-Hayes G, Song S, Qin F. Mapping regulatory variants controlling gene expression in drought response and tolerance in maize. Genotypic data, BIGD: gvm: GVM000048. https://bigd.big.ac.cn/gvm/getProjectDetail?project=GVM000048 (2020c). Accessed 27 Sept 2019.

Liu S, Li C, Wang H, Wang S, Yang S, Liu X, Yan J, Li B, Beatty M, Zastrow-Hayes G, Song S, Qin F. Mapping regulatory variants controlling gene expression in drought response and tolerance in maize. The script for the MR analysis, Github: https://github.com/whweve/MPGV (2020d). Accessed 10 March 2020.

Liu S, Li C, Wang H, Wang S, Yang S, Liu X, Yan J, Li B, Beatty M, Zastrow-Hayes G, Song S, Qin F. Mapping regulatory variants controlling gene expression in drought response and tolerance in maize. The RNA-seq reads, NCBI: BioProject: PRJNA637522. https://www.ncbi.nlm.nih.gov/bioproject/PRJNA637522 (2020e). Accessed 1 Jun 2020.


Author contributions

J-G.C., W.M., J.Z. and G.A.T. conceived and designed the experiments. J.Z., Y.Y., K.Z, M.X., S.S.J., L.E.G., T.J.T., N.E., N.Z. and J.L. performed the experiments. J.Z., K.F., V.R.S., E.L., K.B., J.S., J.L., T.J.T. and P.R. analyzed the data. J.Z. drafted the manuscript. J.Z., J-G.C., W.M., T.J.T. and G.A.T. revised the manuscript. All authors read and approved the manuscript.

Please note: Wiley Blackwell are not responsible for the content or functionality of any Supporting Information supplied by the authors. Any queries (other than missing material) should be directed to the New Phytologist Central Office.

Fig. S1 Summary of P. trichocarpa accessions used in this study.

Fig. S2 Genetic relatedness of 917 P. trichocarpa accessions.

Fig. S3 SNP validation by Sanger sequencing.

Fig. S4 Expression patterns of PtHCTs across various tissues in Populus.

Fig. S5 Promoter similarity between duplicated PtHCTs.

Fig. S6 Expression of nine PtHCTs and abundance of cis-3-O-caffeoylquinic acid, trans-3-O-caffeoylquinic acid and the partially identified caffeoyl conjugate.

Fig. S7 Correlation coefficient between gene expression of nine PtHCTs in xylem and abundance of the three metabolites in leaves across populations in the two independent replicates.

Fig. S8 Comparison of the core sequence of the W-box element in promoter regions of PtHCTs.

Fig. S9 Co-expression network of PtHCT gènes.

Fig. S10 GO enrichment of PtHCT co-expression networks.

Fig. S11 Phylogenetic relationships of the WRKY gene family in Populus.

Fig. S12 Differentially expressed PtWRKYs in response to S. musiva and their response to various stresses.

Fig. S13 Expression of PtHCTs et PtWRKYs in the wood-forming zone of poplar.

Table S1 Abundance of cis-3-O-caffeoylquinic acid, trans-3-O-caffeoylquinic acid and a partially identified caffeoyl conjugate in this Populus population

Table S2 Primers used for this study

Table S3 Significant SNPs from GWAS and eQTL analyses

Table S4HCT gene family in P. trichocarpa

Table S5 Significantly overrepresented sequence motifs in the PtHCT2 co-expression network

Table S6 Comparison of nonsynonymous SNPs in PtHCT2 et PtHCT9

Please note: The publisher is not responsible for the content or functionality of any supporting information supplied by the authors. Any queries (other than missing content) should be directed to the corresponding author for the article.



Commentaires:

  1. Cerny

    Pourquoi pas?

  2. Ranit

    Bonne idée, je maintiens.



Écrire un message