Informations

13 : Module 10 : Gènes et chromosomes - Biologie

13 : Module 10 : Gènes et chromosomes - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

13 : Module 10 : Gènes et chromosomes

Chromosomique : combler le fossé entre les génomes et les chromosomes

Les progrès récents de la technologie de séquençage de l'ADN permettent une augmentation rapide du nombre de génomes séquencés. Cependant, de nombreuses questions fondamentales en biologie du génome restent sans réponse, car les données de séquence à elles seules ne permettent pas de comprendre comment le génome est organisé en chromosomes, la position et l'interaction de ces chromosomes dans la cellule, et comment les chromosomes et leurs interactions les uns avec les autres changent. en réponse à des stimuli environnementaux ou au fil du temps. La relation intime entre la séquence d'ADN et la structure et la fonction des chromosomes met en évidence la nécessité d'intégrer les données génomiques et cytogénétiques pour mieux comprendre le rôle que joue l'architecture du génome dans la plasticité du génome. Nous proposons l'adoption du terme « chromosomique » comme une approche englobant le séquençage du génome, la cytogénétique et la biologie cellulaire, et présentons des exemples où la chromosomique a déjà conduit à de nouvelles découvertes, telles que le gène déterminant le sexe chez les mammifères eutheriens. Plus important encore, nous regardons vers l'avenir et les questions auxquelles nous pourrions répondre alors que nous entrons dans la révolution chromosomique, telles que le rôle des réarrangements chromosomiques dans la spéciation et le rôle des régions du génome à évolution plus rapide, comme les centromères, jouent dans la plasticité du génome. . Cependant, pour que la chromosomique atteigne son plein potentiel, nous devons relever plusieurs défis, notamment la formation d'une nouvelle génération de cytogénéticiens, et l'engagement d'une union plus étroite entre les domaines de recherche de la génomique, de la cytogénétique, de la biologie cellulaire et de la bioinformatique. Surmonter ces défis conduira à des découvertes révolutionnaires dans la compréhension de l'évolution et de la fonction du génome.

Mots clés: centromère réarrangements chromosomiques cytogénétique évolution biologie du génome plasticité du génome chromosomes sexuels.

Déclaration de conflit d'intérêts

Les auteurs ne déclarent aucun conflit d'intérêt.

Les figures

Reconditionnement de l'ADN dans un chromosome. L'hélice d'ADN double brin est enroulée autour de…

Les progrès incrémentiels réalisés grâce à…

Les progrès incrémentiels réalisés grâce à la combinaison d'informations cytogénétiques et génomiques dans la découverte…

Le modèle de rupture intégrative, un…

Le modèle de rupture intégrative, un cadre multicouche pour l'étude de l'évolution du génome…


Les protéines kinésine-13 Kif2a, Kif2b et Kif2c/MCAK ont des rôles distincts au cours de la mitose dans les cellules humaines

Le génome humain possède trois gènes uniques codant pour les protéines de la kinésine-13 appelées Kif2a, Kif2b et MCAK (Kif2c). Kif2a et MCAK ont des rôles documentés dans la mitose, mais la fonction de Kif2b n'a pas été définie. Ici, nous montrons que Kif2b est exprimé à de très faibles niveaux dans les cellules en culture et que GFP-Kif2b se localise principalement dans les centrosomes et les midbodies, mais aussi dans les microtubules du fuseau et de manière transitoire dans les kinétochores. Les cellules déficientes en Kif2b assemblent des fuseaux monopolaires ou désorganisés. Les chromosomes dans les cellules déficientes en Kif2b présentent des attaches typiques kinétochore-microtubule, mais la vitesse de mouvement est réduite d'environ 80 % par rapport aux cellules témoins. Certaines cellules déficientes en Kif2b tentent l'anaphase, mais le sillon de clivage régresse et la cytokinèse échoue. Comme les cellules déficientes en Kif2a, l'assemblage du fuseau bipolaire peut être restauré dans les cellules déficientes en Kif2b par une déficience simultanée de MCAK ou de Nuf2 ou par un traitement avec de faibles doses de nocodazole. Cependant, les cellules déficientes en Kif2b sont uniques en ce qu'elles assemblent des fuseaux bipolaires lorsque les activités de focalisation des pôles de NuMA et HSET sont perturbées. Ces données démontrent que la fonction Kif2b est requise pour l'assemblage du fuseau et le mouvement des chromosomes et que les activités de dépolymérase des microtubules de Kif2a, Kif2b et MCAK remplissent des fonctions distinctes au cours de la mitose dans les cellules humaines.

Les figures

Expression de Kif2b dans des cellules en culture.…

Expression de Kif2b dans des cellules en culture. (A) Extrait cellulaire total de cellules U2OS non transfectées…

Localisation de GFP-Kif2b. (Un humain…

Localisation de GFP-Kif2b. (A) Cellules humaines U2OS exprimant GFP-Kif2b pendant l'interphase et à…

Kif2b est indispensable pour la broche…

Kif2b est essentiel pour la bipolarité du fuseau. (A) Cellules U2OS ou U2OS non traitées transfectées…

Les vitesses chromosomiques sont supprimées dans…

Les vitesses chromosomiques sont supprimées dans les cellules déficientes en Kif2b. (A) Les cellules U20S ont été traitées avec…

Les cellules déficientes en Kif2b forment un kinétochore stable…

Les cellules déficientes en Kif2b forment des attaches stables de microtubules de kinétochore. Les cellules U2OS étaient soit non traitées, soit…

La cytokinèse est altérée chez les patients déficients en Kif2b…

La cytokinèse est altérée dans les cellules déficientes en Kif2b. Microscopie DIC time-lapse de cellules déficientes en Kif2b avec…

Kif2a, Kif2b et MCAK ont…

Kif2a, Kif2b et MCAK ont des fonctions distinctes au cours de la mitose. (A) Pourcentage de mitose…

Comparaison phylogénétique des gènes de la kinésine-13.…

Comparaison phylogénétique des gènes de la kinésine-13. Séquences d'acides aminés de trois protéines kinésine-13 codées…


Résultats et discussion

Cartographie chromosomique fine des neuf loci PKC par analyse FISH

Les clones génomiques ont été isolés dans des conditions d'hybridation hautement stringentes à partir de bibliothèques génomiques humaines en utilisant des sondes d'ADNc pour les neuf isotypes de PKC humaine. Des clones génomiques de PKC confirmés par amplification en chaîne par polymérase (PCR) (jusqu'à cinq clones par gène) ont ensuite été utilisés pour déterminer l'emplacement chromosomique humain du module du gène PKC à l'aide de FISH. Des doublets fluorescents ont été observés dans la majorité des métaphases sur chacune des deux chromatides sœurs aux positions indiquées sur la figure 1a, qui montre le caryotype composite des neuf gènes PKC distincts. Aucun autre site chromosomique n'a présenté de signaux fluorescents significatifs (données non présentées). L'intensité de fluorescence de jusqu'à huit chromosomes porteurs de signaux a été mesurée pour créer un profil moyen vert-rouge très significatif. Ce profil a été interpolé linéairement à la taille des idéogrammes chromosomiques standard, permettant une affectation objective des signaux fluorescents à une bande chromosomique. La présentation schématique de la distribution des taches fluorescentes sur les chromosomes humains en métaphase est illustrée à la figure 1b.

Cartographie chromosomique des neuf loci du gène de la PKC humaine par FISH aux propagations en métaphase. (une) Caryotype composite des neuf gènes PKC distincts attribués par FISH (en vert) aux propagations en métaphase humaine (bandes DAPI/PI). L'étiquette du produit du gène PKC indique l'attribution du pic de fluorescence moyenné à la bande chromosomique correspondante. (b) Idéogrammes représentant la distribution des taches fluorescentes (indiquées par des barres verticales à côté des idéogrammes). Chaque marque représente la localisation d'un spot d'hybridation n = nombre de métaphases notées.

Ainsi, la localisation chromosomique de tous les membres a été cartographiée finement pour confirmer et/ou corriger l'ensemble de données existant. Comme le montre le tableau 1, sur les neuf membres humains de la PKC, cinq isotypes - PKCα, β, , et ι - n'avaient pas été correctement attribués à des chromosomes humains individuels dans la littérature existante [5,7,8,9,10, 11,12,13]. Une comparaison de nos emplacements chromosomiques pour les gènes PKC avec les affectations de projet de génome (HUGO), a confirmé nos résultats dans l'ensemble, cependant, notre analyse FISH détaillée a fourni une résolution de cartographie améliorée.

En particulier, la localisation rapportée du locus du gène PKCι sur le chromosome X (Xq21.3 [13] et HUGO, voir Tableau 1) n'a pas pu être confirmée, car nous avons détecté un signal FISH supplémentaire en 3q26. Une fois isolée de la séquence préliminaire du génome humain, la séquence d'ADN chromosomique Xq21.3 hébergeant PKCι s'est révélée être un pseudogène traité similaire au gène authentique en 3q26. Ce pseudogène PKCι Xq21.3 contient un cadre de lecture ouvert (ORF) ininterrompu et aucun intron, compatible avec une origine par rétrotransposition. Fait intéressant, il est identique à la séquence du gène PKCι à l'exception d'une mutation ponctuelle au niveau du codon d'arrêt (figure 2), qui allonge l'ORF de 27 acides aminés. Le pseudogène PKCι Xq21.3 peut donc être exprimé. En raison de l'identité extrêmement élevée des deux ARNm potentiels de PKCι, cette possibilité n'a pu être étudiée plus avant qu'en utilisant un anticorps conçu pour détecter la séquence supplémentaire de 27 acides aminés d'un produit protéique pseudogénique putatif, et un tel anticorps n'est pas encore disponible.

Séquence d'acides aminés du pseudogène PKCι Xq21.3. L'ORF ininterrompu est en rouge. La mutation ponctuelle transformant le codon d'arrêt TGA de type sauvage en CGA est indiquée en bleu.

En plus du locus PKCι au niveau du chromosome 3q26 (et du pseudogène Xq21.3), une autre séquence génomique PKCι se trouve dans le projet de génome humain, qui avait été cartographié (dans la base de données) sur le chromosome 12 (BAC KlonRP11-147C2). Un alignement du placement des introns dans les gènes PKCι du chromosome 12 et du chromosome 3 a indiqué l'homologie la plus élevée possible dans leur organisation génomique. Par exemple, le gène PKCι du chromosome 12 contient (ainsi que les 17 introns) 18 exons identiques en taille et en séquence à ceux de le gène 3q26 PKCι identifié par FISH (données non présentées). Comme aucun signal FISH pour une séquence PKCι n'a pu être observé sur le chromosome 12, cette apparente « duplication de gène hautement conservée » est très probablement le résultat d'une in silico erreur dans l'assemblage de la séquence de brouillon, confirmant l'existence d'erreurs dans la séquence existante.

PKCγ, ζ et se trouvent sur les parties les plus distales de leurs chromosomes (PKCγ à 19q13.4, PKCζ à 1p36.3 et PKCθ à 10p15), suggérant qu'il pourrait y avoir un effet de position télomérique modifiant l'expression de ces gènes tout au long la durée de vie réplicative des cellules humaines. Cependant, il n'existe actuellement aucune preuve expérimentale à ce sujet.

Organisation génomique du module du gène PKC

En utilisant HUGO et des outils bioinformatiques, nous avons disséqué l'organisation génomique, c'est-à-dire la caractérisation de la structure exon/intron, des neuf gènes isotypiques PKC (Figure 3). Les loci PKC varient en taille d'environ 24,4 kilobases (kb) (PKCγ) à 480 kb (PKCα), et sont composés de 14 à 18 exons codants et de 13 à 17 introns, dont la taille varie de 94 à 188 435 paires de bases (pb) . Les exons sont de taille petite à intermédiaire, allant de 32 à 381 nucléotides. Toutes les jonctions intron-exon semblent être conformes à la règle GT-AG. Compte tenu de l'origine évolutive commune de cette famille de gènes (comme le montre un arbre phylogénétique basé sur l'ADNc de la PKC et de son plus proche parent, la PKD, figure 3a), il n'est pas surprenant que certaines de leurs structures d'exons soient identiques (et presque homologues dans leur séquence d'acides aminés) au sein des sous-familles PKC (Figure 3b). Le site d'initiation de la traduction AUG pour les ORF de PKCα, , , , et est situé dans l'exon 1, pour PKCδ, et un intron est situé dans la région 5'-non traduite (5'-UTR) et seuls les exons suivants déterminent les domaines fonctionnels des protéines PKC. Néanmoins, l'existence d'exons supplémentaires au sein de la 5'-UTR ne peut pas être exclue à ce stade.

Les relations évolutives et les structures des neuf gènes PKC humains distincts. (une) Un arbre phylogénétique basé sur l'ADNc des isotypes PKC et de leur parent le plus proche, PKD. (b) La comparaison évolutive entre les séquences de gènes génomiques PKC a révélé une organisation génomique spécifique à la sous-famille. Au sein des sous-familles (regroupées en rangées), le codage couleur indique différentes collections de tailles d'exons conservées entre les loci.

Ces données génomiques structurelles peuvent être utilisées pour représenter les relations phylogénétiques des gènes PKC. L'organisation des sous-domaines régulateurs et catalytiques de la PKC a été remarquablement préservée au cours de l'évolution : en utilisant la structure des exons de la PKCα comme référence, les exons 10-15 dans le domaine catalytique partagent la plus grande similitude en taille, organisation et structure primaire parmi les (c )PKC et nouvelles (n)PKC, mais pas (a)PKC atypiques. aPKCζ et sont très distincts de cPKC et nPKC dans la structure exonique du domaine catalytique. Le long de cette ligne, aPKCι et aPKC semblent particulièrement conservés entre eux dans leurs structures de domaine régulatrices et catalytiques. Dans le domaine de régulation, les sous-familles cPKC, nPKC et aPKC sont clairement distinctes les unes des autres, et il y a même une scission au sein des nPKC en les formes D, PKCδ et , et les formes E, PKCε et η. De plus, cPKCα et cPKCβ semblent plus étroitement liés l'un à l'autre qu'à cPKCγ. Dans l'ensemble, les données suggèrent que la duplication de gènes suivie d'une perte et/ou d'une insertion d'intron et d'un remaniement d'exons a joué un rôle important dans l'évolution de la famille de gènes PKC. Cette attention in silico la dissection de la structure fine du gène est également une condition préalable à une recherche efficace d'anomalies potentielles dans les gènes PKC.

Traitement alternatif des transcrits du gène PKC

L'existence de variantes d'épissage alternatives de la PKC dans certains tissus est une option intéressante pour fournir une plus grande hétérogénéité dans la PKC, reflétant les diverses voies de transduction du signal au sein de ces cellules.

L'épissage alternatif est actuellement connu pour au moins un isotype de PKC humaine. Deux clones d'ADNc de PKCβ distincts ont été isolés qui codent pour des séquences de 671 et 673 acides aminés, respectivement, qui ne diffèrent l'un de l'autre que dans les régions carboxy-terminales d'environ 50 acides aminés [14,15]. La caractérisation du gène chromosomique PKCβ a fourni une preuve directe de l'existence de deux exons carboxy-terminaux adjacents qui pourraient être alternativement épissés pour générer deux types de PKCβ [16]. Il est important de noter que ces variantes d'épissage, PKCβI et βII, semblent être exprimées de manière sélective pour les tissus, suggérant que leurs fonctions sont différentes.

Des variantes d'épissage PKC sont connues chez les rongeurs

Une variante murine de PKCδ - PKCδII - a récemment été décrite [17]. Celui-ci a une insertion de 78 pb (26 acides aminés) dans le site sensible à la caspase-3 dans le domaine V3 de la séquence PKCδI originale, ce qui rend l'isoforme PKCδII insensible à la caspase-3. La PKCδI est détectée dans la plupart des tissus, tandis que la PKCδII est exprimée sélectivement dans les testicules, les ovaires, les thymocytes, le cerveau et les reins [18].

De plus, une forme tronquée carboxy-terminale de PKCδIII existe chez le rat, qui a une insertion hors cadre de 83 pb au même site dans la région V3 [18]. L'analyse de l'ADN génomique a révélé que la différence entre la PKCδII de souris et la PKCδIII de rat est due à une séquence différente au niveau des sites d'épissage donneurs 5' critiques (données non présentées). PKCδIII, qui ne représente que le domaine de régulation, pourrait montrer un effet dominant-négatif contre PKCδI, et donc un épissage alternatif impliquant cette variante pourrait moduler les voies de signalisation.

Deux formes d'ARN PKCζ de rat, avec des extrémités 5' différentes, ont été rapportées. La forme majeure (PKCζ de type sauvage) est exprimée de manière ubiquitaire, tandis que la forme plus petite - la protéine kinase M ζ (PKMζ) - qui code uniquement le domaine catalytique de l'enzyme sans la majeure partie de son domaine régulateur, est prédominante dans le cerveau normal et certaines prostates de rat. tumeurs. Le locus du gène PKCζ du rat semble contenir deux promoteurs alternatifs à partir desquels il peut être transcrit pour donner deux transcrits avec une hétérogénéité à l'extrémité 5' [19].

Enfin, un clone d'ADNc PKCθII a été isolé à partir de testicules de souris, codant pour une séquence 5' unique de 20 acides aminés et la séquence PKCθI (= type sauvage) de 444 acides aminés. La transcription de l'ARN de PKCθII est initiée à partir de l'exon spécifique de PKCθII, qui est situé entre les exons 7 et 8 du gène PKCθI, indiquant que l'épissage alternatif est le mécanisme par lequel PKCθII est généré. La PKCθII est exprimée exclusivement dans les testicules de manière dépendante de l'âge avec la maturation sexuelle. En cohérence avec son absence de domaine régulateur C1, PKCθII est constitutivement actif et pourrait jouer un rôle crucial dans la spermatogenèse [20].

La détermination des polymorphismes mononucléotidiques dans le module du gène PKC humain

Les loci authentiques du gène PKC présents en une seule copie dans le génome humain ont été analysés en détail pour les polymorphismes mononucléotidiques (SNP) en utilisant les ressources du site Web du National Center for Biotechnology Information [21]. Parmi les 11 SNP dans les régions codantes du module du gène PKC actuellement connus à partir de ces recherches dans les banques de données, seuls deux (un chacun dans PKCδ et PKCη, respectivement) donnent lieu à des codons non synonymes et créent des mutations faux-sens (tableau 2). Ces mutations faux-sens n'exercent aucun effet sur la fonction kinase de manière évidente, même si un effet ne peut pas être exclu pour le moment. Dans l'ensemble, les gènes PKC humains ne semblent pas être des régions très variables telles que caractérisées par l'analyse des SNP, cependant, les SNP exoniques disponibles semblent suffisants pour être utilisés à des fins d'haplotypage dans des études de liaison et/ou d'association.

Localisation chromosomique de loci de gènes PKC finement cartographiés avec des loci de maladie humaine

À l'aide du Cancer Genome Anatomy Project [22], une comparaison de l'emplacement chromosomique de ces neuf loci PKC finement cartographiés avec des loci de maladie humaine a révélé des aberrations/points de rupture chromosomiques dans ces régions, par exemple, chez des patients atteints d'une maladie maligne (Figure 4). En particulier, les emplacements 17q24 (PKCα), 19q13 (PKCγ), 3p21 (PKCδ), 2p21 (PKCε), 1p36 (PKCζ) et 3q26 (PKCι) sont remarquables, car des délétions ou des translocations équilibrées impliquant ces régions chromosomiques définies sont fréquemment décrites. dans les tumeurs malignes naturelles. Ainsi, en théorie, les gènes de la famille PKC pourraient être affectés en tant que gènes candidats potentiels à la maladie dans des recombinaisons accidentelles lors de réarrangements intrachromosomiques ou même de translocations interchromosomiques, comme dans la jonction délétère de abl séquences à l'immunoglobuline ou bcr loci qui conduit à la malignité (via le gain de fonction). Cependant, de nombreux autres gènes impliqués dans la régulation de l'activation, de la prolifération et de l'apoptose cellulaires sont également inclus dans ces régions chromosomiques. Néanmoins, nos résultats de cartographie suggèrent que certains isotypes de PKC pourraient être des gènes candidats impliqués dans le cancer humain.

Comparaison des loci du gène PKC humain avec la localisation chromosomique des aberrations équilibrées dans les tumeurs à l'aide des données du Cancer Genome Anatomy Project [37]. En plus des données d'anomalies chromosomiques énumérées à droite de chaque diagramme de structure de locus de gène, des informations sur l'expression tissulaire du gène (à partir des bases de données d'étiquettes de séquences exprimées (EST)) et sur les mutations humaines connues [38,39] sont fournies. Plusieurs des loci PKC sont remarquables, car des délétions ou des événements de translocation dans cette région chromosomique sont décrits dans la carte des points de rupture des réarrangements chromosomiques récurrents dans la néoplasie humaine [22,37]. Les études cytogénétiques sur les aberrations chromosomiques équilibrées récurrentes dans toutes les hémopathies malignes et les tumeurs solides publiées sont rassemblées dans [37].

Les membres de la famille PKC ont été systématiquement impliqués dans des réponses de signalisation aberrantes contribuant à la transformation maligne, par exemple, en tant que récepteurs intracellulaires pour les esters de phorbol promoteurs de tumeurs, qui se sont avérés protéger diverses cellules, y compris les cellules T, de l'apoptose [23,24 ]. En raison de cette capacité potentiellement transformatrice des gènes de la famille PKC, les niveaux d'expression anormalement élevés d'isotypes PKC distincts trouvés dans la plupart des lignées cellulaires tumorales plaident en faveur d'un lien fonctionnel entre la PKC et l'oncogenèse (G.B., travail non publié). Un recrutement chronique de PKCθ (par un mécanisme non défini) dans la fraction membranaire des cellules malignes a été rapporté dans des lignées cellulaires dérivées de patients atteints de leucémie à cellules T [25]. D'autres résultats, plus définitifs, montrent que les activités Bcr-Abl et PKCι sont nécessaires à la résistance à l'apoptose des cellules hématopoïétiques K562, soutenant un rôle fonctionnel de la PKCι dans la survie des cellules leucémiques [26]. Des études récentes, y compris la nôtre [23,27], ont directement lié des isotypes PKC distincts aux voies moléculaires régulant l'apoptose. Mais malgré le rôle putatif des PKC dans le contrôle de la croissance cellulaire et la différenciation, aucun exemple clinique d'un rôle causal des PKC dans la malignité cellulaire primaire n'a encore été publié. Il reste à voir si la dissection génétique de mutants naturels de cellules somatiques malignes finira par établir un lien entre les PKC et la maladie clinique.

Une recherche dirigée de mutations potentielles de perte de fonction (et très probablement récessives) dans les loci PKC, potentiellement associées à des syndromes génétiques distincts, va maintenant être lancée. Avec des informations provenant de travaux biochimiques sur la transduction du signal, les modèles d'expression spécifiques aux tissus et les phénotypes des lignées knock-out d'isotype PKC à perte de fonction de souris actuellement établies ([28,29,30,31,32,33] et GB, travail non publié ), la cartographie fine génomique rapportée ici permettra aux études génétiques dans des groupes définis de patients de rechercher des polymorphismes PKC fonctionnels ou des mutations associées à des défauts ou des anomalies génétiques familiales. Compte tenu de l'énorme augmentation des bases de données génétiques et moléculaires, les approches bioinformatiques devraient continuer à s'améliorer et à devenir des outils utiles pour évaluer les hypothèses, seules les plus prometteuses étant soumises à des tests empiriques. Cette approche génétique humaine, et donc à long terme, peut aider à délimiter les fonctions physiologiques de base et physiopathologiques possibles du module du gène PKC, et peut éclairer si et éventuellement comment les PKC sont impliquées dans les maladies génétiques humaines.


Discussion

Ici, l'assemblage du génome A188 a capitalisé sur des technologies de lecture longue, y compris les lectures de molécules uniques Nanopore et la cartographie optique à longue distance, qui ajoute un nouveau génome de référence de haute qualité à la collection de génomes de maïs séquencés [8,9,10,11, 12,13,14,15,16]. La qualité de l'assemblage a été améliorée par la stratégie consistant à comparer les profondeurs de lecture des données de lecture courte de deux sources d'ADN indépendantes pour filtrer les contigs avant l'échafaudage. L'utilisation de sources d'ADN indépendantes a réduit la contamination par les séquences d'ADN de génomes d'organites et de micro-organismes tout en préservant les séquences organellaires à intégration nucléaire. En outre, une nouvelle approche pour la découverte de la variation structurelle du génome basée sur la comparaison quantitative des profondeurs des lectures de séquençage, appelée ici Comparative Genomic Read Depth ou CGRD, a été introduite. La caractérisation détaillée de la variation structurelle génomique dans des génomes complexes tels que le maïs est difficile. Des comparaisons utilisant des séquences génomiques complètes basées sur leurs alignements seraient une méthode idéale pour révéler la variation et les réarrangements du nombre de copies. Cependant, techniquement, les méthodes basées sur l'alignement souffrent toujours d'une faible capacité d'alignements sûrs de séquences répétitives. Plus critique encore, trouver une variation structurelle avec des séquences génomiques assemblées est soumis à la qualité des assemblages. Malheureusement, les assemblages de la plupart des génomes végétaux ou d'autres grands génomes complexes ne sont généralement pas complets ou exempts d'erreurs. B73Ref4, par exemple, manque la région la plus haute de la séquence du bras court du chromosome 6 (Fichier supplémentaire 1 : Figure S13) et comprend plusieurs erreurs d'inversion d'assemblage. Le CGRD basé sur la comparaison des profondeurs de lectures courtes complète les approches qui reposent sur les alignements du génome entier, y compris SyRI [32]. En particulier, le pipeline CGRD peut détecter la variation du nombre de copies manquée par SyRI en raison d'un assemblage incomplet dans des régions structurellement complexes. Le CGRD a identifié une duplication de 1,8 Mo au Ga1 locus et une duplication en tandem à copie élevée de WC1 dans A188, qui ont tous deux été manqués par SyRI. Les deux méthodes sont complémentaires en ce que CGRD capture la variation structurelle déséquilibrée due à la variation du nombre de copies plutôt que la variation structurelle équilibrée que SyRI peut détecter. Par conséquent, la combinaison de SyRI et de CGRD fournit une stratégie optimale pour la découverte de la variation structurelle génomique, ce qui est essentiel pour une caractérisation plus poussée de leurs impacts sur l'expression des gènes et les phénotypes.

L'analyse de la variation structurelle a élucidé une structure répétitive de la ccd1 gène, qui, dans A188, se compose de 13 copies. Le nombre élevé de copies de ccd1 correspond au niveau d'expression élevé de ccd1, qui a été précédemment observé et conduit vraisemblablement à une activité élevée de l'enzyme de clivage des caroténoïdes et à une dégradation accrue des caroténoïdes [37]. De plus, l'expression de y1, qui code pour la phytoène synthase et la réaction d'entrée dans la voie des caroténoïdes, en A188 est faible pendant le développement de la graine, tandis que la y1 l'expression dans les graines B73 est relativement élevée [48]. Les deux allèles étaient fortement exprimés dans certains tissus autres que les graines, y compris les feuilles. L'A188 y1 L'allèle est probablement fonctionnel puisqu'un niveau faible mais perceptible de caroténoïdes est produit lors du développement de la graine. Un QTL de couleur du noyau mineur supplémentaire a été identifié à partir des lignées DH et concordant avec les QTL de plusieurs autres populations biparentales dérivées de B73 [49]. Le gène candidat sous-jacent, zep1 (Zm00001d003513) codant pour la zéaxanthine époxydase, a également été identifié dans une étude d'association antérieure [50]. Cependant, la validation fonctionnelle de l'implication de zep1 dans la couleur des graines est nécessaire. Dans le même temps, les trois loci QTL ne sont pas suffisants pour déterminer complètement la variation de couleur du noyau des raies DH. L'analyse avec une plus grande population dérivée de B73xA188 peut révéler des loci supplémentaires influençant les couleurs du noyau, car toutes les lignes DH ne partageaient pas la couleur attendue sur la base des QTL associés. Dans tous les cas, les niveaux de caroténoïdes étaient attendus sur la base des types d'allèles de y1 et ccd1 et a soutenu l'hypothèse que des niveaux plus élevés de ccd1 et bas y1 les niveaux contribuent aux différences de couleur des graines de A188 et B73.

Un objectif important de la caractérisation A188 est de mieux comprendre la culture de tissus végétaux. Le développement d'un tissu hautement différencié vers le cal à des fins de génie génétique implique un processus de dédifférenciation pour gagner en pluripotence [51]. La transition d'état de différenciation est, physiologiquement, stressante [52]. La variation somaclonale, y compris la stérilité, chez les plantes produites par culture tissulaire peut être le produit de réponses de stress endommageant l'ADN [53]. Les données transcriptomiques de cette étude ont révélé qu'en fait, les gènes de réponse de défense étaient enrichis parmi les gènes caractérisés par le cal qui étaient régulés à la hausse dans le cal par rapport à tout autre tissu. L'hyperméthylation est considérée comme un mécanisme de protection contre les stress, qui améliore la stabilité du génome et préserve l'intégrité du génome [54]. Notre comparaison entre le cal et la plantule a révélé une méthylation globalement élevée dans le cal dans les trois contextes de séquence. De manière cohérente, une hyperméthylation dans le cal par rapport à l'embryon immature a été trouvée dans une étude utilisant une autre lignée consanguine de maïs et un séquençage d'immunoprécipitation d'ADN méthylé (MeDIP-seq) [55]. Dans cette étude, un petit ARN de 24 nt s'est avéré positivement corrélé avec la méthylation de l'ADN. Chez le riz, une hyperméthylation de la CG a été observée dans les cals à 1 et 3 ans par rapport à la pousse du riz mutant. MET1-2, qui code pour une ADN méthyltransférase ayant un rôle majeur dans le maintien de la méthylation de la CG. Dans le riz de type sauvage, cependant, seule une hyperméthylation CHH a été observée [52]. Dans notre étude, la comparaison cals versus plantules a montré que l'A188 MET1-2 homologue (Zm00056a035610) était

2× régulé à la hausse dans le cal, et vadrouille1 (Zm00056a013519), un homologue de l'ARN polymérase 2 dépendante de l'ARN qui est impliquée dans la production de 24 nt de petit ARN [56], était régulé à la hausse 5 à 6 fois dans le cal, indiquant que la machinerie transcriptomique était régulée pour améliorer Méthylation de l'ADN dans le cal. Chez les plantes régénérées à partir de cals, la méthylation de la CG et de la CHG avait tendance à être perdue par rapport aux plantes non régénérées et de nombreux événements de méthylation étaient héréditaires [57]. Une hypométhylation héréditaire chez les plantes régénérées a été observée dans une étude antérieure sur le maïs [58]. Dans le riz, par rapport aux plantes non régénérées du riz, une hypométhylation prononcée a été trouvée dans les plantes régénérées à partir de la culture tissulaire [59]. Les niveaux différents de méthylation de l'ADN entre les plantes régénérées et les cals ont indiqué que la plupart des méthylations obtenues à partir de la culture de tissus ne sont pas stables ou héréditaires. Collectivement, la méthylation de l'ADN était élevée pendant la formation du cal, probablement en raison des réponses de défense cellulaire. La majorité de la méthylation de l'ADN acquise semble être déméthylée pendant la redifférenciation, ce qui entraîne des plantes régénérées hypométhylées.


Héritage:

Le génotype est la constitution génétique d'un organisme. Ce sont les allèles qui font partie du code génétique par exemple TT, Tt ou tt pour la taille.

Le phénotype est l'expression de cette constitution génétique et de son interaction avec l'environnement (la caractéristique de l'individu).

Il peut y avoir de nombreux allèles d'un même gène où ils pourraient être l'un des trois suivants :

  • Dominant: Allèle dont la caractéristique apparaît dans le phénotype même lorsqu'il n'y a qu'une seule copie. Ces allèles sont écrits en lettres majuscules par exemple le t majuscule dans le génotype utilisé dans l'exemple pour le génotype pour grand.
  • Récessif: Un allèle dont la caractéristique apparaît dans le phénotype s'il y a deux copies contrairement à dominante. Ces allèles sont écrits en lettres minuscules, par exemple le t minuscule dans le génotype utilisé dans l'exemple pour le génotype pour grand.
  • Codominante : Allèles qui sont tous deux exprimés dans le phénotype et sont représentés par deux lettres majuscules où une lettre étant l'allèle est un exposant à l'autre lettre majuscule étant le gène par exemple la couleur d'un muflier où C R = Fleurs rouges et C W = Fleurs blanches :

Dans un organisme diploïde (comme nous les humains car nous avons deux ensembles de chromosomes), les allèles à un locus spécifique (emplacement sur le chromosome) peuvent être :

  • Homozygote : Un organisme qui a deux copies du même allèle dans le génotype, par exemple TT ou tt. L'organisme est dit homozygote.
  • Hétérozygote : Un organisme qui porte deux allèles différents dans le génotype, par exemple Tt. L'organisme est dit hétérozygote.

NB : Le diagramme génétique suivant doit être connu car il vous sera demandé à l'examen de prédire les génotypes et phénotypes de la progéniture. L'héritage monohybride est l'héritage d'une seule caractéristique contrôlée par un seul gène. Les images qui disent «croix monohybride» (l'image avec les allèles T) montre la disposition qu'il est recommandé de faire à l'examen et ces croisements monohybrides couvrent toutes les combinaisons possibles entre homozygote dominant, hétérozygote dominant et homozygote récessif. Ces allèles sont sur des gènes autosomiques portés sur des autosomes. Les autosomes sont des chromosomes qui ne sont pas des chromosomes sexuels.

L'image croisée monohybride avec les allèles C W fait également partie de la ressource ci-dessous. Ces allèles font partie de l'autosome.

Certains gènes ont plusieurs allèles où plus de deux peuvent coder pour le même gène, mais seulement deux de ces allèles peuvent être exprimés dans le phénotype de la progéniture car deux parents sont impliqués. Ceci est un exemple de groupe sanguin qui est également une image avec le titre ‘monohybrid cross – plusieurs alleles’ (les allèles avec I B et I O ). Ces allèles font partie de l'autosome.

La mucoviscidose (FK) est causée par un allèle récessif chez une personne homozygote récessive. Un mucus épais et collant se forme et reste sur la muqueuse des poumons. Ces allèles font partie de l'autosome.

L'albinisme est une maladie héréditaire caractérisée par un manque de couleur créé par la mélanine dans des structures colorées telles que les cheveux, l'iris et la peau. Les albinos ont donc les yeux rouges, la peau rosâtre et les cheveux jaune pâle. It caused by a single recessive allele in the genotype. These alleles are part of the autosome.

Huntington’s disease, an incurable and fatal disease, is caused by a dominant allele in the genotype. These alleles are part of the autosome.

There is a 50-50 chance that a baby can be a boy or a girl. This can be proved by the Punnett square which is shown by the image called 󈧶-50 chance of being a boy or a girl’.

Sex linked characteristics are carried on the X of the sex chromosomes therefore the genes are not autosomal. An example of this is colour blindness which is the image called ‘colour blindness’. Boys are more likely to be colour blind than girls as boys only have one X chromosome. If this chromosome has the allele then he is colour blind. Girls have two X chromosomes and therefore the two are needed to have the allele for her to be colour blind.

Dihybrid inheritance is where two characteristics are adopted by two different alleles on different loci. An example follows:

Exemple: Two pea plants each with the genotype RRYY and rryy were crossed to create the first generation of offspring all with the genotype of RrYy. Two of the offspring were crossed to create the second generation of offspring. R is for round, r is for wrinkled, Y is for yellow and y is for green. NB: There has to be the two different types of alleles controlling a different characteristic in the same gamete as this is dihybrid inheritance – the inheritance of two characteristics. The other parent has the phenotype wrinkled and green with the genotype rryy so the gametes will be ry and ry. As the table below represents the offspring of the second generation, both parents have the genotype RrYy giving the gametes RY, Ry, rY and ry (the possible combinations of two different alleles controlling different characteristics:

RYRyrYry
RYRRYYRRYyRrYYRrYy
RyRRYyRRyyRrYyRryy
rYRrYYRrYyrrYYrrYy
ryRrYyRryyrrYyrryy

From the offspring above a phenotypic ratio can be concluded showing the two characteristics i.e. the phenotypic ratio for the offspring above is: 9 round and yellow seeds: 3 round and green seeds: 3 wrinkled and yellow seeds: 1 wrinkled and green seed.

If there were 16 offspring, 9 of the offspring would have round and yellow seeds, 3 would have round and green seeds, another 3 would have wrinkled and yellow seeds and 1 would have wrinkled and green seeds as this is the expected value. Not all cases are like this where another set of 16 offspring either from the same parents or different parents of the same genotype as RrYy may have 10 that have round and yellow seeds, 2 that have round and green seeds, 4 that have wrinkled and yellow seeds and none of the offspring have wrinkled and green seeds instead of the classic 9:3:3:1 ratio. This is our observed value. So, how would we know if the difference of the expected values and observed values are due to chance? Solution: Chi-squared should be used.

NB: You are not expected to work out chi squared in the exam however a demo will be given below following the same type of plant and crossing as the one above.

We have to come up with our null hypothesis which is: THERE IS NO SIGNIFICANT DIFFERENCE BETWEEN THE OBSERVED AND EXPECTED RESULTS.

It is best if you put your data in a table like the one below:

OEO – E(O – E) 2(O – E) 2 /E
Round and yellow seeds109111/9
Round and green seeds23-111/3
Wrinkled and yellow seeds43111/3
Wrinkled and green seeds01-111

As the chi squared formula has the funny symbol in front of the fraction which means sum of, all the values at the furthest right of the table above have to be added up to give chi-squared. Chi squared is therefore 16/9. This value should be referred to the table below:

Probability, p
Degrees of freedom0.25 (25%)0.20 (20%)0.15 (15%)0.10 (10%)0.05 (5%)0.02 (2%)0.01 (1%)
11.321.642.072.713.845.416.63
22.773.223.794.615.997.829.21
34.114.645.326.257.819.8411.34
45.395.996.747.789.4911.6713.28
56.637.298.129.2411.0713.3915.09

NB: We should always use the column with the 0.05 or 5% probability highlighted in yellow as biologists always use this. The values in the table are known as critical values.

To know which degrees of freedom to use we must use the value that is 1 minus how many categories we have. So in this case as we have four categories (the different types of seeds that the offspring have), we subtract 1 from this and we get three which is our degrees of freedom. Therefore our critical value is 7.81 which is in bold and underlined. We compare our chi-squared value (16/9) to the critical value (7.81). Our chi-squared value is smaller than the critical value therefore we accept our null hypothesis saying also that there is a 5% or higher probability that the results are due to chance and there is no significant difference between observed and expected values. NB: If our chi-squared value was greater than the critical value then we reject our null hypothesis and also say that there is a 5% or lower probability that the results are not due to chance and there is a significant difference between observed and expected values.

Epistasis is where a gene interferes with another gene on a different locus. An example is as follows: Flowers can be either white, light blue or aqua blue. The alleles of the gene code for the enzyme used to catalyse the reaction between white and light blue and light blue and aqua blue. The reaction between white and light blue is controlled by an enzyme called Enzyme A, coded by the dominant allele A. The reaction between light blue and aqua blue is controlled by Enzyme B coded by the dominant allele B. An image with the title ‘Epistasis’ is on the resource for you to look at.

Linkage is where there are two alleles that code for a different characteristic on the same chromosome. Therefore variation is reduced. An example is sweet pea plants in the image named ‘linkage’.

Recombination is the reassortment of genes into different combinations from the parents. Offspring that have recombination are called recombinants and gives rise to different individuals in a natural population. Three things can give rise to recombination: crossing over, independent assortment/segregation and random fertilization.

6 POINTS ON HOW TO ANSWER ‘LOOKING FOR EVIDENCE’ QUESTIONS IN GENETICS

  1. A TIP TO REMEMBER IS NEVER ASSUME THAT A GENETIC CROSS OR PEDIGREE DIAGRAM IS SEX-LINKED UNLESS IT TELLS YOU IN THE QUESTION.
  2. Q1:WHAT IS THE EVIDENCE THAT AN ALLELE IS RECESSIVE?

Ce qu'il faut chercher:LOOK FOR PARENTS WHO ARE UNAFFECTED AND HAVE A CHILD WHO IS AFFECTED.

Explication:PARENTS MUST BE HETEROZYGOUS BECAUSE THEY ARE UNAFFECTED AND ALSO THEY PASS ON THEIR RECESSIVE ALLELE TO THEIR CHILD.

Ce qu'il faut chercher:LOOK FOR TWO PARENTS WHO ARE AFFECTED AND HAVE A CHILD THAT IS NOT AFFECTED.

Explication:PARENTS MUST HETEROZYGOUS BECAUSE THEY ARE AFFECTED AND ALSO THEY PASS ON THEIR RECESSIVE ALLELE TO THEIR CHILD.

Ce qu'il faut chercher: LOOK FOR A MOTHER WITHOUT THE CONDITION AND A SON WITH THE CONDTION.

Explication: MUM MUST BE HETEROZYGOUS FOR HER TO NOT HAVE THE CONDITION.

Ce qu'il faut chercher: LOOK FOR UNAFFECTED FATHER AND AFFECTED DAUGHTER.

Explication: DAUGHTER MUST HAVE TWO RECESSIVE ALLES BUT COULD NOT INHERIT THE RECESSIVE ALLELE FROM DAD BECAUSE HE IS UNAFFECTED.

Ce qu'il faut chercher: LOOK FOR AN AFFECTED FATHER AND UNAFFECTED DAUGHTER.

Explication: IF FATHER’S X CHROMOSOME CARRIES THE DOMINANT ALLELE THE DAUGHETR WOULD BE AFFECTED WHICH IS NOT THE CASE.


Selina Concise Biology Class 10 ICSE Solutions Genetics Some Basic Fundamentals

APlusTopper.com provides step by step solutions for Selina Concise ICSE Solutions for Class 10 Biology Chapter 3 Genetics Some Basic Fundamentals. You can download the Selina Concise Biology ICSE Solutions for Class 10 with Free PDF download option. Selina Publishers Concise Biology for Class 10 ICSE Solutions all questions are solved and explained by expert teachers as per ICSE board guidelines.

Selina ICSE Solutions for Class 10 Biology Chapter 3 Genetics – Some Basic Fundamentals

Solution A.1.
d) Ascaris

Solution A.2.
a) 3 : 1

Solution B.1.
(a) – (iii) Study of laws of inheritance of characters
(b) – (v) Chromosomes other than the pair of sex chromosomes
(c) – (iv) A gene that can express when only in a similar pair
(d) – (ii) The alternative forms of a gene
(e) – (i) Chromosomes similar in size and shape

Solution B.2.
Lion, tiger, domestic cat (Any two)

Résolution B.3.
Colour-blindness, Thalassaemia, Sickle cell anaemia and Haemophilia (Any two)

Solution B.4.
Homozygous dominant – RR
Homozygous recessive – rr

Solution C.1.

Phénotype Génotype
The observable Characteristic which is genetically controlled is called phenotype. The set of genes present in the cells of an organism is called its genotype.

Personnage Trait
Any heritable feature is called a character. The alternative form of a character is called trait.

Croix monohybride Croix dihybride
It is a cross between two pure breeding parent organisms with different varieties taking into consideration the alternative trait of only une personnage. It is a cross between two pure breeding parent organisms with different varieties taking into consideration the alternative trait of deuxpersonnages.

Résolution C.2.
The characteristics of a species such as physical appearance, body functions and behavior are not only the outcome of chromosome number, but these depend on the genotype of every organism. That means the set of genes present in the organisms may very and therefore lion, tiger and domestic cat have the same number of 38 chromosomes, their characteristics (like different appearances) are the result of the genes located on the chromosomes.

Résolution C.3.

Personnage Dominant trait Trait récessif
Flower Colour Purple blanche
Seed Colour Jaune Vert
Seed Shape Tour Ridé
Pod Shape Inflated Constricted
Flower Position Axial Terminal

Solution C.4.

  • Colour-blindness is caused due to recessive genes which occur on the X chromosome.
  • Males have only one X chromosome. If there is recessive gene present on X chromosome, then the male will suffer from colour-blindness.
  • Females have two X chromosomes. It is highly impossible that both the X chromosomes carry abnormal gene. Hence, if one gene is abnormal and since it is recessive, its expression will be masked by the normal gene present on the other X chromosome. Females are unlikely to suffer from colour-blindness.

Résolution C.5.
Phenotypic Ratio – 3 (Black Fur) :1 (Brown Fur)
Genotypic Ratio – 1(Homozygous Black Fur):2 (Heterozygous Black Fur): 1 (Homozygous Brown Fur)

Résolution D.1.

(une) Hétérozygote : The condition in which a pair of homologous chromosomes carries dissimilar alleles for a particular character.

  1. A daughter (XX o ) from a normal homozygous mother for colour vision (XX) and a colour blind father has one normal and one defective allele (X o Y).
  2. Certain tongue rollers are heterozygous with Rr genotype.

(b) Homozygote : The condition in which a pair of homologous chromosomes carries similar alleles for a particular character.

  1. A colorblind daughter (X o X o ) will have both the X chromosomes with defective alleles.
  2. A non-roller will have rr (homozygous) genotype.

(c) Pedigree Chart: A pedigree chart is a diagram that shows the occurrence and appearance or phenotypes of a particular gene or organism and its ancestors from one generation to the next. In the pedigree chart, males are shown by squares and females by circles.

Résolution D.2.
Mendel’s laws of inheritance are:

  1. Law of Dominance: Out of a pair of contrasting characters present together, only one is able to express itself while the other remains suppressed. The one that expresses is the dominant character and the one that is unexpressed is the recessive one.
  2. Law of Segregation : The two members of a pair of factors separate during the formation of gametes. The gametes combine together by random fusion at the time of zygote formation. This law is also known as ‘law of purity of gametes’.
  3. Law of Independent Assortment: When there are two pairs of contrasting characters, the distribution of the members of one pair into the gametes is independent of the distribution of the other pair.

Résolution D.3.

    • The sex of the child depends on the father. The egg contains only one X chromosome, but half of the sperms contain X-chromosome whereas the other half contains Y-chromosome. It is simply a matter of chance as to which category of sperm fuses with the ovum and this determines whether the child will be male or female.
    • If the egg fuses with X-bearing sperm, the resulting combination is XX and the resulting child is female.
    • If the egg fuses with Y-bearing sperm, the resulting combination is XY and the resulting child is male.

    Résolution E.1.

    Résolution E.2.
    (a) Black
    (b) No

    Résolution E.3.

    Résolution E.4.
    (a) Father
    (b) Two sons and three daughters
    (c) The child 1 (daughter) is colour blind
    (d) X chromosome
    (e) Haemophilia

    More Resources for Selina Concise Class 10 ICSE Solutions


    Genome structure and evolution of Antirrhinum majus L

    Snapdragon (Antirrhinum majus L.), a member of the Plantaginaceae family, is an important model for plant genetics and molecular studies on plant growth and development, transposon biology and self-incompatibility. Here we report a near-complete genome assembly of A. majus cultivar JI7 (A. majus cv.JI7) comprising 510 Megabases (Mb) of genomic sequence and containing 37,714 annotated protein-coding genes. Scaffolds covering 97.12% of the assembled genome were anchored on eight chromosomes. Comparative and evolutionary analyses revealed that a whole-genome duplication event occurred in the Plantaginaceae around 46-49 million years ago (Ma). We also uncovered the genetic architectures associated with complex traits such as flower asymmetry and self-incompatibility, identifying a unique duplication of TCP family genes dated to around 46-49 Ma and reconstructing a near-complete ψS-locus of roughly 2 Mb. The genome sequence obtained in this study not only provides a representative genome sequenced from the Plantaginaceae but also brings the popular plant model system of Antirrhinum into the genomic age.

    Déclaration de conflit d'intérêts

    Les auteurs ne déclarent aucun intérêt concurrent.

    Les figures

    Fig. 1. An overview of the genomic…

    Fig. 1. An overview of the genomic features of A. majus JI7.

    Fig. 2. Genome evolution of A. majus…

    Fig. 2. Genome evolution of A. majus .

    Fig. 3. Evolution of flower symmetry and…

    Fig. 3. Evolution of flower symmetry and TCP gene family.

    Left, a phylogenetic tree of…

    Fig. 4. Genomic features of the ψS…

    Fig. 4. Genomic features of the ψS -locus of A. majus and its synteny with…


    Résultats

    Data pre-processing

    A total of 18 samples of raw RNA-Seq data (Additional file 2: Table S1) were obtained for this study. Of the 18 samples, 3 generated from the trypanosome-infected salivary glands were excluded from further analysis because they contained PCR duplicates. Thus, a total of 15 samples were analyzed (Additional file 2: Table S1). Furthermore, lowly expressed genes were excluded to reduce noise, thus resulting in a total of 7390 genes across the 15 samples.

    The relationship between the samples and the reproducibility of biological replicates was determined using principal component analysis (PCA) and Pearson correlation heatmap analysis prior to (Additional file 3: Figure S1) and after adjusting for batch effects that could have resulted from biological replicates (Fig. 1). The PCA and Pearson correlation heatmap plots showed that the samples grouped together based on the developmental stages of T. brucei in the insect vector rather than their biological replicates (Fig. 1). An assessment of the distribution of per-gene read counts per sample showed a median steady-state expression level of

    6.5 log2 counts per million in all the 15 samples (Additional file 4: Figure S2).

    Global gene expression profiles of Trypanosoma brucei. une Principal component analysis (PCA) plot. Each point in the PCA plot represents a sample, and point color indicates a batch that consists of the biological replicates. b Sample correlation heatmap using hierarchical clustering. Color codes along the left side of the sample correlation heatmap indicate samples based on the batch they belong to. MG1 and MG2 are midgut samples, PV2 proventriculus samples, and SA2 salivary gland samples

    Weighted gene co-expression network construction

    A total of 7390 protein coding genes from 15 samples were used for the construction of the co-expression network. Prior to generation of the network, the soft-thresholding power to which co-expression similarity was raised to calculate adjacency was determined by analysis of thresholding powers from 1 to 20. Power 14, the power for which the scale-free topology fitting index (R 2 ) was ≥ 0.8, was chosen (Additional file 5: Figure S3). A total of 28 distinct modules were generated for 7390 protein coding genes from the hierarchical clustering tree (dendrogram) using the dynamic tree cut algorithm (Figs. 2, 3, and Additional file 6: Table S2). The gray module, which contained 59 genes that could not be assigned to any module, was excluded from the analysis (Fig. 3). Thus, a total of 27 modules were used in the subsequent analysis. The module with the least genes (61) was the white module while the turquoise module had the largest number of genes (732) (Fig. 3).

    An illustration of the identified gene co-expression network modules in T. brucei. une Hierarchical cluster dendrogram. Les X-axis represents the co-expression distance of the genes, while the oui-axis represents the genes. A dynamic tree cutting algorithm identified the modules by splitting the tree at significant branching points. Modules are represented by different colors as shown by the dendrogram. b Co-expression network from weighted gene co-expression network analysis (WGCNA) based on topological overlap measures (TOMs) > 0.3 for visualization. Each point (or node) on the network represents a gene, and points of the same color form a gene module. Lines (edges) on the network connecting the nodes represent a relationship between the genes

    Number of genes identified in each module. In total, there were 28 modules. The gray module contains 59 genes that could not be assigned to any module and was excluded from downstream analysis

    Functional and pathway enrichment analysis

    Out of the 27 modules generated, only 14 modules were found to be enriched for GO terms 12 were over-represented and 2 (blue and green modules) were under-represented for GO terms (Additional file 7: Table S3). Seven of the 27 modules were enriched following KEGG pathway enrichment analysis, from which 5 were over-represented and 2 (lightcyan and blue modules) were under-represented for KEGG pathway terms (Additional file 8: Table S4). The top enriched GO terms for the modules with over-represented GO terms highlight some functions of the module genes (Table 1). Of the 12 modules with over-represented GO terms, 4 modules were over-represented for KEGG pathway terms and 1 module (yellow module) was over-represented for a KEGG pathway term (endocytosis), but not GO terms (Table 1).

    Modules hub gene identification

    Highly connected genes in a module are referred to as intra-modular hub genes. These hub genes are considered functionally significant in the enriched functions of the modules. Following the hypothesis that higher connectivity for a gene implies more importance in the module’s functional role, genes with the highest connectivity in the 27 modules were determined and considered to be the hub genes (Additional file 9: Table S5). Hub genes for the 12 modules with over-represented GO terms are described in Table 2.

    3′ UTR motif prediction based on gene co-expression modules

    Genes in a given module are hypothesized to be co-regulated as they are assumed to have similar functions. Consequently, their cis-regulatory element should be similar. Following this hypothesis, ten statistically significant RNA motifs, each over-represented in different gene modules, were identified using FIRE (Fig. 4a).

    Prediction of regulatory elements in the 3′ untranslated regions (UTR) based on gene co-expression modules. une Predicted motifs for the gene modules are shown. Columns represent gene modules, while rows represent the predicted motifs with consensus sequence on the right side. Over-representation of a motif for a given gene module is indicated by yellow color with significant over-representation highlighted by red frames. Blue color map and frames indicate under-representation. b Motif pairs co-occurring in the 3′ UTR are shown in the heatmap where each row and each column correspond to a predicted motif. Light colors indicate the presence of another motif within the same 3′ UTR while dark colors indicate that the motifs are absent in the same 3′ UTR. “+” indicates significant spatial co-localization between pairs of motifs


    Fichier supplémentaire 1 : Figure S1.

    OCCs present fluctuations in histone modifications. A. Heatmap of PC1 values for stable compartments from the three independent Hi-C biological replicates and B, the merged Hi-C biological replicates. C. PC1 eigenvector correlations between every pair of timepoints (Kruskal-Wallis rank sum test p-value < 2e-16). D. Proportion of OCCs and constant compartments in the mouse genome. E. Barplot of the frequency of the different OCCs categories with compartments switching at different times of the 24 hours. For example AABA refers to OCCs with compartment assignment A at ZT0, A at ZT6, B at ZT12 and A at ZT18. F. Chromatin features (H3Kme4 and H3Kme1) at OCCs across time points (AABB, ABBB and ABAB OCCs are shown) (*** all p-values < 0.001 except for the H3K4me1 AABB, one way ANOVA and Tukey post hoc test).

    Additional file 2: Figure S2.

    Total RNA-seq analysis at four timepoints during the circadian cycle. A. Spearman correlation analysis of the four biological replicates from ZT0 and ZT12 (r ≥ 0.85). B. Heat map of the relative transcription (Z scores) of 1,257 oscillating genes sorted by oscillation phase. C. Individual expression profiles and genome browser tracks showing examples of the RNA-seq signal for Arntl, Per1, Nr1d1, Cry1, Ppp1r3c et Gsk3a oscillating genes (Fragments Per Kilobase of transcript per Million mapped reads, FPKM) (n=4, q-value <0.01). D. GO analysis for the detected oscillating genes. Significantly enriched categories are shown. E. KEGG analysis for detected oscillating genes. Significantly enriched categories are shown. F. Additional individual transcriptional profiles from the RNA-seq for Rorc, L'horloge, Npas2, Cry2, Per2, Per3 circadian genes. G. RT-qPCR validation for candidate circadian genes both at mRNA and pre-mRNA level (p-values < 0.0001, one-way ANOVA test).

    Additional file 3: Figure S3.

    Expression profiles of the circadian genes displayed along the paper. RNA-seq signal tracks for circadian genes shown across the paper for the four timepoints during the circadian cycle. Arntl, Npas2, Cgn, Nr1d1, Dhrs3, Nr1d2, Per2, Ppp1r3c, Tef, Rnf125, Rorc et Aco2 circadian gene expression profiles are presented.

    Additional file 4: Figure S4.

    TAD structure and CTCF binding is preserved during the 24 hours. A. TADs overlap between time points. B. TADs size distribution at all time points. C. 50kb resolution Median Observed/Expected Hi-C signal around 1000 randomly selected TADs from ZT6, 12 and 18 plotted on the indicated time points. TADs were scaled to fit the five central bins. D. CTCF ChIP-seq motif analysis and peak overlap between ZT0 and 12. Genomic tracks of CTCF ChIP-seq signal at example regions harbouring circadian genes. E. Above, the same metaplots as in C but for 1000 randomly CTCF peaks found at ZT12 plotted using ZT12 and ZT0 Hi-C contacts. Below, metaplot using CTCF peaks from mESC and plotted using liver ZT0 and 12 Hi-C contacts. CTCF peaks are at the central bin of the metaplot. F. TAD and cTAD size comparison (p-value < 2.2e-16, Wilcoxon rank sum test).

    Additional file 5: Figure S5.

    Promoter-Promoter networks in the mouse liver over a circadian cycle. A. Partial view of a virtual 4C from the Arntl gene promoter using the Hi-C and P-CHi-C raw valid pairs. Histograms of read counts per restriction fragment around the bait region corresponding to the captured promoter are shown. B. Number of total read counts comparing Hi-C and P-CHi-C recovered using the Arntl1 gene promoter as bait on a virtual 4C (restriction fragments with at least 5 reads in the P-CHi-C experiment where used) (p-value < 0.0001, Wilcoxon ranked test). C. Promoter-promoter contact network at ZT0. Each color represents a chromosome. Nodes with degree=1 are not included for simplicity. D. The four largest promoter-promoter interaction clusters of the network at the different time points during the day. E. Significantly enriched GO categories for the genes on the most prominent promoter-promoter clusters shown in D.

    Additional file 6: Figure S6.

    Circadian gene promoter-promoter interactions. A. Promoter-promoter contact network at ZT0 with the circadian genes marked in blue. B. Above, number of edges (interactions) between circadian gene promoters at ZT0, 6, 12 and 18 hours of the day (blue line) compared to a random set of non circadian promoters. Below, z-score for circadian gene promoter contacts compared to the random sampling. C. Quantification of the read counts supporting all circadian gene promoter-promoter interactions compared to a random set of non circadian promoter-promoter interactions (*** p-value < 0.001, Mann Whitney test) D. Transcriptional phase distributions of circadian promoters in contact with diurnal or nocturnal circadian promoters (all p-values < 0.0001, Wilcoxon signed rank test) for our circadian intronic gene set. E. The same as in D for the circadian gene set detected through GRO-seq (Fang et al., 2014) (all p-values < 0.0001, Wilcoxon signed rank test) F. Virtual 4C landscape for the Tef circadian gene promoter from P-CHi-C data at all time points during the day. The acrophase of Tef is written next to the gene name. Expression profiles for both genes can be found in Figure S3. Genomic tracks show significant contacts as arcs and chromatin features including liver H3K4me3, H4K4me1, H3K27ac, DNAseI, eRNAs and TADs. Tef gene promoter contacts Aco2 gene promoter both with acrophase at ZT12.

    Additional file 7: Figure S7.

    Core clock gene promoter vs output circadian genes interaction landscapes.A-D. Virtual 4C for Rorc, Npas2, Nr1d2 et Per2, core clock circadian gene promoters from P-CHi-C data at all time points during the day. Les Rorc circadian gene promoter contacts Cgn circadian gene promoter and both peak in transcription at ZT18. E-F Virtual 4C for Dhrs3 et Ppp1r3c output circadian genes in the liver. Acrophases are written next to the gene names. Genomic tracks show significant contacts as arcs and chromatin features including liver H3K4me3, H3K4me1, H3K27ac, DNAseI, eRNAs and TADs. Expression profiles for all genes can be found in Figure S3. The interaction profiles of core clock genes display less contacts that dynamically change over time. The two output gene contact profiles show more saturated contacts that are mostly constant during the 24 hours.

    Fichier supplémentaire 8.

    Custom code. This file contains a summary of the custom code used in this work.


    Voir la vidéo: Ch3 gènes et chromosomes (Septembre 2022).


Commentaires:

  1. Ahriman

    Ces informations ne sont pas exactes

  2. Donnell

    Je ne peux pas participer maintenant à la discussion - il n'y a pas de temps libre. Mais j'écrirai bientôt nécessairement que je pense.

  3. Bennie

    Désolé, supprimé

  4. Orin

    Je suis désolé, mais, à mon avis, ils se sont trompés. Nous devons discuter. Écrivez-moi en MP.

  5. Hamdan

    Phrase merveilleusement utile



Écrire un message