Informations

18.4 : Évolution des génomes - Biologie

18.4 : Évolution des génomes - Biologie



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

18.4 : Évolution des génomes

L'évolution du nombre d'organites par cellule

Des organites avec leurs propres génomes distincts, tels que les plastes et les mitochondries, se trouvent dans la plupart des cellules eucaryotes. Au fur et à mesure que ces organites et leurs cellules hôtes ont évolué, la partition des processus métaboliques et le codage des produits géniques en interaction ont créé une codépendance obligatoire. Cette relation a joué un rôle dans la formation du nombre d'organites dans les cellules au cours de l'évolution. Des facteurs tels que les forces évolutives stochastiques agissant sur les gènes impliqués dans la biogenèse des organites, les interactions organites-gènes nucléaires et les limitations physiques peuvent, à des degrés divers, dicter la contrainte sélective à laquelle le nombre d'organites par cellule est soumis. En particulier, la coordination entre l'expression des gènes nucléaires et organellaires peut être importante dans le maintien de la stoechiométrie des produits géniques, ce qui peut avoir un rôle important dans la limitation de l'évolution de ce trait.

Mots clés: biologie cellulaire évolutive mitochondrie biogenèse des organites stoechiométrie des plastes.


18.4 : Évolution des génomes - Biologie

Évolution des génomes Similitudes génomiques entre espèces distantes Les similitudes génomiques entre espèces distantes peuvent être établies via l'analyse des génomes à l'aide d'une technologie de pointe. OBJECTIFS D'APPRENTISSAGE Discuter des implications évolutives des similitudes génomiques observées entre des espèces distantes PRINCIPAUX POINTS À RETENIR Points clés Les similitudes génomiques entre espèces distantes peuvent être expliquées par la théorie th .

  • Vous êtes ici :  
  • Accueil
  • Parapluie
  • Manuels
  • Bio581
  • Chapitre 1 L'étude de la vie
  • 1.4 Résumé du chapitre

Ce texte est basé sur Openstax Biology for AP Courses, Senior Contributing Authors Julianne Zedalis, The Bishop's School in La Jolla, CA, John Eggebrecht, Cornell University Contributing Authors Yael Avissar, Rhode Island College, Jung Choi, Georgia Institute of Technology, Jean DeSaix , Université de Caroline du Nord à Chapel Hill, Vladimir Jurukovski, Suffolk County Community College, Connie Rye, East Mississippi Community College, Robert Wise, Université du Wisconsin, Oshkosh

Ce travail est sous licence Creative Commons Attribution-NonCommercial 4.0 Unported License, sans restrictions supplémentaires


Évolution des chromosomes sexuels monotrèmes

Pour élucider la composition génomique détaillée des chromosomes sexuels monotrèmes, nous avons comparé des régions qui partagent des séquences entre les chromosomes sexuels, c'est-à-dire les PAR, avec des régions qui sont devenues sexuellement différenciées (SDR). Les limites du PAR montrent un changement important dans le ratio de couverture de séquençage femme/homme comme prévu (Fig. 2a et données étendues Fig. 4a). Les deux monotrèmes ont montré des niveaux d'expression génique généralement non biaisés entre les sexes dans les PAR, mais une expression prononcée en faveur des femmes dans les SDR, indiquant l'absence de compensation complète de la dose à l'échelle du chromosome dans les monotrèmes, comme suggéré précédemment 9 (données étendues, figure 4b).

une, Composition génomique des chromosomes sexuels de l'ornithorynque. Des anneaux externes aux anneaux internes : les chromosomes X avec les PAR (couleurs claires) et les SDR (couleurs foncées) ont marqué les fragments de chromosome Y assemblés au sein des SDR montrant les niveaux de divergence de séquence à l'échelle des couleurs avec les chromosomes X homologues femelle-à-mâle ( Rapports F/M) de couverture courte de lecture de séquençage dans des fenêtres de 5 kb sans chevauchement Rapports d'expression F/M (chaque point rouge est un gène) du rein adulte et tendance d'expression lissée et contenu en GC dans les 2- ko fenêtres. De plus, nous avons marqué les positions sur l'anneau chromosomique X des paires de gamétologues qui ont supprimé la recombinaison avant la divergence des monotrèmes (« partagés », triangles oranges) ou après la divergence (« indépendants », triangles bleus). b, Homologie entre les chromosomes X et Y de l'ornithorynque. En particulier, la plupart des Y5 présentent une homologie avec X1 et X2, ce qui suggère une conformation en anneau ancestral des chromosomes sexuels de l'ornithorynque. Nous avons également marqué la position du gène putatif déterminant le sexe AMH. La silhouette de l'ornithorynque est créée par S. Werning et est reproduite sous la licence Creative Commons Attribution 3.0 Unported (http://creativecommons.org/licenses/by/3.0/).

Les courts PAR des chromosomes X2-X5 de l'ornithorynque ont une teneur en GC significativement plus élevée (test unilatéral de la somme des rangs de Wilcoxon, P < 0,01) que les SDR ou les PAR plus longs (Extended Data Fig. 4c), ce qui reflète probablement une forte conversion génique biaisée par GC causée par un taux de recombinaison élevé 10 . Ceci est similaire au schéma du PAR humain court riche en GC, dont le taux de recombinaison est 17 fois plus élevé que la moyenne à l'échelle du génome 11 . Notamment, les séquences orthologues de poulet de ces PAR monotrèmes sont toutes localisées sur les microchromosomes, qui ont également une teneur élevée en GC 12 (test unilatéral de Wilcoxon rank-sum, P < 0.01) (Données étendues Fig. 4c, d). Ce paysage de recombinaison hautement conservé pourrait être partiellement sélectionné dans les monotrèmes pour maintenir le polymorphisme de séquence et le dosage équilibré des gènes du CMH, qui résident dans les PAR des paires de chromosomes X3-Y3 et Y4-X5 dans l'ornithorynque 13 (Extended Data Fig. 3a). La sélection régionale pour une recombinaison élevée peut également contrecarrer une nouvelle expansion des SDR sur ces chromosomes sexuels.

Les chromosomes sexuels des eutherians et des oiseaux se sont formés par suppression progressive de la recombinaison, entraînant un modèle de divergence de séquence par paires entre les SDR appelé «strates évolutives» 14,15. Nous avons identifié au moins sept strates dans les monotrèmes, nommées S0 à S6 de la plus ancienne à la plus jeune (Fig. 2a et Extended Data Fig. 4a), en classant leurs niveaux de divergence de séquences synonymes par paires entre les gamétologues X-Y et la phylogénie. (Données étendues Fig. 5a, b). Toutes les strates sauf les plus récentes (S5 et S6) sont partagées par l'ornithorynque et l'échidné. Cependant, les PAR qui bordent S5 et S6, ainsi que les PAR plus courts des chromosomes X2 et X5 (Extended Data Fig. 5c, d), se sont formés indépendamment après leur divergence. Dans l'ensemble, la distribution des strates évolutives a suggéré un ordre temporel d'incorporation de différents autosomes ancestraux dans la chaîne de chromosomes sexuels : elle a commencé à partir de la région S0 de X1 contenant un gène déterminant le sexe (voir ci-dessous), suivi de X2, X3 et X5. X4 et les régions individuelles de X3 et X1 ont subi une suppression de recombinaison après la divergence monotrème.

Malgré des épisodes d'évolution indépendante, la plupart des régions de chromosomes sexuels de l'ornithorynque et de l'échidné sont homologues (Extended Data Fig. 6a), suggérant que le complexe s'est formé dans l'ancêtre monotrème 16 . Pour reconstruire son origine, nous avons projeté les chromosomes sexuels de l'ornithorynque sur leurs homologues de poulet (tableau supplémentaire 39). Cette carte d'homologie raffinée (données étendues Fig. 4d) suggère que les fusions et les translocations réciproques parmi les fragments micro- et macrochromosomiques ancestraux ont donné naissance au complexe de chromosomes sexuels monotrèmes. Les chromosomes X de l'ornithorynque contiennent des séquences homologues des microchromosomes de poulet entiers ou partiels 11, 16, 17, 25 et 28. Ces microchromosomes ont également des orthologues dans le gar tacheté 17 , suggérant qu'ils étaient des microchromosomes de vertébrés ancestraux, et fusionnés dans le monotrème ancestral ou chromosomes de mammifères. La preuve de translocations réciproques est venue de l'observation que des parties de chaque deux chromosomes sexuels voisins sont homologues à deux régions adjacentes du même chromosome de poulet (Extended Data Fig. 6c, d). Par exemple, les chromosomes X1 et X2 de l'ornithorynque sont tous deux homologues à des parties du microchromosome 12 et du chromosome 13 du poulet, tandis que X2 et X3 sont tous deux homologues au chromosome 2 du poulet.

Notamment, X1 à une extrémité de la chaîne méiotique et Y5 à l'autre partagent cette relation de chevauchement alternative, et les deux sont homologues au microchromosome 28 de poulet. En effet, la plupart des gènes sur Y5 ne se trouvent pas sur son partenaire d'appariement X5, mais sur X1. (Fig. 2b et Tableau supplémentaire 40). Les chromosomes X1 et Y5 ne s'apparient pas à la méiose, mais cette homologie suggère que l'origine du complexe chromosomique sexuel monotrème existant impliquait l'ouverture de l'« anneau » chromosomique ancestral au cours de la dégénérescence 18 . Un gène conservé déterminant le sexe des vertébrés, l'hormone anti-mullérienne, est situé sur le chromosome Y5 (AMHY) et S0 du chromosome X1 (AMHX) 14 (fig. 2b). La région d'appariement ancestrale X1-Y5 qui englobe AMH pourrait donc être le site où la recombinaison homologue a été supprimée pour la première fois. La dégénérescence du chromosome Y5 a alors provoqué la perte d'homologie avec X1 et conduit à la rupture de l'anneau chromosomique. En effet, les taux de substitution synonymes (dS) entre les paires de gamétologues X1-Y5 retenues sont significativement plus élevées (test unilatéral de la somme classée de Wilcoxon, P < 0,01) que celles de toute autre paire de chromosomes sexuels (données étendues Fig. 6e). Une configuration d'anneau chromosomique a été signalée chez les plantes 19, mais pas chez aucune espèce animale. Alternativement, la structure de l'anneau ancestral pourrait avoir évolué après l'émergence de la paire proto-X1-Y5 par des translocations impliquant d'autres autosomes, de sorte que les allèles sexuellement antagonistes pourraient être liés aux gènes déterminant le sexe 20 .


Méthodes

Génération du génome et annotation des gènes

Tous les génomes Acari analysés dans notre étude sont disponibles en tant que ressources publiques auprès du NCBI (ftp://ftp.ncbi.nlm.nih.gov/). Les étapes d'inclusion étaient les suivantes : (1) Toutes les espèces d'Arachnida dans la base de données (avant 2020.06) ont été recherchées en tant que candidats (2) le génome avec le meilleur score de complétude a été sélectionné comme représentant s'il y avait deux génomes ou plus pour une espèce (3) les espèces dont la complétude du génome est inférieure à 80 % ont été éliminées (4) la prédiction des gènes a été effectuée pour les génomes dépourvus d'informations d'annotation des gènes et (5) les contigs de moins de 1 kb de longueur ont été exclus de l'ensemble de l'analyse. Les éléments répétitifs dans la séquence du génome ont été identifiés par RepeatMasker 63 (version 4.0.7) avec Repbase (version 16.02). Pour la prédiction des gènes, le pipeline BRAKER 64 (version 1.9) a été utilisé et les séquences protéiques de l'araignée de velours, de l'acarien de la gale, de l'acarien des abeilles, de l'aoûtat, du tétranyque du velours, du tétranyque, de l'acarien prédateur, de l'acarien de la poussière et du génome de la tique ont été appliquées comme références pour la prédiction de gènes basée sur l'homologie. Un lien vers les résultats annotés est fourni dans la section Disponibilité des données.

Détection de pseudogène

Pour réduire l'hétérogénéité des données de fond, nous avons sélectionné les trois génomes de meilleure qualité (ceux de D. farina, P. ovis, et S. scabiei) dans le groupe de transition en tant que représentants. GeneWise (version 2.4.1) a été utilisé pour l'alignement des gènes, tandis que les séquences codant pour les protéines d'une araignée (Stegodyphus mimosarum) ont servi de références. L'identité de séquence minimale a été fixée à 80 % et la valeur seuil E a été fixée à 10 -5 . Les gènes avec des mutations de décalage du cadre (SNP ou indels) ou des codons d'arrêt prématuré ont été annotés comme des pseudogènes.

Construction d'arbres phylogénétiques

Les séquences protéiques de courte longueur (<50 acides aminés) ou les codons d'arrêt prématuré ont été exclus. Les gènes orthologues ont été déduits par OrthoFinder (version 2.3.8) avec le logiciel DIAMOND (version 0.9.24). Une valeur attendue a été fixée à 10 -5 . Des gènes orthologues à copie unique ont été générés à partir du résultat d'OrthoFinder, et les blocs conservés de chaque gène ont été extraits par Gblocks (version 0.91b). Ensuite, nous avons combiné toutes les régions conservées de chaque gène orthologue. Un total de 50 502 sites ont été concaténés pour construire une séquence de supergènes pour chaque espèce, qui a été adoptée pour construire l'arbre phylogénétique. La phylogénie du supergène a été construite avec RAxML 65 (version 8.2.12) sous le modèle GTRGAMMA. Au total, 200 répliques bootstrap ont été effectuées et l'arbre avec le score de probabilité le plus élevé a été choisi comme arbre standard. Sur la base de la topologie de l'arbre standard, la longueur des branches de chaque gène a été estimée avec sa séquence. Ensuite, les gènes avec des longueurs de branches extrêmement biaisées ont été exclus. Après avoir supprimé tous les gènes biaisés, l'arbre des espèces a été reconstruit sur la base de 48 831 sites conservés par RAxML avec 1 000 réplicats bootstrap suivant la commande raxmlHPC-PTHREADS-SSE3 -x 12345 -p 12345 -# 1000 -m GTRGAMMA.

Estimation du temps de divergence

MCCMTREE dans PAML 66 (version 4.9i) a été utilisé pour calibrer le temps de divergence via la méthode de Monte Carlo de la chaîne de Markov. Temps fossile (Steganacarus magnus contre Hypochthonius rufulus: 394 - 571 Mya Dermatophagoides pteronyssinus contre Sarcoptes scabiei: 119 Mya et Ixodes scapulaires contre Dermanyssus gallinae: 336 Mya) a été déterminée à partir de la base de données Time Tree (http://www.timetree.org). Un modèle d'horloge détendue (horloge = 2) a été établi et MCMC a été réalisé (burnin = 4 000 000 sampfreq = 100 nsample = 100 000). D'autres paramètres ont été définis sur les valeurs par défaut et le programme Baseml a été exécuté en double pour vérifier la convergence.

Analyse de famille de gènes

Les séquences protéiques de seize génomes d'Arachnida ont été générées à partir des résultats annotés. Nous avons retiré les protéines avec des codons d'arrêt prématuré ou une longueur inférieure à 50 acides aminés. Les protéines restantes ont été utilisées pour effectuer le regroupement des protéines par OrthoFinder avec la méthode tout-à-tout DIAMOND et une valeur E = 10 -5. Un ensemble de données de 39 474 grappes a été généré, et certaines des grappes ont été supprimées en raison d'un faible taux d'annotation de moins de 50 pour cent de toutes les espèces. Ensuite, 5 718 familles de gènes restantes ont été soumises à une analyse d'expansion et de contraction à l'aide de CAFÉ 67 (version 4.2.1), et un modèle stochastique de naissance et de mort a été adopté. L'arbre phylogénétique avec le temps de divergence a été obtenu avec l'analyse MCCMTREE dans PAML.

Identification de gènes sélectionnés positivement

Au total, 9 306 familles de gènes ont été identifiées par OrthoFinder et 4 546 gènes orthologues à copie unique ont été générés pour effectuer une analyse de sélection positive, qui a annoté au moins 60 % des seize génomes. Les séquences de gènes orthologues ont été alignées par le logiciel MAFFT (version 7.455) et un arbre de gènes a été généré à partir de l'arbre d'espèces basé sur les espèces restantes. Le modèle de site de branche dans PAML a été utilisé pour détecter les PSG le long de lignées spécifiques avec le modèle A (modèle = 2 et NSsites = 2). Un test de rapport de vraisemblance (LRT) a été réalisé pour comparer le modèle A (sites sous sélection positive au premier plan fix_omega = 0) avec le modèle nul (les sites pourraient évoluer de manière neutre/sous sélection purificatrice fix_omega = 1 et omega = 1) par le programme codeml au PAML. Les P les valeurs des LRT ont été évaluées via des statistiques du chi carré, un taux de fausses découvertes (FDR) a été calculé et le seuil a été fixé à 0,1. Les sites avec une probabilité a posteriori bayésienne empirique bayésienne (BEB) supérieure à 95 % ont été sélectionnés comme sites sélectionnés positivement dans PAML. Les analyses d'enrichissement KEGG et GO des PSG ont été effectuées par KOBAS 3.0 68 avec des seuils de P valeur < 0,05 dans les tests exacts de Fisher et un FDR corrigé P valeur < 0.1. Drosophila melanogaster les gènes ont été sélectionnés comme ensemble d'arrière-plan. Des diagrammes à bulles de termes KEGG et GO significativement enrichis ont été générés à l'aide du package R ggplot.

Taux d'évolution du métabolisme des graisses

Pour étudier le taux d'évolution du métabolisme des graisses chez les acariens avec différents régimes alimentaires, 122 gènes impliqués dans le métabolisme des lipides de la base de données KEGG (http://www.genome.jp/kegg/catalog/org_list.html) ont été inclus pour analyse. Les branches ont été divisées en cinq groupes avec différents types d'alimentation. Les rapports dN/dS des groupes sélectionnés ont été calculés par le programme codeml avec le modèle de branche à deux rapports (modèle = 2) dans PAML, et les valeurs dN/dS du fond ont été détectées avec le modèle à un rapport (modèle = 0 , NSsites = 0). La distribution de densité des valeurs dN/dS et un graphique en violon des valeurs dN/dS pour différents groupes alimentaires ont été générés. Les rapports dN/dS ont été comparés à ceux des données de fond avec le test t de Student.

Analyse de l'expression génique

Seize échantillons de quatre populations de tétranyques ont été téléchargés à partir de la base de données SRA (BioProject : PRJNA610897) 69 et Trimmomatic (version 0.36) a été appliqué pour effectuer un contrôle qualité, notamment en coupant les séquences d'adaptateurs et en supprimant les lectures de faible qualité, avec les paramètres « LEADING :3 TRAILING:3 COULISSANTE:4:20 MINLEN:45”. Les lectures qualifiées ont été mappées à la référence du tétranyque à l'aide de HISAT2 (version 2.1.0). Les fragments par kilobase de transcription par million de lectures mappées (FPKM) ont été calculés par Cufflinks 70 (version 2.2.1). Ensuite, l'expression des gènes dans les seize échantillons a été triée en fonction des valeurs médianes de FPKM. Les 200 et 50 gènes les plus exprimés ont été sélectionnés et analysés. Une carte thermique a été établie sur la base des 50 gènes les plus exprimés à l'aide de Heatmapper 71 . Les analyses d'enrichissement KEGG et GO ont été effectuées par KOBAS 3.0 avec des seuils d'un P valeur < 0,05 dans les tests exacts de Fisher et un FDR corrigé P valeur < 0.1. Des diagrammes à bulles de termes KEGG et GO significativement enrichis ont été générés à l'aide du package R ggplot.

Analyse de la famille Serpin

La famille des serpines a été annotée manuellement à l'aide des méthodes décrites dans des études antérieures 72 . Les séquences protéiques de la serpine de Ixodes scapularis, Metaseiulus occidentalis, Dermanyssus gallinae, Tropilaelaps mercedesae, Varroa destructor, Varroa jacobsoni, Sarcoptes scabiei, Psoroptes ovis, Leptotrombidium delicense, Dinothrombium tinctorium, Tetranychus urticae, et Stegodyphus mimosarum de la base de données NCBI ont été utilisées comme séquences de requête. Ensuite, les séquences de référence ont été alignées sur les seize génomes en utilisant BLASTP (version 2.2.29+). Les coups de souffle appartenant à la même protéine de requête ont été combinés en un gène prédit de chaque génome. Ensuite, la structure des gènes a été prédite par GeneWise et les domaines de séquences ont été estimés sur la base de la base de données Pfam. Enfin, un total de 2 748 positions dans les gènes de serpines de seize espèces ont été alignées avec ClustalW, puis appliquées pour construire un arbre de probabilité maximale dans MEGA 73 (version 10.0.1) avec 1 000 réplicats bootstrap. L'arbre résultant a été visualisé dans Figtree (version 1.4.3).

Résumé du rapport

De plus amples informations sur la conception de la recherche sont disponibles dans le résumé des rapports de recherche sur la nature lié à cet article.


Voir la vidéo: COURS DE TERMINALE SPÉCIALITÉ SVT:: LÉVOLUTION DES GÉNOMES -Bio Logique- (Août 2022).