Informations

6.9 : Le génome humain - Biologie

6.9 : Le génome humain - Biologie


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Homme de Vitruve

Le dessin de la figure (PageIndex{2}), nommé Homme de Vitruve, a été créé par Léonard de Vinci en 1490. Il était censé montrer les proportions normales du corps humain. Vitruve Homme est utilisé aujourd'hui pour représenter une approche différente du corps humain. Il symbolise un projet de recherche scientifique qui a commencé en 1990, exactement 500 ans après que Vinci a créé le dessin. Ce projet, nommé Human Genome Project, est le plus grand projet de recherche biologique collaborative jamais entrepris.

Qu'est-ce que le génome humain ?

Les génome humain désigne tout l'ADN de l'espèce humaine. L'ADN humain se compose de 3,3 milliards de paires de bases et est divisé en plus de 20 000 gènes sur 23 paires de chromosomes. Le génome humain comprend également des séquences non codantes (par exemple une région intergénique) d'ADN, comme le montre la figure (PageIndex{2}).

À la découverte du génome humain

Les scientifiques connaissent maintenant la séquence de toutes les paires de bases d'ADN dans l'ensemble du génome humain. Cette connaissance a été acquise par le Projet du génome humain (HGP), un projet de recherche scientifique international de 3 milliards de dollars qui a été officiellement lancé en 1990. Le projet a été achevé en 2003, deux ans avant son échéance prévue de 15 ans.

Déterminer la séquence des milliards de paires de bases qui composent l'ADN humain était l'objectif principal du HGP. Un autre objectif était de cartographier l'emplacement et de déterminer la fonction de tous les gènes du génome humain. Il n'y a qu'environ 20 500 gènes chez l'être humain.

Un effort de collaboration

Le financement du HGP provenait du département américain de l'Énergie et des National Institutes of Health ainsi que d'institutions étrangères. La recherche proprement dite a été entreprise par des scientifiques de 20 universités aux États-Unis, au Royaume-Uni, en Australie, en France, en Allemagne, au Japon et en Chine. Une société américaine privée nommée Celera a également contribué à l'effort. Bien que Celera ait espéré breveter certains des gènes qu'elle a découverts, cela a ensuite été refusé.

Génome de référence du projet du génome humain

En 2003, le HGP a publié les résultats de son séquençage d'ADN comme génome humain de référence. La figure (PageIndex{4}) illustre le processus de séquençage de l'ADN. Les détails de cette image sortent du cadre de ce concept et de ce livre. La séquence de l'ADN humain est stockée dans des bases de données accessibles à tous sur Internet. Le National Center for Biotechnology Information (NCBI) des États-Unis, qui fait partie du NIH, ainsi que des organisations comparables en Europe et au Japon, conservent les séquences génomiques dans une base de données connue sous le nom de Genbank. Les séquences protéiques sont également conservées dans cette base de données. Les séquences dans ces bases de données sont les séquences combinées de donneurs anonymes et, en tant que telles, ne traitent pas encore les différences individuelles qui nous rendent uniques. Cependant, la séquence connue jette les bases pour identifier les différences uniques entre nous tous. La plupart des variations actuellement identifiées parmi les individus seront des polymorphismes nucléotidiques simples ou SNP. Un SNP (prononcé "snip") est une variation de séquence d'ADN se produisant au niveau d'un seul nucléotide du génome. Par exemple, deux fragments d'ADN séquencés d'individus différents, GGATCTA à GGATTTA, contiennent une différence dans un seul nucléotide. Si cela, un changement de base se produit dans un gène, le changement de base se traduit alors par deux allèles : l'allèle C et l'allèle T. N'oubliez pas qu'un allèle est une forme alternative d'un gène. Presque tous les SNP courants n'ont que deux allèles. L'effet de ces SNP sur la structure et la fonction des protéines et tout effet sur le phénotype résultant sont un vaste domaine d'étude.

Avantages du projet du génome humain

Le séquençage du génome humain présente des avantages dans de nombreux domaines, notamment la médecine moléculaire et l'évolution humaine.

  • Connaître la séquence de l'ADN humain peut nous aider à comprendre de nombreuses maladies humaines. Par exemple, il aide les chercheurs à identifier des mutations liées à différentes formes de cancer. Il donne également des informations sur les bases génétiques de la mucoviscidose, des maladies du foie, des troubles de la coagulation sanguine et de la maladie d'Alzheimer, entre autres.
  • La séquence d'ADN humain peut également aider les chercheurs à adapter les médicaments aux génotypes individuels. C'est ce qu'on appelle la médecine personnalisée, et cela a conduit à un domaine entièrement nouveau appelé pharmacogénomique. Pharmacogénomique, également appelée pharmacogénétique, est l'étude de la façon dont nos gènes affectent la façon dont nous répondons aux médicaments. Vous pouvez en savoir plus sur la pharmacogénomique dans la fonctionnalité ci-dessous.
  • L'analyse des similitudes entre les séquences d'ADN de différents organismes ouvre de nouvelles voies dans l'étude de l'évolution. Par exemple, les analyses devraient faire la lumière sur de nombreuses questions sur les similitudes et les différences entre les humains et nos plus proches parents, les primates non humains.

Enjeux éthiques, juridiques et sociaux du projet du génome humain

Depuis son lancement en 1990, le HGP a établi et financé de manière proactive un comité distinct pour superviser les problèmes éthiques, juridiques et sociaux potentiels associés au projet. Une préoccupation majeure était l'utilisation possible des connaissances générées par le projet pour discriminer les gens. L'un des problèmes était la crainte que les employeurs et les compagnies d'assurance maladie refusent d'embaucher ou d'assurer des personnes en fonction de leur constitution génétique, par exemple, si elles avaient des gènes qui augmentaient leur risque de contracter certaines maladies. En réponse, en 1996, les États-Unis ont adopté la Health Insurance Portability and Accountability Act (HIPAA). Il protège contre la divulgation non autorisée et non consensuelle d'informations de santé identifiables individuellement à toute entité qui n'est pas activement engagée dans la fourniture de soins de santé à un patient. Cela a été suivi en 2008 par le Genetic Information Nondiscrimination Act (GINA), qui interdit spécifiquement la discrimination génétique par les compagnies d'assurance maladie et les lieux de travail.

Revoir

  1. Décrire le génome humain.
  2. Qu'est-ce que le Projet Génome Humain ?
  3. Identifiez deux objectifs principaux du projet du génome humain.
  4. Quel est le génome de référence du Projet Génome Humain ? Sur quoi est-il basé ?
  5. Expliquez en quoi la connaissance de la séquence des bases d'ADN dans le génome humain est bénéfique pour la médecine moléculaire.
  6. Quelle a été l'une des découvertes surprenantes du projet du génome humain ?
  7. Pourquoi pensez-vous que les scientifiques n'ont pas simplement séquencé l'ADN d'une seule personne pour le projet du génome humain ? Dans ce sens, pourquoi pensez-vous qu'il est important d'inclure des échantillons de différents groupes ethniques et genres dans les efforts de séquençage du génome ?
  8. Vrai ou faux. Le génome humain séquencé n'inclut pas de régions non codantes - il ne comprend que des gènes réels.
  9. Vrai ou faux. Connaître la séquence du génome humain peut donner un aperçu de l'évolution humaine.
  10. Qu'est-ce que la pharmacogénomique ?
    1. Si un patient devait subir une pharmacogénomique pour optimiser sa médication, quelle serait la première étape selon vous ?
    2. Énumérez un avantage et un inconvénient de la pharmacogénomique.
  11. Il y a environ 20 000 humains
    1. paires de bases
    2. nucléotides
    3. allèles
    4. gènes
  12. Expliquez comment le séquençage du génome humain est lié aux préoccupations éthiques concernant la discrimination génétique.

Explore plus

Pendant des années, les scientifiques ont eu le défi de séquencer le génome humain. En savoir plus sur le projet du génome humain ici :


Le projet du génome humain

Le projet du génome humain (HGP) a été l'un des grands exploits d'exploration de l'histoire. Plutôt qu'une exploration vers l'extérieur de la planète ou du cosmos, le HGP était un voyage de découverte vers l'intérieur dirigé par une équipe internationale de chercheurs cherchant à séquencer et à cartographier tous les gènes - connus sous le nom de génome - des membres de notre espèce. , Homo sapiens. Commençant le 1er octobre 1990 et achevé en avril 2003, le HGP nous a donné la possibilité, pour la première fois, de lire le modèle génétique complet de la nature pour construire un être humain.

Le projet du génome humain était l'effort de recherche international visant à déterminer la séquence d'ADN de l'ensemble du génome humain.

En 2003, une séquence précise et complète du génome humain a été achevée deux ans plus tôt que prévu et à un coût inférieur au budget initial estimé.

Moments clés et communiqués de presse de l'histoire du Projet Génome Humain.

Le 15 février 2021 marque le 20e anniversaire des publications rapportant le projet de séquence du génome humain.

Témoignages vidéo de membres éminents de la communauté génomique commémorant et célébrant le 30e anniversaire du lancement du Projet du génome humain.

Explorez les questions fréquemment posées et les réponses sur le projet du génome humain et son impact sur le domaine de la génomique.


Les graphes du génome et l'évolution de l'inférence du génome

Le génome humain de référence fait partie des fondements de la biologie humaine moderne et une réalisation scientifique monumentale. Cependant, parce qu'il exclut une grande partie des variations humaines communes, il introduit un biais de référence omniprésent dans le domaine de la génomique humaine. Pour réduire ce biais, il est judicieux de s'appuyer sur des collections représentatives de génomes humains, regroupées en cohortes de référence. Il existe un certain nombre de techniques pour représenter et organiser les données glanées à partir de ces cohortes, dont beaucoup utilisent des idées implicitement ou explicitement empruntées à des modèles basés sur des graphes. Ici, nous examinons divers projets en cours pour construire et appliquer ces structures basées sur des graphes - que nous appelons collectivement graphes génomiques - et discutons des améliorations en matière de mappage de lecture, d'appel de variantes et de détermination des haplotypes que les graphes génomiques devraient produire.

© 2017 Patène et al. Publié par Cold Spring Harbor Laboratory Press.

Les figures

Représentation schématique de deux niveaux de population…

Représentation schématique de deux structures de référence au niveau de la population. ( UNE ) Une cohorte de référence,…

Quatre types de graphes génomiques,…

Quatre types de graphes génomiques, tous construits à partir de la paire de séquences ATCCCCTA…

Sites ultrabulles dans un biedged…

Sites d'ultrabulles dans un graphe de séquence biedged. Chaque flèche montre le nœud terminal…

Un pangénome commandant sur un…

Un pangénome ordonné sur un graphe construit à partir de deux génomes. Les bords rouges…

Un exemple schématique d'un…

Un exemple schématique d'un "Array Sequence Graph" du type utilisé pour…

Une hiérarchie de graphes génomiques de référence…

Une hiérarchie de graphe du génome de référence (le graphe le plus réduit au Haut , moins…

Haplotypes distincts du projet 1000 génomes…

Haplotypes distincts du projet 1000 génomes intégrés dans un sous-graphe de variation. Les haplotypes sont montrés…

graphe de séquence bidirectionnel ( UNE…

graphe de séquence bidirectionnel ( UNE ) se dépliant en un graphe orienté acyclique…


Mutation

Les humains et les chimpanzés sont issus d'un ancêtre commun, et les scientifiques pensent qu'ils ont divergé il y a environ six millions d'années.

Compte tenu de ce temps relativement court depuis la scission, il est probable que quelques mutations importantes soient responsables des différences entre les deux espèces, selon Wen-Hsiung Li, un évolutionniste moléculaire à l'Université de Chicago dans l'Illinois.

"Si vous regardez deux espèces de grenouilles sur 10 millions d'années, vous ne verrez probablement pas beaucoup de différences morphologiques ou comportementales que vous voyez entre les humains et les chimpanzés", a déclaré Li, qui a écrit un commentaire d'accompagnement sur le séquençage du génome des chimpanzés. pour La nature.

Il existe plusieurs hypothèses qui expliquent l'évolution des traits humains. Li pense que ces traits proviennent de changements dans les parties du génome qui régulent l'activité d'autres gènes.

Les scientifiques s'accordent à dire que de nombreuses questions restent sans réponse, mais le génome du chimpanzé fournit des indices importants pour comprendre ce qui fait de nous un être humain.

"Nous sommes dans une très bonne étape intermédiaire pour comprendre les différences entre les humains et les chimpanzés", a déclaré Eichler. "Nous ne pouvons pas dire, c'est la différence qui fait de nous des humains, mais nous pouvons dire, ce sont les régions du génome qui montrent beaucoup de potentiel et sont d'excellents candidats pour poursuivre les travaux."


Remerciements

Nous remercions l'équipe du laboratoire de l'Institut Max Planck pour la science de l'histoire humaine à Iéna, M. Rivollat ​​et K. Nägele pour la préparation de la bibliothèque génétique V. Kuželka, J. Dašková et T. Přikryl pour la préparation des informations de fond anthropologiques et géologiques et M. O'Reilly pour le soutien à la conception graphique. Ce travail a été financé par la Max Planck Society. E. et T.D. sont soutenus par la subvention ERC 324139 (PalaeoChron) et le Natural Environment Research Council. P.V. est soutenu par le ministère de la Culture de la République tchèque (DKRVO 2019-2023/7.I.c, 00023272).


Les références

Morton, N. E. Paramètres du génome humain. Proc. Natl Acad. Sci. Etats-Unis 88, 7474–7476 (1991).

Le consortium de cartographie et de séquençage du chromosome 21. La séquence d'ADN du chromosome humain 21. La nature 405, 311–319 (2000).

Dunham, I. et al. La séquence d'ADN du chromosome humain 22. La nature 402, 489–495 (1999).

Tilford, C.A. et al. Une carte physique du chromosome Y humain. La nature 409, 943–945 (2001).

Montgomery, K. T. Une carte haute résolution du chromosome humain 12. La nature 409, 945–946 (2001).

Bruls, T. et al. Une carte physique du chromosome humain 14. La nature 409, 947–948 (2001).

Le Consortium international de cartographie du génome humain. Une carte physique du génome humain. La nature 409, 934–941 (2001).

Consortium international de séquençage du génome humain. Séquençage initial et analyse du génome humain. La nature 409, 860–921 (2001).

Deloukas, P. et al. Une carte physique de 30 000 gènes humains. Science 282, 744–746 (1998).

Riethman, H.C. et al. Intégration des séquences des télomères avec le projet de séquence du génome humain. La nature 409, 948–951 (2001).

Jackson, M. S., See, C. G., Mulligan, L. M. & Lauffart, B. F. Une carte de 9,75 Mo à travers le centromère du chromosome 10 humain. Génomique 33, 258–270 (1996).


Un nouveau décompte des gènes humains relance le débat

L'une des premières tentatives pour estimer le nombre de gènes dans le génome humain impliquait des généticiens éméchés, un bar à Cold Spring Harbor, New York, et de pures conjectures.

C'était en 2000, alors qu'un projet de séquence du génome humain était encore en préparation, les généticiens organisaient un tirage au sort sur le nombre de gènes humains, et les paris allaient de dizaines de milliers à des centaines de milliers. Près de deux décennies plus tard, les scientifiques armés de données réelles ne parviennent toujours pas à se mettre d'accord sur le nombre – une lacune dans les connaissances qui, selon eux, entrave les efforts pour repérer les mutations liées à la maladie.

La dernière tentative pour combler cette lacune utilise les données de centaines d'échantillons de tissus humains et a été publiée sur le serveur de préimpression BioRxiv le 29 mai 1 . Il comprend près de 5 000 gènes qui n'avaient jamais été repérés auparavant, dont près de 1 200 qui contiennent des instructions pour fabriquer des protéines. Et le décompte global de plus de 21 000 gènes codant pour des protéines est un bond substantiel par rapport aux estimations précédentes, qui évaluaient le chiffre à environ 20 000.

Mais de nombreux généticiens ne sont pas encore convaincus que tous les gènes nouvellement proposés résisteront à un examen minutieux. Leurs critiques soulignent à quel point il est difficile d'identifier de nouveaux gènes, voire de définir ce qu'est un gène.

"Les gens y travaillent dur depuis 20 ans, et nous n'avons toujours pas la réponse", déclare Steven Salzberg, biologiste informatique à l'Université Johns Hopkins de Baltimore, Maryland, dont l'équipe a produit le dernier décompte.

En 2000, alors que la communauté génomique était en effervescence sur la question de savoir combien de gènes humains seraient trouvés, Ewan Birney a lancé le concours GeneSweep. Birney, maintenant co-directeur de l'Institut européen de bioinformatique (EBI) à Hinxton, au Royaume-Uni, a pris les premiers paris dans un bar lors d'une réunion annuelle de génétique, et le concours a finalement attiré plus de 1 000 inscriptions et un jackpot de 3 000 $ US. Les paris sur le nombre de gènes allaient de plus de 312 000 à un peu moins de 26 000, avec une moyenne d'environ 40 000. Ces jours-ci, la durée des estimations s'est réduite – la plupart se situant maintenant entre 19 000 et 22 000 – mais il y a toujours des désaccords (voir « Gene Tally »).

Source : M. Pertea & S. L. Salzberg

Le nombre de gènes peut varier en fonction des données analysées, des outils utilisés et des critères d'élimination des faux positifs. Le dernier décompte a utilisé un ensemble de données plus important et différentes méthodes de calcul des efforts précédents, ainsi que des critères plus larges pour définir un gène.

L'équipe de Salzberg a utilisé les données du projet Genotype-Tissue Expression (GTEx), qui a séquencé l'ARN de plus de 30 tissus différents prélevés sur plusieurs centaines de cadavres. L'ARN est l'intermédiaire entre l'ADN et les protéines. Les chercheurs voulaient identifier les gènes qui codent pour une protéine et ceux qui ne le font pas, mais qui jouent tout de même un rôle important dans les cellules. Ils ont donc assemblé les 900 milliards de minuscules extraits d'ARN de GTEx et les ont alignés avec le génome humain.

Ce n'est pas parce qu'un segment d'ADN est exprimé sous forme d'ARN qu'il s'agit nécessairement d'un gène. L'équipe a donc tenté de filtrer le bruit en utilisant une variété de critères. Par exemple, ils ont comparé leurs résultats avec les génomes d'autres espèces, estimant que les séquences partagées par des créatures éloignées les uns des autres ont probablement été préservées par l'évolution car elles servent un objectif utile et sont donc susceptibles d'être des gènes.

L'équipe s'est retrouvée avec 21 306 gènes codant pour des protéines et 21 856 gènes non codants – bien plus que ceux inclus dans les deux bases de données de gènes humains les plus utilisées. L'ensemble de gènes GENCODE, maintenu par l'EBI, comprend 19 901 gènes codant pour des protéines et 15 779 gènes non codants. RefSeq, une base de données gérée par le National Center for Biotechnology Information (NCBI) des États-Unis, répertorie 20 203 gènes codant pour des protéines et 17 871 gènes non codants.

Kim Pruitt, chercheur en génome au NCBI de Bethesda, Maryland, et ancien directeur de RefSeq, affirme que la différence est probablement due en partie au volume de données analysées par l'équipe de Salzberg. Et il y a une autre différence majeure. GENCODE et RefSeq reposent tous deux sur une curation manuelle - une personne examine les preuves pour chaque gène et prend une décision finale. Le groupe de Salzberg s'est appuyé uniquement sur des programmes informatiques pour tamiser les données.

« Si les gens aiment notre liste de gènes, alors peut-être que dans quelques années, nous serons l'arbitre des gènes humains », déclare Salzberg.

Mais de nombreux scientifiques disent qu'ils ont besoin de plus de preuves pour être convaincus que la liste est exacte. Adam Frankish, un biologiste informatique à l'EBI qui coordonne l'annotation manuelle de GENCODE, dit que lui et son groupe ont scanné environ 100 des gènes codant pour les protéines identifiés par l'équipe de Salzberg. D'après leur évaluation, un seul d'entre eux semble être un véritable gène codant pour une protéine.

Et l'équipe de Pruitt a examiné une douzaine de nouveaux gènes codant pour les protéines du groupe Salzberg, mais n'en a trouvé aucun qui répondrait aux critères de RefSeq. Certains chevauchent des régions du génome qui semblent appartenir à des rétrovirus qui ont envahi les génomes de nos ancêtres, d'autres appartiennent à d'autres tronçons répétitifs, qui sont rarement traduits en protéines.

Mais Salzberg dit que certaines séquences répétitives peuvent être considérées comme des gènes. Un exemple est VRE3-1, qui apparaît dans RefSeq et code pour une protéine surexprimée dans le cancer colorectal. Salzberg reconnaît également que les nouveaux gènes sur la liste de son équipe devront être validés par son équipe et d'autres.

Une autre confusion des efforts de comptage est la définition imprécise et changeante d'un gène. Les biologistes considéraient les gènes comme des séquences codant pour des protéines, mais il est alors devenu évident que certaines molécules d'ARN non codantes jouent un rôle important dans les cellules. Juger ce qui est important – et devrait être considéré comme des gènes – est controversé et pourrait expliquer certaines des divergences entre le décompte de Salzberg et les autres.

Pourtant, il est probable qu'au moins certains des gènes identifiés par le groupe de Salzberg se révéleront valides, déclare Emmanouil Dermitzakis, généticien à l'Université de Genève en Suisse, qui copréside le projet GTEx. Il n'est pas surpris que le nombre de gènes codant pour les protéines de l'équipe soit une augmentation de 5% par rapport aux décomptes précédents, étant donné la taille gargantuesque de l'ensemble de données GTEx.

Avoir un décompte précis de tous les gènes humains est important pour les efforts visant à découvrir les liens entre les gènes et la maladie. Les gènes non comptés sont souvent ignorés, même s'ils contiennent une mutation causant la maladie, dit Salzberg. Mais ajouter à la hâte des gènes à la liste principale peut également présenter des risques, explique Frankish. Un gène qui s'avère incorrect peut détourner l'attention des généticiens du vrai problème.

Pourtant, les incohérences dans le nombre de gènes d'une base de données à l'autre sont problématiques pour les chercheurs, explique Pruitt. "Les gens veulent une réponse", ajoute-t-elle, "mais la biologie est complexe."


Dix ans d'analyse du génome ancien ont appris aux scientifiques "ce que cela signifie d'être humain"

Le regretté Jim Boyd des Tribus confédérées de Colville s'exprimant lors de la conférence de presse en 2015 annonçant les résultats de l'analyse ADN de Kennewick Man, l'Ancien. Crédit : Linus Mørk/Magus Film

Une pelote de cheveux vieille de 4 000 ans figée dans le temps et emmêlée autour d'un peigne en os de baleine a conduit à la toute première reconstruction d'un ancien génome humain il y a un peu plus de dix ans.

Les cheveux, qui ont été conservés dans le pergélisol arctique au Groenland, ont été collectés dans les années 1980 et stockés dans un musée au Danemark. Ce n'est qu'en 2010 que le biologiste évolutionniste, le professeur Eske Willerslev, a pu utiliser le séquençage de l'ADN au fusil de chasse pour reconstruire l'histoire génétique des cheveux.

Il a découvert que cela venait d'un homme des premiers peuples connus à s'installer au Groenland, connu sous le nom de culture Saqqaq. C'était la première fois que des scientifiques récupéraient un ancien génome humain entier.

Maintenant une revue de la première décennie de la génomique ancienne des Amériques publiée dans La nature écrit aujourd'hui par le professeur Willerslev, membre du St John's College de l'Université de Cambridge et directeur du Lundbeck Foundation GeoGenetics Centre, Université de Copenhague, avec l'un de ses collaborateurs de longue date, le professeur David Meltzer, archéologue basé à la Southern Methodist University, Texas, montre comment la première analyse au monde d'un génome ancien a déclenché une incroyable « décennie de découvertes ».

Le professeur Willerslev a déclaré : « Les dix dernières années ont été pleines de surprises dans la compréhension du peuplement des Amériques. l'esprit est à quel point les premiers humains dont nous avons séquencé l'ADN étaient résistants et capables - ils occupaient des environnements extrêmement différents et les peuplaient souvent en peu de temps.

"On nous a appris à l'école que les gens resteraient sur place jusqu'à ce que la population atteigne un niveau où les ressources soient épuisées. Mais nous avons constaté que les gens se répandaient dans le monde juste pour explorer, découvrir, vivre des aventures.

"Les 10 dernières années nous ont beaucoup appris sur notre histoire et ce que cela signifie d'être humain. Nous ne reverrons plus jamais cette profondeur d'expérience humaine sur cette planète - les gens sont entrés dans de nouvelles zones sans aucune idée de ce qui se passait devant nous. d'entre eux. Cela nous en dit long sur l'adaptabilité humaine et sur la façon dont les humains se comportent.

Pendant des décennies, les scientifiques se sont appuyés sur les découvertes archéologiques pour reconstruire le passé et les théories n'étaient pas toujours exactes. On pensait auparavant qu'il y avait des premiers non-amérindiens dans les Amériques, mais l'analyse de l'ADN ancien a montré jusqu'à présent que tous les vestiges antiques trouvés sont plus étroitement liés aux Amérindiens contemporains qu'à toute autre population ailleurs dans le monde. monde.

Une pelote de cheveux vieille de 4 000 ans figée dans le temps et emmêlée autour d'un peigne en os de baleine a conduit à la toute première reconstruction d'un ancien génome humain il y a un peu plus de dix ans. Les cheveux, qui ont été conservés dans le pergélisol arctique au Groenland, ont été collectés dans les années 1980 et stockés dans un musée au Danemark. Ce n'est qu'en 2010 que le biologiste évolutionniste, le professeur Eske Willerslev, a pu utiliser le séquençage de l'ADN au fusil de chasse pour reconstruire l'histoire génétique des cheveux. Il a découvert que cela venait d'un homme des premiers peuples connus à s'installer au Groenland, connu sous le nom de culture Saqqaq. C'était la première fois que des scientifiques récupéraient un ancien génome humain entier. Maintenant une revue de la première décennie de la génomique ancienne des Amériques publiée dans La nature aujourd'hui (16 juin 2021) écrit par le professeur Willerslev, membre du St John's College, Université de Cambridge, et directeur du Lundbeck Foundation GeoGenetics Centre, Université de Copenhague, avec l'un de ses collaborateurs de longue date, le professeur David Meltzer, archéologue basé à Southern L'Université méthodiste du Texas montre comment la première analyse au monde d'un génome ancien a déclenché une incroyable « décennie de découvertes ». Crédit : St John's College, Université de Cambridge

Le professeur Meltzer, qui a travaillé sur l'examen avec le professeur Willerslev alors que le premier était au St John's College en tant que chercheur invité à Beaufort, a ajouté: "Les preuves génomiques ont montré des liens dont nous ignorions l'existence entre différentes cultures et populations et l'absence de liens qui L'histoire de la population humaine a été beaucoup plus complexe qu'on ne le pensait auparavant.

« Beaucoup de ce qui a été découvert sur le peuplement des Amériques n'aurait pas pu être prédit. Nous avons vu à quelle vitesse les gens se déplaçaient dans le monde lorsqu'ils ont un continent à eux seuls, il n'y avait rien pour les retenir. avantage sélectif pour voir ce qu'il y avait au-dessus de la prochaine colline."

En 2013, des scientifiques ont cartographié le génome d'un garçon de quatre ans décédé dans le centre-sud de la Sibérie il y a 24 000 ans. La sépulture d'un enfant sibérien du Paléolithique supérieur a été découverte dans les années 1920 par des archéologues russes près du village de Mal'ta, le long de la rivière Belaya. Le séquençage du génome de Mal'ta était essentiel car il montrait l'existence d'une population auparavant non échantillonnée qui contribuait à l'ascendance des populations sibériennes et amérindiennes.

Deux ans plus tard, le professeur Willerslev et son équipe ont publié le premier génome amérindien ancien, séquencé à partir des restes d'un petit garçon enterré cérémonieusement il y a plus de 12 000 ans à Anzick, dans le Montana.

En 2015, leur ancienne analyse génomique a permis de résoudre le mystère de l'homme de Kennewick, l'un des squelettes les plus anciens et les plus complets jamais trouvés dans les Amériques, et l'un des plus controversés.

Les restes vieux de 9 000 ans avaient été entourés d'une tempête de controverse lorsque la juridiction légale sur le squelette est devenue l'objet d'une décennie de poursuites entre cinq tribus amérindiennes, qui revendiquaient la propriété de l'homme qu'elles appelaient Ancient One, et les États-Unis. Corps des ingénieurs de l'armée.

Le professeur Willerslev, qui a appris à juste titre à tenir compte des sensibilités culturelles lors de la recherche d'ADN ancien, a passé une grande partie de la dernière décennie à parler aux membres de la communauté tribale pour expliquer son travail en détail et solliciter leur soutien.

Cela signifiait qu'il était en mesure de convenir avec les membres de la tribu Colville, basée dans l'État de Washington où les restes ont été trouvés, qu'ils donneraient une partie de leur ADN pour permettre au professeur Willerslev et à son équipe d'établir s'il y avait un lien génétique entre eux et L'homme de Kennewick.

Le professeur Eske Willerslev avec Donna et Joey, deux membres de la tribu Fallon Paiute-Shoshone, discutant de l'individu Spirit Cave. Crédit : Linus Mørk/Magus Film.

Jackie Cook, descendante de la tribu Colville et spécialiste du rapatriement des tribus confédérées de la réserve de Colville, a déclaré : « Nous avons passé près de 20 ans à essayer de nous faire rapatrier l'Ancien. Il y a eu une longue histoire de méfiance entre scientifiques et nos tribus amérindiennes, mais quand Eske nous a présenté son travail sur l'ADN de l'enfant Anzick, les poils de mes bras se sont dressés.

« Nous savions que nous ne devrions pas avoir à accepter les tests ADN, et il y avait des inquiétudes que nous devions le faire à chaque fois pour prouver l'affiliation culturelle, mais nos membres du Conseil en ont discuté avec les anciens et il a été convenu que tout membre tribal qui voulait fournir de l'ADN pour l'étude.

Le génome de l'homme Kennewick, comme le bébé Anzick, a révélé que l'homme était un ancêtre direct des Amérindiens vivants. L'Ancien a été dûment rendu aux tribus et réenterré.

Cook a ajouté: "Nous avons pris un risque mais cela a fonctionné. C'était remarquable de travailler avec Eske et nous nous sommes sentis honorés, soulagés et humiliés de pouvoir résoudre une affaire aussi importante. Nous avons eu des histoires orales qui ont traversé les générations pour des milliers d'années que nous appelons des histoires de coyotes - des histoires d'enseignement. Ces histoires nous ont été racontées par nos ancêtres sur la vie aux côtés de mammouths laineux et le témoignage d'une série d'inondations et d'éruptions volcaniques. En tant que tribu, nous avons toujours embrassé la science, mais toute l'histoire n'est pas découverte par la science ."

Les travaux menés par le professeur Willerslev ont également permis d'identifier les origines de la plus ancienne momie naturelle du monde appelée Spirit Cave. Les scientifiques ont découvert l'ancien squelette humain en 1940, mais ce n'est qu'en 2018 qu'une découverte frappante a été faite qui a dévoilé les secrets de la tribu de l'ère glaciaire dans les Amériques.

La révélation est venue dans le cadre d'une étude qui a analysé génétiquement l'ADN d'une série de vestiges antiques célèbres et controversés à travers l'Amérique du Nord et du Sud, y compris Spirit Cave, les squelettes de Lovelock, les restes de Lagoa Santa, une momie Inca et les restes les plus anciens au Chili. Patagonie.

Les scientifiques ont séquencé 15 génomes anciens allant de l'Alaska à la Patagonie et ont pu suivre les mouvements des premiers humains alors qu'ils se propageaient à travers les Amériques à une vitesse « étonnante » pendant la période glaciaire et comment ils interagissaient les uns avec les autres au cours des millénaires suivants.

L'équipe d'universitaires a non seulement découvert que les restes de Spirit Cave étaient un Amérindien, mais ils ont pu rejeter une théorie de longue date selon laquelle un groupe appelé Paléoaméricains existait en Amérique du Nord avant les Amérindiens. Spirit Cave a été rendu à la tribu Fallon Paiute-Shoshone, un groupe d'Amérindiens basé au Nevada, pour y être enterré.

Le professeur Willerslev a ajouté: "Au cours de la dernière décennie, l'histoire de l'humanité a été fondamentalement modifiée grâce à l'analyse génomique ancienne - et les découvertes incroyables ne font que commencer."


Aperçu

Les données de comptabilité analytique présentées ici sont résumées par rapport à deux mesures : (1) « Coût par mégabase de séquence d'ADN » - le coût de détermination d'une mégabase (Mb par million de bases) de séquence d'ADN d'une qualité spécifiée [voir ci-dessous] ( 2) "Coût par génome" - le coût du séquençage d'un génome à taille humaine. Pour chacun, un graphique est fourni montrant les données depuis 2001 de plus, les chiffres réels reflétés par les graphiques sont fournis dans un tableau récapitulatif.

NHGRI invite les gens à télécharger ces graphiques et à les utiliser dans leurs présentations et matériels pédagogiques. Le NHGRI prévoit de mettre à jour ces données régulièrement. Vous pouvez afficher les données dans Excel en téléchargeant les coûts de séquençage 2020.

Pour illustrer la nature des réductions des coûts de séquençage de l'ADN, chaque graphique montre également des données hypothétiques reflétant la loi de Moore, qui décrit une tendance à long terme dans l'industrie du matériel informatique qui implique le doublement de la « puissance de calcul » tous les deux ans (voir : Moore's droit [wikipedia.org]). Les améliorations technologiques qui « suivent » la loi de Moore sont largement considérées comme extrêmement performantes, ce qui les rend utiles pour la comparaison.

Dans les deux graphiques, notez : (1) l'utilisation d'une échelle logarithmique sur l'axe Y et (2) le dépassement soudain et profond de la loi de Moore à partir de janvier 2008. Ce dernier représente le moment où les centres de séquençage sont passés de Sanger- (séquençage de terminaison de chaîne didésoxy) aux technologies de séquençage de l'ADN de « deuxième génération » (ou « prochaine génération »). Des détails supplémentaires sur ces graphiques sont fournis ci-dessous.

Ces données, cependant, ne capturent pas tous les coûts associés au programme de séquençage du génome à grande échelle du NHGRI. The sequencing centers perform a number of additional activities whose costs are not appropriate to include when calculating costs for production-oriented DNA sequencing. In other words, NHGRI makes a distinction between 'production' activities and 'non-production' activities. Production activities are essential to the routine generation of large amounts of quality DNA sequence data that are made available in public databases the costs associated with production DNA sequencing are summarized here and depicted on the two graphs. Additional information about the other activities performed by the sequencing centers is provided below.

The cost-accounting data presented here are summarized relative to two metrics: (1) "Cost per Megabase of DNA Sequence" - the cost of determining one megabase (Mb a million bases) of DNA sequence of a specified quality [see below] (2) "Cost per Genome" - the cost of sequencing a human-sized genome. For each, a graph is provided showing the data since 2001 in addition, the actual numbers reflected by the graphs are provided in a summary table.

NHGRI welcomes people to download these graphs and use them in their presentations and teaching materials. NHGRI plans to update these data on a regular basis. You can view the data in in Excel by downloading the Sequencing Costs 2020.

To illustrate the nature of the reductions in DNA sequencing costs, each graph also shows hypothetical data reflecting Moore's Law, which describes a long-term trend in the computer hardware industry that involves the doubling of 'compute power' every two years (See: Moore's Law [wikipedia.org]). Technology improvements that 'keep up' with Moore's Law are widely regarded to be doing exceedingly well, making it useful for comparison.

In both graphs, note: (1) the use a logarithmic scale on the Y axis and (2) the sudden and profound out-pacing of Moore's Law beginning in January 2008. The latter represents the time when the sequencing centers transitioned from Sanger-based (dideoxy chain termination sequencing) to 'second generation' (or 'next-generation') DNA sequencing technologies. Additional details about these graphs are provided below.

These data, however, do not capture all of the costs associated with the NHGRI Large-Scale Genome Sequencing Program. The sequencing centers perform a number of additional activities whose costs are not appropriate to include when calculating costs for production-oriented DNA sequencing. In other words, NHGRI makes a distinction between 'production' activities and 'non-production' activities. Production activities are essential to the routine generation of large amounts of quality DNA sequence data that are made available in public databases the costs associated with production DNA sequencing are summarized here and depicted on the two graphs. Additional information about the other activities performed by the sequencing centers is provided below.


DISCUSSION

Previous reports (5-12) have counted the number of genes exhibiting the overlapping phenomenon, but no reports have enumerated the number of loci or exons that exhibit this overlap. Furthermore, previous reports (5-12) have only described this overlap phenomenon for opposite strands. The present strategy offers a valuable method for estimating the number of overlapping genes, as the total number of genes in the human genome is yet uncertain. Because the total number of genes in the human genome was estimated 32,000 in 2001 (1, 2), and subsequently estimated in 2004 to 22,000.

The total number of exons in the human genome has been estimated at approximately 320,000 (8.8/gene) (1, 2), whereas the present data indicate the existence of more than twice that number. This discrepancy is due to different methods of enumerating exons. We simply counted all of the exons in the human genome, without considering how many exons comprise a gene. This method can identify all exons (e.g., more than 2 exons identified in the same region) and avoids confusion due to splicing variants.

Overlapping genes may evolve as a result of extensions of open reading frames (ORF) caused by switching to an upstream start codon, substitutions in start or stop codons, or deletions and frame shifts that eliminate initiation or stop codons (13). The necessity for maintaining 2 functional overlapping genes inevitably constrains the extent to which both genes can become optimally adapted. However, such constraints can be alleviated by duplication of the overlapping gene pair, allowing for independent evolution of each gene in the resulting copies. This means that overlapping genes can thus only survive long evolutionary periods when the overlap confers a selective advantage upon the organism. In viruses, overlapping genes are thought to persist due to the considerable constraints on genome size (7). In non-viral organisms, the potential advantages of overlapping genes are less clear, although co-regulation may be involved (4). Results of a comparative study of overlapping genes in the genomes of two closely related bacteria revealed that many overlapping genes arise due to incidental elongation of the coding region (16). Overlapping genes have generally been thought to be relatively rare in the human genome, but the results of the present study show that they are more abundant than was previously thought. Interestingly, overlapping genes do not appear to be the result of evolutionary pressure to minimize the size of the human genome.

Yelin et al. (17) demonstrated by in vitro experiments that antisense transcription occurs widely in the human genome. The resulting data set of 2,667 sense-antisense pairs was evaluated by microarrays containing strand-specific oligonucleotide probes derived from the region of overlap. Verification of specific cases by Northern blot analysis with strand-specific riboprobes confirmed the occurrence of transcription from both DNA strands. While these authors also predicted the existence of approximately 1,600 sense-antisense transcriptional units, transcribed from both DNA strands (13), no overlapping patterns were elucidated.

Adachi-N et al. (18) reported that some genes overlap in a head-to-head manner (transcribed in opposite directions), while Koyanagi-KO et al. (19) recently reported the occurrence of bidirectional gene pairs in some species. However, they did not describe the patterns of the overlapping exons. In our study, this type of overlap was included in the overlapping loci identified. It has also been reported that divergence (bidirectionality) is frequently observed, particularly in genes involved in DNA repair or replication.(18). The functional significance of this is unclear, but divergence may permit two genes to share one CpG island for purposes of coordinated expression. In some bidirectional loci, expression of two divergent genes has been found to be coregulated, and promoters exhibiting bidirectional activity have often been observed (20, 21). To the best of our knowledge, the phenomenon of overlapping exons is not specific in DNA repair or replication, and further studies are needed to clarify the functional significance of overlapping genes.

Clarification of overlapping genes will facilitate the description of roles for each strand of the human genome and will provide insight into the mechanisms of evolution.

These results show that all overlapping types are distributed throughout the human genome, but that distributions differ for each chromosome.



Commentaires:

  1. Eustace

    Vous pouvez rechercher un lien vers un site avec des informations sur un sujet d'intérêt pour vous.



Écrire un message