Informations

Pourquoi la traduction a-t-elle développé un codon spécifique pour l'initiation ?

Pourquoi la traduction a-t-elle développé un codon spécifique pour l'initiation ?


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

La traduction de l'ARNm est initiée par un ARNt acceptant la méthionine spécifique à un codon d'initiation spécifique, généralement AUG (complémentaire de l'anticodon de l'ARNt). Cependant, la traduction dans des conditions appropriées (quoique non physiologiques) in vitro ne nécessite pas de codon d'initiation spécifique ou d'acide aminé spécifique, il n'est donc pas difficile d'envisager une étape plus précoce dans l'évolution de l'appareil de traduction dans laquelle ce système d'initiation spécifique était absent. Au lieu de cela, il pourrait y avoir eu une initiation aléatoire ou une initiation à partir de l'extrémité 5' de l'ARNm.

Un codon d'initiation spécifique impose des contraintes sur la séquence de l'ARNm et ajoute un acide aminé inutile à la N-terminus - celui qui est parfois indésirable et doit être supprimé.

Quels avantages peut-on envisager pour l'initiation à un site interne spécifique, plutôt qu'à, disons, l'extrémité 5' de l'ARNm ?

Je comprends qu'il est impossible de prouver quel facteur était réellement responsable au cours de l'évolution, mais en sollicitant des explications concrètes, j'espère que cette question est aussi valable que l'original dont elle est dérivée (voir Note de bas de page).

NOTE DE BAS DE PAGE

Cette question a été développée à partir d'une partie d'une question en trois parties publiée il y a quelque temps sur « Pourquoi AUG est-il le codon d'initiation ? ». Cela a récemment refait surface, et comme personne n'avait répondu à cette partie en particulier, et comme c'est la politique du site de poser une question à la fois, j'ai décidé de la retirer de l'original et de la republier ici afin qu'elle puisse être considérée sur ses propres mérites, sans la distraction d'autres questions telles que le choix du codon ou de la méthionine par rapport à d'autres acides aminés. Je vais apporter une réponse avec quelques réflexions personnelles, mais, bien sûr, tout le monde peut participer.


Il n'est pas clair pour moi où l'initiation a eu lieu dans la traduction de polynucléotides artificiels tels que (UC)m que Khorana a utilisé dans des expériences qui, à la suite des travaux de Nirenberg et Matthaii, ont aidé à déchiffrer le code génétique. Cela peut très bien s'être produit à des positions aléatoires plutôt qu'à l'extrémité 5'. Un tel mode de traduction aurait évidemment été un gaspillage s'il s'était produit au début de l'évolution, car un mélange de produits se formerait, dont beaucoup seraient inactifs et pourraient même entrer en compétition avec les espèces actives. Si telle était la situation d'origine, il est facile de voir en quoi un changement d'initiation à un moment précis serait avantageux.

Mais pourquoi ne pas commencer au bout de 5' ? Les complexes d'initiation eucaryotes contemporains reconnaissent l'extrémité 5' de l'ARNm, même s'ils analysent ensuite davantage pour trouver un codon d'initiation spécifique qui répondra à l'ARNt initiateur. Comme il n'y a pas de séparation physique des gènes sur un chromosome, il est évident pourquoi transcription doit commencer à un point spécifique dans l'ADN, mais cela n'est pas nécessairement vrai pour la traduction des transcrits d'ARNm individuels.

Je vois deux manières d'aborder cette question.

La première est du point de vue du contemporain "Le monde de l'ADN". Les arguments que l'on peut faire incluent :

  • Dans un sens général, l'initiation de l'extrémité 5' peut être considérée comme restrictive en ce qu'elle ne permettrait pas à l'extrémité 5' de l'ARNm de fournir d'autres fonctions telles que la formation d'une structure secondaire pour réguler la facilité de traduction.
  • L'initiation de l'extrémité 5' empêcherait les ARNm polycistroniques que nous voyons dans les bactéries contemporaines.
  • Dans l'initiation de l'extrémité 5', il aurait pu être difficile de distinguer les extrémités des ARNm des autres ARN avant que la modification des bases que nous voyons dans les ARNm eucaryotes contemporains ne se soit développée.
  • De même, comme suggéré par @John dans un commentaire sur la question, l'initiation de l'extrémité 5' pourrait avoir provoqué la traduction de fragments d'ARN au fur et à mesure qu'ils se dégradaient.
  • La sélection d'un codon spécifique était secondaire au besoin d'un seul ARNt initiateur, qui a été discuté en relation avec une autre question SE, bien que les arguments ici concernent des étapes plus récentes de l'évolution.

Cependant, il existe une autre approche qui considère la situation dans un 'Monde de l'ARN'.

La différence ici est que - comme certains virus à ARN et bactériophages contemporains - le génome pourrait également avoir été l'ARNm mais sans système pour produire de nombreuses copies du brin "plus" pour la traduction. La traduction peut avoir été sur l'ARN génomique.

  • Pour traduire plusieurs protéines il aurait été avantageux d'avoir plusieurs sites d'initiation sur ce qui aurait été un messager polycistronique (plutôt synthétiser une polyprotéine comme le poliovirus).
  • L'extrémité 5' de l'ARN n'a peut-être en aucun cas été disponible pour coder une protéine car elle pourrait avoir une autre fonction (par exemple réplicative), et il est également possible qu'une partie de ce qui dans les systèmes contemporains soit une partie distincte de la l'appareil de traduction a été physiquement incorporé dans le génome.

La synthèse des protéines commence par la formation d'un complexe d'initiation. Dans E. coli, ce complexe implique le petit 30S ribosome, les modèle d'ARNm, facteurs d'initiation et un spécial ARNt initiateur. L'ARNt initiateur interagit avec le début codon AUG. Le guanosine triphosphate (GTP), qui est un nucléotide triphosphate purique, agit comme une source d'énergie pendant la traduction, à la fois au début de l'élongation et pendant la translocation du ribosome.

Une fois l'AUG approprié identifié, la sous-unité 50S se lie au complexe Met-ARNt, ARNm et sous-unité 30S. Cette étape termine le lancement de la traduction.


Une petite molécule fait dérailler l'initiation de la traduction

Le facteur d'initiation eucaryote (eIF) 4A joue un rôle essentiel dans l'initiation de la traduction sur la plupart des ARNm eucaryotes en déroulant leur structure secondaire pour permettre la fixation et le balayage ribosomiques. Le produit naturel hippuristanol a inhibé sélectivement les modes d'initiation de la traduction dépendant de eIF4A et eIF4A.

Les mécanismes d'initiation de la traduction eucaryote ont reçu une attention croissante en raison de leur importance centrale dans divers processus biologiques, de la croissance et de la différenciation cellulaires à l'infection virale. L'initiation de la traduction implique la liaison des ribosomes aux ARNm par des mécanismes distincts spécifiques à l'ARNm qui diffèrent par leurs exigences en facteurs d'initiation, en particulier eIF4A (l'hélicase à ARN à boîte DEAD prototypique). Récemment, Pelletier et ses collègues ont identifié de nouveaux inhibiteurs de traduction eucaryotes 1 . A la page 213 de ce numéro 2 , ils rapportent l'identification de l'hippuristanol, un stéroïde polyoxygéné du corail Isis hippuris. L'hippuristanol fait partie des premiers inhibiteurs spécifiques d'un facteur d'initiation identifié. Il bloque l'initiation d'une manière spécifique à l'ARNm, agissant plus puissamment contre les ARNm avec les exigences les plus élevées pour eIF4A, qui incluent certains ARNm viraux. L'identification de l'hippuristanol démontre le potentiel des petites molécules inhibitrices de l'initiation en tant que médicaments antiviraux.


Les machines de synthèse de protéines

En plus de la matrice d'ARNm, de nombreuses molécules et macromolécules contribuent au processus de traduction. La traduction nécessite l'entrée d'un modèle d'ARNm, ribosomes, ARNt, et divers facteurs enzymatiques.

Ribosomes

Un ribosome est une macromolécule complexe composée d'ARNr structurels et catalytiques et de nombreux polypeptides distincts. Les ribosomes existent dans le cytoplasme des procaryotes et dans le cytoplasme et le réticulum endoplasmique rugueux des eucaryotes. Les ribosomes sont constitués de deux sous-unités. Dans E. coli, la petite sous-unité est décrite comme 30S et la grande sous-unité est 50S, pour un total de 70S. Les ribosomes de mammifères ont une petite sous-unité 40S et une grande sous-unité 60S, pour un total de 80S. La petite sous-unité est responsable de la liaison de la matrice d'ARNm, tandis que la grande sous-unité se lie séquentiellement aux ARNt.

ARNt

Les ARNt sont des molécules d'ARN structurelles qui ont été transcrites à partir de gènes par l'ARN polymérase III. Servant d'adaptateurs, des ARNt spécifiques se lient aux séquences de la matrice d'ARNm et ajoutent l'acide aminé correspondant à la chaîne polypeptidique. Par conséquent, les ARNt sont les molécules qui traduisent réellement le langage de l'ARN dans le langage des protéines.

Figure 2. ARNt de phénylalanine

Sur les 64 codons d'ARNm possibles - ou combinaisons de triplets de A, U, G et C - trois spécifient la fin de la synthèse des protéines et 61 spécifient l'ajout d'acides aminés à la chaîne polypeptidique. Parmi ces 61, un codon (AUG) également connu sous le nom de "codon de démarrage" code l'initiation de la traduction. Chaque anticodon d'ARNt peut s'apparier avec l'un des codons d'ARNm et ajouter un acide aminé ou terminer la traduction, selon le code génétique. Par exemple, si la séquence CUA apparaissait sur une matrice d'ARNm dans le cadre de lecture approprié, elle se lierait à un ARNt exprimant la séquence complémentaire, GAU, qui serait liée à l'acide aminé leucine.

Les ARNt matures adoptent une structure tridimensionnelle par liaison hydrogène intramoléculaire pour positionner le site de liaison des acides aminés à une extrémité et le anticodon à l'autre extrémité (figure 2). L'anticodon est une séquence de trois nucléotides dans un ARNt qui interagit avec un codon d'ARNm par appariement de bases complémentaires.

Les ARNt doivent interagir avec trois facteurs :

  1. Ils doivent être reconnus par la bonne aminoacyl synthétase.
  2. Ils doivent être reconnus par les ribosomes.
  3. Ils doivent se lier à la séquence correcte dans l'ARNm.

Synthétases d'ARNt aminoacyl

Grâce au processus de charge de l'ARNt, chaque molécule d'ARNt est liée à son acide aminé correct par un groupe d'enzymes appelées aminoacyl ARNt synthétases. Au moins un type de aminoacyl ARNt synthétase existe pour chacun des 20 acides aminés.


Traduction en procaryotes | La génétique

Le processus par lequel les protéines sont produites avec des séquences d'acides aminés spécifiées par la séquence de codons dans l'ARN messager est appelé traduction. La traduction est la première étape de la biosynthèse des protéines.

Les principaux points concernant la traduction chez les procaryotes sont donnés ci-dessous :

La traduction se produit dans le cytoplasme où se trouvent les ribosomes. Les ribosomes sont constitués d'une petite et d'une grande sous-unité qui entoure l'ARNm. Dans la traduction procaryote, des ribosomes 70S avec des sous-unités 30S et 50S sont utilisés. L'ARNm est synthétisé à partir d'ADN uniquement. Chez les procaryotes, il existe plusieurs sites d'initiation et de terminaison.

En traduction, l'ARN messager (ARNm) est décodé pour produire un polypeptide spécifique selon les règles spécifiées par le code génétique. Celui-ci utilise une séquence d'ARNm comme matrice pour guider la synthèse d'une chaîne d'acides aminés qui forment une protéine. De nombreux types d'ARN transcrits, tels que l'ARN de transfert, l'ARN ribosomique et le petit ARN nucléaire ne sont pas nécessairement traduits en une séquence d'acides aminés.

Le processus de traduction nécessite un ARNm, un ARNr, des ribosomes, 20 types d'acides aminés et leurs ARNt spécifiques.

Chez les procaryotes, trois facteurs sont impliqués dans l'initiation de la traduction [IF 1, IF 2 et IF 3], un facteur dans l'allongement de la chaîne polypeptidique et trois facteurs dans la terminaison de la chaîne [RF1, RF2 et RF3],

Deux types d'enzymes sont utilisés dans la traduction. L'aminoacyl ARNt synthétase (une enzyme) catalyse la liaison entre des ARNt spécifiques et les acides aminés. L'enzyme peptidyl transférase relie le site A et le site P en formant une liaison peptidique [la liaison carbone azote] pendant la phase d'élongation.

Dans le processus de traduction, deux types de codons, à savoir, les codons d'initiation et les codons d'arrêt sont impliqués. Le codon, AUG, initie le processus de traduction et l'un des trois codons d'arrêt, c'est-à-dire UAA, UAG ou UGA, est utilisé pour la terminaison de la chaîne.

7. Démarrage de l'acide aminé :

Chez les procaryotes, l'acide aminé de départ est la N-formyl méthionine. De plus, il y a chevauchement de la transcription et de la traduction.

Mécanisme de traduction chez les procaryotes:

Le processus de traduction se compose de trois phases ou étapes principales, à savoir :

Ceux-ci sont brièvement discutés ci-dessous :

C'est la première phase de la traduction. Le codon de départ ou d'initiation [AUG] est responsable de l'initiation du processus de traduction.

L'initiation de la traduction chez les procaryotes implique l'assemblage des composants du système de traduction qui sont : les deux sous-unités ribosomiques (petite et grande), l'ARNm à traduire, le premier ARNt (formyl) aminoacyl (l'ARNt chargé du premier acide aminé ), GTP (comme source d'énergie), et trois facteurs d'initiation (IF 1, IF 2 et IF 3) qui aident à l'assemblage du complexe d'initiation.

Le ribosome se compose de trois sites, le site A, le site P et le site E. Le site A est le point d'entrée pour l'ARNt aminoacyl (sauf pour le premier ARNt aminoacyl, fMet-ARNtF Met , qui entre au site P). Le site P est l'endroit où l'ARNt peptidyle est formé dans le ribosome. Et le site E qui est le site de sortie de l'ARNt maintenant non chargé après avoir donné son acide aminé à la chaîne peptidique en croissance.

La traduction commence par la liaison de la petite sous-unité ribosomique à une séquence spécifique de la chaîne d'ARNm. L'initiation de la traduction commence avec les sous-unités ribosomiques 50S et 30S. IF1 (facteur d'initiation 1) bloque le site A pour garantir que l'ARNt IMet ne peut se lier qu'au site P et qu'aucun autre aminoacyl-ARNt ne peut se lier au site A pendant l'initiation, tandis que IF3 bloque le site E et empêche les deux sous-unités de s'associer.

IF2 est une petite GTPase qui se lie au fmet-ARNtF Rencontré et aide sa liaison avec la petite sous-unité ribosomique. L'extrémité 3 & 8242 de l'ARNr 16S de la petite sous-unité ribosomique 30S reconnaît le site de liaison ribosomique sur l'ARNm (séquence Shine-Dalgarno ou SD), via sa séquence anti-SD, 5 à 10 paires de bases en amont du codon d'initiation. La séquence Shine-Dalgarno ne se trouve que chez les procaryotes.

Cela aide à positionner correctement le ribosome sur l'ARNm de sorte que le site P soit directement sur le codon d'initiation AUG. IF3 aide à positionner fMet-ARNtF rencontré dans le site P, de sorte que fMet-ARNtF met interagit par appariement de bases avec le codon d'initiation de l'ARNm (AUG). L'initiation se termine lorsque la grande sous-unité ribosomique rejoint le complexe provoquant la dissociation des facteurs d'initiation.

La petite sous-unité se lie via un appariement de bases complémentaires entre l'une de ses sous-unités internes et le site de liaison du ribosome. Ce site une séquence d'une dizaine de nucléotides sur l'ARNm. Il est situé entre 5 et 11 nucléotides du codon initiateur [AUG],

Après la liaison de la petite sous-unité, une molécule d'ARNt spéciale, appelée N-formyl méthionine, ou fMet, reconnaît et se lie au codon initiateur. Ensuite, la grande sous-unité se lie, ce qui entraîne la formation du complexe d'initiation. Dès que le complexe d'initiation est formé, le fMet-ARNt occupe le site P du ribosome et le site A est laissé vide.

Tout ce processus d'initiation est facilité par des protéines supplémentaires, appelées facteurs d'initiation, qui aident à la liaison des sous-unités ribosomiques et de l'ARNt à la chaîne d'ARNm.

C'est la deuxième phase ou phase intermédiaire de la traduction. L'allongement commence après la formation du complexe d'initiation. L'allongement de la chaîne polypeptidique implique l'ajout d'acides aminés à l'extrémité carboxyle de la chaîne en croissance. La protéine en croissance sort du ribosome par le tunnel de sortie du polypeptide dans la grande sous-unité.

L'élongation commence lorsque le fmet-ARNt pénètre dans le site P, provoquant un changement de conformation qui ouvre le site A pour que le nouvel aminoacyl-ARNt se lie. Cette liaison est facilitée par le facteur d'élongation T4 (EF-T4), une petite GTPase. Maintenant, le site P contient le début de la chaîne peptidique de la protéine à coder et le site A contient l'acide aminé suivant à ajouter à la chaîne peptidique.

Le polypeptide en croissance connecté à l'ARNt dans le site P est détaché de l'ARNt dans le site P et une liaison peptidique se forme entre les derniers acides aminés du polypeptide et l'acide aminé encore attaché à l'ARNt dans le site A.

Ce processus, connu sous le nom de formation de liaison peptidique, est catalysé par un ribozyme, la peptidyltransférase, une activité intrinsèque à l'ARN ribosomique 23S dans la sous-unité ribosomique 50S. Maintenant, le site A a un peptide nouvellement formé, tandis que le site P a un ARNt déchargé (ARNt sans acides aminés). Au stade final de l'élongation, la translocation, le ribosome déplace 3 nucléotides vers l'extrémité 3 & 8242 de l'ARNm.

Étant donné que les ARNt sont liés à l'ARNm par appariement de bases codon-anticodon, les ARNt se déplacent par rapport au ribosome en prenant le polypeptide naissant du site A au site P et en déplaçant l'ARNt non chargé vers le site de sortie E.

Ce processus est catalysé par le facteur d'allongement G (EF-G). Le ribosome continue de traduire les codons restants sur l'ARNm à mesure que davantage d'aminoacyl-ARNt se lie au site A, jusqu'à ce que le ribosome atteigne un codon d'arrêt sur l'ARNm (UAA, UGA ou UAG).

Lorsque le site A s'ouvre à nouveau, le prochain ARNt aminoacyle approprié peut s'y lier et la même réaction a lieu, produisant une chaîne peptidique de trois acides aminés. Ce processus se répète, créant une chaîne polypeptidique dans le site P du ribosome. Un seul ribosome peut traduire 60 nucléotides par seconde. Cette vitesse peut être considérablement augmentée lorsque les ribosomes s'unissent pour former des polyribosomes.

C'est la dernière phase de la traduction. La terminaison se produit lorsqu'un des trois codons de terminaison se déplace dans le site A. Ces codons ne sont reconnus par aucun ARNt. Au lieu de cela, ils sont reconnus par des protéines appelées facteurs de libération, à savoir RF1 (reconnaissant les codons stop UAA et UAG) ou RF2 (reconnaissant les codons stop UAA et UGA).

Ces facteurs déclenchent l'hydrolyse de la liaison ester dans le peptidyl-ARNt et la libération de la protéine nouvellement synthétisée du ribosome. Un troisième facteur de libération RF-3 catalyse la libération de RF-1 et RF-2 à la fin du processus de terminaison.


Démarrer Codon

Un codon de départ est le point de départ de la traduction dans une cellule. Lisez l'article suivant pour obtenir plus d'informations sur ce sujet.

Un codon de départ est le point de départ de la traduction dans une cellule. Lisez l'article suivant pour obtenir plus d'informations sur ce sujet.

Qu'est-ce qu'un Codon ?

Un codon est une sorte de code génétique, qui est un ensemble de règles, par lequel certaines informations sont codées dans le matériel génétique qui peut être soit des séquences d'ADN ou d'ARNm, à partir desquelles elles sont traduites en protéines. Ces protéines sont constituées d'acides aminés qui sont enchaînés dans une séquence spécifique. Tout changement dans cette séquence signifie un changement dans le codage, ce qui est normalement observé dans les cas de mutations génétiques. Chaque codon est composé de trois bases, qui codent pour un seul acide aminé, et elles forment une cartographie qui est codée dans l'ARNt de l'organisme. Au total, quatre bases sont présentes dans l'ADN : l'adénine, la cytosine, la guanine et la thymine.

Qu'est-ce qu'un codon de démarrage ?

Aimeriez-vous écrire pour nous? Eh bien, nous recherchons de bons écrivains qui veulent faire passer le mot. Contactez-nous et nous discuterons.

Un codon d'initiation dans l'ADN initie la traduction du premier acide aminé de la chaîne polypeptidique. Les trois premières bases de la séquence codante de l'ARNm à traduire en protéines sont l'endroit où se trouve le codon d'initiation. Il s'agit d'une structure importante, car la séquence protéique réelle qui est traduite est définie par un codon d'initiation. Le codon d'initiation est presque toujours précédé d'une région non traduite appelée 5 & 8242 UTR, également connue sous le nom de séquence leader. C'est une section particulière d'ARNm, qui commence à la position +1. C'est la région où la transcription commence et se termine, juste avant le début du codon de la région codante.

Il s'agit généralement du premier codon AUG dans la séquence d'ARNm. De plus, dans les cas de codons d'initiation d'ADN, le matériel se compose généralement des bases de codons ATG. Ce n'est que dans de très rares cas que les organismes supérieurs, c'est-à-dire les eucaryotes, ont des codons d'initiation non AUG. Cependant, en plus d'AUG, il existe également certaines alternatives comme GUG et UUG. Ceux-ci sont observés chez les organismes inférieurs et moins différenciés, c'est-à-dire chez les procaryotes. Par exemple, E. coli utilise ATG (AUG) 83 % du temps, GTG (GUG) 14 % du temps et TTG (UUG) 3 % du temps. Un ou deux autres, comme ATT et CTG, sont très rares. À chaque fois, il peut ne pas y avoir le même codon de départ, même au sein de la même espèce. Les bactéries et les archées ont UUG ​​et GUG comme codons d'initiation dans la plupart des cas. Cependant, on a vu que dans certains cas rares, des protéines spécifiques peuvent utiliser des codons d'initiation alternatifs, qui peuvent ne pas être utilisés par cette espèce.

Tous les codons d'initiation codent pour la méthionine, car c'est le premier acide aminé qui est codé lors de la synthèse des protéines. Même si des codons d'initiation alternatifs sont présents, il est finalement traduit en méthionine, même si le codon présent code normalement pour un acide aminé différent. Cela se produit parce qu'un ARNt séparé est utilisé pour l'initiation dans de tels cas. La traduction commence par l'initiation de la chaîne ou le codon de départ. Il existe une différence majeure entre le codon de départ et le codon d'arrêt. Contrairement aux dernières, les premières seules ne sont pas suffisantes pour lancer le processus de synthèse des protéines. Des séquences proches et certains facteurs d'initiation sont également nécessaires pour démarrer le processus de traduction.

En cas de mutation du codon de départ, comme d'habitude, l'ARNm muté serait shunté vers les ribosomes, mais la traduction n'aurait pas lieu. En effet, un codon d'initiation est responsable du démarrage de la traduction, et non un codon de démarrage de la transcription. Par conséquent, il ne peut pas nécessairement produire des protéines, car ce codon manque d'une séquence nucléotidique appropriée pouvant servir de cadre de lecture.

Les informations fournies ci-dessus sont un bref aperçu de la structure, de la fonction du codon de départ et de ce qui se passe lorsqu'il y a mutation de ce code d'initiation. Ce codon joue un rôle central dans la traduction et constitue donc un élément très important de la composition génétique de chaque cellule.

Articles Similaires

Saviez-vous que les champignons manquent de chlorophylle ? Ce type de forme de vie peut provoquer des maladies chez l'homme et peut également être utilisé pour fabriquer du fromage par le processus&hellip

Les cellules végétales ont toujours suscité la curiosité des étudiants en biologie, parmi d'autres. Par conséquent, ici, dans cet article, j'ai fourni des informations détaillées.

La reproduction sexuée et asexuée sont les deux moyens de produire une progéniture. Lisez cet article pour obtenir plus d'informations sur la reproduction asexuée dans le règne animal.


Disponibilité des données

Cinq cartes ont été déposées dans l'EMDB avec les codes d'accession EMDB : 4328, EMDB : 4330, EMDB : 4331, EMDB : 4327, EMDB : 4329, pour la carte échantillon 1, la carte A, la carte B, la carte C1 et la carte C2, respectivement . Deux modèles de coordonnées atomiques ont été déposés dans la PDB avec les codes d'accession PDB : 6FYX, PDB : 6FYY, pour les modèles montrant TC en conformation 1 et en conformation 2, respectivement. Toutes les données générées ou analysées au cours de cette étude sont incluses dans le manuscrit et les fichiers justificatifs. Des fichiers de données sources ont été fournis pour les tableaux 4 et 5 et les figures 4 et 5


Association entre le repliement de l'ARNm et le taux de traduction

Les molécules d'ARNm dans la cellule assument souvent une structure secondaire et tertiaire qui peut être serrée pour certains gènes et lâche pour d'autres. Pour que la traduction se poursuive, une telle structure doit être enfilée à travers le ribosome. Voici donc une autre opportunité de réguler et d'induire une grande variation dans l'efficacité de la traduction des gènes - l'étanchéité de leur structure d'ARNm pourrait contrôler à la fois la liaison du ribosome et la vitesse de son flux à travers eux. Les premières preuves indiquent que la stabilité de l'appariement des bases au site de liaison du ribosome ou à son voisinage est un déterminant majeur de l'efficacité de l'initiation de la traduction chez les procaryotes ( Schauder et McCarthy, 1989 ). Chez les organismes eucaryotes, il a été démontré que les structures secondaires serrées le long de l'UTR 5' réduisent l'efficacité de la traduction, en particulier si elles sont situées à proximité du site de départ de la traduction, probablement en obstruant la liaison des ribosomes (Wang et Wessler, 2001).

L'effet de la structure de l'ARNm sur la traduction était traditionnellement déchiffré en inspectant les gènes naturels de divers génomes ( Jia et Li, 2005 ). Maintenant, la biologie synthétique peut compléter cette image en permettant aux chercheurs de manipuler une propriété d'un gène, tout en gardant de nombreuses autres constantes. Récemment, Kudla et al (2009) ont fourni un bon exemple de cette tendance moderne en synthétisant une bibliothèque de 154 GFP gènes qui variaient au hasard sur des sites synonymes, tout en codant la même séquence d'acides aminés. Ils ont exprimé les gènes GFP dans E. coli, et détecté une variation de 250 fois dans les niveaux d'expression. Ils ont découvert que la structure serrée à l'extrémité 5' de l'ARNm inhibe la traduction, tandis que les structures lâches la favorisent. Ces résultats sont cohérents avec l'idée que l'étape d'initiation est d'une importance primordiale dans la détermination des niveaux d'expression génique. Chez les procaryotes, la liaison au ribosome se produit au niveau de la séquence SD ( Shine et Dalgarno, 1974 ) située en amont du codon de départ. Fait intéressant, il a été montré auparavant que le masquage du site d'initiation par une structure secondaire serrée peut être compensé par une interaction SD plus forte que la normale ( de Smit et van Duin, 1994 Olsthoorn et al, 1995 ). Comme Kudla et al (2009) n'a fait varier que la région de codage de la GFP, cette possibilité n'a pas été testée dans leur étude récente.

L'association entre la stabilité des structures secondaires dans la région d'initiation de la traduction et l'efficacité de la traduction est également étayée par une analyse informatique à grande échelle ( Gu et al, 2010), indiquant une tendance à l'échelle du génome à une stabilité réduite de l'ARNm près du codon de départ pour les espèces procaryotes et eucaryotes. Ici aussi, la tendance s'est avérée être renforcée parmi les gènes fortement exprimés, suggérant un effet de l'efficacité de la traduction.


Fond

L'identification des cadres de lecture ouverts (ORF) traduits est une étape critique vers l'annotation des gènes et la compréhension d'un génome. Les progrès rapides du séquençage ont entraîné un déluge de nouveaux génomes, rendant l'annotation manuelle insoluble et le développement de méthodes automatisées précises une nécessité. Chez les procaryotes, la délimitation de l'ORF est particulièrement difficile car les gènes sont souvent étroitement emballés et se chevauchent fréquemment. L'identification de l'ORF du génome entier chez les procaryotes est le plus souvent réalisée in silico, en utilisant une variété de caractéristiques de séquence, telles que le biais de codon guanine-cytosine (GC) et des motifs, tels que le site de liaison ribosomique ou la séquence Shine-Dalgarno (SD) [1 ,2,3], pour différencier les ORF que l'on pense fonctionnels de ceux qui se produisent par hasard dans le génome. Bien que ces techniques soient capables d'identifier des régions génomiques contenant des ORF avec une grande précision [3], la prédiction des sites d'initiation de la traduction (TIS), et donc le début exact d'une séquence codant pour une protéine (CDS), est nettement plus difficile. En plus de fournir des informations fonctionnelles via la séquence peptidique, les informations de régulation et de ciblage sont souvent contenues dans les terminaisons N de la protéine [4, 5], ce qui rend l'identification précise du début des ORF essentielle. Cela a conduit au développement d'un certain nombre de méthodes d'identification TIS in silico reposant sur une variété de caractéristiques de séquence [6,7,8,9], généralement appliquées après l'annotation ORF initiale afin de ré-annoter les prédictions souvent erronées. TIS.

La protéogénomique à haut débit a le potentiel de permettre l'identification des protéines N-terminales, et par extension des TIS, à partir d'un protéome entier. En pratique, cependant, la variation des niveaux d'expression des protéines, les propriétés physiques, l'incompatibilité MS et l'apparition de modifications protéiques limitent le nombre de protéines N-terminales détectables [10, 11]. Chez les procaryotes, la protéomique N-terminale capture généralement les peptides correspondants de centaines à quelques milliers de gènes [11]. Par exemple, une étude récente a identifié les peptides N-terminaux de 910 des 4140 (22 %) gènes annotés dans Escherichia coli [12]. Bien qu'ils ne soient pas en mesure de fournir une annotation complète du génome, ces ensembles de données constituent un moyen efficace de validation expérimentale TIS.

Une couverture significativement plus élevée des TIS peut être obtenue avec des technologies basées sur le séquençage. En se concentrant spécifiquement sur les lectures protégées par le ribosome, le profilage du ribosome (ribo-seq) [13] déduit quelles parties du transcriptome sont activement en cours de traduction. En bref, ribo-seq vise à capturer, sélectionner et séquencer les lectures d'ARNm associées aux ribosomes, généralement des lectures de 26 à 34 nt (eucaryotes) [14, 15] ou de 20 à 40 nt (procaryotes) [16, 17] de longueur . Ces lectures sont ensuite communément affectées à un décalage fixe [15, 17, 18, 19, 20], ou à un décalage dépendant de la longueur de lecture [14, 21, 22], afin de résoudre le codon traduit représenté par chaque lecture. De cette façon, ribo-seq a été utilisé pour démontrer la traduction de nombreux ARN et régions qui n'étaient pas considérés comme associés aux ribosomes [14, 18, 21, 23, 24, 25, 26]. Être capable d'identifier la traduction à l'échelle du transcriptome a une application évidente à l'annotation ORF et un certain nombre de méthodologies ont été développées pour la prédiction des ORF traduits [15, 18, 21, 22, 27]. Ces méthodes reposent sur un certain nombre de caractéristiques, telles que la périodicité des codons, le contexte de lecture et les longueurs de lecture, pour distinguer les empreintes indicatives de la traduction des autres empreintes non traduisantes fréquemment observées dans les données ribo-seq. Alors que des progrès ont été réalisés dans la recherche de régions traduites, la délimitation de leurs limites exactes a reçu moins d'attention. Un traitement antibiotique peut être utilisé pour caler et capturer les empreintes du ribosome initiateur [14, 28, 29], mais trouver un composé approprié a été insaisissable chez les procaryotes, avec un seul ensemble de données disponible à ce jour [30].

Ici, nous présentons une méthode généralement applicable qui ne dépend pas d'un traitement chimique spécialisé, mais peut tirer parti de ces données (Fig. 1a). En utilisant la protéomique N-terminale, nous démontrons sa grande précision et montrons qu'elle est cohérente avec d'autres caractéristiques liées à l'initiation de la traduction. En appliquant le modèle, nous prédisons de nombreux nouveaux sites d'initiation dans Salmonella enterica le sérovar Typhimurium et plusieurs nouveaux gènes.

Classification du site d'initiation de la traduction avec des modèles de longueur de lecture ribo-seq. une Représentation schématique de la stratégie de classification. b Les méta-profils Ribo-seq dans les fenêtres autour des codons de démarrage pour toutes les séquences codantes annotées dans le S. Génome de Typhimurium (échantillon de monosome, n = 4187), les contributions de chaque gène sont ramenées à une somme de un (panneau supérieur) proportion des comptes de lecture 5' ribo-seq par position nucléotidique, colorée par la position du codon (encart) proportions des comptes de lecture ribo-seq par position de nucléotide, après ajustement par les décalages de longueur de lecture (voir méthodes) (panneau inférieur) cartes thermiques des scores z des nombres de lectures ribo-seq de 5' par longueur de lecture


Remerciements

Nous remercions T.M.A. Wilson pour le (CAA)m-Plasmide GUS, I.N. Shatsky pour avoir suggéré que nous utilisions (CAA)m-GUS mRNA, F. Dardel pour avoir souligné la similitude des structures de eIF1 et IF3, et Christopher Hellen pour des discussions utiles et une aide à la préparation de ce manuscrit. Ce travail a été soutenu par la subvention R01 GM59660 de l'Institut national des sciences médicales générales.

Les frais de publication de cet article ont été couverts en partie par le paiement des frais de page. Cet article doit donc être marqué par les présentes « publicité » conformément à la section 18 USC 1734 uniquement pour indiquer ce fait.



Commentaires:

  1. Scandy

    Je félicite, votre idée est très bonne

  2. Samurn

    Infiniment en discuter est impossible

  3. Tygorr

    Je pense que tu as tort. Je suis sûr. Je peux le prouver. Écrivez-moi en MP, nous discuterons.

  4. Eleazar

    Supprimé (mélange de sujets)



Écrire un message