Informations

7.13A : Stratégies utilisées dans les projets de séquençage - Biologie

7.13A : Stratégies utilisées dans les projets de séquençage - Biologie



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Les stratégies utilisées pour le séquençage des génomes comprennent la méthode de Sanger, le séquençage au fusil de chasse, l'extrémité par paire et le séquençage de nouvelle génération.

OBJECTIFS D'APPRENTISSAGE

Comparez les différentes stratégies utilisées pour le séquençage du génome entier : méthode de Sanger, séquençage shotgun, séquençage par paires et séquençage de nouvelle génération

Points clés

  • La méthode de Sanger est une technique de séquençage de base qui utilise des didésoxynucléotides marqués par fluorescence (ddNTP) pendant la réplication de l'ADN, ce qui se traduit par de multiples brins courts d'ADN répliqué qui se terminent à différents points, en fonction de l'endroit où le ddNTP a été incorporé.
  • Le séquençage au fusil de chasse est une méthode qui coupe au hasard des fragments d'ADN en morceaux plus petits, puis, à l'aide d'un ordinateur, prend les fragments d'ADN, les analyse pour les séquences qui se chevauchent et réassemble la séquence d'ADN entière.
  • Le séquençage par paires est un type de séquençage shotgun qui est utilisé pour les génomes plus grands et analyse les deux extrémités des fragments d'ADN pour le chevauchement.
  • Le séquençage de nouvelle génération est un type de séquençage automatisé qui s'appuie sur un logiciel sophistiqué pour un séquençage rapide de l'ADN.

Mots clés

  • fluorophore: une molécule ou un groupe fonctionnel qui est capable de fluorescence
  • contig: un ensemble de segments d'ADN chevauchants, dérivés d'une seule source de matériel génétique, à partir de laquelle la séquence complète peut être déduite
  • didésoxynucléotide: tout nucléotide formé à partir d'un désoxynucléotide par perte d'un second groupe hydroxyle du groupe désoxyribose

Stratégies utilisées dans les projets de séquençage

La technique de séquençage de base utilisée dans tous les projets de séquençage modernes est la méthode de terminaison de chaîne (également connue sous le nom de méthode didésoxy), qui a été développée par Fred Sanger dans les années 1970. La méthode de terminaison de chaîne implique la réplication d'ADN d'une matrice simple brin avec l'utilisation d'une amorce et d'un désoxynucléotide régulier (dNTP), qui est un monomère, ou une unité unique, d'ADN. L'amorce et le dNTP sont mélangés avec une faible proportion de didésoxynucléotides marqués par fluorescence (ddNTP). Les ddNTP sont des monomères auxquels il manque un groupe hydroxyle (-OH) au site auquel un autre nucléotide se fixe généralement pour former une chaîne. Chaque ddNTP est marqué avec une couleur différente de fluorophore. Chaque fois qu'un ddNTP est incorporé dans le brin complémentaire en croissance, il met fin au processus de réplication de l'ADN, ce qui se traduit par de multiples brins courts d'ADN répliqué qui se terminent chacun à un point différent au cours de la réplication. Lorsque le mélange réactionnel est traité par électrophorèse sur gel après avoir été séparé en brins simples, les multiples brins d'ADN nouvellement répliqués forment une échelle en raison de leurs tailles différentes. Parce que les ddNTP sont marqués par fluorescence, chaque bande sur le gel reflète la taille du brin d'ADN et le ddNTP qui a terminé la réaction. Les différentes couleurs des ddNTP marqués par un fluorophore aident à identifier le ddNTP incorporé à cette position. La lecture du gel sur la base de la couleur de chaque bande sur l'échelle produit la séquence du brin modèle.

Premières stratégies : séquençage au fusil de chasse et séquençage final par paire

Dans la méthode de séquençage au fusil de chasse, plusieurs copies d'un fragment d'ADN sont découpées au hasard en de nombreux morceaux plus petits (un peu comme ce qui arrive à une cartouche à balle ronde lorsqu'elle est tirée d'un fusil de chasse). Tous les segments sont ensuite séquencés en utilisant la méthode de séquençage en chaîne. Ensuite, à l'aide d'un ordinateur, les fragments sont analysés pour voir où leurs séquences se chevauchent. En faisant correspondre les séquences qui se chevauchent à la fin de chaque fragment, la séquence d'ADN entière peut être reformée. Une séquence plus grande qui est assemblée à partir de séquences plus courtes qui se chevauchent est appelée contig. Par analogie, considérez que quelqu'un a quatre copies d'une photographie de paysage que vous n'avez jamais vue auparavant et ne sait rien sur la façon dont elle devrait apparaître. La personne déchire ensuite chaque photographie avec ses mains, de sorte que des morceaux de tailles différentes soient présents sur chaque copie. La personne mélange ensuite toutes les pièces et vous demande de reconstituer la photographie. Dans l'un des plus petits morceaux, vous voyez une montagne. Dans une pièce plus grande, vous voyez que la même montagne est derrière un lac. Un troisième fragment ne montre que le lac, mais il révèle qu'il y a une cabane sur la rive du lac. Par conséquent, en regardant les informations qui se chevauchent dans ces trois fragments, vous savez que l'image contient une montagne derrière un lac qui a une cabane sur sa rive. C'est le principe de la reconstruction de séquences d'ADN entières à l'aide du séquençage shotgun.

À l'origine, le séquençage au fusil de chasse n'analysait qu'une extrémité de chaque fragment pour les chevauchements. C'était suffisant pour le séquençage de petits génomes. Cependant, le désir de séquencer des génomes plus gros, comme celui d'un humain, a conduit au développement du séquençage à double canon, plus officiellement connu sous le nom de séquençage par paires. Dans le séquençage par paires, les deux extrémités de chaque fragment sont analysées pour le chevauchement. Le séquençage par paires est donc plus lourd que le séquençage shotgun, mais il est plus facile de reconstituer la séquence car il y a plus d'informations disponibles.

Séquençage de nouvelle génération

Depuis 2005, les techniques de séquençage automatisé utilisées par les laboratoires sont sous l'égide du séquençage de nouvelle génération, qui est un groupe de techniques automatisées utilisées pour le séquençage rapide de l'ADN. Ces séquenceurs automatisés à faible coût peuvent générer des séquences de centaines de milliers ou de millions de fragments courts (25 à 500 paires de bases) en l'espace d'une journée. Un logiciel sophistiqué est utilisé pour gérer le processus fastidieux de mise en ordre de tous les fragments.


Les cliqueurs du chapitre 15

b. Leur construction est basée sur la recombinaison génétique.

c. Ils sont limités parce que leur construction dépend de traits à locus unique.

une. fréquence de recombinaison

ré. cartographie du site étiqueté par séquence (STS)

une. L'approche shotgun ne nécessite pas l'utilisation de plasmides.

b. L'approche du fusil de chasse est hautement automatisée.

c. En raison de l'efficacité de l'approche shotgun, le génome n'est séquencé qu'une seule fois.

une. Le projet du génome humain a conduit au développement de technologies de séquençage plus efficaces et moins coûteuses.

b. Le projet du génome humain a permis d'identifier de nombreux gènes liés aux maladies.

c. Le projet du génome humain a aidé les scientifiques à comprendre les processus biologiques de base.

ré. Le projet du génome humain a conduit à une utilisation généralisée des tests génétiques par les assureurs-maladie pour évaluer le risque de développer une maladie.

une. elles sont rares chez les personnes d'une même ethnie.

b. ils sont hérités en tant que variantes alléliques.

c. ils sont utiles dans les études de liaison pour localiser les allèles pathogènes.

ré. deux ou plusieurs SNP situés à proximité l'un de l'autre sur un chromosome présenteront un déséquilibre de liaison.

une. La bioinformatique combine les domaines de la biologie moléculaire et de l'informatique.

b. La bioinformatique développe des bases de données de séquences d'ADN et de protéines.

c. La bioinformatique est essentielle pour gérer la grande quantité de données de séquençage qui ont été générées.

une. homologues de variantes alléliques

b. l'utilisation de séquences reporters

une. doit être plus petit (en nombre de paires de bases).

b. devrait avoir approximativement le même nombre de gènes pour les fonctions ménagères de base.

c. devrait avoir moins de gènes dans l'ensemble.

une. architecture chromosomique

une. les eucaryotes plus complexes sur le plan phénotypique ont des génomes plus grands.

b. les eucaryotes plus complexes sur le plan phénotypique ont plus de gènes.

c. les génomes eucaryotes contiennent plusieurs copies de nombreux gènes.

une. Bioinformatique : combine la biologie moléculaire et l'informatique pour développer des bases de données de séquences d'ADN et de protéines et les outils pour leur analyse.

b. Génomique fonctionnelle : développe et utilise des méthodes qui permettent de déterminer la fonction et l'expression des gènes à partir de la séquence d'ADN uniquement.

c. Métagénomique : examine les génomes des communautés d'organismes qui habitent un environnement commun.

ré. Biologie synthétique : crée à partir de zéro de nouveaux génomes et organismes qui vont être libérés dans des environnements naturels.


À quel point le séquençage de l'ADN est-il nouveau?

Depuis l'achèvement du projet du génome humain, les améliorations technologiques et l'automatisation ont augmenté la vitesse et réduit les coûts au point où des gènes individuels peuvent être séquencés de manière routinière, et certains laboratoires peuvent séquencer plus de 100 000 milliards de bases par an, et un génome entier peut être séquencé. pour seulement quelques milliers de dollars.

Bon nombre de ces nouvelles technologies ont été développées avec le soutien du programme de technologie du génome du National Human Genome Research Institute (NHGRI) et de ses prix Advanced DNA Sequencing Technology. L'un des objectifs du NHGRI est de promouvoir de nouvelles technologies qui pourraient éventuellement réduire le coût du séquençage d'un génome humain de qualité encore supérieure à ce qui est possible aujourd'hui et pour moins de 1 000 $.

Depuis l'achèvement du projet du génome humain, les améliorations technologiques et l'automatisation ont augmenté la vitesse et réduit les coûts au point où des gènes individuels peuvent être séquencés de manière routinière, et certains laboratoires peuvent séquencer plus de 100 000 milliards de bases par an, et un génome entier peut être séquencé. pour seulement quelques milliers de dollars.

Bon nombre de ces nouvelles technologies ont été développées avec le soutien du programme de technologie du génome du National Human Genome Research Institute (NHGRI) et de ses prix Advanced DNA Sequencing Technology. L'un des objectifs du NHGRI est de promouvoir de nouvelles technologies qui pourraient éventuellement réduire le coût du séquençage d'un génome humain de qualité encore supérieure à ce qui est possible aujourd'hui et pour moins de 1 000 $.


Exemples

Arts du langage

Les Story Maps offrent un moyen d'aider les élèves à organiser les événements à partir d'une histoire.

Aider les élèves à apprendre des mots de transition ou des mots indicateurs qui indiquent une séquence (premier, deuxième, dernier) les aidera également à en apprendre davantage sur la séquence.

Les bâtons de séquence, les chaînes d'histoires, les cordes pour raconter des histoires et l'artisanat de séquences d'histoires aident tous les élèves à s'entraîner à organiser des événements dans une histoire. Consultez ces ressources pour des idées :

La plupart des programmes de mathématiques incluent des feuilles de travail sur les nombres ordinaux (premier, deuxième, troisième, etc.). Les motifs sont également une forme de séquençage pour encourager l'utilisation de mots de vocabulaire tels que « Quelle perle va en premier ? Quelle perle ensuite ? Quelle perle est la troisième ? » Encourager les élèves à écrire les étapes pour résoudre les problèmes d'addition et de soustraction qui incluent le regroupement est un excellent moyen de leur faire réfléchir aux étapes dans l'ordre. Les enseignants peuvent utiliser une simple feuille de papier pliée en quatre carrés. Demandez aux élèves d'écrire les étapes dans l'ordre dans les carrés.

Science

Aider les enfants à séquencer développe également leurs compétences en recherche scientifique. Afin d'étudier ou d'observer des changements dans quelque chose, les élèves doivent suivre et enregistrer les changements. Les changements se produisent dans un ordre particulier, que les enfants peuvent documenter en écrivant ou en dessinant des images.

Études sociales

Les chronologies sont un excellent moyen d'enseigner la séquence en sciences sociales. Les enfants peuvent aimer établir une chronologie de leur propre vie et inclure des étapes importantes telles que lorsqu'ils ont appris à marcher, à parler, à faire du vélo et à aller à l'école. Une fois que les élèves ont compris le processus consistant à tracer des jalons importants sur une chronologie, les sujets des programmes d'études sociales peuvent être utilisés.

Cet exemple simple de chronologie d'explorateurs illustre comment l'espacement entre les dates indique le passage du temps.

D'autres idées de séquençage

  • Activités d'artisanat d'art. Il peut être souhaitable d'envisager la confection de courtepointes et/ou d'autres activités d'artisanat avec les enfants. Ceci et d'autres activités artistiques et artisanales peuvent renforcer l'idée de séquençage et peuvent introduire des concepts mathématiques (mesure, addition et soustraction et calcul de base, etc.). celui d'Alex Henderson Les enfants commencent à courtepointe avec Alex Anderson : 7 courtepointes amusantes et faciles pour les enfants par les enfants, conseils pour la courtepointe avec les enfants fournit des instructions faciles pour les adultes qui quilting avec des enfants.
  • Cuisiner avec des enfants. Les livres de cuisine pour enfants peuvent renforcer les histoires lues, les concepts mathématiques (mesure, etc.), ainsi que le séquençage. The Little House Cookbook: Frontier Foods de Laura Ingalls Wilder's Classic Stories de Barbara Walker (HarperCollins 0064460908) présente des recettes d'aliments mentionnés dans la série Little House de Laura Ingalls Wilder.
  • Des livres sans mots. Il existe de nombreux livres sans mots qui peuvent être utilisés avec des enfants plus jeunes et avec des apprenants de langue anglaise (ou des étudiants qui peuvent avoir une maîtrise limitée de l'anglais). Pour les plus jeunes, Crêpes pour le petit déjeuner par Tomie dePaola détaille avec humour une femme faisant des crêpes à partir de rien ou les aventures muettes du petit chien de Mark Newgarden nommé Bow-Wow (par exemple, Bow-Wow bugs un bug). Pour les lecteurs plus âgés ou plus avertis, les livres de Barbara Lehmann et David Weisner peuvent être envisagés.
  • Activités quotidiennes. Créez une page de séquence pour une activité simple à la maison ou à l'école. Utilisez n'importe quelle feuille de papier vierge. Pliez le papier en carrés. Commencez avec 4 grands carrés, pour les élèves plus âgés, créez plus de carrés. Demandez aux enfants de dessiner les étapes qu'ils connaissent dans l'ordre dans lequel elles se produisent. Par exemple, dessinez chaque étape nécessaire pour faire un sandwich au beurre de cacahuète et à la gelée ou pour se brosser les dents.
  • L'heure du calendrier. Coupez ou déchirez les pages d'un vieux calendrier. Mélangez les mois et distribuez la pile de pages. Demandez aux enfants d'ordonner les mois de janvier à décembre en étalant les pages sur le sol. Quel mois commence en premier ? Alors laquelle ? Quel mois est le dernier ?

Télécharger des modèles vierges


Présentation de la discussion

Le séquençage cellulaire unique, comme son nom l'indique, permet aux chercheurs d'examiner les informations génomiques des cellules individuelles. Cela donne l'occasion d'étudier les différences de cellule à cellule et d'identifier les sous-types cellulaires, ce qui donne un aperçu de la façon dont des cellules spécifiques fonctionnent et répondent à leur environnement. Le Dr Eric Chow commence son exposé par une vue d'ensemble du séquençage monocellulaire en mettant l'accent sur l'ARN. Il poursuit ensuite en décrivant les approches prédominantes, y compris les méthodes d'indexation basées sur des plaques, basées sur la microfluidique et combinatoires. Il termine en abordant les approches de l'analyse cellulaire unique qui ne reposent pas sur l'ARN, y compris les méthodes qui utilisent l'ADN, les protéines et les anticorps. Il passe également en revue certains des avantages et des limites de l'analyse au niveau des cellules individuelles.


Téléchargez et imprimez cet article pour votre usage personnel académique, de recherche et pédagogique.

Achetez un seul numéro de Science pour seulement 15 $ US.

Science

Vol 326, numéro 5950
09 octobre 2009

Outils d'articles

Veuillez vous connecter pour ajouter une alerte pour cet article.

Par PSG Chain , DV Grafham , RS Fulton , MG FitzGerald , J. Hostetler , D. Muzny , J. Ali , B. Birren , DC Bruce , C. Buhay , JR Cole , Y. Ding , S. Dugan , D. Field , GM Garrity , R. Gibbs , T. Graves , CS Han , SH Harrison , S. Highlander , P. Hugenholtz , HM Khouri , CD Kodira , E. Kolker , NC Kyrpides , D. Lang , A. Lapidus , SA Malfatti , V. Markowitz , T. Metha , KE Nelson , J. Parkhill , S. Pitluck , X. Qin , TD Read , J. Schmutz , S. Sozhamannan , P. Sterk , RL Strausberg , G. Sutton , NR Thomson , JM Tiedje , G. Weinstock , A. Wollam , Consortium sur les normes génomiques Consortium Jumpstart du projet sur le microbiome humain , JC Detter

Science 09 oct. 2009 : 236-237

Des normes de séquence plus détaillées qui suivent les technologies de séquençage révolutionnaires aideront la communauté des chercheurs à évaluer les données.


Qu'est-ce que c'est?

Comme défini dans le cours de certification PMP, les activités de séquence sont le processus de identifier et documenter les relations entre les activités du projet . Ainsi, l'objectif principal du processus d'activités de séquence est finaliser l'interrelation des activités pour compléter la portée du projet et atteindre les objectifs du projet.

Le résultat clé du processus des activités de séquence est Diagramme de réseau . Le diagramme de réseau d'un projet visualise les activités du projet dans des cases avec l'ID d'activité et montre l'interrelation des activités avec des flèches. Examinons maintenant brièvement cette sortie du processus Sequence Activities avec un exemple.

Exemple de diagramme de réseau pour le processus d'activités de séquence

Cette figure montre un exemple de diagramme de réseau résultant du processus d'activités de séquence.

Comme vous le voyez, après le démarrage du projet,

  • L'activité #1 doit commencer en premier.
  • Une fois l'activité 1 terminée, l'activité 2 et l'activité 3 commenceront.
  • L'activité n°4 ne peut commencer qu'une fois l'activité n°2 terminée.
  • L'activité n°5 dépend de l'activité n°2 et de l'activité n°3, par conséquent, elle ne commencera qu'une fois ces deux activités terminées.
  • Et la dernière activité, l'activité n°6 ne peut commencer que si l'activité n°4 et l'activité n°5 sont terminées.
  • Après l'achèvement de l'activité #6, le projet se terminera.

Notez qu'il ne s'agit que d'un schéma de réseau simple et exemple afin de vous montrer comment est un schéma de réseau. Dans les projets réels, il y aura beaucoup d'activités de projet, donc le diagramme de réseau et le processus d'activités de séquence seront beaucoup plus complexes que cela.

Comment créer un bon diagramme de réseau dans le processus d'activités de séquence ?

Si les durées des activités sont ajoutées dans le diagramme de réseau pendant le processus des activités de séquence, le chemin critique du projet peut également être vu. Un schéma de réseau est un entrée critique pour déterminer le chemin critique du projet et si des durées d'activité sont placées sur ces cases d'activité, celles-ci aideront également à voir le chemin critique du projet.

Méthode de schéma de priorité qui est abrégé en PDM est la méthode la plus courante pour dessiner des diagrammes de réseau. PDM est également appelé Activity-On-Node et abrégé en AON. En effet, les activités sont représentées sous forme de boîtes ou de nœuds dans le diagramme de réseau.

Dans la méthode de diagramme de priorité, les cases représentent les activités du projet et les flèches représentent les dépendances de ces activités.

Par exemple, dans cette figure ci-dessus, l'activité A est connectée à l'activité B avec une flèche vers l'avant. Cela signifie que l'activité B dépend de l'activité A et que l'activité B ne peut commencer qu'une fois l'activité A terminée. Ou en d'autres termes, l'activité A est le prédécesseur de l'activité B.


Application du projet du génome humain

Certains des différents domaines où l'application du projet du génome humain est utilisée sont les suivants : (a) Médecine moléculaire (b) Contrôle des déchets et nettoyage de l'environnement (c) Biotechnologie (d) Sources d'énergie (e) Évaluation des risques (f) Médecine légale de l'ADN (identification).

(a) Médecine moléculaire :

Le dépistage génétique permettra des tests diagnostiques rapides et spécifiques permettant de traiter d'innombrables maladies.

Les tests basés sur l'ADN clarifient rapidement le diagnostic et permettent aux généticiens de détecter les porteurs au sein des familles. Les informations génomiques peuvent indiquer la probabilité future de certaines maladies. Les maladies pour lesquelles la susceptibilité peut être déterminée comprennent les maladies cardiaques, le cancer et le diabète.

(b) Contrôle des déchets et nettoyage de l'environnement :

En 1994, la Microbial Genome Initiative a été formulée pour séquencer les génomes de bactéries utiles dans les domaines de la production d'énergie, de l'assainissement de l'environnement, de la réduction des déchets toxiques et du traitement industriel. À la suite de ce projet, six microbes vivant dans des conditions de température et de pression extrêmes ont été séquencés. En apprenant la structure protéique unique de ces microbes, il peut être possible d'utiliser les organismes et leurs enzymes à des fins pratiques telles que le contrôle des déchets et le nettoyage de l'environnement.

(c) Biotechnologie :

Les ventes de produits biotechnologiques devraient être très élevées aux États-Unis d'ici l'an 2000. Le HGP a stimulé des investissements importants de la part de grandes entreprises et favorisé le développement de nouvelles biotechnologies.

(d) Sources d'énergie :

La biotechnologie jouera un rôle important dans l'amélioration de l'utilisation des ressources fossiles. Les demandes croissantes d'énergie nécessitent des stratégies pour contourner les nombreux problèmes liés aux technologies énergétiques dominantes d'aujourd'hui. La biotechnologie aidera à répondre à ces besoins en fournissant un moyen plus propre pour la bioconversion des matières premières en produits raffinés. De plus, il est possible de développer des sources d'énergie entièrement nouvelles à base de biomasse. Avoir la séquence génomique du micro-organisme producteur de méthane.

(e) Évaluation des risques :

Les scientifiques savent que les différences génétiques rendent certaines personnes plus sensibles que d'autres à de tels agents. Davantage de travail doit être fait pour déterminer la base génétique d'une telle variabilité, mais cette connaissance répondra directement à la mission à long terme du DOE pour comprendre les effets des expositions de faible niveau aux rayonnements et à d'autres agents liés à l'énergie, en particulier en termes de risque de cancer.

(f) Médecine légale de l'ADN (identification) :

Pour identifier les individus, les médecins légistes scannent 13 régions d'ADN, ou loci, qui varient d'une personne à l'autre et utilisent les données pour créer un profil ADN de cet individu (parfois appelé empreinte ADN).


Gestion de classe et survie des enseignants

Ces stratégies visent à établir un cadre pour des expériences positives pour les enseignants et les élèves.

Définir des attentes d'apprentissage claires : Une fois que vous les avez définis, communiquez-les clairement. Dites aux élèves le premier ou le deuxième jour quels sont vos objectifs pour eux. Puisqu'ils n'écoutent probablement pas, répétez-leur. Écrivez les attentes de la classe dans le programme du cours. Dites-leur des attentes spécifiques avant chaque mission. Notez les attentes de l'affectation sous la forme d'une rubrique. Écrivez-les dans des instructions.

Établir des attentes comportementales claires : Une fois que vous les avez établis, communiquez-les clairement. Les attentes comportementales sont mieux établies par vos actions. Si vous vous attendez à ce que les enfants soient à l'heure, par exemple, vous feriez mieux d'être prêt à sévir contre ce premier enfant en retard. Vos attentes en matière d'apprentissage et de comportement doivent être clairement énoncées dans vos attentes de cours.

Établissez une routine : Les tâches ordinaires, telles que collecter des papiers, se regrouper ou sortir un livre des étagères, peuvent rapidement devenir chaotiques s'il n'y a pas de routine établie. Prenez le temps, les premières semaines d'école, de revoir en détail comment les choses sont faites. Ajustez, si nécessaire.

Tout documenter : Ceci est particulièrement important au début de votre carrière lorsque les administrateurs, les étudiants et les parents peuvent ne pas vous trouver aussi crédible que vos collègues plus expérimentés. Les éléments à documenter comprennent les plans de cours, les conférences des élèves, les contacts avec les parents, les mauvais comportements des élèves, les réunions auxquelles ils ont assisté et les conférences parents/enseignants.

Trouver un mentor : Si vous êtes nouveau, trouvez un mentor. Il y a un autre enseignant dans votre école qui comprend ce que vous vivez et, plus important encore, sait comment vous aider. Si c'est quelqu'un qui enseigne la même matière, tant mieux. Si non, c'est OK. Vous feriez mieux d'apprendre les ficelles de quelqu'un de compétent qui enseigne un sujet différent qu'un idiot qui a des intérêts similaires.


PROJETS GENOME : DÉCOUVRIR LES PLANS DE LA BIOLOGIE

Aux premiers jours de la génétique, les scientifiques n'avaient pas les ressources nécessaires pour examiner plus de quelques gènes à la fois. Cela a rendu le processus de compréhension de l'influence de la génétique sur un organisme lent et ardu. Les scientifiques ont été confrontés à l'énorme tâche de tenter de comprendre l'influence génétique avec peu d'informations pour accomplir la tâche. La compréhension des gènes aurait été très utile pour résoudre ce problème.

L'année 1995 a vu l'achèvement des deux premiers génomes non viraux complets, Haemophilus influenzae [1] et Mycoplasme génital [1], deux bactéries qui peuvent provoquer des maladies humaines. Depuis lors, plus de 100 génomes ont été entièrement séquencés, y compris ceux d'organismes supérieurs comme la levure de boulanger, la mouche des fruits et le nématode [2]. Avec l'annonce en juin 2001 de l'achèvement de la première ébauche du génome humain [3], l'approche scientifique de la biologie a complètement changé. L'ensemble des gènes humains était désormais disponible. Cela représentait une quantité irrésistible de données qui ont comblé le fossé bioinformatique qui séparait les biologistes de leur compréhension de la génétique.

Pour commencer à voir la signification d'un tel événement historique, il est nécessaire de voir pourquoi la découverte d'un génome est une tâche biologique importante.

Le génome fait référence à tout l'ADN présent dans un organisme.

L'ADN est le « plan génétique » qui détermine la constitution génotypique de chaque organisme. Dans sa forme la plus simple, l'ADN se compose de deux chaînes de nucléotides, ou bases (en abrégé A, C, G et T), enroulées l'une autour de l'autre. Les bases composant l'ADN ont des capacités de liaison spécifiques : A se lie toujours à T et C se lie toujours à G. Ces capacités de liaison sont utiles pour les scientifiques à comprendre car, si la séquence nucléotidique d'un brin d'ADN est déterminée, la liaison complémentaire permet la séquence de autre brin à déduire.

Dans le cas des humains, l'ADN est organisé en 24 unités structurelles appelées chromosomes. Chaque chromosome est constitué de bobines d'ADN compactées. Bien qu'une grande partie de cet ADN n'ait aucune fonction connue (ces segments d'ADN sont commodément appelés ADN espaceur ou ADN indésirable), une partie importante de l'ADN code pour les gènes. Chaque gène fournit les informations nécessaires pour produire une protéine, qui est responsable de l'exécution des fonctions cellulaires. Le complément de protéines dans un organisme est très important, les maladies se manifestant souvent lorsqu'une protéine ne fonctionne pas correctement.

Pourquoi séquencer les génomes, en particulier les génomes non humains ?

L'une des choses intéressantes à propos des organismes biologiques est leur remarquable similitude au niveau moléculaire, malgré leurs différences extérieures évidentes. Par exemple, de nombreux gènes se trouvent dans des organismes morphologiquement différents malgré la distance phylogénétique qui les sépare4. Non seulement ces gènes sont très similaires dans leur composition de séquence d'ADN, mais ils ont également tendance à remplir les mêmes fonctions. Ainsi, en comprenant la fonction d'un gène dans un organisme, les scientifiques peuvent se faire une idée de la fonction que ce gène peut remplir dans un organisme plus complexe comme l'homme. Les connaissances acquises peuvent ensuite être appliquées à divers domaines tels que la médecine, le génie biologique et la médecine légale.

La réaction de séquençage : comment la composition nucléotidique de l'ADN est déterminée

Pour comprendre comment l'ADN est séquencé, il faut d'abord en savoir un peu sur la structure de l'ADN :

  • Un segment d'ADN, qui est généralement double brin, a une orientation spécifique, car il a une extrémité 5′ (lu comme 𔄝 prime”) et une extrémité 3′ (𔄛 prime”). Cela peut être simplement considéré comme une extrémité avant et arrière du segment d'ADN.
  • Lorsque l'ADN est synthétisé en laboratoire, les deux brins sont séparés et de nouvelles bases sont ajoutées à l'extrémité 3 & 8242, ainsi l'ADN est assemblé de l'extrémité 5 & 8242 à 3 & 8242.
  • L'ADN ne peut pas être synthétisé à partir de zéro. Un petit morceau d'ADN, appelé amorce, est nécessaire pour que la réaction commence.
  • Les amorces sont conçues de telle sorte qu'elles soient capables de se lier à l'ADN cible, dont la liaison est l'initiateur de la synthèse d'ADN.

Le séquençage de l'ADN est réalisé par la méthode de Fredrick Sanger (voir Figure 1), pour laquelle il a remporté son deuxième prix Nobel en 1980.


Figure 1. La réaction de séquençage de Sanger. L'ADN simple brin est amplifié en présence de ddNTP marqués par fluorescence qui servent à terminer la réaction et à marquer tous les fragments d'ADN produits. Les fragments d'ADN sont ensuite séparés par électrophorèse sur gel de polyacrylamide et la séquence lue à l'aide d'un faisceau laser et d'un ordinateur.

Cette méthode consiste essentiellement à amplifier plusieurs fois un morceau d'ADN simple brin [5]. Normalement, lorsque l'ADN est amplifié, de nouveaux désoxy-nucléotides (dNTP) sont ajoutés au fur et à mesure que le brin d'ADN se développe. La méthode de Sanger utilise des bases spéciales appelées didésoxy-nucléotides ( ddNTPs). Ceux-ci sont similaires aux dNTP, à deux différences près : ils ont des étiquettes fluorescentes qui leur sont attachées (une étiquette différente pour chacun des 4 ddNTP) et il manque un atome crucial qui empêche l'ajout de nouvelles bases à un brin d'ADN après un ddNTP. a été ajouté. Ainsi, une fois qu'un ddNTP est inséré dans un brin d'ADN en croissance, la synthèse de ce brin est arrêtée. Après de nombreux cycles répétés d'amplification, toutes les longueurs possibles d'ADN seront représentées et chaque morceau d'ADN synthétisé contenant un marqueur fluorescent à son extrémité.

L'ADN amplifié peut ensuite être séparé selon la taille par électrophorèse sur gel. Lorsque l'ADN fluorescent atteint le fond du gel (maintenant séparé du plus petit au plus grand), un laser peut capter la fluorescence de chaque morceau d'ADN. L'astuce de la méthode de Sanger réside dans le fait que chaque ddNTP émet un signal fluorescent différent, de sorte que la présence d'un ddNTP au terminus peut être enregistrée sur un ordinateur (voir Figure 2). La réaction est configurée de sorte qu'un ddNTP fluorescent soit présent à chaque position du brin d'ADN (c'est-à-dire que chaque taille possible de brin d'ADN est présente) afin que chaque nucléotide du brin puisse être déterminé. Un programme informatique peut alors compiler les données dans un graphique coloré montrant la séquence déterminée.

Dans le passé, la séparation des brins d'ADN par électrophorèse était une étape longue, nécessitant l'utilisation de radio-isotopes pour le marquage des ddNTP. C'était loin d'être négligeable, car quatre réactions de séquençage différentes étaient nécessaires (une pour chaque ddNTP) et le gel de séquençage résultant devait être analysé manuellement. Aujourd'hui, les marqueurs fluorescents et les nouvelles avancées de l'électrophorèse sur gel ont rendu le séquençage de l'ADN non seulement rapide et beaucoup plus précis, mais aussi presque entièrement automatisé, y compris la lecture de la séquence finale.


Figure 2. Un électrophérogramme d'une réaction de séquençage terminée. Au fur et à mesure que les fragments de la réaction de séquençage sont résolus par électrophorèse, un laser lit la fluorescence de chaque fragment (bleu, vert, rouge ou jaune) et compile les données en une image. Chaque couleur, ou intensité de fluorescence, représente un nucléotide différent (par exemple, le bleu pour C) et révèle où se trouve ce nucléotide dans la séquence.

Bien que la méthode de Sanger soit la méthode acceptée pour le séquençage de l'ADN, on ne peut pas séquencer un génome complet en utilisant cette méthode seule. La raison principale en est que, à mesure que les morceaux d'ADN grossissent, la résolution de deux morceaux par une base devient pratiquement impossible [6]. En fait, seulement environ 1000 bases peuvent être séquencées avec précision, loin des 50 à 250 millions de bases qui composent un chromosome humain. De plus, comme indiqué ci-dessus, une amorce de séquence connue est requise pour chaque réaction de séquençage. Ainsi, on ne peut pas prendre n'importe quel morceau d'ADN et "juste le séquencer". Un point de départ connu, et donc une certaine connaissance de la séquence, est nécessaire pour commencer la réaction. Pour contourner ce problème, l'ADN est généralement découpé en morceaux plus petits et plus faciles à gérer, puis placé dans un petit morceau circulaire d'ADN appelé plasmide ou vecteur de clonage (un processus généralement appelé clonage). La séquence du vecteur de clonage est connue et permet donc de séquencer tout morceau d'ADN qui y est introduit.

Avec ces idées en tête, les scientifiques ont entrepris de concevoir des méthodes pour rendre possible le séquençage d'un génome entier. Ce n'est pas une mince affaire quand on sait que le génome humain contient environ trois milliards de bases qu'il a fallu séquencer.

La première méthode de séquençage d'un génome, employée par le projet du génome humain financé par l'État, consiste à cloner un gros morceau d'ADN en morceaux plus petits appelés sous-clones. Avec l'utilisation de marqueurs génétiques connus (c'est-à-dire des caractéristiques physiques qui ont été attribuées à des zones spécifiques d'un chromosome), une carte simple et mal résolue de l'emplacement des sous-clones sur un chromosome est préparée. Cela permet de placer les sous-clones dans un ordre basé sur la structure du chromosome. Chaque sous-clone individuel est ensuite séquencé. La séquence résultante est utilisée pour créer une nouvelle amorce pour séquencer les régions flanquantes de l'ADN qui n'ont pas pu être séquencées lors du premier cycle de réactions. This process is continued until the sequences overlap (are contiguous). These contiguous sequences can then be assembled into a group of overlapping sequences, termed a contig. As this method progresses, larger and larger contigs will be produced, until a single ordered contig of the genome is achieved.

A common named for the above method is a ‘top-down’ approach (See Figure 3). If you look at a jigsaw puzzle as an analogy, a top-down approach is similar to starting the puzzle form one corner and working your way down and across in an ordered manner, always building on the last piece that was added. The advantages of this method are that each individual clone can be sent to different people for sequencing and that each stretch of DNA only needs to be sequenced once, as the DNA has already been mapped. However, a large disadvantage to this method is the slow process of sub-cloning and mapping of the clones, requiring significant human manipulation.


Figure 3. The top-down sequencing method. In this approach, a large source clone is first physically mapped before it is broken up into smaller sub-clones. This is done by taking the fragmented source clone and sequentially ordering the sub-clones, based on their original order in the source clone. This requires a physical map of the source clone to work, meaning you need to know that #1 (blue) comes before #2 (yellow) in the source clone. Once the clones have been ordered, each sub-clone is sequenced, and using the overlapping sequences of neighbouring sub-clones, the whole piece is put together.

A second method is the so-called ‘shotgun’ method of sequencing (see Figure 4), which was employed by the privately funded company Celera Genomics to sequence the human genome. This method was the subject of a good deal of debate, as it is relatively crude in comparison to the method employed by the Human Genome Project. It involves each contig being sub-cloned into smaller fragments in the same way as the top-down approach, with the exception that a physical genetic map is not created. Instead, each clone is sequenced first, and then overlapping sequences are joined together to create the contig. In other words, random clones are sequenced (as they are not ordered) in the hopes that overlapping sequences will be found to piece together the contiguous sequence.


Figure 4. Shotgun Sequencing. A relatively crude method of sequencing, shotgun sequencing does not produce a physical map of the source clone first. Instead, the source clone is fragmented, producing a random mixture, and a random sub-clone (i.e. an unordered sequencing clone of blue, yellow, black, red or green) is selected for sequencing by the Sanger method. To ensure that that the whole source clone has been sequenced, this stretch of DNA must be sequenced numerous times (represented by multiples of a single coloured sub-clone) to produce an ordered overlapping sequence. Gaps in this process will occur where a sub-clone is not fully sequenced (blue coloured sub-clone).

Using the jigsaw puzzle analogy again, the shotgun method is similar to starting with random pieces of the puzzle and looking for pieces that fit to it, regardless of where in the puzzle the piece originated from. One major problem with this method is uncertainty. You lack an initial map to guide you, making it difficult to be sure that the entire contig is represented. To get around this problem, the same contig needs to be sequenced many times to ensure that the probability of missing a sub-clone is less than 1%. After which the gaps between contigs must still be filled in, usually through the use of a technique called chromosome walking. The shotgun method is advantageous in that the laborious process of mapping and sub-cloning, requiring human hands, is eliminated. So, while this method requires much more sequencing compared to the first, it proves to be much more economical and faster due to the sequencing reactions being virtually fully automated and the sequences being assembled by computer programs.

When is a Genome Sequence Finished?

When it was announced that the first draft of the human genome was completed [3], it was commonly misreported by many media outlets that the human genome was sequenced. In fact, much more sequencing needs to be done to finish the job. This is because the genome sequence was still in the ‘draft’ stage, meaning that the genome had been sequenced about 4 to 5 times, and the data organized into fragments that are approximately 10,000 bases in size.

To prepare a high quality sequence of the human genome, potential errors in the sequence must still be statistically removed. This is done primarily by closing the gaps between contigs with additional sequencing, ultimately reducing ambiguity and ensuring that there is at most 1 error in every 10,000 bases. The finished version will require that a chromosome be sequenced about 9 to 10 times. Furthermore, not all regions of the chromosome can be cloned, resulting in them being unavailable for sequencing. Luckily, these regions, called heterochromatin, consist of telomeres and centromeres (the tips and centre of the chromosome, respectively), which are rich in repeating sequences (making cloning very difficult) and low in genes. Most of the genes reside in euchromatin, the part of the chromosome that can be sequenced. Therefore, a complete genome sequence actually refers to a high quality sequence of an organism’s euchromatin.

Benefits of Sequencing Projects

Why do we want to determine the A’s, T’s, C’s, and G’s of an organism?

When you get right down to it, a genome is the blueprint of how an organisms functions. If we are interested in understanding the complexity of life (and every biologist and doctor is), having a genome to study is a big step forward.

Scientists are revving up their computers to study genomes and the benefits of this are already being seen. Take the field of medicine as an example. As the population begins to become increasingly health conscious, more attention is being paid to the ongoing research in the medical sciences. As the chromosome maps have become more detailed, genes associated with genetic diseases such as Alzheimer’s disease [7] and familial breast cancer [8] have been identified. This has led to the hope that these diseases can be identified early and that new drugs and treatments can be discovered.

Genome projects also give us insight into other organisms, which has many applications in the industrial sector [9]. Increasing knowledge about domesticated plants and animals can reduce costs in agriculture, for example, by reducing the need for pesticides. Microbes are also an important resource. It has already been shown that bacteria can be used to clean up toxic chemical and oil spills and aid in the clean-up of sewage and waste. Bacteria have also been used to replace many industrial processes that require large amounts of toxic reagents or harsh conditions, making many workplaces, and their surrounding environment, much safer.

Final Words: Where is Genome Science Taking Us?

Even though the numbers of completed genomes is ever increasing, the real work is just beginning. New advances in technology must accommodate the increasing amount of data, as the information available to researchers can be overwhelming. Already new fields of science have been created by the sequencing of genomes. An example of this is functional genomics, which aims to look at the practical aspects of sequenced genomes by looking at genome-wide responses to various elements.

Finally, a whole can of ethical issues have been opened as researchers have begun patenting genes in the hopes of financial reward. Is it right to patent genes that are present in all humans? Who controls the genetic information? Can the use of genetic information oppress and control people, like in the movie Gattaca? Only education, debate and time will produce these answers.

Texts Consulted and Additional Reading

1. Dale JW, von Schantz M. 2002. From Genes to Genomes: Concepts and Applications of DNA Technology. West Sussex, England / New York: Wiley. 360p.

2. Town C, ed. 2002. Functional Genomics. Dordrecht/Boston: Kluwer Academic. 200p.

3. Caporale LH. 2003. Darwin in the Genome: Molecular Strategies in Biological Evolution. New York : McGraw-Hill. 245p.

4. Rangel P, Giovannetti J. 2002. Genomes and databases on the Internet: A Practical Guide to Functions and Applications. Wymondham: Horizon Scientific. 223p.

5. Primrose SB, Twyman RM. 2003. Principles of genome analysis and genomics. Malden, MA: Blackwell Pub. 263p.

1. Two Bacterial Genomes Sequenced. 1995. Human Genome News, May-June 7(1).

2. Genome-Scale Science. National Centre for Biotechnology Information:

3. The Genome International Sequencing Consortium. 2001. Initial sequencing and analysis of the human genome. Nature 409: 860-921.

4. Griffiths et al, eds. 2002. Modern Genetic Analysis: Integrating Genes and Genomes. New York : W.H. Freeman and Co. 736p.

6. Alphey L. 1997. DNA Sequencing: From Experimental Methods to Bioinformatics. New York : Springer. 206p.

7. Lahiri DK, et al. 2003. A Critical Analysis of New Molecular Targets and Strategies for Drug Developments in Alzheimer’s Disease. Curr Drug Targets 4(2): 97-112.

8. Marsh D, Zori R. 2002. Genetic Insights into Familial Cancers — Update and Recent Discoveries. Cancer Lett 181(2): 125-64.

9. Goujon P. 2001. From Biotechnology to Genomes: The Meaning of the Double Helix. NJ: World Scientific. 728p.