Informations

Coefficient de parenté pour un locus sur le chromosome Z

Coefficient de parenté pour un locus sur le chromosome Z



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Je sais donc que le système de détermination ZW est l'équivalent de XY chez les oiseaux. De plus, je sais que le coefficient de parenté entre frères et sœurs pour le chromosome X est de 0,5, donc je suppose que le coefficient de parenté entre frères et sœurs pour le chromosome Z est le même ??


Coefficient de parenté pour un locus sur le chromosome Z - Biologie

Mariages consanguins (les accouplements, si des non-humains sont en discussion) sont ceux entre personnes apparentées, définis simplement comme ceux qui partagent un ancêtre commun). Dans les tableaux généalogiques, ceux-ci sont indiqués par lignes doubles entre les symboles.

Les Appartenance ( r ) de deux individus consanguins est la fraction d'allèles qu'ils partagent à tous les loci. Pour cela, nous distinguons le partage par allélique Etat et par identité Cela peut être estimé par l'analyse de n'importe quel locus. Tout parent / progéniture combinaison partagera exactement 1/2 de leurs allèles à n'importe quel locus : la progéniture hérite de l'un ou l'autre allèle de chacun des deux parents : (1/2)(1/2) + (1/2)(1/2) = 1/2. Ceci est vrai pour un échantillon de tout lieu. Tout deux frères et sœurs devraient également partager 1/2 de leurs allèles sur tous les loci, mais pas nécessairement à n'importe Célibataire lieu. Par exemple, les frères et sœurs #3 & #4 peuvent chacun recevoir l'une des quatre paires d'allèles des parents : UNE1UNE3, UNE 1UNE4, UNE2UNE 3, ou UNE 2 UNE 4. Il y a donc 16 relations alléliques possibles entre frères et sœurs à n'importe quel locus (voir Table). Dans quatre d'entre eux, les deux allèles sont identique, (r = 1) dans quatre allèles sont distinct (r = 0) , et dans huit, seul l'allèle est partagé (r = 0.5) : en moyenne, attendu r = [(4)(1.0) + (4)(0.0) + (8)(0.5)] / (16) = 8/16 = 1/2. Pour tout petit échantillon de loci, mesuré r peut s'écarter de son attente.

C'est l'une des raisons pour lesquelles les estimations de la parenté génétique à partir du commerce "ADN.com" ADN les tests peuvent être ambigus. Par exemple, parce que 4e & 5e les cousins ​​ont r = 1/64 et 1/128, respectivement, le attente de partage d'allèles à travers 512 les lieux seraient 8 vs 4, respectivement. Partage observé à 3

9 loci ne permettrait pas de faire une distinction statistique entre ces degrés de parenté.


1/3
1/4
2/3
2/4
1/3
1
0.5
0.5
0
1/4
0.5
1
0
0.5
2/3
0.5
0
1
0.5
2/4
0
0.5
0.5
1

Les progéniture d'un accouplement consanguin sont décrits comme inné . Les coefficient de consanguinité ( F ) pour un individu consanguin est le attente que l'individu a deux allèles identique par descendance ( MICI ) en un lieu donné. Les allèles sont identiques par descendance s'ils sont copies génétiques du même allèle de l'ancêtre commun des parents consanguins. Ces probabilités peuvent être calculées en suivant chaque allèle sur plusieurs générations. [La notion de MICI est bien antérieur à la découverte de ADN réplication, toutefois MICI se produit à la suite d'une ADNdb molécule se répliquant le long de deux lignées distinctes].

Par exemple, nous pouvons calculer la probabilité que l'individu #5 , le produit d'un accouplement entre frères et sœurs, a deux allèles au locus A qui sont identique par descendance comme F = 1/4 = 0.25 . D'autres coefficients de parenté et de consanguinité pour les accouplements consanguins typiques sont indiqués ci-dessous.

Consanguinité et La consanguinité sont souvent confondus. Parce que de nombreux humains existent et se marient dans des populations finies plus ou moins fermées, deux partenaires peuvent avoir un ancêtre commun plus ou moins éloigné et sont donc consanguin cousins ​​éloignés. Leur progéniture aurait (en principe) une valeur calculable F. Toutes les populations sont dans une certaine mesure "inné, tel que mesuré par la moyenne F sur tous les individus d'une population, et qui est inversement proportionnelle à sa taille N. "La consanguinité" devient d'un intérêt particulier lorsque le taux de mariages entre personnes proches est plus élevé que prévu. Cela peut se produire délibérément dans les sociétés où mariages frères et sœurs ou cousins ​​germains sont encouragés, comme cela arrive parfois pour des raisons religieuses, ou pour conserver des biens dans la même famille. Les sociétés occidentales découragent souvent les mariages entre cousins ​​germains, mais n'attachent aucune responsabilité aux mariages entre cousins ​​au deuxième degré ou au degré supérieur, la plupart des gens peuvent ignorer l'existence de cousins ​​au quatrième ou au cinquième degré.

DEVOIRS : Spectacle graphiquement cette individuel #10, le produit d'un mariage cousin germain, a F = 1/16.

Coefficients de parenté ( r ) et de consanguinité ( F ) pour les parents et les accouplements consanguins


Conséquences de la relation conjugale sur la condition physique dans 46 sociétés à petite échelle

Les normes sociales qui régissent les décisions en matière de reproduction et de mariage génèrent des variations interculturelles impressionnantes dans la prévalence des mariages entre parents. Dans certaines sociétés, les mariages entre parents sont la norme et cette consanguinité crée des réseaux de parenté intensifs concentrés au sein des communautés. Dans d'autres, en particulier les sociétés de cueilleurs, la plupart des mariages sont entre des individus plus éloignés généalogiquement et géographiquement, ce qui génère un plus grand nombre de parents et d'affinités de moindre parenté dans des réseaux de parenté plus étendus répartis sur plusieurs communautés. Ici, nous étudions la conséquence sur la fitness des mariages entre parents dans un échantillon de 46 sociétés à petite échelle (12 439 mariages). Les résultats montrent que certaines sociétés non cueilleuses (y compris les horticulteurs, les agriculteurs et les éleveurs), mais pas les cueilleuses, ont des sociétés de parenté intensive où les résultats de la condition physique (mesurés par le nombre d'enfants survivants dans les généalogies) culminent à des niveaux généralement élevés de parenté conjugale. En revanche, les systèmes de parenté étendus des butineuses ont de moins bons résultats en termes de condition physique à des niveaux élevés de parenté conjugale. Dans l'ensemble, les sociétés avec des niveaux plus élevés de consanguinité ont montré une relation plus positive entre la forme physique et la parenté conjugale.

1. Introduction

Les sociétés humaines varient considérablement dans les normes sociales qui affectent le mariage et la parenté. Par exemple, la prévalence des mariages entre cousins ​​germains varie de zéro dans de nombreuses sociétés, en particulier les cueilleurs, à plus de 50 % dans certaines sociétés sans cueilleurs [1]. Bugos [2] a défini les systèmes de parenté intensive comme ces sociétés qui mettent l'accent sur les normes sociales des mariages de parenté et des alliances qui créent des réseaux denses et convergents de parenté corésidente. Il existe un certain nombre de traits culturels corrélés associés aux systèmes de parenté intensifs qui incluent plus de mariages de parenté [3], l'arrangement matrimonial [4], les fissions linéaires [5], l'endogamie [6], la polygamie [1] et une relation de groupe plus élevée [7] .

Dans les systèmes de parenté intensifs, des pics de fitness ont été observés pour les mariages de cousins ​​(de proche à lointain) pour les Yanomamo [8], les Ayoreo [2] et l'Islande historique [9], avec des preuves mitigées en Inde [10] et dans plusieurs autres pays [ 11]. Il s'agit du résultat d'optimalité attendu étant donné que les décisions de mariage reflètent un compromis entre les avantages sociaux du mariage de parents et les risques associés à l'héritage d'allèles récessifs délétères (une « zone Boucle d'or » de partenaires optimaux). Les mariages familiaux créent des alliances entre les lignages [12,13] pour créer un intérêt partagé entre des réseaux de parents et d'affins qui se chevauchent étroitement. Le cas échéant, les mariages de parents proches peuvent réduire la dilution potentielle de la richesse familiale héritée telle que la terre et le bétail dans les sociétés non-cueilleuses [14]. La manifestation la plus intense de ceci se trouve dans les mariages de parents proches des familles royales [15]. De plus, les mariages de parents proches établissent des groupes de parenté bien définis qui peuvent être bien adaptés à la défense des ressources, et les non-cueilleurs ont des taux de violence significativement plus élevés que les sociétés de cueilleurs [16].

À l'autre extrême se trouvent des systèmes de parenté humains étendus associés à la subsistance des fourrageurs. De nombreux butineurs ont une appartenance à un groupe fluide [17] et des déplacements fréquents à travers le paysage [18,19] pour exploiter une diversité de ressources alimentaires inégalement réparties [20]. Dans ces sociétés, les mariages sont souvent entre des individus non apparentés ou des parents plus éloignés généalogiquement vivant dans des communautés éloignées [21]. Le mariage d'individus non apparentés ou apparentés augmente le nombre total possible de parents et d'affinités en incluant un réseau plus large d'individus. Un réseau de parenté étendu peut être plus important dans des environnements imprévisibles et pour les populations nomades étant donné qu'il offre une pléthore d'options résidentielles qui peuvent s'avérer vitales en temps de crise [2,20,21].

Contrairement aux exemples de systèmes intensifs ci-dessus, nous ne connaissons aucune étude ayant examiné les résultats de la condition physique pour les mariages de parents dans les sociétés de cueilleurs, probablement en raison d'un manque de données. Nous avons compilé des généalogies interculturelles pour tester la proposition d'optimalité selon laquelle les butineuses présentent des pics de fitness à de faibles niveaux de parenté conjugale. De plus, nous avons testé si les différences entre les modèles de fitness selon la relation conjugale chez les butineurs et les non-fourrageurs pouvaient s'expliquer par des différences sociétales en matière de consanguinité, sans doute la meilleure mesure de parenté intensive [1].

2. Matériel et méthodes

Les généalogies proviennent de 46 sociétés à petite échelle disponibles à partir d'ensembles de données en ligne sur KinSources (http://kinsources.net) avec l'ajout de butineuses Ache du Paraguay [22] (toutes les sociétés, les tailles d'échantillon et les valeurs de consanguinité apparaissent dans le matériel électronique supplémentaire) . L'échantillon est également divisé en butineuses et non butineuses et contient un total de 12 439 actes de mariage. Les populations principalement pastorales, comme les nomades touaregs et turcs, ont été incluses dans la catégorie des non-cueilleurs avec d'autres sociétés agricoles et horticoles. Les généalogies varient en profondeur de quatre à 16 générations avec une moyenne de 6,5. Le calcul de la parenté conjugale pose le problème que différentes études ont des degrés variables de qualité dans les informations généalogiques disponibles, de sorte que la profondeur de la généalogie en nombre de générations est ajoutée aux modèles de régression en tant que variable de contrôle de qualité.

Les généalogies permettent d'estimer le coefficient de co-ascendance entre deux individus, ou la probabilité que deux allèles au même locus tirés au hasard soient identiques par filiation [23]. Le coefficient de parenté (r) entre époux, ou parenté conjugale, est le double du coefficient d'ascendance, et le coefficient de consanguinité d'un individu est le coefficient de co-ascendance des parents. Ici, le coefficient moyen de consanguinité est calculé pour chaque généalogie comme la consanguinité moyenne de tous les individus. Les calculs des coefficients ont été effectués dans le logiciel Descent d'Ed Hagen (http://itb.biologie.hu-berlin.de/

hagen/Descente/). Les quatre catégories suivantes ont été utilisées pour catégoriser la parenté entre conjoints : [0,0.03125), [0.03125,0.0625), [0.0625,0.125) et [0.125,1). Ce sont des seuils de 1/32, 1/16 et 1/8 niveaux de parenté. Cette dernière catégorie représente une parenté supérieure ou égale aux cousins ​​germains.

Des modèles de régression à effets mixtes ont été estimés à l'aide du package lme4 [24] dans R. Le résultat était le log naturel du nombre d'enfants survivants de chaque couple (c'est-à-dire les enfants qui apparaissaient dans les généalogies, nous avons d'abord ajouté 1 à cette valeur car le log de 0 est indéfini), et le prédicteur clé était le lien de parenté avec le conjoint (le groupe le plus bas, [0,0,03125), a été désigné comme groupe de référence). Les modèles contrôlaient le nombre de fois où chaque conjoint s'était produit dans les registres de mariage et la profondeur générationnelle de la généalogie de la société. Pour contrôler les effets générationnels, spécifiques à la famille et spécifiques à la société, chaque couple a été imbriqué dans la mère et le père de chaque conjoint (les individus avec des codes manquants pour une mère et/ou un père dans la généalogie ont été codés comme ayant une mère et/ou un père uniques père), et les parents des époux étaient nichés dans des sociétés.

Nous avons d'abord exécuté le modèle en incluant uniquement les non-fourrageuses, et deuxièmement en incluant uniquement les butineuses. Pour tester si ces modèles différaient significativement selon le type de subsistance, nous avons estimé un modèle qui incluait toutes les observations, avec les prédicteurs supplémentaires du type de subsistance et son interaction avec la relation conjugale. Enfin, pour tester si les différences de subsistance pouvaient être attribuées aux niveaux de consanguinité au sein des sociétés, nous avons estimé un modèle complet, qui a ajouté la consanguinité et son interaction avec la parenté conjugale au modèle précédent.

3. Résultats

(a) Non-cueilleurs

La taille des échantillons et les estimations des paramètres pour les non-cueilleurs apparaissent dans les colonnes de gauche du tableau 1, et la valeur adaptative moyenne par lien de parenté apparaît dans la figure 1. Chez les non-cueilleurs, les mariages entre personnes ayant un lien génétique inférieur à 1/32 commun. Cependant, les couples des trois autres groupes de parenté avaient significativement Suite enfants survivants que les couples de la catégorie de parenté la plus faible.

Tableau 1. Estimations des paramètres pour les effets de la relation conjugale sur la condition physique par type de subsistance. (Les mariages mari-femme sont le nombre de mariages dans lesquels chaque conjoint du couple a été impliqué. *p < 0.05 **p < 0,001.)

a Effet principal de la subsistance, ou différence entre les non-cueilleurs et les butineurs au niveau de parenté le plus bas.

Figure 1. Forme physique moyenne selon le lien de parenté avec le conjoint et le type de subsistance. Les barres d'erreur sont des erreurs standard de la moyenne. (Version en ligne en couleur.)

(b) Fourrageuses

La taille des échantillons et les estimations des paramètres pour les butineuses apparaissent dans les troisième et quatrième colonnes du tableau 1. Comme on le voit pour les non-cueilleuses, les mariages de butineuses entre individus ayant une parenté génétique inférieure à 1/32 étaient également les plus courantes. Cependant, cette tendance était beaucoup plus prononcée chez les butineuses : le rapport des mariages dans la classe de parenté la plus faible aux mariages dans la classe de parenté la plus élevée était de 7 : 1 chez les non-cueilleurs, contre 77 : 1 chez les butineuses. Le modèle de fitness à travers les bacs de parenté différait également pour les butineuses. Plus précisément, les couples dans la catégorie de parenté la plus élevée avaient significativement moins enfants survivants que les couples dans la catégorie de parenté la plus faible. Aucune des classes de relation de condition physique intermédiaire ne différait significativement de la classe de relation la plus faible.

(c) Comparer les non-fourrageurs aux butineuses

Les résultats du modèle qui a testé les différences entre les régimes de subsistance apparaissent dans la dernière colonne du tableau 1. L'effet principal de la subsistance n'était pas significatif dans ce modèle, indiquant que les butineuses et les non butineuses dans la catégorie de parenté la plus faible ne différaient pas dans leur fitness . Cependant, l'interaction entre le niveau de subsistance et la catégorie de parenté la plus élevée était statistiquement significative, ce qui indique que la condition physique est plus élevée pour les non-cueilleurs à des niveaux plus élevés de parenté conjugale.

(d) Le rôle de la consanguinité

Lorsque la consanguinité au niveau de la société et son interaction avec la parenté conjugale ont été ajoutées au modèle précédent, aucune des interactions entre la parenté conjugale et le niveau de subsistance n'est restée statistiquement significative (tableau 2), ce qui indique que les différences dans la relation entre la parenté conjugale et la condition physique étaient pleinement expliquées. par les différences sociétales en matière de consanguinité. Toutes les interactions entre la parenté et la consanguinité au niveau de la société étaient positives et statistiquement significatives (tableau 2), indiquant que des niveaux plus élevés de consanguinité sociétale étaient associés à une relation plus positive entre la parenté conjugale et la forme physique, même après contrôle du type de subsistance. La relation entre la parenté conjugale et l'aptitude pour chaque quartile de consanguinité au niveau de la société est illustrée à la figure 2. La relation entre la parenté conjugale et l'aptitude est positive pour le quartile le plus élevé des valeurs de consanguinité et négative pour le quartile le plus bas des valeurs de consanguinité.

Tableau 2. Estimations des paramètres pour les effets de la parenté conjugale sur la condition physique selon le type de subsistance et la consanguinité. (Les mariages mari-femme sont le nombre de mariages dans lesquels chaque conjoint du couple a été impliqué. **p < 0,001.)

Figure 2. Forme physique moyenne selon le lien de parenté avec le conjoint et le quartile de consanguinité au niveau de la société. Les barres d'erreur sont des erreurs standard de la moyenne. (Version en ligne en couleur.)

4. Discussion

Nous constatons que les résultats de la condition physique augmentent avec la relation conjugale pour les non-cueilleurs, mais diminuent pour les butineurs. L'effet modérateur de la subsistance pourrait s'expliquer pleinement par les différences de valeurs de consanguinité au niveau de la société. Plus précisément, la relation entre la parenté conjugale et la forme physique était positive pour les sociétés avec les niveaux de consanguinité les plus élevés (sociétés avec des systèmes de parenté intensifs) et négative pour les sociétés avec les niveaux de consanguinité les plus bas (systèmes de parenté étendus).

Compte tenu de la relation positive entre la parenté conjugale et la forme physique chez les non-cueilleurs, on peut se demander pourquoi le mariage entre cousins ​​germains n'est pas le type modal de mariage dans davantage de sociétés. Une possibilité est la dépression de consanguinité chez les générations futures : cette étude n'a pas mesuré la relation entre la parenté conjugale et le nombre de petits-enfants, mais une étude précédente a révélé que les enfants de couples apparentés au niveau de cousins ​​germains ou plus ont des niveaux de survie et de reproduction inférieurs. 9]. De plus, des facteurs autres que les liens familiaux influencent également les décisions des individus et de leurs parents concernant le mariage [22,25]. Quoi qu'il en soit, la relation conjugale est clairement influencée par les normes sociales. Le rapport observé de 7 : 1 entre les couples dans la catégorie de parenté la plus faible et les couples dans la catégorie de parenté la plus élevée chez les non-cueilleurs est probablement beaucoup plus faible que le rapport entre les conjoints potentiels non apparentés et les cousins ​​​​de sexe opposé appropriés à l'âge du mariage.

Une autre explication qui pourrait expliquer au moins certaines des différences intersociétales dans la relation entre la parenté conjugale et la forme physique est que les personnes ayant de bonnes perspectives de mariage peuvent avoir un potentiel de reproduction plus élevé. Par exemple, les conjoints potentiels avec le plus grand nombre de ressources peuvent être favorisés pour les mariages entre cousins ​​dans les sociétés avec des systèmes de parenté intensifs. L'endogamie pourrait n'être stratégique que pour les individus du statut social le plus élevé, pour les descendants desquels l'endogamie pourrait être le plus susceptible de maximiser la richesse et les gènes associés à la réussite sociale [26]. Ainsi, certaines des différences d'aptitude selon le lien de parenté peuvent ne pas être attribuables au lien de parenté en soi, mais aux différences individuelles qui affectent à la fois la condition physique et les relations conjugales, comme la richesse.

Enfin, même si l'échantillon utilisé dans cette étude était le plus grand et le plus diversifié de tous les échantillons utilisés pour examiner la relation entre la relation conjugale et la condition physique, il n'était certainement pas exhaustif. Nous encourageons d'autres chercheurs à tester si nos découvertes sont également valables dans d'autres sociétés traditionnelles.


Définitions et notations

Nous définissons un relation par paire être un triple ((a,b,>)) , où (>) est un pedigree connecté, et une et b sont (pas nécessairement distincts) membres de (>) . Fondateurs de (>) , c'est-à-dire les membres dont les parents ne sont pas inclus dans (>) , sont supposés non apparentés et non consanguins, sauf indication contraire explicite. allèles homologues de une et b sommes identique par descendance (IBD) s'ils descendent du même allèle porté par un ancêtre commun de une et b dans (>) . Il convient de souligner que la notion d'IBD, et par conséquent tous les coefficients à définir ci-dessous, dépendent du pedigree du contexte. Nous limitons notre attention aux loci diploïdes.

La mesure la plus simple de la parenté entre deux membres de pedigree une et b est le coefficient de parenté (varphi _) , définie comme la probabilité qu'un allèle aléatoire de une est IBD avec un allèle aléatoire de b au même endroit. De plus, si une et b avoir un enfant c, les coefficient de consanguinité (f_c) est le coefficient de parenté de ses parents, c'est-à-dire (f_c = varphi _) . De manière équivalente, (f_c) peut être défini comme la fraction attendue de cdes autosomes qui sont autozygote, c'est-à-dire où les allèles paternel et maternel sont IBD. Le coefficient de parenté/consanguinité a été étudié pour la première fois par Wright (1922), qui a fourni les formule de chemin:

La sommation s'étend sur tous les ancêtres communs s de une et b, et toutes les paires (vous, v) de chemins généalogiques non chevauchants de s à une et b respectivement, avec des longueurs de chemin |vous| et |v|.

Le triangle IBD. Chaque axe va de 0 à 1. Abréviations des relations : FC = cousins ​​germains G = grands-parents-petits-enfants H = demi-frères et sœurs MZ = jumeaux monozygotes PO = parent-enfant S = frères et sœurs germains U = avunculaire (p. ex. oncle-nièce) UN = non apparenté

Pour les individus non consanguins une et b leur Coefficients IBD (kappa =(kappa _0, kappa _1, kappa _2)) sont définis comme les probabilités de partager respectivement 0, 1 et 2 allèles IBD, à un locus autosomique aléatoire. Puisque (kappa _0 + kappa _1 + kappa _2=1) , le triple (kappa ) peut être représenté comme un point ((kappa _0, kappa _2)) dans le Triangle MICI représenté sur la figure 2, défini par (kappa _0, kappa _2ge 0) et (kappa _0+kappa _2le 1) . Thompson (1976) a découvert que toutes les relations entre individus non consanguins satisfont à l'inégalité (kappa _1^2 ge 4kappa _0kappa _2) , définissant ainsi une région inadmissible du triangle, représentée en gris sur la figure. Un point dans le triangle IBD est appelé admissible s'il n'est pas dans la région inadmissible. (Notez que les points limites sont admissibles.) La figure 2 comprend l'emplacement de certaines relations de consanguinité communes.

Les états d'identité condensés de Jacquard et les coefficients correspondants. Chaque état représente un modèle de MII entre les allèles des individus une et b en un seul lieu. Les allèles IBD sont connectés avec un segment de ligne

Une caractérisation complète du partage attendu d'IBD à un seul locus, de deux individus quelconques, est donnée par le coefficients d'identité condensés (varDelta _1, dotsc , varDelta _9) , attribuable à Jacquard (1966). Ce sont les fréquences relatives attendues de la états d'identité condensés montré dans la Fig. 3. Les neuf états représentent les modèles possibles d'IBD entre les quatre allèles portés par les deux individus, lorsque les allèles au sein de chaque individu ne sont pas ordonnés. Il est important de noter que lorsque les deux individus sont non consanguins, les six premiers états sont impossibles et les trois autres correspondent aux coefficients IBD dans l'ordre inverse : ((kappa _0, kappa _1, kappa _2) = (varDelta _9, varDelta _8, varDelta _7)) .


MODÈLES STATISTIQUES

Pour les échantillons de population dans lesquels l'ascendance des allèles individuels est inconnue, le moyen le plus général de décrire la parenté d'un individu à un autre est en termes de neuf modes d'identité décrits par J acquard (1974) (figure 1). Le degré de parenté est quantifié par un ensemble de coefficients Δ= (Δ1,2. ??9), dont chacun représente la probabilité des quatre allèles à un seul locus chez deux individus diploïdes partageant le modèle particulier correspondant d'identité par filiation. Dans une grande population non consanguine, seulement Δ7,8, et9 sont différents de zéro par conséquent, dans une telle population, tout modèle de relation entre deux individus peut être décrit par cet ensemble de trois coefficients. Le résumé le plus couramment utilisé du degré de parenté est le coefficient d'ascendance (J acquard 1974 L ynch et W alsh 1998), θ = Δ 1 + 1 2 ( Δ 3 + Δ 5 + Δ 7 ) + 1 4 Δ 8 , (1) qui quantifie la probabilité que deux individus produisent une progéniture consanguine s'ils s'accouplent. Ce dernier coefficient joue un rôle central dans l'estimation de l'héritabilité et de la variance génétique additive (F alconer 1981 L ynch et W alsh 1998) et dans la définition de la fitness inclusive (H amilton 1964a,b). Ainsi, les estimateurs de parenté (Q ueller et G oodnight 1989 L i et al. 1993 R itland 1996a L ynch et R itland 1999 W ang 2002) se concentrent principalement sur θ ou r = 2θ même s'il y a une perte d'information dans le processus de transformation de l'ensemble complet des paramètres Δ en une seule quantité θ. Pour le développement d'un estimateur de vraisemblance de la parenté, l'ensemble complet sous-jacent de paramètres est utilisé par la suite θ (ou r) peut être calculé à partir de l'équation 1 si nécessaire.

— Modes d'identité par filiation entre deux individus. Dans chaque figure, les deux points supérieurs représentent les deux allèles d'un individu, tandis que les deux points inférieurs représentent les deux allèles du deuxième individu. Les lignes indiquent les allèles identiques par descendance.

Modèles de vraisemblance : Les estimateurs de vraisemblance sont basés sur un modèle de probabilité des données échantillonnées. Dans ce cas, l'unité de prélèvement est un couple d'individus dont chacun a été dosé génétiquement à L loci. L'estimateur décrit ici est basé sur l'hypothèse de loci marqueurs séparés indépendamment. La vraisemblance pour l'échantillon global est donc simplement le produit des vraisemblances à travers les loci.

Le modèle de probabilité de base des allèles échantillonnés à un seul locus diploïde est bien connu (T hompson 1975). Habituellement, il n'est donné que pour le cas de grandes populations non consanguines où seuls trois modes de parenté (S7, S8, et S9) sont possibles. Cependant, la structure du modèle est beaucoup plus claire dans sa forme générale et il est applicable à toute la gamme des structures de population. Comme base d'une généralisation plus poussée, cela justifie donc de décrire explicitement le modèle complet de vraisemblance à un seul locus pour les neuf coefficients de parenté.

Il existe neuf modèles distincts d'identité dans l'état pour les quatre allèles échantillonnés en un seul locus chez deux individus. Le tableau 1 les répertorie dans la deuxième colonne. A titre d'exemple, une paire d'individus chacun homozygote pour l'allèle UNE1 représentent le mode d'identité dans l'état J 1 , alors que deux individus de génotypes UNE1UNE1 et UNE1UNE2 représentent le mode d'identité dans l'état J3.

Étant donné qu'une paire d'individus est connue pour être apparentée selon le mode d'identité par filiation Sj, la probabilité de chaque modèle d'identité dans l'état Sje dépend des fréquences alléliques. Par exemple, si deux individus non consanguins ont deux allèles identiques par descendance (S7), l'un ou l'autre des deux modèles d'identité dans l'état ( J 1 ou J 7 ) pourrait se produire, en fonction de l'échantillonnage des allèles réels au locus. Le premier, qui correspond aux deux allèles identiques par descendance ayant également le même état UNEje, se produit avec une probabilité p i 2 , alors que cette dernière, qui correspond à des UNEje et UNEj allèles, se produit avec probabilité 2pjepj. Le tableau 1 répertorie la probabilité d'observer chacun de ces modèles d'identité dans l'état conditionnée à ce que les deux individus soient apparentés selon chacun des modes possibles d'identité par filiation (Figure 1), Pr ( J i ∣ S j ) . A noter que ce tableau corrige une erreur typographique présente dans la formulation classique (T hompson 1975). R itland (2000) donne une notation plus compacte, qui peut être utile pour le calcul, qui couvre les trois colonnes les plus à droite du tableau 1, cependant, la compacité rend également la structure biologique du modèle moins apparente.

Rappelons que le jeu de paramètres Δ= (Δ1,2. ??9) correspondent aux probabilités de chaque mode d'identité par filiation et quantifient complètement le degré de parenté entre les individus. D'après T hompson (1975), la probabilité d'observer un modèle allélique particulier, J i , pour deux individus à un même locus, étant donné le degré de parenté Δ et la distribution des fréquences alléliques, est égale à la probabilité de Δ : L ( ) = Pr ( J i ∣ Δ ) = ∑ j Pr ( J i ∣ S j ) Δ j . (2) La vraisemblance de l'ensemble du réseau échantillonné de L loci est simplement le produit de l'équation 2 à travers les loci. Bien que chaque locus soit caractérisé par son propre ensemble de fréquences alléliques, le degré de parenté entre les deux individus (le paramètre dans l'équation 2) est constant à travers les loci car il représente la parenté globale du personnes l'un à l'autre.

Espace des paramètres : L'estimation de vraisemblance maximale de l'ensemble de est trouvée en recherchant dans l'espace des paramètres jusqu'à ce qu'un maximum soit trouvé. En général, une solution algébrique est impossible car des méthodes numériques sont utilisées. L'implémentation utilisée ici est basée sur une traduction de la méthode du simplexe (P ress et al. 1992), une technique d'optimisation de l'escalade, dans un ensemble de classes C++ (B. G. M illigan , données non publiées). Bien qu'il soit possible pour de telles méthodes d'identifier des maxima locaux plutôt que globaux dans la fonction de vraisemblance, les tracés de la surface de vraisemblance et l'évaluation de l'algorithme à partir de conditions initiales distinctes suggèrent qu'il est peu probable que des optima multiples existent, en accord avec les résultats analytiques de T. homson (1975).

Probabilité des modèles d'identité dans l'état des modes donnés d'identité par filiation Sj

Plusieurs possibilités existent pour définir l'espace des paramètres sur lequel l'optimisation sera effectuée. L'espace complet des paramètres est bien entendu à huit dimensions, correspondant aux neuf paramètres distincts Δj = Pr (Sj) contraint par le fait qu'ils s'additionnent à l'unité. L'objectif immédiat, cependant, est de considérer le cas d'une grande population non consanguine. Dans ce cas, seuls les trois derniers paramètres sont différents de zéro. Pour les besoins de cette analyse, l'estimation du maximum de vraisemblance est obtenue par optimisation dans l'espace des paramètres bidimensionnel défini par les paramètres (Δ7,8,9) contraints par leur somme étant l'unité. Cela n'a pas de sens d'admettre des solutions en dehors de cette région car elles correspondent à des valeurs indéfinies pour la probabilité d'identité par filiation (T hompson 1975).

L'une des caractéristiques utiles des estimateurs du maximum de vraisemblance est qu'ils peuvent être facilement adaptés à diverses situations. Dans certains cas, on peut savoir que les individus sont soit des frères et sœurs à part entière, soit non apparentés (ou toute autre paire de degrés de parenté M ousseau et al. 1998). Dans un tel cas, la probabilité pourrait être maximisée dans l'espace de paramètres unidimensionnel représentant un continuum de combinaisons linéaires de ces deux degrés de parenté. Alternativement, on peut savoir que les individus sont soit frères et sœurs, demi-frères, ou non apparentés ou frères et sœurs, parent-progéniture ou non apparentés (T homas et al. 2002). Dans de tels cas, l'optimisation peut être effectuée dans l'espace des paramètres défini par des combinaisons linéaires appropriées de ces trois degrés de relation. Ainsi, l'estimateur de vraisemblance de base décrit ici peut facilement être adapté à une variété de structures de population différentes simplement par un choix approprié de l'espace des paramètres.

La principale préoccupation est le comportement statistique de l'estimateur de vraisemblance, en particulier par rapport aux alternatives existantes (Q ueller et G oodnight 1989 L i et al. 1993 R itland 1996a L ynch et R itland 1999 W ang 2002). En raison du recours à l'optimisation numérique, le comportement statistique doit être déterminé par simulation. Le processus de simulation de base impliquait de générer des ensembles de données génétiques répliqués pour une paire d'individus dans des conditions de parenté connue, un nombre spécifié de loci échantillonnés et une distribution connue de la variation allélique à chaque locus. Les résultats analytiques basés sur l'annexe a ont été utilisés pour vérifier les simulations.

Estimateurs de méthode des moments : La performance de 6 estimateurs de parenté, quantifiée par le coefficient de coascendance , a été étudiée. L'estimateur de vraisemblance a calculé θ à partir de l'équation 1 comme l'estimation de vraisemblance maximale des probabilités d'identité par filiation, . Cinq estimateurs de non-vraisemblance supplémentaires ont été considérés comme étant représentatifs de la diversité de ceux disponibles. Ils représentent 5 façons différentes d'utiliser la similarité des états alléliques entre les individus pour construire des estimations de parenté, et celles testées par V an de C asteele et al. (2001) ont obtenu de bons résultats dans certaines conditions dans leur évaluation de 10 estimateurs différents. Ceux-ci ont tous été décrits et comparés précédemment (L ynch et R itland 1999 V an de C asteele et al. 2001 W ang 2002) par conséquent, plutôt que de répéter leurs formulations ici, le lecteur est renvoyé aux équations spécifiques présentées par R itland (1996a), L ynch et R itland (1999) et W ang (2002).

L'estimateur le plus couramment utilisé est celui publié par Q ueller et G oodnight (1989), dont plusieurs variantes sont possibles. La variante choisie ici était la symétrique obtenue par moyennage (xy + yx)/2 (L ynch et R itland 1999, équation 11) à travers les loci. Un deuxième estimateur de parenté (L i et al. 1993) is based directly on the pattern of shared alleles between two individuals and was obtained by averaging xy (L ynch and R itland 1999, Equation 8) across loci. The third estimator, a method-of-moments one based on the correlation between relatedness and genotypic similarity (R itland 1996a), was obtained as ρ ^ (R itland 1996a, Equation 5). The fourth estimator, another method-of-moments one based on the regression of similarity on relatedness (L ynch and R itland 1999), was the weighted average of (xy + yx)/2 across loci (L ynch and R itland 1999, Equations 5-7). The final estimator was described by W ang (2002). Two forms of this were investigated. The first follows the method favored in this article and involves the following steps: calculating a set of locus-specific similarity and allele-frequency parameters, calculating a set of locus-specific weights from those locus-specific parameters, averaging the locus-specific parameters across loci using those weights, and averaging the locus-specific values of relatedness (obtained using the average parameters W ang 2002, Equations 6 and 7 or 9-11) across loci, again using the same weights. The second method involves calculating the locus-specific values of relatedness using the locus-specific parameters (rather than the averages) and averaging across loci in the same way. These two methods are identical when allele frequencies are the same across loci however, they may differ otherwise. Although seemingly more natural, apparently the latter approach performed less well than the former (J. W ang , personal communication). Note that some of these nonlikelihood estimators are of r = 2θ and so were transformed to θ to be comparable with the maximum-likelihood estimator.

Several of these estimators have undesirable behavior under certain conditions. For example, with two alleles the Q ueller and G oodnight (1989) estimator is undefined for heterozygous reference individuals, and for two equally frequent alleles the L ynch and R itland (1999) estimator is also undefined for heterozygous reference individuals. Consequently, some loci must be discarded for multilocus estimates under these conditions, depending on the sampling of alleles at each locus. Both of these estimators are also based on arithmetic averages using each of the two individuals as a reference. At a particular locus one, both, or neither of those individuals can be heterozygous. Thus, the locus-specific value actually used in averaging across loci was the average (as described above) if both locus-specific values are defined and the defined value if only one is defined otherwise, the locus was ignored. This approach attempts to maximize the amount of information obtained from these estimators within the constraints imposed by their mathematical definition.

Additionally, the method-of-moments estimators are generally not constrained to lie within the biologically relevant range of [0, 0.5], unlike the traditional maximum-likelihood estimator. This property enables them to remain statistically unbiased however, individual estimates may not have meaning when interpreted as probabilities of identity-by-descent. One means of handling this is to truncate the method-of-moments estimates to lie within the proper range, that is, to replace lower values with zero and larger values with 0.5. To investigate the effect of the parameter range itself, as opposed to the type of estimator, all method-of-moments estimators were examined in both the standard and the truncated form.

Simulations: A range of sampling conditions was considered to mimic the variety of different genetic markers that might be available for estimating relatedness. Although for some organisms huge arrays of polymorphic genetic loci are available, for the vast majority of natural populations this is not the case. Thus, the range in number of loci (5-30) mimics moderate genetic samples. A great variety of types of genetic markers are available for quantifying relatedness. These range from markers that segregate few distinguishable alleles, generally including allozymes, single-nucleotide polymorphisms, or restriction/PCR fragments, to markers that segregate many distinguishable alleles, commonly microsatellites. To reflect this range in marker types, loci segregating 2, 5, 10, and 20 alleles were considered. Three different allele-frequency distributions were used for the simulations: one in which all alleles occur at equal frequency, one in which a single allele occurs with a frequency of 0.8 and the remainder are equally frequent, and one in which allele frequencies at each locus were independently drawn from the same Dirichlet distribution (S tuart and O rd 1987, Exercise 5.33, p. 209) with all parameters set to unity. The last case approximates natural situations better by allowing the distributions to vary across loci however, the first two are useful for isolating the effects of each factor. Finally, four actual degrees of relatedness between individuals were considered: parent-offspring, full-sibs, first cousins, and unrelated individuals. This range of conditions in relatedness, numbers of loci, numbers of alleles, and types of allele-frequency distributions was chosen to make the diversity of natural situations tractable, so that the influence of each main characteristic of a genetic sample on the statistical performance of the estimators can be examined. Future studies can focus more specifically on particular types of genetic markers or population structures.

To determine the statistical behavior of each estimator under each condition, sets of 1000 replicate samples of two individuals were obtained. Each of the six estimators was used to estimate θ for each of the replicate samples. The mean and standard error of the population of estimates were calculated from these samples. The bias of each estimator was quantified as the deviation of the mean from the known parametric value of θ used to generate the data. The root mean-square error was quantified as RMSE ( θ ) = 1 1000 ∑ i = 1 1000 ( θ ^ i − θ ∗ ) 2 , (3) where θ ^ i is the jeth estimate and θ * is the parametric value used to generate the simulated data sets. In all cases it was assumed that the allele-frequency distribution was known without error. Consequently, the focus is on the sampling properties of the relatedness estimators themselves.

—Distribution of estimates of θ for each estimator under different conditions of true relatedness. Each distribution is based on a sample of 1000 estimates taken from five loci, each segregating for five alleles. The allele-frequency distributions for each locus are drawn from a Dirichlet distribution. The W ang (2002) estimator is represented by the published version.


1. Introduction

Genomic regions that have been inherited from a common ancestor are said to be identical by descent (IBD). Identification of IBD regions has proven useful in many applications, including discovery and quantification of unknown or misspecified familial relatedness ( McPeek and Sun, 2000) and disease mapping where a region inherited in multiple affected individuals is indicative of a critical region containing disease susceptibility genes ( Albrechtsen et al., 2009).

Several methods have been proposed for inferring IBD, however few allow for analysis of the X chromosome. This is unfortunate as the X chromosome allows for inference of more distant relatedness than autosomes since fewer recombination events occur, resulting in IBD segments that are sustained over longer periods of time. Current IBD analysis of the X chromosome is based on identity by state sharing, which is non-probabilistic and does not necessarily imply IBD ( Browning and Browning, 2013 Gusev et al., 2009). Here we present XIBD the only hidden Markov model (HMM) that infers IBD on the X chromosome in addition to the autosomes, where IBD is detectable between individuals with a recent common ancestor, within 25 generations, rather than more distant relatedness. Many IBD methodologies rely on large cohorts to estimate allele frequency data or to infer linkage disequilibrium structure. XIBD can be applied to as few as two samples with the option to use HapMap allele frequency data for 11 populations. Furthermore, it can be applied to either single nucleotide polymorphism (SNP) chip or next generation sequencing (NGS) data (exome or genome wide).


Coefficient of relatedness for a locus on the Z chromosome - Biology

Consanguinious matings are those between related individuals (those that share a common ancestor), and are indicated by double lines between pedigree symbols. Les parenté ( r ) of two individuals is the fraction of alleles they share at all loci. The offspring of a consanguinious mating are said to be inbred . Les inbreeding coefficient ( F ) for an inbred individual is the probability that the individual has two alleles identical by descent at a locus. Alleles are identical by descent if they are genetic copies of the même allele in the common ancestor. These probabilites can be calculated by following each allele through several generations.

For example, we can calculate the probability that individual #5 , the product of a full-sib mating, has two alleles at the A locus that are identical by descent comme F = 1/4 = 0.25 . Other relatedness and inbreeding coefficients for typical consanguinious matings are shown below.


Mating Systems in Plants, Genome Evolution and

Effects on Heterozygosity Levels

When selfing evolves from outcrossing, homozygosity is almost complete after a few generations (FEST , the inbreeding coefficient , is close to one). This reveals recessive mutations, whose effects were hidden in heterozygous outcrossers (F EST

0). In asexuals, due to clonal transmission of the genome, any new mutation appearing in a genotype endlessly remains at the heterozygous state, unless the exact same mutation occurs on the homologous chromosome (Meselson effect). Heterozygosity is thus high in asexuals (FEST

−1) ( Glémin and Galtier, 2012 ).


Introduction

Breeding between related individuals is frequently observed to result in declines in traits influencing fitness. This phenomenon, termed inbreeding depression, has long been recognized in a wide variety of taxa (Darwin, 1876 Wright, 1977 Charlesworth, 1987 ). Although the effects are highly variable, it is now well established that inbreeding depression, acting across a variety of traits, has the potential to affect the growth and persistence of wild populations (Crnokrak & Roff, 1999 Keller & Waller, 2002 Frankham, 2005 ). Inbreeding depression is a central concern in conservation genetics, in part, because restricted population sizes may result in an increase in inbreeding over time even under random mating (Keller & Waller, 2002 ). Negative effects of inbreeding may be further compounded by the other genetic complications of small population size such as increased genetic drift leading to an overall loss of diversity (Lande, 1995 Lynch et al., 1995 Frankham et al., 2002 ).

Despite this, more than a decade on from a highly cited review of studies of inbreeding depression in wild populations (Keller & Waller, 2002 ) and the flood of studies that followed, the study of inbreeding depression can still be difficult to conduct in practice, when wild populations are involved. The increased expression of rare deleterious recessive alleles among inbred individuals is thought to be the most important genetic contributor to inbreeding depression (Wright, 1921 , 1977 Charlesworth & Charlesworth, 1999 ). This is due to increased genomewide homozygosity expected as a result of the proportion of loci that are identical by descent (IBD) in offspring produced by consanguineous matings. Since the inheritance of at least a proportion of the genetic load responsible for inbreeding depression may be largely dependent on stochastic events and population or lineage specific mutations, the effects of inbreeding depression are expected to be, to some extent, population, trait, environment, and also importantly, family specific (Kristensen & Sørensen, 2005 ). Attempts to generalize the results of studies of inbreeding in captive or laboratory reared populations may, therefore, underestimate the potential effects of inbreeding experienced under wild conditions (Crnokrak & Roff, 1999 ). Captive and laboratory based studies will also fail to provide information on the frequency of inbreeding expected to occur naturally.

Individual-based estimates of the degree of inbreeding or parental relatedness from pedigrees provide a critical starting point for studies of inbreeding depression (Pemberton, 2008 ). Molecular genetic data are now more readily available than ever before, improving our ability to reconstruct wild pedigrees using genotypes when accurate parental records are unavailable (Pemberton, 2008 Jones et al., 2010 ). However, accurate and reliable wild pedigrees are still difficult to obtain and typically involve a long-term commitment to intensive data collection.

As inbreeding is expected to reduce heterozygosity by increasing the number of loci with alleles that are IBD, within populations inbred individuals are expected, on average, to have lower genomewide levels of heterozygosity than less inbred individuals (Wright, 1922 ). It is therefore intuitively and practically appealing to use relatively easy to obtain molecular marker data as an indirect measure of an individual's level of inbreeding. This exploits the theoretical expectation that when inbreeding depression is present, individuals with higher pedigree inbreeding coefficients will be more homozygous and experience depression of the trait of interest (Falconer & MacKay, 1996 Charlesworth & Charlesworth, 1999 ). In this way, inbreeding depression would be expected to generate observable correlations between heterozygosity and traits. These are commonly referred to as heterozygosity-fitness correlations (HFCs) when traits are associated with fitness (Houle, 1989 Hansson & Westerberg, 2002 Balloux et al., 2004 Slate et al., 2004 ).

Although both HFCs and inbreeding depression have received well-deserved attention, wild pedigrees are still rarely available due to the difficulty of obtaining data (Pemberton, 2004 , 2008 Grueber & Jamieson, 2008 ). There is, therefore, relatively little empirical evidence available to address the ability of HFCs to reflect inbreeding under a variety of demographic scenarios. When wild pedigrees are available, they present a rare opportunity to assess the ability of both pedigree and molecular methods to detect inbreeding depression for the same population and traits.

Here, we first assess evidence for inbreeding depression using pedigree-determined measures of relatedness. Then, we examine HFCs in the same individuals using molecular data based on a panel of 35 microsatellite loci. We focus on measures of breeding success in three life-history stages in a remnant population of Stewart Island robins in New Zealand. A reintroduced island population of this species has been studied and monitored intensively since it was established on Ulva Island off Stewart Island, in 2000 (Jamieson, 2011 ). Previous studies, which included pedigree and fitness data up until 2006 when juvenile recruitment rates were high and the population was still growing, documented relatively weak levels of inbreeding depression (Laws et al., 2010 Laws & Jamieson, 2011 ). Here, we add four additional breeding seasons, but focus on the period between 2005 and 2010 during which juvenile recruitment rates declined as the island habitat approached its carrying capacity for territorial robins (I. Jamieson, unpublished data).

We generate standardized effect size estimates for both the effect of microsatellite heterozygosity and pedigree-determined inbreeding F on hatching success, fledging success and juvenile survival using an information-theoretical approach. Our findings support the conclusion that HFCs in this population reflect the weak inbreeding depression revealed by examining the pedigree.


Conclusion

Information from the other related populations was applied to improve the predictive ability. However, our results showed that the GEBVs were in different rank when a loose related population was used as RP. Integrating results from previous studies, we concluded that it was feasible to predict the GEBVs of a target population using RP of a related population in the condition that there was a close genetic relationship between these two populations and the size of related population is large.


Voir la vidéo: Degrés de parenté (Août 2022).