一对等位基因的基因概率
山西农业科学2009,37(3):28,32JourlzalofShanxiAgricuhuralSciences
一
对等位基因的基因概率
李祥旭
(山西农业大学动物科技学院,山西太谷030801)
摘要:根据孟德尔定律可以得到一个孟德尔群体的基因频率和基因型频率.随着遗
传学的发展,需要知道
已知亲本和子代基因型时,子代的某一个基因来自亲本的某一个基因的概率和子
代的基因型来自亲本的某
一
个组合基因型的概率,即基因概率和基因型概率.根据条件概率和孟德尔定律导出
了基因概率和基因型
概率的计算方法,且研究了基因概率的性质.
关键词:基因概率;基因型概率;孟德尔定律;条件概率;基因型
中图分类号:G633.91文献标识码:A文章编号:1002—2481(2009)03—0028—05
GeneProbabilityofAPairAllele
LIXiang——XU
(DepartmentofAnimalScience,ShanxiAgricuhuralUniversity,Taigu030801,China) Abstract:FromMendelianprincipleswecangetgenefrequencyandgenotypefrequencyofMendelianpopulation.Asthe
developmentofgenetics,itneedstoknowacertaingeneofoffspringfromacertaingeneofparentandgenotypeofoffspringfroma
certaineomb.
inationgenotypeofparentdefinitelyunderknowngenotype,namedgeneprobabilityandgenotypeprobability.This
papergavethemethodofcomputationgeneprobabilityandgenotypeprobabilityundercondi
tionalprobabilityandMendelianprin-
ciplesandstudiedthecharacterofgeneprobability.
Keywords:Geneprobability;Genotypeprobability;Mendelianprinciples;Conditionalpro
bability;Genotype 随着生物技术和相关学科的日益完善,可以 很容易确定出标记座位的基因型.经过科学家们 不懈地努力,定位了大量的QTL并构建了各种动 物的遗传图谱,为标记辅助选择奠定了基础. 实施标记辅助选择,需要把QTL与标记联系起 来,这就需要基因概率和基因型概率的计算.本 研究提出一种基因概率的计算方法,导出求基因 型概率的方法,研究了基因概率的性质,指出了 基因概率与基因型概率的关系,旨在为分子标记 与QTL的应用提供理论基础.
1材料和方法
1.1假设条件
基因在体细胞中成对存在,其中一个来自雌 性配子,另一个来自雄性配子.形成配子时,成对 的基因彼此分离,并分配到不同的配子中去,每 一
个配子仅包含成对配子中的一个,由于要用到 孟德尔定律,条件与应用孟德尔定律的假设条件 基本一致.基因概率计算不需要考虑基因的显隐 性关系,可以是复等位基因,关键是要已知亲本 和后代的基因型,已知基因型(knowngenotypes)
用G
示,父本(),母本(d)和后代(i)的基因 型分别用G4,GA:和G=AA(图1)
表示,上下角标是为了方便的计算基因概率.给 基因概率下一个定义,就是已知亲本和子代基因
型时,子代的某一个基因来自亲本的某一个基因 L
的概率.基因概率可以用数学符号表示为Pr(A: }收稿日期:2008—12-22
作者简介:李祥旭(1984一),男,内蒙古宁城人,在读硕士,研究方向:分子数量遗传学.
?
28?
李祥旭:一对等位基因的基因概率
G),其中p等于s或d,k与k分别等于 1或2.如果群体某一基因座位由4.,:和4,3 个复等位基因组成,那么A可以是A,A:和A, 中的任何一个,其他亲本和子代中的基因也可以 是3个复等位基因中的任何一个.
ll
AAd
AA
l
A
————了一
A
图1个体i与其父本s和母本d含有一对 等位基因的染色体片段
1.2方法
已知Gs,G和Gi,k'来自:的条件概率与 群体中任何别的信息无关.因此Pr=:(k'乍:I G):P(k:IG.GG),根据条件概率可以通
过以下公式计算基因概率.
P乍,,)=皇(1)
方程(1)中,等号左边代表的是基因概率,而
右边分子是后代含有来自某一亲本的某一基因 的基因型概率,分母是考虑基因位置的后代的基 因型概率.这里亲本交配产生的后代基因型组合 共有8个(A1,
1
4,2
,
2
,
1
,
A1A
,
A'
d
A,A'
d
As
),不是孟德尔定律的4个基因型,因
为孟德尔定律不需要考虑基因的位置.根据方程 (1)可以知道,对于每一个后代共有8个基因概 率(表1).
表1已知亲子基因型时的一对等位基因的8个基因概率 表1用矩阵的形式表示如下.
Pr(仁I)
Pr(l)
Pr(A]仁AI)
Pr(乍l.)
士墨量2基因概率的性质本研究中前两列对应的是父本,这并不是问题的一
关键,只是一种表达习惯,父本在前,母本在后,后代一个基因的基因概率共有4个,并且这
不影响后面的研究.4个基因概率的和是1.因为个体一个基因来自 亲本基因的选择机会只4个.即:
Pr(4~《==A1)+Pr(41<==)+Pr(仁)+Pr(4l<==)一,,
er()+Pr(《==)+Pr{42仁)+P乍)=1
用矩阵(2)中的元素表示如下.
(1,1)+(1,2)+(1,3)+JF:(1,4)=(2,1)+(2,2)+(2,3)+(2,4)=1
后代一个基因来自一个亲本的两个基因概那一个亲本确定时,个体的另一个基因必来自另
率之和等于后代的另一基因来自另一个亲本的一个亲本.条件概率公式表示如下.,
两个基因概率之和.因为当个体的一个基因来自
Pr(a,1c==I)+Pr(A~1仁I.)=Pr(A~仁I.)+Pr(乍I.)(4) er(4l仁l.)+Pr(A,a乍:IG.)=er(A~仁I.)+Pr(《=二i)(5) 用矩阵(2)中的元素表示如下.
(1,1)+(1,2)=(2,3)+(2,4),(1,3)+(1,4)=(2,1)+(2,2)
r==
乍乍
乍上上
PP
=
山西农业科学2009年第37卷第3期
基因概率的计算需要考虑基因的位置,如果
个体的基因型是杂合子,不同的写法会得到不同
的基因概率.如果子代是杂合型,不同的写法会
导致(2)中行元素的对换;如果亲本是杂合型,不
同的写法会使(2)所对应亲本的列元素对换;如
果个体是纯合子,那么怎么写也不会改变(2)中
的任何元素的任何位置.不论个体的基因型是杂 合的还是纯合的,基因概率的性质都不会改变. 3基因型概率的推导
让表示个体i来自亲本组合(A:,A)的
基因型,其中,Kd=1或2,亲本组合只有4个, 即TI,I,T,,,,.和,:或(A,A),(A,A:),(A, A:)和(,A:o
下面来求已知基因型下的基因型概率, 即子代的基因型来自亲本的某一个组合基因型 的概率,符号表示为Pr(IG).
由于已知基因型,Pr(IGk.o)可以另写为如 F式.
Pr(l(,.)
=
Pr(~Z仁,Af2仁I.)+Pr(~/dkd,仁I.) 先只考虑(6)中等号右边第一项的条件概率,可以表示为如下式.
Pr(,仁I.)
=Pr(A,2乍I.)Pr(乍lA,2乍,.).
(7)
其中Pr(A乍IG)是一个基因概率,对概率表示.因为A一旦来自母本A,Ai1一定来
于个体,Pr(AlA,G)也可以用基因自父本,同一个体的一对等位基因不可能同
时来自一个亲本,即:
PA1c==f仁Ay-\is,G一1..
=
Pr(=I?=,G
ariel
.
)=!辜竽(8)'
此时,(8)可以用基因概率的形式表示如下.
乍l仁,=骞鬻毫c9
把(9)代人(7)后,(6)中等号右边第一项的条件概率可以用基因概率表示如下.
Pr(《==,乍I.)
Pr(仁As"IG)Pr(<==I.) Pr(A乍AI.)+Pr(AA2l.) 同样的方法可以求出方程(6)中等号右边第可以用基因概率表示如下.
2项的条件概率.此时,Pr=(IG)的条件概率 Pr(T~1G蛔.)=
!兰i21三l2!三:!.21三:i2
Pr(<==1Gh.)+Pr(仁l.)'Pr(<==Al(.)+Pr(<==A;I.)
根据基因概率的性质,也就是方程(4)与 (5),得知方程(11)等号右边每一项中的分母都 有两种表示方式,但是其值不变.当然这个也可 以推导出来,变化发生在方程(7).根据方程(4) 得知方程(11)号右边第一项分母的两种不同 表达方式是等价的,可选择任意一种方式来进行 ?
30.
(10)
(11)
计算.方程(11)等号右边的第2项也具有同样的 性质.如果方程(11)等号右边的某一项的分母是 0,此时不管该项分子值是多少,这个项就是0. 利用方程(11)和(2)可以写出4个基因型概率如 下.
李祥旭:一对等位基因的基因概率
Pr(.IG.)=
Pr(T~.1lG.)
!::2一.:2!:12
(1,1)+P(1.2)P(1.3)+(1,4)
!:三2墨!:2!:2,!兰:三2
(1,1)+(1,2)(1.3)+(1,4) Pr=(Tk,k,IG)为已知亲子基因型子代基因
型来自亲本的一个组合基因型的条件概率,即基 Pr(T~.IGb.)
Pr(T2.2IGk..)=
:2!:12上:!:!!:2
(1,1)+(1.2)(1,3)+(1.4) !:2!三:12!:!曼!:兰2
(1,1)+(1,2)9(1,3)+(1.4) 因型概率,它们的概率之和是1.把(6)中的,k 换成1或2,有下式.
Pr(仁A1,乍I.)+P,<==A;I.) +Pr(乍,Af2仁IG^W.)+Pr(仁,仁l)=1
据已知的条件,(】2)可以用更简单的符号表示如下. Pr(T~.l.)+PI)+Pr(Tz,l)+Pr(T2,
I)=1
4举例验证
如果两个亲本及其后代的基因型分别为G= AA.,Gd1
d
A
1A2和G=A.计
算方程(1)右边的分子需要具体到某一亲本和后 代的某一个基因,把这一组亲本和后代的基因型 另写为G:AI2:sA,
Gd==412=.和G=
AA=A,其中下标是用来确定基因型,上标
是用来确定基因位置的,这样可以区分出一个个
体某一座位上的某一个基因.
亲本交配产生后代的8个基因型组合是 A:,A,4A,A.A,j4:,AA!,4,:d2
As
..
符合G1A2i
,
~i
,
2
的基型组合是4s
l
Ad
1,
4j,/4,AAs.(如果例题中GA:,
符合条件的基因型组合是A,/4d2,基因位 置也要一致).根据Pr(GIG,G)可以算得Pr(A Al,AA,d2)=4/8,即方程(1)等号右边的分 母,已知后代的基因型,这个分母是不变的,变化 的只是分子.分母是考虑基因位置的基因型概 率,按不同基因型的亲本交配所产生后代的基因 型计算Pr(GIG,G)所得的条件概率也各有不 同.
符合分子条件的基因型来自符合分母条件 的基因型,符合分母条件的基因型中符合子代的 第一个等位基因来自父本的第一个等位基因的 基因型只有4d..据Pr(A':,GIG,G)可以
算得Pr(A乍A,GIG,G)=1/8,即方程(1)等号 (12)
(13)
右边的一个分子.根据已求出方程(1)等号右边 的分母和方程(1)可以算出Pr(A乍IG,G, G)=1/4,就是矩阵(2)中的(1,1).由于方程 (1)等号右边的分子和分母有公分母,为了方便 也可以只写符合条件的基因型,也就是公分母可 以约掉,问题的关键是符合条件的基因型必须同 时考虑基因位置,这里写出八分之几只是让人更 明白这种方法与孟德尔定律的不同之处,方法不 违背孟德尔定律,是在解决不同的问题.利用同 样的算法可以算出另外7个基因概率,按(2)确 定的位置,个体i的8个基因概率以矩阵的形式 表示如下.
I1/41/41/20l
p—Il
I1/41/41/20l
此例中的母本是杂合型,父本和子代都是纯 合型,可以给矩阵(2)中元素的位置带来变化的 只有母本基因型的写法.例题中用A:表示母 本的基因型,如果把母本的基因型写为4:,利 用上面的算法,可以得到(2)为:
/4
.
0/
2
2
4141]p—I1l1//0/21
通过这个例子可以看出,在亲本基因型不变 时,即使基因型位置不同,两个矩阵元素的位置 也发生改变,但是基因概率的两个性质是不变
的,即(1,1)+(1,2)+(1,3)十(1,4)=(2,1) +(2,2)+(2,3)+(2,4)=l;Pi(1,1)+(1,2)=
(2,3)+(2,4),(1,3)+(1,4)=(2,1)+
Pi(2,2).
本例中,按母本基因型写法为Aa.算得的 (2)来计算方程(13)中的基因型概率分别为Pr 山西农业科学2009年第37卷第3期
(.1lIG)=1/2,Pr(Tt.2IG)=0,Pr(.IG^)=1/2和 Pr(.:IG)=0.按母本基因型写法为A:A算得 的矩阵(2)来计算方程(13)中的基因型概率分别 为Pr(T1.1IG^)=0,Pr(1.2IG)=1/2,Pr(.1lG)
=
0和Pr(.IG)=1/2.4个基因型概率之和是1, 没有随杂合子基因型的不同写法而改变.为计算 方便最好不要随意写杂合子的基因型,虽然这样 不会改变基因概率的性质,但是会改变具体基因 概率和基因型概率的值.
其他的例子见表2和表3,个体i的8个基 因概率和4个基因型概率分别由方程(1),(2), (11),(12)和(13)确定,个体的父本和母本分别 用S和d表示.
表2计算基因概率的例子
1
2
d
A:
A.
12
A2
4
(1,2)(1,3)只(1,4)(2,1)(2,2)(2,3)(2,4)
1/4 0
O
1/2 O
O
01()00010
Az
2
A,
A1A2 2
,
12
2
2
2
A1A1 A1A3 3
l,4 O
O
1/2 0
0
0
1/4 112
1,2
112
1/2
O
1
l『4
O
0
0
0
0
O
5讨论
在遗传学上,人们往往关心的是基因频率和 基因型频率,而很少有人去关心已知亲本和子代 基因型,并且考虑基因位置时基因概率的变化. 本文详细研究了在只考虑一对基因时子代某 基因来自亲本的某一基因的条件概率,即基因概 率.基因概率具有很好的性质,即后代的一个基 因的基因概率共有4个,这4个基因概率的和是 1;后代一个基因来自一个亲本的2个基因概率 之和与后代的另一个基因来自另一个亲本的2 个基因概率之和相等.具体基因概率的值会随着 杂合子的不同写法而有所不同,但2个性质是不 会随之改变.基因概率的计算看似与盂德尔定律 相似,可是又具有自身的特点.根据基因概率的 性质,又推导出已知亲子基因型子代基因型来自 亲本的某一组合基因型的条件概率,即基因型概 率.基因概率还可以用在标记辅助选择上,根据
现有的理论,有了基因概率和基因型概率的计
算方法,再通过标记与QTL之间的重组率就可
以把标记与QTL联系起来,为标记辅助最佳线
.
32.
性无偏预测方法提供理论支持.
本文只是初步对基因概率和基因型概率的
理论进行了研究.已知一条染色体上多个基因的
连锁相时,可以用类似的方法推导多基因基因概
率.有关基因概率和基因型概率的理论和应用,
还需要进一步的研究.
参考文献:
[1]储明星,叶素成,陈国宏.微卫星标记与奶牛数量性状QTL 定位fJ】.遗传,2003(25):337—340.
[2]敖雁,朱明星,徐辰武.贝叶斯统计在QTL作图中的应用 研究进展【J】.遗传,2007(29):668—674.
[3]殷宗俊,张勤,张纪刚,等.家畜抗性等级性状的QTL定 位方法lJ】.遗传,2005(32):1147—1155.
14jFernandoRL,GrossmanM.Marker-assistedselectionusing
bestlinearunbiasedprediction【JJ_GenetSelEvol,1989,21:
467-477.
[5]GamalABDEI一AZIM*,AlbertE.FREEMAN.Arapidme~od
forcomputingtheinverseofthegameticcovariancematrixbe-
tweenrelativesforamarkedQuantitativeTraitIz~cus【J】.Genet SelEvol,2001,33:153—173.
16JWangT,FernandoRL,VanderBeckS,eta1.Covadancebe— tweenrelativesforamarkedquantitativetraitlocus【J].Genet SelEvol,1995,27:25l一274.
42
/11O/1
II
424
/00//O III
44
/00O/0 II
4.
/00O00 I
422
/00//0 一