子代身高性别对父母身高的回归分析
子代身高性别对父母身高的回归分析 ◎生物数学2007,22(11:131—136Biomathematics 子代身高性别对父母身高的回归分析
程永生葛峙中.
(1南通大学商学院,江苏南通226007;2南通大学公共管理学院,江苏南通2260071 摘要:对抽样调查的身高数据进行计量分析,建立了子代对亲代身高的回归分析模型,
揭示了子代身高与亲代身高的遗传率;研究结果表明,父母身高对下一代的遗传率强度不同,母
亲要强于父亲;子女接受遗传的效应也不一样,女儿要强于儿子;建立了性别遗传模型,深入研
究了亲代父母之间的身高差对子代性别的影响,亲代身高差越大,则生女孩的几率就越大,反之
生男孩的几率就越大.
关键词:身高遗传;性别遗传;身高差;Logit模型
中图分类号:Q348MR分类号:l1G50;14G40文献标识码:A
文章编号:1001—9626(2007)01—0131—06
0引言
一
般经验性观察表明,父母身高与子代身高正相关,个子高的父母生的孩子也是高个,个
子矮的父母生的孩子也是矮个.英国生物学家Galton最早对此作出了精确的数量化描述,创
立了回归分析的研究方法.国内外很多学者应用亲一子身高之间的回归系数估算子代身高的
遗传率.笔者利用收集到的在校大学生及其父母身高数据展开较深入的研究,得出了一些很有
意思的结论.
1样本数据的统计描述
通过问卷调查,收集到南通大学在读四年级的大学生的身高及其父母身高的样本数据,共
203条,其中男生94人,女生109人,年龄在22—24周岁之间,身高已趋稳定(笔者注:南通大
学生源主要来自于江苏省).考虑到与人群总体保持一致性(中国当代青年男性性别比率为稍大
于50%),随机删除了一些女生的数据,保留了183个有效数据(其中男生94人,女生8g人).
采用Eviews软件,通过View功能查看样本数据的描述性统计特征如下表】. 从表l的峰度和偏度可以看出,所有的组别都近似服从正态分布.这是因为对身高的影响
因素非常多,除了遗传,还有生活环境,生活质量,生活习惯等多方面的影响,而这些因素又
是由从多细微弱小的影响因素组成.
收稿日期:2005—04—05
作者简介:程永生(1971--),男,江西九江人,博士生.E—mail:iamcheI1gys@163?com
l32生物数学第22卷
表1样本描述性统计特征
Table1DescriptiveStatisticsofSamples 子代的最大值,最小值,中位数都大于或等于亲代的对应统计量,如男生的平均身高要比
他们的父亲高】.5厘米,女生比他们的母亲要高O.91厘米,而且通过了显着性检验(对应的t
检验统计量分别为2.97和1.78,相应的伴随概率为O.00】5和0.0375).子代比亲代高或许是因
为与以前相比,现在我国居民的生活水平有了显着的提高.以男生为例,有:
H0:男生不高于父亲
H1:男生高于父亲
构造t统计量,z==2.97,查表可知对应的伴随概率为0.0015.可见男 生高于父亲的置信水平为O.9985.
样本中,亲代身高差范围为[,3,26]厘米,平均为1O.96厘米,偏度,峰度是组别中最小
的,接近于标准的正态分布.
2身高遗传模型
2.1身高遗传模型初步回归
建立子代身高回归模型:
Zi=bo+blXBi+b2+b8Mi+Ui
其中,z:子代身高
XB:性别变量,1表示男生,0表示女生
F:父亲身高
M:母亲身高
采用Eviews软件,得回归分析结果为:
=28.51+l0.37XB+O.303F+O508M (2.09)(16.45)(4.35)(6.99) n=183.AdjustedR=O.72.F=153.93
第l期程永生等:予代身高性别对父母身高的回归分析 括号内为对应参数估计值的t统计量,以下同.
2.2计量经济学检验
由于样本数据为横截面数据,模型(1)可能存在异方差和多重共线性,须加以检验. (1)多重共线性检验
通过ViewS功能查看父亲身高与母亲身高的相关系数矩阵,如下表2: 表2相关系数矩阵
Table2CorrelatlonMatrix 可知,父亲身高和母亲身高之间存在弱相关性.原因或许是80年代初的他们找对
象时,
身高条件未受到特别的重视.多重共线性不很强,这里不予考虑. (2)异方差检验
以父亲身高和母亲身高的线性组合为解释变量,残差为被解释变量,寻求异方差的具体函
数关系.经过反复多次试探计算,得出残差e方差的函数关系式: e:一207.71+1.393M~?
(,2.71)(2.92)
,=2.92,伴随概率为O0039,可置信水平为99.5%以上.可以判断,原模型(1)中确实存
在着显着的异方差问题.子代身高的方差与母亲身高正相关.也就是说,母亲高,其子女的身
高差异较大;母亲矮,其子女身高差异较小.
2.3异方差消除后的身高遗传回归结果
由于存在着异方差,参数估计量不再具有最小方差性,所以普通最小二乘法不适用,采用
加权最小二乘回归.
将原模型(1)式两边同时除以权重厕丽,经变量代换后,重新作回归分析, 得身高遗传回归方程结果如下:
2=29.52+10.90XB+0.288F+O.517M (2,758)(191)(4.89)(7.82)(4) R2:099.F:9360
该方程中,所有的解释变量的伴随概率都为0.0000,可置信水平为0.9999以上,性别和
父母身高对子代身高的影响作用非常显着.F=9360,说明模型的总体解释作用非常强.
在该模型中,XB的系数为1O.90,说明男生比女生平均要高出1090厘米.父母身高的
系数分别表示对应变量对子代身高的边际影响率.由解释变量的系数可知,母亲身
高对子代的
影响是父亲身高的1.8倍.与我们的常识判断相吻合.
除了遗传影响的因素外,生活环境,生活质量,生活习惯对身高的影响也非常大,这些因
素统称为其他因素.常数项29.52为其他因素的作用总和.就女生的平均身高161,6厘米来说,
134生物数学第22卷
除去遗传因素以外的其他因素的影响为18.27%,亲代对女孩的遗传作用为81.73%;其他因素
对男生的影响作用为40.42(29.52+10.90)厘米,占平均身高的23.36%,则亲代对男孩的遗传作
用为76.64%.与女孩相比,男孩身高受到更多的后天的环境等因素的影响,可能是因为男孩子
更喜欢运动的结果.
3亲代身高差对子代性别的影响
亲代身高不仅对子代身高有着显着的影响,而且对子代的性别也产生影响.分别建立线性
概率模型LPM和Logit模型研究父母身高的差异对下一代性别的影响. 3.1线性概率计量模型(Linearprobabilitymodel,LPM) 我们建立线性概率计量模型:
Biao+n】Hdi+u(5)
在这个模型中,随机项ui服从二点分布,
表3随机项的分布
Table3DistributionsofRandomItems P表示XB:1的概率,即子代为男孩的概率值;1一Pi代表子代为女孩的概率.随机 扰动项方差为V(ui)=Pi(1一P1),
p=E(xB~/IIdi)
取估计值,P,=XBOb(采用普通最小二乘法的拟合值),则
(uf)=XBI(1一x直f).
对不同的tti,其方差不一样,模型中存在着异方差,参数估计量失去有效性,须采用加权最
小二乘法加以消除.
为消除异方差,在原模型(5)两边除以标准差,//(ui),得
XBi/而=ao/+ai(Hd)/俑+ui/而(6)
通过变量代换,得到性别遗传的回归结果见表4.
3.2Logit模型
采用简单线形模型,拟合效果不好,误差较大.以下采用改进的Logit模型进行分析. 设定理论模型为
Bex而p(a+t3Hdi)(7)
第1期程永生等:子代身高性另4对父母身高的回归分析
使用非线性最小二乘法的一般方法高斯一牛顿迭代法估计模型参数,即将函数展开成泰
级数芝后,再利用迭代估计方法进行估计.迭代最大次数设定为100,收敛标准为o?oo,得
性别遗传的回归结果见表4.
表4LPM和Logit模型回归结果
rrable4ResultsofLPMandLogitRegressiveModel
说明两个方程预测效果较好.
Logit模型拟合曲线如下图:
从散点图看出,当父母身高差在(0,20)范
围内,logit模型接近于线形概率模型(笔者注:
实际上,根据Logit散点拟合出的线性方程为
XB:0.754—0.0221Hd,与线性概率模型基本吻合).
进一步分析可知,当父亲比母亲身高高出11?5
厘米,XB:0.5,则生男孩和生女孩的几率是一样
的,都为50%.若父亲比母亲身高高不超出11.5厘
显
着
亲
,
米,则生男孩的几率大,否则生女孩的几率大?图1Logit模型拟合散点图 在(0,20)范围内,亲代身高差超出11.5厘米后,每再增加1厘米,生女孩的增加 2.6
L
为
PM
5,
020
孩的
Log
几
it是递与不同
,
超出(,)范围,模型杀代身两爰明迈,双个骨苊吊姒'疋胆
减的.本空南,亲代身高差的范围为一3cm-26cm,对应的子代性别概率区间上下限为0.814
和0.187,下表是根据Logit模型拟合的对应的子代性别概率: 表5根据Logit模型拟合性别概率
Tab】f15FittingSexPossibilitiesSeriesInferredfromLogitModel
婊搠汰擞糊郯滴捌懒
孵似差别.懒模身化瘦一一一一一弧黼墩一,,,一一一一一一
136生物数学第22卷
当亲代身高相若时,子代为男孩的概率为O.76,生女孩的概率为O.24;当亲代身高差为
2O厘米,生男孩的概率下降为0.30,生女孩的概率为O.70. 4结论
综合以上,得出以下结论
1)子代身高主要受亲代身高的遗传影响,相对来说,母亲身高对子代的影响要比父亲大得多;
2)子代身高的差异与母亲身高成正向相关,即母亲身高高的,下一代的身高差异较大;身
高矮的母亲,子代身高则比较稳定,差异小;
3)子代接受遗传的作用效应是不同的,相对来说,女孩受到的遗传作用要强,男孩受到的
遗传影响相对较弱.男孩受到遗传以外的生活环境等因素的影响更大. 4)亲代身高差与下一代的性别是有较强关联性的,父亲比母亲高的越多,则生女孩的可能
性更大,否则,生男孩的可能性要大.
参考文献
…1JeffreyM,Wooldridge.1ntr'oductoryEconometricsAModernApproach【M】.北京:中国人民大学出版社
1996.
【2】胡晶,任岫林.子女身高对父母身高的再回归分析[J].数学的实践与认识,2001,1a(3):342—346.
【3】林秀玉,毛宗秀.浙江省人体身高与遗传及环境关系的初步研究【J1.遗传,1986,1a(2):155—159.
【4】郭平伸.数量遗传分析【M】.北京:北京师范大学出版社,1987. 【5】鲍智婿,盖平.吉林省人体身高与遗传及环境关系的数量分析【J1.生物数学,1996,11(4):102—104.
【6】张斌东.中年男女体质标准及婚配遗传性别研究【J1.生物数学,1999,14(4):459
—462.
AggressiveAnalyzeofHeightandSexofChildrento
theHeightofTheirParents
CHENGYong—shengGEZhi—zhong.
(1Schoolo/Business,NantongUniversity,NantongJiangsu226007China)
(2Schoolo/PublicManagement,NantongUniversity,Nanton9Jiangsu226007China) Abstract:Aregressanalvticmode1.whichreleasestherateofheredityprobabilityfrom parentstotheirdescendants,iSbuiltbyquantityanalyzeonthespotcheckheightdata.Itshows thatfather'sheredityratedifiersfrommother'Sheredityrate.andthelatteriSbiggerthanthe former.HeredityeriectreceivedbysonanddaughteriSdifierentanddaughterreceivesmorethan
son.Moreover.asexhereditymodeliSbuilt.Itfurtherstudiestheinfluenceoftheheight,ditier—
eneebetweenparentsonthechildren.TheresultshowsthatthehigheriSthefatherthanmother, thebiggeristheprobabilityofthebirthofdaughter,whereasthebiggeristheprobabilityofson Keywords:Heightheredity;Sexheredity;Heightdifference;Weightleastsquares