为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

伍德里奇---计量经济学第6章部分计算机习题详解(STATA)

2013-05-03 11页 pdf 808KB 1250阅读

用户头像

is_762418

暂无简介

举报
伍德里奇---计量经济学第6章部分计算机习题详解(STATA) 计量经济学第 6 章计算机习题(STATA) 1 班级:金融学×××班 姓名:×× 学号:××××××× C6.9 𝐍𝐁𝐀𝐒𝐀𝐋. 𝐑𝐀𝐖 𝒑𝒐𝒊𝒏𝒕𝒔 = 𝜷𝟎 + 𝜷𝟏𝒆𝒙𝒑𝒆𝒓 + 𝜷𝟐𝒆𝒙𝒑𝒆𝒓 𝟐 + 𝜷𝟑𝒂𝒈𝒆 + 𝜷𝟒𝒄𝒐𝒍𝒍 + 𝒖 解:(ⅰ)按照通常的格式报告结果。 由上图可知:𝑝𝑜𝑖𝑛𝑡𝑠 = 35.22 + 2.364𝑒...
伍德里奇---计量经济学第6章部分计算机习题详解(STATA)
计量经济学第 6 章计算机习题(STATA) 1 班级:金融学×××班 姓名:×× 学号:××××××× C6.9 𝐍𝐁𝐀𝐒𝐀𝐋. 𝐑𝐀𝐖 𝒑𝒐𝒊𝒏𝒕𝒔 = 𝜷𝟎 + 𝜷𝟏𝒆𝒙𝒑𝒆𝒓 + 𝜷𝟐𝒆𝒙𝒑𝒆𝒓 𝟐 + 𝜷𝟑𝒂𝒈𝒆 + 𝜷𝟒𝒄𝒐𝒍𝒍 + 𝒖 解:(ⅰ)按照通常的格式结果。 由上图可知:𝑝𝑜𝑖𝑛𝑡𝑠 = 35.22 + 2.364𝑒𝑥𝑝𝑒𝑟 − 0.077𝑒𝑥𝑝𝑒𝑟2 − 1.074𝑎𝑔𝑒 − 1.286𝑐𝑜𝑙𝑙 6.987 0.405 0.0235 0.295 (0.451) 𝑛 = 269,𝑅2 = 0.1412,𝑅 2 = 0.1282。 (ⅱ)保持大学打球年数和年龄不变,从加盟的第几个年份开始,在 NBA 打球的经历实际上将降低 每场得分?这讲得通吗? 由上述估计方程可知,转折点是𝑒𝑥𝑝𝑒𝑟的系数与𝑒𝑥𝑝𝑒𝑟2系数的两倍之比:𝑒𝑥𝑝𝑒𝑟∗ = 𝛽 1 2𝛽 2 = 2.364 [2 × −0.077 ] = 15.35,即从加盟的第 15 个到第 16 个年份之间,球员在 NBA 打球的经历 实际上将降低每场得分。实际上,在模型所用的数据中,269 名球员中只有 2 位的打球年数超过了 15 年,数据代表性不大,所以这个结果讲不通。 (ⅲ)为什么𝑐𝑜𝑙𝑙具有负系数,而且统计显著? 一般情况下,NBA运动员的球员都会在读完大学之前被选拔出,甚至从高中选出,所以这些球 员在大学打球的时间少,但每场得分却很高,所以𝑐𝑜𝑙𝑙具有负系数。同时,𝑐𝑜𝑙𝑙的𝑡统计量为-2.85, 所以𝑐𝑜𝑙𝑙统计显著。 (ⅳ)有必要在方程中增加𝑎𝑔𝑒的二次项吗?控制𝑒𝑥𝑝𝑒𝑟和𝑐𝑜𝑙𝑙之后,这对年龄效应意味着什么? 计量经济学第 6 章计算机习题(STATA) 2 增加𝑎𝑔𝑒的二次项后,原估计模型变成: 𝑝𝑜𝑖𝑛𝑡𝑠 = 73.59 + 2.864𝑒𝑥𝑝𝑒𝑟 − 0.128𝑒𝑥𝑝𝑒𝑟2 − 3.984𝑎𝑔𝑒 + 0.054𝑎𝑔𝑒2 − 1.313𝑐𝑜𝑙𝑙 35.93 0.61 0.05 2.69 0.05 (0.45) 𝑛 = 269,𝑅2 = 0.1451,𝑅 2 = 0.1288。 由方程可知:𝑎𝑔𝑒的𝑡统计量为−1.48,𝑎𝑔𝑒2的𝑡统计量为1.09,所以𝑎𝑔𝑒和𝑎𝑔𝑒的二次项统计都不 显著,而当不增加𝑎𝑔𝑒2 时,𝑎𝑔𝑒的𝑡统计量为−3.64,统计显著,因此完全没有必要在方程中增加𝑎𝑔𝑒的 二次项。当控制了𝑒𝑥𝑝𝑒𝑟和𝑐𝑜𝑙𝑙之后,年龄对𝑝𝑜𝑖𝑛𝑡𝑠的负效应将会增大。 (ⅴ)现在将log⁡(𝑤𝑎𝑔𝑒)对𝑝𝑜𝑖𝑛𝑡𝑠,𝑒𝑥𝑝𝑒𝑟,𝑒𝑥𝑝𝑒𝑟2,𝑎𝑔𝑒和𝑐𝑜𝑙𝑙回归。以通常的格式报告结论。 所以,𝑙𝑜𝑔 𝑤𝑎𝑔𝑒 = 6.78 + 0.078𝑝𝑜𝑖𝑛𝑡𝑠 + 0.218𝑒𝑥𝑝𝑒𝑟 − 0.0071𝑒𝑥𝑝𝑒𝑟2 − 0.048𝑎𝑔𝑒 − 0.040𝑐𝑜𝑙𝑙 0.85 0.007 0.050 0.0028 0.035 (0.053) 𝑛 = 269,𝑅2 = 0.4878,𝑅 2 = 0.4781。 (ⅵ)在第(ⅴ)部分的回归中检验𝑎𝑔𝑒和𝑐𝑜𝑙𝑙是否联合显著。一旦控制了生产力和资历,这对考察 年龄和受教育程度是否对工资具有单独影响这个问题有何含义? 计量经济学第 6 章计算机习题(STATA) 3 𝐹统计量为1.19,𝐹的𝑝值为0.3061,所以检验𝑎𝑔𝑒和𝑐𝑜𝑙𝑙不是联合显著的。因此,一旦控制了生 产力和资历,当考察年龄和受教育程度是否对工资具有单独影响这个问题时,不能说明其对工资差 异有明显的效应。 C6.9 𝐁𝐖𝐆𝐇𝐓𝟐. 𝐑𝐀𝐖 𝒍𝒐𝒈 𝒃𝒘𝒈𝒉𝒕 = 𝜷𝟎 + 𝜷𝟏𝒏𝒑𝒗𝒊𝒔 + 𝜷𝟐𝒏𝒑𝒗𝒊𝒔 𝟐 + 𝒖 解:(ⅰ)按照通常的格式报告结果,二次项显著吗? 由上图可知:log⁡(𝑏𝑤𝑔𝑕𝑡) = 7.958 + 0.0189𝑛𝑝𝑣𝑖𝑠 − 0.00043𝑛𝑝𝑣𝑖𝑠2 0.027 0.0037 0.00012 𝑛 = 1764,𝑅2 = 0.0213,𝑅 2 = 0.0201。 因为𝑛𝑝𝑣𝑖𝑠2的𝑡统计量为−3.57,所以二次项显著。 (ⅱ)基于(ⅰ)中的方程,证明:最大化log⁡(𝑏𝑤𝑔𝑕𝑡)的产前检查次数为 22。样本中有多少妇女至 少接受过 22 次产前检查? 由上述估计方程可知,转折点是𝑛𝑝𝑣𝑖𝑠的系数与𝑛𝑝𝑣𝑖𝑠2系数的两倍之比:𝑛𝑝𝑣𝑖𝑠∗ = 𝛽 1 2𝛽 2 = 0.0189 [2 × −0.00043 ] = 21.98,所以最大化log⁡(𝑏𝑤𝑔𝑕𝑡)的产前检查次数为 22。 由截图可知,样本中有89位妇女至少接受过22次产前检查。 (ⅲ)在22次产前检查之后,预计婴儿出生体重实际上会下降,这有意义吗?请解释。 有意义,因为如果产前检查次数太多,表明生育过程可能有困难,所以婴儿的体重可能会下降。 (ⅳ)在方程增加母亲年龄,并使用二次函数形式。保持𝑛𝑝𝑣𝑖𝑠不变,目前在什么年龄,孩子的出生 体重最大?样本中有多大比率的妇女年龄大于这个“最优”生育年龄? 计量经济学第 6 章计算机习题(STATA) 4 所以,𝑙𝑜𝑔 𝑏𝑤𝑔𝑕𝑡 = 7.584 + 0.0180𝑛𝑝𝑣𝑖𝑠 − 0.00041𝑛𝑝𝑣𝑖𝑠2 + 0.0254𝑚𝑎𝑔𝑒 − 0.00041𝑚𝑎𝑔𝑒2 0.137 0.0037 0.00012 0.0093 (0.00015) 𝑛 = 1764,𝑅2 = 0.0256,𝑅 2 = 0.0234。 当孩子的出生体重最大时,对应的年龄为𝑚𝑎𝑔𝑒∗ = 𝛽 1 2𝛽 2 = 0.0254 [2 × −0.00041 ] = 30.96,即保持𝑛𝑝𝑣𝑖𝑠不变的情况下,在31岁时孩子的出生体重最大。 由左图可得:样本中有605位妇女年龄大于这个“最优”生育年龄,而 有746位妇女年龄大于等于这个“最优”生育年龄。 (ⅴ)你认为母亲年龄和产前检查次数解释了𝑙𝑜𝑔 𝑏𝑤𝑔𝑕𝑡 中的大部分变异吗? 由(ⅳ)中方程可知,母亲年龄和产前检查次数只解释了𝑙𝑜𝑔 𝑏𝑤𝑔𝑕𝑡 的2.56%的变异,所以解释 程度十分小,并没有解释大部分变异。 (ⅵ)确定用𝑏𝑤𝑔𝑕𝑡的自然对数或水平值来预测𝑏𝑤𝑔𝑕𝑡孰优孰劣? 用𝑏𝑤𝑔𝑕𝑡的水平值作为因变量时,回归结果如下所示: 计量经济学第 6 章计算机习题(STATA) 5 其对应的𝑅2 = 0.0192,用𝑏𝑤𝑔𝑕𝑡的水平值来预测𝑏𝑤𝑔𝑕𝑡更好。 C6.11 𝐀𝐏𝐏𝐋𝐄. 𝐑𝐀𝐖 𝒆𝒄𝒐𝒍𝒃𝒔 = 𝜷𝟎 + 𝜷𝟏𝒆𝒄𝒐𝒑𝒓𝒄 + 𝜷𝟐𝒓𝒆𝒈𝒑𝒓𝒄 + 𝒖 解:(ⅰ)以通常的格式报告结论,包括𝑅2和𝑅 2。解释价格变量的系数,并评论他们的符号和大小。 由上图可知:𝑒𝑐𝑜𝑙𝑏𝑠 = 1.97 − 2.93𝑒𝑐𝑜𝑝𝑟𝑐 + 3.03𝑟𝑒𝑔𝑝𝑟𝑐 0.38 0.59 0.71 𝑛 = 660,𝑅2 = 0.0364,𝑅 2 = 0.0335。 𝑒𝑐𝑜𝑝𝑟𝑐的系数表示当𝑟𝑒𝑔𝑝𝑟𝑐不变时,𝑒𝑐𝑜𝑝𝑟𝑐提高10%,生态标记的苹果的需求数量将会降低 0.293 𝑙𝑏𝑠;𝑟𝑒𝑔𝑝𝑟𝑐的系数表示当𝑒𝑐𝑜𝑝𝑟𝑐固定不变时,𝑟𝑒𝑔𝑝𝑟𝑐提高10%,生态标记苹果的需求数量将 会增加0.303 𝑙𝑏𝑠。由上面可知,𝑒𝑐𝑜𝑝𝑟𝑐和𝑟𝑒𝑔𝑝𝑟𝑐对生态标记苹果需求变化量的标记效应大小差 不多,但是系数符号相反。 (ⅱ)价格变量统计显著吗?报告个别𝑡检验的𝑝值。 由于𝑒𝑐𝑜𝑝𝑟𝑐和𝑟𝑒𝑔𝑝𝑟𝑐对应的𝑡统计量分别为−4.98和4.26,所以两个价格变量都统计显著,𝑝值全 部为0。 (ⅲ)𝑒𝑐𝑜𝑙𝑏𝑠拟合值的范围是多少?样本报告𝑒𝑐𝑜𝑙𝑏𝑠 = 0比例是多少?请评论。 所以,𝑒𝑐𝑜𝑙𝑏𝑠拟合值的范围是[0.855,2.087], 计量经济学第 6 章计算机习题(STATA) 6 样本报告𝑒𝑐𝑜𝑙𝑏𝑠 = 0的数据有248个,当𝑒𝑐𝑜𝑙𝑏𝑠 = 0时,需求量为0,说 明这些观测值在模型中没有被很好地解释。 (ⅳ)你认为价格变量很好地解释了𝑒𝑐𝑜𝑙𝑏𝑠中的变异吗?请解释。 两个价格变量(𝑒𝑐𝑜𝑝𝑟𝑐和𝑟𝑒𝑔𝑝𝑟𝑐)只解释了𝑒𝑐𝑜𝑙𝑏𝑠中变异的3.6%,解释程度很小,所以价格变 量并没有很好地解释了𝑒𝑐𝑜𝑙𝑏𝑠中的变异。 (ⅴ)增加变量𝑓𝑎𝑚𝑖𝑛𝑐,𝑕𝑕𝑠𝑖𝑧𝑒 家庭规模 ,𝑒𝑑𝑢𝑐和𝑎𝑔𝑒。求它们联合显著的𝑝值。你得到什么结论? C6.12 𝟒𝟎𝟏𝐊𝐒𝐔𝐁𝐒. 𝐑𝐀𝐖 𝒏𝒆𝒕𝒕𝒇𝒂 = 𝜷𝟎 + 𝜷𝟏𝒊𝒏𝒄 + 𝜷𝟐𝒂𝒈𝒆 + 𝜷𝟑𝒂𝒈𝒆 𝟐 + 𝒖 解:(ⅰ)样本中最年轻的人多少岁?这个年龄的有多少人? 所以,样本中最年轻的人有25岁,并且处于这个年龄的人有99人。 由截图可得:联合显著的𝑝值为 0.6286,所以 变量 𝑓𝑎𝑚𝑖𝑛𝑐,𝑕𝑕𝑠𝑖𝑧𝑒 家庭规模 ,𝑒𝑑𝑢𝑐和𝑎𝑔𝑒联 合不显著,不应该放入同一个回归模型中。 计量经济学第 6 章计算机习题(STATA) 7 (ⅱ)𝛽2的字面解释是什么?它本身有什么意义吗? 由于 𝜕𝑛𝑒𝑡𝑡𝑓𝑎 𝜕𝑎𝑔𝑒 = 𝛽2 + 2𝛽3𝑎𝑔𝑒,所以𝛽2的字面解释是从𝑎𝑔𝑒 = 0到𝑎𝑔𝑒 = 1的近似斜率。它本身并 没有意义,因为样本中最年轻的人都有25岁,所以从𝑎𝑔𝑒 = 0开始考察偏效应,完全没有意义。 (ⅲ)估计第(ⅱ)部分的模型,并以标准形式报告结果。你关心𝑎𝑔𝑒的系数为负吗?请解释。 由上图可知:𝑛𝑒𝑡𝑡𝑓𝑎 = −1.20 + 0.825𝑖𝑛𝑐 − 1.322𝑎𝑔𝑒 + 0.0256𝑎𝑔𝑒2 15.28 0.060 0.767 (0.0090) 𝑛 = 2017,𝑅2 = 0.1229,𝑅 2 = 0.1216。 由上述估计方程可知:转折点为𝑎𝑔𝑒的系数与𝑎𝑔𝑒2系数的两倍之比:𝑎𝑔𝑒∗ = 𝛽 1 2𝛽 2 = (−1.322) (2 × 0.0256) = 25.82,即年龄从26岁起,净总金融资产会随着年龄的增长增加。而样本 中被调查的人群最低年龄都为25岁,所以结果符合预期猜想,没有必要在意𝑎𝑔𝑒的系数为负。 (ⅳ)若认为给定收入水平下,25岁时净总金融资产的平均量最低,这有意义吗?记得𝑎𝑔𝑒对𝑛𝑒𝑡𝑡𝑓𝑎的 偏效应为𝛽2 + 2𝛽3𝑎𝑔𝑒,所以在25岁时的偏效应为𝛽2 + 2𝛽3 25 = 𝛽2 + 50𝛽3;称之为𝜃2。求𝜃 2并得 到检验𝐻0:𝜃2 = 0的双侧𝑝值。你应该得到𝜃 2很小且在统计上也不显著的结论。 定义一个新的变量𝑎𝑔𝑒0𝑠𝑞并进行回归,结果如下: 由上图可知:𝑛𝑒𝑡𝑡𝑓𝑎 = −17.18 + 0.825𝑖𝑛𝑐 − 0.0437𝑎𝑔𝑒 + 0.0256(𝑎𝑔𝑒 − 25)2 9.97 0.060 0.325 (0.0090) 计量经济学第 6 章计算机习题(STATA) 8 𝑛 = 2017,𝑅2 = 0.1229,𝑅 2 = 0.1216。 由(ⅲ)估计方程可知,𝜃 2 = 𝛽2 + 2𝛽3 25 = 𝛽2 + 50𝛽3 = −0.042,和方程中−0.0437差不多。 同时,检验𝐻0:𝜃2 = 0的双侧𝑝值为0.893,𝜃 2的𝑡统计量为-0.13,所以𝜃 2很小且在统计上也不显著。 (ⅴ)估计模型𝑛𝑒𝑡𝑡𝑓𝑎 = 𝛼0 + 𝛽1𝑖𝑛𝑐 + 𝛽3(𝑎𝑔𝑒 − 25) 2 + 𝑢,根据拟合优度,这个模型比第(ⅱ)部 分中的模型拟合的更好吗? 由上图可知:𝑛𝑒𝑡𝑡𝑓𝑎 = −18.49 + 0.824𝑖𝑛𝑐 + 0.0244(𝑎𝑔𝑒 − 25)2 2.18 0.060 (0.0025) 𝑛 = 2017,𝑅2 = 0.1229,𝑅 2 = 0.1220。 因为𝑎𝑔𝑒统计不显著,当把𝑎𝑔𝑒从模型中删除后,调整的𝑅2稍微提高了一点,所以这个模型比第 (ⅱ)部分中的模型拟合的更好,解释效果更好。 (ⅵ)对第(ⅴ)部分中估计的方程,令𝑖𝑛𝑐 = 30(大致为平均值),画图给出𝑛𝑒𝑡𝑡𝑓𝑎和𝑎𝑔𝑒的关系, 但仅限于𝑎𝑔𝑒 ≥ 25。描述你所看到的情况。 𝑛𝑒𝑡𝑡𝑓𝑎和𝑎𝑔𝑒的 关系如左图所示。 由图形趋势可 知:𝑛𝑒𝑡𝑡𝑓𝑎随着𝑎𝑔𝑒 的增长而增长,两变 量之间存在正相关 的函数关系,并且边 际递增效应逐渐增 大(即导数越来越 大 )。 当 𝑎𝑔𝑒 = 25时,导数为0。 (ⅶ)检查在方程中增加𝑖𝑛𝑐2是否必要? 当 在 方 程 中 增 加 𝑖𝑛𝑐2 时 , 回 归 结 果 如 下 图 所 示 。 由 于 𝑖𝑛𝑐2 对 应 的 系 数 值 为 −0.00054,𝑡统计量为− 0.27,所以𝑖𝑛𝑐2对𝑛𝑒𝑡𝑡𝑓𝑎几乎没有解释效果,𝑖𝑛𝑐2统计不显著,故在方程中 增加𝑖𝑛𝑐2没有必要。 10 20 30 40 50 ne ttf a 20 30 40 50 60 70 age 计量经济学第 6 章计算机习题(STATA) 9 C6.13 𝐌𝐄𝐀𝐏𝟎𝟎− 𝟎𝟏 𝒎𝒂𝒕𝒉𝟒 = 𝜷𝟎 + 𝜷𝟏𝒍𝒆𝒙𝒑𝒑𝒑 + 𝜷𝟐𝒍𝒆𝒏𝒓𝒐𝒍𝒍 + 𝜷𝟑𝒍𝒖𝒏𝒄𝒉 + 𝒖 解:(ⅰ)以通常的格式报告结果,在5%的显著性水平上,每个解释变量都是统计显著的吗? 由上图可知:𝑚𝑎𝑡𝑕4 = 91.93 + 3.52𝑙𝑒𝑥𝑝𝑝𝑝 − 5.40𝑙𝑒𝑛𝑟𝑜𝑙𝑙 − 0.449𝑙𝑢𝑛𝑐𝑕 19.96 2.10 0.94 (0.015) 𝑛 = 1692,𝑅2 = 0.3729,𝑅 2 = 0.3718。 𝑙𝑒𝑥𝑝𝑝𝑝对应的𝑝值为9.3%,当在5%的显著性水平上,其统计不显著;而𝑙𝑒𝑛𝑟𝑜𝑙𝑙和𝑙𝑢𝑛𝑐𝑕对应的𝑝值 为0,在5%的显著性水平上统计十分显著。 (ⅱ)求出第(ⅰ)部分中回归的拟合值。拟合值的取值范围是多少?它与𝑚𝑎𝑡𝑕4的实际数据取值 范围相比如何? 由截图可知:拟合值的取值范围为(42.41,92.67)。 计量经济学第 6 章计算机习题(STATA) 10 所以,拟合值与𝑚𝑎𝑡𝑕4的实际数据取值范围相比,其数据范围更窄。 (ⅲ)求出第(ⅰ)部分中回归的残差。哪类学校具有最大的(正)残差?对这个残差给予解释。 由截图可知:回归残差的平均值为−4.62 × 10−8,最大的正残差时−56.32564,对应的学校为 code 1141。这个残差衡量的是拟合的数学考试通过率和实际的数学考试通过率的差异。 (ⅳ)增加所有解释变量的平方项,检验它们的联合显著性。你会把它们放到模型中吗? 由截图可知:变量平方项的𝐹检验的𝐹值为0.52,对应的𝑝值为66.99%,显然联合不显著,所以 不应该把它们放到模型中。 计量经济学第 6 章计算机习题(STATA) 11 (ⅴ)将应变量和每个解释变量都除以各自的样本标准差,并重新进行回归。以标准差为单位,哪 个解释变量对数学考试通过率具有最大的影响? 由截图可得:𝑙𝑒𝑥𝑝𝑝𝑝、𝑙𝑒𝑛𝑟𝑜𝑙𝑙和𝑙𝑢𝑛𝑐𝑕标准化后对应的系数值分别为0.035,− 0.115和− 0.613, 所以𝑙𝑢𝑛𝑐𝑕对数学考试通过率具有最大的影响,而𝑙𝑒𝑥𝑝𝑝𝑝对数学考试通过率具有最小的影响。
/
本文档为【伍德里奇---计量经济学第6章部分计算机习题详解(STATA)】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索