为了正常的体验网站,请在浏览器设置里面开启Javascript功能!

《统计软件及应用》第三章作业参考答案

2019-04-21 10页 doc 31KB 54阅读

用户头像

is_321575

暂无简介

举报
《统计软件及应用》第三章作业参考答案P86 第一题 3. 将“ch3_Child.txt”转为Stata文件 cd C:\stata11\ado\homework    //我自己建立了一个工作目录,把“ch3_Child.txt”拷到这里 insheet using ch3_Child.txt,clear  4. 将数据以“ch3_Child.dta”为名保存 save ch3_Child des 5. 压缩数据,并比较前后数据占用空间的变化 compress des 6. 描述数据共有多少个变量,多少个观察值 共有7个变量,26个观察值。 7. 描述变量...
《统计软件及应用》第三章作业参考答案
P86 第一题 3. 将“ch3_Child.txt”转为Stata文件 cd C:\stata11\ado\homework    //我自己建立了一个工作目录,把“ch3_Child.txt”拷到这里 insheet using ch3_Child.txt,clear  4. 将数据以“ch3_Child.dta”为名保存 save ch3_Child des 5. 压缩数据,并比较前后数据占用空间的变化 compress des 6. 描述数据共有多少个变量,多少个观察值 共有7个变量,26个观察值。 7. 描述变量weight 的基本内容: . codebook  weight type:    numeric (double) range:    [11,59.4]    units:  .1 unique values:    24    missing .:  1/26 mean:    33.284 std. dev:    15.8639 percentiles:    10%      25%    50%      75%    90% 13.6        21    32        44.4    55.6 (1)变量的存储形式:double(双精度) (2)取值范围:最大值59.4,最小值11。 (3)独特取值个数:24个 (4)测量单位(unit):0.1 (5)缺失值:1个 (6)均值:33.284 (7)差:15.86392 (8) 第10、25、50、75、90百分位情况 10%        13.6        25%          21            50%          32                    75%        44.4        90%        55.6  样本的平均体重为33.284kg,有10%的样本体重在13.6kg以下;90%的样本体重在55.6kg以下。 8. 描述每个变量各有多少个缺失值。 age,sex和id 无缺失值;yrsch 和enroll各有 10个缺失值;height 和weight各有 1个缺失值 9. 将数据按照变量age的取值排序 sort age 10. 将变量按首字母顺序排列 aorder 或 order_all, alpha 11. 将变量按照id,age,sex,yrsch,enroll,height, weight 的顺序排列 order id age sex yrsch enroll height weight 12. 浏览数据的基本情况 browse 第二题 1. 将数据输入stata中并以zuove2.1命名,再进行压缩(用compress 命令) 2、将变量math 和chinese 转换为字符型变量,然后转换为数值型变量 (1)由数值型转为字符型 tostring math chinese, replace (2)由字符型转为数值型 destring math chinese,replace 3. 为数据库zuove2.1添加标签“学生成绩”,为math添加标签“数学成绩”,为gender添加标签1为“male”0为“female” (1)为数据库添加标签“学生成绩” label data “学生成绩” (2) 为math添加标签“数学成绩” label var math “数学成绩” (3)为gender添加标签1为“male”0为“female” label define gender1 0“male” 1“female” label value gender gender1 4. 将数据库用两种命令按数学成绩排序 sort math 或  gsort math 第三题 本章使用的数据为ch6_Child.dta. 先给b2、b4、yrschfm和goods1分别贴上标签。并将yrschfm定义为一个分类变量 use ch6_Child.dta label var b2 "父母亲是否在业" label var b4 "具体职业" label var yrschfm "父母亲的受教育年限" label var goods1 "家庭耐用消费品拥有量" 将yrschfm定义为分类变量: replace yrschfm =0 if  yrschfm<=6 replace yrschfm =1 if  yrschfm>=7 & yrschfm<=9 replace yrschfm =2 if  yrschfm>=10 & yrschfm<=12 replace yrschfm =3 if  yrschfm>=13 & yrschfm<=17 replace yrschfm=. if yrschfm==. label define edu 0 "小学" 1 "初中" 2 "" 3 "大学及以上" label values yrschfm edu 1.了解数据的基本情况:该数据一共有多少个变量、多少个观察值 des 该数据共有13个变量,2341个观察值, 2. (1)将sex命名为girl。将sex原有的取值1替换为0,代男孩;原有的取值2替换为1,代表女孩。 rename sex girl replace girl = 0 if girl==1 replace girl = 1 if girl==2 (2)  变量urban的名称不变,但将其原有的取值2替换为0,代表农村;原有取值1保持不变,代表城镇 replace urban= 0 if urban==2 (3)分别给这两个变量的取值贴上标签 label define girl1 0 “男孩” 1 “女孩” label values girl girl1 label define city 0 “农村” 1 “城镇” label values urban city 3. 给age girl urban生成各自的频数分布表,并回答: (1)样本中孩子的年龄分布情况 tab1 age girl urban 样本中孩子年龄在0到19岁之间,7岁和14-15岁左右分布较为密集。 (2)男孩和女孩所占比例 (3)城市样本和农村样本比例 男孩占51.6%,女孩占48.4%。性别分布较为均匀。 城市样本占样本总量的26.95%,农村样本占73.05%。接近四分之三的样本来自农村。 4. 在7岁及以上的人群中,给变量yrsch edulevel enroll 生成各自的频数分布表,并回答以下问题(注意各自的缺失值): tab1 yrsch edulevel enroll if age>=7 (1)受教育年限多集中在9年及以下,受8-9年教育的人占的比例最大(29.31%),受教育年限不少于9年的比例为32.33%,同时有11.36%的人只受过1年教育。其中存在615个缺省值。 (2)受过小学、初中、高中、大学教育的孩子所占比例分别为47.45%,38.18%,13.85%,0.52%。将大学作为一个独立分类没有明显的统计意义,因为最大年龄只统计到19岁,使得大学这一分类比例极小,可以与高中共同归为“高中及以上”。当然,样本中存在615个缺省值。 (3)在学的孩子占87.33%,不在学的孩子占12.67%。当然有620个缺省值。不在学的7岁以上年龄的孩子所占比例比较高,该问题应当引起关注,可进一步分析这些孩子是农村还是城市户口、具体年龄分布等问题。
/
本文档为【《统计软件及应用》第三章作业参考答案】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。 本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。 网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。

历史搜索

    清空历史搜索