中学生物理成绩与数学成绩之间的关系
摘要:在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就没有什么问
。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系,本文针对这一问题做了研究。在某某中学随机抽取了48位学生期末考试中的数学成绩和物理成绩进行研究,研究表明中学生的数学成绩与物理成绩之间有较好的线性相关关系,数学成绩并不能决定物理成绩,但能在一定程度上影响物理成绩。
关键词:数学成绩 物理成绩 线性回归
正文:
一、问题分析
在学校里,老师对学生经常这样说:“如果你的数学成绩好,那么你的物理学习就没有什么问题。”按照这种说法,似乎学生的物理成绩与数学成绩之间存在着一种相关关系,这种说法有没有根据呢?我对此进行了研究。
二、模型假设
1.物理试卷与数学试卷的难度差异很小。
2.忽略样本间的差异(如:考试心理、学习习惯、复习策略等)。
3.忽略考场环境(如:监考严格程度等)的影响。
三、模型建立
(一)数据收集
从某某中学随机抽取48名学生的期末考试的数学与物理成绩作为样本数据。
序号
1
2
3
4
5
6
7
8
9
10
11
12
数学
108
102
106
114
128
102
99
90
99
88
90
83
物理
78
67
66
64
78
74
59
58
61
52
54
56
序号
13
14
15
16
17
18
19
20
21
22
23
24
数学
98
82
85
91
87
79
74
120
115
110
72
104
物理
65
55
52
56
55
47
43
73
70
66
43
61
序号
25
26
27
28
29
30
31
32
33
34
35
36
数学
99
64
93
87
55
63
75
65
69
68
54
46
物理
64
37
50
45
27
35
44
34
39
31
24
30
序号
37
38
39
40
41
42
43
44
45
46
47
48
数学
35
46
49
49
52
63
65
37
26
37
30
32
物理
19
27
24
32
34
32
39
14
14
23
18
18
(二)回归分析理论
1.回归分析相关概念
回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
正相关—— 一个散点图,如果它们散布在从左下角到右上角的区域。对于两个变量的这种相关关系,我们将它成为正相关。
负相关—— 一个散点图,如果它们散布在从左上角到右下角的区域。对于两个变量的这种相关关系,我们将它成为负相关。
相关系数r —— 在统计中用相关系数r来衡量两个变量之间的线性关系的强弱。若相应于变量x的取值xi,变量y的观测值为yi(1≤i≤n),则两个变量的相关系数的计算公式为
注意:对于相关系数r,首先值得注意的是它的符号。当r为正时,表明变量x和y正相关;当r为负时,表明变量x和y负相关。另一个值得注意的是r的大小。统计学认为,对于变量x,y,如果r ∈〔-1,-0.75〕,那么负相关很强;如果r ∈(0.75,1),那么正相关很强;如果r ∈(-0.75,-0.30)或r ∈ (0.30,0.75),那么相关性一般;如果r ∈ (-0.25,0.25),那么相关性较弱。
2.回归分析主要内容
(1)从一组数据出发确定某些变量之间的定量关系式,即建立数学模型并估计其中的 未知参数。估计参数的常用方法是最小二乘法。
(2)对这些关系式的可信程度进行检验。
(3)在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量选入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。
(4)利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便。
3.回归分析的步骤
(1)根据预测目标,确定自变量和因变量
明确预测的具体目标,也就确定了因变量。如预测具体目标是下一年度的销售量,那么销售量Y就是因变量。通过市场调查和查阅资料,寻找与预测目标的相关影响因素,即自变量,并从中选出主要的影响因素。
(2)建立回归预测模型
依据自变量和因变量的历史统计资料进行计算,在此基础上建立回归分析方程,即回归分析预测模型。
(3)进行相关分析
回归分析是对具有因果关系的影响因素(自变量)和预测对象(因变量)所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时,建立的回归方程才有意义。因此,作为自变量的因素与作为因变量的预测对象是否有关,相关程度如何,以及判断这种相关程度的把握性多大,就成为进行回归分析必须要解决的问题。进行相关分析,一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关的程度。
(4)检验回归预测模型,计算预测误差
回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误差较小,才能将回归方程作为预测模型进行预测。
(5)计算并确定预测值
利用回归预测模型计算预测值,并对预测值进行综合分析,确定最后的预测值。
4.应注意的问题
应用回归预测法时应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。
正确应用回归分析预测时应注意:
①用定性分析判断现象之间的依存关系;
②避免回归预测的任意外推;
③应用合适的数据资料;
(三)运用回归分析对数据进行预测
通过对数据的分析,发现大多数学生数学成绩好,那么他的物理成绩也比较好。
利用Matlab制作散点图:如下图(横坐标为数学成绩,纵坐标为物理成绩)。
Matlab实现:
x=[108 102 106 114 128 102 99 90 99 88 90 83 98 82 85 91 87 79 74 120 115 110 72 104 99 64 93 87 55 63 75 65 69 68 54 46 35 46 49 49 52 63 65 37 26 37 30 32]
y=[78 67 66 64 78 74 59 58 61 52 54 56 65 55 52 56 55 47 43 73 70 66 43 61 64 37 50 45 27 35 44 34 39 31 24 30 19 27 24 32 34 32 39 14 14 23 18 18]
plot(x,y,'*')
图1——散点图
由散点图发现,数学成绩与物理成绩之间有较好的线性相关关系。所以利用线性回归对数据进行分析。
建立回归模型:
对两个参数进行估计(最小二乘法)。
四、模型求解
Matlab实现:
x=[108 102 106 114 128 102 99 90 99 88 90 83 98 82 85 91 87 79 74 120 115 110 72 104 99 64 93 87 55 63 75 65 69 68 54 46 35 46 49 49 52 63 65 37 26 37 30 32]
y=[78 67 66 64 78 74 59 58 61 52 54 56 65 55 52 56 55 47 43 73 70 66 43 61 64 37 50 45 27 35 44 34 39 31 24 30 19 27 24 32 34 32 39 14 14 23 18 18]
x=[ones(48,1) x'];
[b,bint,r,rint,stats]=regress(y',x);
b,bint,stats,rcoplot(r,rint)
输出结果:
残差图:
图2——残差图
回归系数:
b =
-5.2787
0.6677
回归系数的置信区间(默认置信度95%):
bint =
-9.2490 -1.3083
0.6187 0.7166
stats =
0.9425 754.6194 0 19.6260
回归方程为: y= -5.2787+ 0.6677*x
模型结果分析:
1.根据散点图可以观察出中学生物理成绩与数学成绩成一定的正相关关系。
2.0.9425(R2统计量值:要判断实际观察值是否紧密地分布在回归直线两侧,以及紧密的程度如何,必须对回归直线的拟合优度goodnenss-of-fit进行检验。R2就是判断回归直线拟合优度的一个重要标准,它的取值范围在0~1之间,如果值小,就表明模型没有很好地拟合数据),本模型的拟合效果比较好。同时说明在某种程度上中学生的数学成绩与物理成绩相关性较强。
3.754.6194 ( F统计量值用于检验
:β1=0,两个临界值F0.05=4.75, F0.01=9.33,Matlab: finv(1-α,1,12)),与0.00(p-value)配套使用。说明回归方程的线性关系显著。
p-value远小于0.05,拒绝H0,所建立的线性回归模型合理,可以使用。
4.19.6260 (总误差/(n-2),即:
)
5.回归方程的解释:β1值等于0.6677,意味着:当数学成绩1分时,物理成绩就会相应地增加0.6677分。由此可见,β1值表示的是自变量对因变量的影响的大小。β1值还有正值和负值之分,如本例是正值,说明写作对阅读有积极的影响,如果是负值就是负面的影响,所以β1值还可以表示自变量对因变量的影响方向。
Matlab画图:(画回归直线:横坐标为数学成绩,纵坐标为物理成绩))
x=[108 102 106 114 128 102 99 90 99 88 90 83 98 82 85 91 87 79 74 120 115 110 72 104 99 64 93 87 55 63 75 65 69 68 54 46 35 46 49 49 52 63 65 37 26 37 30 32]
y=[78 67 66 64 78 74 59 58 61 52 54 56 65 55 52 56 55 47 43 73 70 66 43 61 64 37 50 45 27 35 44 34 39 31 24 30 19 27 24 32 34 32 39 14 14 23 18 18]
xx=15:2:130
yy= -5.2787+ 0.6677*xx
plot(x,y,'*',xx,yy)
图3——回归直线
结论:根据研究表明,中学生的数学成绩并不能决定物理成绩,但能在一定程度上影响物理成绩。
五、模型分析
1.本模型建立的比较合理,在一定程度上反映了数学成绩和物理成绩之间的联系。
继续阅读