两个变量的线性相关
一、学习目标:
1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系.
2.了解最小二乘法的含义,知道最小二乘法的思想
,能根据给出的线性回归方程系数公式建立线性回归方程. 3.在两个变量具有线性相关关系时,会在散点图中作出线性回归直线,会用线性回归方程进行预测.
二、学习重点与难点:
学习重点:回归直线方程的求解方法. 学习难点:回归直线方程的求解方法.
三、课堂过程:
1.创设情境,揭示课题
的点在坐标系内标出,得到散点图.
从散点图可以看出.这些点大致分布在通过散点图中心的一条直线的附近.
如果散点图中点的分布从整体看大致分布在一条直线的附近,我们称这两个变量之间具有线性相关关系,这条直线叫回归直线.
如果能够求出这条回归直线的方程,我们就可以比较清楚的了解热茶销量与气温之间的关系.
2.最小二乘法
选择怎样的直线近似地表示热茶销量与气温之间的关系? 我们有多种思考方案:
(1)选择能反映直线变化的两个点,例如取(4,50),(18,24)这两点的直线; (2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;
(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;
怎样的直线最好呢? ------从整体上看,各点与此直线的距离最小.
即:用方程为?y
bx a =+的直线拟合散点图中的点,应使得该直线与散点图中的点最接近.那么,怎样衡量直线?y
bx a =+与图中六个点的接近程度呢? 我们将表中给出的自变量x 的六个值带入直线方程,得到相应的六个?y
的值: 26,18,13,10,4,b a b a b a b a b a b a +++++-+.这六个值与表中相应的实际值应该越接近越好.所以,我们
用类似于估计平均数时的思想,考虑离差的平方和:
222222
22(,)(2620)(1824)(1334)(1038)(450)(64)12866140382046010172
Q a b b a b a b a b a b a b a b a ab b a =+-++-++-++-+
+-+-+-=++--+
(,)Q a b 是直线?y
bx a =+与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线?y bx a =+与图中六个点的接近程度,所以,设法取,a b 的值,使(,)Q a b 达到最小值.这种方法叫做最小平方法(又称最小二乘
法) .
先把a 看作常数,那么Q 是关于b 的二次函数.易知,当1403820
21286
a b -=-
?时, Q 取得最小值.同理, 把b 看作
常数,那么Q 是关于a 的二次函数.当140460
12b a -=-时, Q 取得最小值.因此,当1403820
21286140460
12
a b b a -?
=-????-?=-??
时,Q 取
得最小值,由此解得 1.6477,57.5568b a ≈-≈.所求直线方程为? 1.647757.5568y x =-+.当5x =-时,?66y
≈,故当气温为5-0
C 时,热茶销量约为66杯. 3.线性回归方程的求解方法
一般地,设有n 个观察数据如下:
当,a b 使1122n n 取得最小值时,就称y
bx a =+为拟合这n 对数据的线性回归方程,该方程所表示的直线称为回归直线.
上述式子展开后,是一个关于,a b 的二次多项式,应用配方法,可求出使Q 为最小值时的,a b 的值.即
????
?????
-=--=---=---=--==-=--∑∑∑∑x b y a x n x y
x n y x x x y y x x b n i i n i i i n i i n i i i 2
1
21
11)())((,(*) ∑==n i i x n x 11, ∑==n i i y n y 11 线性回归方程是
?y
bx a =+,其中b 是回归方程的斜率,a 是截距.系数 4.求线性回归方程的步骤: (1)计算平均数y x ,;
(2)计算i i y x 与的积,求∑i i y x ;
(3)计算
∑2
i x ;
(4)将结果代入公式
∑∑=--
-=--=
n
i i
n i i i x
n x
y
x n y x b 1
2
21,求b ;
(5)用 x b y a -=,求a ; (6)写出回归方程
5. 线性回归方程的应用
(2)求出回归直线方程 解:(1)散点图(略).
(2)表中的数据进行具体计算,列成以下表格
故可得到
257
30
75
.4
3.
399
, 75 .4
30
7
70002
≈
?
-
=≈
?
-
=
a
b
从而得回归直线方程是^ 4.75257
y x
=+.
6.小结:
对一组数据进行线性回归分析时,应先画出其散点图,看其是否呈直线形,再依系数,a b的计算公式,算出,a b.写出回归方程
7.课后作业:P92练习.