文档库 最新最全的文档下载
当前位置:文档库 › 北师大版数学高二3.1回归分析 教案 (北师大选修2-3)

北师大版数学高二3.1回归分析 教案 (北师大选修2-3)

北师大版数学高二3.1回归分析  教案 (北师大选修2-3)
北师大版数学高二3.1回归分析  教案 (北师大选修2-3)

高中数学:3.1回归分析 教案 (北师大选修2-3)

教学目标:

1. 通过对统计案例的探究,会对两个随机变量进行线性回归分析.

2. 理解相关系数的含义,会计算两个随机变量的线性相关系数,会通过线性相关系数判断

它们之间的线性相关程度.

3. 通过对数据之间散点图的观察,能够对两个随机变量进行可线性化的回归分析. 教学重点:

散点图的画法,回归直线方程的求解方法;相关系数的求法与应用. 教学难点

回归直线方程的求解方法; 相关系数的求法与应用; ;能够对两个随机变量进 行可线性化的回归分析. 教法:启发诱导式

第一课时(回归分析)

教学过程

一、问题情境

客观事物是相互联系的 过去研究的大多数是因果关系,但实际上更多存在的是一种非因果关系 比如说:某某同学的数学成绩与物理成绩,彼此是互相联系的,但不能认为数学是“因”,物理是“果”,或者反过来说 事实上数学和物理成绩都是“果”,而真正的“因”是学生的理科学习能力和努力程度 所以说,函数关系存在着一种确定性关系 但还存在着另一种非确定性关系——相关关系 二、新授

在必修课程中,我们已经学习了最小二乘法,并会建立变量之间的线性回归方程.引导学生阅读教材,然后完成知识点的填充.

(一) 知识讲解

1.相关关系的概念

两个变量间的关系可分为确定关系和非确关系,前者又称为函数关系,后者又称为相关关系.

2.回归方程

设有n 对观测数据(,)i i x y (1,2,3,

,)i n =,根据线性回归模型,对于每一个i x ,

对应的随机偏差项()i i i y a bx ε=-+,我们希望总偏差越小越好,即要使

21

n

i

i ε

=∑越小越

好.所以,只要求出使2

1

(,)()

n

i

i

i Q y x αββα==

--∑取得最小值时的α,β值作为a ,

b 的估计值,记为a ,b .

注:这里的i ε就是拟合直线上的点(),i i x a bx +到点(),i i i P x y 的距离. 用什么方法求a ,b ?

回忆《数学3(必修)》“2.4线性回归方程”P71“热茶问题”中求a ,b 的方法:最小二乘法.

利用最小二乘法可以得到a ,b 的计算公式为

11

22211()()()()n n

i i i i i i n n

i i

i i x x y y x y nx y b x x x n x a y bx

====?

---?

?==??--??=-??∑∑∑∑, 其中11n i i x x n ==∑,1

1n

i i y y n ==∑

由此得到的直线y a bx =+就称为这n 对数据的回归直线,此直线方程即为线性回归方程.其中a ,b 分别为a ,b 的估计值,a 称为回归截距,b 称为回归系数,y 称为回归值.

(二) 举例应用

例1.下表给出了我国从1949年至1999年人口数据资料,试根据表中数据估计我国2004年的人口数.

年份

1949 1954 1959 1964 1969 1974 1979 1984 1989 1994 1999

人口数/百万 542 603 672 705 807 909 975 1035 1107 1177 1246

解:为了简化数据,先将年份减去1949,并将所得值用x 表示,对应人口数用y 表示,x 0 5 10 15 20 25 30 35 40 45 50 y

542 603 672 705 807 909 975 1035 1107 1177 1246

作出11个点(),x y 构成的散点图,

由图可知,这些点在一条直线附近,可以用线性回归模型y a bx ε=++来表示它们之间的关系.

根据公式(1)可得

14.453,

527.591.

b a ?≈??

≈?? 这里的,a b 分别为,a b 的估 计值,因此线性回归方程 为527.59114.453y x =+

由于2004年对应的55x =,代入线性回归方程527.59114.453y x =+可得

1322.506y =(百万),即2004年的人口总数估计为13.23亿.

对应练习:课本

6P 练习

小结:1.线性相关的概念;2.理解回归方程的系数来历;3.求回归方程的步骤. 作业:课本15

P 习题1-1,1题的第二问

第二节相关系数

教学过程: 一.问题情境

对任意给定的样本数据,由计算公式都可以求出相应的线性回归方程,但求得的线性回归方程未必有实际意义.左图中的散点明显不在一条直线附近,不能进行线性拟合,求得的线性回归方程是没有实际意义的;右图中的散点基本上在一条直线附近,我们可以粗略地估计两个变量间有线性相关关系,但它们线性相关的程度如何,如何较为精确地刻画线性相关关系呢?为了回答这个问题,我们需要对变量x 与y 的线性相关性进行检验(简称相关性检验),那么就需要学习相关系数来处理. 二、新授

(一)知识点讲解

1.相关系数的计算公式:

对于x ,y 随机取到的n 对数据(,)i i x y (1,2,3,,)i n =,样本相关系数r 的计算

公式为

()()

n

n

i

i

i i

x x y y x y nx y

r ---=

=

∑∑.()2

2.相关系数r 的性质: (1)||1r ≤;

(2)||r 越接近与1,x ,y 的线性相关程度越强; (3)||r 越接近与0,x ,y 的线性相关程度越弱.

可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. (二) 应用举例

要分析学生高中入学的数学成绩对高一年级数学学习的影响,在高一年级学生中随机抽

(2)如果x 与y 之间具有线性相关关系,求线性回归方程;

(3)若某学生入学数学成绩为80分,试估计他高一期末数学考试成绩.

解:(1)因为()1

6367767010

x =

?+++=,()1

6578757610

y =

?+++=,

10

1()()1894xy i i i L x x y y ==--=∑,2

10

1

()2474xx i i L x x ==-=∑,

10

21

()2056yy i i L y y ==-=∑.

因此求得相关系数为10

()()

0.840i

i

x x y y L r --=

=

=∑.

结果说明这两组数据的相关程度是比较高的; 点评:解决这类问题的解题步骤:

(1)作出散点图,直观判断散点是否在一条直线附近; (2)求相关系数r ;

(3)计算a ,b ,写出线性回归方程.

对应练习:课本9

P 练习

五.回顾小结:

1.相关系数的计算公式与回归系数b 计算公式的比较; 2.相关系数的性质;

3.探讨相关关系的基本步骤. 六.课外作业:1516P -习题1-1第2题.

第三节可线性化的回归分析

教学过程: 一.问题情境

前面我们学习的是利用线性回归方程与相关系数判断两个随机变量间的相关关系的,那么能否利用散点图将其他的常见函数拟合成线性关系呢?这也是我们本节课将要学习的可线性化的回归分析问题 二、新授

(一)知识点讲解

在实际问题中,有时两个变量之间的关系并不是线性关系,这就需要我们根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数.下面列举出一些常见的曲线方程,并给出相应的化为线性回归方程的换元公式. (1)b y a x =+

,令'y y =,1

'x x

=,则有''y a bx =+.

(2)b

y ax =,令'ln y y =,'ln x x =,'ln a a =,则有'''y a bx =+. (3)bx

y ae =,令'ln y y =,'x x =,'ln a a =,则有'''y a bx =+. (4)b x y ae =,令'ln y y =,1

'x x

=

,'ln a a =,则有'''y a bx =+. (5)ln y a b x =+,令'y y =,'ln x x =,则有''y a bx =+.

(二)应用举例

某地区对本地的企业进行了一次抽样调查,下表是这次抽查中所得到的各企业的人均资本x (万元)与人均产出y (万元)的数据:

(1)设y 与x 之间具有近似关系b

y ax ≈(,a b 为常数),试根据表中数据估计a 和b 的值;

(2)估计企业人均资本为16万元时的人均产出(精确到0.01).

分析:根据x ,y 所具有的关系可知,此问题不是线性回归问题,不能直接用线性回归

方程处理.但由对数运算的性质可知,只要对b

y ax ≈的两边取对数,就能将其转化为线性关系.

解(1)在b

y ax ≈的两边取常用对数,可得lg lg lg y a b x ≈+,设lg y z =,lg a A =,

lg x X =,则z A bX ≈+.相关数据计算如图327--所示.

仿照问题情境可得A ,b 的估计值A ,b 分别为0.2155,

1.5677,

A b ?=-??=??由lg 0.2155a =-可得

0.6088a ≈,即a ,b 的估计值分别为0.6088和1.5677.

(2)由(1)知 1.56770.6088y x =.样本数据及回归曲线的图形如图328--(见书本102P

页)

当16x =时, 1.56770.60881647.01y =?≈(万元),故当企业人均资本为16万元时,人均产值约为47.01万元. 2.练习:13P 练习. 五.回顾小结:

1. 线性回归模型y a bx ε=++与确定性函数y a bx =+相比,它表示y 与x 之间是统计

相关关系(非确定性关系)其中的随机误差ε提供了选择模型的准则以及在模型合理的情况下探求最佳估计值a ,b 的工具;

2. 线性回归方程y a bx =+中a ,b 的意义是:以a 为基数,x 每增加1个单位,y 相应

地平均增加b 个单位; 3.求线性回归方程的基本步骤. 六.课外作业:16P 第4题.

相关文档