文档库 最新最全的文档下载
当前位置:文档库 › 第八章相关与回归分析

第八章相关与回归分析

第八章相关与回归分析
第八章相关与回归分析

第八章相关分析

●第一节相关分析概述

●第二节直线相关关系的测定

●第三节回归分析

第一节相关分析概述

●一、相关关系的概念

●现象相互之间的数量关系可以从形式上分为两种类型:一类是严格的确定性的函数关

系,另一类是不严格的不确定性的相关关系。

●相关关系是现象之间确实存在有数量上的依存关系,但这种数量上的关系是不确定的。函数关系的例子

?某种商品的销售额(y)与销售量(x)之间的关系可表示为y = px (p 为单价)

?圆的面积(S)与半径之间的关系可表示为S= R2

?企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3

函数关系

1.是一一对应的确定关系

2.设有两个变量x 和y ,变量y 随变量x 一起变化,并完全依赖于x ,当变量x 取

某个数值时,y 依确定的关系取相应的值,则称y 是x 的函数,记为y = f (x),其中x 称为自变量,y 称为因变量

3.各观测点落在一条线上

相关关系(几个例子)

相关关系的例子

?父亲身高(y)与子女身高(x)之间的关系

?收入水平(y)与受教育程度(x)之间的关系

?粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系

?商品的消费量(y)与居民收入(x)之间的关系

?商品销售额(y)与广告费支出(x)之间的关系

相关关系

1.变量间关系不能用函数关系精确表达

2.一个变量的取值不能由另一个变量唯一确定

3.当变量x 取某个值时,变量y 的取值可能有几个

4.各观测点分布在直线周围

二、相关关系的种类

(1)相关关系按涉及的变量的多少分为单相关、复相关和偏相关。

单相关就是两个变量之间的相关关系。是研究一个因变量与一个自变量的依存关系。

复相关就是多个变量之间的相关关系。是研究一个因变量与两个或两个以上自变量的依存关系。

偏相关就是在复相关研究中,如果假定其它变量不变,仅研究某一个变量对另一个变量的依存关系。

(2)相关关系按方向不同分为正相关和负相关。

正相关是指变量之间存在着同向变动的相关关系,即当一个变量的数值有小变大,另一个变量的数值也相应地由小变大

负相关是指变量之间存在着反向变动的相关关系,即当一个变量的数值有小变大,另一个变量的数值却由大变小。

(3)相关关系按表现的形式不同分为线性相关和非线性相关。

当一个变量变动时,另一个变量也随之发生大致均等的变动,从图形上看,二者对应点分布近似地在一条直线附近,这种相关关系就称为线性相关关系。

当一个变量变动时,另一个变量也随之发生变动,但从图形上看,二者对应点分布

近似地在一条曲线附近,这种相关关系就称为非线性相关关系。

(4)相关关系按相关程度不同分为完全相关、不完全相关和不相关。

完全相关就是当一个变量的变动完全由另一个变量的变动所决定。(函数关系)

当两个变量之间完全不存在任何依存关系,各自独立变动,其相关程度为零,称为不相关或零相关。

当变量之间的关系介于完全相关与不相关之间,称为不完全相关。

三、相关分析的内容

● 1.确定现象之间是否存在相关关系,以及相关关系的表现形式

● 2.测定相关关系的密切程度和方向

● 3.确定现象之间相关关系的一般关系式

● 4.测定变量估计值的可靠程度

第二节直线相关关系的测定

判断现象之间有无相关关系,应先进行定性分析,即依据理论知识、实践经验对现象之间是否存在相关关系及相关关系的类型作出判断。然后在此基础上进行定量分析,即运用相关图、相关表和相关系数等方法对现象之间的相关关系进行描述与测度。

㈠相关表㈡相关关系的图示㈢相关系数

一、相关表

相关表是指按照相关现象的数量对应关系以及一定的逻辑顺序编制成的一种统计表。

通过相关表可以初步看出各变量之间的相关关系。

●相关图是指把相关表中原始的对应数值在平面直角坐标图中用点描绘出来,用以反映

其分布状况的统计图,也称散点图、散布图。

●从相关点的分布情况,就可以直观地、近似地观察出两个变量之间有无相关关系、相

散点图

(scatter diagram)

不相关

负线性相关

正线性相关

非线性相关

完全负线性相关

完全正线性相关

散点图(例题分析)

【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据

散点图(例题分析)

不良贷款与贷款余额的散点图

2

4

6

8

10

12

14

0100200300400

贷款余额

不良贷款与贷款项目个数的散点图

2

4

6

8

10

12

14

010203040

贷款项目个数

不良贷款与固定资产投资额的散点图

2

4

6

8

10

12

14

050100150200

固定资产投资额

不良贷款与累计应收贷款的散点图

2

4

6

8

10

12

14

0102030

累计应收贷款

三、 相关系数

1.相关系数的概念及其公式

相关表与相关图只能大致反映变量间的相关关系要准确反映变量之间的相关程度,就需要计算相关系数。

相关系数是测量变量之间的密切程度的指标。测定两个变量之间线性关系密切程度的指标称为单线性相关系数或线性单相关系数。通常用字母r 表示。 积差法公式:

()()

()()

222

..y

y x x y y x x r y x xy ----=

=∑∑σσσ (简单式)∑∑∑∑∑∑∑---=

2222)

(.)(.y y n x x n y x xy n r

()

985

.01428879125587700124087

8090282450012)(.)(.4087

80902

2

2

222=-?-

??-?=

---=∑∑∑∑∑∑∑y y n x x n y

x xy n r

2.相关关系的密切程度的判断标准

●相关系数的取值范围一定是在-1≤r≤+1,或0≤r≤1这一闭区间。

●当r=1时,表示与变量为完全相关,即确定性的函数关系。

●当r=0时,表明所有的相关点的分布都是杂乱无章的,说明变量与变量无关。

●如果0<r<1,表示xy 为正相关;

●当-1<r<0时,表示xy 为负相关,。

3.直线相关分析的特点

●1)参与相关分析的两个变量是对等关系,不分自变量和因变量,因此,相关系数只有

一个。

●2)相关系数有正负号,它们反映相关关系的方向,正号反映正相关,负号反映负相关。

●3)相关的两个变量必须是随机的,这也是对等关系的反映。

第三节回归分析

一、回归分析的含义

什么是回归

回归是由英国著名统计学家Francis Galton在19世纪末期研究孩子及其父母的身高时提出来的。Galton发现身材高的父母,他们的孩子也高。但这些孩子平均起来并不像他们父母那样高。比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们父母的平均身高高。Galton把这种孩子的身高向中间值靠近的趋势称之为一种回归效应,而他发展的研究两个数值变量之间数量关系的方法称为回归分析。

什么是回归分析?

1.从一组样本数据出发,确定变量之间的数学关系式

2.对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找

出哪些变量的影响显著,哪些不显著

3.利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,

并给出这种预测或控制的精确程度

回归分析与相关分析的关系

联系:二者都是对客观事物数量依存关系的分析。一方面,相关分析是回归分析的基础和前提。另一方面,回归分析是相关分析的深入和继续。

回归分析与相关分析的区别

1.相关分析中,变量x变量y 处于平等的地位;回归分析中,变量y 称为因变量,处

在被解释的地位,x 称为自变量,用于预测因变量的变化

2.相关分析中所涉及的变量x 和y 都是随机变量;回归分析中,因变量y 是随机变量,

自变量x可以是随机变量,也可以是非随机的确定变量

3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量

x 对变量 y 的影响大小,还可以由回归方程进行预测和控制

二、 简单直线回归方程的配合方法 回归方程式,其一般形式为:bx a y c += 应用最小平方法原理有:

∑∑+=x b na y ∑∑∑+=2

x

b x a xy

∑∑∑∑∑--=

2

2)(x x n y x xy n b x b y n

x b n

y a -=-=

∑∑

三、估计标准误差

估计标准误差是就是观察值 对估计值 的平均离差,也叫回归误差,是衡量因变量的估计值与观测值之间的平均误差大小的指标。

2

)

(2

--=

∑n y y S c

y 简捷公式 :2

2

---=

∑∑∑n xy b y a y

S y

四、 估计标准误差和相关系数的关系

221y

y S r σ-

±= 2

1r S y y -=σ

回归模型的类型

一元线性回归

1. 涉及一个自变量的回归

2. 因变量y 与自变量x 之间为线性关系

? 被预测或被解释的变量称为因变量(dependent variable),用y 表示

? 用来预测或用来解释因变量的一个或多个变量称为自变量(independent variable),用x 表示

3. 因变量与自变量之间的关系用一条线性方程来表示 回归模型(regression model)

1. 回答“变量之间是什么样的关系?”

2. 方程中运用

? 1 个数字的因变量(响应变量)

? 被预测的变量

? 1 个或多个数字的或分类的自变量 (解释变量)

? 用于预测的变量

3. 主要用于预测和估计 一元线性回归模型

1. 描述因变量 y 如何依赖于自变量 x 和误差项ε 的方程称为回归模型

2. 一元线性回归模型可表示为

y = A + B x + e

? y 是 x 的线性函数(部分)加上误差项

? 线性部分反映了由于 x 的变化而引起的 y 的变化 ? 误差项 ε 是随机变量

? 反映了除 x 和 y 之间的线性关系之外的随机因素对 y 的影响 ? 是不能由 x 和 y 之间的线性关系所解释的变异性 ? A 和 B 称为模型的参数

一元线性回归模型(基本假定)

1. 误差项ε是一个期望值为0的随机变量,即E (ε)=0。对于一个给定的 x 值,y 的期望值为

2. Y =A+ B x

3. 对于所有的 x 值,ε的方差σ2 都相同

4. 误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N ( 0 ,σ2 )

? 独立性意味着对于一个特定的 x 值,它所对应的ε与其他 x 值所对应的ε不相关

? 对于一个特定的 x 值,它所对应的 y 值与其他 x 所对应的 y 值也不相关

回归方程 (regression equation)

1. 描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程

2. 一元线性回归方程的形式如下

3. Y = A + Bx 方程的图示是一条直线,也称为直线回归方程

A 是回归直线在 y 轴上的截距,是当 x =0 时 y 的期望值

B 是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值 估计的回归方程(estimated regression equation)

1. 总体回归参数 A 和 B 是未知的,必需利用样本数据去估计

2. 用样本统计量a 和b 代替回归方程中的未知参数A 和B ,就得到了估计的回归方程

3.一元线性回归中估计的回归方程为 Yc=a+bx 其中: a 是估计的回归直线在 y 轴上的截距, b 是直线的斜率,它表示对于一个给定的 x 的值, Yc 是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值. 参数的最小二乘估计

1. 使因变量的观察值与估计值之间的离差平方和达到最小来求得a 和b 的方法。即

最小=--=-∑∑==n

i i i n

i c i

bx a y y y

1

21

2

)()(

2. 用最小二乘法拟合的直线来代表x 与y 之间的关系与实际数据的误差比其他任何直线都小

根据最小二乘法的要求,可得求解a 和b 的公式如下

?

??

??-=--=∑∑∑∑∑x

b y a X X n Y X XY n b 22)(

已求得如下过程数据:

∑∑∑∑====6029,541250,30800,3392

X XY Y X

由最小二乘法标准方程得回归系数的计算值为:

82

.6733960292030800

33954125020)(2

2

2=-??-?=

--=

∑∑∑∑∑X X n Y X XY n b

45.39020

339

82.672030800=?-=

-=

∑∑n

X

b n

Y a 得出Y 对X 的直线回归方程为:X bX a Y c 82.6745.390+=+= 方程的意义

回归直线的拟合优度

变差

1. 因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面

? 由于自变量 x 的取值不同造成的

? 除 x 以外的其他因素(如x 对y 的非线性影响、测量误差等)的影响

2. 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示

变差的分解

(图示)

x

y

y

y bx

a y c +=y

y -{}}

c

c y

y -c y

y c -

)

,(i i y x 离差平方和的分解

(三个平方和的关系)

SST = SSR + SSE

2

()

()

()∑∑∑===-+-=

-n

i c i n

i c n

i i y y y y y y 1

2

1

2

1

2

总平方和(SST )

{

回归平方和

(SSR )

残差平方和

(SSE )

{

{

离差平方和的分解 (三个平方和的意义)

1.总平方和(SST)

?反映因变量的n 个观察值与其均值的总离差

2.回归平方和(SSR)

?反映自变量x 的变化对因变量y 取值变化的影响,或者说,是由于x 与y 之间的线性关系引起的y 的取值变化,也称为可解释的平方和

3.残差平方和(SSE)

?反映除x 以外的其他因素对y 取值的影响,也称为不可解释的平方和或剩余平方和

?从上图可以看出,在总变差平方和(SST)中回归离差平方和(SSR)的比例越大,回归直线拟合越好。

统计学基础 第八章 相关与回归分析

统计学基础第八章相关与回归分析 【教学目的】 1.掌握相关系数的测定和性质 2.明确相关分析与回归分析的特点 3.建立回归直线方程,掌握估计标准误差的计算 【教学重点】 1.相关关系、相关分析和回归分析的概念 2.相关系数计算 3.回归方程的建立和依此进行估计和预测 【教学难点】 1.相关分析和回归分析的区别 2.相关系数的计算 3.回归系数的计算 4.估计标准误的计算 【教学时数】 教学学时为8课时 【教学内容参考】 第一节相关关系 一、相关关系的含义 宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。 相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,

体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。 在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。 二、相关关系的特点 1.现象之间确实存在数量上的依存关系 如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。 2.现象之间数量上的关系是不确定的 相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。 三、相关关系的种类 现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类: (一)正相关与负相关 按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。 (二)单相关与复相关 按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因

第8章 相关分析与回归分析及答案

第八章相关与回归分析 一、本章重点 1.相关系数的概念及相关系数的种类。事物之间的依存关系,可以分为函数关系和相关关系。相关关系又有单向因果关系和互为因果关系;单相关和复相关;线性相关和非线性相关;不相关、不完全相关和完全相关;正相关和负相关等类型。 2.相关分析,着重掌握如何画相关表、相关图,如何测定相关系数、测定系数以及进行相关系数的推断。相关表和相关图是变量间相关关系的生动表示,对于未分组资料和分组资料计算相关系数的方法是不同的,一元线性回归中相关系数和测定系数有着密切的关系,得到样本相关系数后还要对总体相关系数进行科学推断。 3.回归分析,着重掌握一元回归的基本原理方法,一元回归是线性回归的基础,多元线性回归和非线性回归都是以此为基础的。用最小平方法估计回归参数,回归参数的性质和显著性检验,随机项方差的估计,回归方程的显著性检验,利用回归方程进行预测是回归分析的主要内容。 4.应用相关与回归分析应注意的问题。相关与回归分析都有它们的应用范围,必须知道在什么情况下能用,什么情况下不能用。相关分析和回归分析必须以定性分析为前提,否则可能会闹出笑话,在进行预测时选取的样本要尽量分散,以减少预测误差,在进行预测时只有在现有条件不变的情况下才能进行,如果条件发生了变化,原来的方程也就失去了效用。 二、难点释疑 本章难点在于计算公式多,不容易记忆,所以更要注重计算的练习。为了掌握基本计算的内容,起码应认真理解书上的例题,做完本指导书上的全部计算题。初学者可能会感到本章公式多且复杂,难于记忆,其实只要抓住Lxx、Lxy、Lyy 这三个记号,记住它们的展开式,几个主要的公式就不难记忆了。如果能自己把这些公式推证一下,搞清其关系,那就更容易记住了。 三、练习题 (一)填空题 1事物之间的依存关系,根据其相互依存和制约的程度不同,可以分为(函数关系)和(相关关系)两种。 2.相关关系按相关关系的情况可分为()和();按自变量的多少分(单相关)和(复相关);按相关的表现形式分(线性相关)和(非线性相关);按相关关系的密切程度分(完全相关)、(不完全相关)和(不相关);按相关关系的方向分(正相关)和(负相关)。 3.回归方程只能用于由(自变量)推算(因变量)。 4.一个自变量与一个因变量的线性回归,称为(一元线性回归) 5.估计变量间的关系的紧密程度用(相关系数) 6.在相关分析中,要求两个变量都是随机的,而在回归分析中要求自变量是(不是随机的),因变量是(随机的)。 7.已知剩余变差为250,具有12对变量值资料,那么这时的估计标准误差是()。 8.将现象之间的相关关系,用表格来反映,这种表称为(相关表),将现象之间的相关关系用图表示称(相关图)。

高中数学:第八章 方差分析与回归分析

高中数学:第八章 方差分析与回归分析 §1 单因素试验的方差分析 试验指标:研究对象的某种特征。 例 各人的收入。 因素:与试验指标相关的条件。 例 各人的学历,专业,工作经历等与工资有关的特征。 因素水平:因素所在的状态 例 学历是因素,而高中,大学,研究生等,就是学历因素水平;数学,物理等就是专业的水平。 问题:各因素水平对试验指标有无显著的差异? 单因素试验方差分析模型 假设 1) 影响试验指标的因素只有一个,为A ,其水平有r 个:1,,r A A L ; 2) 每个水平i A 下,试验指标是一个总体i X 。各个总体的抽样过程 是独立的。 3)2~(,)i i i X N μσ,且22i j σσ=。 问题:分析水平对指标的影响是否相同 1)对每个总体抽样得到样本{,1}ij i X j n ≤≤,由其检验假设: 原假设0:i j H μμ=,,i j ?;备选假设:1:i j H μμ≠,,i j ?; 2)如果拒绝原假设,则对未知参数21,,,r μμσL 进行参数估计。 注 1)接受假设即认为:各个水平之间没有显著差异,反之则有显著差异。

2)在水平只有两个时,问题就是双正态总体的均值假设检验问题和参数估计问题。 检验方法 数据结构式:ij i ij i ij X μεμδε=+=++,偏差2~(0,)ij N εσ是相互独立的, 11r i i i n n μμ==∑。不难验证,1 0r i k δ==∑。 各类样本均值 水平i A 的样本均值:1 1i n i ij j i X X n == ∑g ; 水平总样本均值:11111i n r r ij i i i j i X X n X n n =====∑∑∑,1 r i i n n ==∑; 偏差平方和与效应 组间偏差平方和: 2 221 1 ()r r A i i i i i i S n X X n X nX ===-=-∑∑g g ;(衡量由不同水平产生的差异) 组内偏差平方和: 2 2 211 1 1 ()()i i n n r r E ij i ij i i i j i j S X X X n X =====-=-∑∑∑∑g g ; (衡量由随机因素在同一水平上产生的差异) 总偏差平方和: 2 2 211 1 ()i n r r T ij i ij i j i S X X n X nX ====-=-∑∑∑; (综合衡量因素,水平之间,随机因素的差异) 定理1(总偏差平方和分解定理) T A E S S S =+。 即2 2 211 11 11 ()()()i i i n n n r r r ij ij i i i j i j i j X X X X X X ======-=-+-∑∑∑∑∑∑g g ,或直接证明。 注:利用11 ()()0i n r ij i i i j X X X X ==--=∑∑即可证明。 定理2(统计特性) 2 ()E ES n r σ=-,2 21(1)r A i i i ES r n σδ==-+∑,2 21 (1)r T i i i ES n n σδ==-+∑。

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案 一、单选题 1.相关分析研究的是( A ) A、变量间相互关系的密切程度 B、变量之间因果关系 C、变量之间严格的相依关系 D、变量之间的线性关系 2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 4.相关系数等于零表明两变量(B)。 A.是严格的函数关系 B.不存在相关关系 C.不存在线性相关关系 D.存在曲线线性相关关系 5.相关关系的主要特征是(B)。 A、某一现象的标志与另外的标志之间的关系是不确定的 B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系 C、某一现象的标志与另外的标志之间存在着严格的依存关系 D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系 B、两变量静态的依存关系 C、一个变量随时间不同其前后期变量值之间的依存关系 D、一个变量的数值与时间之间的依存关系 7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间 (D)。 A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关 8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。 A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是(A)。 A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指(D)。 A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归 11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A ) A. y=6000+24x B. y=6+0.24x C. y=24000+6x D. y=24+6000x 12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关 B.表明现象负相关

第八章、相关与回归分析

第八章、相关与回归分析 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为( ) A. 不相关 B. 负相关 C. 正相关 D. 复相关 2.判断现象间线性相关关系的密切程度的主要方法是( ) A. 对现象做定性分析 B. 编相关表 C. 绘相关图 D. 计算相关系数 3.相关系数可以说明( ) A. 现象之间的因果关系 B. 现象之间的函数关系 C. 相关关系的方向和密切程度 D. 相关关系的表现形式 4.相关系数r的取值范围( ) A. 0≤r≤1 B. -1<r<1 C. -1≤r≤1 D. -1≤r≤0 5.配合一元线性回归方程对资料的要求是( ) A. 因变量是给定的数值, 自变量是随机的 B.自变量是给定的数值, 因变量是随机的 C. 自变量和因变量都是随机的 D.自变量和因变量都不是随机的 6.产品产量与单位成本的相关系数是-0.88, 单位成本与利润率的相关系数是-0.94, 产量与利润之间的相关系数是0.81, 因此( ) A. 产量与利润的相关程度最高 B. 单位成本与利润率的相关程度最高 C. 产量与单位成本的相关程度最高 D.看不出哪对变量间的相关程度最高 7.每吨铸件成本(元)和每一个工人劳动生产率(吨)之间的回归方程为 , 这意味着劳动生产率提高1吨,单位成本平均将( ) A. 降低269.5元 B. 提高269.5元 C. 降低0.5元 D. 提高0.5元 8.每吨铸件成本(元)和铸件废品率(%)之间的回归方程为, 这意味着( ) A. 废品率每增加1%, 每吨成本平均增加64元 B. 废品率每增加1%, 每吨成本平均增加8% C. 废品率每增加1%, 每吨成本平均增加8元 D. 废品率每增加1%, 则每吨成本为56元 9.下列不属于相关关系的是( ) A.劳动生产率与工资的关系 B.投资额与国民收入的关系

第八章相关与回归分析习题参考答案

二、计算与分析题 1.根据下列资料编制直线回归方程并计算估计标准误差。 (1)已知8 .29.036 2522 ====a r y x σσ解:b=x bx a Y r x y 08.18.2?,08.15 69.0+=+==? =σσ 62 .281.01612=-=-≈r S y y σ(2)已知X 、Y 两变量, ,是的两倍,求相关系数r=? 6.1=xx xy L L y σx σ解:r= 8.02 6 .1== yy xx xy L L L 2.某家俱厂生产家俱的总成本与木材耗用量有关,根据记录资料如下表: 月 份 1234567木材耗电量(千米) 2.4 2.1 2.3 1.9 1.9 2.1 2.4总成本(千克) 3.1 2.6 2.9 2.7 2.8 3.0 3.2 (1)建立以总成本为因变量的回归直线方程。(2)计算回归方程的估计标准误差。(3)计算相关系数,判断其相关程度。解:(1)=a+bx=1.27+0.768x (2)=1592.022=-∑-∑-∑=n xy b y a Y S y (3)r==0.754y x b σσ3、广告的作用测定:在现代营销战中,广告的作用功不可没。受娃娃哈集团的委托,时代统计调查事务所调查研究了1995-2004年期间的娃娃哈集团的广告投入力度与平均销量的问题。其有数据资料整理如下表所示。 年份广告费用(万元) 平均销量(百万箱) 1995199619971998199920002001200220032004 891215161718192123 8.0010.4010.6712.3514.2315.5416.4218.7019.5022.87

第八章相关与回归分析

第八章相关分析 ●第一节相关分析概述 ●第二节直线相关关系的测定 ●第三节回归分析 第一节相关分析概述 ●一、相关关系的概念 ●现象相互之间的数量关系可以从形式上分为两种类型:一类是严格的确定性的函数关 系,另一类是不严格的不确定性的相关关系。 ●相关关系是现象之间确实存在有数量上的依存关系,但这种数量上的关系是不确定的。函数关系的例子 ?某种商品的销售额(y)与销售量(x)之间的关系可表示为y = px (p 为单价) ?圆的面积(S)与半径之间的关系可表示为S= R2 ?企业的原材料消耗额(y)与产量(x1) 、单位产量消耗(x2) 、原材料价格(x3)之间的关系可表示为y = x1 x2 x3 函数关系 1.是一一对应的确定关系 2.设有两个变量x 和y ,变量y 随变量x 一起变化,并完全依赖于x ,当变量x 取 某个数值时,y 依确定的关系取相应的值,则称y 是x 的函数,记为y = f (x),其中x 称为自变量,y 称为因变量 3.各观测点落在一条线上 相关关系(几个例子) 相关关系的例子 ?父亲身高(y)与子女身高(x)之间的关系 ?收入水平(y)与受教育程度(x)之间的关系 ?粮食亩产量(y)与施肥量(x1) 、降雨量(x2) 、温度(x3)之间的关系 ?商品的消费量(y)与居民收入(x)之间的关系 ?商品销售额(y)与广告费支出(x)之间的关系 相关关系 1.变量间关系不能用函数关系精确表达 2.一个变量的取值不能由另一个变量唯一确定 3.当变量x 取某个值时,变量y 的取值可能有几个 4.各观测点分布在直线周围 二、相关关系的种类 (1)相关关系按涉及的变量的多少分为单相关、复相关和偏相关。 单相关就是两个变量之间的相关关系。是研究一个因变量与一个自变量的依存关系。 复相关就是多个变量之间的相关关系。是研究一个因变量与两个或两个以上自变量的依存关系。 偏相关就是在复相关研究中,如果假定其它变量不变,仅研究某一个变量对另一个变量的依存关系。 (2)相关关系按方向不同分为正相关和负相关。 正相关是指变量之间存在着同向变动的相关关系,即当一个变量的数值有小变大,另一个变量的数值也相应地由小变大 负相关是指变量之间存在着反向变动的相关关系,即当一个变量的数值有小变大,另一个变量的数值却由大变小。 (3)相关关系按表现的形式不同分为线性相关和非线性相关。 当一个变量变动时,另一个变量也随之发生大致均等的变动,从图形上看,二者对应点分布近似地在一条直线附近,这种相关关系就称为线性相关关系。 当一个变量变动时,另一个变量也随之发生变动,但从图形上看,二者对应点分布

相关文档
相关文档 最新文档