文档库 最新最全的文档下载
当前位置:文档库 › 第七章回归与相关分析练习及答案

第七章回归与相关分析练习及答案

第七章回归与相关分析练习及答案
第七章回归与相关分析练习及答案

第七章回归与相关分析

一、填空题

1.现象之间的相关关系按相关的程度分为、和;按相关的形式分为和;按影响因素的多少分

为和。

2.两个相关现象之间,当一个现象的数量由小变大,另一个现象的数

量,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量,这种相关称为负相关。

3.相关系数的取值范围是。

4.完全相关即是关系,其相关系数为。

5.相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。

6.直线相关系数等于零,说明两变量之间;直线相关系数等1,说明两变量之间;直线相关系数等于—1,说明两变量之间。 7.对现象之间变量的研究,统计是从两个方面进行的,一方面是研究变量之间关系的,这种研究称为相关关系;另一方面是研究关于自变量和因变量之间的变动关系,用数学方程式表达,称为。

8.回归方程y=a+bx中的参数a是,b是。在统计中估计待定参数的常用方法是。

9. 分析要确定哪个是自变量哪个是因变量,在这点上它

与不同。

10.求两个变量之间非线性关系的回归线比较复杂,在许多情况下,非线性回归问题可以通过化成来解决。

11.用来说明回归方程代表性大小的统计分析指标是。

12.判断一条回归直线与样本观测值拟合程度好坏的指标

是。

二、单项选择题

1.下面的函数关系是( )

A销售人员测验成绩与销售额大小的关系 B圆周的长度决定于它的半径 C家庭的收入和消费的关系 D数学成绩与统计学成绩的关系

2.相关系数r的取值范围( )

A -∞

B -1≤r≤+1

C -1

D 0≤r≤+1

3.年劳动生产率z(干元)和工人工资y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均( )

A增加70元 B减少70元 C增加80元 D减少80元

4.若要证明两变量之间线性相关程度是高的,则计算出的相关系数应接近于( )

A+1 B 0 C 0.5 D [1]

5.回归系数和相关系数的符号是一致的,其符号均可用来判断现象( )

A线性相关还是非线性相关 B正相关还是负相关

C完全相关还是不完全相关 D单相关还是复相关

6.某校经济管理类的学生学习统计学的时间(x)与考试成绩(y)之间建立线=a+b x。经计算,方程为y c=200—0.8x,该方程参数的计算( ) 性回归方程y

c

A a值是明显不对的

B b值是明显不对的

C a值和b值都是不对的 C a值和6值都是正确的

7.在线性相关的条件下,自变量的均方差为2,因变量均方差为5,而相关系数为0.8时,则其回归系数为:( )

A 8

B 0.32

C 2

D 12.5

8.进行相关分析,要求相关的两个变量( )

A都是随机的 B都不是随机的 C一个是随机的,一个不是随机的

D随机或不随机都可以

9.下列关系中,属于正相关关系的有( )

A合理限度内,施肥量和平均单产量之间的关系

B产品产量与单位产品成本之间的关系

C商品的流通费用与销售利润之间的关系

D流通费用率与商品销售量之间的关系

10.相关分析是研究( )

A变量之间的数量关系 B变量之间的变动关系

C变量之间的相互关系的密切程度 D变量之间的因果关系

=a+bx,b<0,则x与y之间的相关系数 ( )

11.在回归直线y

c

A r=0

B r=l

C 0

D -1

12.在回归直线yc=a+bx中,b表示( )

A当x增加一个单位,,y增加a的数量

B当y增加一个单位时,x增加b的数量

C当x增加一个单位时,y的均增加量

D当y增加一个单位时,x的平均增加量

13.当相关系数r=0时,表明( )

A现象之间完全无关 B相关程度较小

C现象之间完全相关 D无直线相关关系

14.下列现象的相关密切程度最高的是( )

A某商店的职工人数与商品销售额之间的相关系数0.87

B流通费用水平与利润率之间的相关关系为-0.94

C商品销售额与利润率之间的相关系数为0.51

D商品销售额与流通费用水平的相关系数为-0.81

15.估计标准误差是反映( )

A平均数代表性的指标 B相关关系的指标

C回归直线的代表性指标 D序时平均数代表性指标

三、多项选择题

1.下列哪些现象之间的关系为相关关系( )

A家庭收入与消费支出关系 B圆的面积与它的半径关系

C广告支出与商品销售额关系 D单位产品成本与利润关系

E在价格固定情况下,销售量与商品销售额关系

2.相关系数表明两个变量之间的( )

A线性关系 B因果关系 C变异程度 D相关方向 E相关的密切程度

3.对于一元线性回归分析来说( )

A两变量之间必须明确哪个是自变量,哪个是因变量

B回归方程是据以利用自变量的给定值来估计和预测因变量的平均可能值

C可能存在着y依x和x依y的两个回归方程

D回归系数只有正号

E 确定回归方程时,尽管两个变量也都是随机的,但要求自变量是给定的。 4.可用来判断现象相关方向的指标有( )

A相关系数 B回归系数 C回归方程参数a D估计标准误 E x、y 的平均数

=78- 2x,这表示( ) 5.单位成本(元)依产量(千件)变化的回归方程为y

c

A产量为1000件时,单位成本76元

B产量为1000件时,单位成本78元

C产量每增加1000件时,单位成本下降2元

D产量每增加1000件时,单位成本下降78元

E当单位成本为72元时,产量为3000件

6.估计标准误的作用是表明( )

A回归方程的代表性 B样本的变异程度 C估计值与实际值的平均误差 D样本指标的代表性 E总体的变异程度

7.销售额与流通费用率,在一定条件下,存在相关关系,这种相关关系属于( )

AlE相关 B单相关 C负相关 D复相关 E完全相关

8.在直线相关和回归分析中( )

A据同一资料,相关系数只能计算一个 B据同一资料,相关系数可以计算两个

C据同一资料,回归方程只能配合一个 D据同一资料,回归方程随自变量与因变量的确定不同,可能配合两个

E回归方程和相关系数均与自变量和因变量的确定无关

9.相关系数r的数值( )

A可为正值 B可为负值 C可大于1 D可等于-1 E可等于1

10.从变量之间相互关系的表现形式看,相关关系可分为( )

A正相关 B负相关 C直线相关 D曲线相关 E不相关和完全相关

11.确定直线回归方程必须满足的条件是( )

A现象间确实存在数量上的相互依存关系 B相关系数r必须等于1

Cy与x必须同方向变化 D现象间存在着较密切的直线相关关系

E相关系数r必须大于0

12.当两个现象完全相关时,下列统计指标值可能为( )

A r=1

B r=0

C r=-1

D S

yx =0 E S

yx

=1

13.在直线回归分析中,确定直线回归方程的两个变量必须是( )

A一个自变量,一个因变量 B均为随机变量 C对等关系

D一个是随机变量,一个是可控制变量 E不对等关系

14.配合直线回归方程是为了( )

A确定两个变量之间的变动关系 B用因变量推算自变量

C用自变量推算因变量 D两个变量相互推算 E确定两个变量间的相关程度

15.在直线回归方程中( )

A在两个变量中须确定自变量和因变量 B一个回归方程只能作一种推算 C回归系数只能取正值 D要求两个变量都是随机变量 E要求因变量是随机的,而自变量是给定的。

16.相关系数与回归系数( )

A回归系数大于零则相关系数大于零 B回归系数小于零则相关系数小于零

C回归系数大于零则相关系数小于零 D回归系数小于零则相关系数大于零

E回归系数等于零则相关系数等于零

四、判断题

1.相关关系和函数关系都属于完全确定性的依存关系。 ( )

2.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。( )

3.假定变量x与y的相关系数是0.8,变量m与n的相关系数为—0.9,则x与y的相关密切程度高。( )

4.当直线相关系数r=0时,说明变量之间不存在任何相关关系。( )

5.相关系数r有正负、有大小,因而它反映的是两现象之间具体的数量变动关系。( )

6.在进行相关和回归分析时,必须以定性分析为前提,判定现象之间有无关系及其作用范围。( )

7.回归系数b的符号与相关系数r的符号,可以相同也可以不相同。( ) 8.在直线回归分析中,两个变量是对等的,不需要区分因变量和自变量。( ) 9.相关系数r越大,则估计标准误差 S

xy

值越大,从而直线回归方程的精确性越低。( )

10.进行相关与回归分析应注意对相关系数和回归直线方程的有效性进行检验。( )

11.工人的技术水平提高,使得劳动生产率提高。这种关系是一种不完全的正相关关系( )

12.正相关指的就是两个变量之间的变动方向都是上升的( )

13.回归分析和相关分析一样所分析的两个变量都一定是随机变量( )

14.相关的两个变量,只能算出一个相关系数( )

15.一种回归直线只能作一种推算,不能反过来进行另一种推算( )

五、计算题

1.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:

(1)说明两变量之间的相关方向;

(2)建立直线回归方程;

(3)计算估计标准误差;

(4)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。

2.检查5位同学统计学的学习时间与成绩分数如下表:

要求:(1)由此计算出学习时数与学习成绩之间的相关系数;

(2)建立直线回归方程;

(3)计算估计标准误差。

3.某种产品的产量与单位在成本的资料如下:

要求:(1)计算相关系数r,判断其相关议程和程度;

(2)建立直线回归方程;

(3)指出产量每增加1000件时,单位成本平均下降了多少元?

4.某地高校教育经费(x)与高校学生人数(y)连续6年的统计资料如下:

要求:(1)建立议程回归直线方程,估计教育经费为500万元的在校学生数;

(2)计算估计标准误差。

5.设某公司下属十个门市部有关资料如下:

(1)确立适宜的回归模型;

(2)计算有关指标,判断这三种经济现象之间的相关紧密程度。

第七章回归与相关分析

一、填空题

1.完全相关、不完全相关、不相关;直线相关、曲线相关;单相关、复相关

2.也由小变大、由大变小

3.—1≤r≤1

4.函数,

1 r

5.直线相关

6.无线性相关;完全正相关、完全负相关

7.密切程度、回归分析

8.y轴上截距、回归系数、最小二乘法

9.回归分析、相关分析

10.变量变换、线性关系

11.估计标准误差

12.样本决定系数

二、单项选择题

1.B 3.B 3.A 4.D 5.B 6.C 7.C 8.A 9.A 10.C 11.D 12.C 13.D 14.B 15.C

三、选择题

1.ACD 2.DE 3.ABCE 4.AB 5.ACE 6.AC

7.BC 8.AD 9.ABDE 10.CD 11.AD 12.ACD

13.ADE 14.AC 15.ABE 16.ABE

四、判断题

1.X 2.√ 3.X 4.X 5.X 6.√ 7.X 8.X 9.X 10.√ 11.√12.X 13.X 14.√15.√

五、计算题

1.(1)r=0.9478 (2)y=395.567+0.8958x (3)S

yx=

126.764 (4)1 380.947

2.(1)0.9558 (2)y=20.4+5.2x (3)S

yx

=6.532

3.(1)r=0.91 (2)y=77.37-1.82x (3)1.82元

4.(1)y=-17.92+0.0955x,29.83 (2)S

yx

=0.9299

5.y=6.3095+1.6169x1-0.9578x2

第七章相关与回归分析

第七章 相关与回归分析 一、本章学习要点 (一)相关分析就是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。现象之间的相互关系可以分为两种,一种是函数关系,一种是相关关系。函数关系是一种完全确定性的依存关系,相关关系是一种不完全确定的依存关系。相关关系是相关分析的研究对象,而函数关系则是相关分析的工具。 相关按其程度不同,可分为完全相关、不完全相关和不相关。其中不完全相关关系是相关分析的主要对象;相关按方向不同,可分为正相关和负相关;相关按其形式不同,可分为线性相关和非线性相关;相关按影响因素多少不同,可分为单相关和复相关。 (二)判断现象之间是否存在相关关系及其程度,可以根据对客观现象的定性认识作出,也可以通过编制相关表、绘制相关图的方式来作出,而最精确的方式是计算相关系数。 相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“γ”表示,其特点表现在:参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个;相关系数有正负号反映相关系数的方向,正号反映正相关,负号反映负相关;计算相关系数的两个变量都是随机变量。 相关系数的取值区间是[-1,+1],不同取值有不同的含义。当1||=γ时,x 与y 的变量为完全相关,即函数关系;当1||0<<γ时,表示x 与y 存在一定的线性相关,||γ的数值越大,越接近于1,表示相关程度越高;反之,越接近于0,相关程度越低,通常判别标准是:3.0||<γ称为微弱相关,5.0||3.0<<γ称为低度相关,8.0||5.0<<γ称为显著相关,1||8.0<<γ称为高度相关;当0||=γ时,表示y 的变化与x 无关,即不相关;当0>γ时,表示x 与y 为线性正相关,当0<γ时,表示x 与y 为线性负相关。 皮尔逊积距相关系数计算的基本公式是: ∑∑∑∑∑∑∑---= =] )(][)([22222y y n x x n y x xy n y x xy σσσγ 斯皮尔曼等级相关系数和肯特尔等级相关系数是测量两个等级变量(定序测度)之间相 关密切程度的常用指标。 (三)回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。回归分析按自变量的个数分,有一元回归和多元回归,按回归线的形状分,有线性回归和非线性回归。与相关分析相比,回归分析的特点是:两个变量是不对等的,必须区分自变量和因变量;因变量是随机的,自变量是可以控制的量;对于一个没有因果关系的两变量,可以求得两个回归方程,一个是y 倚x 的回归方程,一个是x 倚y 的回归方程。 简单线性回归方程式为:bx a y c +=,式中c y 是y 的估计值,a 代表直线在y 轴上的截距,b 表示直线的斜率,又称为回归系数。回归系数的涵义是,当自变量x 每增加一个单位时,因变量y 的平均增加值。当b 的符号为正时,表示两个变量是正相关,当b 的符号为负时,表示两个变量是负相关。a 、b 都是待定参数,可以用最小平方法求得。求解a 、b 的公式为: ∑∑∑∑∑--= 2 2)(x x n y x xy n b ; n x b n y a ∑∑-= 回归估计标准误差是衡量因变量的估计值与观测值之间的平均误差大小的指标。利用此 指标可以说明回归方程的代表性。其计算公式为: 2 ) (2 --= ∑n y y S c yx 或2 2 ---= ∑∑∑n xy b y a y S yx 回归估计标准误和相关系数之间具有以下关系:

第7章 相关与回归分析。

第七章相关与回归分析 学习内容 一、变量间的相关关系 二、一元线性回归 三、线性回归方程拟合优度的测定 学习目标 1. 掌握相关系数的含义、计算方法和应用 2. 掌握一元线性回归的基本原理和参数的最小二 3. 掌握回归方程的显著性检验 4. 利用回归方程进行预测 5. 了解可化为线性回归的曲线回归 6. 用Excel 进行回归分析 一、变量间的相关关系 1. 变量间的关系(函数关系) 1)是一一对应的确定关系。 2)设有两个变量x和y,变量y 随变量x一起变化, 并完全依赖于x,当变量x 取某个数值时,y依确定的关系取相应的值, 则称y 是x的函数,记为y = f (x),其中x 称为自变量,y 称为因变量。 3)各观测点落在一条线上。 4)函数关系的例子 –某种商品的销售额(y)与销售量(x)之间的关系可表示为 y = p x (p 为单价)。 –圆的面积(S)与半径之间的关系可表示为S = π R2。 –企业的原材料消耗额(y)与产量x1、单位产量消耗x2、原材料价格x3间的关系可表 示为y =x1 x2 x3。 单选题 下面的函数关系是() A、销售人员测验成绩与销售额大小的关系 B、圆周的长度决定于它的半径 C、家庭的收入和消费的关系 D、数学成绩与统计学成绩的关系

2. 变量间的关系(相关关系) 1)变量间关系不能用函数关系精确表达。 2)一个变量的取值不能由另一个变量唯一确定。 3)当变量 x 取某个值时,变量 y 的取值可能有几个。 4)各观测点分布在直线周围。 5)相关关系的例子 –商品的消费量(y)与居民收入(x)之间的关系。 –商品销售额(y)与广告费支出(x)之间的关系。 –粮食亩产量(y)与施肥量(x1)、降雨量(x2)、温度 (x3)之间的关系。 –收入水平(y)与受教育程度(x)之间的关系。 –父亲身高(y)与子女身高(x)之间的关系。 3. 相关图表 1)相关表:将具有相关关系的原始数据,按某一顺序平行排列在一张表上,以观察它 们之间的相互关系。 2)相关图:也称为分布图或散点图,它是在平面直角坐标中把相关关系的原始数据用 点描绘出来,通常以直角坐标轴的横轴代表自变量x,纵轴代表因变量y。 4. 相关关系的类型

统计学题目第七章相关与回归分析

(一) 填空题 1、 现象之间的相关关系按相关的程度分有________相关、________相关和_______ 相关;按相关的方向分有________相关和________相关;按相关的形式分有-________相关和________相关;按影响因素的多少分有________相关和-________相关。 2、 对现象之间变量关系的研究中,对于变量之间相互关系密切程度的研究,称为 _______;研究变量之间关系的方程式,根据给定的变量数值以推断另一变量的可能值,则称为_______。 3、 完全相关即是________关系,其相关系数为________。 4、 在相关分析中,要求两个变量都是_______;在回归分析中,要求自变量是 _______,因变量是_______。 5、 person 相关系数是在________相关条件下用来说明两个变量相关________的统 计分析指标。 6、 相关系数的变动范围介于_______与_______之间,其绝对值愈接近于_______, 两个变量之间线性相关程度愈高;愈接近于_______,两个变量之间线性相关程度愈低。当_______时表示两变量正相关;_______时表示两变量负相关。 7、 当变量x 值增加,变量y 值也增加,这是________相关关系;当变量x 值减少, 变量y 值也减少,这是________相关关系。 8、 在判断现象之间的相关关系紧密程度时,主要用_______进行一般性判断,用_______进行数量上的说明。 9、 在回归分析中,两变量不是对等的关系,其中因变量是_______变量,自变量是 _______量。 10、 已知13600))((=----∑y y x x ,14400)(2=--∑x x ,14900)(2=-∑-y y ,那么,x 和y 的相关系数r 是_______。 11、 用来说明回归方程代表性大小的统计分析指标是________指标。 12、 已知1502=xy σ,18=x σ,11=y σ,那么变量x 和y 的相关系数r 是_______。 13、 回归方程bx a y c +=中的参数b 是________,估计特定参数常用的方法是 _________。 14、 若商品销售额和零售价格的相关系数为-0.95,商品销售额和居民人均收入的相关系数为0.85,据此可以认为,销售额对零售价格具有_______相关关系,销售额与人均收入具有_______相关关系,且前者的相关程度_______后者的相关程度。 15、 当变量x 按一定数额变动时,变量y 也按一定数额变动,这时变量x 与y 之间存在着_________关系。 16、 在直线回归分析中,因变量y 的总变差可以分解为_______和_______,用公式表示,即_____________________。 17、 一个回归方程只能作一种推算,即给出_________的数值,估计_________的可能值。 18、 如估计标准误差愈小,则根据回归直线方程计算的估计值就_______ 19、 已知直线回归方程bx a y c +=中,5.17=b ;又知30=n ,∑=13500y ,

应用回归分析课后习题第7章第6题

7.6一家大型商业银行有多家分行,近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做定量分析,以便找出控制不良贷款的方法。表7-5是该银行所属25家分行2002年的有关业务数据。 (1)计算y 与其余4个变量的简单相关系数。 由系数表可知,y 与其余4个变量的简单相关系数分别为0.844,0.732,0.700,0.519. (2)建立不良贷款对4个自变量的线性回归方程,所得的回归系数是否合理? 由上表可知,回归方程为为: 022.1029.0015.0148.04.0?4321--++=x x x x y 从上表可看出,方程的自变量2x 、3x 、4x 未通过t 检验,说明回归方程不显著,而且由实际意义出发,4x 的系数不能是负的,所以所得的回归系数不合理。 (3)分析回归模型的共线性。

由上表可知,所有自变量对应的VIF 全部小于10,所以自变量之间不存在共线性。但进行特征根检验见下表: 由这个表可以看出来,第5行中1x 、3x 的系数分别为0.87和0.63,可以说明这两个变量之间有共线性。 (4)采用后退法和逐步回归法选择变量,所得的回归系数是否合理?是否还存在共线性? 采用后退法(见上表),所得回归方程为972.0029.0149.0041.0y ?421--+=x x x 采用逐步回归法(见上表),所得回归方程为443.0032.005.0?41--=x x y 所得4x 的系数不合理(为负),说明存在共线性. (5)建立不良贷款y 对4个变量的岭回归。

第七章相关分析

第七章相关分析 第一节Bivariate Correlations过程 7.1.1 主要功能 7.1.2 实例操作 第二节Partial Correlations过程 7.2.1 主要功能 7.2.2 实例操作 第三节Distances Correlations过程 7.3.1 主要功能 7.3.2 实例操作 任何事物的存在都不是孤立的,而是相互联系、相互制约的。在医学领域中,身高与体重、体温与脉搏、年龄与血压等都存在一定的联系。说明客观事物相互间关系的密切程度并用适当的统计指标表示出来,这个过程就是相关分析。 值得注意,事物之间有相关,不一定是因果关系,也可能仅是伴随关系。但如果事物之间有因果关系,则两者必然相关。 SPSS的相关分析是借助于Statistics菜单的Correlate选项完成的。 第一节 Bivariate过程 7.1.1 主要功能 调用此过程可对变量进行相关关系的分析,计算有关的统计指标,以判断变量之间相互关系的密切程度。调用该过程命令时允许同时输入两变量或两个以上变量,但系统输出的是变量间两两相关的相关系数。 返回目录返回全书目录

7.1.2 实例操作 [例7-1]某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下,试作发硒与血硒的相关分析。 7.1.2.1 数据准备 激活数据管理窗口,定义变量名:发硒为X,血硒为Y,按顺序输入相应数值,建立数据库(图7.1)。 图7.1 原始数据的输入 7.1.2.2 统计分析

激活Statistics菜单选Correlate中的Bivariate...命令项,弹出Bivariate Correlation对话框(图7.2)。在对话框左侧的变量列表中选x、y,点击?钮使之进入Variables框;再在Correlation Coefficients框中选择相关系数的类型,共有三种:Pearson为通常所指的相关系数(r),Kendell’s tau-b为非参数资料的相关系数,Spearman为非正态分布资料的Pearson 相关系数替代值,本例选用Pearson项;在Test of Significance框中可选相关系数的单侧(One-tailed)或双侧(Two-tailed)检验,本例选双侧检验。 图7.2 相关分析对话框 点击Options...钮弹出Bivariate Correlation:Options对话框(图7.3),可选有关统计项目。本例要求输出X、Y的均数与标准差以及XY交叉乘积的标准差与协方差,故选Means and standard deviations和Cross-product deviations and covariances项,而后点击Continue钮返回Bivariate Correlation对话框,再点击OK钮即可。 图7.3 相关分析统计对话框 7.1.2.3 结果解释: 在结果输出窗口中将看到如下统计数据:变量X、Y的例数、均数与标准差,变量X、Y交叉乘积的例数、标准差与协方差;XY两两对应的相关系数及其双侧检验的概率,本例r = 0.8715,P = 0.001。

第七章 相关与回归分析s

第七章 相关回归分析 皮尔逊线性相关系数计算的基本公式: (简捷法) ])(][)([(积差法)22222∑∑∑∑∑∑∑--- ==y y n x x n y x xy n s s s y x xy γ 简单线性回归方程式为:bx a y c +=, 式中c y 是y 的估计值,a 代表直线在y 轴上的截距,b 表示直线的斜率,又称为回归系数。回归系数的涵义是,当自变量x 每增加一个单位时,因变量y 的平均增加值。 当b 的符号为正时,表示两个变量是正相关,当b 的符号为负时,表示两个变量是负相关。a 、b 都是待定参数,可以用最小平方法求得。 求解a 、b 的公式为: ∑∑∑∑∑--=22) (x x n y x xy n b ; n x b n y a ∑∑-= 相关系数与回归系数之间具有以下的关系: x y s s r b = (一) 填空题 1.在相关关系中,把具有因果关系相互联系的两个变量中起影响作用的变量称为_______,把另一个说明观察结果的变量称为________。 2.现象之间的相关关系按相关的程度分有________相关、________相关、________相关和_______相关;按相关的方向分有________相关和______ _相关;按影响因素的多少分有________相关和________相关。 3.对现象之间变量关系的研究中,对于变量之间相互关系密切程度的研究,称为_______;研究变量之间关系的方程式,根据给定的变量数值以推断另一变量的可能值,则称为_______。 4.完全相关即是________关系,其相关系数为________。 5.相关系数的变动范围介于_______与_______之间,其绝对值愈接近于_______,两个变量之间线性相关程度愈高;愈接近于_______,两个变量之间线性相关程度愈低。当_______时表示两变量正相关;_______时表示两变量负相关。 6.当变量x 值增加,变量y 值也增加,这是________相关关系;当变量x 值减少,变量y 值也减少,这是________相关关系。 7.已知13600))((=----∑y y x x ,14400)(2=--∑x x ,14900)(2 =-∑-y y ,那么,x 和y 的相关系数r 是_______。 8.已知1502=xy s ,18=x s ,11=y s ,那么变量x 和y 的相关系数r 是_______。 9.已知直线回归方程bx a y c +=中,5.17=b ;又知30=n , ∑=13500y ,12=- x , 则可知_______=a 。

应用回归分析,第7章课后习题参考答案

第7章岭回归 思考与练习参考答案 7.1 岭回归估计是在什么情况下提出的? 答:当自变量间存在复共线性时,|X’X|≈0,回归系数估计的方差就很大,估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。 7.2岭回归的定义及统计思想是什么? 答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其统计思想是对于(X’X)-1为奇异时,给X’X加上一个正常数矩阵 D, 那么X’X+D接近奇异的程度就会比X′X接近奇异的程度小得多,从而完成回归。但是这样的回归必定丢失了信息,不满足blue。但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。 7.3 选择岭参数k有哪几种方法? 答:最优 是依赖于未知参数 和 的,几种常见的选择方法是: 岭迹法:选择 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太多;

方差扩大因子法: ,其对角线元 是岭估计的方差扩大因子。要让 ; 残差平方和:满足 成立的最大的 值。 7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是: 1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小。我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量; 2. 当k值较小时,标准化岭回归系数的绝对值并不很小,但是不稳定,随着k的增加迅速趋近于零。像这样岭回归系数不稳定、震动趋于零的自变量,我们也可以予以剔除; 3. 去掉标准化岭回归系数很不稳定的自变量。如果有若干个岭回归系数不稳定,究竟去掉几个,去掉那几个,要根据去掉某个变量后重新进行岭回归分析的效果来确定。

统计学课后习题答案第七章 相关分析与回归分析

第七章相关分析与回归分析 一、单项选择题 1.相关分析是研究变量之间的 A.数量关系 B.变动关系 C.因果关系 D.相互关系的密切程度 2.在相关分析中要求相关的两个变量 A.都是随机变量 B.自变量是随机变量 C.都不是随机变量 D.因变量是随机变量 3.下列现象之间的关系哪一个属于相关关系? A.播种量与粮食收获量之间关系 B.圆半径与圆周长之间关系 C.圆半径与圆面积之间关系 D.单位产品成本与总成本之间关系 4.正相关的特点是 A.两个变量之间的变化方向相反 B.两个变量一增一减 C.两个变量之间的变化方向一致 D.两个变量一减一增 5.相关关系的主要特点是两个变量之间 A.存在着确定的依存关系 B.存在着不完全确定的关系 C.存在着严重的依存关系 D.存在着严格的对应关系 6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量 之间存在着 A.直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系 7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存 在着 A.正相关关系 B.直线相关关系 C.负相关关系 D.曲线相关关系 8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存 在着 A.直线相关关系 B.负相关关系 C.曲线相关关系 D.正相关关系 9.判定现象之间相关关系密切程度的最主要方法是 A.对现象进行定性分析 B.计算相关系数 C.编制相关表 D.绘制相关图 10.相关分析对资料的要求是 A.自变量不是随机的,因变量是随机的 B.两个变量均不是随机的 C.自变量是随机的,因变量不是随机的 D.两个变量均为随机的 11.相关系数 A.既适用于直线相关,又适用于曲线相关 B.只适用于直线相关 C.既不适用于直线相关,又不适用于曲线相关 D.只适用于曲线相关 12.两个变量之间的相关关系称为

应用回归分析第七章答案

第七章岭回归 1.岭回归估计是在什么情况下提出的? 答:当解释变量间出现严重的多重共线性时,用普通最小二乘法估计模型参数,往往参数估计方差太大,使普通最小二乘法的效果变得很不理想,为了解决这一问题,统计学家从模型和数据的角度考虑,采用回归诊断和自变量选择来克服多重共线性的影响,这时,岭回归作为一种新的回归方法被提出来了。 2.岭回归估计的定义及其统计思想是什么? 答:一种改进最小二乘估计的方法叫做岭估计。当自变量间存在多重共线性,∣X'X∣≈0时,我们设想给X'X加上一个正常数矩阵kI(k>0),那么X'X+kI 接近奇异的程度小得多,考虑到变量的量纲问题,先对数据作标准化,为了计算方便,标准化后的设计 阵仍然用X表示,定义为 ()()1 ?'' X X I X y βκκ- =+ ,称为 β的岭回归估计,其中k 称为岭参数。 3.选择岭参数k有哪几种主要方法? 答:选择岭参数的几种常用方法有1.岭迹法,2.方差扩大因子法,3.由残差平方和来确定k值。 4.用岭回归方法选择自变量应遵从哪些基本原则? 答:用岭回归方法来选择变量应遵从的原则有: (1)在岭回归的计算中,我们假定设计矩阵X已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小,我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量。 (2)当k值较小时标准化岭回归系数的绝对值并不是很小,但是不稳定,随着k的增加迅速趋于零。像这样的岭回归系数不稳定,震动趋于零的自变量,我们也可以予以删除。 (3)去掉标准化岭回归系数很不稳定的自变量,如果有若干个岭回归系数不稳定,究竟去掉几个,去掉哪几个,这并无一般原则可循,这需根据去掉某个变量后重新进行岭回归分析的效果来确定。 5.对第5章习题9的数据,逐步回归的结果只保留了3个自变量x1,x2,x5,用y对这3个自变量做岭回归分析。 答:依题意,对逐步回归法所保留的三个自变量做岭回归分析。 程序为: include'C:\Program Files\SPSSEVAL\Ridge regression.sps'. ridgereg dep=y/enter x1 x2 x5 /start=0.0/stop=1/inc=0.01.

第七章 相关分析与回归分析(补充例题)

第七章 相关分析与回归分析 例1、有10个同类企业的固定资产和总产值资料如下: 根据以上资料计算(1)协方差和相关系数;(2)建立以总产值为因变量的一元线性回归方程;(3)当固定资产改变200万元时,总产值平均改变多少?(4)当固定资产为1300万元时,总产值为多少? 解:计算表如下: (1)协方差——用以说明两指标之间的相关方向。 2 2) )((n y x xy n n y y x x xy ∑∑∑∑- = - -= σ

35.126400100 9801 6525765915610>=?-?= 计算得到的协方差为正数,说明固定资产和总产值之间存在正相关关系。 (2)相关系数用以说明两指标之间的相关方向和相关的密切程度。 ∑∑∑ ∑∑∑∑--- = ] )(][) ([2 2 2 2 y y n x x n y x xy n r 95 .0) 980110866577 10()6525566853910(9801 65257659156102 2 =-??-??-?= 计算得到的相关系数为0.95,表示两指标为高度正相关。 (3) 2 2 26525 56685391098016525765915610) (-??-?= --= ∑∑∑∑∑x x n y x xy n b 90 .014109765 126400354257562556685390 6395152576591560== --= 85 .39210 65259.010 9801=? -= -=x b y a 回归直线方程为: x y 9.085.392?+= (4)当固定资产改变200万元时,总产值平均改变多少? x y ?=?9.0,180 2009.0|200=?=?=?x y 万元 当固定资产改变200万元时,总产值平均增加180万元。 (5)当固定资产为1300万元时,总产值为多少? 85 .156213009.085.392|1300=?+==x y 万元 当固定资产为1300万元时,总产值为1562.85万元。 例2、试根据下列资产总值和平均每昼夜原料加工量资料计算相关系数。

【免费下载】第七章 相关分析与回归分析

第七章 相关分析与回归分析 (一)单项选择题 1、相关分析研究的是( A ) A.变量之间关系的密切程度 B.变量之间的因果关系 C.变量之间严格的相互依存关系 D.变量之间的线性关系 2、相关关系是( B ) A 、现象间客观存在的依存关系 B 、现象间的一种非确定性的数量关系 C 、现象间的一种确定性的数量关系 D 、现象间存在的函数关系 3、下列情形中称为正相关的是( A ) A.随着一个变量的增加,另一个变量也增加 B.随着一个变量的减少,另一个变量增加 C. 随着一个变量的增加,另一个变量减少 D.两个变量无关 4、当自变量x 的值增加,因变量y 的值也随之增加,两变量之间存在着( B ) A 、曲线相关 B 、正相关 C 、负相关 D 、无相关 5、相关系数r 的取值范围是( C ) A. B. C. D.11<<-r 10≤≤r 11≤≤-r 1>r 6、当自变量x 的值增加,因变量y 的值也随之减少,两变量之间存在着( C ) A 、曲线相关 B 、正相关 C 、负相关 D 、无相关7、相关系数等于零表明两变量( C ) A.是严格的函数关系 B.不存在相关关系 C. 不存在线性相关关系 D. 存在曲线相关关系8、相关系数r 的取值范围是( C ) A 、从0到1 B 、从-1到0 C 、从-1到1 D 、无范围限制9、相关分析对资料的要求是( C ) A.两变量均为随机的 B.两变量均不是随机的 C.自变量是随机的,因变量不是随机的 D.自变量不是随机的,因变量是随机的 10、相关分析与回归分析相比,对变量的性质要求是不同的,回归分析中要求( A ) A 、自变量是给定的,因变量是随机的 B 、两个变量都是随机的 C 、两个变量都是非随机的 D 、因变量是给定的,自变量是随机的 11、回归方程 中的回归系数b 说明自变量变动一个单位时,因变量( bx a y +=?B ) A.变动b 个单位 B. 平均变动b 个单位 C. 变动a+b 个单位 D. 变动a 个单位

应用回归分析,第7章课后习题参考答案

第7章 岭回归 思考与练习参考答案 7.1 岭回归估计是在什么情况下提出的? 答:当自变量间存在复共线性时,|X’X |≈0,回归系数估计的方差就很大, 估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。 7.2岭回归的定义及统计思想是什么? 答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其 统计思想是对于(X ’X )-1为奇异时,给X’X 加上一个正常数矩阵D, 那么X’X+D 接近奇异的程度就会比X ′X 接近奇异的程度小得多,从而完成回归。但是这样的回归必定丢失了信息,不满足blue 。但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。 7.3 选择岭参数k 有哪几种方法? 答:最优k 是依赖于未知参数β和2σ的,几种常见的选择方法是: ○ 1岭迹法:选择0k 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太多; ○ 2方差扩大因子法:11()()()c k X X kI X X X X kI --'''=++,其对角线元()jj c k 是岭估计的方差扩大因子。要让()10jj c k ≤; ○ 3残差平方和:满足()SSE k cSSE <成立的最大的k 值。 7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是: 1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这 样可以直接比较标准化岭回归系数的大小。我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量; 2. 当k 值较小时,标准化岭回归系数的绝对值并不很小,但是不稳定,随

应用回归分析-第7章课后习题参考答案

应用回归分析-第7章课后习题参考答案

第7章 岭回归 思考与练习参考答案 7.1 岭回归估计是在什么情况下提出的? 答:当自变量间存在复共线性时,|X’X |≈0,回归系数估计的方差就很大, 估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。 7.2岭回归的定义及统计思想是什么? 答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其统计思想是对于(X ’X )-1为奇异时,给X’X 加上一个正常数矩阵D, 那么X ’X+D 接近奇异的程度就会比X ′X 接近奇异的程度小得多,从而完成回归。但是这样的回归必定丢失了信息,不满足blue 。但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。 7.3 选择岭参数k 有哪几种方法? 答:最优k 是依赖于未知参数β和2σ的,几种常见的选择方法是: ○ 1岭迹法:选择0k 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太 多; ○ 2方差扩大因子法:11()()()c k X X kI X X X X kI --'''=++,其对角线元()jj c k 是岭估计的方差扩大因子。要让()10jj c k ≤; ○ 3残差平方和:满足()SSE k cSSE <成立的最大的k 值。 7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是: 1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这 样可以直接比较标准化岭回归系数的大小。我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量;

第七章统计相关分析报告习题

第七章相关分析习题 一、单项选择题 1、在相关分析中,要求相关的两个变量()。 A、都是随机变量 B、因变量是随机变量 C、都不是随机变量 D、自变量是随机变量 2、两个变量间的相关关系称为()。 A、单相关 B、复相关 C、无相关 D、负相关 3、相关系数的取值范围是()。 A、r=0 B、-1

D、当Y增加一个单位时,X的平均增加量 12、估计标准误差是反映()。 A、平均数代表性的指标 B、相关关系的指标 C、回归直线的代表性指标 D、序时平均数代表性指标 13、在回归分析中,要求对应的两个变量()。 A、都是随机变量 B、是对等关系 C、不是对等关系 D、都不是随机变量 14、当产量为100件时,其生产成本为300元,其中固定生产成本为600元,则成本总额对产量的回归直线方程是()。 A、y=6000+24x B、y=600+24x C、y=24+6000x D、y=2400+6x 二、多项选择题 1、直线相关分析的特点是()。 A相关系数有正负号B、两个变量是对等关系C、只有一个相关系数 D两个变量均是随机变量E、因变量是随机变量 2、当两变量完全相关时,则相关系数为()。 A、0 B、1 C、-1 D、0.5 E、0.8 3、相关系数的种类()。 A、从相关的方向分为正相关和负相关 B、从相关的表现形式分为直线相关和曲线相关 C、从相关程度分为完全相关、不完全相关、无相关 D、从影响因素多少分为单相关、复相关 E、从数值形式分为相关系数和相关指数 4、简单直线回归分析的特点是()。 A、存在两个回归方程 B、两个变量不是对等关系 C、回归系数有正负号 D、因变量是随机的,自变量是给定的 E、利用一个回归方程,两个变量可相互推算 5、估计标准误差是反映()。 A、因变量的估计值 B、自变量的估计值 C、回归方程代表性的指标 D、因变量估计值可靠程度的指标 E、自变量数列离散程度的指标 6、直线回归方程中的两个变量()。 A、两个都是随机变量 B、两个都是给定的变量 C、一个是自变量。另一个是因变量 D、一个是给定的变量,另一个是随机变量 E、必须确定哪个是自变量,哪个是因变量 7、直线回归方程中的回归系数()。

第七章 相关分析作业答案

第七章 相关分析 一、单项选择 1、当变量x 按一定数值变化时,变量y 也近似地按固定数值变化,这表明变量x 和变量y 之间存在着 ( ) A 、完全相关关系 B 、复相关关系 C 、直线相关关系 D 、函数关系 2、相关关系的取值范围 ( ) A 、r -∞<<+∞ B 、11r -≤≤+ C 、11r -<<+ D 、01r ≤≤+ 3、直线相关分析与直线回归分析的联系表现为 ( ) A 、相关分析是回归分析的基础 B 、回归分析是相关分析的基础 C 、相关分析是回归分析的深入 D 、相关分析与回归分析互为条件 4、在用一个回归方程进行估计推算时 ( ) A 、只能用因变量推算自变量 B 、只能用自变量推算因变量 C 、既可用因变量推算自变量,也可用自变量推算因变量 D 、不需要考虑因变量和自变量问题 5、如果估计标准误差0=yx S ,则表明 ( ) A 、全部观测值和回归值都不相等 B 、回归直线代表性小 C 、全部观测值与回归值的离差之积为0 D 、全部观测值都落在回归直线上 6、判断两个变量间相关关系的密切程度时,“显著相关”通常是指 ( ) A 、5.03.0?≤r B 、8.05.0?≤r C 、18.0?≤r D 、高于0.5 7、在回归直线方程bx a y c +=中,b 表示 ( ) A 、当x 增加一个单位时,y 增加a 的数量 B 、当y 增加一个单位时,x 增加b 的数量 C 、当x 增加一个单位时,y 的平均增加量 D 、当y 增加一个单位时,x 的平均增加量 8、配合直线回归方程对资料的要求是 ( ) A 、因变量是给定的数值,自变量是随机变量 B 、自变量是给定的数值,因变量是随机变量 C 、自变量和因变量都是随机变量 D 、自变量和因变量都不是随机变量 二、多项选择 1、下列各种现象之间的关系属于相关关系的有 ( ) A 、劳动生产率与工资水平之间的关系 B 、商品销售额与流通费用率的关系 C 、农作物收获量与施肥量的关系 D 、价格不变条件下,商品销售额与销售量之间的关系 E 、正方形的面积与它的边长之间的关系 2、相关分析的特点有 ( ) A 、两变量不是对等的

第七章相关分析练习

第七章相关分析练习题 一、单项选择题 1.相关关系按自变量的多少分为 (A)正相关与负相关(B)单相关与复相关 (C)线性相关与非线性相关(D)不相关、完全相关与不完全相关 2.一个因变量与多个自变量的依存关系是 (A)单相关(B)线性相关(C)非线性相关(D)复相关 3.若y 随着x 的变化而等比例变化,则y 与x 的关系是 (A)单相关(B)线性相关(C)非线性相关(D)复相关 4.若两变量的变化方向相反,则属于 (A)线性相关(B)非线性相关(C)正相关(D)负相关 5.若∣r∣在0.3~0.5之间,则表明两变量 (A)无直线相关(B)显著相关(C)低度相关(D)高度相关 6.相关系数的取值范围是 (A)<1(B)>l (C)(一1,+1)(D)[一1,+1] 7.在回归分析中,要求两变量 (A)都是随机变量(B)自变量是确定性变量,因变量是随机变量 (C)都是确定性变量(D)因变量是确定性变量,自变量是随机变量 8.r=0表示 (A)不存在相关关系(B)存在平衡关系 (C)两变量独立(D)不存在线性相关关系 9.已知xy L 是yy L 的1.5倍,x σ是y σ的1.8倍,则r 为 (A)0.83(B)0.8(C)0.9(D)0.92 10.每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为:y c =56+8x,这意味着 (A)废品率每增加1%,成本每吨增加64元(B)废品率每增加1%,成本每吨增加8% (C)废品率每增加1%,成本每吨增加8元(D)废品率每增加1%,则每吨成本为56元 11.圆的周长和半径之间存在着() (A)比较关系(B)相关关系(C)因果关系(D)函数关系 二、多项选择题 1.判断相关关系的方法有 (A)定性判断(B)相关表(C)相关图(D)相关系数(E)标准差系数 2.2cx bx a y ++=?表明自变量与因变量之间的关系是 (A)单相关(B)复相关(C)线性相关(D)非线性相关(E)二元相关 3.x y 450?=?表示变量间的关系是 (A)单相关(B)复相关(C)正相关(D)负相关(E)线性相关 4.bx a y +=?中的b 是 (A)截距(B)斜率(C)回归系数 (D)相关系数(E)当x 增加一个单位时,y 的平均数 5.下列哪些关系是相关关系 (A)圆的半径长度和周长的关系(B)农作物收获和施肥量的关系 (C)商品销售额和利润率的关系(D)产品产量与单位成品成本的关系

第七章相关分析与回归分析(学生练习)

第七章相关分析与回归分析 一、目的与要求 通过本章的学习应理解相关关系的概念;掌握相关关系的测定方法,特别是相关系数的意义、计算及作用。回归分析主要掌握一元线性回归,能够用最小平方法求回归方程,了解应用相关与回归分析时应该注意的几个问题。 二、重点与难点 本章介绍的基本概念是相关关系的概念,重点是相关关系的测定,即相关系数的意义、计算和一元线性回归方程的建立。难点是相关系数的计算,一元线性回归方程中两个待定参数的计算。 三、思考与练习 (一)填空题 1、相关关系按其相关的程度不同,可分为、和 2、相关系数的正负表示相关关系的方向,r 为正值,两变量 是;r 为负数,两变量是。 3、r=0 ,说明两个变量之间;r=+1 ,说明两个变量之间;r=-1 说明两个 变量之间。 4、一元线性回归方程y? a bx 中的参数 a 代表,数学上称为;b 代表,数学上称为。 5、分析要根据研究的目的确定哪一个为自变量,哪一个为因变量,在这一点与分析时不同。 6、相关关系按方向不同,可分为和。 7、完全线性相关的相关系数r 值等于。 8、计算回归方程要注意资料中因变量是的,自变量是 的。 9、回归方程只能用于由推算。(二)单项选择题(在每小题备选答案中,选出一个 正确答案) 1、相关分析研究的是() A.变量之间关系的密切程度 B.变量之间的因果关系 C.变量之间严格的相互依存关系 D. 变量之间的线性关系 2、相关关系是() A 、现象间客观存在的依存关系 B、现象间的一种非确定性的数量关系 C、现象间的一种确定性的数量关系 D、现象间存在的函数关系 3、下列情形中称为正相关的是() A.随着一个变量的增加,另一个变量也增加 B.随着一个变量的减少,另一个变量增加 C.随着一个变量的增加,另一个变量减少 D.两个变量无关 4、当自变量x 的值增加,因变量y 的值也随之增加,两变量之间存在着() A、曲线相关 B、正相关 C、负相关 D 、无相关 5、相关系数r 的取值范围是()

《统计学》 第七章 相关分析与回归分析(补充例题)

第七章 相关分析与回归分析 (3)当固定资产改变200万元时,总产值平均改变多少?(4)当固定资产为1300万元时,总产值为多少? (1)协方差——用以说明两指标之间的相关方向。 2 2))((n y x xy n n y y x x xy ∑∑∑∑-= --=σ 035.126400100 9801 6525765915610>=?-?= 计算得到的协方差为正数,说明固定资产和总产值之间存在正相关关系。 (2)相关系数用以说明两指标之间的相关方向和相关的密切程度。 ∑∑∑∑∑∑∑---= ] )(][)([2222y y n x x n y x xy n r

95.0) 98011086657710()6525566853910(9801 65257659156102 2 =-??-??-?= 计算得到的相关系数为0.95,表示两指标为高度正相关。 (3) 2 226525 5668539109801 6525765915610)(-??-?=--= ∑∑∑∑∑x x n y x xy n b 90.014109765 12640035 42575625566853906395152576591560==--= 85.39210 6525 9.0109801=?-= -=x b y a 回归直线方程为: x y 9.085.392?+= (4)当固定资产改变200万元时,总产值平均改变多少? x y ?=?9.0,1802009.0|200=?=?=?x y 万元 当固定资产改变200万元时,总产值平均增加180万元。 (5)当固定资产为1300万元时,总产值为多少? 85.156213009.085.392|1300=?+==x y 万元 当固定资产为1300万元时,总产值为1562.85万元。 例2、试根据下列资产总值和平均每昼夜原料加工量资料计算相关系数。 解:【分析】本题中“企业数”应看成资产总值和平均每昼夜原料加工量两变量的次数,在计算相关系数的过程,要进行“加权”。

统计学习题 第七章相关与回归分析答案

第七章相关与回归分析习题 一、填空题 1、客观现象之间的数量联系有两种不同的类型:一种函数关系;另一种是相关关系。 2、现象之间是否存在相关关系是进行相关与回归分析的基础,其主要测定方法是计算相关系数。 3、若估计标准误差愈小,则根据直线回归方程计算的估计值就越能代表实际值。 4、对某实验结果做线性回归分析,得到形如y=a+bx的方程,现对回归系数b做显著性检验,该假设检验中原假设为 H0:b=0 ,备择假设为 H1:b≠0 ,若拒绝原假设,则认为 x 对y有显著的影响。 二、选择题 单选题: 1、相关分析对资料的要求是((1)) (1)两变量均为随机的(2)两变量都不是随机的 (3)自变量是随机的,因变量不是随机的 (4)因变量是随机的,自变量不是随机的 2、回归方程Y=a+bx中的回归系数b说明自变量变动一个单位时,因变量((4)) (1)变动a+b个单位(2)变动1/b个单位 (3)变动b个单位(4)平均变动b个单位 3、相关系数r的取值范围((2)) (1)-∞

相关文档
相关文档 最新文档