文档库 最新最全的文档下载
当前位置:文档库 › 统计学课后习题答案第七章-相关分析与回归分析

统计学课后习题答案第七章-相关分析与回归分析

统计学课后习题答案第七章-相关分析与回归分析
统计学课后习题答案第七章-相关分析与回归分析

第七章相关分析与回归分析

一、单项选择题

1.相关分析是研究变量之间的

A.数量关系

B.变动关系

C.因果关系

D.相互关系的密切程度

2.在相关分析中要求相关的两个变量

A.都是随机变量

B.自变量是随机变量

C.都不是随机变量

D.因变量是随机变量

3.下列现象之间的关系哪一个属于相关关系?

A.播种量与粮食收获量之间关系

B.圆半径与圆周长之间关系

C.圆半径与圆面积之间关系

D.单位产品成本与总成本之间关系

4.正相关的特点是

A.两个变量之间的变化方向相反

B.两个变量一增一减

C.两个变量之间的变化方向一致

D.两个变量一减一增

5.相关关系的主要特点是两个变量之间

A.存在着确定的依存关系

B.存在着不完全确定的关系

C.存在着严重的依存关系

D.存在着严格的对应关系

6.当自变量变化时, 因变量也相应地随之等量变化,则两个变量

之间存在着

A.直线相关关系

B.负相关关系

C.曲线相关关系

D.正相关关系

7.当变量X值增加时,变量Y值都随之下降,则变量X和Y之间存

在着

A.正相关关系

B.直线相关关系

C.负相关关系

D.曲线相关关系

8.当变量X值增加时,变量Y值都随之增加,则变量X和Y之间存

在着

A.直线相关关系

B.负相关关系

C.曲线相关关系

D.正相关关系

9.判定现象之间相关关系密切程度的最主要方法是

A.对现象进行定性分析

B.计算相关系数

C.编制相关表

D.绘制相关图

10.相关分析对资料的要求是

A.自变量不是随机的,因变量是随机的

B.两个变量均不是随机的

C.自变量是随机的,因变量不是随机的

D.两个变量均为随机的

11.相关系数

A.既适用于直线相关,又适用于曲线相关

B.只适用于直线相关

C.既不适用于直线相关,又不适用于曲线相关

D.只适用于曲线相关

12.两个变量之间的相关关系称为

A.单相关

B.复相关

C.不相关

D.负相关

13.相关系数的取值范围是

A.-1≤r≤1

B.-1≤r≤0

C.0≤r≤1

D. r=0

14.两变量之间相关程度越强,则相关系数

A.愈趋近于1

B.愈趋近于0

C.愈大于1

D.愈小于1

15.两变量之间相关程度越弱,则相关系数

A.愈趋近于1

B.愈趋近于0

C.愈大于1

D.愈小于1

16.相关系数越接近于-1,表明两变量间

A.没有相关关系

B.有曲线相关关系

C.负相关关系越强

D.负相关关系越弱

17.当相关系数r=0时,

A.现象之间完全无关

B.相关程度较小

B.现象之间完全相关 D.无直线相关关系

18.假设产品产量与产品单位成本之间的相关系数为-0.89,则说明这两个变量之间存在

A.高度相关

B.中度相关

C.低度相关

D.显著相关

19.从变量之间相关的方向看可分为

A.正相关与负相关

B.直线相关和曲线相关

C.单相关与复相关

D.完全相关和无相关

20.从变量之间相关的表现形式看可分为

A.正相关与负相关

B.直线相关和曲线相关

C.单相关与复相关

D.完全相关和无相关

21.物价上涨,销售量下降,则物价与销售量之间属于

A.无相关

B.负相关

C.正相关

D.无法判断

22.配合回归直线最合理的方法是

A.随手画线法

B.半数平均法

C.最小平方法

D.指数平滑法

23.在回归直线方程y=a+bx中b表示

A.当x增加一个单位时,y增加a的数量

B.当y增加一个单位时,x增加b的数量

C.当x增加一个单位时,y的平均增加量

D.当y增加一个单位时, x的平均增加量

24.计算估计标准误差的依据是

A.因变量的数列

B.因变量的总变差

C.因变量的回归变差

D.因变量的剩余变差

25.估计标准误差是反映

A.平均数代表性的指标

B.相关关系程度的指标

C.回归直线的代表性指标

D.序时平均数代表性指标

26.在回归分析中,要求对应的两个变量

A.都是随机变量

B.不是对等关系

C.是对等关系

D.都不是随机变量

27.年劳动生产率(千元)和工人工资(元)之间存在回归方

程y=10+70x,这意味着年劳动生产率每提高一千元时,工人工资平均

A.增加70元

B.减少70元

C.增加80元

D.减少80元

28.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本6000元,则总生产成本对产量的一元线性回归方程为:

A.y=6+0.24x

B.y=6000+24x

C.y=24000+6x

D.y=24+6000x

29.用来反映因变量估计值代表性高低的指标称作

A.相关系数

B.回归参数

C.剩余变差

D.估计标准误差

二、多项选择题

1.下列现象之间属于相关关系的有

A.家庭收入与消费支出之间的关系

B.农作物收获量与施肥量之间的关系

C.圆的面积与圆的半径之间的关系

D.身高与体重之间的关系

E.年龄与血压之间的关系

2.直线相关分析的特点是

A.相关系数有正负号

B.两个变量是对等关系

C.只有一个相关系数

D.因变量是随机变量

E.两个变量均是随机变量

3.从变量之间相互关系的表现形式看,相关关系可分为

A.正相关

B.负相关

C.直线相关

D.曲线相关

E.单相关和复相关

4.如果变量x与y之间没有线性相关关系,则

A.相关系数r=0

B.相关系数r=1

C.估计标准误差等于0

D.估计标准误差等于1

E.回归系数b=0

5.设单位产品成本(元)对产量(件)的一元线性回归方程为y=85-5.6x,则

A.单位成本与产量之间存在着负相关

B.单位成本与产量之间存在着正相关

C.产量每增加1千件,单位成本平均增加5.6元

D.产量为1千件时,单位成本为79.4元

E.产量每增加1千件,单位成本平均减少5.6元

6.根据变量之间相关关系的密切程度划分,可分为

A.不相关

B.完全相关

C.不完全相关

D.线性相关

E.非线性相关

7.判断现象之间有无相关关系的方法有

A.对现象作定性分析

B.编制相关表

C.绘制相关图

D.计算相关系数

E.计算估计标准误差 8.当现象之间完全相关的,相关系数为

A.0

B.-1

C.1

D.0.5

E.-0.5 9.相关系数r =0说明两个变量之间是

A.可能完全不相关

B.可能是曲线相关

C.肯定不线性相关

D.肯定不曲线相关

E.高度曲线相关

10.下列现象属于正相关的有

A.家庭收入愈多,其消费支出也愈多

B.流通费用率随商品销售额的增加而减少

C.产量随生产用固定资产价值减少而减少

D.生产单位产品耗用工时,随劳动生产率的提高而减少

E.工人劳动生产率越高,则创造的产值就越多 11.直线回归分析的特点有

A.存在两个回归方程

B.回归系数有正负值

C.两个变量不对等关系

D.自变量是给定的,因变量是随机的

E.利用一个回归方程,两个变量可以相互计算 12.直线回归方程中的两个变量

A.都是随机变量

B.都是给定的变量

C.必须确定哪个是自变量,哪个是因变量

D.一个是随机变量,另一个是给定变量

E.一个是自变量,另一个是因变量

13.从现象间相互关系的方向划分,相关关系可以分为

A.直线相关

B.曲线相关

C.正相关

D.负相关

E.单相关 14.估计标准误差是

A.说明平均数代表性的指标

B.说明回归直线代表性指标

C.因变量估计值可靠程度指标

D.指标值愈小,表明估计值愈可靠

E.指标值愈大,表明估计值愈可靠

15.下列公式哪些是计算相关系数的公式

16.用最小平方法配合的回归直线,必须满足以下条件

A.(y-y c )=最小值

B.(y-y c )=0

C.(y-y c )2=最小值

D.(y-y c )2=0

E.(y-y c )2=最大值 17.方程y c =a+bx

2

2222

2

)()(.)

()())((...))((.y y n x x n y

x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx

xy xy

yy xx xy y x ∑-∑?∑-∑∑?∑-∑=

-∑?-∑--∑=

=

=

--∑=σσ

A.这是一个直线回归方程

B.这是一个以X为自变量的回归方程

C.其中a是估计的初始值

D.其中b是回归系数

E.y c是估计值

18.直线回归方程y c=a+bx中的回归系数b

A.能表明两变量间的变动程度

B.不能表明两变量间的变动程度

C.能说明两变量间的变动方向

D.其数值大小不受计量单位的影响

E. 其数值大小受计量单位的影响

19.相关系数与回归系数存在以下关系

A.回归系数大于零则相关系数大于零

B.回归系数小于零则相关系数小于零

C.回归系数等于零则相关系数等于零

D.回归系数大于零则相关系数小于零

E.回归系数小于零则相关系数大于零

20.配合直线回归方程的目的是为了

A.确定两个变量之间的变动关系

B.用因变量推算自变量

C.用自变量推算因变量

D.两个变量相互推算

E.确定两个变量之间的相关程度

21.若两个变量x和y之间的相关系数r=1,则

A.观察值和理论值的离差不存在

B.y的所有理论值同它的平均值一致

C.x和y是函数关系

D.x与y不相关

E.x与y是完全正相关

22.直线相关分析与直线回归分析的区别在于

A.相关分析中两个变量都是随机的;而回归分析中自变量是给定的数值,因变量是随机的

B.回归分析中两个变量都是随机的;而相关分析中自变量是给定的数值,因变量是随机的

C.相关系数有正负号;而回归系数只能取正值

D.相关分析中的两个变量是对等关系;而回归分析中的两个变量不是对等关系

E.相关分析中根据两个变量只能计算出一个相关系数;而回归分析中根据两个变量只能计算出一个回归系数

三、填空题

1.研究现象之间相关关系称作相关分析。

2.从变量之间相互关系的方向来看,相关关系可以分为和

3从变量之间相互关系的表现形式不同,相关关系可以分为和。

4.从变量之间相互关系的密切程度不同,相关关系可以分为和

5.完全相关的关系实质上就是其相关系数

为。

6.相关关系按相关变量的多少可以分为和。

7.当变量x的数值增大时,变量y的数值也明显增大,相关点分

布比较集中,表明这两个变量之间呈。

8.说明两个现象之间相关关系密切程度的统计分析指标称

为。

9.相关系数计算的前提条件是。

10.回归直线方程y=a+bx中的参数b称为。

11.计算回归方程要求资料中的因变量是

自变量是。

12.配合直线回归方程最常用的方法是,其基

本要求是使达到最小。

13.估计标准误差是用来说明代表性大小的统

计分析指标。

14.在进行相关分析时要求所分析的两个变量都是;

而在回归分析中要求自变量是随机的,因变量是。

四、判断改错题

1.在进行相关分析时要求所分析的两个变量都是随机的;而在回

归分析中要求自变量是随机的,因变量是给定的。

2.相关关系和函数关系都属于完全确定性的依存关系。

3.正相关是指两个变量之间的变动方向都是上升的。

4.负相关是指两个变量的变化趋势相反,一个上升而另一个

下降。

5.相关系数是测定变量之间相关关系密切程度的唯一方法。

6.相关系数r是在曲线相关条件下,说明两个变量之间相关关

系密切程度的统计分析指标。

7.相关系数数值越大,说明相关程度越高;相关系数数值越小,

说明相关程度越低。

8.相关系数r的符号与回归系数的符号,可以相同也可以不相

同。

9.回归分析中计算的估计标准误差就是因变量的标准差。

10.回归分析中,对于没有明显因果关系的两个变量可以求得两

个回归方程。

11.当回归系数大于零时,两个变量的关系是正相关;而当回归

系数小于零时,两个变量的关系是负相关。

12.估计标准误差是以回归直线为中心反映各观察值与估计值平

均数之间离差程度的大小。

五、名词解释

1.相关关系

2.相关分析

3.直线相关

4.曲线相关

5.完全

相关 6.不完全相关7.相关表8.相关图9.相关系数10.回归分析11.回归系数12.估计标准误差

六、简答题

1.简述相关关系及其特点。

2.相关关系与函数关系有什么区别?

3.相关分析的作用及其主要内容。

4.判断相关关系的方法有哪些?

5.什么是相关系数?试写出其定义公式.

6.简述回归分析与相关分析的区别与联系.

7.什么叫估计标准误差?它有什么作用?

8估计标准误差与相关系数有什么关系?

8.简述配合最佳回归直线模型的两个条件.

9.应用相关分析与回归分析就注意哪些问题?

10.回归直线方程y=a+bx中,参数a、b是利用什么方法求得的?它们的几何意义与经济意义是什么?

七、计算题

1.已知n=6,Σx=21, Σy=426, Σx2=79, Σy2=30268, Σxy=1481

试据此: (1)计算相关系数;(2)建立回归直线方程;(3)计算估计

标准误差.

2.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下表:

估计标准误差;(4)估计生产性固定资产(自变量)为1100万元时的工业总产值。

3.某企业上半年产品产量与单位成本资料如下:

位成本平均下降多少?(2)假定产量为6000件时,单位成本为多少元?(3)若单位成本为70元/件时,估计产量应为多少?

3.4.已知x,y两变量的相关系数r=0.8,x=20,y=50, бy为бx 的

两倍,求y倚x的回归方程.

1. 5.已知x,y两变量x=15,y=41,在直线回归方程中,当自变量x

于0时,y c=5,又已知бx=1.5, бy=6. 试求估计标准误差.

6.已知xy=146.5,x=12.6,y=11.3,x2=164.2,y2=134.1,a=1.7575.

试据此建立回归直线方程并求出相关系数.

7.在x,Y两变量中, бx是бy的两倍,而бy又是Sy的两倍,试据

此求回归系数b

8.已知x,y两变量y2=2600,y=50,r=0.9.试求估计标准误差Sy

第七章相关分析与回归分析一、单项选择题:

1-5:DAACB;6-10:ACDBD;11-15:BAAAB;16-20:CDAAB;21-25:BCCDC:26-29:BABD。

二、多项选择题:

1.ABDE;

2.ABCE;

3.CD;

4.AE;

5.ADE;

6.ABC;

7.ABCD;

8.BC;9.ABC;10.ACE;11.ABCD;12.CDE;13.CD;14.BCD;15.ABDE;16.BC;17.ABCDE;18.BCE;19.ABC;20.AC;21.ACE;

22.ADE。

三、填空题:

1.密切程度;

2.正相关,负相关;

3.直线相关,曲线相关;

4.

不相关,完全相关,不完全相关;5.函数关系,1;6.单相关,

复相关;7.强正相关;8.相关系数;9.直线相关;10.回归系数;11.随机的,给定的;12.最小平方法,实际值与理论值的离差的平方和;12.回归方程;13.随机的,给定的。

四、判断改错题:

1.正确。

2.错误。相关关系属于不完全确定性的关系,而函数关系则是一种完全确定性的关系。

3.错误。正相关是指两个变量之间的变动方向是一致的。

4.正确。

5.错误。相关系数是测定变量之间相关关系密切程度的主要方法。

6.错误。相关系数是在直线相关条件下,说明两个变量之间相关关系密切程度的统计分析指标。

7.错误。相关系数数值越接近于±1,说明相关程度越高,相关系数数值越接近于0,说明相关程度越低。

8.错误。相关系数的符号和回归系数的符号肯定是一致的。

9.错误。回归分析计算中的估计标准误差是指因变量实际值与理论值离差的平均数。

10.正确。

11.正确。

12.正确。

五、名词解释:

1.相关关系:相关关系是指客观现象之间存在的互相依存关系。

2.相关分析:相关分析是指对现象之间相关关系密切程度的研究。

3.直线相关:直线相关是指当相关关系的一个变量变动时,另一个变量也相应地发生大致均等的变动。

4.曲线相关:曲线相关是指当相关关系的一个变量变动时,另一个变量也相应地发生不均等的变动。

5.完全相关:如果一个变量的数值变化是由另一个变量的数值变化所唯一确定的,这时两个变量间的关系称为完全相关。

6.不完全相关:如果两个变量之间的关系介于不相关和完全相关之间称为不完全相关。

7.相关表:用表格形式来反映现象之间的相关关系称为相关表。

8.相关图:通过图象形式来表示现象之间的相关关系称为相关图。

9.相关系数:相关系数是指在直线相关条件下,说明两个现象之间相关关系密切程度的统计分析指标。

10.回归分析:回归分析是指对具有相关关系的现象。根据其关系形态,选择一个合适的数学模型(称为回归方程式),用来近似地表示变量间的平均变化关系的一种统计分析方法。

11.回归系数:回归系数就是回归方程y=a+bx中的斜率,用b 表示,它说明当自变量x每变动一个单位时,因变量y平均变动的数量。

12.估计标准误差:估计标准误差是用来说明回归方程代表性大小的统计分析指标。

六、简答题:

1.简述相关关系及其特点。

答:相关关系是指客观现象之间存在的互相依存关系。其特点有:(1)现象之间确实存在着数量上的依存关系;(2)现象之间数量上的关系不是确定的。

2.相关关系与函数关系有什么区别?

答:相关关系与函数关系的区别表现在:

(1)函数关系是变量之间的一种完全确定性的关系;但相关关系一般不是完全确定的,对自变量的一个值,与之对应的因变量值不是唯一的。

(2)函数关系通常可以用数学公式确切地表示出来;而相关关

系一般不能用数学公式准确地表示出来。

3.相关分析的作用及其主要内容。 答:相关分析的主要作用表现在,(1)确定现象之间有无相 关关系;(2)确定相关关系的表现形式;(3)判定相关关系的密 切程度和方向。

4.判断相关关系的方法有哪些?

答:判断相关关系的方法有:(1)根据对客观现象的定性认 识来进行判断;(2)通过相关表初步看出相关关系的形式,密 切程度和相关方向;(3)通过相关图大致看出两个变量之间有无 相关关系及相关的形态、方向和密切程度;(4)通过计算相关系 数来判断变量之间相关关系的密切程度。 5.什么是相关系数?试写出其定义公式。

答:相关系数是指在直线相关条件下说明两个现象之间相关关 系密切程度的统计分析指标。其定义公式为:

式中,σx 表示x 变量数列的标准差,σy 表示y 变量数列的标准 差,σx y 表示x 、x 变量数列的协方差。

6.简述回归分析与相关分析的区别与联系。 答:回归分析与相关分析的区别:

(1)相关分析所研究的两个变量是对等关系;而回归分析所研 究的两个变量不是对等关系。(2)对于两个变量来说,相关分析 只能计算出一个相关系数;而回归分析可以分别建立两个不同的回 归方程。(3)相关分析要求两个变量都必须是随机的,而回归分 析要求自变量是给定的,因变量是随机的。 回归分析与相关分析的联系:

(1)相关分析是回归分析的基础和前提。(2)回归分析是相 关分析的深入和继续。

7.什么叫估计标准误差?它有什么作用?

答:估计标准误差是用来说明回归方程代表性大小的统计分析 指标。

其作用是说明理论值(回归线)的代表性,也反映因变量与自 变量关系的密切程度。若估计标准误差小,说明回归方程准确性 高,代表性大,也说明X 对y 的影响大;反之,若估计标准误差 大,说明回归方程准确性低,代表性小,调对y 的影响小。

8.估计标准误差与相关系数有什么关系? 答:

222

)(1)(1))((1

y y n

x x n y y x x n r y

x xy

-∑?-∑--∑==

σσσ

9..简述配合最佳回归直线模型的两个条件.

答:配合最佳回归直线模型的两个条件是:(1)实际值与理 论值的离差的代数和为零;2)实际值与理论值的离差的平方和为 最小。

10.应用相关分析与回归分析就注意哪些问题?

答:应用相关分析与回归分析应注意的问题有以下几下方面: (1)在定性分析的基础上进行定量分析。

(2)要注意现象质的界限及相关关系作用的范围。 (3)要具体问题具体分析。

(4)要考虑社会经济现象的复杂性。

(5)对回归模型中计算出来的参数的有效性应进行检验。 11.回归直线方程y=a+bx 中,参数a 、b 是利用什么方法求得 的?它们的几何意义与经济意义是什么?

答:回归直线方程y=a+bx 中,参数a 、b 是利用最小平方法求 得的。它们的几何意义是:a 是回归直线的截距,b 是回归直线的 斜率。它们的与经济意义是:a 是作为因变量的经济现象的起点 值,b 是回归系数,即作为自变量的经济现象每增减一个单位,则 作为因变量的经济现象增减b 个单位。 七、计算题:

1.解:(1)由相关系数简捷法计算公式得: ∑∑-∑?∑-∑∑∑?-=

2

2

2

2

)

()()()(y y n x x n y x xy n r

=

2

2

426

302686217964262114816-??-??-?

=-0.9091

(2) 由回归系数计算公式得 =∑∑-∑∑∑?-=

2

2)

()()(x x n y x xy n b 8182.121796426

2114816-=-??-? 3637.776

218182.16426

=?+=∑-∑=

-=n x b n y x b y a 则回归直线方程为x y 8182.13637.77-=

(3) 估计标准误差

n

xy

b y a y S Y ∑∑∑--=2

6

1481

8182.14263637.7730268?+?-=

=0.7977

2.解:(1)依题意得∑=6525x ,n=10,∑=9801y ,56685392

=x ,

相关系数,7659156,108665772==xy y

∑∑-∑?∑-∑∑∑?-=

2

2

2

2

)

()()()(y y n x x n y x xy n r

2

2

9795

108589571065255668539109795

6525765795610-??-??-?=

=0.9479 建立回归直线方程

8978.065255668539109795

6525765795610)(2

2

2=-??-?=

∑-∑?-=

∑∑∑x x n y x xy n b

a=6855.39310

6525

8978109795=?-=

-x b y 回归方程为:y=393.6855+0.8978x (3)计算估计标准误差

n

xy

b y a y S y ∑-∑-∑=2

=

10

7657956

8978.097956855.39310858957?-?-

=112.9135

(4)当生产性固定资产为1100万元时的工业总产值

2655.138********.06855.393=?+=c y (万元)

3.解:设产量为x ,单位成本为y ,则可得:

30268,1481,79,426,21,622=∑=∑=∑=∑=∑=y xy x y x n

(1)以单位成本为因变量的回归系数

r 8182.121796426

2114816)

(2

2

2-=-??-?=

-?-=

∑∑∑∑∑x x n y x xy n

说明产量每增加1000件单位成本平均每件下降1.8182元 (2)建立y 倚x 的回归方程并进行预测

3637.776

21

8182.16426=?+=

-=x b y a 回归方程为c y =77.3637-1.8182x 当x=6000件时,c y 为

c y =77.3637-1.8182?6=66.4545(元/件)

(3)建立x 倚y 的回归方程并进行预测 设,dy c x c ++则c=y d x -

4545.0426

302686426

2114816)

(2

2

2-=-??-?=

∑∑-∑∑∑?-=

y x n y x xy n d 77.356

4264545.0621=?+=

-=y d x c 则回归方程为y x c 4545.077.35-= 当y=70时

955.3704545.077.35=?-=c x (千件)

4.解:依题意得r=y x b σσ?

,因2

1

=y x σσ,r=0.8 则b=1.6,又a=18206.150=?-=-x b y 故回归方程为y c =18+1.6x

5.解:依题意得y c =a+bx ,当x=0时 y c =a=5,又x b y a -=,则

y x

b r x

a y

b σσ?==-=-=

又,4.215541

故6.06

5

.14.2=?

=r ,则 8.46.015.1122=-?=-=r S y y σ

6.解:a=x b y -,则7573.06.127575

.15.11=-=-=x

a y b

y c =a+bx=1.7575+0.7573x

697.0)

()(2

2

2

2

=-?-?-=

y y x x y x xy r

7.解:依题意得:σx =2σy ,σy =2S y 又866.0)2

1

(1122

2

±=-=-

=Y

y

S r σ

43.02

1866.0±=?±=?=x y r b σσ

8.解:依题得1025002600)(22=-=-=

y y y σ

36.49.0110122=-?=-?=r S y y σ

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%( 104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如下: 64.43(件/人) (55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下:

根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下: 试分析:(1)哪个单位工人的生产水平高? (2)哪个单位工人的生产水平整齐? % 3.33V %7.44V /8 .1x /5.1x ====乙甲乙甲人)(件人)(件9.在 计算平均数里,从每个标志变量中减去75个单位,然后将每个差数 缩小10倍,利用这个变形后的标志变量计算加权算术平均数,其中各个变量的权数扩大7倍,结果这个平均数等于0.4个单位。试计算这个平均标志变量的实际平均数,并说明理由。79 10.某地区1998~1999年国内生产总值资料如下表:(单位:亿元)

应用回归分析,第8章课后习题参考答案

第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如: (1) 乘性误差项,模型形式为 e y AK L αβε =, (2) 加性误差项,模型形式为y AK L αβ ε = + 对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表8.15 生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%) 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解:先画出散点图如下图: 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y

从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下: Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为:72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。 由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。 (2)指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.

2014年7月高等教育自学考试 00974《统计学原理》试题及答案

2014年7月高等教育自学考试 统计学原理试卷及答案 (课程代码 00974) 一、单项选择题(本大题共20小题,每小题1分,共20分) 1.构成统计总体的每一个别事物,称为 C A .调查对象 B .调查单位 C .总体单位 D .填报单位 2.对事物进行度量,最精确的计量尺度是A A .定比尺度 B .定序尺度 C .定类尺度 D .定距尺度 3.《中华人民共和国统计法》对我国政府统计的调查方式做的概括中指出,调查方式的主体是C A .统计报表 B .重点调查 C .经常性抽样调查 D .周期性普查 4.是非标志的成数p 和q 的取值范围是D A .大于零 B .小于零 C .大于1 D .界于0和1之间 5.在经过排序的数列中位置居中的数值是A A .中位数 B .众数 C .算术平均数 D .平均差 6.确定中位数的近似公式是A A .d f S f L m m ?-+ -∑1 2 B .d L ??+??+ 2 11 C .∑∑? f f x D . ∑-)(x x 7.反映现象在一段时间内变化总量的是B A .时点指标 B .时期指标 C .动态指标 D .绝对指标 8.重置抽样与不重置抽样的抽样误差相比A A .前者大 B .后者大 C .二者没有区别 D .二者的区别需要其他条件来判断 9.如果总体内各单位差异较大,也就是总体方差较大,则抽取的样本单位数A A .多一些 B .少一些 C .可多可少 D .与总体各单位差异无关 10.进行抽样调查时,样本对总体的代表性受到一些可控因素的影响,下列属于可控因素的是D A .样本数目 B .样本可能数目 C .总体单位数 D .样本容量 11.在12个单位中抽取4个,如果进行不重置抽样,样本可能数目M 为B A .4 12 B . ! 8!4! 12 C .12×4 D .12 4 12.方差是各变量值对算术平均数的A A .离差平方的平均数 B .离差平均数的平方根 C .离差平方平均数的平方根 D .离差平均数平方的平方根

统计学计算题例题及计算分析

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ乙= √[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

应用回归分析第2章课后习题参考答案

2.1 一元线性回归模型有哪些基本假定? 答:1. 解释变量 1x , ,2x ,p x 是非随机变量,观测值,1i x ,,2 i x ip x 是常数。 2. 等方差及不相关的假定条件为 ? ? ? ? ? ? ??????≠=====j i n j i j i n i E j i i ,0),,2,1,(,),cov(,,2,1, 0)(2 σεεε 这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M 条件。在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差2σ估计的一些重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。 3. 正态分布的假定条件为 ???=相互独立 n i n i N εεεσε,,,,,2,1),,0(~212 在此条件下便可得到关于回归系数的最小二乘估计及2σ估计的进一步结果,如它们分别是回归系数的最及2σ的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。 4. 通常为了便于数学上的处理,还要求,p n >及样本容量的个数要多于解释变量的个数。 在整个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进行处理。因此,线性回归模型的理论和应用是本书研究的重点。 1. 如何根据样本),,2,1)(;,,,(21n i y x x x i ip i i =求出p ββββ,,,,210 及方差2σ的估计; 2. 对回归方程及回归系数的种种假设进行检验; 3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。 2.2 考虑过原点的线性回归模型 n i x y i i i ,,2,1,1 =+=εβ误差n εεε,,,21 仍满足基本假定。求1β的最小二 乘估计。 答:∑∑==-=-=n i n i i i i x y y E y Q 1 1 2112 1)())(()(ββ

统计学原理试题及答案解析

统计学原理试题(6) 一、单项选择题:(每小题1分,共20分) 1、设某地区有200家独立核算得工业企业,要研究这些企业得产品生产情 况,总体就是( )。 A、每一家工业企业 B、200家工业企业 C、每一件产品 D、200家工业企业得全部工业产品 2、有600家公司每位职工得工资资料,如果要调查这些公司得工资水平情 况,则总体单位就是( )。 A、600家公司得全部职工 B、600家公司得每一位职工 C、600家公司所有职工得全部工资 D、600家公司每个职工得工资 3、一个统计总体( )。 A、只能有一个指标 B、可以有多个指标 C、只能有一个标志 D、可以有多个标志 4、以产品等级来反映某种产品得质量,则该产品等级就是( )。 A、数量标志 B、品质标志 C、数量指标 D、质量指标 5、在调查设计时,学校作为总体,每个班作为总体单位,各班学生人数就是( )。 A、变量值 B、变量 C、指标值 D、指标 6、年龄就是( )。 A、变量值 B、连续型变量 C、离散型变量 D、连续型变量,但在实际应用中常按离散型处理 7、人口普查规定统一得标准时间就是为了( )。 A、登记得方便 B、避免登记得重复与遗漏 C、确定调查得范围 D、确定调查得单位 8、以下哪种调查得报告单位与调查单位就是一致得( )。 A、职工调查 B、工业普查 C、工业设备调查 D、未安装设备调查 9、通过调查大庆、胜利、辽河等油田,了解我国石油生产得基本情况。这 种调查方式就是( )。 A、典型调查 B、抽样调查 C、重点调查 D、普查 10、某市进行工业企业生产设备普查,要求在10月1日至15日全部调查完 毕,则这一时间规定就是( )。 A、调查时间 B、登记期限 C、调查期限 D、标准时间 11、统计分组得关键问题就是( )。 A、确定分组标志与划分各组界限 B、确定组距与组中值

统计学练习题——计算题

统计学练习题——计算题 1、某企业工人按日产量分组如下: 单位:(件) 试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。 7月份平均每人日产量为:37360 13320 == = ∑∑f Xf X (件) 8月份平均每人日产量为:44360 15840 == = ∑∑ f Xf X (件) 根据计算结果得知8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。

2、某纺织厂生产某种棉布,经测定两年中各级产品的产量资料如下: 解: 2009年棉布的平均等级= 250 10 3 40 2 200 1? + ? + ? =1.24(级) 2010年棉布的平均等级= 300 6 3 24 2 270 1? + ? + ? =1.12(级) 可见该厂棉布产品质量2010年比2009年有所提高,其平均等级由1.24级上升为1.12级。质量提高的原因是棉布一级品由80%上升为90%,同时二级品和三级品分别由16%及4%下降为8%及2%。

试比较和分析哪个企业的单位成本高,为什么? 解: 甲企业的平均单位产品成本=1.0×10%+1.1×20%+1.2×70%=1.16(元) 乙企业的平均单位产品成本=1.2×30%+1.1×30%+1.0×40%=1.09(元) 可见甲企业的单位产品成本较高,其原因是甲企业生产的3批产品中,单位成本较高(1.2元)的产品数量占70%,而乙企业只占30%。

统计学计算题答案..

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

统计学原理练习题及答案

统计学原理练习题及答案 2007-12-7 9:32:24 阅读数:6162 《统计学原理》综合练习题 一、判断题(把正确的符号“√”或错误的符号“×”填写在题后的括号中。) 1、社会经济统计的研究对象是社会经济现象总体的各个方面。() 2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。() 3、总体单位是标志的承担者,标志是依附于单位的。() 4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。() 5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。 6、调查单位和填报单位在任何情况下都不可能一致。() 7、在统计调查中,调查标志的承担者是调查单位。() 8、对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。() 9、统计分组的关键问题是确定组距和组数( ) 10、按数量标志分组的目的,就是要区分各组在数量上的差别( ) 11、总体单位总量和总体标志总量是固定不变的,不能互相变换。() 12、相对指标都是用无名数形式表现出来的。() 13、众数是总体中出现最多的次数。() 14、国民收入中积累额与消费额之比为1:3,这是一个比较相对指标。() 15、总量指标和平均指标反映了现象总体的规模和一般水平。但掩盖了总体各单位的差异情况,因此通过这两个指标不能全面认识总体的特征。() 16、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。() 17、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。() 18、在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。() 19、抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。() 20、在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。() 21、抽样平均均误差反映抽样的可能误差范围,实际上每次的抽样误差可能大于抽样平均误差,也可能小于抽样平均误差。() 22、施肥量与收获率是正相关关系。() 23、计算相关系数的两个变量都是随机变量() 24、利用一个回归方程,两个变量可以互相推算()

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

统计学期末考试试题(含答案)

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

应用回归分析课后答案

应用回归分析课后答案 第二章一元线性回归 解答:EXCEL结果: SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值5 方差分析 df SS MS F Significance F 回归分析125 残差3 总计410 Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限%上限% Intercept X Variable 15 RESIDUAL OUTPUT 观测值预测Y残差 1 2 3 4 5 SPSS结果:(1)散点图为:

(2)x 与y 之间大致呈线性关系。 (3)设回归方程为01y x ββ∧ ∧ ∧ =+ 1β∧ = 12 2 1 7()n i i i n i i x y n x y x n x -- =- =-=-∑∑ 0120731y x ββ-∧- =-=-?=- 17y x ∧ ∴=-+可得回归方程为 (4)22 n i=1 1()n-2i i y y σ∧∧=-∑ 2 n 01i=1 1(())n-2i y x ββ∧∧=-+∑ =222 22 13???+?+???+?+??? (10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1 169049363 110/3= ++++= 1 330 6.13 σ∧=≈ (5)由于2 11(, )xx N L σββ∧ :

t σ ∧ == 服从自由度为n-2的t分布。因而 /2 |(2)1 P t n α α σ ?? ?? <-=- ?? ?? 也即: 1/211/2 (p t t αα βββ ∧∧ ∧∧ -<<+=1α - 可得 1 95% β∧的置信度为的置信区间为(7-2.3537+2.353即为:(,) 2 2 00 1() (,()) xx x N n L ββσ - ∧ + : t ∧∧ == 服从自由度为n-2的t分布。因而 /2 (2)1 P t n α α ∧ ?? ?? ?? <-=- ?? ?? ?? ?? ?? 即 0/200/2 ()1 pβσββσα ∧∧∧∧ -<<+=- 可得 1 95%7.77,5.77 β∧- 的置信度为的置信区间为() (6)x与y的决定系数 2 21 2 1 () 490/6000.817 () n i i n i i y y r y y ∧- = - = - ==≈ - ∑ ∑ (7)

统计学原理-计算题

《统计学原理》 计算题 1.某地区国民生产总值(GNP)在1988-1989年平均每年递增15%,1990-1992年平均每年递增12%,1993-1997年平均每年递增9%,试计算: 1)该地区国民生产总值这十年间的总发展速度及平均增长速度 答:该地区GNP在这十年间的总发展速度为 115%2×112%3×109%5=285.88% 平均增长速度为 111.08% == 2)若1997年的国民生产总值为500亿元,以后每年增长8%,到2000年可达到多少亿元? 答:2000年的GNP为 500(1+8%)13=1359.81(亿元) 2.某地有八家银行,从它们所有的全体职工中随机动性抽取600人进行调查,得知其中的486人在银行里有个人储蓄存款,存款金额平均每人3400元,标准差500元,试以95.45%的可靠性推断:(F(T)为95.45%,则t=2) 1)全体职工中有储蓄存款者所占比率的区间范围 答:已知:n=600,p=81%,又F(T)为95.45%,则t=2所以 0.1026% == 故全体职工中有储蓄存款者所占比率的区间范围为 81%±0.1026% 2)平均每人存款金额的区间范围 3.某厂产品产量及出厂价格资料如下表: 要求:对该厂总产值变动进行因素分析。(计算结果百分数保留2位小数) 答:①总产值指数 11 00500010012000604100020 104.08% 600011010000504000020 p q p q ?+?+? ==?+?+? ∑ ∑ 总成本增加量 Σp1q1-Σp0q0=2040000-1960000=80000(元)②产量指数

统计学计算题例题学习资料

统计学计算题例题

第四章 1. 某企业1982年12月工人工资的资料如下: 要求:(1)计算平均工资;(79元) (2)用简捷法计算平均工资。 2. 某企业劳动生产率1995年比1990年增长7%,超额完成计划2%,试确定劳动生产率计划增长数。 7%-2%=5% 3. 某厂按计划规定,第一季度的单位产品成本比去年同期降低8%。实际 执行结果,单位产品成本较去年同期降低4%。问该厂第一季度产品单位成本计划的完成程度如何?104.35%( (1-4%)/(1-8%)*100%=96%/92%*100%=104.35%结果表明:超额完成4.35%(104.35%-100%)) 4. 某公社农户年收入额的分组资料如下:

要求:试确定其中位数及众数。中位数为774.3(元)众数为755.9(元) 求中位数: 先求比例:(1500-720)/(1770-720)=0.74286 分割中位数组的组距:(800-700)*0.74286=74.286 加下限700+74.286=774.286 求众数: D1=1050-480=570 D2=1050-600=450 求比例:d1/(d1+d2)=570/(570+450)=0.55882 分割众数组的组距:0.55882*(800-700)=55.882 加下限:700+55.882=755.882 5.1996年某月份某企业按工人劳动生产率高底分组的生产班组数和产量资料如 下: 率。64.43(件/人)

(55*300+65*200+75*140+85*60)/(300+200+140+60) 6.某地区家庭按人均月收入水平分组资料如下: 根据表中资料计算中位数和众数。中位数为733.33(元) 众数为711.11(元) 求中位数: 先求比例:(50-20)/(65-20)=0.6667 分割中位数组的组距:(800-600)*0.6667=66.67 加下限:600+66.67=666.67 7.某企业产值计划完成 103%,比去年增长5%。试问计划规定比去年增长 多少?1.94% (上年实际完成1.03/1.05=0.981 本年实际计划比上年增长 (1-0.981)/0.981=0.019/0.981=1.937%) 8.甲、乙两单位工人的生产资料如下:

应用回归分析,第7章课后习题参考答案

第7章岭回归 思考与练习参考答案 7.1 岭回归估计是在什么情况下提出的? 答:当自变量间存在复共线性时,|X’X|≈0,回归系数估计的方差就很大,估计值就很不稳定,为解决多重共线性,并使回归得到合理的结果,70年代提出了岭回归(Ridge Regression,简记为RR)。 7.2岭回归的定义及统计思想是什么? 答:岭回归法就是以引入偏误为代价减小参数估计量的方差的一种回归方法,其统计思想是对于(X’X)-1为奇异时,给X’X加上一个正常数矩阵 D, 那么X’X+D接近奇异的程度就会比X′X接近奇异的程度小得多,从而完成回归。但是这样的回归必定丢失了信息,不满足blue。但这样的代价有时是值得的,因为这样可以获得与专业知识相一致的结果。 7.3 选择岭参数k有哪几种方法? 答:最优 是依赖于未知参数 和 的,几种常见的选择方法是: 岭迹法:选择 的点能使各岭估计基本稳定,岭估计符号合理,回归系数没有不合乎经济意义的绝对值,且残差平方和增大不太多;

方差扩大因子法: ,其对角线元 是岭估计的方差扩大因子。要让 ; 残差平方和:满足 成立的最大的 值。 7.4 用岭回归方法选择自变量应遵循哪些基本原则? 答:岭回归选择变量通常的原则是: 1. 在岭回归的计算中,我们通常假定涉及矩阵已经中心化和标准化了,这样可以直接比较标准化岭回归系数的大小。我们可以剔除掉标准化岭回归系数比较稳定且绝对值很小的自变量; 2. 当k值较小时,标准化岭回归系数的绝对值并不很小,但是不稳定,随着k的增加迅速趋近于零。像这样岭回归系数不稳定、震动趋于零的自变量,我们也可以予以剔除; 3. 去掉标准化岭回归系数很不稳定的自变量。如果有若干个岭回归系数不稳定,究竟去掉几个,去掉那几个,要根据去掉某个变量后重新进行岭回归分析的效果来确定。

统计学计算习题

第四章 六、计算题 月工资(元) 甲单位人数(人) 乙单位人数比重(%) 400以下 400~600 600~800 800~1000 1000以上 4 25 84 126 28 2 8 30 42 18 合 计 267 100 工资更具有代表性。 1、(1) 430025500267 x f x f ?+?+ == = ∑∑甲工资总额 总人数 3002%5008%7003%f x x f =? =?+?+?+ ∑∑乙 (2) 计算变异系数比较 ()2 x x f f σ-=∑∑甲甲 甲甲 () 2 x x f f σ-∑∑乙乙 乙乙 V x σσ= 甲 甲 甲 V x σσ= 乙乙乙 根据V σ甲 、V σ乙 大小判断,数值越大,代表性越小。 甲品种 乙品种 田块面积(亩) 产量(公斤) 田块面积(亩) 产量(公斤) 1.2 0.8 1.5 1.3 600 405 725 700 1.0 1.3 0.7 1.5 500 675 375 700 4.8 2430 4.5 2250 假定生产条件相同,试研究这两个品种的收获率,确定那一个品种具有稳定性和推广价值。 2、(1) 收获率(平均亩产) 2430 528.254.8 x = ==甲总产量总面积 2250 5004.5 x = =乙 (2) 稳定性推广价值(求变异指标) 2 2 2 2 600405725700506 1.25060.8506 1.5506 1.31.20.8 1.5 1.34.8 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=甲

2 2 2 2 500675375700500 1.0500 1.35000.7500 1.51.0 1.30.7 1.54.5 σ???????? -?+-?+-?+-? ? ? ? ?? ???????=乙 求V σ甲 、V σ乙 ,据此判断。 8.某地20个商店,1994年第四季度的统计资料如下表4-6。 表4-6 按商品销售计划完成情 况分组(%) 商店 数目 实际商品销售额 (万元) 流通费用率 (%) 80-90 90-100 100-110 110-120 3 4 8 5 45.9 68.4 34.4 94.3 14.8 13.2 12.0 11.0 试计算 (1)该地20个商店平均完成销售计划指标 (2)该地20个商店总的流通费用率 (提示:流通费用率=流通费用/实际销售额) 8、(1) () 101%1 % f f x = = =?∑∑ 20实际销售额计划销售额 实际销售额 计划完成 (2) 据提示计算:2012.7%x = 品 种 价格 (元/公斤) 销售额(万元) 甲市场 乙市场 甲 乙 丙 0.30 0.32 0.36 75.0 40.0 45.0 37.5 80.0 45.0 13、提示:= 销售额 平均价格销售量 企业序号 计划产量(件) 计划完成程度(%) 实际一级品率 (%) 1 2 3 4 5 350 500 450 400 470 102 105 110 97 100 98 96 90 85 91

应用统计学试题及答案

北京工业大学经济与管理学院2007-2008年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设 备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为

A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间 D. 时间每减少一个单位,产品成本平均下降个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公

斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=件乙车间: x=90件, σ=件哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何

应用回归分析第三章课后习题整理

y1 1 x11 x12 x1p 0 1 3.1 y2 1 x21 x22 x2p 1 + 2 即y=x + yn 1 xn1 xn2 xnp p n 基本假定 (1) 解释变量x1,x2…,xp 是确定性变量,不是随机变量,且要求 rank(X)=p+1

n 注 tr(H) h 1 3.4不能断定这个方程一定很理想,因为样本决定系数与回归方程中 自变量的数目以及样本量n 有关,当样本量个数n 太小,而自变量又较 多,使样本量与自变量的个数接近时, R 2易接近1,其中隐藏一些虚 假成分。 3.5当接受H o 时,认定在给定的显著性水平 下,自变量x1,x2, xp 对因变量y 无显著影响,于是通过x1,x2, xp 去推断y 也就无多大意 义,在这种情况下,一方面可能这个问题本来应该用非线性模型去描 述,而误用了线性模型,使得自变量对因变量无显著影响;另一方面 可能是在考虑自变量时,把影响因变量y 的自变量漏掉了,可以重新 考虑建模问题。 当拒绝H o 时,我们也不能过于相信这个检验,认为这个回归模型 已经完美了,当拒绝H o 时,我们只能认为这个模型在一定程度上说明 了自变量x1,x2, xp 与自变量y 的线性关系,这时仍不能排除排除我 们漏掉了一些重要的自变量。 3.6中心化经验回归方程的常数项为0,回归方程只包含p 个参数估计 值1, 2, p 比一般的经验回归方程减少了一个未知参数,在变量较 SSE (y y)2 e12 e22 1 2 1 E( ) E( - SSE* - n p 1 n p n 2 [D(e) (E(e ))2 ] 1 n (1 1 n 2 en n E( e 1 1 n p 1 1 n p 1 1 "1 1 n p 1 J (n D(e) 1 (p 1)) 1_ p 1 1 1 n p 1 2 2 n E(e 2 ) (1 h ) 2 1

相关文档
相关文档 最新文档