文档库 最新最全的文档下载
当前位置:文档库 › 统计学练习题(含作业及非官方答案)(1)

统计学练习题(含作业及非官方答案)(1)

统计学练习题(含作业及非官方答案)(1)
统计学练习题(含作业及非官方答案)(1)

一、单项选择题

1.根据样本计算的用于推断总体特征的概括性度量值称作

(参数)

A.参数

B.总体

C.样本

D.统计量

2.只能归于某一类别的非数字型数据称为(分类数据)

A.分类数据

B.顺序数据

C.数值型数据

D.数值型变量

3.只能归于某一有序类别的非数字型数据称为(顺序数据)

A.分类数据

B.顺序数据

C.数值型数据

D.数值型变量

4.用来描述样本特征的概括性数字度量称为(统计量)

A.参数

B.统计量

C.变量

D.变量值

5.为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是(整群抽样)

A.简单随机抽样

B.系统抽样

C.分层抽样

D.整群抽样

6.为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生进行调查,这种调查方法是(分层抽样)

A.简单随机抽样

B.整群抽样

C.系统抽样

D.分层抽样

7.经验法则表明,当一组数据对称分布时,在平均数加减1个标准差的范围之内大约有(68%)

A.68%

B.95%

C.99%

D.100%

8.经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围内大约有(95%)

A.68%

B.95%

C.99%

D.100%

9.离散系数的主要用途是(比较多组数据的离散程度)

A.反映一组数据的离散程度

B.反映一组数据的平均水平

C.比较多组数据的离散程度

D.比较多组数据的平均水平

10.比较两组数据的离散程度最适合的统计量是(离散系数)

A.极差

B.平均差

C.标准差

D.离散系数

11.峰态通常是与标准正态分布相比较而言的,如果一组数据服从标准正态分布,则峰态系数的值(等于0)

A.等于0

B.大于0

C.小于0

D.等于1

12.如果峰态系数k>0,表明该组数据是(尖峰分布)

A.尖峰分布

B.扁平分布

C.左偏分布

D.右偏分布

13.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,则该组数据的中位数是(赞成)

A.赞成

B.69

C.中立

D.22

14.某班共有25名学生,期未统计学课程的考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、62、81、63、68、81、70、73、60、87、75、64、56,那么该班考试分数的下四分位数和上四分位数分别是(64.5和

78.5)

A.64.5和78.5

B.67.5和71.5

C.64.5和71.5

D.64.5和67.5

15.某行业中随机抽取10家企业,第一季度的利润额(单位:万元)分别是:72、63.1、54.7、54.3、29、26.9、25、23.9、

23、20,该组数据的中位数为(27.95)

A.28.46

B.30.20

C.27.95

D.28.12

16.一组数据的离散系数为0.4,平均数为20,则标准差为(8)

A.80

B.0.02

C.4

D.8 方差:

1

)

(

1

2

2

-

-

=

=

n

x

x

s

n

i

i

;离散系数:

x

s

v

s

=

17.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为(μ)

A.μ

B.X

C.2

σ D.n

2

σ

18. 根据中心极限定理可知,当样本容量充分大时,样本均

值的抽样分布服从正态分布,其分布的方差为(

n

2

σ

A.μ

B.X

C.2

σ D.

n

2

σ

19.假设总体服从均匀分布,从此总体中抽取容量为36的样本,则样本均值的抽样分布(近似正态分布)

A.服从非正态分布

B.近似正态分布

C.服从均匀分布

D.服从

2

χ分布

20.总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的均值和标准误差分别为(50,1)

A.50,8

B.50,1

C.50,4

D.8,8

21.当正态总体的方差未知时,在大样本条件下,估计总体均值使用的分布是(正态分布)

A.正态分布

B.t分布

C.

2

χ分布 D.F分布

22.当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是(t分布)

A.正态分布

B.t分布

C.

2

χ分布 D.F分布

23.根据两个匹配的小样本估计两个总体均值之差时,使用的分布是(t分布)

A.正态分布

B.t分布

C.

2

χ分布 D.F分布

24.估计两个总体方差比的置信区间时,使用的分布是(F分布)

A.正态分布

B.t分布

C.

2

χ

分布 D.F分布

25.一种零件的标准长度5cm,要检验某天生产的零件是否符合标准要求,建立的原假设和备择假设应为(H0:μ=5,H1: μ≠5)

A.H0:μ=5,H1: μ≠5

B.H0:μ≠5,H1: μ=5

C.H0:μ≤5,H1: μ≥5

D.H0:μ≥5,H1: μ≤5

26.一项研究表明,中学生中吸烟的比例高达30%,为检验这一说法是否属实,建立的原假设和备择假设应为(H0:π=30%,H1:π≠30%)

A.H0:μ=30%,H1: μ≠30%

B.H0:π=30%,H1:π≠30%

C.H0:π≥30%,H1:π≤30%

D. H0:π≤30%,H1:π≥30%

27.列联分析是利用列联表来研究(两个分类变量的关系)

A.两个分类变量的关系

B.两个数值型变量的关系

C.一个分类变量和一个数值型变量的关系

D.两个数值型变量的分布

28.设R 为列联表的行数,C 为列联表的列数,则2χ分布的

自由度为((R-1)×(C-1))

A.R

B.C

C.R×C

D.(R-1)×(C-1) 29.方差分析的主要目的是判断(分类型自变量对数值型因变量的影响是否显著) A.各总体是否存在方差

B.各样本数据之间是否有显著差异

C.分类型自变量对数值型因变量的影响是否显著

D.分类型因变量对数值型自变量的影响是否显著

30.组间误差是衡量不同水平下各样本数据之间的误差,它(既包括随机误差,又包括系统误差)

A.只包括随机误差

B.只包括系统误差

C.既包括随机误差,又包括系统误差

D.有时包括随机误差,有时包括系统误差 31.组内误差是衡量某一水平下样本数据之间的误差,它(只包括随机误差)

A.只包括随机误差

B.只包括系统误差

C.既包括随机误差,又包括系统误差

D.有时包括随机误差,有时包括系统误差 32.单因素方差分析是指只涉及(一个分类型自变量)

A.一个分类型自变量

B.一个数值型自变量

C.两个分类型自变量

D.两个数值型因变量

33.双因素方差分析涉及(两个分类型自变量)

A.两个分类型自变量

B.两个数值型自变量

C.两个分类型因变量

D.两个数值型因变量

34.在方差分析中,数据的误差用平方和来表示的,其中反映一个样本中各观测值误差大小的平方和称为(组内平方和) A.组间平方和 B.组内平方和 C.总平方和 D.水平项平方和 35.在方差分析中,数据的误差用平方和来表示的,其中反映各个样本均值之间误差大小的平方和称为(组间平方和) A.误差项平方和 B.组内平方和 C.组间平方和 D.总平方和 36.如果一个变量的取值完全依赖于另一个变量,各观测点落在一条直线上,称为两个变量之间为(完全相关关系)

A.完全相关关系

B.正线性相关关系

C.非线性相关关系

D.负线性相关关系

37.如果相关系数r =0,则表明两个变量之间(不存在线性相关关系)

A.相关程度很低

B.不存在任何关系

C.不存在线性相关关系

D.存在非线性相关关系 38.在一元线性回归方程中,回归系数

i β的实际意义是(当x

变量1个单位时,y 增加的总数量)

A.当x=0时,y 的平均变动数量

B.当x 变动1个单位时,y 的平均变动数量

C.当x 变动1个单位时,y 增加的总数量

D.当y 变动1个单位时,x 的平均变动数量

39.对不同年份的产品成本拟合的直线方程为

x y 75.1280-=,回归系数75.11-=β表示(时间每增加

1个单位,产品成本平均下降1.75个单位)

A.时间每增加1个单位,产品成本平均增加1.75个单位

B.时间每增加1个单位,产品成本平均下降1.75个单位

C.产品成本每变动1个单位,平均需要1.75年时间

D.时间每减少1个单位,产品成本平均增加1.75个单位 40.说明回归方程拟合优度的统计量是(判定系数)

A.相关系数

B.回归系数

C.判定系数

D.估计标准误差 41.各实际观测值(yi )与回归值(

i y ?)的离差平方和称为(残

差平方和)

A.总变差平方和

B.残差平方和

C.回归平方和

D.判定系数 42.回归平方和占总平方和的比例称为(判定系数)

A.相关系数

B.回归系数

C.判定系数

D.估计标准误差 43.若两个变量存在负线性相关关系,则建立的一元线性回归方程的判定系数R2的取值范围是([0,1])

A.[0,1]

B.[-1,0]

C.[-1,1]

D.小于0的任意数 44.若变量x 与y 之间的相关系数r =0,则下列结论中正确的是(判定系数R2=0)

A.判定系数R2=1

B.判定系数R2=0

C.回归系数1?

1=β

D.估计标准误差se =0

45.在多元线性回归方程

k k i x x y βββ????110+++= 中,回归系数i β?表示(其他变量不变的条件下,自变量xi 变动1

个单位时,因变量y 的平均变动额为

i β?)

A.自变量xi 变动1个单位时,因变量y 的平均变动额为

i β?

B.其他变量不变的条件下,自变量xi 变动1个单位时,因变

量y 的平均变动额为i β?

C.其他变量不变的条件下,自变量xi 变动1个单位时,因变量y 的变动总额为

i β?

D.因变量y 变动1个单位时,因变量xi 的变动总额为i β?

46.设在多元线性回归方程

k k i x x y βββ????110+++= 中,若自变量xi 的回归系数

i β?的取值接近0,这表明(自变量

xi 对因变量y 的影响不显著)

A.因变量y 对自变量xi 的影响不显著

B.因变量y 对自变量xi 的影响显著

C.自变量xi 对因变量y 的影响不显著

D.自变量xi 对因变量y 的影响显著

47.指数平滑法适合于预测(平稳序列)

A.平稳序列

B.非平稳序列

C.有趋势成分的序列

D.有季节成分的序列

48.移动平均法适合于预测(平稳序列)

A.平稳序列

B.非平稳序列

C.有趋势成分的序列

D.有季节成分的序列

49.用最小二乘法拟合直线趋势方程为t b b Y 1

0?+=,若1b 为负数,表明该现象随着时间的推移呈现(下降趋势)

A.上升趋势

B.下降趋势

C.水平趋势

D.随机波动 50.对某一时间序列拟合的直线趋势方程为

x b b Y t 10?+=,如

果b1的值等于0,则表明该序列(没有趋势)

A.没有趋势

B.有上升趋势

C.有下降趋势 D ,有非线性趋势

二、简答题

1.简要区别描述统计与推断统计?

答:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。

2.一组数据的分布特征可以从哪几个方面进行测度?

答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。

3.在列联分析中,简述2χ统计量的计算步骤?

4.简述单因素方差分析的基本步骤? (1)提出原假设

(2)构造检验的统计量

计算各样本的均值

计算全部观测值的总均值 计算各误差平方和: 总平方和(SST )=组间平方和(SSA )+组内平方和(SSE ) 计算统计量 (3)统计决策 (4)方差分析表

(5)用Excel 进行方差分析

5.简述双因素方差分析的基本步骤? (1)提出假设

(2)构造检验的统计量

(3)统计决策

6.简述方差分析的基本思路和原理? (1)图形描述 (2)误差分解

(3)误差分析

7.简述2χ分布、t 分布、F 分布及正态分布之间的关系?

8.回归分析主要解决哪几方面的问题?

(1)从一组样本数据出发,确定变量之间的数学关系式。

(2)对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。

(3)利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的可靠程度。

9.回归分析与相关分析的区别?

(1)相关分析中,变量x 变量y 处于平等的地位;回归分析中,变量y 称为因变量,处在被解释的地位,变量x 称为自变量,用于预测因变量的变化。

(2)相关分析中所涉及的变量x 和y 都是随机变量;回归分析中,因变量y 是随机变量,自变量x 可以是随机变量,也可以是非随机的确定变量。

(3)相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x 对变量y 的影响大小,还可以由回归方程进行预测和控制。 10.简述一元线性关系的检验步骤? (1)提出假设

(2)计算检验统计量F (3)作出决策

三、名词解释

1.拉氏价格指数:以现期价格购买一个基期选定的商品组合的成本相对于以基期价格购买同一组合的成本的比值。

2.帕氏价格指数:以现期价格购买一个现期选定的商品组合的成本相对于以基期价格购买同一组合的成本的比值。

3.集中趋势:指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。

4.置信区间:由样本统计量所构造的总体参数的估计区间。

5.置信水平:将构造置信区间的步骤重复多次,置信区间中包含总体参数真值的次数所占的比例。

6.弃真错误:当原假设为真时拒绝原假设,所犯的就称为第一类错误,又称弃真错误,即α错误。

7.取伪错误:当原假设为假时没有拒绝原假设,所犯的就是第二类错误,又称取伪错误,即β错误。

8.多重共线性:当回归模型中两个或两个以上的自变量彼此相关时,则称回归模型中存在多重共线性。

9.趋势:是时间序列在长期内呈现出来的某种持续上升或持续下降的变动。 10.线性趋势:指现象随着时间的推移而呈现出稳定增长或下降的线性变化规律。 11.回归方程:描述因变量y 的期望值如何依赖于自变量x 的方程方程。

12.最小二乘估计:通过使因变量的观测值i y 与估计值i y

?之间的离差平方和达到最小来估计0β和1β的方法。 13.判定系数:回归平方和占总平方和的比例。

14.估计标准误差:说明实际值与其估计值之间相对偏离程度的指标。

15.残差:是因变量的观测值i y 与根据估计的回归方程求出的预测值i y ?

之差。

16.拟合优度:指回归直线对观测值的拟合程度。 17.组内误差:来自水平内部的数据误差。 18.间接误差:间接测量的误差。

19.系统误差:在重复性条件下,对同一被测量进行无限多次测量所得结果的平均值与被测量的真值之差。 20.回归模型:描述因变量y 如何依赖于自变量x 和误差项ε的方程。

四、计算题

4.2

1)计算众数、中位数:0M =19和23;e M =23 (2)根据定义公式计算四分位数:1Q =19;3Q =26.5

(3)计算平均数和标准差:x =24;

s=1

)

(2

-

-∑n x x i

=6.65

(4)计算偏态系数和峰态系数: SK=

3

3)2)(1()(s

n n x x n i ---∑=1.08

K=

4

224)3)(2)(1()

1(]

)([3)()1

(s n n n n x x x x n n i i -------+∑∑=0.773

(5)对网民年龄的分布特征进行综合分析:

样本数据的均值为24岁,但标准差较大,说明网民年龄之间差异较大。从偏态和峰度系数来看,网民年龄呈现右偏尖峰分布。

7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g 。现从某天生产的一批产品中按重复抽样随机抽

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量的95%的置信区间。 解:大样本,总体方差未知,用z 统计量

x z =

()0,1N ;x =101.4,s=1.829 置信区间:2,s s x z x z αα?

?-+ ???

1α-=0.95,2z α=0.025z =1.96

22s s x z x z αα?

-+ ?

=101.4 1.96 1.96?-+ ? =(100.89,101.91)

(2)如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。 解:总体比率的估计

大样本,总体方差未知,用z 统计量

z =

()0,1N ;p=(50-5)/50=0.9

置信区间:p z p z αα? -+ ? 1α-=0.95,2z α=0.025z =1.96

22p z p z αα? -+ ? =0.9 1.96 1.96? -+ ? =(0.8168,0.9832)

7.18某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1)求总体中赞成新措施的户数比例的置信区间(α=0.05)

,(为:户数比例的总体中赞成该项改革的,,,,已知:.77051.0即13.064.050

0.64)

-0.64(196.164.0n p)-(1z 的置信区间95% 1.96z 0.0564.050

32

05n α/2

0.05/2±=±=±====

=p p p α(2)如果小区管理者预计赞成的比例能达到80%,要求估计误差不超过10%。应抽取多少户进行调查(α=0.05)?

621

.0)

80.01(80.096.1)1()(z n 1.96z 0.0580.02

2

22

/20.05/2≈-?=-?=

===E ππαπα应抽取的样本量为:,,已知:

7.20顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时

要求: (1)构建第一种排队方式等待时间标准差的95%置信区间。

解:估计统计量:()()222

1~1n S n χσ

-- 样本标准差:2

2s =0.2272

置信区间:()()()()

22

2222121111n S n S n n αασχχ---≤≤--

1α-=0.95,n=10,

()2

21n αχ-=()20.025

=19.02,

()2121n αχ--=()2

0.9759χ=2.7

()()()()22222111,11n S n S n n ααχχ-??-- ? ?--??

=90.227290.2272,19.02 2.7????

???

=(0.1075,0.7574)

因此,标准差的置信区间为(0.3279,0.8703) (2)构建第二种排队方式等待时间标准差的95%置信区间。

解:估计统计量:

()()2

2

2

1~1n S n χ

σ

--

样本标准差2

1s =3.318

置信区间:()()()()

22

2222121111n S n S n n αασχχ---≤≤--

1α-=0.95,n=10,

()221n αχ-=()20.0259χ=19.02,

()211n αχ--=()2

0.9759χ=2.7

()()()()22221211,1

1n S n S n n ααχχ-??--

? ?--??

=9 3.3189 3.318,19.02 2.7????

???

=(1.57,11.06)

因此,标准差的置信区间为(1.25,3.33)

(3)根据(1)和(2)的结果,你认为哪种排队方式更好? 答:第一种方式好,标准差小!

8.4糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5 已知包重服从正态分布,试检验该日打包机工作是否正常(a =0.05)? 解:H 0:μ=100;H 1:μ≠100

经计算得:x =99.9778;S =1.21221 检验统计量:

x t =

-0.055 当α=0.05,自由度n -1=8时,查表得2/αt =2。 因为t <2t α,样本统计量落在接受区域,故接受原假设,拒绝备择假设,说明打包机工作正常。

8.10装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下:

甲:31 34 29 32 35 38 34 30 29 32 31 26 乙:26 24 28 29 30 29 32 26 31 29 32 28 两总体为正态总体,且方差相同。问两种方法的装配时间有无显著不同(a =0.05)?

解:建立假设H 0:μ1-μ2=0;H 1:μ1-μ2≠0

总体正态,小样本抽样,方差未知,方差相等,检验统计量

x x t -=

根据样本数据计算,得

1n =12,2n =12, 1x =31.75,1s =3.19446, 2x =28.6667,2s =2.46183。

()()22

1112212112

p

n s n s s

n n -+-=

+- =()()221210.922161210.7106712122

-?+-?+-

=8.1326

x x t -=

=2.648

当α=0.05时,临界点为()2122t n n α+-=()0.02522t =

2.074,此题中t >2t α,故拒绝原假设,认为两种方法的装配时间有显著差异。

8.14某工厂制造螺栓,规定螺栓口径为7.0cm ,方差为0.03cm 。今从一批螺栓中抽取80个测量其口径,得平均值为6.97cm ,方差为0.0375cm 。假定螺栓口径为正态分布,问这批螺栓是否达到规定的要求?(α=0.05)

20:σH =7;≠21:σH 7

0025.00549.180

/03.07

97.6/Z <-=-=-=

Z n x σμ

不能拒绝原假设。

8.15有人说在大学中男生的学习成绩比女生的学习成绩好。现从一个学校中随机抽取了25名男生和16名女生,对他们进行了同样题目的测试。测试结果表明,男生的平均成绩为82分,方差为56分,女生的平均成绩为78分,方差为49分。假设显著性水平α=0.02,从上述数据中能得到什么结论?

解:首先进行方差是否相等的检验:

建立假设H 0:21σ=22σ;H 1:21σ≠2

2σ n1=25,21s =56,n2=16,22s =49,

2

122

s F s ==5649=1.143 当α=0.02时,()224,15F α=3.294,()124,15F α-=0.346。由于()1224,15F α-<F <()224,15F α,检验统计量的值落在接受域中,所以接受原假设,说明总体方差无显著差异。

检验均值差:

建立假设H 0:μ1-μ2=0;H 1:μ1-μ2=0

总体正态,小样本抽样,方差未知,方差相等,

检验统计量x x t -=

根据样本数据计算,得1n =25,2n =16,

1x =82,21s =56,2x =78,2

2

s =49 ()()22

1112212112

p

n s n s s

n n -+-=

+-=53.308

x x t -=

=1.711

α=0.02时,临界点为()122t n n α+-=()0.0239t =2.125,t <t α,故不能拒绝原假设,不能认为大学中男生的学习成绩比女生的学习成绩好。

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学习题带答案

统计学习题答案 第一章绪论 一、单项选择 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25 000棵成年松树,该研究需要从中随机抽取250棵成年松树并丈量它们的高度后进行分析。该研究的总体是(B )。 A. 250棵成年松树 B.公园中25 000棵成年松树 C.所有高于60英尺的成年松树 D.森林公园中所有年龄的松树 2、推断统计的主要功能是(D )。 A.应用总体的信息描述样本 B.描述样本中包含的信息 C.描述总体中包含的信息 D.应用样本信息描述总体 3、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育,这一叙述是(D )的结果。 A.定性变量 B.试验 C.描述统计 D.推断统计 4、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此他观察了200名新生,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是( C )。 A.该大学的所有学生 B.所有的大学生 C.该大学所有的一年级新生 D.样本中的200名新生 5、在下列叙述中,关于推断统计的描述是( B )。 A.一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌 B.从一个果园中抽取36个橘子的样本,用该样本的平均重量估计果园中橘子的平均重量 C.一个大型城市在元月份的平均汽油价格 D.反映大学生统计学成绩的直方图 6、你询问了你们班8位同学的经济学成绩,这些成绩的平均数是65分。基于这种信息,你认为全班的经济学平均成绩不超过70分。这个例子属于统计学的哪个分支( C )? A.参数统计 B.描述统计 C.推断统计 D.理论统计 7、某手机厂商认为,如果流水线上组装的手机出现故障的比率每天不超过3%,则认为组装过程是令人满意的。为了检验某天生产的手机质量,厂商从当天生产的手机中随机抽取了30部进行检测。手机厂商感兴趣的总体是( A )。 A.当天生产的全部手机 B.抽取的30部手机 C. 3%有故障的手机 D.30部手机的检测结果

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

统计学计算题(有答案)

1、甲乙两班同时参加《统计学原理》课程的测试,甲班平均成绩为81分,标准差为9.5分,乙 班的成绩分组资料如下: 按成绩分组学生人数(人) 60以下 4 60~70 10 70~80 25 80~90 14 90~100 2 计算乙班学生的平均成绩,并比较甲乙两班,哪个班的平均成绩更有代表性? 2、某车间有甲乙两个生产组,甲组平均每个人的日产量为36件,标准差为9.6件,乙组工人产 量资料如下: 日产量(件)工人数(人) 15 15 25 38 35 34 45 13 要求:(1)计算乙组平均每个工人的日产量和标准差 (2)比较甲乙两生产小组的日产量更有代表性 3 月份 1 2 3 4 5 6 8 11 12

库存额60 55 48 43 40 50 45 60 68 又知1月1日商品库存额为63万元,试计算上半年,下半年和全年的平均商品库存额。 4 品名单位销售额2002比2001销售量增长(%) 2001 2002 电视台5000 8880 23 自行车辆4500 4200 -7 合计9500 13080 (2)计算由于销售量变动消费者增加或减少的支出金额 5、某商店两种商品的销售额和销售价格的变化情况如下:(万元) 商品单位销售额1996比1995年销售价格提高(%) 1995 1996 甲米120 130 10 乙件40 36 12 要求:(1)计算两件商品销售价格总指标和由于价格变动对销售额的影响绝对值(2)计算销售量总指数,计算由于销售变动消费者增加或减少的支出金额

6、某企业上半年产品量和单位成本资料如下: 要求:(1)计算相关系数, 说明两个变量相关的密切程度 (2)配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? 月份 产量(千克) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68

统计学练习题及答案

第一章导论练习题 1.单选题 (1)统计研究对象的特点包括(C)。 A、总体性 B、具体性 C 、总体性和具体性D、同一性 (2)下列指标中不属于质量指标的是( D )。 A、平均价格 B 、单位成本 C 、资产负债率 D 、利润总额 (3)下列指标中不属于数量指标的是(C)。 C 、资产报酬率D、A、资产总额 B 、总人口 人口增加数 (4)描述统计和推断统计的之间的关系是( A )。 A、前者是后者的基础 B、后者是前者的基础 C 、两者没有关系 两这互为基础(5)一个统计总体(D ) A、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 (6)若要了解某市工业生产设备情况,则总体单位是该市(D) A每一个工业企业 B 每一台设备 C 每一台生产设备 D 每一台工业生产设备 (7)某班学生数学考试成绩分别为65 分71 分、80 分和87 分,这四个数字是(D) A指标 B 标志C变量 D 标志值 (8)下列属于品质标志的是(B) A 工人年龄 B 工人性别C工人体重 D 工人工资 9)现要了解某机床厂的生产经营情况,该厂的产量和利润是( D )A 连续变量B 离散变量C 前者是连续变量,后者是离散变量者是连续 变量(10)劳动生产率是(B ) A 动态指标 B 质量指标 C 流量指标 D 强度指标 (11)统计规律性主要是通过运用下述方法整理、分析后得出的结论( B )D、 D 前者是离散变量,后

欢迎下载 2 A 统计分组法 B 大量观察法 C 综合指标法 D 统计推断法 (12) (C ) 是统计的基础功能 A 管理功能 B 咨询功能 C 信息功能 D 监督功能 (13) ( A )是统计的根本准则,是统计的生命线 A 真实性 B 及时性 C 总体性 D 连续性 (14)统计研究的数量是( B ) A 抽象的量 B 具体的量 C 连续不断的量 D 可直接相加的量 C ) (15 )数量指标 般表现为( A 平均数 B 相对数 C 绝对数 D 众数 (16 )指标是说明总体特征的,标志是说明总体单位特征的,所以( A ) A 指标和标志之间在一定条件下可以相互转换 B 指标和标志都是可以用数值表示的 C 指标和标志之间是不存在关系的 D 指标和标志之间的关系是固定不变 的 2. 多选题 (1) 统计学发展过程中经历的主要学派有( ABCD )。 (2) 下列标志中属于品质标志的有 ( AC )。 (3) 下列指标中属于质量指标的有( ABD )。 (4) "统计”一词含义有( BCD )。 A 统计研究 B 统计工作 C 统计资料 3?判断题 1、 现代统计学的核心是描述统计学。 ( F ) 2、 描述统计学是推断统计学的基础。 ( T ) 3、 统计指标可以分成数量指标和质量指标。 ( T ) 4、 所有标志都可以用数量表现。 ( F ) A 政治算术学派 B 国势学派 C 数理统计学派 D 社会统计学派 A 企业的经济类型 B 劳动生产率 C 企业所属的行业 D 企业的负债总额 A 平均亩产 数 B 人均钢产量 C 国民生产总值 D 存货周转次 D 统计学

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学计算题和标准答案

企业型号价格(元/台)甲专卖店销售额(万元)乙专卖店销售量(台) A 2500 50.0 340 B 3400 115.6 260 C 4100 106.6 200 合计—272.2 — 要求:分别计算两个专卖店空调的平均销售价格,并分析平均价格差异的原因。 答案: 2某企业甲、乙两个生产车间,甲车间平均每个工人日加工零件数为65件,标准差为11件;乙车间工人日加工零件数资料如下表。试计算乙车间工人加工零件的平均数和标准差,并比较甲、乙两个生产车间哪个车间的平均日加工零件数更有代表性? 日加工零件数(件)60以下60—70 70—80 80—90 90—100 工人数(人) 5 9 12 14 10 答案: 三、某地区2009—2014年GDP资料如下表,要求: 1、计算2009—2014年GDP的年平均增长量; 2、计算2009—2014年GDP的年平均发展水平; 3、计算2009—2014年GDP的年平均发展速度和平均增长速度。

答案: x-== 年平均增长速度:100%100%22.9% 试用最小平方法配合销售额的直线趋势方程,并预测2016年的销售额将达到什么水平? 答案:2010年—2014年的数据有5项,是奇数,所以取中间为0,以1递增。设定x为-2、-1、0、1、2、 年份/销售额(y)x xy x2 2010 320 -2 -640 4 2011 332 -1 -332 1 2012 340 0 0 0 2013 356 1 356 1 2014 380 2 760 4 合计1728 0 144 10 b=∑xy/∑x2=144/10=14.4 a=∑y/n=1728/5=345.6 y=345.6+14.4x 预测2016年,按照设定的方法,到2016年应该是5 y=345.6+14.4*5=417.6元 五、某企业生产三种产品,2013年三种产品的总生产成本分别为20万元,45万元,35万元,2014年同2013年相比,三种产品的总生产成本分别增长8%,10%,6%,产量分别增长12%,6%,4%。试计算: 1、三种产品的总生产成本增长的百分比及增加的绝对额; 2、三种产品的总产量增长的百分比,及由于产量增长而增加的总生产成本; 3、利用指数体系推算单位产品成本增长的百分比。 试计算: 1、三种商品的销售额总指数; 2、三种商品的价格总指数和销售量总指数;

统计学课后习题参考问题详解

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

统计学计算例题及答案

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学思考题

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

应用统计学试题及答案

北京工业大学经济与管理学院2007-2008年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设 备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为

A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间 D. 时间每减少一个单位,产品成本平均下降个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公

斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=件乙车间: x=90件, σ=件哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何

相关文档
相关文档 最新文档