文档库 最新最全的文档下载
当前位置:文档库 › 统计学第七章、第八章课后题包括答案.docx

统计学第七章、第八章课后题包括答案.docx

统计学第七章、第八章课后题包括答案.docx
统计学第七章、第八章课后题包括答案.docx

统计学复习笔记

第七章参数估计

一、思考题

1.解释估计量和估计值

在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。

根据一个具体的样本计算出来的估计量的数值称为估计值。

2.简述评价估计量好坏的标准

(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。

(2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏

估计量,有更小方差的估计量更有效。

(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总

体的参数。

3.怎样理解置信区间

在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,

这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。

4.解释95%的置信区间的含义是什么

置信区间 95%仅仅描述用来构造该区间上下界的统计量(是随机的 )覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有 95%(的区间)包含参数。

不要认为由某一样本数据得到总体参数的某一个 95%置信区间,就以为该区间以的概率覆盖总体参数。

5.简述样本量与置信水平、总体方差、估计误差的关系。

1.估计总体均值时样本量 n 为

( z22

2) 22 E z

n22其中:2

E 2n

2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为

与置信水平成正比,在其他条件不变的情况下,置信水平越大,所

需要的样本量越大;

与总体方差成正比,总体的差异越大,所要求的样本量也越大;

与与总体方差成正比,样本量与估计误差的平方成反比,即可以接

受的估计误差的平方越大,所需的样本量越小。

二、练习题

1.从一个标准差为 5 的总体中采用重复抽样方法抽出一个样本量为

40 的样本,样本均值为 25。

1) 样本均值的抽样标准差x 等于多少

x

2)在 95%的置信水平下,估计误差是多

少解: 1)已知σ= 5,n = 40,x = 25

∵xx

n n

∴x =5 /√ 40 ≈

x

2)已知

∵E z

2

2n

∴估计误差 E = ×5÷√ 40 ≈

2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期 3 周的时间里选取 49 名顾客组成了一个简单随机样本。

1)假定总体标准差为 15 元,求样本均值的抽样标准误差。

2)在 95%的置信水平下,求估计误差。

3)如果样本均值为 120 元,求总体均值μ的 95%的置信区间。解: 1)已知σ= 15,n = 49

x

x

n

x

n

x

n

∴x = 15÷√49 =

x

2)已知

∵ E z 2

2

n

∴估计误差 E = ×15÷√ 49 ≈

3)已知x = 120

∵置信区间为 x ±E

∴其置信区间 = 120±

3.从一个总体中随机抽取n =100 的随机样本,得到x=104560,

假定总体标准差σ= 85414,试构建总体均值μ的95%的置信区间。

x

解:已知 n =100, =104560,σ= 85414,1-=95% ,

由于是正态总体,且总体标准差已知。总体均值在1-置信水平下的置信区间为

x z 2105.36

10 1.96

2 n 104560 ±25×85414÷√ 100 105.36 3.92

= 104560 ±

101.44,109.28

4.从总体中抽取一个n =100 的简单随机样本,得到x=81,s=12。

要求:

1)构建μ的90%的置信区间。

2)构建μ的95%的置信区间。

3)构建μ的99%的置信区间。

解:由于是正态总体,但总体标准差未知。总体均值在 1-置信水平下

的置信区间公式为

81±×12÷√ 100 = 81±×1)1-=90%,

其置信区间为81 ±

2)1-=95% ,

其置信区间为81 ±

3)1-=99%,

其置信区间为 81 ±

5.利用下面的信息,构建总体均值的置信区间。

1)x = 25,σ= ,n =60,置信水平为 95%

2)x =119,s =,n =75,置信水平为98%

3)x =,s =,n =32,置信水平为 90%

解:∵x z

22

n 或x z22

s

n

(未知)

∴1) 1-=95% ,

其置信区间为: 25±×÷√ 60

= 25±

2)1-=98% ,则=, /2=, 1-/2=,查标准正态分布表 ,可知 :其置信区间为 : 119±×÷√ 75

= 119±

3)1-=90%,

其置信区间为 : ±×÷√ 32

= ±

6. 利用下面的信息,构建总体均值μ的置信区间:

1) 总体服从正态分布,且已知 σ= 500,n = 15, x =8900,置信水

平为 95%。

解: N=15,为小样本正态分布,但 σ已知。则 1-=95%, 。

其置信区间公式为

xz

22

105.36 10 1.96

n

25

∴置信区间为: 8900±× 500÷√ 15=( ,

) 105.36 3.92

101.44,109.28

2) 总体不服从正态分布,且已知 σ= 500,n = 35, x

=8900,置信

水平为 95%。

解:为大样本总体非正态分布, 但 σ已知。则 1-=95%,

其置信区间公式为

xz

22

105.36 10 1.96

n

25

∴置信区间为: 8900±× 500÷√ 35=(

105.36 3.92

101.44,109.28

3) 总体不服从正态分布, σ未知, n = 35,x =8900,s =500,置

信水平为 90%。

解:为大样本总体非正态分布,且

σ未知, 1-=90%,

其置信区间为:

8900±× 500÷√ 35=(8761 9039)

4) 总体不服从正态分布, σ未知, n = 35,x =8900,s =500,置信水平为 99%。

解:为大样本总体非正态分布,且 σ未知, 1-=99%, 。

其置信区间为:8900±× 500÷√ 35=()

7.某大学为了解学生每天上网的时间,在全校7500 名学生中采

取重复抽样方法随机抽取36 人,调查他们每天上网的时间,得到下

面的数据(单位:小时)(略)。求该校大学生平均上网时间的置信

区间,置信水平分别为 90%

解:先求样本均值:=

再求样本标准差:

置信区间公式:

8.从一个正态总体中随机抽取样本量为 8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值μ的95%置信区间。解:本题为一个小样本正态分布,σ未知。

先求样本均值:= 80÷8=10

再求样本标准差:=√84/7 =

于是 ,的置信水平为的置信区间是

,

已知,n = 8,则,α/2=,查自由度为 n-1 = 7的

分布表得临界值

所以,置信区间为:10±×÷√ 7

9.某居民小区为研究职工上班从家里到单位的距离,抽取了由16

个人组成的一个随机样本,他们到单位的距离分别是:10,3,14,8,6,9, 12,11,7, 5,10,15,9,16, 13, 2。假设总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。

解:小样本正态分布,σ未知。已知,n = 16,,则,α/2=,查自由度为 n-1 = 15的分布表得临界值

样本均值=150/16=

再求样本标准差:=√15≈

于是 ,的置信水平为的置信区间是

,

±×÷√ 16

10.从一批零件是随机抽取36 个,测得其平均长度是,标准差是。

1) 求确定该种零件平均长度的95%的置信区间。

2)在上面估计中,你使用了统计中的哪一个重要定理请解释。

解:1)这是一个大样本分布。已知N=36,x= , S =,1-α=,。

其置信区间为:±×÷√ 36

2)中心极限定理论证:如果总体变量存在有限的平均数和方差,

那么,不论这个总体的分布如何,随着样本容量的增加,样本均

值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分

布未必很多,但是多个随机变量和的分布趋于正态分布则是普遍存在

的。样本均值也是一种随机变量和的分布,因此在样本容量充分

大的条件下,样本均值也趋近于正态分布,这为抽样误差的概率估计

理论提供了理论基础。

11.某企业生产的袋装食品采用自动打包机包装,每袋标准重量为

100 克,现从某天生产的一批产品中按重复抽样随机抽取 50 包进行检查,测得每包重量如下:(略)

已知食品包重服从正态分布,要求:

1)确定该种食品平均重量的95%的置信区间。

2)如果规定食品重量低于100 克属于不合格,确定该批食品合格率的 95%的置信区间。

解: 1)本题为一个大样本正态分布,σ未知。已知N=50,μ =100,1-α=,。

①每组组中值分别为97、99、101、103、105,即此 50 包样

本平均值= (97+99+101+103+105)/5 = 101

② 样本标准差为:

=√{( 97-101) 2× 2+( 99-101)2 ×3+( 101-101 ) 2×34+( 103-101 )2× 7+( 105-101) 2× 4}÷( 50-1)≈

③其置信区间为:101±×÷√ 50

2)∵ 不合格包数(< 100 克)为 2+3=5 包,5/50 = 10%(不合格率),即 P = 90%。

∴该批食品合格率的95%置信区间为:

=±×√×÷ 50= ±×

12.假设总体服从正态分布,利用下面的数据构建总体均值μ的

99%的置信区间。(略)

解:样本均值

样本标准差:

尽管总体服从正态分布,但是样本 n=25 是小样本,且总体标准差未知,应该用 T 统计量估计。 1-α=,则α=, α/2=,查自由度为 n-1

= 24 的分布表得临界值

的置信水平为的置信区间是,

13.一家研究机构想估计在网络公司工作的员工每周加班的平均

时间,为此随机抽取了18 个员工,得到他们每周加班的时间数据如下(单位:小时):(略)

假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。

解:①N = 18 < 30,为小样本正态分布,σ未知。

② 样本均值= 244/18 =

样本标准差:

③ 1-α= 90%,α=,α/2=

=

,则查自由度为n-1 = 17

分布表

得临界值

④的置信水平为的置信区间是,

14.利用下面的样本数据构建总体比例丌的置信区间:1)n =44, p =,置信水平为99%

2)n =300,p =,置信水平为95%

3)n =1150,p = ,置信水平为90%

解: 1) 1-α= 99%,α= ,α/2= ,1-α/2= ,查标准正态分布表,则

2)1-=95%,

3)1-=90%,

分别代入

15.在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机,其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和 95%。

解: 1)置信水平 90%,1-=90%,,N = 200,P = 23%。

代入

2)置信水平 95%,1-=95%,,N = 200,P = 23%。代入

16.一位银行的管理人员想估计每位顾客在该银行的月平均存款

额。他假设所有顾客月存款额的标准差为1000 元,要求的估计误差在 200 元以内,置信水平为99%。应选取多大的样本

解:已知 1-α= 99%,则。E = 200,σ= 1000元。

则N = ( 2×σ2)÷ E2= (× 10002)÷ 2002≈ 167

(得数应该是,不管小数后是多少,都向上进位取整,因此至少是

167人)

17.要估计总体比例丌,计算下列条件下所需的样本量。

1)E=,丌 =,置信水平 96%

2)E=,丌未知,置信水平95%

3)E=,丌 =,置信水平 90%

解: 1)已知1-α= 96%,α/2 = ,则

N = {2×丌( 1-丌)}÷ E2=××÷≈2547

2)已知 1-α= 95%,α/2 = ,则

丌未知 ,则取使丌( 1-丌)最大时的。

N ={2×丌( 1-丌)}÷ E2=××÷≈601

3)置信水平 90%,1-=90%,,

N = {2×丌( 1-丌)}÷ E2=××÷≈270

18.某居民小区共有居民 500 户,小区管理者准备采用一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了 50 户,其中有32 户赞同, 18 户反对。

1)求总体中赞成该项改革的户数比例的置信区间(α=)

2)如果小区管理者预计赞成的比例能达到80%,估计误差不超过 10%,应抽取多少户进行调查(α=)

解: 1)

已知 N=50,P=32/50=,α=,α/2 = ,则

置信区间: P±√{P(1-P)/N}=±√× 50

=±× =±

2)已知丌 = , E = ,α=,α/2 = ,则

N= 2 丌(1-丌)/E2= ××÷≈ 62

19.根据下面的样本结果,计算总体标准差σ的90%的置信区间:1) =21,S=2,N=50

2) =,S=,N=15

3) =167,S=31,N=22

解: 1)大样本,σ未知,置信水平90%,1-=90%,

21±× 2÷√ 50

2)小样本,σ未知,置信水平90%,1-=90%,则查自由度为n-1 = 14 的分布表得临界值

,= ±×÷√ 15

3)大样本, σ未知,置信水平90%,1-=90%,

167±× 31÷√ 22

20.题目 (略)

1)构建第一种排队方式等待时间标准差的 95%的置信区间

2)构建第二种排队方式等待时间标准差的 95%的置信区间

3)根据 1)和 2)的结果,你认为哪种排队方式更好

解:本题为小样本正态分布,σ未知,应用公式

,

置信水平 95%,1-=95%,则查自由度为 n-1 = 9 的分布表得临界值

1)= ,

=√ 9≈

其置信区间为±×÷√ 10

2)=

=√0/9 = 0

其置信区间为± 0

4)第二种排队方式更好 .

(19 题是对总体方差的估计,应该用卡方统计量进行估计, 20 题是对两个总体参数的估计,这二种类型老师未讲,不是本次考试的内容,不能用 Z 统计量像估计总体均值和比例那样去估计,具体内容见书上 P188―― P194)

第八章假设检验

一、思考题

1.假设检验和参数估计有什么相同点和不同点

解:参数估计与假设检验是统计推断的两个组成部分。

相同点:它们都是利用样本对总体进行某种推断。

不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法,总体参数μ在估计前是未知的。而在假设检验中,则是先对μ的值提出一个假设,然后利用样本信息去检验这个假设是否成立。

2.什么是假设检验中的显着性水平统计显着是什么意思

解:显着性水平用α表示,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,即假设检验中犯弃真错误的概率。它是由人们根据检验的要求确定的。

(我理解的统计学意义,统计显着是统计上专用的判定标准,指在一定的概率原则下,可以承认一种趋势或者合理性达到的程度,达到为统计上水平显着,达不到为统计上水平不显着)

3.什么是假设检验中的两类错误

解:弃真错误(α错误):当原假设为真时拒绝原假设,所犯的错误

成为第 I 类错误,又称为弃真错误。犯第 I 类错误的概率常记作α。

取伪错误(β错误):当原假设为假时没有拒绝原假设,所犯的错误称为第 II 类错误,又称取伪错误。犯第 II 类错误概率常记作β。

发生第 I 类错误的概率也常被用于检验结论的可靠性度量。假设

检验中犯第 I 类错误的概率被称为显着性水平,记作α。

4.两类错误之间存在什么样的数量关系

在样本容量 n 一定的情况下,假设检验不能同时做到犯α和β两类错误的概率都很小。若减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。要使α和β同时变小只有增大样本容量。但样本容量增加要受人力、经费、时间等很多因素的限制,无限制增加样本容量就会使抽样调查失去意义。因此假设检

验需要慎重考虑对两类错误进行控制的问题。

5.解释假设检验中的P 值。

解:如果原假设为真,所得到的样本结果会像实际观测结果那么极端

或更极端的概率,称为 P 值。也称为观察到的显着性水平。

P 值是反映实际观测到的数据与原假设 H0之间不一致程度的一个

概率值。 P 值越小,说明实际观测到的数据与 H0之间不一致程度就越大。

6.显着性水平与P 值有何区别

解:α(显着性水平)是一个判断的标准(当原假设为真,却被拒绝

的概率),而P 是实际统计量对应分位点的概率值(当原假设为真时,所得到的样本观察结果或更极端结果出现的概率)。

可以通过α计算置信区间,然后与统计量进行比较判断,也可以通过统计量计算对应的 p 值,然后与α值比较判断。

7.假设检验依据的基本原理是什么

解:假设检验利用的是小概率原理,小概率原理是指发生概率很小

的随机事件在一次试验中是几乎不可能发生的。根据这一原理,可以先假设总体参数的某项取值为真,也就是假设其发生的可能性很大,然后抽取一个样本进行观察,如果样本信息显示出现了与事先假设相反的结果且与原假设差别很大,则说明原来假定的小概率事件在一次实验中发生了,这是一个违背小概率原理的不合理现象,因此有理由怀疑和拒绝原假设;否则不能拒绝原假设。

8.你认为在单侧检验中原假设和备择假设的方向应该如何确定解:

假设问题有两种情况,一种是所考察的数值越大越好(左单侧检验或

下限检验),临界值和拒绝域均在左侧;另一种是数值越小越好(右

单侧检验或上限检验),临界值和拒绝域均在右侧。

二、练习题

1.已知某炼铁厂的含碳量服从正态分布N(,),现在测定了 9 炉铁

水,其平均含碳量为。如果估计方差没有变化,可否认为现在生产的铁水平均含碳量为(α=)

解:已知μ 0=,σ2=,N=9,=,

这里采用双侧检验,小样本,σ已知,使用 Z 统计。假

定现在生产的铁水平均含碳量与以前无显着差异。则,

H0:μ = ; H1:μ≠

α=,α/2 = ,查表得临界值为

计算检验统计量:

xμ0=

=

Z

n

/

决策:∵ Z 值落入接受域,∴在 =的显着性水平上接受H0。

结论:有证据表明现在生产的铁水平均含碳量与以前没有显着

差异,可以认为现在生产的铁水平均含碳量为。

2.一种元件,要求其使用寿命不得低于700 小时。现从一批这种元件中随机抽取 36 件,测得其平均寿命为680 小时。已知该元件寿命服从正态分布,σ=60 小时,试在显着性水平下确定这批元件是否合格。

解:已知 N=36,σ=60,=680,μ0=700

这里是大样本,σ已知,左侧检验,采用Z 统计量计算。

提出假设:假定使用寿命平均不低于700 小时

H0:μ≥ 700

H1: μ < 700

= ,左检验临界值为负,查得临界值: =

计算检验统计量:

xμ0= (680-700)/(60/√36)

Z

/= -2

n

决策:∵ Z 值落入拒绝域,∴在 =的显着性水平上拒绝H0,接受H1

结论:有证据表明这批灯泡的使用寿命低于700 小时,为不合

格产品。

3.某地区小麦的一般生产水平为亩产250 公斤,其标准差是30 公斤。现用一种化肥进行试验,从25 个小区抽样,平均产量为270 公斤。这种化肥是否使小麦明显增产(α=)

解:已知μ 0 =250,σ= 30,N=25,=270

这里是小样本分布,σ已知,用 Z 统计量。右侧检验,α=,则 Zα=

提出假设:假定这种化肥没使小麦明显增产。

即H0:μ≤ 250

H1: μ> 250

计算统计量:

Z = (-μ0)/ (σ/√N)= (270-250)/ (30/ √25)=结论: Z 统计量落入拒绝域,在α=的显着性水平上,拒绝H0,

接受 H1。

决策:有证据表明,这种化肥可以使小麦明显增产。

4.糖厂用自动打包机打包,每包标准重量是 100 千克。每天开工后需

要检验一次打包机工作是否正常。某日开工后测得 9 包重量(单位:千克)如下:(略)

已知包重服从正态分布,试检验该日打包机工作是否正常。(α=)解:已知 N=9,这里是小样本正态分布,σ未知,双侧检验,采用 t 统

计量,自由度为 N-1=8。α=,则 Tα/2=

=

提出假设,假设打包机工作正常:

即H0:μ = 100

H1: μ ≠ 100

计算统计量:

xμ0

t

s n= () / (√9)≈

结论:∵ t 值落入接受域,∴在 =的显着性水平上接受 H0

决策:有证据表明这天的打包机工作正常。

5.某种大量生产的袋装食品,按规定不得少于 250 克。今从一批该

食品中任意抽取 50 袋,发现有 6 袋低于 250 克。若规定不符合标准

的比例超过 5%就不得出厂,问该批食品能否出厂(=)

解:已知 N=50,P=6/50=,为大样本,右侧检验,用 Z 统计量计算。 =,即Z=

H0:丌≤ 5%

H1:丌> 5%

p P

z0~ N(0,1)

P0(1P0 )

n= -/ √×÷ 50)≈

(因为没有找到丌表示的公式,这里用P0表示丌0)

结论:因为 Z 值落入拒绝域,所以在 =的显着性水平上,拒绝 H0,

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

2021年自考《社会统计学》习题及答案(卷二)

2021年自考《社会统计学》习题及答案(卷二) 一、填空 1.( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为( );凡某时期内变动累计的资料称为( )。 3.( )调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.( )误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。( )误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5. 统计误差有( )和( )两类,其中( )在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于( )。 7.统计调查从调查范围上分,可分为( )和( )。 8.统计调查按调查登记时间是否连续,可分为( )和( )。 9.统计调查从调查目的上,可分为( )和专项调查。 10.( )误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫( )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 2.搞好重点调查的关键是( ) 。 A 力求统一要求和统一行动 B 选择好重点单位 C 选择最有代表性的单位 D 遵循随机原则。 3.下列资料,属于静态资料的是( ) 。 A 某厂89年职工工资总额为76万元; B 某乡89年粮食总产量为1亿3千万公斤; C 某市89年末人口为36.3万人; D 某市89年征用土地125亩。 4.关于统计调查的组织形式,下面正确的描述有( )。 A 普查是一种专门组织的一次性调查; B 满足一定条件,重点调查的结果可以用来推断总体; C 抽样调查是一种全面调查; D 典型调查是在研究现象的总体中,选择其中的重点单位进行调查。 5.应用( )方式抽取样本时,必须避免抽样间隔和现象本身的节奏性或循环周期相重合。 A 随机抽样 B 系统抽样 C 整群抽样 D 分层抽样 6.下面能进行除法运算的测量尺度是( )。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

2014统计学课后复习题答案

《应用统计学》习题解答 第一章绪论 【1.1】指出下列变量的类型: (1)汽车销售量; (2)产品等级; (3)到某地出差乘坐的交通工具(汽车、轮船、飞机); (4)年龄; (5)性别; (6)对某种社会现象的看法(赞成、中立、反对)。 【解】(1)数值型变量 (2)顺序变量 (3)分类变量 (4)数值型变量 (5)分类变量 (6)顺序变量 【1.2】某机构从某大学抽取200个大学生推断该校大学生的月平均消费水平。 要求: (1)描述总体和样本。 (2)指出参数和统计量。 (3)这里涉及到的统计指标是什么? 【解】(1)总体:某大学所有的大学生 样本:从某大学抽取的200名大学生 (2)参数:某大学大学生的月平均消费水平 统计量:从某大学抽取的200名大学生的月平均消费水平 (3)200名大学生的总消费,平均消费水平 【1.3】下面是社会经济生活中常用的统计指标: ①轿车生产总量,②旅游收入,③经济发展速度,④人口出生率,⑤安置再就业人数,⑥全国第三产业发展速度,⑦城镇居民人均可支配收入,⑧恩格尔系数。 在这些指标中,哪些是数量指标,哪些是质量指标?如何区分质量指标与数量指标?【解】数量指标有:①、②、⑤ 质量指标有:③、④、⑥、⑦、⑧ 数量指标是说明事物的总规模、总水平或工作总量的指标,表现为绝对数的形式,并附有计量单位。而质量指标是说明总体相对规模、相对水平、工作质量和一般水平的统计指标,通常是两个有联系的统计指标对比的结果。 【1.4】某调查机构从某小区随机地抽取了50为居民作为样本进行调查,其中60%的居民对自己的居住环境表示满意,70%的居民回答他们的月收入在6000元以下,生活压力大。 回答以下问题: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)对居住环境的满意程度是什么变量? 【解】(1)这一研究的总体是某小区的所有居民。

统计学第六版部分课后题答案

第四章 数据分布特征的测度 4.6 解:先计算出各组组中值如下: 4.8 解: ⑴ ⑵体重的平均数 体重的标准差 ⑶ 55—65kg 相当于μ-1σ到μ+1σ 根据经验法则:大约有68%的人体重在此范围内。 ⑷ 40—60kg 相当于μ-2σ到μ+2σ 2501935030450425501865011426.7120116.5 i M f x f s ?+?+?+?+?=====∑∑ 大。所以,女生的体重差异===离散系数===离散系数女 男10 .010 1 505v 08.012 1 605v =μσ=μσσσ) (1102.250)(1322.260磅=磅=女男=?μ=?μ) (112.25磅==?σ

根据经验法则:大约有95%的人体重在此范围内。 4.9 解: 在A 项测试中得115分,其标准分数为: 在B 项测试中得425分,其标准分数为: 所以,在A 项中的成绩理想。 4.11 解: 成年组的标准差为: 幼儿组的标准差为: 所以,幼儿组身高差异大。 115 100 115X Z =-=σμ-=5.050 400425X Z =-=σμ-= 172.1 4.24.2 2.4%172.1s x x n s s V x = == ====∑ 71.3 2.52.5 3.5% 71.3s x x n s s V x = =====∑

第七章 参数估计 7.7 根据题意:N=7500,n=36(大样本) 总体标准差σ未知,可以用样本标准差s 代替 32 .336 4.119n x x ===∑样本均值 2 1.61 s z α= =样本标准差: 边际误差为:22222 90 1.645 1.6451.61 1.6450.446 3.320.44 (2.883.76)95 1.9699 2.58(2.803.84)(2.634.01) z z x z z z ααααα==?=±=±置信水平%时,=平均上网时间的置信区间为: ,同理,置信水平%时,=;置信水平%时,=平均上网时间的置信区间分别为:,;,

统计学课后习题答案(Chap1.2)

第1章绪论 1.什么是统计学怎样理解统计学与统计数据的关系 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表;

《社会统计学》作业(共享含部份答案)

社会统计学作业 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19

B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( B ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( D ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( D ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

统计学第四版(贾俊平)课后思考题答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

统计学课后题答案

第二章 3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。 (2)制作茎叶图,并与直方图进行比较。 解:(1)频数分布表

或: (2)茎叶图

第三章 1. 已知下表资料: 试根据频数和频率资料,分别计算工人平均日产量。解:计算表

根据频数计算工人平均日产量:6870 34.35200 xf x f = = =∑∑(件) 根据频率计算工人平均日产量:34.35f x x f = = ∑∑ g (件) 结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。 2.某企业集团将其所属的生产同种产品的9个下属单位按其生产该产品平均单位成本的分组资料如下表: 试计算这9个企业的平均单位成本。 解:

这9个企业的平均单位成本=f x x f = ∑∑ =13.74(元) 3.某专业统计学考试成绩资料如下: 试计算众数、中位数。 解:众数的计算: 根据资料知众数在80~90这一组,故L=80,d=90-80=10,fm=20,fm-1=14,fm+1=9, ()() 1 11m m o m m m m f f M L d f f f f --+-=+ ?-+-

统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第四章 统计描述 【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。 【解】产量的计划完成程度=%5.112100%40 45 100%=?=?计划产量实际产量 即产量超额完成%。 成本的计划完成程=84%.96100%5%-18% -1100%-1-1≈?=?计划降低百分比实际降低百分比 即成本超额完成%。 劳动生产率计划完= 85%.101100%8%110% 1100%11≈?++=?++计划提高百分比实际提高百分比 即劳动生产率超额完成%。 【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%, 试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。 【解】本题采用累计法: (1)该煤矿原煤开采量五年计划完成=100% ?数 计划期间计划规定累计数 计划期间实际完成累计 = 75%.1261021025357 4 =?? 即:该煤矿原煤开采量的五年计划超额完成%。 (2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。 【】我国1991年和1994年工业总产值资料如下表:

要求: (1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几? 1991年轻工业与重工业之间的比例=96.01.144479 .13800≈; 1994年轻工业与重工业之间的比例=73.04.296826 .21670≈ (3) %37.25 1%) 451(2824851353 ≈-+ 即,94年实际比计划增长%。 【】某乡三个村2000年小麦播种面积与亩产量资料如下表: 要求:(1)填上表中所缺数字; (2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量。

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

统计学(第五版)贾俊平-课后思考题和练习题答案(完整版)

统计学(第五版)贾俊平课后思考题和练习题答案(最终完整版) 第一部分思考题 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学课后习题答案(全)

<<统计学 >> 课后习题参考答案 第四章 1. 计划完成相对指标二一8% 100% =10 2.9% 1+5% 2. 计划完成相对指标二 1 一6 % 100% =97.9% 1—4% 3. 4. 5.解:⑴计划完成相对指标= 14 防 13 100 %" 5. 56 % (2)从第四年二季度开始连续四季的产量之和为: 10+11 + 12+14=47 该产品到第五年第一季 已提前完成任务,提前 完成的天数 90 ?该产品总共提前10个月零15天完成任务。 6.解:计划完成相对指标 10 11 12 14-45 V 天 14 一10

156 230 540 279 325 470 535 200 1040.1% 100% =126.75% (2) 156+230+540+279+325+470=2000 (万吨) 所以正好提前半年完成计划 7. 第五章平均指标与标志变异指标 1 . X 甲= :.26 27 28 29 30 31 3 2 3334=30 9 —20 25 28 30 32 34 36 38 40 '1.44 X乙二9 AD甲二 26-30卩27 -30 28-30 29 -30 30-30 |31 -30 32 - 30 亠|33 - 30 叫34 - 30 9 -2.22 AD乙二 20—31.44” 25—31.44 十2〔8—31.44 屮30—31.44 +|32|— 31.44 + 34卜31.44 + 網 + 31.44 + 38— |31.44 + 4Q — 9 = 5.06 R 甲=34-26=8 R 乙=40-20=20

社会统计学期末复习题与答案整理

社会统计学期末复习训练 一、单项选择题(20=2×10) 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样 本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是.样本 2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查, 以推断所有家庭的年均收入水平。这项研究的总体是 332.1户家庭的年均收入 3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查, 以推断所有学生的每月生活费用水平。这项研究的总体是 22000名学生的每月生活费用 4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级 6.下列变量属于数值型变量的是工资收入 7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的 机会入选样本,这样的抽样方式称为.简单随机抽样 8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从 女生中抽取8名学生进行调查。这种调查方法属于分层抽样 9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽 样的方式抽取子样本,这样的抽样方式称为分层抽样 10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前 十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于系统抽样 11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率 12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率 13.在频数分布表中,频率是指各组频数与总频数之比 14.在频数分布表中,比率是指不同小组的频数之比 15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图 17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图 18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 89 20.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分 别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.2 22.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那 么该班考试成绩的中位数是88 23.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值 近似为5.5小时

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源,欢迎共阅 社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标;某产品的废品率为结构相对指标;某地区福利机构网点密度为强度相 对指标。2最小 值。345、正J 6于 重点7;总 8计划超额完成程度为;若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程 度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。

海量资源,欢迎共阅 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位 13 1 100%, ) 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√) 5、统计调查按调查范围划分可以分为全面调查和非全面调查。(√) 6、用移动平均法修匀时间数列时,如果移动项数为偶数项,只要进行一次移动平均;如果移动项数为奇数项,则要进行二次移动平均。(×;答案提示:用移动平均法修匀时间数列 时,如果移动项数为奇数项,只要进行一次移动平均;如果移动项数为偶数项,则要进行二

相关文档
相关文档 最新文档