文档库 最新最全的文档下载
当前位置:文档库 › 大学统计学第七章练习题及答案

大学统计学第七章练习题及答案

大学统计学第七章练习题及答案
大学统计学第七章练习题及答案

第7章 参数估计

练习题

7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少?

解:⑴已知25,40,5===x n σ

样本均值的抽样标准差79.04

10

40

5≈=

=

=

n

x σ

σ ⑵已知5=σ,40=n ,25=x ,4

10

=

x σ,%951=-α 96.1025.02

==∴Z Z α

边际误差55.14

10

*

96.12

≈==n

Z E σ

α

7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客

组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差;

(3) 如果样本均值为120元,求总体均值μ的95%的置信区间。

解.已知.根据查表得2/αz =1.96 (1)标准误差:14.249

15==

=n

X σ

σ

(2).已知2/αz =1.96

所以边际误差=2/αz *

=n

s 1.96*49

15=4.2

(3)置信区间:)(2.124,8.11596.149

151202

=*±

=±n

s Z x α

7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差

85414=σ,构建总体均值μ的95%的置信区间。

96.12

=?Z

144.16741100

85414*

96.12

==?

?n

Z σ

856.87818144.16741104560.

2

=-=-?n

Z x σ

144.121301144.16741104560.

2

=+=+?n

Z x σ

置信区间:(87818.856,121301.144)

7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。

(1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s .

(1)置信水平为%901=-α,则645.12

=αZ .

由公式n

s z x ?

±2

α974.181100

12645.181±=?

±=

即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12

=αz

由公式得n

s z x ?

±2

α=81352.281100

12

96.1±=?

± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352

(3)置信水平为%991=-α,则576.22

=αZ .

由公式±x n

s z ?

2

α=096.381100

12576.281±=?

±=

即81 3.1±

则的的%99μ置信区间为

7.5 利用下面的信息,构建总体均值的置信区间。

(1)25=x ,5.3=σ,60=n ,置信水平为95%。

(2)6.119=x ,89.23=s ,75=n ,置信水平为98%。 (3)419.3=x ,974.0=s ,32=n ,置信水平为90%。 ⑴,60,5.3,25===n X σ置信水平为95% 解:,96.12

=αZ

89.060

5.39

6.12

=?

=n

Z σ

α

置信下限:-X 11.2489.0252

=-=n

Z σ

α

置信上限:+X 89.2589.0252

=+=n

Z σ

α

),置信区间为(89.2511.24∴

⑵。,置信水平为,%9875n 89.23s ,6.119===X 解:33.22

=αZ

43.67589.2333.22

=?

=n

s Z α

置信下限:-X 17.11343.66.1192

=-=n s Z α

置信上限:+X 03.12643.66.1192

=+=n

s Z α

),置信区间为(03.12617.113∴

⑶x

=3.419,s=0.974,n=32,置信水平为90%

根据t=0.1,查t 分布表可得645.1)31(05.0=Z .283.0)(2/=?n

s Z

所以该总体的置信区间为

x ±2/?Z (

)n

s =3.419±0.283

即3.419±0.283=(3.136 ,3.702) 所以该总体的置信区间为3.136~3.702.

7.6 利用下面的信息,构建总体均值μ的置信区间。

(1) 总体服从正态分布,且已知500=σ,15=n ,8900=x ,置信水平为95%。 (2) 总体不服从正态分布,且已知500=σ,35=n ,8900=x ,置信水平为95%。 (3) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为

90%。

(4) 总体不服从正态分布,σ未知,35=n ,8900=x ,500=s ,置信水平为

99%。

(1)解:已知500=σ,15=n ,8900=x ,1-95=α%,96.12

=αz

)9153,8647(15

50096.189002

=?

±=±n

z x σ

α

所以总体均值μ的置信区间为(8647,9153)

(2)解:已知500=σ,35=n ,8900=x ,1-95=α%,96.12

=αz

)9066,8734(35

50096.189002

=?

±=±n

z x σ

α

所以总体均值μ的置信区间为(8734,9066)

(3)解:已知35=n ,8900=x ,s=500,由于总体方差未知,但为大样本,

可用样本方差来代替总体方差

∵置信水平1—α=90% ∴645.12

=αz

∴置信区间为)9039,8761(35

500645.1812

=?

±=±n

s z x α

所以总体均值μ的置信区间为(8761,9039)

(4)解:已知35=n ,8900=x ,500=s ,由于总体方差未知,但为大样

本,可用样本方差来代替总体方差

置信水平1—α=99% ∴58.22

=αz

∴置信区间为)9118,8682(35

50058.289002

=?

±=±n

s z x α

所以总体均值μ的置信区间为(8682,9118)

7.7 某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽

取36人,调查他们每天上网的时间,得到的数据见Book7.7(单位:h )。求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%。 解:已知:3167.3=x 6093.1=s n=36 1.当置信水平为90%时,645.12

=?z ,

4532.03167.336

6093.1645

.13167.32

±=±=±?

n

s z x

所以置信区间为(2.88,3.76)

2.当置信水平为95%时,96.12

=?z ,

所以置信区间为(2.80,3.84)

3.当置信水平为99%时,58.22

=?z ,

7305.03167.336

6093.158

.23167.32

±=±=±?

n

s z x

所以置信区间为(2.63,4.01)

7.8 从一个正态总体中随机抽取样本量为8的样本,各样本值见Book7.8。求总体均值95%

的置信区间。

已知:总体服从正态分布,但σ未知,n=8为小样本,05.0=α,365.2)18(2

05.0=-t

根据样本数据计算得:46.3,10==s x

5445

.03167.336

6093.196

.13167.32

±=±=±?

n

s z x

总体均值μ的95%的置信区间为: 89.2108

46.3365.2102

±=?

±=±n

s t x α

,即(7.11,

12.89)。

7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样

本,他们到单位的距离(单位:km )数据见Book7.9。求职工上班从家里到单位平均距离95%的置信区间。

已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,131.2)116(2/05.0=-t 根据样本数据计算可得:375.9=x ,s=4.113 从家里到单位平均距离得95%的置信区间为:

191.2375.914

113.4131.2375.92

/±=?

±=±n

s t x α,

即(7.18,11.57)。

7.10 从一批零件中随机抽取36个,测得其平均长度为149.5cm ,标准差为1.93cm 。

(1) 试确定该种零件平均长度95%的置信区间。

(2) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。 解:已知,103=σn=36, x =149.5,置信水平为1-α=95%,查标准正态分布表得

2/αZ =1.96.

根据公式得: x ±2

/αZ n σ=149.5±1.9636

103

? 即149.5±1.9636

103?

=(148.9,150.1)

答:该零件平均长度95%的置信区间为148.9~150.1

(3) 在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

答:中心极限定理论证。如果总体变量存在有限的平均数和方差,那么,不论这

个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随即变量和的分布趋于正态分布则是普遍存在的。样本均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样本均值也趋近正态分布,这位抽样误差的概率估计理论提供了理论基础。

7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100g 。现从某天生产的

一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g )见Book7.11。 已知食品重量服从正态分布,要求:

(1) 确定该种食品平均重量的95%的置信区间。

(2) 如果规定食品重量低于100g 属于不合格,确定该批食品合格率的95%的置信区

间。 (1)已知:总体服从正态分布,但σ未知。n=50为大样本。α=0.05,2/05.0Z =1.96 根据样本计算可知 X =101.32 s=1.63 该种食品平均重量的95%的置信区间为

45.032.10150/63.1*96.132.101/2/±=±=Z ±X n s α

即(100.87,101.77)

(2)由样本数据可知,样本合格率:9.050/45==p 。该批食品合格率的95%的置信区间为: 2

/αZ ±p n p p )1(-=0.950

)

9.01(9.096.1-±=0.9±0.08,即(0.82,0.98) 答:该批食品合格率的95%的置信区间为:(0.82,0.98)

7.12 假设总体服从正态分布,利用Book7.12的数据构建总体均值μ的99%的置信区间。

根据样本数据计算的样本均值和标准差如下;

x =16.13 σ=0.8706 E= Z 2

α

n

σ=2.58*58706

.0=0.45

置信区间为x ±E 所以置信区间为(15.68,16.58)

7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18

名员工,得到他们每周加班的时间数据见Book7.13(单位:h )。假定员工每周加班的时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。

解:已知x =13.56 =σ7.80 1.0=α n=18

E=2

αZ *n σ

置信区间=[x -2

αZ n σ

, x +2

αZ n σ

]

所以置信区间=[13.56-1.645*(7.80/18), 13.56+1.645*(7.80/18)] =[10.36, 16.76] 7.14 利用下面的样本数据构建总体比例π的置信区间。

(1)44=n ,51.0=p ,置信水平为99%。 (2)300=n ,82.0=p ,置信水平为95%。 (3)1150=n ,48.0=p ,置信水平为90%。 (1)44=n ,51.0=p ,置信水平为99%。 解:由题意,已知n=44, 置信水平a=99%, Z 2/a =2.58 又检验统计量为: P ±Z

n

p p )

1(-,故代入数值计算得, P ±Z n

p p )

1(-=(0.316,0.704), 总体比例π的置信区间为(0.316,0.704)

(2)300=n ,82.0=p ,置信水平为95%。 解:由题意,已知n=300, 置信水平a=95%, Z 2/a =1.96 又检验统计量为: P ±Z

n

p p )

1(-,故代入数值计算得, P ±Z n

p p )

1(-=(0.777,0.863), 总体比例π的置信区间为(0.777,0.863)

(3)1150=n ,48.0=p ,置信水平为90%。 解:由题意,已知n=1150, 置信水平a=90%, Z 2/a =1.645 又检验统计量为: P ±Z

n

p p )

1(-,故代入数值计算得,

P ±Z

n

p p )

1(-=(0.456,0.504), 总体比例π的置信区间为(0.456,0.504) 7.15 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电

视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%。

解:由题意可知n=200,p=0.23

(1)当置信水平为1-α=90%时,Z 2/α=1.645

所以=-±n p p z p )1(2

/α200

)

23.01(23.0645.123.0-?±=0.23±0.04895 即0.23±0.04895=(0.1811,0.2789), (2)当置信水平为1-α=95%时,Z 2/α=1.96 所以=-±n p p z p )1(2

/α200

)

23.01(23.096.123.0-?±=0.23±0.05832 即0.23±0.05832=(0.1717,0.28835);

答:在居民户中拥有该品牌电视机的家庭在置信水平为90%的置信区间为(18.11%,27.89%),在置信水平为95%的置信区间为(17.17%,28.835%)

7.16 一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存

款额的标准差为1000元,要求估计误差在200元以内,应选取多大的样本? 解:已知

1000=σ,E=1000,%991=-α,58.22/=αz

由公式2

2

2/2*E

z n σα=可知n=(2.58*2.58*1000*1000)/(200*200)=167 答:置信水平为99%,应取167个样本。 7.17 要估计总体比例π,计算下列个体所需的样本容量。

(1)02.0=E ,40.0=π,置信水平为96%。 (2)04.0=E ,π未知,置信水平为95%。 (3)05.0=E ,55.0=π,置信水平为90%。

(1)解:已知02.0=E , ,40.0=π, 2/αZ =2.05 由

22

2//)1(E -Z =ππαn 得

2

2

02.0)4.01(40.005.2÷-?=n =2522 答:个体所需的样本容量为2522。

(2)解:已知04.0=E , 2/αZ =1.96 由

22

2//)1(E -Z =ππαn 得

=÷?=22204.05.096.1n 601

答:个体所需的样本容量为601。

(3)解:已知05.0=E ,

55.0=π, 2/αZ =1.645

22

2//)1(E -Z =ππαn 得

2205.045.055.0645.1÷??=n =268

答:个体所需的样本容量为268。

7.18 某居民小区共有居民500户,小区管理者准备采取一向新的供水设施,想了解居民是

否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。 (1) 求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。 (2) 如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查? (1)已知:n=50 96.12

=αZ

根据抽样结果计算的样本比例为P=32/50=60% 根据(7.8)式得: 50

%)

641%(64)1(96

.1%64--±=±

n

P P P

即 %)63.76%,37.51(%63.12%64=± 答:置信区间为(51.37%,76.63%)

(2)已知%80=π %10=E 96.12

=αZ

则有:621

.0)

8.01(8.0*96.1)1(*2

2222≈-=E -=ππαZ n 答:应抽取62户进行调查

7.19 根据下面的样本结果,计算总体标准差σ的90%的置信区间。

(1)21=x ,2=s ,50=n 。 (2)3.1=x ,02.0=s ,15=n 。 (3)167=x ,31=s ,22=n 。 解:已知%901=-α,95.02

1,05.02

%,10=-

==α

α

α

1) 查表知67)1(2

2=-n αχ,34)1(2

2

1=--

n α

χ

由公式

22

12

2

2

2

2

)1()1(α

α

χ

σχ-

-≤

≤-s n s n

得34

2*)150(672*)150(2

2-≤

≤-σ,解得(1.72,2.40) 2) 查表知6848.23)1(2

2=-n αχ,57063.6)1(22

1=--

n α

χ

由公式

22

12

2

2

2

2

)1()1(α

α

χσχ--≤

≤-s n s n

得57063

.602.0*)115(6848.2302.0*)115(2

2-≤

≤-σ,解得(0.015,0.029) 3) 查表知6705.32)1(2

2=-n αχ,5913.11)1(22

1=--

n α

χ

由公式

22

12

2

2

2

2

)1()1(α

α

χ

σχ-

-≤

≤-s n s n

得5913

.1131*)122(6705.3231*)122(2

2-≤

≤-σ,解得(24.85,41.73)

7.20 顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关,

比如,银行的业务员办理业务的速度,顾客等待排队的方式等等。为此,某银行准备采取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取了10名顾客,他们在办理业务时所等待的时间(单位:min )见Book7.20。

(1) 构建第一种排队方式等待时间标准差的95%的置信区间。 (2) 构建第二种排队方式等待时间标准差的95%的置信区间。 (3) 根据(1)和(2)的结果,你认为哪种排队方式更好? 7.21 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本

来自总体2的样本

141=n 72=n

2.531=x 4.432=x

8.9621=s

0.1022

2=s

(1) 求21μμ-的90%的置信区间。 (2) 求21μμ-的95%的置信区间。 (3) 求21μμ-的99%的置信区间。

7.22 从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表:

来自总体1的样本

来自总体2的样本

251=x 232=x

1621=s

202

2=s

(1) 设10021==n n ,求21μμ-95%的置信区间。

(2) 设1021==n n ,2

22

1σσ=,求21μμ-的95%的置信区间。 (3) 设1021==n n ,2

22

1σσ≠,求21μμ-的95%的置信区间。 (4) 设20,1021==n n ,2

22

1σσ=,求21μμ-的95%的置信区间。 (5) 设20,1021==n n ,2

22

1σσ≠,求21μμ-的95%的置信区间。

7.23 Book7.23是由4对观察值组成的随机样本。

(1) 计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s 。

(2) 设1μ和2μ分别为总体A 和总体B 的均值,构造21μμμ-=d 的95%的置信区

间。

7.24 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得

到的自信心测试分数见Book7.24。构建两种方法平均自信心得分之差21μμμ-=d 的95%的置信区间。

7.25 从两个总体中各抽取一个25021==n n 的独立随机样本,来自总体1的样本比例为

%401=p ,来自总体2的样本比例为%302=p 。

(1) 构造21ππ-的90%的置信区间。 (2) 构造21ππ-的95%的置信区间。

7.26 生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以

减小方差。两部机器生产的袋茶重量(单位:g )的数据见Book7.26。构造两个总体

方差比2

22

1σσ的95%的置信区间。

7.27 根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求

边际误差不超过4%,应抽取多大的样本?

解:已知P=2% E=4% 当置信区间1-α为95%时

2

αZ =

n

p p )1(-?P n=

2

22

)

1(p

p p ?

-?Z α

1-α=0.95 2

αZ =025.0Z =1.96

N=

222

)

1(p

p p ?-?Z α=2

204.098

.002.096.1??=47.06

答:所以应取样本数48。

7.28 某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为

120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超

过20元,应抽取多少个顾客作为样本?

解:已知120=σ,20=E ,当05.0=a 时,96.12/05.0=z 。

应抽取的样本量为:13920

120*96.1)(2

2

22222/≈==E z n σα

7.29 假定两个总体的标准差分别为121=σ,152=σ,若要求误差范围不超过5,相应的

置信水平为95%,假定21n n =,估计两个总体均值之差21μμ-时所需的样本量为多大。

7.30 假定21n n =,边际误差05.0=E ,相应的置信水平为95%,估计两个总体比例之差

为21ππ-时所需的样本量为多大。

厦门大学网络教育 2013-2014学年第一学期 《统计学原理》复习题 、单选题 1、统计调查方法体系中,作为“主体”的是( A ) A .经常性抽样调查 B.必要的统计报表 2、考虑全国的工业企业的情况时,以下标志中属于不变标志的有( A .产业分类 B.职工人数 C.劳动生产率 3、某地区抽取3个大型钢铁企业对钢铁行业的经营状况进行调查,这种调查是 4、下列这组数列15,17,17,18,22,24,50,62的中位数是(C )。 现象之间的相关程度越低,贝刑关系数越( 接近+1 B 接近-1 接近0 8、假定其他变量不改变,研究一个变量和另一个变量间的相关关系的是( 9、已知两个同类型企业职工平均工资的标准差分别为 8元,12元,则两个企业职 工平均工资的代表性是(A ) 10、( C 。是标志的承担者。 C.重点调查及估计推算 D.周期性普查 D.所有制 A .普查 B .典型调查 C.重点调查 D .抽样调查 A.17 B.18 C.20 5、标志变异指标中最容易受极端值影响的是( A.极差 B.平均差 &简单分组与复合分组的区别在于( 总体的复杂程度不同 选择分组标志的性质不同 A. C. D.22 C. B. D. 标准差 D.标准差系数 ) 组数多少不同 选择的分组标志的数量不同 7、 A.偏相关 B.正相关 C.完全相关 D.复相关 A.甲大于乙 B.乙大于甲 C. 一样的 D.无法判断

11、 下列各项中属于数量标志的是(A ) A.年龄 B.学历 C.民族 D.性别 12、 某商品价格上涨了 5%,销售额增加了 10%,则销售量增加了( C ) A. 15% B. 5.2 % C. 4.8 % D. 2 % 13、某变量数列末组为开口组,下限是 500;又知其邻组的组中值是 480,则该组 的组 中值应为(D )0 B.时间和指标数值 C.时间和次数 20、现象总体中最普遍出现的标志值是( A ) A.变量 B.总体 C.总体单位 D.指标 A. 490 B. 500 C. 510 D. 520 14、根据最小二乘法原理所配合的一元线性回归方程,是使( B )0 无 (Y -Y?)2 为最小 送(Y -Y?) = 0 A S (Y -Y ) = 0 C 送(Y -Y )为最小 15、 以下不是统计量特点的是( A.不确定 B.已知 16、 不属于专门调查的有(A A.统计年报 B.抽样调查 C.未知 C 普查 17、 今有N 辆汽车在同一距离的公路上行驶的速度资料, Z xf B. ----- Z f C 旦 C 7 x D.不唯一 D.典型调查 m 表示路程,x 表示速度, ) D. 18、 抽样推断的特点有(B )0 A.事先人为确定好样本 C.缺乏一定的科学性和可靠性 19、 时间数列的构成要素是( B.按随机原则抽取样本 D.事先无法计算和控制抽样误差 A.变量和次数 D.主词和宾词 A.众数 B.中位数 C.平均数 D.频数 21、定基发展速度等于相应的各环比发展速度(C A.之和 B.之差 C.之积 D.之商 22、平均指标不包括(A ) 0 A.标准差 B.调和平均数

旗开得胜 1 第七章 假设检验与方差分析 习题答案 一、名词解释 用规范性的语言解释统计学中的名词。 1. 假设检验:对总体分布或参数做出某种假设,然后再依据抽取的样本信息,对假设是否正确做出统计判断,即是否拒绝这种假设。 2. 原假设:又叫零假设或无效假设,是待检验的假设,表示为 H 0,总是含有等号。 3. 备择假设:是零假设的对立,表示为 H 1,总是含有不等号。 4. 单侧检验:备择假设符号为大于或小于时的假设检验。 5. 显著性水平:原假设为真时,拒绝原假设的概率。 6. 方差分析:是检验多个总体均值是否相等的一种统计分析方法。 二、填空题 根据下面提示的内容,将适宜的名词、词组或短语填入相应的空格之中。 1. u , n x σμ0 -,标准正态; ),( ),(2/2/+∞- -∞n z n z σσααY 2. 参数检验,非参数检验 3. 弃真,存伪 4. 方差

旗开得胜 2 5. 卡方, F 6. 方差分析 7. t ,u 8. n s x 0μ-,不拒绝 9. 单侧,双侧 10.新产品的废品率为5% ,0.01 11.相关,总变异,组间变异,组内变异 12.总变差平方和=组间变差平方和+组内变差平方和 13.连续,离散 14.总体均值 15.因子,水平 16.组间,组内 17.r-1,n-r 18. 正态,独立,方差齐

三、单项选择 从各题给出的四个备选答案中,选择一个最佳答案,填入相应的括号中。 1.B 2.B 3. B 4.A 5.C 6.B 7.C 8.A 9.D 10.A 11.D 12.C 四、多项选择 从各题给出的四个备选答案中,选择一个或多个正确的答案,填入相应的括号中。1.AC 2.A 3.B 4.BD 5. AD 五、判断改错 对下列命题进行判断,在正确命题的括号内打“√”;在错误命题的括号内打“×”,并在错误的地方下划一横线,将改正后的内容写入题下空白处。 1. 在任何情况下,假设检验中的两类错误都不可能同时降低。( ×) 样本量一定时 2. 对于两样本的均值检验问题,若方差均未知,则方差分析和t检验均可使用,且两者检验结果一致。( √) 3

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

计算题例题及答案: 1、某校社会学专业同学统计课成绩如下表所示。 社会学专业同学统计课成绩表 学号成绩学号成绩学号成绩101023 76 101037 75 101052 70 101024 91 101038 70 101053 88 101025 87 101039 76 101054 93 101026 78 101040 90 101055 62 101027 85 101041 76 101056 95 101028 96 101042 86 101057 95 101029 87 101043 97 101058 66 101030 86 101044 93 101059 82 101031 90 101045 92 101060 79 101032 91 101046 82 101061 76 101033 80 101047 80 101062 76 101034 81 101048 90 101063 68 101035 80 101049 88 101064 94 101036 83 101050 77 101065 83 要求: (1)对考试成绩按由低到高进行排序,求出众数、中位数和平均数。

(2)对考试成绩进行适当分组,编制频数分布表,并计算累计频数和累计频率。答案: (1)考试成绩由低到高排序: 62,66,68,70,70,75,76,76,76,76,76,77,78,79, 80,80,80,81,82,82,83,83,85,86,86,87,87,88, 88,90,90,90,91,91,92,93,93,94,95,95,96,97, 众数:76 中位数:83 平均数: =(62+66+……+96+97)÷42 =3490÷42 =83.095 (2) 按成绩 分组频数频率(%) 向上累积向下累积 频数频率(%) 频数频率(%) 60-69 3 7.143 3 7.143 42 100.000 70-79 11 26.190 14 33.333 39 92.857 80-89 15 35.714 29 69.048 28 66.667

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏 估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总 体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数, 这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间 95%仅仅描述用来构造该区间上下界的统计量(是随机的 )覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有 95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个 95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1.估计总体均值时样本量 n 为 ( z22 2) 22 E z n22其中:2 E 2n 2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、%104%105

第 1 页/共 12 页 1、下表是某保险公司160名推销员月销售额的分组数据。书p26 按销售额分组(千元) 人数(人) 向上累计频数 向下累计频数 12以下 6 6 160 12—14 13 19 154 14—16 29 48 141 16—18 36 84 112 18—20 25 109 76 20—22 17 126 51 22—24 14 140 34 24—26 9 149 20 26—28 7 156 11 28以上 4 160 4 合计 160 —— —— (1) 计算并填写表格中各行对应的向上累计频数; (2) 计算并填写表格中各行对应的向下累计频数; (3)确定该公司月销售额的中位数。 按上限公式计算:Me=U- =18-0.22=17,78 2、某厂工人按年龄分组资料如下:p41 工人按年龄分组(岁) 工人数(人) 20以下 160 20—25 150 25—30 105 30—35 45 35—40 40 40—45 30 45以上 20 合 计 550 要求:采用简捷法计算标准差。《简捷法》 3、试根据表中的资料计算某旅游胜地2004年平均旅游人数。P50 表:某旅游胜地旅游人数 时间 2004年1月1日 4月1日 7月1日 10月1日 2005年1月1 日 旅游人数(人) 5200 5000 5200 5400 5600 4、某大学2004年在册学生人数资料如表3-6所示,试计算该大学2004年平均在册学生人数. 时间 1月1日 3月1日 7月1日 9月1日 12月31日 在册学生人数(人) 3408 3528 3250 3590 3575

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

1对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果 如下 第1页共4页 成年组 166 169仃2仃7 180 仃0 仃2仃4 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异, 你会采用什么样的指标 测度值?为什么? (2)比较分析哪一组的身高差异大? 解:(1)采用标准差系数比较合适,因为各标志变动值的数值大 小,不仅受离散程度的影响,而且还受到平均水平高低的影响。 标准 差系数适合于比较不同组数据的相对波动程度。 10 (2)成年组的均值:乂 =7 =172.1 cm ,标准差为:S = 4. 202cm 离散系数:V 1 二基二 4^202 : 0. 024 X 172. 1 10 X i 幼儿组的均值:X = V 71.3 cm ,标准差为:= 2. 497 cm 离散系数:v 2 = X = 71 3 : 0. 035 v1

(2)相对数分析 ' P i q i ' p°q 、 pq ' P o q 。 ' P o q 。 ' p°q 125550 117100 绝对数分析 ' pg 八 p °q ° =、 p °q 1 - p °q ° ' pg 八 p °q 1 94500-12500二 117100-125550 94500-117100 31050二 8450 -22600 由于产量q 下降6.73%,使总成本下降8450元; 由于单位成本p 下降 19.30%,使总成本下降22600元。 3、从一个标准差为5的总体中抽出一个容量为40的样本,样本均值 为25。 (1) 样本均值的抽样标准差C X 等于多少? (2) 在95%的置信水平下,允许误差是多少? (3) 试确定该总体均值95%的置信区间。(血25 = 1.96) 解:(1)样本均值的抽样标准差: (2) 在95%的置信水平下,允许误差是: z 0.025▽犬=0. 79 X 1. 96 1. 55 (3) 该总体均值95%的置信区间: 65 340 1000 35 400 150 94500 125550 65 65 340 1000 35 400 150

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

第七章 相关和回归 一、单项选择题 1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。 (1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。 (1)小于0 (2)大于0 (3)等于0 (4)等于1 3.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。 (1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。 (1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。 (1)严格的关系 (2)不严格的关系 (3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示: 其相关系数计算出来放在四个备选答案之中,它是( )。 (1)0.29 (2)-0.88 (3)1.03 (4)0.99 7.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。 (1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知 2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2 ()y y -∑的1.2倍, 则相关系数r=( )。 (1) 21.22 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。 (1)明显因果关系 (2)自身相关关系 (3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。 (1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。 (1)相关系数 (2)回归系数 (3)回归参数 (4)估计标准误差 12.确定回归方程时,对相关的两个变量要求( )。 (1)都是随机变量 (2)都不是随机变量

思考题与练习题 参考答案 【友情提示】请各位同学完成思考题和练习题后再对照参考答案。回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。学而不思则罔,如果直接抄答案,对学习无益,危害甚大。想抄答案者,请三思而后行! 第一章绪论 思考题参考答案 1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。 2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。 3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。 练习题参考答案 一、填空题 1.调查。

2.探索、调查、发现。 3. 目的。 二、简答题 1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。 2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题; ②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。不解决问题时,重复第②-⑥步。 3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。 三、案例分析题 1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。 2.(1)总体:市大学生;单位:市的每个大学生。(2)如果调查中了解的是价格高低,为定序尺度;如果调查中了解的是商品丰富、价格合适、节约时间,为定类尺度。(3)市大学生在网上购物的平均花费。(4)是用统计量作为参数的估计。(5)推断统计。 3.(1)10。(2)6。(3)定类尺度:汽车名称,燃油类型;定序尺度:车型大小;定距尺度:引擎的汽缸数;定比尺度:市区驾车的油耗,公路驾车的油耗。(4)定性变量:汽车名称,车型大小,燃油类型;定量变量:引擎的汽缸数,市区驾车的油耗,公路驾车的油耗。(5)4 0%;(6)30%。 第二章收集数据

2015年大学统计学最新考试试题 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2

二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

计算分析题解答参考 1.1.某厂三个车间一季度生产情况如下: 计算一季度三个车间产量平均计划完成百分比和平均单位产品成本。 解:平均计划完成百分比=实际产量/计划产量=733/(198/0.9+315/1.05+220/1.1) =101.81% 平均单位产量成本 X=∑xf/∑f=(15*198+10*315+8*220)/733 =10.75(元/件) 1.2.某企业产品的有关资料如下: 试分别计算该企业产品98年、99年的平均单位产品成本。 解:该企业98年平均单位产品成本 x=∑xf/∑f=(25*1500+28*1020+32*980)/3500 =27.83(元/件) 该企业99年平均单位产品成本x=∑xf /∑(m/x)=101060/(24500/25+28560/28+48000/32) =28.87(元/件) 年某月甲、乙两市场三种商品价格、销售量和销售额资料如下: 1.3.1999 解:三种商品在甲市场上的平均价格x=∑xf/∑f=(105*700+120*900+137*1100)/2700 =123.04(元/件) 三种商品在乙市场上的平均价格x=∑m/∑(m/x)=317900/(126000/105+96000/120+95900/137) =117.74(元/件) 2.1.某车间有甲、乙两个生产小组,甲组平均每个工人的日产量为22件,标准差为 3.5件;乙组工人日产量资料:

试比较甲、乙两生产小组中的哪个组的日产量更有代表性? 解:∵X 甲=22件 σ甲=3.5件 ∴V 甲=σ甲/ X 甲=3.5/22=15.91% 列表计算乙组的数据资料如下: ∵x 乙=∑xf/∑f=(11*10+14*20+17*30+20*40)/100 =17(件) σ 乙=√[∑(x-x)2 f]/∑f =√900/100 =3(件) ∴V 乙=σ乙/ x 乙=3/17=17.65% 由于V 甲<V 乙,故甲生产小组的日产量更有代表性。 2.2.有甲、乙两个品种的粮食作物,经播种实验后得知甲品种的平均产量为998斤,标准差为162.7斤;乙品种实验的资料如下: 试研究两个品种的平均亩产量,确定哪一个品种具有较大稳定性,更有推广价值? 解:∵x 甲=998斤 σ甲=162.7斤 ∴V 甲=σ甲/ x 甲=162.7/998=16.30% 列表计算乙品种的数据资料如下:

第7章 参数估计 练习题 7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ 样本均值的抽样标准差79.04 10 40 5≈= = = n x σ σ ⑵已知5=σ,40=n ,25=x ,4 10 = x σ,%951=-α 96.1025.02==∴Z Z α 边际误差55.14 10 * 96.12 ≈==n Z E σ α 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差; (3) 如果样本均值为120元,求总体均值μ的95%的置信区间。 解.已知.根据查表得2/αz =1.96 (1)标准误差:14.249 15== =n X σ σ (2).已知2/αz =1.96 所以边际误差=2/αz * =n s 1.96* 49 15=4.2 (3)置信区间:)(2.124,8.11596.149 151202 =*± =±n s Z x α

7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差 85414=σ,构建总体均值μ的95%的置信区间。 96.12 =?Z 144.16741100 85414* 96.12 ==? ?n Z σ 856.87818144.16741104560. 2 =-=-?n Z x σ 144.121301144.16741104560. 2 =+=+?n Z x σ 置信区间:(87818.856,121301.144) 7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。 (1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s . (1)置信水平为%901=-α,则645.12 =αZ . 由公式n s z x ? ±2 α974.181100 12645.181±=? ±= 即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12 =αz 由公式得n s z x ? ±2 α=81352.281100 12 96.1±=? ± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352 (3)置信水平为%991=-α,则576.22 =αZ .

思考题: 1、什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1)反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨(,依据(意)帕累托(V.Pareto)的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0~1之间 ①基尼系数小于0.2,表明分配平均;②在0.2~0.4之间,分配比较适当;③0.4 是收入分配不公平的警戒线,超过0.4,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;(2)区别:概率密度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。11、离散型随机变量和连续型随机变量的概率分布的描述有些什么不同? 答:⑴离散型随机变量的概率分布可以用表格、函数或图形等形式来表现。最常见的离散型随机变量的概率分布是二项分布,此外还有伯松分布、超几何分布; ⑵连续型随机变量的概率分布可以用概率密度和分布函数以及对应的曲线图来表示。最常见

相关文档
相关文档 最新文档