文档库 最新最全的文档下载
当前位置:文档库 › 统计学第五版课后题答案

统计学第五版课后题答案

统计学

第五版贾俊平版课后题答案(部分)

第三章 数据的图表展示

3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为:A .好;B .较好;C 一般;D .较差;E .差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B C

B

C

E

D

B

C

C

B

C

要求:

(1)指出上面的数据属于什么类型。 顺序数据

(2)用Excel 制作一张频数分布表。 用数据分析——直方图制作:

(3)绘制一张条形图,反映评价等级的分布。 用数据分析——直方图制作:

直方图

2040

E

D

C B

A

接收

频率

频率

接收 频率 E 16 D 17 C 32 B 21 A 14

(4)绘制评价等级的帕累托图。

逆序排序后,制作累计频数分布表:

接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A

14

14

100

5101520253035C

D

B

A

E

20406080100120频数

累计频率(%)

3.2 某行业管理局所属40个企业2002年的产品销售收入数据如下: 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97

88

123

115

119

138

112

146

113

126

要求:

(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。 1、确定组数: ()l g 40l g () 1.60206111 6.32l g (2)l g 20.30103

n K =+

=+=+=,取

k=6 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(152-87)÷6=10.83,取10 3、分组频数表

销售收入

频数 频率% 累计频数

累计频率%

80.00 - 89.00 2 5.0 2 5.0 90.00 - 99.00 3 7.5 5 12.5 100.00 - 109.00 9 22.5 14 35.0 110.00 - 119.00

12

30.0

26

65.0

120.00 - 129.00 7 17.5 33 82.5 130.00 - 139.00 4 10.0 37 92.5 140.00 - 149.00 2 5.0 39 97.5 150.00+ 1 2.5 40

100.0

总和

40

100.0

(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

频数

频率%

累计频数

累计频率%

先进企业 10 25.0 10 25.0 良好企业 12 30.0 22 55.0 一般企业 9 22.5 31 77.5 落后企业 9 22.5 40

100.0

总和

40

100.0

3.3 某百货公司连续40天的商品销售额如下:

单位:万元

41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42

36

37

37

49

39

42

32

36

35

要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 1、确定组数: ()l g 40l g () 1.60206111 6.32l g (2)l g 20.30103

n K =+

=+=+=,取

k=6 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(49-25)÷6=4,取5 3、分组频数表

销售收入(万元)

频数

频率%

累计频数

累计频率%

<= 25 1 2.5 1 2.5 26 - 30 5 12.5 6 15.0 31 - 35 6 15.0 12 30.0 36 - 40 14 35.0 26 65.0 41 - 45 10 25.0 36 90.0 46+ 4 10.0 40

100.0

总和

40

100.0

频数

246810121416<= 25

26 - 30

31 - 35

36 - 40

41 - 45

46+

销售收入

频数

频数

3.4 利用下面的数据构建茎叶图和箱线图。

57 29 29 36 31 23 47 23 28 28 35 51 39 18 46 18 26 50 29 33 21 46 41 52 28 21 43

19

42

20

60

50

40

30

20

10

data

data Stem-and-Leaf Plot

Frequency Stem & Leaf

3.00 1 . 889

5.00 2 . 01133

7.00 2 . 6888999

2.00 3 . 13

3.00 3 . 569

3.00 4 . 123

3.00 4 . 667

3.00 5 . 012

1.00 5 . 7

Stem width: 10

Each leaf: 1 case(s)

3.6一种袋装食品用生产线自动装填,每袋重量大约为50g,但由于某些原因,每袋重量不会恰好是50g。下面是随机抽取的100袋食品,测得的重量数据如下:

单位:g 57 46 49 54 55 58 49 61 51 49 51 60 52 54 51 55 60 56 47 47

53 51 48 53 50 52 40 45 57 53 52 51 46 48 47 53 47 53 44 47 50 52 53 47 45 48 54 52 48 46 49 52 59 53 50 43 53 46 57 49 49 44 57 52 42 49 43 47 46 48 51 59 45 45 46 52 55 47 49 50 54 47 48 44 57 47 53 58 52 48 55 53 57 49 56 56 57 53 41 48 要求:

(1)构建这些数据的频数分布表。 (2)绘制频数分布的直方图。 (3)说明数据分布的特征。

解:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。

1、确定组数:

()l g 100l g ()2111 6.64l g (2)l g 20.30103

n K =+=+=+=,取

k=6或7 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(61-40)÷6=3.5,取3或者4、5 组距=( 最大值 - 最小值)÷ 组数=(61-40)÷7=3, 3、分组频数表

组距3,上限为小于

频数

百分比

累计频数

累积百分比

有效

40.00 - 42.00 3 3.0 3 3.0 43.00 - 45.00 9 9.0 12 12.0 46.00 - 48.00 24 24.0 36 36.0 49.00 - 51.00 19 19.0 55 55.0 52.00 - 54.00 24 24.0 79 79.0 55.00 - 57.00 14 14.0 93 93.0 58.00+ 7 7.0 100

100.0

合计

100

100.0

直方图:

组距3,小于

10

8

6

4

2

F r e q u e n c y

30

20

10

组距3,小于

Mean =5.22Std. Dev. =1.508

N =100

组距4,上限为小于等于

频数

百分比

累计频数

累积百分比

有效

<= 40.00 1 1.0 1 1.0 41.00 - 44.00 7 7.0 8 8.0 45.00 - 48.00 28 28.0 36 36.0 49.00 - 52.00 28 28.0 64 64.0 53.00 - 56.00 22 22.0 86 86.0 57.00 - 60.00 13 13.0 99 99.0 61.00+ 1 1.0 100

100.0

合计

100

100.0

直方图:

组距4,小于等于

8

6

4

2

F r e q u e n c y

40

30

20

10

组距4,小于等于

Mean =4.06Std. Dev. =1.221

N =100

组距5,上限为小于等于

频数

百分比

累计频数

累积百分比

有效

<= 45.00 12 12.0 12.0 12.0 46.00 - 50.00 37 37.0 49.0 49.0 51.00 - 55.00 34 34.0 83.0 83.0 56.00 - 60.00 16 16.0 99.0 99.0 61.00+ 1 1.0 100.0

100.0

合计

100

100.0

直方图:

组距5,小于等于

6

5

4

3

2

1

F r e q u e n c y

50

40

30

20

10

组距5,小于等于

Mean =2.57Std. Dev. =0.935

N =100

分布特征:左偏钟型。

3.8 下面是北方某城市1——2月份各天气温的记录数据:

-3 2 -4 -7 -11 -1 7 8 9 -6 14 -18 -15 -9 -6 -1 0 5 -4 -9 6 -8 -12 -16 -19 -15 -22 -25 -24 -19 -8 -6 -15 -11 -12 -19 -25 -24 -18 -17 -14

-22

-13

-9

-6

0 -1 5 -4 -9 -3 2 -4 -4 -16 -1

7

5

-6

-5

要求:

(1)指出上面的数据属于什么类型。 数值型数据

(2)对上面的数据进行适当的分组。

1、确定组数:

()l g 60l g () 1.778151111 6.90989l g (2)l g 20.30103

n K =+

=+=+=,取

k=7 2、确定组距:

组距=( 最大值 - 最小值)÷ 组数=(14-(-25))÷7=5.57,取5 3、分组频数表

温度 频数

频率%

累计频数

累计频率%

-25 - -21 6 10.0 6 10.0 -20 - -16 8 13.3 14 23.3 -15 - -11 9 15.0 23 38.3 -10 - -6 12 20.0 35 58.3 -5 - -1 12 20.0 47 78.3 0 - 4 4 6.7 51 85.0 5 - 9 8 13.3 59 98.3 10+ 1 1.7 60

100.0

合计

60

100.0

(3)绘制直方图,说明该城市气温分布的特点。

频数

6

8

9

12

12

4

8

1

2468101214-25 - -21-20 - -16-15 - -11-10 - -6

-5 - -1

0 - 4

5 - 9

10+

频数

3.11 对于下面的数据绘制散点图。

x 2 3 4 1 8 7 y 25

25

20

30

16

18

解:

051015202530350

2

4

6810

x

y

3.12 甲乙两个班各有40名学生,期末统计学考试成绩的分布如下:

考试成绩 人数

甲班 乙班 优

良 中 及格 不及格

3 6 18 9 4

6 15 9 8 2

要求:

(1)根据上面的数据,画出两个班考试成绩的对比条形图和环形图。

3

6

18

9

4615

9

8

2

2468101214161820优良中及格不及格

人数 甲班人数 乙班

3

6

18

9

4

615

9

82

优良中及格不及格

(2)比较两个班考试成绩分布的特点。

甲班成绩中的人数较多,高分和低分人数比乙班多,乙班学习成绩较甲班好,高分较多,而低分较少。

(3)画出雷达图,比较两个班考试成绩的分布是否相似。

5101520优良

及格不及格

人数 甲班人数 乙班

分布不相似。

3.14 已知1995—2004年我国的国内生产总值数据如下(按当年价格计算):

单位:亿元

年份

国内生产总值

第一产业

第二产业

第三产业

1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 58478.1 67884.6 74462.6 78345.2 82067.5 89468.1 97314.8 105172.3 117390.2 136875.9 11993 13844.2 14211.2 14552.4 14471.96 14628.2 15411.8 16117.3 16928.1 20768.07 28538 33613 37223 38619 40558 44935 48750 52980 61274 72387 17947 20428 23029 25174 27038 29905 33153 36075 39188 43721

要求:

(1)用Excel 绘制国内生产总值的线图。

国内生产总值

20000

4000060000800001000001200001400001600001995

1996

1997

1998

1999

2000

2001

2002

2003

2004

国内生产总值

(2)绘制第一、二、三产业国内生产总值的线图。

10000

200003000040000500006000070000800001995199619971998199920002001200220032004

第一产业第二产业第三产业

(3)根据2004年的国内生产总值及其构成数据绘制饼图。

国内生产总值

20768.07,

15%

72387, 53%

43721, 32%

第一产业第二产业第三产业

第四章 数据的概括性度量

4.1(1)众数:100 M 。

中位数:5.52

11021=+=+=n 中位数位置,10210

10=+=e M 。

平均数:6.910

96

101514421

==++++=

=

∑= n

x

x n

i i

(2)5.24

10

4===

n Q L 位置 ,5.5274=+=L Q 。 5.74

10

343=?==n Q U 位置,1221212=+=U Q 。 (3)

2.49

4

.1561

10)6.915()6.914()6.94()6.92(1)(2

2221

2

==

--+-++-+-=

--=∑= n x x

s n

i i

(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2(1)从表中数据可以看出,年龄出现频数最多的是19和23,所以有两个众数,即19

0=M 和

23

0=M 。

将原始数据排序后,计算的中位数的位置为:13212521=+=+=n 中位数位置,第13个位置

上的数值为23,所以中位数23=e M 。 (2)25.64

25

4===

n Q L 位置,19)1919(25.019=-?+=L Q 。 75.184

25

3=?=

位置U Q ,56.252-7257.052=?

+=)(U Q 。 (3)平均数2425

600

25231715191

==++++=

=

∑= n x

x n

i i

65.61

251062

1

25)2423()2417()2415()2419(1)(2

2221

2

=-=

--+-++-+-=

--=∑= n x x

s n

i i

(4)偏态系数:()

08.165.6)225)(125(24253

3

=?---=

∑i x SK 。

峰态系数:[]

77.065

.6)325)(225)(125()

125()24(3)24()125(254

2

24=?-------+=

∑∑i i x x K 。

(5)分析:从众数、中位数和平均数来看,网民年龄在23~24岁的人数占多数。由于标准差较大,说明网民年龄之间有较大差异。从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以偏斜程度很大。由于峰态系数为正值,所以为尖峰分布。

4.3(1)茎叶图如下:

茎 叶 数据个数

5 5

1 6 6 7 8

3 7 1 3

4 8 8

5 (2)79

63

98.78.76.65.5==++++=

x 。

714.08

08

.419)78.7()78.7()76.6()75.5(2222==--+-++-+-= s 。

(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。 第一种排队方式:274.02.797.11==

v ;102.07

714.02==v 。由于21v v >,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4(1)1.27430

8223

1

==

=

∑=n

x

x n

i i

。 5.152

130=+=

中位数位置,5.2722273272=+=

e M 。 (2)5.74

30

==

位置L Q ,5.2592261258=+=L

Q 。 5.224

30

3=?=位置U Q ,5.2872291284=+=

U Q 。 (3)17.211

307

.130021

)(1

2

=-=

--=

∑=n x x

s n

i i

4.5(1)41.19340

6600

30

1500203000152100150030002100==++++==

总产量总成本甲企业的平均成本。

92.18342

55

6230

1500200051152553150000515523==++++==

总产量总成本乙企业的平均成本.

原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较

大,因此拉低了总平均成本。

4.6(1)平均数计算过程见下表:

按利润额分组 组中值

i M

企业数

i f

i i f M

200~300 250 19 4750 300~400 350 30 10500 400~500 450 42 18900 500~600 550 18 9900 600以上 650 11 7150 合计

120

51200

67.426120

51200

1

==

=

∑=n

f M

x k

i i

i

。 标准差计算过程见下表: 按利润额分组 组中值i M

企业数i f

2)(x M i -

i i f x M 2)(-

200~300 250 19 31212.3 593033.5 300~400 350 30 5878.3 176348.7 400~500 450 42 544.3 22860.1 500~600 550 18 15210.3 273785.2 600以上 650 11 49876.3 548639.2 合计

120

102721.5

1614666.7

48.1161

1207

.16146661

)(1

2=-=

--=

∑=n f x M

s k

i i

i

(2)偏态系数和峰态系数的计算过程见下表: 按利润额分组 组中值i M 企业数i f

i i f x M 3)(- i i f x M 4)(-

200~300 250 19 -104771226.5 185********.2 300~400 350 30 -13520652.3 1036628411.8 400~500 450 42 533326.9 12442517.1 500~600 550 18 33765928.7 4164351991.6 600以上 650 11 122527587.6 27364086138.8 合计

120

38534964.4 51087441648.4

偏态系数:203.048.1161204

.38534964)(3

313=?=

-=

∑=ns f x M

SK k

i i

i

峰态系数:688.0348

.1161204

.851087441643)(4

4

1

4-=-?=

--=

∑=ns f x M

K k

i i

i

4.7(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。

(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。

(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。

4.8 (1)要比较男女学生体重的离散程度应该采用离散系数。女生体重的离散系数为

1.0505

==

女v ,男生体重的离散系数为08.0605==男v ,所以女生的体重差异大。 (2)男生:1322.260=?=x (磅),112.25=?=s (磅); 女生:1102.250=?=x (磅),112.25=?=s (磅); (3)假定体重为对称分布,根据经验法则,在平均数加减1个标准差范围内的数据个数大约为68%。因此,男生中大约有68%的人体重在55kg 到65kg 之间。

(4)假定体重为对称分布,根据经验法则,在平均数加减2个标准差范围内的数据个数大约为95%。因此,女生中大约有95%的人体重在40kg 到60kg 之间。

4.9 通过计算标准分数来判断:

115100115=-=-=

A A A A s x x z ;5.050

400

425=-=-=B B B B s x x z 。 该测试者在A 项测试中比平均分数高出1个标准差,而在B 项测试中只高出平均分数0.5

个标准差,由于A 项测试的标准分数高于B 项测试,所以A 项测试比较理想。

4.10 通过标准分数来判断,各天的标准分数如下表:

日期 周一

周二

周三 周四 周五 周六 周日 标准分数Z 3 -0.6

-0.2

0.4

-1.8

-2.2

周一和周六两天失去了控制。

4.11(1)应该采用离散系数,因为它消除了不同组数据水平高低的影响。

(2)成年组身高的离散系数:024.01.1722

.4==

s v ; 幼儿组身高的离散系数:035.03

.715

.2==

s v ; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相

对较大。

4,11(1)应该从平均数和标准差两个方面进行评价。在对各种方法的离散程度进行比较时,应该采用离散系数。

(2)下表给出了用Excel 计算一些主要描述统计量。

方法A 方法B 方法C 平均 165.6 平均 128.73 平均 125.53 中位数 165 中位数 129 中位数 126 众数 164 众数 128 众数 126 标准差 2.13 标准差 1.75 标准差 2.77 极差 8 极差 7 极差 12 最小值 162 最小值 125 最小值 116 最大值

170

最大值

132

最大值

128

从三种方法的集中趋势来看,方法A 的平均产量最高,中位数和众数也都高于其他两种方法。从离散程度来看,三种方法的离散系数分别为:013.06

.16513

.2==

A v ,014.073.12875.1==

B v ,022.053

.12577

.2==C v 。方法A 的离散程度最小。因此应选择

方法A 。

4.12(1)用方差或标准差来评价投资的风险。

(2)从直方图可以看出,商业类股票收益率的离散程度较小,说明投资风险也就较小。 (3)从投资风险角度看,应该选择风险较小的商业类股票。当然,选择哪类股票还与投资者的主观判断有很大关系。

第五章 概率与概率分布

5.1 略

5.2 P(AB)=P(A)+P(B)-P(A+B)=50%+60%-85%=35% 5.3 因为

()()P AB P AB P(AB)=1/3++;()()P B (A(B+B))=P(AB)P AB =1/3P =+

()()P A (A(B+B))=P(AB)P AB =1/3-1/9=2/9P =+

5.4

()()P AB P AB P(AB)P(AB)=1+++;

()()P A|B P AB /()1/6P B ==; ()P AB 1/6*1/31/18∴==

()()P A (A(B+B))=P(AB)P AB P =+;()P AB 1/31/185/18=-=

同理()()

P B (B(A+A))=P(AB)P AB P =+;()

P AB =518/

()()11/185/185/18

P A|B P AB /()7/1211/3

P B ---==

=-

5.5 (1)()P(A)P B 0.8*0.70.56==; (2)()P A+B (A)+P(B)-P(AB)=0.8+0.7-0.8*0.7=0.94P = (3)()P A+B (A)+P(B)-2P(AB)=0.8+0.7-2*0.8*0.7=0.38P = 5.6 ()()(A P B|A 96%*75%=0.72P B P ==) 5.7 ()()1/2

P A|B P AB /()2/334

P B ===/ 5.8 贝叶斯公式:

()()()()k k k P A )P(B|A 10%*20%

P A |B 3.63%P A P B|A 10%*20%50%*50%40%*70%

===++∑

()()()()k k k P A )P(B|A 50%*50%

P A |B 45.45%P A P B|A 10%*20%50%*50%40%*70%

=

==++∑

()()()()

k k k P A )P(B|A 40%*70%

P A |B 50.9%P A P B|A 10%*20%50%*50%40%*70%=

==++∑

5.9 贝叶斯公式:

()()()()k k k P A )P(B|A 30%*0.1

P A |B 0.249P A P B|A 30%*0.127%*0.0525%*0.218%*0.15

===+++∑

()()()()

k k k P A )P(B|A 27%*0.05

P A |B 0.112P A P B|A 30%*0.127%*0.0525%*0.218%*0.15=

==+++∑

5.10 P(x=0)=0.25; P(x=1)=0.5; P(x=2)=0.25

5.11 (1) P(x=1)=0.20; P(x=10)=0.01; P(x=100)=0.001 (2)Ex=1*0.2+10*0.01+100*0.001=0.4

5.12 (1) 2

3137

8

x dx θ

θ=?,2θ∴= (2) 3213 1.58x Ex dx ==?;21340.158x Dx dx ==? 5.13 (5,0.25)x B ,学生凭猜测至少答对4道的概率为:

(4)(5)P x P x =+==4415

5055

0.250.750.250.75C C +=164

5.14 P(x=k)=λ^k×e^(-λ)/k!①

P(x=k+1)=λ^(k+1)×e^(-λ)/(k+1)!② ②/①得 P(x=k+1)/P(x=k)=λ/(k+1)

令P(x=k+1)/P(x=k)>1, 则λ>k+1, k<λ-1 令P(x=k+1)/P(x=k)<1, 则λλ-1

若λ<2, 则P(x=k)随着k 增大而减小, ∴k=1时最大

若λ>2, 则P(x=1)<……P(x=[λ-1]+2)>……, ∴k=[λ-1]+1=[λ]是最大

综上, λ<2时,k=1;λ>2时,k=[λ](写成分段的形式,[]是取整符号) 5.16 (1)0.6997 (2)0.5 5.17 173.913

5.18 (1)0.9332 (2)0.383

相关文档
相关文档 最新文档