解: (1)已知 6 = 5/= 40,元=25
(1)标准误差:A a 15 八… 亍=亍=2.14 4n V49
练习题
7.1从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。
(1)样本均值的抽样标准差<7了等于多少?
(2)在95%的置信水平下,边际误差是多少?
样本均值的抽样标准差。亍=与=京==逅^ 0.79
V40 4
(2)已知er = 5,〃 = 40,无=25 , (7- = , l-a = 95%
4
??Z Q/2 = Z° 025 = 1-96
边际误差 E = Z a/2-^ = 1.96*—? 1.55 -yjn 4
7.2某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客
组成了一个简单随机样木。
(1)假定总体标准差为15元,求样本均值的抽样标准误差;
(2)在95%的置信水平下,求边际误差;
(3)如果样本均值为120元,求总体均值〃的95%的置信区间。
解.已知.根据查表得%2=1?96
(2).已知Za/2=1?96
v I )
所以边际误差=z ” *刀==1.96*-7= =4.2
插 V49
q 15
(3)置信区问:元土Z.刁==120±^*1.96 = (115.8,124.2)
2 V/i 749
第7章参数估计
假定总体标准差
121301.144
7.3从一个总体中随机抽取〃 =10。的随机样本,得到x = 104560 ,
b = 85414,构建总体均值#的95%的置信区间。
85414 1.96*^= = 16741.144 V100
=104560 -16741.144 = 87818.856
f +Z %.云=104560 +16741.144 置信区间:(87818.856, 121301.144)
7.4从总体中抽取一个〃 =100的简单随机样本,得到x=81, 5 = 12O
(1) 构建〃的90%的置信区间。
(2) 构建"的95%的置信区间。 (3) 构建#的99%的置信区间。 解;由题意知7? = 100,元= 81,s = 12? (1)置信水平为 l-a = 90%,则Z. = 1.645 .
I
v I?
由公式元土 z” x— = 81 ±1.645x^^ = 8111.974
f Vn V100 即 81 ±1.974 =(79.026,82.974),
则g 的90%的置信区间为79.026?82.974 (2)置信水平为1一。=95%,
七=1.96
~2
5 |2
由公式得x±z x —=81±1.96x —= 81±2.352
f 插 100 即 81 ±2.352= (78.648, 83.352),
则#的95%的置信区间为78.648?83.352 (3) 置信水平为 1 —a=99%,则Z 。=2.576.
2
置信上限:
= 119.6+ 6.43 = 126.03
c
7
由公式元土 j x —= =81±2.576x^= = 81±3.096
7 4n V100 即 81±3.1
则"的99%的置信区间为
7.5利用下面的信息,构建总体均值的置信区间。
(1) 元=25 , CT = 3.5, n = 60, iH 信水平-为 95%。 (2) 元= 119.6, s = 23.89, n = 75 ,置信水平为 98%。 (3) 元= 3.419, s = 0.974, 〃 = 32,置信水平为 90%。 ⑴ X = 25,cr = 3.5,〃 = 60,置信水平为 95% 解:Z, =1.96,
2
Z 。与= 1.96x^1 = 0.89
7 V60
置信下限:.
k-Z“m = 25-0.89 = 24.11
2 J 〃
置信上限:X+Z” 3 = 25 + 0.89 = 25.89
7 v w .??置信区间为(24.11,25.89)
(2) X =119.6,s = 23.89, n = 75,置信水平为98%。 解:Zg=2.33
r s …23.89 … Z 。—j= = 2.33 x —= 6.43 i V75
置信下限:X-Z a -^= = \ 19.6 -6.43 = 113.17
2 V/1
置信区间为(113.17,126.03)
(3) x =3.419,s=0.974,n=32,置信水平为 90%
=0.283
(8734,9066)
根据 t=0.1,查 t 分布表可得 Z 005(31) = 1.645.Z a/2 所以该总体的置信区间为 x ± Z./2 (土)=3.419±0.283 即 3.419±0.283= (3.136 , 3.702)
所以该总体的置信区间为3.136?3.702.
7.6利用下面的信息,构建总体均值#的置信区间。
(1) 总体服从正态分布,且已知b=500, 〃 = 15,元= 8900,置信水平为95%。 (2) 总体不服从正态分布,且已知b = 500, 〃 = 35,元= 8900,管信水平为95%。 (3) 总体不服从正态分布,b 未知,〃 =35,元= 8900, 5 = 500 ,置信水平为 90% o (4) 总体不服从正态分布,b 未知,〃 =35,无= 8900, 5 = 500 ,置信水平为 99% o
(1)
解:巳知 元 ± z 与= 8900 ± 1.96 x 犁二(8647,9153) 所以总体均值〃的置信区间为(8647, 9153) (2) 解:已知o — 500 , 〃 = 35 , x — 8900 , \-a = 95 %, z a — 1.96 j±7 -^ = 890011.96x^2 y V35 所以总体均值//的置信区间为(8734, 9066) (3)解:已知H = 35 ,无= 8900, s=500,由于总体方差未知,但为大样本, 可用样本方差来代替总体方差 ?.?置信水平1—<7=90%“ 二1.645 2 ..?置信区间为彳土私土 = 81 ± 1.645 x 黑 =(8761,9039) 三插 V35 所以总体均值/的置信区间为(8761, 9039) (4) 解:已知〃 =35,无= 890(), s = 500,由于总体方差未知,但为大样 本,可用样本方差来代替总体方差 置信水平1—a =99%...J = 2.58 T ?.?省信区间为元土私二 =8900 ±2.58x 犁 =(8682,9118) 三插 V35 所以总体均值△的置信区间为(8682, 9118) 7.7某大学为了解学生每天上网的时间,在全校7500名学生中采取不重复抽样方法随机抽 取36人,调查他们每天上网的时间,得到的数据见Book7.7 (单位:h)。求该校大学生平均上网时间的置信区间,置信水平分别为90%、95%和99%o 解:己知:x = 3.3167 s = 1.6093 n=36 1.当置信水平为90%时,为=1.645 , 2 - s 1 6093 = 3.3167 ±1.645 =3.3167± 0.4532 2<36 所以置信区间为(2.88, 3.76) 2.当省信水平为95%时,小=196, 2 一s 1 6093 = 3.3167 ±1.96^=^ = 3.3167 ±0.5445 2 yn J36 所以置信区间为(2.80, 3.84) 3.当置信水平为99%时,耳=2.58 , 2 一s 1 6093 工土 /『=3.3167 ± 2.58^^ = 3.3167 ± 0.7305 7 Vn V36 所以置信区间为(2.63, 4.01) 7.8从一个正态总体中随机抽取样木量为8的样本,各样本值见Book7.8o求总体均值95% 的置信区间。 已知:总体服从正态分布,但b未知,n=8为小样本,。=0.05,(o()s (8 —1) = 2.365 根据样本数据计算得:元二10,s = 3.46 总体均值"的95%的置信区间为: x±t 7 Vn Av = 10±2.365x = 10±2.89,即(7.11, 12.89)O 7.9某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样 本,他们到单位的距离(单位:km)数据见Book7.9o求职工上班从家里到单位平均距离95%的置信区间。 已知:总体服从正态分布,但b未知,n=16为小样本,a =0.05, /00S/?(16 - 1) = 2.131 根据样本数据计算可,得:无= 9.375, s=4.113 从家里到单位平均距离得95%的置信区间为: v 4 113 x ±t r//2 -= = 9.375 ±2.131x = 9.375 ±2.191 插V14 即(7.18, 11.57)o 7.10从一批零件中随机抽取36个,测得其平均长度为149.5cm,标准差为1.93cm。 (1)试确定该种零件平均长度95%的置信区间。 (2)在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。 解:已知b = 103,n=36, x =149.5,置信水平为1.。=95%,查标准正态分布表得 ZgT%. 根据公式得: x ± Z],,,? — =149.5i 1.96x—-===? -Jn J36 103 即149.5± 1.96x-== (148.9, 150.1) V36 答:该零件平均长度95%的置信区间为148.9-150.1 (3)在上面的估计中,你使用了统计中的哪一个重要定理?请简要解释这一定理。 答:中心极限定理论证。如果总体变量存在有限的平均数和方差,那么,不论这个总体的分布如何,随着样本容量的增加,样本均值的分布便趋近正态分布。在现实生活中,一个随机变量服从正态分布未必很多,但是多个随即变量和的分布趋于正态分布则是普遍存在的。样木均值也是一种随机变量和的分布,因此在样本容量充分大的条件下,样 3.46 7.12 本均值也 趋近正态分布,这位抽样误差的概率估计理论提供了理论基础。 7.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100凯现从某天生产的 一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:Q 见Book7.1L 已知食品重量服从正态分布,要求: (1) 确定该种食品平均重量的95%的置信区间。 (2) 如果规定食品重量低于l (X)g 属于不合格,确定该批食品合格率的95%的置信区 问。 ⑴已知:总体服从正态分布,但a 未知。n=50为大样本。a =0.05, Z {)05/2 =1.96 根据样本计算可知 又= 101.32 s=1.63 该种食品平均至量的95%的置信区间为 X±Z a/25/Vn=101.32± 1.96*1.63/750 = 101.32 + 0.45 即(100.87, 101.77) (2)由样本数据可知,样本合格率:p = 45/50 = 0.9。该批食品合格率的95%的置信区 间为: p±Z a/. J 冲 一 P )=0.9 ±1.96 J O" 」。*) =o.9±O.O8,即(0.82, 0.98) ~ V n V 50 答:该批食品合格率的95%的置信区间为:(0.82, 0.98) 假设总体服从正态分布,利用Book7.12的数据构建总体均值。的99%的置信区间。 根据样本数据计算的样木均值和标准差如下; - b 0.8706 尤=16.13 a =0.8706 E=Z ,,=2.58* ------------------------- =0.45 为5 置信区间为工土E 所以置信区间为(15.68, 16.58) 7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了 18 名员工,得到他们每周加班的时间数据见Book7.13 (单位:h)o 假定员工每周加班的 时间服从正态分布,估计网络公司员工平均每周加班时间的90%的置信区间。 解:已知 x =13.56 b=7.80 a = 0.1 n=18 E=Z^ *cr/Vn 置信区间=[T-Z% cr/Vn ,元+ ?% ] 0.704) 又检验统计量为: P±Z 故代入数值计算得, P±Z p(l - p) 、 总体比例〃的置信区间为(0.777, 0.863) n = 1150, p = 0.48 ,置信水平为 90%。 解:由题意,己知n=1150,置信水平a=90%, Z a/2 =1.645 又检验统计量为: p±zj p(l ~p) ,故代入数值计算得, v n 所以置信区间=[13.56-1.645*(7.80/而),13.56+1.645*(7.80/灰)] =[10.36, 16.76] 7.14利用下面的样本数据构建总体比例兀的置信区间。 (1) n = 44 , p = 0.51,置信水平为 99%。 (2) n = 300, p = 0.82 ,置信水平为 95%。 (3) = 1150, p = 0.48 ,管信水平为 90%。 (1) n = 44 , p = 0.51,置信水平为 99%。 解:由题意,巳知n=44, K 信水平a=99%, Z a/2=2.58 又检验统计量为:P ±Z J /?(1~/?),故代入数值计算得, V n P±zJP (l — P )= (0.316, 0.704), 总体比例4 的置信区间为(0.316, V n (2) n = 300, p = 0.82 ,置信水平为 95%。 解:由题意,已知n=300,置信水平a=95%, Z rt/2=L96 p(l-p) P±Z =(0.456, 0.504), 总体比例勿的置信区间为(0.456, 0.504) n 7.15在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电 视机。其中拥有该品牌电视机的家庭占23%。求总体比例的置信区间,置信水平分别为90%和95%O 解:由题意可知n=200, p=0.23 (I)当置信水平为l-a=90%时,Z a/. =1.645 所以p±Z a,2」P(D = 0.23 ± 1.645J畛芸竺=0.23 ± 0.04895 即0.23± 0.04895= (0.1811, 0.2789), (2)当置信水平为1.。=95%时,Z M=1.96 °23X2QQ023)=°23±005832 所以p±喝2尸._〃 = 0.23± 1.96^ 即0.23±0.05832= (0.1717, 0.28835); 答:在居民户中拥有该品牌电视机的家庭在置信水平为90%的置信区间为 (18.11%, 27.89%),在置信水平为95%的置信区间为(17.17%, 28.835%) 7.16 一位银行的管理人员想估计每位顾客在该银行的月平均存款额。他假设所有顾客月存 款额的标准差为10()0元,要求估计误差在200元以内,应选取多大的样本? 解:已知er = 1000,E=1000,\-a = 99%,z a/2 = 2.58 2 * 2 由公式M = "n可知n=(2.58*2.58* 1000* 1000)/(200*200)= 167 E2 答:置信水平为99%,应取167个样本。 7.17要估计总体比例〃,计算下列个体所需的样本容量。 (1) E = 0.02 , 71 = 0.40 ,置信水平为96%。 (2) E = 0.04 ,仃未知,置信水平为95%。 (3)E = 0.05 , 71 = 0.55 ,置信水平为90%。 P 土爬尹=64%±1.96』 64%(1-64%) 5() (1)解:巳知 E = 0.02 , 71 = 0.40,, Z a/2=2.05 由 n = Z n = 2.052 x 0.40(1 -0.4) + 0.022 =2522 答:个体所需的样本容量为2522。 (2) 解:己知E = 0.04 , Z 〃”=1.96 IX /匕 由 〃 =Z"22〃(1—〃)/E2 得 /?=1.962 X 0.52 ^0.042 =601 答:个体所需的样本容量为601。 (3) 解:己知 E = 0.05 ,彳=0.55, Z“=1.645 由〃 =Z a,227T (l ~ 7T )/E 2 得 n = 1.6452 x 0.55 x 0.45 + 0.052 =268 答:个体所需的样本容量为268。 7.18某居民小区共有居民500户,小区管理者准备采取一向新的供水设施,想了解居民是 否赞成。采取重复抽样方法随机抽取了 50 P,其中有32户赞成,18户反对。 (1) 求总体中赞成该项改革的户数比例的置信区间,置信水平为95%o (2) 如果小区管理者预计赞成的比例能达到80%,应抽取多少户进行调查? (1)已知:n=50 Z = 1.96 根据抽样结果计算的样本比例为P=32/50=60% 根据(7.8)式得: 即 64% ±12.63% = (51.37%,76.63%) 答:置信区间为(51.37%, 76.63%) (2)己知〃 =80% E = 10% =1.96 7 则有:好Z%F1F = 1.96F8(1-。.8) 部2 E 2 O.l 2 勿 1(22-1)*312 们V 32.6705 答:应抽取62户进行调查 7.19根据下面的样本结果,计算总体标准差a 的90%的置信区间。 (1) 元= 21, s = 2 , 〃 = 50。 (2) 元= 1.3, s = 0.02 , 〃 = 15。 (3) 元= 167, 5 = 31, 〃 = 22。 oc a 解:已知 1 一。=90%, a = 10%,一= 0.05,1-一 = 0.95 2 2 1) 查表知//(/?-1) = 67, / :(〃 —1) = 34 — 1 ----------------------- 2 2 由公式 2 2 "1) 七”Eg, m, 2.40) V 67 V 34 2) 查表知 /:(〃_])= 23.6848, / a 2 (/i -1) = 6.57063 — 1—— 2 2 由公式岬气冬尹 ,疽 Z. a — 1— 回-1)*。.。2二 3-1)*0.022,解得 SB, os) V 23.6848 V 6.57063 3) 查表知 7。之(〃_])= 32.6705, / ;(〃-1) = 11.5913 — 1—— 2 2 Za _ Z ;a — 1 --------------------- 2 2 (22_1)*3F k ; ,解得(24.85, 41.73) X. = 53.2 s ; = 102.0 11.5913 7.20顾客到银行办理业务时往往需要等待一些时间,而等待时间的长短与许多因素有关, 比如,银行的业务员办理业务的速度,顾客等待排队的方式等等。为此,某银行准备采 取两种排队方式进行试验,第一种排队方式是所有顾客都进入一个等待队列;第二种排 队方式是:顾客在三个业务窗曰处列队三排等待。为比较哪种排队方式使顾客等待的时 间更短,馄行各随机抽取了 1()名顾客,他们在办理业务时所等待的时间(单位:min ) 见 Book7.20。 (1) 构建第一种排队方式等待时间标准差的95%的置信区间。 (2) 构建第二种排队方式等待时间标准差的95%的置信区间。 (3) 根据(1)和(2)的结果,你认为哪种排队方式更好? 7.21从两个正态总体中分别抽取两个独立的随机样木,它们的均值和标准差如下表: 来自 总体1的样本 来自总体2的样本 n x = 14 = 7 元 2 = 43.4 5; = 96.8 (1) 求"i 一 —的90%的置信区间。 (2) 求巧-必的95%的置信区间。 (3) 求-#2的99%的置信区间。 7.22从两个正态总体中分别抽取两个独立的随机样本,它们的均值和标准差如下表: 来自 总体1的样木 来自总体2的样本 %! =25 x 2 = 23 4 =20 解:已知P=2% E=4% △p ~2 p(l - p)当置信区间1-a为95%时 Z%xp(l-p) n= ― l-cr=0.95 Z° = Z° 025 = L96 2 N=z;xp(l-p) 1.962x 0.02x0.98 0.042 =47.06 (2)设巧和化分别为总体A和总体B的均值,构造"dF—f的95%的置信区间。 7.24 一家人才测评机构对随机抽取的1()名小企业的经理人用两种方法进行自信心测试, 得到的自信心测试分数见Book7.24c构建两种方法平均自信心得分之差"d=4\W的95%的置信区间。 7.25从两个总体中各抽取一个n{ = n2 = 250的独立随机样本,来自总体1的样本比例为 /?, = 40% ,来a总体2的样本比例为p2 = 30% o (1)构造沔—巧的90%的置信区间。 (2)构造羽-勿之的95%的置信区间。 7.26生产工序的方差是工序质量的一个重要度量。当方差较大时,需要对工序进行改进以 减小方差。两部机器生产的袋茶重量(单位:g)的数据见Book7.26o构造两个总体方差比’2/两的95%的置信区间。 7.27根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求 边际误差不超过4%,应抽取多大的样本? 答:所以应取样本数48。 7.28某超市想要估计每个顾客平均每次购物花费的金额。根据过去的经验,标准差大约为 120元,现要求以95%的置信水平估计每个购物金额的置信区间,并要求边际误差不超 过20元,应抽取多少个顾客作为样本? 解:已知cr = 120, E = 20,当 a = 0.05 时,z oos/. =1.96O (7)2(T21 Q62 * 1202 应抽取的样本量为:〃= —= al39 E2202 7.29假定两个总体的标准差分别为丹=12, %=15,若要求误差范围不超过5,相应的 置信水平为95%,假定勺=昭,估计两个总体均值之差"\一此时所需的样木量为多大。 7.30假定勺=〃2,边际误差E = 0.05 ,相应的置信水平为95%,估计两个总体比例之差 为冬-勿2时所需的样本量为多大。 (1)设n} =n2 = 100 ,求巧-外95%的置信区间。 (2)设勺=〃2=1。,’2=两,求〃]一"2的95%的置信区间。 (3)设勺=/灼=10, erf a;,求"、一上的95%的置信区间。 (4)设n} = 10,?2 = 20 , er,1 2 3 4 5 = a;,求"、一上的95%的党信区间。 (5)设/?! = 10,n2 = 20 ,勇更勇,求"、一M的95%的置信区间。 7.23 Book7.23是由4对观察值组成的随机样本。 (1)计算A与B各对观察值之差,再利用得出的差值计算d和叫。