文档库 最新最全的文档下载
当前位置:文档库 › 2019-2020年高三数学一轮复习第十一章统计统计案例第一节随机抽样夯基提能作业本理

2019-2020年高三数学一轮复习第十一章统计统计案例第一节随机抽样夯基提能作业本理

2019-2020年高三数学一轮复习第十一章统计统计案例第一节随机抽样夯基提能作业本理
2019-2020年高三数学一轮复习第十一章统计统计案例第一节随机抽样夯基提能作业本理

2019-2020年高三数学一轮复习第十一章统计统计案例第一节随机抽样夯基提能作

业本理

1.(xx北京,4,5分)某校老年、中年和青年教师的人数见下表.采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为( )

A.90

B.100

C.180

D.300

2.福利彩票“双色球”中红色球的编号有33个,分别为01,02,…,33,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )

A.23

B.09

C.02

D.17

3.从2 007名学生中选取50名学生参加全国数学联赛,若采用以下方法选取:先用简单随机抽样法从2 007名学生中剔除7名学生,剩下的2 000名学生再按系统抽样的方法抽取,则每名学生入选的概率( ) A.不全相等 B.均不相等

C.都相等,且为

D.都相等,且为

4.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区.三个营区被抽中的人数依次为( )

A.25,17,8

B.25,16,9

C.26,16,8

D.24,17,9

5.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应该为( )

A.480

B.481

C.482

D.483

6.已知某商场新进3 000袋奶粉,为检查其三聚氰胺是否超标,现采用系统抽样的方法从中抽取150袋检查,若第一组抽出的号码是11,则第六十一组抽出的号码为.

7.

某企业三个分厂生产同一种电子产品,三个分厂产量分布如图所示,现在用分层抽样方法从三个分厂生

产的该种产品中共抽取100件做使用寿命的测试,则从第一分厂应抽取的件数为;由所得的测试结果计算出从第一、二、三分厂取出的产品的使用寿命平均值分别为1 020小时、980小时、1 030小时,估计这个企业所生产的该种产品的平均使用寿命为小时.

8.某学校对该校参加第二次模拟测试的2 100名考生的数学学科的客观题解答情况进行抽样调查,可以在每个试题袋中抽取一份(每考场的人数为30),则采取抽样方法抽取一个容量为的样本进行调查较为合适.

9.某初级中学共有学生2 000名,各年级男、女生人数如下表:

已知在全校学生中随机抽取1名,抽到初二年级女生的概率是0.19.

(1)求x的值;

(2)现用分层抽样的方法在全校抽取48名学生,问应从初三年级抽取多少名?

10.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n个人参加市里召开的科学技术大会,如果采用系统抽样和分层抽样的方法抽取,则不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n的值.

B组提升题组

11.某工厂的三个车间在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从第一、二、三车间抽取的产品数分别为a,b,c,且a,b,c构成等差数列,则第二车间生产的产品数为( )

A.800

B.1 000

C.1 200

D.1 500

12.(xx甘肃兰州实战考试)采用系统抽样方法从1 000人中抽取50人做问卷调查,将他们随机编号

1,2,…,1 000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A,编号落入区间[401,750]的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷C的人数为( )

A.12

B.13

C.14

D.15

13.某企业三月中旬生产A、B、C三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表:

由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是件.

14.某班共有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号为1~50,并分组,第1组为1~5号,第2组为6~10号,……,第10组为46~50号,若在第3组中抽出号码为12的学生,则在第8组中应抽出号码为的学生.

15.据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改”引起广泛关注.为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3 600人进行调查,就“是否取消英语听力”问题进行了问卷调查,统计结果如下表.

已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05.

(1)现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?

(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.

答案全解全析

A组基础题组

1.C 本题考查分层抽样,根据样本中的青年教师有320人,且青年教师与老年教师人数的比为1

600∶900=16∶9,可以得到样本中的老年教师的人数为×320=180,故选C.

2.C 从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.

3.C 从N个个体中抽取M个个体,则每个个体被抽到的概率都等于.

4.A ∵总体容量为600,样本容量是50,

600÷50=12,

∴分段间隔为12,又由于随机抽得的第一个号码为003,故按照系统抽样的操作步骤在第Ⅰ营区应抽到25人,第Ⅱ营区应抽到17人,第Ⅲ营区应抽到8人.故选A.

5.C 根据系统抽样的定义可知样本的编号成等差数列,令a1=7,a2=32,则d=25,所以7+25(n-1)≤500,所以n≤20.72,因为n∈N*,所以n的最大值为20,最大编号为7+25×(20-1)=482.

6.答案 1 211

解析每组袋数为=20,

由题意知这些号码是以11为首项,20为公差的等差数列.a61=11+(61-1)×20=1 211.

7.答案50;1 015

解析从第一分厂应抽取的件数为100×50%=50;估计该种产品的平均使用寿命为1

020×0.5+980×0.2+1 030×0.3=1 015小时.

8.答案系统;70

解析因为样本容量较大,且考生情况按照每考场抽取没有明显的层次性,又=70,所以可以采用系统抽

样的方法抽取一个容量为70的样本.

9.解析(1)∵=0.19,∴x=380.

(2)初三年级学生人数为y+z=2 000-(373+377+380+370)=500,现用分层抽样的方法在全校抽取48名学生,则应从初三年级抽取×48=12名.

10.解析总体容量为6+12+18=36.

当样本容量是n时,n<36,由题意知,系统抽样的间隔为,抽取的工程师人数为×6=,技术员人数为×12=,技工人数为×18=,所以n应是6的倍数,36的约数,即n可取6,12,18.

当样本容量为n+1时,由题意知,系统抽样的间隔为,因为必须是整数,所以n只能取6,即n=6.

B组提升题组

11.C 因为a,b,c成等差数列,所以2b=a+c,

所以=b,所以从第二车间抽取的产品数占抽样产品总数的,根据分层抽样的性质,可知第二车间生产的产品数占总数的,即×3 600=1 200.

12.A 根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d==20的等差数列

{a n},∴a n=8+20(n-1)=20n-12,令751≤20n-12≤1 000,得≤n≤,又∵n∈N*,∴39≤n≤50,∴做问卷C的共有12人,故选A.

13.答案800

解析设样本容量为x,则×1 300=130,

∴x=300.∴A产品和C产品在样本中共有300-130=170(件).设C产品的样本容量为y,则

y+y+10=170,∴y=80.

∴C产品的数量为×80=800(件).

14.答案37

解析因为12=5×2+2,即在第3组中抽出的是第2个学生,所以每一组都应抽出第2个学生,所以第8组中应抽出的号码为5×7+2=37的学生.

15.解析(1)∵抽到持“应该保留”态度的人的概率为0.05,∴=0.05,解得x=60.

∴持“无所谓”态度的人数为3 600-2 100-120-600-60=720,∴应在持“无所谓”态度的人中抽取720×=72(人).

(2)由(1)知持“应该保留”态度的一共有180人,所以在所抽取的6人中,在校学生有×6=4人,社会人士有×6=2人,于是第一组中在校学生人数ξ的可能取值为1,2,3,

P(ξ=1)==,

P(ξ=2)==,

P(ξ=3)==,

ξ的分布列为

所以E(ξ)=1×+2×+3×=2.

2019-2020年高三数学一轮复习第十一章统计统计案例第三节变量间的相关关系统

计案例夯基提能作业本理

1.已知变量x,y之间具有线性相关关系,其散点图如图所示,回归直线l的方程为=x+,则下列说法正确的是( )

A.>0,<0

B.>0,>0

C.<0,<0

D.<0,>0

2.(xx福建,4,5分)为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:

根据上表可得回归直线方程=x+,其中=0.76,=-.据此估计,该社区一户年收入为15万元家庭的年支出为( )

A.11.4万元

B.11.8万元

C.12.0万元

D.12.2万元

3.在西非肆虐的“埃博拉病毒”的传播速度不断加快,这已经成为全球性的威胁.为考察某种埃博拉病毒疫苗的效果,现随机抽取100只小动物进行试验,得到如下列联表:

附表:

其中K2=.

参照附表,下列结论正确的是( )

A.在错误率不超过5%的前提下,可认为“小动物是否被感染与有没有服用疫苗有关”

B.在错误率不超过5%的前提下,可认为“小动物是否被感染与有没有服用疫苗无关”

C.有97.5%的把握认为“小动物是否被感染与有没有服用疫苗有关”

D.有97.5%的把握认为“小动物是否被感染与有没有服用疫苗无关”

4.已知变量x与y之间的回归直线方程为=-3+2x,若x i=17,则y i的值等于( )

A.3

B.4

C.0.4

D.40

5.xx年春节期间,某市物价部门对该市5家商场某商品一天的销售量及售价进行了调查,5家商场的售价x(单位:元)和销售量y(单位:件)之间的一组数据如下表所示:

通过散点图可知,销售量y与售价x之间有较好的线性相关关系,其线性回归方程是=-3.2x+,则的值为.

6.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录进行比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是.

①有95%的把握认为“这种血清能起到预防感冒的作用”;

②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;

③这种血清预防感冒的有效率为95%;

④这种血清预防感冒的有效率为5%.

7.(xx赣中南五校2月联考)心理学家分析发现视觉和空间想象能力与性别有关,某数学兴趣小组为了验证这个结论,从所在学校中按分层抽样的方法抽取50名同学(男30女20),给所有同学几何题和代数题各一题,让各位同学自由选择一道题进行解答.选题情况如下表:(单位:人)

根据以上数据能否判断有97.5%的把握认为视觉和空间想象能力与性别有关? 附表及公式:

K=.

8.某商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:

其中i=1,2,3,4,5,6,7.

(1)以每天进店人数为横轴,每天商品销售件数为纵轴,画出散点图;

(2)求回归直线方程;(结果保留到小数点后两位)

参考数据:x i y i=3 245,=25,=15.43,=5 075,7()2=4 375,7=2 700

(3)预测进店人数为80时商品销售的件数.(结果保留整数)

B组提升题组

9.(xx河南开封一模)下列说法错误的是( )

A.自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系

B.在线性回归分析中,相关系数r的值越大,变量间的相关性越强

C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高

D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好

10.为了解篮球爱好者小李的投篮命中率与打篮球时间之间的关系,下表记录了小李某月1号到5号每天打篮球时间x(单位:小时)与当天投篮命中率y之间的关系:

小李这5天的平均投篮命中率为;用线性回归分析的方法,可预测小李该月6号打6小时篮球的投篮命中率为.

11.(xx河南新乡许昌平顶山二调)某校高二年级共有学生1 000 名,其中走读生750名,住宿生250名,现采用分层抽样的方法从该年级抽取100名学生进行问卷调查,得到这100名学生每天晚上有效学习时间(单位:分钟)的数据,按照以下区间分为八组:①[0,30),②[30,60),③[60,90),④[90,120),……得到频率分布直方图(部分),如图所示.

(1)如果把“学生晚上有效学习时间达到两小时”作为是否充分利用时间的标准,对抽取的100名学生,完成下列2×2列联表,并判断是否有95%的把握认为学生利用时间是否充分与走读、住宿有关;

附:

K=.

(2)若在第①组、第②组、第③组中共抽出3人调查影响有效利用时间的原因,记抽到“有效学习时间少于60分钟”的学生人数为X,求X的分布列和数学期望.

答案全解全析

A组基础题组

1.D 由题图可知,回归直线的斜率是正数,即>0;回归直线在y轴上的截距是负数,即<0,故选D.

2.B 由统计数据表可得==10.0,==8.0,则=8.0-0.76×10.0=0.4,所以回归直线方程为=0.76x+0.4,当

x=15时,=0.76×15+0.4=11.8,故估计年收入为15万元家庭的年支出为11.8万元.故选B.

3.A 由题意得,K2=≈

4.762,结合附表比较得3.841

5.024,所以在错误率不超过5%的前提下,可认为“小动物是否被感染与有没有服用疫苗有关”,故选A.

4.B 依题意有==1.7,而直线=-3+2x一定经过样本点的中心(,),所以=-3+2=-3+2×1.7=0.4,所以

y i=0.4×10=4.

5.答案40

解析由题意可知,==10,==8,故样本点的中心为(10,8),将其代入线性回归方程=-3.2x+,可解得=40. 6.答案①

解析∵3.918≥3.841,P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.

7.解析由2×2列联表中数据得K2的观测值k= =≈5.556>5.024,

所以有97.5%的把握认为视觉和空间想象能力与性别有关.

8.解析(1)散点图如图所示.

(2)因为x i y i=3 245,=25,=15.43,=5 075,

7()2=4 375,7=2 700.

所以=

=-=-4.07,

所以回归直线方程是=0.78x-4.07.

(3)进店人数为80时,商品销售的件数为y=0.78×80-4.07≈58件.

B组提升题组

9.B 根据相关关系的概念知A正确;当r>0时,r越大,相关性越强,当r<0时,r越大,相关性越弱,故B

不正确;对于一组数据拟合程度好坏的评价,一是残差点分布的带状区域越窄,拟合效果越好;二是R2越大,拟合效果越好,所以R2为0.98的模型比R2为0.80的模型拟合的效果好,C,D正确,故选B.

10.答案0.5;0.53

解析这5天的平均投篮命中率=×(0.4+0.5+0.6+0.6+0.4)=0.5.利用相关公式计算易得

=0.01,=0.47,∴线性回归方程为=0.01x+0.47,当x=6时,=0.01×6+0.47=0.53.

11.解析(1)

K=≈5.556.

由于K2>3.841,所以有95%的把握认为学生利用时间是否充分与走读、住宿有关.

(2)设第i组的频率为P i(i=1,2,…,8),则由题图可知,P1=×30=,P2=×30=,P3=×30=,可得第①组1人,第

②组4人,第③组10人.

因为X的所有可能取值为0,1,2,3,

P(X=0)==,

P(X=1)==,

P(X=2)==,

P(X=3)==.

所以X的分布列为

E(X)=0×+1×+2×+3×=1.

相关文档