概率与统计
1.[河南省新乡市高三第一次模拟考试(理科数学)]某地有两个国家AAAA级景区—甲景区和乙景区.相关部门统计了这两个景区2019年1月至6月的客流量(单位:百人),得到如图所示的茎叶图.关于2019年1月至6月这两个景区的客流量,下列结论正确的是
A.甲景区客流量的中位数为13000
B.乙景区客流量的中位数为13000
C.甲景区客流量的平均值比乙景区客流量的平均值小
D.甲景区客流量的极差比乙景区客流量的极差大
【答案】D
【解析】
2.[四川省成都外国语学校2019-2020学年高三(上)期中数学试卷(理科)]某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是
注:90后指1990年及以后出生,80后指19801989
年之间出生,80前指1979年及以前出生.
A.互联网行业从业人员中90后占一半以上
B .互联网行业中从事技术岗位的人数超过总人数的20%
C .互联网行业中从事运营岗位的人数90后比80前多
D .互联网行业中从事技术岗位的人数90后比80后多 【答案】D 【解析】 【分析】
结合两图对每一个选项逐一分析得解.
【详解】对于选项A ,互联网行业从业人员中90后占56%,占一半以上,所以该选项正确; 对于选项B ,互联网行业中90后从事技术岗位的人数占总人数的39.6%56%=22.176%?,超过总人数的20%,所以该选项正确;
对于选项C ,互联网行业中从事运营岗位的人数90后占总人数的56%17%9.52%?=,比80前多,所以该选项正确;
对于选项D ,互联网行业中从事运营岗位的人数90后占总人数的56%17%9.52%?=,80后占总人数的41%,所以互联网行业中从事运营岗位的人数90后不一定比80后多,所以该选项不一定正确. 故选D.
【点睛】本题主要考查饼状图和条形图,意在考查学生对这些知识的理解掌握水平和分析推理能力.
3.[福建省永春第一中学2020届高三上学期期初考试数学(理)试题] 某小区有1000户,各
户每月的用电量近似服从正态分布(300,100)N ,则用电量在320度以上的户数估计约为 【参考数据:若随机变量ξ服从正态分布2(,)N μσ,则()68.26%P μσξμσ-<<+=,
(22)95.44%P μσξμσ-<<+=,(33)99.74%P μσξμσ-<<+=】 A .17 B .23 C .34 D .46
【答案】B
4.[广东省三校(广州真光中学、深圳市第二中学、珠海市第二中学)2020届高三上学期第一次联考数学(理)试题]已知某离散型随机变量X 的分布列为
X 0 1 2 3
则X 的数学期望()E X =
A .23
B .1
C .32
D .2
【答案】B
5.[湖北省武汉市部分学校2020届高三上学期起点质量监测数学(理)试题]圆周率π是一个在数学及物理学中普遍存在的数学常数,它既常用又神秘,古今中外很多数学家曾研究它的计算方法.下面做一个游戏:让大家各自随意写下两个小于1的正数然后请他们各自检查一下,所得的两数与1是否能构成一个锐角三角形的三边,最后把结论告诉你,只需将每个人的结论记录下来就能算出圆周率的近似值.假设有n 个人说“能”,而有m 个人说“不能”,那么应用你学过的知识可算得圆周率π的近似值为
A .m
m n + B .
n
m n + C .4m m n
+
D .4n m n
+
【答案】C 【解析】 【分析】
把每一个所写两数作为一个点的坐标,由题意可得与1不能构成一个锐角三角形是指两个
数构成点的坐标在圆221x y +=内,进一步得到2
1
1411+m m n π?=?,则答案可求. 【详解】
总人数为+m n ,写出的+m n 组数可以看作是+m n 个点,
满足与1不能构成一个锐角三角形是指两个数构成的坐标在圆221x y +=内,
则2
1
π1411+m
m n ?=
?,即4π+m m n =. 故选C.
本题是古典概型和几何概型的实际应用,是一道中等难度的题目.
6.[福建省永春第一中学2020届高三上学期期初考试数学(理)试题] 某学校课题组为了研
究学生的数学成绩和物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(百分制)如下表所示:
序号 1 2
3
4
5
6
7
8 9 10 11 12 13 14 15 16 17 18 19 20
数学
成绩 95 75 80 94 92 65 67
84
98 71 67 93 64 78 77 90 57 83 72 83 物理
成绩
90 63 72 87 91 71 58 82 93 81 77 82 48 85 69 91 61 84 78 86
若数学成绩90分(含90分)以上为优秀,物理成绩85(含85分)以上为优秀。有多少把握认为学生的数学成绩与物理成绩之间有关系 A .99.5% B .99.9% C .97.5% D .95%
【答案】A
7.[湖北省武汉市部分学校2020届高三上学期起点质量监测数学(理)试题]设同时抛掷两个质地均匀的四面分别标有1,2,3,4的正四面体一次.记事件A ={第一个四面体向下的一面出现偶数};事件B ={第二个四面体向下的一面出现奇数};C ={两个四面体向下的一面或者同时出现奇数或者同时出现偶数}.给出下列说法: ①()()()P A P B P C ==; ②()()()P AB P AC P BC ==; ③1()8
P ABC =
; ④1
()()()8
P A P B P C =,
其中正确的有 A .0个 B .1个 C .2个
D .3个
【答案】D 【解析】
由题可知111
(),(),()222
P A P B P C ===,且()()()P AB P A P B =,可求①②④,然后事件,,A B C
不可能同时发生,则()0P ABC =. 【详解】
111
(),(),()222P A P B P C ===,故①④对,
111111111
(),(),()224224224
P AB P AC P BC =?==?==?=,故②对,
事件,,A B C 不可能同时发生,()0P ABC =,故③错, 故选D. 【点睛】
本题考查事件同时发生的概率问题,是一道中等难度的题目. 8.[辽宁省本溪高级中学2020届高三一模考试数学(理)试卷]
【答案】A
9.[安徽省合肥一中、安庆一中等六校教育研究会2020届高三上学期第一次素质测试数学(理)试题]4名高三学生准备高考后到上海市、江苏省、浙江省、安徽省四个地方旅游, 假设每
名同学均从这四个地方中任意选取一个去旅游,则恰有一个地方未被选中的概率为
A.27
64
B.
9
16
C.81
256
D.
7
16
【答案】B
【解析】
【分析】
根据排列组合的知识分别求解出恰有一个地方未被选中的情况和所有情况,利用古典概型计算可得结果.
【详解】
4名同学去旅游的所有情况有:44256
=种,
恰有一个地方未被选中共有:
21
13
42
43
2
2
C C
C A144
A
??=种情况,
∴恰有一个地方未被选中的概率:
1449
25616
p==.
故选B.
【点睛】
本题考查古典概型计算概率的问题、排列组合中的分组分配问题;关键是能够利用排列组合的知识准确求解出恰有一个地方未被选中的情况种数;易错点是忽略了分组分配中的平均分配问题.
10.[江苏省南通市2020届高三第一学期期末考试第一次南通名师模拟试卷数学试题]甲、乙两人下棋,结果是一人获胜或下成和棋.已知甲不输的概率为0.8,乙不输的概率为0.7,则两人下成和棋的概率为▲.
【答案】0.5
11.[江苏省南通市2020届高三第一学期期末考试第一次南通名师模拟试卷数学试题] 工人甲在某周五天的时间内,每天加工零件的个数用茎叶图表示如下图(左边一列的数字表示零件个数的十位数,右边的数字表示零件个数的个位数),则该组数据的方差2s的值为▲.
187
2212
【答案】22
5
【解析】由茎叶图可以得到样本的平均值20
x
=,所以
()()()()()
22222
2
1820172022202120222022
55
s
-+-+-+-+-
==.
12.[辽宁省本溪高级中学2020届高三一模考试数学(理)试卷]
【解析】(Ⅰ)设“随机抽取2名,其中恰有一名学生不近视”为事件A,则
11
31
2
4
C C1
()
C2
P A==,
故随机抽取2名,其中恰有一名学生不近视的概率为
1
2
.
(Ⅱ)根据以上数据得到列联表:
近视不近视
足够的户外暴露时40 60
间
不足够的户外暴露
时间
60 40
所以2
K的观测值
2
200(40406060)
8.000 6.635
(4060)(6040)(4060)(6040)
k
??-?
==>
++++
,
故能在犯错误的概率不超过0.01的前提下认为不足够的户外暴露时间与近视有关系. 13.[江西省宜春市上高二中2020届高三上学期第三次月考数学(理)试题]
14.[四川省成都外国语学校2019-2020学年高三(上)期中数学试卷(理科)]自由购是通过自助结算方式购物的一种形式.某大型超市为调查顾客使用自由购的情况,随机抽取了100人,统计结果整理如下:
20以下[20,30) [30,40) [40,50) [50,60) [60,70]
70以
上
使用人
数
3 12 17 6
4 2 0
未使用
人数
0 0 3 14 36 3 0
(1)现随机抽取1名顾客,试估计该顾客年龄在[30,50)且未使用自由购的概率;
(2)从被抽取的年龄在[50,70]使用自由购的顾客中,随机抽取3人进一步了解情况,用X 表示这3人中年龄在[50,60)的人数,求随机变量X的分布列及数学期望;
(3)为鼓励顾客使用自由购,该超市拟对使用自由购的顾客赠送1个环保购物袋.若某日该超市预计有5000人购物,试估计该超市当天至少应准备多少个环保购物袋. 【解析】 【分析】
(1)随机抽取的100名顾客中,年龄在[30,50)且未使用自由购的有3+14=17人,由概率公式即可得到所求值;
(2)X 所有的可能取值为1,2,3,求出相应的概率值,即可得到分布列与期望; (3)随机抽取的100名顾客中,使用自由购的有44人,计算可得所求值.
【详解】(1)在随机抽取的100名顾客中,年龄在[30,50)且未使用自由购的共有3+14=17人,
所以,随机抽取1名顾客,估计该顾客年龄在[30,50)且未使用自由购的概率为17
100
P =
. (2)X 所有的可能取值为1,2,3,()12
423
61
15C C P X C ===, ()214236325C C P X C ===,()30
423
61
35
C C P X C ===. 所以X 的分布列为
X
1
2 3
P
15
15
所以X 的数学期望为131
1232555
EX =?+?+?=.
(3)在随机抽取的100名顾客中,
使用自由购的共有3121764244+++++=人, 所以该超市当天至少应准备环保购物袋的个数估计为
44
50002200100
?=. 【点睛】本题考查统计表,随机变量X 的分布列及数学期望,以及古典概型,比较综合. 15.[安徽省2020届高三期末预热联考理科数学]
16.[福建省永春第一中学2020届高三上学期期初考试数学(理)试题] 有一批货物需要用汽车从生产商所在城市甲运至销售商所在城市乙,已知从城市甲到城市乙只有两条公路,且通过这两条公路所用的时间互不影响.据调查统计,通过这两条公路从城市甲到城市乙的200辆汽车所用时间的频数分布如下表:
所用的时间(天数) 10 11 12 13
通过公路l的频数20 40 20 20
通过公路2的频数10 40 40 10
假设汽车A只能在约定日期(某月某日)的前11天出发,汽车B只能在约定日期的前12
天出发(将频率视为概率).
(1)为了尽最大可能在各自允许的时间内将货物运往城市乙,估计汽车A 和汽车B 应如何选择各自的路径;[
(2)若通过公路l 、公路2的“一次性费用”分别为3.2万元、1.6万元(其他费用忽略不计),此项费用由生产商承担.如果生产商恰能在约定日期当天将货物送到,则销售商一次性支付给生产商40万元,若在约定日期前送到;每提前一天销售商将多支付给生产商2万元;若在约定日期后送到,每迟到一天,生产商将支付给销售商2万元.如果汽车
A ,
B 按(1)中所选路径运输货物,试比较哪辆汽车为生产商获得的毛利润更大. 【解析】(1)频率分布表如下:
所有的时间(天数) 10 11 12 13 通过公路1的频率 0.2 0.4 0.2 0.2 通过公路2的频率
0.1
0.4
0.4
0.1
设12,A A 分别表示汽车A 在约定日期前11天出发选择公路1,2将货物运往城市乙;
12,B B 分别表示汽车B 在约定日期前12天出发选择公路1,2将货物运往城市乙;
1()0.20.40.6P A =+=;2()0.10.40.5P A =+=;
8.02.04.02.0)(1=++=B P ;2()0.10.40.40.9P B =++=;
所以汽车A 选择公路1,汽车B 选择公路2。
(2)设X 表示汽车A 选择公路1时,销售商付给生产商的费用,则X 的所有可能取值有42,40,38,36,则X 的分布列如下:
X 42 40 38 36 P
0.2
0.4
0.2
0.2
420.2400.4380.2360.239.2EX =?+?+?+?=.
∴汽车A 选择公路1的毛利润是39.2 3.236-=(万元).
设Y 表示汽车B 选择公路2时,销售商付给生产商的费用,则Y 的所有可能取值有42,40,38,36,则X 的分布列如下:
X 44 42 40 38 P
0.1
0.4
0.4
0.1
440.1420.4400.4380.141EX =?+?+?+?=,
∴汽车B 选择公路2的毛利润是41 1.639.4-=(万元), ∵36.039.4<,
汽车B 为生产商获得的毛利更大.
17.[四川省宜宾市第四中学高2020届一诊模拟考试理科数学]某市教育部门为了解全市高三
学生的身高发育情况,从本市全体高三学生中随机抽取了100人的身高数据进行统计分析.经数据处理后,得到了如下图1所示的频事分布直方图,并发现这100名学生中,身高不低于1.69米的学生只有16名,其身高茎叶图如下图2所示,用样本的身高频率估计该市高一学生的身高概率.
(1)求该市高三学生身高高于1.70米的概率,并求图1中a 、b 、c 的值.
(2)若从该市高三学生中随机选取3名学生,记ξ为身高在(]1.50,1.70的学生人数,求ξ的分布列和数学期望;
(3)若变量S 满足()0.6826P S μσμσ-<≤+>且(22)09544P S μσμσ-<≤+>.
,则称变量S 满足近似于正态分布()2
,N μσ
的概率分布.如果该市高三学生的身高满足近似于正
态分布()1.6,0.01N 的概率分布,则认为该市高三学生的身高发育总体是正常的.试判断该市高三学生的身高发育总体是否正常,并说明理由.
【解析】(1)由图2可知,100名样本学生中身高高于1.70米共有15名, 以样本的频率估计总体的概率,可得这批学生的身高高于1.70的概率为0.15. 记X 为学生的身高,结合图1可得:
2
(1.30 1.40)(1.80 1.90)0.02100f X f X <≤=<≤=
=, 13
(1.40 1.50)(1.70 1.80)0.13100f X f X <≤=<≤==,
()1
(1.50 1.60)(1.60 1.70)120.0220.130.352
f X f X <≤=<≤=
-?-?=, 又由于组距为0.1,
所以0.2a =, 1.3b =, 3.5c =. (2)以样本的频率估计总体的概率,
可知从这批学生中随机选取1名,身高在[]1.50,1.70的概率为
(1.50 1.70)(1.50 1.60)(1.60 1.70)0.7P X f X f X <≤=<≤+<≤=,
因为从这批学生中随机选取3名,相当于三次重复独立试验, 所以随机变量ξ服从二项分布()3,0.7B ,
分布列为:()()33C 0.30.70,1,2,3n n n
P n n ξ-==??=,
ξ
0 1 2 3 ()P ξ
0.027
0.189
0.441
0.343
()00.02710.18920.44130.343 2.1E ξ=?+?+?+?=(或()30.7 2.1E ξ=?=). (3)由()1.6,0.01N ,取 1.60μ=,0.1σ=,
由(2)可知,()
2(1.70 1.80) 1.50 1.70)0.960.9544f X P X =?<≤+<≤=>(,
所以这批学生的身高满足近似于正态分布()1.6,0.01N 的概率分布,应该认为该市高一学生的身高发育总体是正常的.
18.[【全国百强校首发】四川省棠湖中学2020届高三一诊模拟考试数学(理)试题] 为降低
空气污染,提高环境质量,政府决定对汽车尾气进行整治.某厂家生产甲、乙两种不同型号的汽车尾气净化器,为保证净化器的质量,分别从甲、乙两种型号的净化器中随机抽取100件作为样本进行产品性能质量评估,评估综合得分m 都在区间[70,95].已知评估综合得分与产品等级如下表:
根据评估综合得分,统计整理得到了甲型号的样本频数分布表和乙型号的样本频率分布直方图(图表如下).
甲型 乙型
(1)从厂家生产的乙型净化器中随机抽取一件,估计这件产品为二级品的概率; (2)从厂家生产的乙型净化器中随机抽取3件,设随机变量X 为其中二级品的个数,求X 的分布列和数学期望;
(3)根据图表数据,请自定标准,对甲、乙两种型号汽车尾气净化器的优劣情况进行比较.
【解析】(1)设“从厂家生产的乙型净化器中随机抽取一件,这件产品为二级品”为事件A ,
由图可得()(0.020.03)50.25P A =+?=. (2)X 的可能取值为0,1,2,3,
()003313270()()4464P X C ===,()112313271()()4464P X C ===,
()22131392()()4464P X C ===,()330
31313()()4464P X C ===,
所以X 的分布列为
X
0[
1
2
3
P
2764
2764
964
方法一:()27279130123646464644
E X =?
+?+?+?=. 方法二:X 服从二项分布(3,0.25)X B :,所以()30.250.75E X np ==?=.
(3)答案不唯一,只要有数据支撑,言之有理可得分(下面给出两种参考答案). ①可根据三级品率进行比较,由图表可知甲型产品三等品概率为0,乙型三等品概率0.05,所以可以认为甲型产品的质量更好;
②可根据一级品率进行比较,由图表可知甲型产品一等品概率为0.6,乙型一等品概率为0.7,所以可以认为乙型产品的质量更好.
19.[安徽省合肥一中、安庆一中等六校教育研究会2020届高三上学期第一次素质测试数学(理)
试题] 从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:
(1)求这500件产品质量指标值的样本平均数x 和样本方差2s (同一组数据用该区间的中点值作代表,记作i x ,1,2,,7i =L );
(2)由频率分布直方图可以认为,这种产品的质量指标值X 服从正态分布()2
,N μσ,其
中μ近似为样本平均数x ,2σ近似为样本方差2s .
(i )若使84.14%的产品的质量指标值高于企业制定的合格标准,则合格标准的质量指标值大约为多少?
(ii )若该企业又生产了这种产品1000件,且每件产品相互独立,则这1000件产品质量指标值不低于12.14的件数最有可能是多少?
附参考数据与公式:()
1
2
7
3.46i i i x h x =-=∑,2
13.46 2.632≈?;
若()
2
~,x N μσ,则①()0.6827P x μσμσ-<≤-=;②()220.9545P x μσμσ-<≤+=;
③()330.9973P X μσμσ-<≤+=. 【解析】 【分析】
(1)根据频率分布直方图估计平均数的方法可直接求得x ;利用方差计算公式
()
7
2
2
12i i i s x x h ==-?∑可求得样本方差;(2)(i )根据3σ原则可验证出()0.8414P x μσ>-≈,
求得14.77μσ-=,即为结果;(ii )根据3σ原则可得到()12.140.9773P x ≥≈,从而得到
这100产品的质量指标值不低于12.14的件数ξ服从于()3
10,B p ,0.9773p =;根据二项分
布概率公式构造不等式
()
()
11P k P k ξξ=>=-,解不等式可求得978.2773k <,从而可得结果. 【详解】
(1)120.04140.12160.28180.36200.10220.06240.0417.4x =?+?+?+?+?+?+?=,
()
7
2
2
12 3.462 6.92i i i s x x
h ==-?=?=∑.
(2)由题意知:()~17.4,692X N , (i )()10.68270.841422
P x μσ>-=
+≈, ∴17.4 2.6314.77μσ-=-=时,满足题意, 即合格标准的质量指标值约为14.77; (ii )由()()0.9545
12.1420.50.97732
P x P X μσ≥=≥-=+
≈, 可知每件产品的质量指标值不低于12.14的事件概率为0.9733, 记这100产品的质量指标值不低于12.14的件数为ξ,
则()3
~10,B p ξ,其中0.9773p =,
∴恰有k 件产品的质量指标值不低于12.14的事件概率:()()
33
1010C
1k
k k
P k p p ξ-==-,
则()()()()10011
11P k k p P k k p ξξ=-?=>=-?-,解得:1001978.2773k p <=,
∴当0978k ≤≤时,()()1P k P k ξξ=-<=;
当9791000k ≤≤时,()()1P k P k ξξ=->=,
由此可知,在这1000件产品中,质量指标值不低于12.14的件数最有可能是978. 【点睛】
本题考查利用频率分布直方图估计总体的数据特征、正态分布的实际应用等知识,重点考查正态分布中3σ原则的具体应用;关键是能够结合正态分布曲线的特点得到所求区间所对应的概率.
20.[湖北省武汉市部分学校2020届高三上学期起点质量监测数学(理)试题] 武汉又称江城,
是湖北省省会城市,被誉为中部地区中心城市,它不仅有着深厚的历史积淀与丰富的民俗文化,更有着众多名胜古迹与旅游景点,每年来武汉参观旅游的人数不胜数,其中黄鹤楼与东湖被称为两张名片为合理配置旅游资源,现对已游览黄鹤楼景点的游客进行随机问卷调查,若不游玩东湖记1分,若继续游玩东湖记2分,每位游客选择是否游览东湖景点的
概率均为1
2
,游客之间选择意愿相互独立.
(1)从游客中随机抽取3人,记总得分为随机变量X ,求X 的分布列与数学期望; (2)(i )若从游客中随机抽取m 人,记总分恰为m 分的概率为m A ,求数列{}m A 的前10项和;
(ⅱ)在对所有游客进行随机问卷调查过程中,记已调查过的累计得分恰为n 分的概率为
n B ,探讨n B 与1n B -之间的关系,并求数列{}n B 的通项公式.
【解析】 【分析】
(1)判断出X 可能取值为3,4,5,6,分别求出概率,进而求出其数学期望; (2)(i )由题可得首项为
12,公比为1
2
的等比数列,并求其前10项和;(ⅱ)根据n B 与1n B -
之间的关系11
12n n B B --=,用待定系数法得1212323n n B B -??-=-- ???
,进一步就可求出{}n B 的
通项公式. 【详解】
解:(1)X 可能取值为3,4,5,6.
3
11(3)28P X ??=== ???,3
1313(4)C 28P X ??=== ???,3
2313(5)C 28P X ??=== ?
??,333
11
(6)C 28
P X ??=== ???.
∴X 的分布列为
∴3456 4.58888
EX =?+?+?+?=.
(2)(i )总分恰为m 分的概率为12m
m A ??
= ???
,
∴数列{}m A 是首项为
12,公比为1
2
的等比数列, 前10项和10101111023
221102412
S ??- ?
??==
-. (ⅱ)已调查过的累计得分恰为n 分的概率为n B ,得不到n 分的情况只有先得1n -分,再得2
分,概率为112n B -,11
2B =.
所以1112n n B B --=,即11
12
n n B B -=-+
∴1212323n n B B -??-
=-- ???
.