高考理科数学《概率与统计》题型归纳与训练
【题型归纳】
题型一 古典概型与几何概型
例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】
【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为
. 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示:
(1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同;
(2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2)
20
11
. 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为
52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为75
64, ∵
5
2
7564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高.
(2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有
5840155
408
-=
),(),,(),,(),,(),,(),,(),,(),,(),,(),,(),,(1514433323423222413121b a b a b a b a b a b a b a b a b a b a b a 共11个,∴抽取
的两个人恰好对该措施一个赞成一个不赞成的概率20
11=
P . 【易错点】求解古典概型问题的关键:先求出基本事件的总数,再确定所求目标事件包含基本事件的个数,结合古典概型概率公式求解.一般涉及“至多”“至少”等事件的概率计算问题时,可以考虑其对立事件的概率,从而简化运算. 【思维点拨】
1. 求复杂互斥事件概率的方法
一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是
间接法,先求此事件的对立事件的概率,再用公式()()
1P A P A =
-,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.
2.求古典概型的概率的基本步骤:算出所有基本事件的个数;求出事件A 包含的基本事件个数;代入公式,求出()P A ;几何概型的概率是几何度量之比,主要使用面积、体积之比与长度之比. 题型二 统计与统计案例
例1、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:],90,80[,),40,30[),30,20[Λ并整理得到如下频率分布直方图:
(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;
(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间)50,40[内的人数;
(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体
中男生和女生人数的比例.
【答案】(Ⅰ)4.0;(Ⅱ)20;(Ⅲ)2:3.
【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为6.010)04.002.0(=?+,所以样本中分数小于70的频率为4.06.01=-.
(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.
所以总体中分数在区间内的人数估计为. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为6010010)04.002.0(=??+,所以样本中分数不小于70的男生人数为302
1
60=?
.所以样本中的男生人数为60230=?,女生人数为4060100=-,男生和女生人数的比例为2:340:60=,所以根据分层抽样的原理,总体中男生和女生人数的比例估计为2:3. 【易错点】求解统计图表问题,重要的是认真观察图表,发现有用信息和数据.对于频率分布直方图,应注意图中的每一个小矩形的面积是落在该区间上的频率,所有小矩形的面积和为1,当小矩形等高时,说明频率相等,计算时不要漏掉其中一个. 【思维点拨】
1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.
2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.
3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 4.利用频率分布直方图求众数、中位数与平均数
利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.求回归直线方程的关键
①正确理解计算^
^
,a b 的公式和准确的计算.
②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关
(0.010.020.040.02)100.9+++?=[40,50)1001000.955-?-=[40,50)5
40020100
?
=
系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 6.独立性检验的关键
①根据22?列联表准确计算2K ,若22?列联表没有列出来,要先列出此表. ②2K 的观测值k 越大,对应假设事件0H 成立的概率越小,0H 不成立的概率越大. 题型三 概率、随机变量及其分布
例1、“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕, 市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,
(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);
(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求
落在内的概率;
②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.
附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为; ②若,则, .
【答案】(1) (2) (3)的分布列为
;.
【解析】(1)所抽取的100包速冻水饺该项质量指标值的样本平均数为
A x Z (
)2
,N μσ
Z ()14.55,38.45()10,30X X 11.95σ=≈(
)2
~,Z N μσ
()0.6826P Z μσμσ-<≤+=(22)0.9544P Z μσμσ-<≤+=26.5x =0.6826X ()2E X =x
.
(2)①∵服从正态分布,且, ,
∴, ∴落在内的概率是. ②根据题意得, ; ; ; ; . ∴的分布列为
∴. 50.1150.2250.3350.25450.1526.5x =?+?+?+?+?=Z (
)2
,N μσ
26.5μ=11.95σ≈(14.5538.45)(26.511.9526.511.95)0.6826P Z P Z <<=-<<+=Z ()14.55,38.450.68261~4,
2X B ?? ???
()4
04110216P X C ??=== ???()4
1411124P X C ??=== ???()4
2413228P X C ??=== ???()4
34
11324P X C ??=== ???()4
44114216P X C ??=== ?
??
X ()1
422
E X =?
=
【思维点拨】
1.条件概率的两种求解方法: (2)基本事件法,借助古典概型概率公式,先求事件A 包含的基本事件数)(A n ,再求事件AB 所包含的基本事件数()AB n ,得)
()
()|(A n AB n A B P =. 2.判断相互独立事件的三种常用方法:
(1)利用定义,事件B A ,相互独立?)()()(B P A P AB P ?=.
(2)利用性质,A 与B 相互独立,则A 与A B ,与B ,B A 与也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.
3. 求离散型随机变量的分布列,首先要根据具体情况确定X 的取值情况,然后利用排列、组合与概率知识求出X 取各个值的概率.
4. 利用独立重复试验概率公式可以简化求概率的过程,但需要注意检验该概率模型是否满足公式
k n k k n p p C k X P --==)1()(的三个条件:(1)在一次试验中某事件A 发生的概率是一个常数p ;(2)n 次试
验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n 次试验中事件A 恰好发生了k 次的概率.
5. 求离散型随机变量的均值与方差的基本方法有:
(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;
(2)已知随机变量X 的均值、方差,求X 的线性函数b aX Y +=的均值、方差,可直接用均值、方差的性质求解,即b X aE b aX E +=+)()(,)()(2
X D a b aX D =+(b a ,为常数).
(3)如能分析所给随机变量服从常用的分布,可直接利用它们的均值、方差公式求解,即若X 服从两点分布,则p X E =)(,)1()(p p X D -=;若),(~p n B X ,则np X E =)(,)1()(p np X D -=.
【巩固训练】
题型一 古典概型与几何概型
1.已知,,则函数在区间上为增函数的概率是( )
A .
B .
C .
D . {}0 1 2a ∈,,{}1 1 3 5b ∈-,,,()22f x ax bx =-()1 +∞,51213
141
6
【答案】A
【解析】①当时,,情况为符合要求的只有一种; ②当时,则讨论二次函数的对称轴要满足题意则产生的情况表示: ,8种情况满足的只有4种; 综上所述得:使得函数在区间为增函数的概率为:125
1214=
+=P .
2.在区间上任取一数,则的概率是( )
A .
B .
C .
D . 【答案】C
【解析】由题设可得,即;所以,则由几何概型的概率公式.故应选C .
(1)估计该公司一位会员至少消费两次的概率;
(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;
(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出
2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.
【答案】(1) 0.4;(2) 45;(3)
7
4. 【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为
0a =()2f x bx =- 1 1 3 5b =-,
,,1b =-0a ≠22b b x a a -=-
=1b
a
≤() a b ,
()()()1 1 1 1 1 3-,
,,,,()()()()()1 5 2 1 2 1 2 3 2 5-,,,,,,,,,()22f x ax bx =-()1 +∞,()0,4x 1
22
4x -<<1213143
4
211<- 1 =P 考向二 统计与统计案例 1.为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下: 现从所有试验动物中任取一只, (Ⅰ)求列联表中的数据,,,的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效? 22?x y A B 【答案】(Ⅰ),,,;(Ⅱ)详见解析;(Ⅲ)至少有%9.99的把握认为疫苗有效. 【解析】(Ⅰ)设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件A, 由已知得,所以,,,. 发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率. 10y =40B =40x =60A =302 ()1005 y P A += =10y =40B =40x =60A =未注射 注射 . 所以至少有%9.99的把握认为疫苗有效. 2.在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在市的区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记表示在各区开设分店的个数, 表示这个分店的年收入之和. (Ⅰ)该公司已经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程; (Ⅱ)假设该公司在区获得的总年利润(单位:百万元)与之间的关系为,请结合(Ⅰ)中的线性回归方程,估算该公司应在区开设多少个分店,才能使区平均每个分店的年利润最大? 参考公式: , , . 【答案】(1);(2)公司应在区开设4个分店,才能使区平均每个分店的年利润最大. 【解析】(1)100 85 ) () )(() (,4,42 1 1 2 1 2 1^ =---= --= ==∑∑∑∑====x x y y x x x n x y x n y x b y x n i i n i i i n i i n i i i Θ,6.0^^=-=x b y a , ∴y 关于x 的线性回归方程6.085.0+=x y . (2) , 区平均每个分店的年利润 , ∴时, 取得最大值, 故该公司应在区开设4个分店,才能使区平均每个分店的年利润最大. 10000005016.6710.8285020603=≈>??S A x y x y x y x A z ,x y 2 0.05 1.4z y x =--A A y b x a ∧∧∧=+122 1n i i i n i i x y nxy b x nx ∧ ==-= =-∑∑()()() 1 2 1 n i i i n i i x x y y x x ==---∑∑a y b x ∧ ∧ =-0.850.6y x =+A A 2 0.05 1.4z y x =--=20.050.850.8x x -+-A 0.80.050.85z t x x x = =--+800.0150.85x x ? ?=-++ ?? ?4x =t A A 3. 某商场对商品30天的日销售量y (件)与时间t (天)的销售情况进行整理,得到如下数据,经统计分析,日销售量y (件)与时间t (天)之间具有线性相关关系. (1)请根据表中提供的数据,用最小二乘法求出y 关于t 的线性回归方程a t b y +=. (2)已知商品30天内的销售价格z (元)与时间t(天)的关系为,) ,200(,20) ,3020(,100?? ?∈<<+∈≤≤+-=N t t t N t t t z 根据(1) 中求出的线性回归方程,预测t 为何值时,商品的日销售额最大.参考公式:2 1 21^ )(t n t y t n y t b n i i n i i i --= ∑∑==, t b y a ^ ^-=. 【答案】(1)40^ +-=t y ;(2)预测当20=t 时,商品的日销售额最大,最大值为1600元. 【解析】(1)根据题意,6)108642(51=++++?= t ,34)3033323738(5 1 =++++?=y , 98030103383263743825 1 =?+?+?+?+?=∑=i i i y t ,220108642222225 1 2 =++++=∑=i i t , 所以回归系数为16 52203465980)(2 2 1 21 ^ -=?-??-=--= ∑∑==t n t y t n y t b n i i n i i i , 406)1(34^ ^=?--=-=t b y a , 故所求的线性回归方程为40^ +-=t y . (2)由题意得日销售额为,,3020),40)(100(,200),40)(20(?? ?∈≤≤+-+-∈<<+-+=N t t t t N t t t t L 当N t t ∈<<,200时,900)10(80020)40)(20(2 2 +--=++-=+-+=t t t t t L , 所以当;90010max ==L t 时, 当N t t ∈≤≤,3020时,900)70(4000140)40)(100(2 2 --=+-=+-+-=t t t t t L , 所以当.160020max ==L t 时, 综上所述,预测当20=t 时,A 商品的日销售额最大,最大值为1600元. 题型三 概率、随机变量及其分布 A A A A 1.在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者654321,,,,,A A A A A A 和4名女志愿者 4321,,,B B B B ,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示. (I )求接受甲种心理暗示的志愿者中包含1A 但不包含的频率。 (II )用X 表示接受乙种心理暗示的女志愿者人数,求X 的分布列与数学期望EX. 【答案】(I ) (II)X 的分布列为 X 的数学期望是. 【解析】(I )记接受甲种心理暗示的志愿者中包含1A 但不包含1B 的事件为M ,则18 5 )(51048==C C M P ; (II)由题意知X 可取的值为:4,3,2,1,0,则421 )0(51056===C C X P ,215)1(5 101446===C C C X P , 2110)2(5102436===C C C X P ,215)3(5103426===C C C X P ,42 1 )4(5104 416===C C C X P , 因此X 的分布列为 X 的数学期望是 = 2.某市医疗保险实行定点医疗制度,按照“就近就医、方便管理” 的原则,规定参加保险人员可自主选择 1B 5 .18 2EX =0(0)1(1)2(2)3(3)4(4)EX P X P X P X P X P X =?=+?=+?=+?=+?=151******** 2.4221212142 ? +?+?+?+?= 四家医疗保险定点医院和一家社区医院作为就诊的医疗机构.若甲、乙、丙、丁4名参加保险人员所在地区 附近有三家社区医院,并且他们的选择是等可能的、相互独立的. (1)求甲、乙两人都选择社区医院的概率; (2)求甲、乙两人不选择同一家社区医院的概率; (3)设在4名参加保险人员中选择社区医院的人数为,求的分布列和数学期望及方差. 【答案】(1) ;(2) ;(3)答案见解析. 【解析】(1)设“甲、乙两人都选择社区医院”为时间A ,那么9 1 3131)(=?=A P ,所以甲、乙两人都选择社区医院的概率为 . (2) 设“甲、乙两人选择同一家社区医院”为事件B ,那么3 1 3131)(1 3=? ?=C B P ,所以甲、乙两人不选择同一家社区医院的概率3 2 )(1)(= -=B P B P . 依题意)3 1,4(~B ξ,所以812)32()31()(4444k k k k k C C k P --?=??==ξ. 故的分布列为 所以的数学期望334)(=? =ξE ,方差9 )31(34)(=-??=ξD . 3.袋中有大小相同的3个红球和2个白球,现从袋中每次取出一个球,若取出的是红球,则放回袋中,继续取一个球,若取出的是白球,则不放回,再从袋中取一球,直到取出两个白球或者取球5次,则停止取球,设取球次数为, (1)求取球3次则停止取球的概率; (2)求随机变量的分布列. 【答案】(1) ;(2)见解析. A B C 、、A A ξξ192 3 A A 19 ξξX X 27 200 【解析】(1)记“取球3次停止”为事件, 则; (3)由题意,可能的取值为5,4,3,2,1014152)2(=?= =X P ;200 27 )3(= =X P ; ;4000 549 414343524143525341525353)4(=???+???+???==X P ,4000 2511 )4()3()2(1)5(==-=-=-==X P X P X P X P 其分布表如下: A ()32123127 (554544200) P A =+=X X