(2020江西省上饶市一模)在贯彻中共中央、国务院关于精准扶贫政策的过程中,某单位在某市定点帮扶某村100户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标x .将指标x 按照[)0,0.2,[)0.2,0.4,[)0.4,0.6,[)0.6,0.8,[]0.8,1.0分成五组,得到如图所示的频率分布直方图.规定若00.6x ≤<,则认定该户为“绝对贫困户”,否则认定该户为“相对贫困户”;当00.2x ≤<时,认定该户为“亟待帮住户”.工作组又对这100户家庭的受教育水平进行评测,家庭受教育水平记为“良好”与“不好”两种
.
(1)完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:
受教育水平良好
受教育水平不好 总计 绝对贫困户 2
相对贫困户 52
总计
100
(2)上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .
附:()()()()()
2
2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.
()
20P K k ≥
0.15 0.10
0.05 0.025
大题肢解一
统计案例与数学期望
k
2.072 2.706
3.841 5.024
【肢解1】完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:
受教育水平良好
受教育水平不好 总计 绝对贫困户 2
相对贫困户 52
总计
100
【肢解2】上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .
【解析】(1)由题意可知,绝对贫困户有()0.250.500.75++0.210030??=(户),可得出如列联表:
受教育水平良好
受教育水平不好
总计
绝对贫困户 2 28 30 相对贫困户 18 52
70
总计
20
80 100
()
2
2100182825230702080
K ??-?=
??? 4.762 3.841≈>. 故有95%的把握认为绝对贫困户数与受教育水平不好有关.
(2)贫困指标在[)00.4,的贫困户共有()0.250.50.210015+??=(户)
,
“亟待帮助户”共有0. 250.21005??=(户), 依题意X 的可能值为0,1,2,
()2
10215307C P X C =
==,()11
1052
1510121C C P X C ===,()252152
221
C P X C ===, 则X 的分布列为
X
0 1
2
P
37
10
21
221
故31022()012721213
E X =?
+?+?=.
1.独立性检验的一般步骤:
(1)根据样本数据制成2×2列联表; (2)根据公式
K 2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
计算K 2的值;
(3)查表比较K 2与临界值的大小关系,作统计判断. 2.求离散型随机变量ξ的均值与方差的方法:
(1)理解ξ的意义,写出ξ可能取的全部值; (2)求ξ取每个值的概率; (3)写出ξ的分布列; (4)由均值的定义求E (ξ); (5)由方差的定义求D (ξ).
【拓展1】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)
若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?
参考数据:
参考公式:()()()()
2
2
()n ad bc K a b c d a c b d -=++++.
【解析】(1)由统计表可得,低于45岁人数为70人,不低于45岁人数为30人, 可得列联表如下:
于是有K2的观测值2
100(60151510)14.28610.82875257030
k ??-?=
≈???>. 故可以在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关.
【拓展2】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)
(1)若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?
(2)若从年龄在[55,65),[65,75]的样本中各随机选取2人进行座谈,记选中的4人中“使用手机支付”的人数为X ,求随机变量X 的分布列和数学期望.
【解析】由题意可知,X 的所有可能取值为0,1,2,3,相应的概率为:()22
3222531
010C C P X C C ===,
()1122132232222253532
15
C C C C C P X C C C C ==+=,
()1112
2322222222535313230C C C C C P X C C C C ==+=,()21
2222
531
315
C C P X C C ===, 于是X 的分布列为:
所以1213122
()0123105301515
E X =?+?+?+?=
.
1.(2019年湖北模拟)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:
男 女 总计 爱好 40 20 60 不爱好 15 25 40 总计
55
45
100
(1)能否有99%
(2)利用分层抽样的方法从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从
“运动达人社”中选派2人参加某项校际挑战赛,求选出的2人中恰有1名女大学生的概率.
附:
P (K 2≥k 0)
0.050 0.010 0.001 k 0
3.841
6.635
10.828
K 2=
n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,其中n =a +b +c +d .
【解析】(1)因为
K 2=
100×(40×25-20×15)2
55×45×60×40
≈8.249>6.635,
所以有99%的把握认为是否爱好该项运动与性别有关.
(2)由题意,抽取的6人中,有男生4名,分别记为a ,b ,c ,d ;女生2名,分别记为m ,n . 则抽取的结果共有15种:(a ,b ),(a ,c ),(a ,d ),(a ,m ),(a ,n ),(b ,c ),(b ,d ), (b ,m ),(b ,n ),(c ,d ),(c ,m ),(c ,n ),(d ,m ),(d ,n ),(m ,n ),
设“选出的2人中恰有1名女大学生”为事件A ,事件A 所包含的基本事件有8种: (a ,m ),(a ,n ),(b ,m ),(b ,n ),(c ,m ),(c ,n ),(d ,m ),(d ,n ).
则P (A )=815
.
故选出的2人中恰有1名女大学生的概率为8
15
.
2.(2019年湖北省宜昌模拟)某公司招收大学毕业生,经过综合测试录用了14名男生和6名女生,这20名毕业生的测试成绩如茎叶图所示(单位:分).公司规定:成绩在180分以上者到甲部门工作,在180分以下者到乙部门工作,另外只有成绩高于180分的男生才能担任助理工作.
变式训练一
(1)现用分层抽样的方法从甲、乙两部门中选取8人.若从这8人中再选3人,求至少有一人来自甲部门的概率;
(2)若从甲部门中随机选取3人,用X 表示所选人员中能担任助理工作的人数,求X 的分布列及数学期望.
【解析】(1)根据茎叶图可知,甲、乙两部门各有10人,用分层抽样的方法,应从甲、乙两部门中各选取2
1045
?
=人. 记“至少有一人来自甲部门”为事件A ,则()343813
114
C P A C =-=.
故至少有一人来自甲部门的概率为
1314
. (2)由题意可知,X 的可能取值为0,1,2,3.
()()()()03122130646464643333101010101311
0,1,2,3301026
C C C C C C C C P X P X P X P X C C C C ============,
所以X 的分布列为
X 0 1 2 3
P
1
30
310
1
2 16
所以()1301233010265
E X =?+?+?+?=.
(2019河南洛阳市模拟)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A 、B 、C 三个城市进行治霾落实情况抽查.
(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组
大题肢解二
二项分布
给检查到的城市评价为优的概率为1
2,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设
需进行复检的城市的个数为X ,求X 的分布列和期望.
【肢解1】若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;
【肢解2】每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为1
2,若四个专家组均评价为优则检查通过不用复检,否则需进行复
检.设需进行复检的城市的个数为X ,求X 的分布列和期望.
【解析】(1)随机选取,共有34=81种不同方法,
恰有一个城市没有专家组选取的有C 13(C 14A 22+C 24)=42种不同方法,
故恰有一个城市没有专家组选取的概率为4281=1427
.
(2)设事件A :“一个城市需复检”,则P (A )=1-4)2
1(=15
16,X 的所有可能取值为0,1,2,3,
P (X =0)=C 03·3)161(
=14 096,P (X =1)=C 13·3)161(·1)1615(=454 096,P (X =2)=C 23·1)161(
·2)16
15(=6754 096,P (X =3)=C 33·3)16
15(
=3 3754 096. 所以X 的分布列为
X 0 1 2 3 P
14 096
45
4 096
675
4 096
3 375
4 096
由题意知X ~B )16
15
,
3(, 所以E (X )=3×1516=45
16
.
二项分布的期望与方差
如果ξ~B (n ,p ),则用公式E (ξ)=np ;D (ξ)=np (1-p )求解,可大大减少计算量.
1.(2019四川成都诊断)某部门为了解一企业在生产过程中的用水量情况,对其每天的用水量做了记录,得到了大量该企业的日用水量的统计数据,从这些统计数据中随机抽取12天的数据作为样本,得到如图所示的茎叶图(单位:吨).若用水量不低于95吨,则称这一天的用水量超标.
(1)从这12天的数据中随机抽取3个,求至多有1天的 用水量超标的概率;
(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X 为未来这3天中用水量超标的天数,求X 的分布列、数学期望和方差. 【解析】(1)记“从这12天的数据中随机抽取3个,至多有1天的用水量超标”为事件A ,
则P (A )=C 14C 2
8C 312+C 38
C 3
12=168220=4255
.
(2)以这12天的样本数据中用水量超标的频率作为概率,易知用水量超标的概率为3
1
. X 的所有可能取值为0,1,2,3, 易知X ~B )31,3(,P (X =k )=C k 3k
k
-??3)
3
2()3
1(,k =0,1,2,3,
则P (X =0)=827,P (X =1)=49,P (X =2)=29,P (X =3)=1
27.
所以随机变量X 的分布列为
X 0 1 2 3 P
8
27
49
29
127
所以数学期望E (X )=3×13=1,D (X )=3×1
3×)311(-=23
.
2.(2020湖南师范大学附属中学高三上学期第二次月考)某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表:
从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:
变式训练二
(1)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?
(2)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;
(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X近似满足~(218,140)
X N,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?
【解析】(1)根据抽样调查数据,一、二等品所占比例的估计值为0.2000.3000.2600.0900.0250.875
++++=,由于该估计值小于0.92,故不能认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定.
(2)由频率分布直方图知,一、二、三等品的频率分别为0.375、0.5、0.125,故在样本中用分层抽样方法抽取的8件产品中,一等品3件,二等品4件,三等品1件,再从这8件产品中随机抽取4件,一、二、三等品都有的情况有2种:①一等品2件,二等品1件,三等品1件;②一等品1件,二等品2件,三等
品1件,故所求的概率211121 3
41341
4
8
3
7
C C C C C C
P
C
+
==.
(3)“质量提升月”活动前,该企业这种产品的质量指标值的均值约为
1700.0251800.11900.22000.32100.262200.092300.025?+?+?+?+?+?+?
200.4
=
“质量提升月”活动后,产品质量指标值X近似满足()
~218,140
X N,则()218
E X=. 所以,“质量提升月”活动后的质量指标值的均值比活动前大约提升了17.6.
1.(2019云南省高考模拟)一个口袋中装有大小形状完全相同的红色球1个、黄色球2个、蓝色球*
()n n N ∈个,现进行从口袋中摸球的游戏:摸到红球得1分、摸到黄球得2分、摸到蓝球得3分.若从这个口袋中随机的摸出2个球,恰有一个是黄色球的概率是
15
8
. (1)求n 的值;
(2)从口袋中随机摸出2个球,设ξ表示所摸2球的得分之和,求ξ的分布列和数学期望()E ξ.
【解析】(1)由题意有15
82
31
2
11=++n n C C C ,即03522=--n n ,解得3=n ; (2)ξ取值为3,4,5,6.
则11
122
62
(3)15
C C P C ξ===,11213222664(4)15C C C P C C ξ==+=, 11
232
62
(5)5
C C P C ξ===,23261(6)5C P C ξ===, ξ的分布列为:
故242114
()34561515553
E ξ=?
+?+?+?=. 2.(2020福建省厦门外国语学校高三上学期12月月考)自由购是通过自助结算方式购物的一种形式.某大型超市为调查顾客使用自由购的情况,随机抽取了100人,统计结果整理如下:
(1)现随机抽取1名顾客,试估计该顾客年龄在[30,50)且未使用自由购的概率;
(2)从被抽取的年龄在BF 使用自由购的顾客中,随机抽取3人进一步了解情况,用X 表示这3人中年龄在[50,60)的人数,求随机变量X 的分布列及数学期望;
(3)为鼓励顾客使用自由购,该超市拟对使用自由购的顾客赠送1个环保购物袋.若某日该超市预计
有5000人购物,试估计该超市当天至少应准备多少个环保购物袋. 【解析】(1)在随机抽取的100名顾客中, 年龄在[30,50)且未使用自由购的共有3+14=17人,
所以,随机抽取1名顾客,估计该顾客年龄在[30,50)且未使用自由购的概率为17
100
P =. (2)X 所有的可能取值为1,2,3,
()124236115C C P X C ===,()214236325C C P X C ===,()30
423
61
35
C C P X C ===. 所以X 的分布列为
所以X 的数学期望为131
()1232555
E X =?
+?+?=. (3)在随机抽取的100名顾客中,使用自由购的共有3121764244+++++=人, 所以该超市当天至少应准备环保购物袋的个数估计为44
50002200100
?=.
3.(2020广东省惠州市高三第三次调研)为发挥体育核心素养的独特育人价值,越来越多的中学将某些体育项目纳入到学生的必修课程.惠州市某中学计划在高一年级开设游泳课程,为了解学生对游泳的兴趣,某数学研究学习小组随机从该校高一年级学生中抽取了100人进行调查.
(1)已知在被抽取的学生中高一(1)班学生有6名,其中3名对游泳感兴趣,现在从这6名学生中随机抽取3人,求至少有2人对游泳感兴趣的概率;
(2)该研究性学习小组在调查中发现,对游泳感兴趣的学生中有部分曾在市级或市级以上游泳比赛中获奖,具体获奖人数如下表所示.若从高一(8)班和高一(9)班获奖学生中随机各抽取2人进行跟踪调查,记选中的4人中市级以上游泳比赛获奖的人数为ξ,求随机变量ξ的分布列及数学期望.
【解析】(1)记事件i A {=从6名学生抽取的3人中恰好有i 人有兴趣,i 0=,1,2,3}; 则2A 与3A 互斥,
故所求概率为()()()()2323P 2P A A P A P A =+=+至少人感兴趣 2130
33
3333
66
C C C C C C ??=+101202==; (2)由题意知,随机变量ξ的所有可能取值有0,1,2,3;
()22342255C C 9P ξ0C C 50?===?,()11221234342255C C C C C 12P ξ1C C 25??+?===?,()22111
24
324
22
55C C C C C 3P ξ2C C 10?+??===? ()2124
2255C C 1P ξ3C C 25
?===
?. 则ξ的分布列为:
数学期望为()9241526E ξ0123505050505
=?
+?+?+?=. 4.(2019·河北高考模拟)某次招聘分为笔试和面试两个环节,且只有笔试过关者方可进入面试环节,笔试与面试都过关才会被录用.笔试需考完全部三科,且至少有两科优秀才算笔试过关,面试需考完全部两科且两科均为优秀才算面试过关.假设某考生笔试三科每科优秀的概率均为2
3
,面试两科每科优秀的概率均为
34
. (1)求该考生被录用的概率;
(2)设该考生在此次招聘活动中考试的科目总数为ξ,求ξ的分布列与数学期望. 【解析】(1)该考生被录用,说明该考生笔试与面试均得以过关.
所以=P 3223221335[(
)+()]=3334412
C ???. (2)易得ξ的可能取值为3 ,5 ,
所以(=3)=1P ξ-3223221207
[(
)+()]=1-=3332727C ?, 或(=3)=P ξ31231127
()+()=33327
C ? ,
所以20
(=5)=1-(=3)=27
P P ξξ,
或(=5)=P ξ322322120
()+()=33327
C ? ,
ξ的分布列为:
所以720121
()=3+5=
272727
E ξ?
?. 5.(2019江西省新八校联考)某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:
(1)若将频率是为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;(结果用分数表示)
(2)用样本估计总体,果园老板提出两种购销方案给采购商参考, 方案1:不分类卖出,单价为20元/kg . 方案2:分类卖出,分类后的水果售价如下:
从采购单的角度考虑,应该采用哪种方案?
(3)用分层抽样的方法从这100个水果中抽取10个,再从抽取的10个水果中随机抽取3个,X 表示
抽取的是精品果的数量,求X 的分布列及数学期望()E X .
【解析】(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A ,则201
()1005
P A ==, 现有放回地随机抽取4个,设抽到礼品果的个数为X ,则1~(4,)5
X B ,
所以恰好抽到2个礼品果的概率为22244196(2)C ()()55625
P X ===
, (2)设方案2的单价为ξ,则单价的期望值为
134216548848()1618222420.61010101010
E ξ+++=?
+?+?+?==, 因为()20E ξ>,所以从采购商的角度考虑,应该采用第一种方案. (3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个, 现从中抽取3个,则精品果的数量X 服从超几何分布,所有可能的取值为0,1,2,3,
则36
310C 1(0)C 6P X ===;21
643
10C C 1(1)C 2P X ===; 1264
310C C 3(2)C 10P X ===;34310C 1(3)C 30
P X ===
, 所以X 的分布列如下:
所以()01236210305
E X =?+?+?+?=.
6.(2020山西省晋城市高三第一次模拟)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,
这将推动新能源汽车产业的迅速发展.下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:
某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:
(1)求新能源乘用车的销量y 关于年份x 的线性相关系数r ,并判断y 与x 是否线性相关; (2)请将上述22?列联表补充完整,并判断是否有90%的把握认为购车车主是否购置新能源乘用车与性别有关;
(3)若以这30名购车车主中购置新能源乘用车的车主性别比例作为该地区购置新能源乘用车的车主性别比例,从该地区购置新能源乘用车的车主中随机选取50人,记选到女性车主的人数为X,求X 的数学期望与方差.
参考公式:()()
n
i
i
x x y y r --=
∑,2
2
()()()()()
n ad bc k a b c d a c b d -=++++,
其中n a b c d =+++25≈,若0.9r >,则可判断y 与x 线性相关. 附表:
【解析】(1)依题意,20142015201620172018
20165
x ++++=
=,
810132524
165
y ++++=
=,
故
5
1
()()(2)(8)(1)(6)192847i
i
i x x y y =--=-?-+-?-+?+?=∑,
5
2
1
()
411410i
i x x =-=+++=∑,5
21
()643698164254i i y y =-=++++=∑,
则5
()()
0.940.9i
i
x x y y r --=
=
=≈>∑
故y 与x 线性相关.
(2)依题意,完善表格如下:
22
30(18426)15 3.75 2.70620102464
K ??-?===>???
故有90%的把握认为购车车主是否购置新能源乘用车与性别有关. (3)依题意,该地区购置新能源车的车主中女性车主的概率为42
105
=, 则2(50,)5
X B :, 所以2()50205E X =?
=,22
(
)50(1)1255
D X =??-=. 7.(2020云南省昆明市第一中学高三一轮检测)某城市为鼓励人们乘坐地铁出行,地铁公司决定按照乘客经过地铁站的数量实施分段优惠政策,不超过30站的地铁票价如下表:
现有甲、乙两位乘客同时从起点乘坐同一辆地铁,已知他们乘坐地铁都不超过30站,甲、乙乘坐不超过10站的概率分别为
14,13;甲、乙乘坐超过20站的概率分别为12,13
. (1)求甲、乙两人付费相同的概率;
(2)设甲、乙两人所付费用之和为随机变量X ,求X 的分布列和数学期望. 【解析】(1)由题意知甲乘坐超过10站且不超过20站的概率为111
1424
-
-=,
乙乘坐超过10站且不超过20站的概率为1111333
-
-=, 设“甲、乙两人付费相同”为事件A ,则()11114343P A =?+? 1
11
233
+?=,
所以甲、乙两人付费相同的概率是1
3
.
(2)由题意可知X 的所有可能取值为:6,9,12,15,18.
()11164312P X ==?=,()11943P X ==? 111436+?=,()11112432P X ==?+ 1111
3433?+?=,
()11112432P X ==?+ 1134?=,()111
18236
P X ==?=.
因此X 的分布列如下:
X
6
9
12 15
18
P
1
12
16
13
14
16
所以X 的数学期望()1169126E X =?
+? 11121534+?+? 1511864
+?=. 8.(2020东北三省三校联合模拟)“移动支付、高铁、网购、共享单车”被称为中国的“新四大发明”.为了帮助50岁以上的中老年人更快地适应“移动支付”,某机构通过网络组织50岁以上的中老年人学习移动支付相关知识.学习结束后,每人都进行限时答卷,得分都在[]50,100内.在这些答卷(有大量答卷)中,随机抽出200份,统计得分绘出频率分布直方图如图.
(1)求出图中a 的值,并求样本中,答卷成绩在[)80,90上的人数;
(2)以样本的频率为概率,从参加这次答卷的人群中,随机抽取4名,记成绩在80分以上(含80分)的人数为X ,求X 的分布列和期望.
【解析】(1)依题意,()2 376 2101,a a a a a ?++++=故0.005a =, 故成绩在[)80,90上的频率为600.3,a = 答卷成绩在[)80,90上的人数为2000.360; ?=
(2)由样本的频率分布直方图知成绩在80分以上(含80分)的频率为2805
a =, 依题意,24,5X B ??- ???
,
故()04042381055625P X C ????=== ? ?????,()3
1423216155625P X C ????=== ???
????, ()()2
2
4
2
34
42321623962,35562555625
P X C P X C ????????====== ? ? ? ?
????????, ()4442316455625P X C α
????=== ? ?
????
, 所以X 的分布列为
所以X 的数学期望为()28455
E X =?=.