文档库 最新最全的文档下载
当前位置:文档库 › 统计、统计案例-高考文科数学通用讲义

统计、统计案例-高考文科数学通用讲义

统计、统计案例-高考文科数学通用讲义
统计、统计案例-高考文科数学通用讲义

重点增分专题十一 统计、统计案例

[全国卷3年考情分析]

(1)统计与统计案例在选择题或填空题中的命题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在2~4题的位置.

(2)统计与统计案例在解答题中多出现在第18或19题位置,考查茎叶图、直方图、数字特征及统计案例,多以计算为主.

考点一 抽样方法 保分考点·

练后讲评 1.[

简单随机抽样]福利彩票“双色球”中红球的号码可以从01,02,03,…,32,33这33个两位号码中选取,小明利用如下所示的随机数表选取红色球的6个号码,选取方法是从第1行第9列的数字开始,从左到右依次读取数据,则第四个被选中的红色球号码为( )

A .12

B .33

C .06

D .16

解析:选C 被选中的红色球号码依次为17,12,33,06,32,22.所以第四个被选中的红色球号码为06,故选C.

2.[分层抽样]某电视台在因特网上就观众对其某一节目的喜爱程度进行调查,参加调查的一共有20 000人,其中各种态度对应的人数如下表所示:

电视台为了了解观众的具体想法和意见,打算从中抽选100人进行更为详细的调查,为此要进行分层抽样,那么在分层抽样时,每类人中应抽选的人数分别为( )

A .25,25,25,25

B .48,72,64,16

C .20,40,30,10

D .24,36,32,8

解析:选D 因为抽样比为

10020 000=1

200

, 所以每类人中应抽选的人数分别为4 800×1200=24,7 200×1200=36,6 400×1

200=32,

1 600×

1

200

=8.故选D. 3.[系统抽样]某班共有学生56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知学号为2,30,44的同学在样本中,则样本中还有一位同学的学号为________.

解析:由题意得,将56人按学号从小到大分成4组,则分段间隔为14,所以抽取的学号依次为2,16,30,44,故还有一位同学的学号为16.

答案:16

[解题方略] 系统抽样和分层抽样中的计算 (1)系统抽样

①总体容量为N ,样本容量为n ,则要将总体均分成n 组,每组N

n 个(有零头时要先去掉).

②若第一组抽到编号为k 的个体,则以后各组中抽取的个体编号依次为k +N

n ,…, k +(n -1)N

n

.

(2)分层抽样

按比例抽样,计算的主要依据是:各层抽取的数量之比=总体中各层的数量之比.

考点二 用样本估计总体 保分考点·

练后讲评 [大稳定——常规角度考双基]

1.[频数分布表中的数字特征]某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量,如下表所示:

则这20户家庭该月用电量的众数和中位数分别是( ) A .180,170 B .160,180 C .160,170

D .180,160

解析:选A 用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A.

2.[茎叶图中的数字特征]甲、乙两名同学在7次数学测试中的成绩如茎叶图所示,其中

甲同学成绩的众数是85,乙同学成绩的中位数是83,则成绩较稳定的是________.

解析:根据众数及中位数的概念易得x =5,y =3,故甲同学成绩的平均数为78+79+80+85+85+92+967=85,乙同学成绩的平均数为

72+81+81+83+91+91+96

7=85,故甲同学成绩的方差为17×(49+36+25+49+121)=40,乙同学成绩的方差为1

7×(169

+16+16+4+36+36+121)=

398

7

>40,故成绩较稳定的是甲. 答案:甲

3.[频率分布直方图中的数字特征]为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量的数据(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.

(1)求图中a 的值;

(2)估计这种植物果实重量的平均数x 和方差s 2(同一组中的数据用该组区间的中点值作代表).

解:(1)由5×(0.020+0.040+0.075+a +0.015)=1,得a =0.050. (2)各组中点值和相应的频率依次为

x =30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40, s 2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75. [解题方略]

1.方差的计算与含义

(1)计算:计算方差首先要计算平均数,然后再按照方差的计算公式进行计算. (2)含义:方差是描述一个样本和总体的波动大小的特征数,方差大说明波动大. 2.从频率分布直方图中得出有关数据的方法

[小创新——变换角度考迁移]

1.[统计中的创新]空气质量指数AQI 是检测空气质量的重要参数,其数值越大说明空气污染状况越严重,空气质量越差.某地环保部门统计了该地区12月1日至12月24日连续24天的空气质量指数AQI ,根据得到的数据绘制出如图所示的折线图.则下列说法错误的是( )

A .该地区在12月2日空气质量最好

B .该地区在12月24日空气质量最差

C .该地区从12月7日到12月12日AQI 持续增大

D .该地区的空气质量指数AQI 与这段日期成负相关

解析:选D 12月2日空气质量指数最低,所以空气质量最好,A 正确;12月24日空气质量指数最高,所以空气质量最差,B 正确;12月7日到12月12日AQI 在持续增大,所以C 正确;在该地区统计这段时间内,空气质量指数AQI 整体呈上升趋势,所以空气质量指数与这段日期成正相关,D 错误.

2.[与基本不等式交汇]为保障食品安全,某市质量监督局对某超市进行食品

安全检查,如图所示是某品牌食品中某元素含量数据的茎叶图,已知该组数据的平均数为11.75,则4a +1

b

的最小值为( )

A .9 B.92 C .3

D.73

解析:选C 根据茎叶图中的数据得,该组数据的平均数x =1

4(a +11+13+20+b )=

11.75,∴a +b =3,∴4a +1b =13????4a +1b (a +b )=13?

???5+4b a +a b ≥13??

??5+24b a ·a b =1

3

(5+4)=3.当且仅当a =2b ,即a =2,b =1时取“=”.∴4a +1

b

的最小值为3.故选C.

3.[借助数学文化考查]《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问:各几何?”其意为:今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱,则丙应出________钱(所得结果四舍五入,保留整数).

解析:甲持560钱,乙持350钱,丙持180钱,甲、乙、丙三人一起出关,关税共100钱,要按照各人带钱多少的比例进行交税,丙应出100×

180560+350+180

=1656

109≈17(钱).

答案:17

考点三 统计案例 增分考点·

广度拓展 [分点研究]

题型一 回归分析在实际问题中的应用

[例1] 某商店为了更好地规划某种商品的进货量,从某一年的销售数据中,随机抽取了8组数据作为研究对象,如下表所示(x 为该商品的进货量,y 为销售天数):

(1)根据上表数据在如图所示的网格中绘制散点图;

(2)根据上表提供的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^

(3)根据(2)中的计算结果,若该商店准备一次性进货该商品24吨,预测需要销售的天数.

参考公式和数据:b ^

∑i =1

n

x i y i -n x y ∑i =1

n

x 2i -n x

2

,a ^=y -b ^x .

i =18

x 2

i =356,∑

i =1

8

x i y i =241. [解] (1)散点图如图所示:

(2)依题意,得x =1

8×(2+3+4+5+6+8+9+11)=6,

y =1

8×(1+2+3+3+4+5+6+8)=4,

又∑i =1

8

x 2i =356,∑i =1

8

x i y i =241,

所以b ^=

∑i =1

8

x i y i -8x y ∑i =1

8

x 2i -8x

2

=241-8×6×4356-8×62

=49

68,

a ^=4-4968×6=-1134,故线性回归方程为y ^=49

68x -1134.

(3)由(2)知,当x =24时,y ^=49

68×24-1134≈17,

故若该商店一次性进货24吨,则预计需要销售17天.

[解题方略] 求回归直线方程的方法

(1)若所求的回归直线方程是在选择题中,常利用回归直线y ^=b ^x +a ^

必经过样本点的中心(x ,y )快速选择.

(2)若所求的回归直线方程是在解答题中,则求回归直线方程的一般步骤为:

题型二独立性检验在实际问题中的应用

[例2](2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:

(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.

(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m的工人数填入下面的列联表:

(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?

附:K2=

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

[解](1)第二种生产方式的效率更高.

理由如下:

(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.

(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.

(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80min ;用第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更高.

(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.

(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分) (2)由茎叶图知m =79+812=80.

列联表如下:

(3)因为K 2

=40(15×15-5×5)2

20×20×20×20

=10>6.635,所以有99%的把握认为两种生产方式的效

率有差异.

[解题方略] 独立性检验的一般步骤 (1)根据样本数据制成2×2列联表;

(2)根据公式K 2

=n (ad -bc )2

(a +b )(c +d )(a +c )(b +d )

(其中n =a +b +c +d )计算出K 2的观测值;

(3)比较K 2的观测值与临界值的大小,作出统计推断.

[多练强化]

1.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.

为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^

= -30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^

=99+17.5t .

(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

解:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y ^

=-30.4+13.5×19=226.1(亿元).

利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y ^

=99+17.5×9=256.5(亿元).

(2)利用模型②得到的预测值更可靠. 理由如下:

(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^

=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.

(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.

(以上给出了2种理由,答出其中任意一种或其他合理理由均可得分)

2.(2019届高三·湖北五校联考)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:

(1)将题中的2×2列联表补充完整;

(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由.附:

K2=n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

.

解:(1)题中的2×2列联表补充如下:

(2)由(1)表中数据得K2=100×(40×25-20×15)2

55×45×60×40

≈8.25>6.635,所以有99%的把握认为

是否爱好该项运动与性别有关.

数学建模——回归分析问题的求解

[典例](2018·汕头模拟)二手车经销商小王对其所经营的A型号二手汽车的使用年数x 与销售价格y(单位:万元/辆)进行整理,得到如下数据:

下面是z关于x的折线图:

(1)由折线图可以看出,可以用线性回归模型拟合z 与x 的关系,请用相关系数加以说明.

(2)求y 关于x 的回归方程并预测某辆A 型号二手车当使用年数为9年时售价约为多少?(b ^,a ^

小数点后保留两位有效数字).

(3)基于成本的考虑,该型号二手车的售价不得低于7 118元,请根据(2)求出的回归方程预测在收购该型号二手车时车辆的使用年数不得超过多少年?

参考公式:回归方程y ^=b ^x +a ^

中斜率和截距的最小二乘估计公式分别为:

b ^=

∑i =1

n

(x i -x )(y i -y )

∑i =1

n

(x i -x )

2

∑i =1

n

x i y i -n x y ∑i =1

n

x 2i -n x

2

,a ^=y -b ^

x .

r =

∑i =1

n

(x i -x )(y i -y )

∑i =1

n

(x i -x )2∑i =1

n

(y i -y )2

.

参考数据:∑i =1

6

x i y i =187.4,∑i =1

6

x i z i =47.64,∑i =1

6

x 2i =139,

∑i =1

6

(x i -x )2≈4.18,

∑i =1

6

(y i -y )2

≈13.96,

∑i =1

6

(z i -z )2≈1.53,ln 1.46≈0.38,ln 0.711 8≈-0.34.

[解] (1)因为x =1

6×(2+3+4+5+6+7)=4.5,

z =1

6×(3+2.48+2.08+1.86+1.48+1.10)=2,

且 ∑i =16

x i z i =47.64,

∑i =1

6

(x i -x )2

≈4.18,

∑i =1

6

(z i -z )2≈1.53,

所以r =

∑i =1

6

(x i -x )(z i -z )∑i =1

6

(x i -x )2∑i =1

6

(z i -z )2

≈47.64-6×4.5×24.18×1.53

≈-0.99,

所以z 与x 的相关系数大约为0.99,说明z 与x 的线性相关程度很高.

(2)由已知,得b ^

∑i =1

6

x i z i -6 x z

∑i =1

6

x 2i -6x

2

47.64-6×4.5×2

139-6×4.52

≈-0.36,

所以a ^=z -b ^

x =2+0.36×4.5=3.62, 所以z 与x 的线性回归方程是z ^

=-0.36x +3.62. 又z =ln y ,

所以y 关于x 的回归方程是y ^=e -0.36x +

3.62. 令x =9,得y ^=e -0.36×9+

3.62≈1.46,

即预测某辆A 型号二手车当使用年数为9年时售价约1.46万元. (3)当y ^≥0.711 8时,e -0.36x +3.62≥0.711 8=e ln 0.711 8=e -

0.34, 所以-0.36x +3.62≥-0.34,解得x ≤11,

因此预测在收购该型号二手车时车辆的使用年数不得超过11年. [素养通路]

本题是典型的回归分析问题,在实际问题中收集数据,画散点图,可以用线性回归模型拟合变量关系,再用最小二乘法求出回归方程,进而用回归模型对实际问题进行预测,考查了数学建模这一核心素养.

[专题过关检测]

A 组——“6+3+3”考点落实练

一、选择题

1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( )

A .73

B .78

C .77

D .76

解析:选B 样本的分段间隔为80

16=5,所以13号在第三组,则最大的编号为13+(16

-3)×5=78.故选B.

2.(2019届高三·南宁摸底联考)已知某地区中小学生人数和近视情况分别如图甲和图乙

所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )

A .100,20

B .200,20

C .200,10

D .100,10

解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选B.

3.从某地高中男生中随机抽取100名同学,将他们的体

重(单位:kg)数据绘制成频率分布直方图(如图),由直方图可知( )

A .估计体重的众数为50或60

B .a =0.03

C .学生体重在[50,60)有35人

D .从这100名男生中随机抽取一人,体重在[60,80)的概率为1

3

解析:选C 根据频率分布直方图知,最高的小矩形对应的底边中点为

50+60

2

=55,所以估计众数为55,A 错误;根据频率和为1,计算(a +0.035+0.030+0.020+0.010)×10=1,解得a =0.005,B 错误;体重在[50,60)内的频率是0.35,估计体重在[50,60)内的学生有100×0.35=35人,C 正确;体重在[60,80)内的频率为0.3+0.2=0.5,用频率估计概率,知这100名男生中随机抽取一人,体重在[60,80)的概率为1

2

,D 错误.

4.如图是民航部门统计的2018年春运期间十二个城市售出的往返机票的平均价格以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述不正确的是( )

A .深圳的变化幅度最小,北京的平均价格最高

B .深圳和厦门的春运期间往返机票价格同去年相比有所下降

C .平均价格从高到低居于前三位的城市为北京、深圳、广州

D .平均价格的涨幅从高到低居于前三位的城市为天津、西安、厦门

解析:选D 由图可知深圳对应的小黑点最接近0%,故变化幅度最小,北京对应的条形图最高,则北京的平均价格最高,故A 正确;由图可知深圳和厦门对应的小黑点在0%以下,故深圳和厦门的价格同去年相比有所下降,故B 正确;由图可知条形图由高到低居于前三位的城市为北京、深圳和广州,故C 正确;由图可知平均价格的涨幅由高到低分别为天津、西安和南京,故D 错误,选D.

5.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{a n },若a 3

=8,且a 1,a 3,a 7成等比数列,则此样本的平均数和中位数分别是( )

A .13,12

B .13,13

C .12,13

D .13,14

解析:选B 设等差数列{a n }的公差为d (d ≠0),a 3=8,a 1a 7=a 23=64,(8-2d )(8+4d )=64,即2d -d 2=0,又d ≠0,故d =2,故样本数据为:4,6,8,10,12,14,16,18,20,22,平均数为(4+22)×510=13,中位数为12+142

=13.

6.(2017·山东高考)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关

系,设其回归直线方程为y ^=b ^x +a ^,已知∑i =1

10x i =225,∑i =1

10

y i =1 600,b ^

=4.该班某学生的脚长

为24,据此估计其身高为( )

A .160

B .163

C .166

D .170

解析:选C 由题意可知y ^=4x +a ^

, 又x =22.5,y =160,

因此160=22.5×4+a ^,解得a ^

=70, 所以y ^

=4x +70.

当x =24时,y ^

=4×24+70=166. 二、填空题

7.如图是某学校一名篮球运动员在10场比赛中所得分数的茎叶图,则该运动员在这10场比赛中得分的中位数为________.

解析:把10场比赛的所得分数按顺序排列:5,8,9,12,14,16,16,19,21,24,中间两个为14与16,故中位数为14+16

2

=15.

答案:15

8.已知一组数据x 1,x 2,…,x n 的方差为2,若数据ax 1+b ,ax 2+b ,…,ax n +b (a >0)的方差为8,则a 的值为________.

解析:根据方差的性质可知,a 2×2=8,故a =2. 答案:2

9.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:

试根据样本估计总体的思想,估计在犯错误的概率不超过________的前提下(约有________的把握)认为“喜爱该节目与否和性别有关”.

参考附表:

? ??

??参考公式:K 2=n (ad -bc )2

(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 解析:分析列联表中数据,可得K 2的观测值k =110×(40×30-20×20)2

60×50×60×50

≈7.822>6.635,

所以在犯错误的概率不超过0.01的前提下(有99%的把握)认为“喜爱该节目与否和性别有关”.

答案:0.01 99% 三、解答题

10.某市教育学院从参加市级高中数学竞赛的考生中随机抽取60名学生,将其竞赛成绩(均为整数)分成六段:[40,50),[50,60),[60,70),…,[90,100],得到如图所示的频率分布直方图.

(1)根据频率分布直方图,估计参加高中数学竞赛的考生的成绩的平均数、众数、中位数(小数点后保留一位有效数字);

(2)用分层抽样的方法在各分数段的考生中抽取一个容量为20的样本,则各分数段抽取的人数分别是多少?

解:(1)由频率分布直方图可知,

(0.010+0.015+0.015+a+0.025+0.005)×10=1,所以a=0.03.

所以参加高中数学竞赛的考生的成绩的平均数为

45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,

成绩的众数为75.

设参加高中数学竞赛的考生的成绩的中位数为x,

则0.1+0.15+0.15+(x-70)×0.03=0.5,解得x≈73.3,

所以中位数为73.3.

(2)因为各层人数分别为6,9,9,18,15,3,各层抽取比例为20

60=

1

3,

所以各分数段抽取人数依次为2,3,3,6,5,1.

11.(2018·长春质量检测)某种植园在芒果临近成熟时,随机从一些芒果树上摘下100个芒果,其质量分别在[100,150),[150,200),[200,250),[250,300),[300,350),[350,400](单位:克)中,经统计得频率分布直方图如图所示.

(1)经计算估计这组数据的中位数;

(2)某经销商来收购芒果,以各组数据的中间数代表这组数据的平均值,用样本估计总体,该种植园中还未摘下的芒果大约还有10 000个,经销商提出如下两种收购方案:A方案是所有芒果以10元/千克收购;

B方案是对质量低于250克的芒果以2元/个收购,高于或等于250克的芒果以3元/个收购.通过计算确定该种植园选择哪种方案获利更多.

解:(1)这组数据的中位数是250+0.5-(0.002×2+0.003)×50

0.008=268.75.

(2)A方案可获利:

(125×0.002+175×0.002+225×0.003+275×0.008+325×0.004+375×0.001)×50×10 000×10×0.001=25 750(元).

B方案可获利:

(0.002+0.002+0.003)×50×10 000×2+(0.008+0.004+0.001)×50×10 000×3

=26 500(元).

由于25 750<26 500,因此该种植园选择B方案获利更多.

12.(2018·广东七校联考)某淘宝店经过对“十一”七天假期的消费情况进行统计,发现在金额不超过1 000元的消费者中男女之比约为1∶4,该店按此比例抽取了100名消费者进行进一步分析,得到下表:

女性消费情况:

男性消费情况:

若消费金额不低于600元的消费者称为“网购达人”、低于600元的消费者称为“非网购达人”.

(1)分别计算女性和男性消费的平均数,并判断平均消费水平高的一方“网购达人”出手是否更阔绰?

(2)根据以上统计数据填写如下2×2列联表,并回答能否在犯错误的概率不超过0.005的前提下认为“是否为‘网购达人’与性别有关”.

附:K2=

n(ad-bc)2

(a+b)(c+d)(a+c)(b+d)

,其中n=a+b+c+d.

解:(1)女性消费的平均数为1

80×(100×5+300×10+500×15+700×47+900×3)=

582.5(元).

男性消费的平均数为1

20×(100×2+300×3+500×10+700×3+900×2)=500(元).

虽然女性消费者的平均消费水平较高,但“女网购达人”的平均消费水平(为712元)低于“男网购达人”的平均消费水平(为780元),所以平均消费水平高的一方“网购达人”出手不一定更阔绰.

(2)2×2列联表如下表:

K 2

=100×(50×15-30×5)2

55×45×80×20

≈9.091,

因为9.091>7.879,

所以在犯错误的概率不超过0.005的前提下可以认为“是否为‘网购达人’与性别有关”.

B 组——大题专攻补短练

1.2017年8月22日金乡县首届“诚信文艺奖”评选暨2017“百姓大舞台”第一季大型才艺大赛决赛在红星美凯龙举行.在比赛现场,12名专业人士和12名观众代表分别组成评判小组A ,B ,给参赛选手打分,如图是两个评判组对同一选手打分的茎叶图.

(1)求A 组数据的众数和极差,B 组数据的中位数;

(2)对每一组计算用于衡量相似性的数值,回答:小组A 与小组B 哪一个更像是由专业人士组成的?并说明理由.

解:(1)由茎叶图可得:A 组数据的众数为47,极差为55-42=13; B 组数据的中位数为55+58

2

=56.5.

(2)小组A 更像是由专业人士组成的.理由如下: 小组A ,B 数据的平均数分别为

x A=1

12×(42+42+44+45+46+47+47+47+49+50+50+55)=47,

x B=1

12×(36+42+46+47+49+55+58+62+66+68+70+73)=56,

所以小组A,B数据的方差分别为

s2A=1

12×[(42-47)

2+(42-47)2+…+(55-47)2]=1

12×(25+25+9+4+1+4+9+9+

64)=12.5,

s2B=1

12×[(36-56)

2+(42-56)2+…+(73-56)2]=1

12×(400+196+100+81+49+1+4

+36+100+144+196+289)=133.

因为s2A

2.(2019届高三·武汉部分学校调研)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:

(1)估计旧养殖法的箱产量低于50 kg的概率并估计新养殖法的箱产量的平均值;

(2)填写下面的2×2列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关.

附:K 2

=n (ad -bc )2

(a +b )(c +d )(a +c )(b +d )

,其中n =a +b +c +d .

解:(1)旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62,所以旧养殖法的箱产量低于50 kg 的概率估计值为0.62;新养殖法的箱产量的平均值为37.5×0.004×5+42.5×0.020×5+47.5×0.044×5+52.5×0.068×5+57.5×0.046×5+62.5×0.010×5+67.5×0.008×5=52.35.

(2)根据箱产量的频率分布直方图得2×2列联表如下:

由表中数据得K 2

=200×(62×66-34×38)2

100×100×96×104

≈15.705,

由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.

3.(2018·广州高中综合测试)某地1~10岁男童年龄x i (单位:岁)与身高的中位数y i (单位:cm)(i =1,2,…,10)如下表:

对上表的数据作初步处理,得到下面的散点图及一些统计量的值.

文科数学专题概率与统计(专练)高考二轮复习资料含答案

专題16概率与统计(押题专练〉 1 12 1 ?围棋盒子中有多粒黑子和白子,已知从中取出2粒都是黑子的概率为7都是白子的概率是35.则从 中任意取出2粒恰好是同一色的概率是 ( ) 1 12 A : B. 35 7 17 C D. 1 35 【答案】 C 【解析】设如中取出2粒都是黒子彷事件直「从中取出2粒者卩是白子彷事件B 「任竜取出2粒恰 好是 同一色悄事件C f 则C=AUB,且事件A 与B 互斥-所叹PQ=P(A)+P(B)=昇||二¥即任青取出 -粒恰好是同一色的概率为紧 n 1 2?若[0 , n ],则sin ( 0 + 3)>5成立的概率为( ) 2 C 3 D 1 【答案】B n n 4 n n 1,口 n n 5 n n 【解析】依题意,当 0 € [0, n ]时,0 +-3€[§,丁],由 sin ( 0 +~3)>2得"3 w 0 + _3<_^,。三 0 <2. n 1 因此,所求的概率等于二十n =二,选B 3?在{1,3,5}和{2,4}两个集合中各取一个数组成一个两位数,则这个数能被 4整除的概率是( ) 1 1 A 3 B -2 C 1 【答案】D 【解析】所有的两位数为 12,14,21,41,32,34,23,43,52,54,25,45 ,共12个, 能被4整除的数为12,32,52,共3个, 3 1 故所求概率P = ;7=匚.故选D 12 4 4.在平面区域{(x , y)|0 w x w 1, 1w y w 2}内随机投入一点 P,则点P 的坐标(x , y)满足y w 2x 的概率 1 A 3 1 B-2

1 1 X - X1 S阴影2 2 5.在区间[0,1]上随机取一个数x,则事件“ log°.5(4x —3)>0”发生的概率为( 1 1 C3 D-4 【答案】D 【解析】因为log o.5(4x —3)>0,所以0<4x —3< 1,即|

高考文科数学试题汇编 统计

I单元统计 I1随机抽样 17.I1,I2[2013·安徽卷] 为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下: (1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格); (2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为x1,

x 2,估计x 1-x 2的值. 17.解:(1)设甲校高三年级学生总人数为n ,由题意知,30 n =0.05,即n =600. 样本中甲校高三年级学生数学成绩不及格人数为5,据此估计甲校高三年级此次联考数学成绩及格率为1-530=56. (2)设甲、乙两校样本平均数分别为x 1′,x 2′,根据样本茎叶图可知, 30(x 1′-x 2′)=30x 1′-30x 2′ =(7-5)+(55+8-14)+(24-12-65)+(26-24-79)+(22-20)+92 =2+49-53-77+2+92 =15. 因此x 1′-x 2′=0.5,故x 1-x 2的估计值为0.5分. 3.I1[2013·湖南卷] 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件.为了解它们的产品质量是否存在显著差别,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n =( ) A .9 B .10 C .12 D .13 3.D [解析] 根据抽样比例可得360=n 120+80+60,解得n =13, 选D.

(完整word版)高二数学典型统计案例习题及答案

典型案例作业 1.某商场经理根据以往经验知道,有40%的客户在结账时会使用信用卡,则连续三位顾客都使用信用卡的概率为( ) 2.三个同学同时作一电学实验,成功的概率分别为1P ,2P ,3P ,则此实验在三人中三人都不成功的概率是( ) 3.甲、乙两人同时应聘一个工作岗位,若甲、乙被应聘的概率分别为0.5、0.6 两人被聘用是相互独立的,则甲乙两人中没有一人被聘用的概率( ) 4.甲射击运动员分别对一目标射击三次,甲射中的概率为0.4,则至少有一次射中的概率是________ 5.对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示: 比较这两种手术对病人又发作心脏病的影响有没有差别.________. 6. 回答能否有99.9% 的把握认为“注射药物A 后的疱疹面积与注射药物B 后的疱疹面积有差异”

7.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表: 推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y与工作年限x之间的相关系数; (2)求年推销金额y关于工作年限x的线性回归方程; (3)若第6名推销员的工作年限为11年,试估计他的年推销金额. (参考数据: 1.04≈1.02;由检验水平0.01及n-2=3,查表得=0.959)

8.某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2010年12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下表: 该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验. (1)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12 ^=bx+a; 月4日的数据,求出y关于x的线性回归方程y (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过 2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

全国卷文科数学概率统计汇总

概率统计高考题 1.[2016.全国卷3.T5] 小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M ,I,N 中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是( ) A. 158 B. 81 C. 151 D. 30 1 2.[2016.全国卷2.T8] 某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为( ) A. 710 B. 58 C.38 D.310 3.[2015.全国卷1.T4] 如果3个整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则3个数构成一组勾股数的概率为( ) A. 103 B.15 C.110 D.1 20 4.[201 5.全国卷2.T3]根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是( ) A .逐年比较,2008年减少二氧化硫排放量的效果最显著 B .2007年我国治理二氧化硫排放显现成效 C .2006年以来我国二氧化硫年排放量呈减少趋势 D .2006年以来我国二氧化硫年排放量与年份正相关 5.[2013.全国卷1.T3]从1,2,3,4中任取2个不同的数,则取出的2个数之差的绝对值为2的概率是( ) A. 12 B.13 C.14 D.1 6 6.[2012.全国卷.T3]在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i =1,2,…,n )都在直线y =12x +1上,则这组样本数据的样本相关系数为( ) A. -1 B.0 C. 1 2 D. 1 7.[2011.全国卷.T6]有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为( ) A. 13 B. 12 C.23 D.34 8.[2014.全国卷1.T13] 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为 2004年 2005年 2006年 2007年 2008年 2009年 2010年 2011年 2012年 2013年

高考文科数学试题分类汇编11:概率与统计

高考文科数学试题分类汇编11:概率与统计 一、选择题 1 .(2013年高考安徽(文))若某公司从五位大学毕业生甲、乙、丙、丁、戌中录用三人,这五人被录用的 机会均等,则甲或乙被录用的概率为 ( ) A . 23 B . 25 C . 35 D . 910 【答案】D 2 .(2013年高考重庆卷(文))下图是某公司10个销售店某月销售某 产品数量(单位:台)的茎叶图,则数据落在区间[20,30)内的概率为( ) A .0.2 B .0.4 C .0.5 D .0.6 【答案】B 3 .(2013年高考湖南(文))已知事件“在矩形ABCD 的边CD 上随机取一点P,使△APB 的最大边是AB”发 生的概率为.2 1 ,则 AD AB =____ ( ) A . 12 B . 14 C D 【答案】D 4 .(2013年高考江西卷(文))集合A={2,3},B={1,2,3},从A,B 中各取任意一个数,则这两数之和等于4的 概率是 ( ) A . 2 3 B . 1 3 C . 12 D . 16 【答案】C 5 .(2013年高考湖南(文))某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件,60件. 为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为n 的样本进行调查,其中从丙车间的产品中抽取了3件,则n=___ ( ) A .9 B .10 C .12 D .13 【答案】D 6 .(2013年高考山东卷(文))将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均 分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x 表示: 则7个剩余分数的方差为 ( ) A . 116 9 B . 367 C .36 D 【答案】B 7 .(2013年高考四川卷(文))某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎 叶图如图所示.以组距为5将数据分组成[0,5),[5,10),,[30,35),[35,40]时,所作的频率分布直方图是 8 7 7 9 4 0 1 0 9 1 x

高三文科数学统计概率总结

高三文科数学统计概率 总结 文档编制序号:[KKIDT-LLE0828-LLETD298-POI08]

统计概率考点总结 【考点一】分层抽样 01、交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对 甲、乙、丙、丁四个社区做分层抽样调查。假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人。若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为() 02、A、101 B、808 C、1212 D、2012 03、某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽 取一个容量为280的样本,则此样本中男生人数为____________. 04、一支田径运动队有男运动员56人,女运动员42人。现用分层抽样的方法抽取若 干人,若抽取的男运动员有8人,则抽取的女运动员有______人。 05、某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人 按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为() 06、A.11 B.12 C.13 D.14 07、将参加夏令营的600名学生编号为:001,002,……600,采用系统抽样方法抽取 一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495住在第Ⅱ营区,从496到600在第Ⅲ营 区,三个营区被抽中的人数依次为() 08、A.26, 16, 8B.25,17,8 C.25,16,9 D.24,17,9 【考点二】频率分布直方图(估计各种特征数据) 01、从某小区抽取100户居民进行月用电量调查,发现其用电量都在50到350度之间, 频率分布直方图所示. 02、(I)直方图中x的值为________; 100,250内的户数为_____. 03、(II)在这些用户中,用电量落在区间[) 04、下图是样本容量为200的频率分布直方图。根据样本的 频率分布直方图估计,样本数据落在[6,10]内的频数 为,数据落在(2,10)内的概率约为

2019年高考数学统计案例(文科) 含解析

统计案例 一、选择题 1.(2018·长春一模)完成下列两项调查:①从某社区125户高收入家庭、280户中等收入家庭、95户低收入家庭中选出100户,调查社会购买能力的某项指标;②从某中学的15名艺术特长生中选出3名调查学习负担情况.宜采用的抽样方法依次是( ) A .①简单随机抽样,②系统抽样 B .①分层抽样,②简单随机抽样 C .①系统抽样,②分层抽样 D .①②都用分层抽样 答案:B 解析:因为社会购买能力的某项指标受到家庭收入的影响,而社区中各个家庭收入差别明显,所以①用分层抽样法;从某中学的15名艺术特长生中选出3名调查学习负担情况,个体之间差别不大,且总体和样本容量较小,所以②用简单随机抽样法,故选B. 2.(2018·贵州遵义联考)某校高三年级有1 000名学生,随机编号为0001,0002,…,1 000.现按系统抽样方法,从中抽出200人,若0122号被抽到了,则下列编号也被抽到的是( ) A .0927 B .0834 C .0726 D .0116 答案:A 解析:系统抽样就是等距抽样,被抽到的编号满足0122+5k ,k ∈Z .因为0927=0122+5×161,故选A. 3.(2018·江西九校联考(一))一组数据共有7个数,其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数据的平均数、中位数、众数依次成等差数列,则这个数的所有可能值的和为( ) A .3 B .17 C .-11 D .9 答案:D 解析:设这个数是x ,则平均数为25+x 7,众数为2,若x ≤2,则

中位数为2,此时x =-11,若2

高二数学《统计案例》教案

选修1-2第一章、统计案例 1、1回归分析的基本思想及其初步应用。(第1课时) 教学目标:通过典型案例,掌握回归分析的基本步骤。 教学重点:熟练掌握回归分析的步骤。 教学难点:求回归系数 a , b 教学方法:讲练。 教学过程: 一、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 二、新课: 1、回归分析的基本步骤:(1) 画出两个变量的散点图。(2) 求回归直线方程。 (3) 用回归直线方程进行预报。 2、举例:例1、题(略) 用小黑板给出。 解:(1) 作散点图,由于问题是根据身高预报体重,因此要求身高与体重的回归直线方程,取身高为自变量x 。体重为因变量 y ,作散点图(如图) (2)列表求 ,?0.849?85.712x y b a ≈≈- 回归直线方程 y=0.849x-85.712 对于身高172cm 女大学生,由回归方程可以预报体重为y=0.849*172-85.712=60.316(kg) 预测身高为172cm 的女大学生的体重为约60。316kg 问题:身高为172cm 的女大学生的体重一定是60。316kg 吗?(留下一节课学习) 例2:(提示后做练习、作业) 研究某灌溉渠道水的流速y 与水深x 之间的关系,测得一组数据如下: 水深xm 1.40 1.50 1.60 1.70 1.80 1.90 2.00 2.10 流速ym/s 1.70 1.79 1.88 1.95 2.03 2.10 2.16 2.21 (1)求y 对x 的回归直线方程; (2)预测水深为1。95m 时水的流速是多少? 解:(略) 三、小结 四、作业: 例2、 预习。

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

2020年高考文科数学概率与统计题型归纳与训练

2020年高考文科数学《概率与统计》题型归纳与训练 【题型归纳】 题型一古典概型 例1 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为(). A. 1 5B. 2 5 C. 8 25 D. 9 25 【答案】B 【解析】可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有: (甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为42 105 =.故选B. 例2 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________. 【答案】2 3 【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6 种,其中2本数学书相邻的有4种,则其概率为:42 63 p==. 【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数. 题型二几何概型 1 / 18

例 1 如图所示,正方形ABCD 内的图形来自中国古代的太极 图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ). A. 14 B. π8 C. 12 D. π 4 【答案】B 【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为 8 22122 ππ=??? ????a a .故选B. 例2 在区间[0,5]上随机地选择一个数p ,则方程22320x px p 有两个负根的概率为________. 【答案】3 2 【解析】方程2 2320x px p 有两个负根的充要条件是2121244(32)0 20320 p p x x p x x p ??=--≥? +=-? 即 2 1,3 p <≤或2p ≥,又因为[0,5]p ∈,所以使方程22320x px p 有两个负根的p 的取值范围为2(,1][2,5]3,故所求的概率2(1)(52)23503 -+-=-,故填:32. 【易错点】“有两个负根”这个条件不会转化. 【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数p 的范围.在利用几何概型的计算公式计算即可. D

2高考文科数学统计习题答案

2020年4月28日习题 海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: (1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率; (2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关: 箱产量<50kg箱产量≥50kg 旧养殖法 新养殖法 (3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行较。 附: P()0.0500.0100.001 k 3.841 6.63510.828

(2)根据箱产量的频率分布直方图得列联表 箱产量<50kg箱产量≥50kg 旧养殖法6238 新养殖法3466 K2= 由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图平均值(或中位数)在45kg到50kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.

2020年4月29日习题 某险种的基本保费为(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下: 上年度 出 险 次 数 保费 随机调查了设该险种的200名续保人在一年内的出险情况,得到如下统计表:出险次数 概数 (Ⅰ)记为事件:“一续保人本年度的保费不高于基本保费”.求的估计值;(Ⅱ)记为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”.求的估计值; (Ⅲ)求续保人本年度平均保费的估计值.

高中数学统计案例综合检测试题及答案-word文档

高中数学统计案例综合检测试题及答案 选修2-3第三章统计案例综合检测 时间120分钟,满分150分。 一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.(2019宁夏银川模拟)下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y 4.5 4 3 2.5 由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于() A.10.5 B.5.15 C.5.2 D.5.25 [答案] D [解析] x=2.5,y=3.5, ∵回归直线方程过定点(x,y), 3.5=-0.72.5+a,a=5.25.故选D. 2.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵轴上的截距是a,那么必有() A.b与r的符号相同 B.a与r的符号相同

C.b与r的符号相反 D.a与r的符号相反 [答案] A [解析] 因为b0时,两变量正相关,此时,r0;b0时,两变量负相关,此时r0. 3.有下列说法: ①随机误差是引起预报值与真实值之间的误差的原因之一; ②残差平方和越小,预报精度越高; ③在独立性检验中,通过二维条形图和三维柱形图可以粗略判断两个分类变量是否有关系. 其中真命题的个数是() A.0 B.1 C.2 D.3 [答案] D 4.有甲、乙两种钢材,从中各取等量样品检验它们的抗拉强度指标如下: 甲 X 110 120 125 130 135 P 0.1 0.2 0.4 0.1 0.2 乙 X 100 115 125 130 145 P 0.1 0.2 0.4 0.1 0.2

概率统计专题复习(文科)

概率、统计专题复习(文科) 例1.近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其 他垃圾三类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨): “厨余垃圾”箱 “可回收物”箱 “其他垃圾”箱 厨余垃圾 400 100 100 可回收物 30 240 30 其他垃圾 20 20 60 (1)试估计厨余垃圾投放正确的概率;(2)试估计生活垃圾投放错误的概率; (3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为,,a b c ,其中0a >,600a b c ++=.当数据,,a b c 的方差2 S 最大时,写出,,a b c 的值(结论不要求证明),并求此时2 S 的值.(注:方差2222121[()()()]n s x x x x x x n =-+-++-,其 中x 为12,,n x x x 的平均数) 例2.从装有编号分别为a,b 的2个黄球和编号分别为 c,d 的2个红球的袋中无放回地摸球,每次任摸一球,求:(Ⅰ)第1次摸到黄球的概率;(Ⅱ)第2次摸到黄球的概率. 例3.一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆): 轿车A 轿车B 轿车C 舒适型 100 150 z 标准型 300 450 600 按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆. (1)求z 的值; (2)用分层抽样的方法在C 类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率; (3)用随机抽样的方法从B 类舒适型轿车中抽取8辆,经检测它们的得分如下: 9.4,8.6,9.2,9.6,8.7,9.3,9.0,8.2,把这8辆轿车的得分看成一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率.

20112017高考全国卷文科数学统计概率汇编

新课标全国卷Ⅰ文科数学汇编 统计、概率 一、选择题 【2017,2】为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为 12,,,n x x x L ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A. 12,,,n x x x L 的平均数 B. 12,,,n x x x L 的标准差 C. 12,,,n x x x L 的最大值 D. 12,,,n x x x L 的中位数 【2017,4】如图,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ) A. 14 B.π8 C.12 D.π4 【2016,3】为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是( ). A . 13 B . 12 C . 23 D . 56 【2015,4】如果3个正数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为( ) A . 310 B .15 C .110 D .120 【2013,3】从1,2,3,4中任取2个不同的数,则取出的2个数之差的绝对值为2的概率是( ). A . 12 B .13 C .14 D .16 【2012,3】在一组样本数据(1x ,1y ),(2x ,2y ),…,(n x ,n y )(2n ≥,1x ,2x ,…,n x 不全相等)的散点图中,若所有样本点(i x ,i y )(i =1,2,…,n )都在直线1 12 y x =+上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 【2011,6】有3个兴趣小组,甲、乙两位同学各自参加其中一个小组,每位同学参加各个小组的可能性相同,则这两位同学参加同一个兴趣小组的概率为( ). A.13 B. 12 C.23 D.34 二、填空题 【2014,13】将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____.

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习 A组 一、选择题 1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为() A.200 B.240 C.400 D.480 解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400. 2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为() A.3 B.4 C.12 D.21

解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为4 10= 2 5, 所以估计昆明市2020年4月份空气质量为优的天数为30×2 5=12,故选C. 3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是() A.最低气温与最高气温为正相关 B.10月的最高气温不低于5月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在1月 D.最低气温低于0 ℃的月份有4个 解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D. 4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关

2018年高考文科数学分类之统计与概率

统计与概率 一、选择题: 1.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图: 则下面结论中不正确的是() A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上 C.新农村建设后,养殖收入增加了一倍 D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半 2.某群体中的成员只用现金支付的概率为0.45,既用现金也用非现金支付的概率为0.15,则不用现金支付的概率为() A.0.3B.0.4C.0.6D.0.7 3.从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为() A.0.6B.0.5C.0.4D.0.3 二、填空题: 4.某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方式有简单随机抽样,分层抽样和系统抽样,则最适合的抽样方法是______. 5.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为___________. 6.某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为___________. 7.有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是___________(结果用最简分数表示).三、解答题: 8.某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下: 未使用节水龙头50天的日用水量频数分布表

高二文科数学统计案例专项练习

高二文科数学统计案例专项练习 1.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分 层抽样抽取容量为30的样本,则抽高级职称的人数为 A .2 B .3 C .5 D .10 2.为了判断高一学生是否选修文科与性别的关系,现随机抽取 50名学生,得到右侧2×2列联表:则认为选修文科与性别有 关系出错的可能性不超过 A .0.005 B .0.05 C .0.95 D .0.095 3.某人对一地区人均工资x (千元)与该地区人均消费y (千元)进行统计调查,y 与x 有相 关关系,得到回归直线方程?0.5 1.5y x =+.若该地区的人均消费水平为3.5千元,估计该地区的人均消费额占人均工资收入的百分比约为 A .80% B .82.5% C .87.5% D .92.3% 4.某化工厂为预测产品的回收率y ,需要研究它和原料有效成分含量x 之间的相关关系.现取 8对观测值,计算得8 1 40i i x ==∑,8 1 240i i y ==∑,8 1 1800i i i x y ==∑,8 21 400i i x ==∑,则其线性回归方 程为 . 5.某地区调查了2~9岁儿童的身高,由此建立的身高y (cm )与年龄x (岁)的回归模型为 ?8.2560.13y x =+. ①该地区一个10岁儿童的身高为142.63 cm ;②该地区2~9岁的儿童每年身高约增加8.25 cm ; ③该地区9岁儿童的平均身高是134.38 cm ;④利用这个模型可以准确地预算该地区每个2~9岁儿童的身高. 上述叙述正确的有. 6.某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关 系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x (°C )与该奶茶店 ( (2)请根据所给五组数据,求出y 关于x 的线性回归方程???y bx a =+. (参考公式:()() () 1 2 1 ???n i i i n i i x x y y b a y bx x x ==--==--∑∑,.)

高中数学统计、统计案例知识点总结和典例

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

相关文档
相关文档 最新文档