文档库 最新最全的文档下载
当前位置:文档库 › 专题七 第3讲 统计与统计案例(理)(教师)

专题七 第3讲 统计与统计案例(理)(教师)

专题七  第3讲 统计与统计案例(理)(教师)
专题七  第3讲 统计与统计案例(理)(教师)

专题七概率与统计(理)

概率与统计应以随机变量及其分布列为中心,求解时应抓住建模、解模、用模这三个基本点.

排列组合是求解概率的工具,利用排列组合解题时应抓住特殊元素或特殊位置,注意元素是否相邻及元素是否定序,同时还应注意题中是否还涉及两个计数原理.

随机变量的均值和方差是概率初步的关键点,解决概率应用问题时,首先要熟悉几种常见的概率类型,熟练掌握其计算公式;其次还要弄清问题所涉及的事件具有什么特点、事件之间有什么联系;再次要明确随机变量所取的值,同时要正确求出所对应的概率.

统计的主要内容是随机抽样、样本估计总体、变量的相关性,复习时应关注直方图、茎叶图与概率的结合,同时注意直方图与茎叶图的数据特点.

第3讲 统计与统计案例

考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.

1.明确直方图的三个结论 (1)小长方形的面积=组距×

频率

组距

=频率. (2)各小长方形的面积之和等于1.

(3)小长方形的高=频率组距,所有小长方形高的和为1

组距.

2.把握统计中的四个数据特征

(1)众数:在样本数据中,出现次数最多的那个数据.

(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.

(3)平均数:样本数据的算术平均数,即 x =1

n (x 1+x 2+…+x n ).

(4)方差与标准差

方差:s 2=1

n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].

标准差: s =

1

n

[(x 1-x )2+(x 2-x )2+…+(x n -x )2].

热点一 抽样方法

1.(1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为() A.11 B.12 C.13 D.14

(2)(2014·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.

思维启迪(1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例.

答案(1)B(2)200

解析(1)由840

42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为

720-480

20=240

20=12.

(2)本题属于分层抽样,设该学校的教师人数为x,所以

160

3 200=

160-150

x,所以x=200.

思维升华(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.

2.(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为()

A.15 B.16 C.17 D.18

(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为()

A.200,20 B.100,20

C.200,10 D.100,10

答案(1)C(2)A

解析(1)由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故共抽取高二学生人数为33

-16=17,故选C.

(2)该地区中、小学生总人数为3 500+2 000+4 500=10 000,

则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A.

热点二用样本估计总体

3.(1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()

A.6 B.8 C.12 D.18

(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是()

A.甲B.乙

C.甲乙相等D.无法确定

甲乙

20.04123 6

930.059

6210.0629

3310.079

640.087

70.09246

思维启迪(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;(2)直接根据公式计算方差.

答案(1)C(2)A

解析(1)志愿者的总人数为

20

(0.16+0.24)×1

=50,

所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.

(2)x 甲=(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+0.097)÷12≈0.068 9,

x 乙=(0.041+0.042+0.043+0.046+0.059+0.062+0.069+0.079+0.087+0.092+0.094+0.096)÷12≈0.067 5,

s 2=1

12[(0.042-0.068 9)2+(0.053-0.068 9)2+…+(0.097-0.068 9)2]≈0.000 212.

s 2=1

12[(0.041-0.067 5)2+(0.042-0.067 5)2+…+(0.096-0.067 5)2]≈0.000 429.

所以甲、乙两地浓度的方差较小的是甲地.

思维升华 (1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等.

(2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.

4.(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.

(2)(2014·陕西)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为( ) A .1+a,4 B .1+a,4+a C .1,4

D .1,4+a

答案 (1)10 (2)A

解析 (1)由频率分布直方图可知: 0.100.40=2.5

x

,所以x =10. (2)x 1+x 2+…+x 1010

=1,y i =x i +a ,

所以y 1,y 2,…,y 10的均值为1+a ,方差不变仍为4. 故选A.

热点三 统计案例

5.(1)以下是某年2月某地区搜集到的新房屋的销售价格y 和房屋的面积x 的数据.

房屋面积x /m 2 115 110 80 135 105 销售价格y /万元

24.8

21.6

18.4

29.2

22

根据上表可得线性回归方程y ^

=b ^

x +a ^

中的b ^

=0.196 2,则面积为150 m 2的房屋的销售价格约为________万元.

(2)(2014·江西)某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的变量是( )

表1

成绩 性别

不及格 及格 总计 男 6 14 20 女 10 22 32 总计

16 36

52

表2

视力 性别

好 差 总计 男 4 16 20 女 12 20 32 总计

16 36

52 表3

智商 性别

偏高 正常 总计 男 8 12 20 女 8 24 32 总计

16

36

52

表4

阅读量 性别

丰富 不丰富 总计 男 14 6 20 女 2 30 32 总计

16

36

52

A.成绩 B .视力 C .智商 D .阅读量 思维启迪 (1)回归直线过样本点中心(x ,y ); (2)根据列联表,计算K 2的值 答案 (1)31.244 2 (2)D

解析 (1)由表格可知x =1

5(115+110+80+135+105)=109,

y =1

5

(24.8+21.6+18.4+29.2+22)=23.2.

所以a ^

=y -b ^

x =23.2-0.196 2×109=1.814 2.

所以所求线性回归方程为y ^

=0.196 2x +1.814 2.

故当x =150时,销售价格的估计值为y ^

=0.196 2×150+1.814 2=31.244 2(万元).

(2)A 中,a =6,b =14,c =10,d =22,a +b =20,c +d =32,a +c =16,b +d =36,n =52,

K 2

=52×(6×22-14×10)220×32×16×36

=131 440.

B 中,a =4,b =16,c =12,d =20,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2

=52×(4×20-16×12)220×32×16×36

=637

360.

C 中,a =8,b =12,c =8,d =24,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2

=52×(8×24-12×8)220×32×16×36

=13

10.

D 中,a =14,b =6,c =2,d =30,a +b =20,c +d =32,a +c =16,b +d =36,n =52, K 2

=52×(14×30-6×2)220×32×16×36

=3 757

160.

131 440<1310<637360<3 757

160

, ∴与性别有关联的可能性最大的变量是阅读量.

思维升华 (1)线性回归方程求解的关键在于准确求出样本点中心.回归系数的求解可直接把相应数据代入公式中求解,回归常数的确定则需要利用中心点在回归直线上建立方程求解;(2)独立性检验问题,要确定2×2列联表中的对应数据,然后代入K 2(χ2)计算公式求其值,根据K 2(χ2)取值范围求解即可. 6.(1)已知x 、y 取值如下表:

x 0 1 4 5 6 8 y

1.3

1.8

5.6

6.1

7.4

9.3

从所得的散点图分析可知:y 与x 线性相关,且y ^

=0.95x +a ^

,则a ^

等于( )

A .1.30

B .1.45

C .1.65

D .1.80

(2)某研究机构为了研究人的脚的大小与身高之间的关系,随机抽测了20人,若“身高大于175厘米”的为“高个”,“身高小于等于175厘米”的为“非高个”,“脚长大于42码”的为“大脚”,“脚长小于等于42码”的为“非大脚”.得以下2×2列联表:

高个 非高个 总计 大脚 5 2 7 非大脚 1 12 13 总计

6

14

20

则在犯错误的概率不超过________的前提下认为人的脚的大小与身高之间有关系. (附:

P (K 2>k ) 0.05 0.01 0.001 k

3.841

6.635

10.828

)

答案 (1)B (2)0.01

解析 (1)依题意得,x =1

6×(0+1+4+5+6+8)=4,

y =1

6

(1.3+1.8+5.6+6.1+7.4+9.3)=5.25;

又直线y ^

=0.95x +a ^

必过样本点中心(x ,y ),即点(4,5.25),于是有5.25=0.95×4+a ^

,由

此解得a ^

=1.45. (2)由题意得

K 2

=20×(5×12-1×2)2

6×14×7×13

≈8.802>6.635.

而K 2>6.635的概率约为0.01,所以在犯错误的概率不超过0.01的前提下认为人的脚的大小与身高之间有关系.

1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样,最重要的是各层的“比例”. 2.用样本估计总体

(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1. (2)众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.

(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体

容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. ①总体期望的估计,计算样本平均值x =1n ∑n i =1x i .②总体方差(标准差)的估计:方差=1n ∑n

i =1 (x

i -x )2,标准差=方差,方差(标准差)较小者较稳定.

3.线性回归方程y ^

=b ^

x +a ^

过样本点中心(x ,y ),这为求线性回归方程带来很多方便. 4.独立性检验

(1)作出2×2列联表.(2)计算随机变量K 2(χ2)的值.(3)查临界值,检验作答. 真题感悟

7.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.

答案 24

解析 底部周长在[80,90)的频率为0.015×10=0.15, 底部周长在[90,100)的频率为0.025×10=0.25,

样本容量为60,所以树木的底部周长小于100 cm 的株数为(0.15+0.25)×60=24.

8.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h 以下的汽车有________辆.

答案 20

解析 时速在70 km/h 以下的汽车所占的频率为0.01×10+0.03×10=0.4,共有0.4×50=20(辆).

9.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此

期间购买教辅资料的情况进行调研,得到如下数据:

购买图书情况

只买试题类

只买讲解类

试题类和讲解类都买

人数

240

200

160

若该教育出版社计划用分层抽样的方法从这600人中随机抽取60人进行座谈,则只买试题类的学生应抽取的人数为________. 答案 24

解析 只买试题类的学生应抽取的人数为60×240

600

=24.

10.(2012·山东高考)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )

A .7

B .9

C .10

D .15

[思路点拨] 由系统抽样的概念可以求解.

[解析] 由系统抽样的特点知:抽取号码的间隔为

960

32

=30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人.

[答案] C

11.某校共有学生2 000名,各年级男、女生人数如下表,已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19,现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生数为( )

一年级 二年级 三年级 女生 373 x y 男生

377

370 z

A.24 B .18 C .16

D .12

解析:选C 依题意可知,二年级女生有380人,则三年级的学生的人数应是500,即总体中各个年级的人数比例为3∶3∶2,故在分层抽样中应在三年级抽取到的学生人数为64×2

8

=16.

[配套课时作业]

A 组

12.(2012·济南模拟)某全日制大学共有学生5 600人,其中专科生有1 300人,本科生有

3 000人,研究生1 300人,现采用分层抽样的方法调查学生利用因特网查找学习资料的情况,抽取的样本为280人,则应在专科生,本科生与研究生这三类学生中分别抽取( )

A .65人,150人,65人

B .30人,150人,100人

C .93人,94人,93人

D .80人,120人,80人

解析:选A 设应在专科生,本科生与研究生这三类学生中分别抽取x 人,y 人,z 人,则

5 600280=1 300x =3 000y =1 300z

,所以x =z =65,y =150.所以应在专科生,本科生与研究生这三类学生中分别抽取65人,150人,65人.

13.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,

得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )

A .46,45,56

B .46,45,53

C .47,45,56

D .45,47,53

解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即

45+472=46,众数为45,极差为68-12=56.

14.(2012·广州调研)设随机变量X ~N (1,52

),且P (X ≤0)=P (X >a -2),则实数a 的值为

( )

A .4

B .6

C .8

D .10

解析:选A 由正态分布的性质可知P (X ≤0)=P (X ≥2),所以a -2=2,故a =4.

15.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,则样本方差为

( )

A.

6

5

B.65

C. 2 D .2

解析:选D 由题可知样本的平均值为1,所以a +0+1+2+3

5=1,解得a =-1,所以

样本的方差为1

5

[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.

16.高三(1)班共有56人,学号依次为1,2,3,…,56,现用系统抽样的办法抽取一个容

量为4的样本.已知学号为6,34,48的同学在样本中,那么还有一个同学的学号应为________.

解析:由题意可知,可将学号依次为1,2,3,…,56的56名同学分成4组,每组14人,抽取的样本中,若将他们的学号按从小到大的顺序排列,彼此之间会相差14.故还有一个同学的学号应为6+14=20.

答案:20

17.(2012·济南模拟)随机变量ξ服从正态分布N (40,σ2

),若P (ξ<30)=0.2,则P (30<ξ<50)

=________.

解析:根据正态分布曲线的对称性可得P (30<ξ<50)=1-2P (ξ<30)=0.6. 答案:0.6

18.(2012·江南十校联考)“低碳经济”是促进社会可持续发展的推进器.某企业现有

100万元资金可用于投资,如果投资“传统型”经济项目,一年后可能获利20%,可能损失10%,也可能不赔不赚,这三种情况发生的概率分别为35,15,1

5;如果投资“低碳型”经济

项目,一年后可能获利30%,也可能损失20%,这两种情况发生的概率分别为a 和b (其中a +b =1).

(1)如果把100万元投资“传统型”经济项目,用ξ表示投资收益(投资收益=回收资金-投资资金),求ξ的概率分布及均值(数学期望)E (ξ);

(2)如果把100万元投资“低碳型”经济项目,预测其投资收益均值会不低于投资“传统型”经济项目的投资收益均值,求a 的取值范围.

解:(1)依题意,ξ的可能取值为20,0,-10, 则ξ的分布列为

ξ 20 0 -10 P

35

15

15

故ξ的均值E (ξ)=20×35+0×15+(-10)×1

5

=10(万元).

(2)设η表示100万元投资“低碳型”经济项目的收益,则η的分布列为

η 30 -20 P

a

b

依题意,需30a -20b ≥10,又a +b =1,则50a -20≥10, 所以3

5

≤a ≤1.

19. (2012·郑州质检)为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:

分组频数频率

一60.5~70.5 a 0.26

二70.5~80.515c

三80.5~90.5180.36

四90.5~100.5 b d

合计50 e

(1)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,199,试写出第二组第一位学生的编号;

(2)求出a,b,c,d,e的值(直接写出结果),并作出频率分布直方图;

(3)若成绩在85.5~95.5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人.

解:(1)依题意可知第二组第一位学生的编号为004.

(2)a,b,c,d,e的值分别为13,4,0.30,0.08,1.

频率分布直方图如下:

(3)被抽到的学生中获二等奖的人数约为9+2=11,占样本的比例是11

50=0.22,即获二等奖的概率为22%,所以参赛学生中获二等奖的人数估计为200×22%=44.

答:参赛学生中获得二等奖的学生大约有44人.

20.(2014·湖南)对一个容量为N的总体抽取容量为n的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则()

A.p1=p2

B.p2=p3

C.p1=p3

D.p1=p2=p3

答案 D

解析由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p1=p2=p3.

21.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取

一个容量为200人的样本,则高中二年级被抽取的人数为( ) A .28 B .32 C .40 D .64

答案 D

解析 由已知,得样本容量为400+320+280=1 000, 所以,高中二年级被抽取的人数为200

1 000

×320=64,选D.

22.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,用茎叶图表示上述两组数据,对两块地抽取树苗的高度的平均数x 甲,x 乙和中位数y 甲,y 乙进行比较,下面结论正确的是( ) A.x 甲>x 乙,y 甲>y 乙 B.x 甲y 乙 D.x 甲>x 乙,y 甲

23.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________.

答案 125,124

解析 由图可知(a +a -0.005)×10=1-(0.010+0.015+0.030)×10,解得a =0.025,则x =105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.中位数在120~130之间,设为x ,则0.01×10+0.03×10+0.025×(x -120)=0.5,解得x =124.

24.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是__________. 答案 1

解析 当x ≥4时,89+89+92+93+92+91+947=640

7

≠91,

∴x <4,∴89+89+92+93+92+91+x +90

7=91,

∴x =1.

25.(2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10

解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5, 则由题意知x 1+x 2+x 3+x 4+x 55

=7,

(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x -7|=3可得x =10或x =4. 由|x -7|=1可得x =8或x =6.

由上可知参加的人数分别为4,6,7,8,10, 故最大值为10.

数学第一章统计案例测试1新人教A版选修1 2

高中新课标选修(1-2)统计案例测试题1 一、选择题 1.下列属于相关现象的是() A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 答案:B 2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足() A.23.841K?B.23.841K? C.26.635K?D.26.635K? 答案:A 3.如图所示,图中有5组数据,去掉组数据后(填字母代),剩下的4组数据的线性相关性最大() A.EB.CC.DD.A 答案:A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结 果(单位:人) 不患肺癌患肺癌不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91

9 965 根据表中数据,你认为吸烟与患肺癌有关的把握有() A.90% B.95% C.99% D.100% 答案:C 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 晚上白天合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89 你认为婴儿的性别与出生时间有关系的把握为() A.80% B.90% C.95% D.99% 答案:B 6.已知有线性相关关系的两个变量建立的回归直线方程为yabx??,方程中的回归系数b() A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 答案:A 7.每一吨铸铁成本c y(元)与铸件废品率x%建立的回归方程568c yx??,下列说法正确的是() A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 答案:C 8.下列说法中正确的有:①若0r?,则x增大时,y也相应增大;②若0r?,则x增

高中数学第三章统计案例3.1独立性检验假设检验(hypothesistesting素材苏教版选修2_3202012251102

假设检验(hypothesis testing) 方法演变:t检验、z检验、F检验、卡方检验,方差分析( ANOVA) ?概述 假设检验是分析数据的一种方法。回答此类问题:“随机发生的事件的概率是多少?”另一方面的问题是:“我们从数据中发现的结果是真的吗?”当问题是有关大的总体而只能得到总体的一个样本时用假设检验。这种方法被用来回答在质量改进中一系列重要的问题,如“我们在过程中所做的改变对产出创造了有意义的差别吗?”或”顾客对场地A的满意度是不是比其他场地高?” 最常用的检验是:z检验、t检验、F检验、卡方(χ2)检验和方差分析。这些检验和其他的检验都是基于均值、方差、比例及其他统计量所形成的具有常见模式的频率分布。最有名的分布就是正态分布,它是:检验的基础。t检验、F检验和卡方(χ2)检验是基于t分布、F分布和卡方分布。 ?适用场合 ·想知道一组或更多组数据的平均值、比例、方差或其他特征时; ·当结论是基于更大总体中所取得的样本时。 例如: ·想确定一个过程的均值或方差有否改变; ·想确定很多数据集的均值或方差是否不同: ·想确定两组不同的数据集的比例是否不同; ·想确定真正的比例、均值或方差是否和一个定值相等(或大于或小于)。 ?实施步骤 假设检验的步骤由三部分组成:理解要解决的问题并安排检验(以下步骤1~3);数字计算通常由计算机完成(步骤4和步骤5);应用数值结果到实际问题中(步骤6)。虽然计算机能处理数字,但理解假没检验隐含的观念对第1部分和第3部分至关重要。 如果第一次接触假设检验,那么从看“注意事项”中的术语和定义开始。这些定义解释了假设检验的慨念,然后再回来看这个步骤。 本书不可能详细地涉及假设检验。这个步骤是个综述和快速参考。要得到更多的信息,查阅统计学参考书或请教统计学家。 1确定要从数据中获得的结论。选择适当的检验方法。用哪种检验取决于检验的目的和数据的种类。可以用表5.7和表5.8概括的常用的假设检验,或者请教统计学家以得到帮助。 2建立零假设和备择假设。确定问题是属于双尾检验、左尾检验还是右尾检验。 3选择显著性水平。。 4计算检验统计量,可借助计算机软件。 5用统计分布的统计表或计算机程序等来确定检验统计量的P值。对于z检验可用表A.1正态曲线以下的曲线。 6把P值与左尾或右尾检验的α或者双尾检验的α/2作比较,如果P值较小,那么拒绝零假设并会得到备择假设可能正确的结论。否则,不能拒绝零假设,并得出没有足够证据支持备择假设的结论。 ?备择步骤 步骤1~4同上。然后: 5用统计表或计算机程序确定如下所示的检验统计量的临界值和拒绝域。以z检验作为示例,对t检验、F检验或卡方检验,用统计量f、F或χ2来替换z。 6比较检验统计量和拒绝域。如果检验统计量值落在拒绝域内,拒绝零假设,结论是备择假设可能止确。否则,不拒绝零假设,结论是没有足够的证据支持备择假设。 ?示例:t检验

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

数学选修23第三章统计案例教案

第三章 统计案例 §3.1 独立性检验(1) 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人, 不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 为了研究这个问题,(1)引导学生将上述数据用下表来表示: 一.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ22 ()-=∑ 观测值预期值预期值 )来进行估计. 卡方χ2统计量公式: χ2() ()()()() 2 n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2的值应该很小.把37,183,21,274a b c d ====代入计算得 χ211.8634=,统计学中有明确的结论,在0H 成立的情况下,随机事件“2 6.635χ≥” 发生的概率约为0.01,即2 ( 6.635)0.01P χ ≥≈,也就是说,在0H 成立的情况下,对统计量χ2进行多次观测, 观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”. 象以上这种用2 χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.

专题五 第1讲 统计与统计案例(解析版)

第1讲 统计与统计案【典例】 【要点提炼】 考点一 统计图表 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率 组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 【热点突出】 【典例】1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A .这11天复工指数和复产指数均逐日增加 B .这11天期间,复产指数增量大于复工指数的增量 C .第3天至第11天复工复产指数均增大都超过80% D .第9天至第11天复产指数增量大于复工指数的增量 【答案】 CD (2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根

据调查结果绘制学生周末阅读时间的频率分布直方图如图所示: 将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是( ) A.抽样表明,该校约有一半学生为阅读霸 B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸 【答案】 A 【解析】根据频率分布直方图可列下表: 阅读时间(分 钟) [0,10 ) [10,20) [20,30) [30,40) [40,50) [50,60] 抽样人数(名) 10 18 22 25 20 5 抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸. 易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂. (2)频率分布直方图中纵坐标不要误以为频率. 【拓展训练】1 (1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是( )

第一章《统计案例》练习

----------专业最好文档,专业为你服务,急你所急,供你所需------------- §1.1 独立性检验 1.当χ2>2.706时,就有________的把握认为“x 与y 有关系”. 2.分类变量X 和Y .(填序号) ①ad -bc 越小,说明X 与Y 的关系越弱; ②ad -bc 越大,说明X 与Y 的关系越强; ③(ad -bc )2越大,说明X 与Y 的关系越强; ④(ad -bc )2越接近于0,说明X 与Y 的关系越强. 3.通过随机询问110 χ2=110×(40×30-20×20) 60×50×60×50 ≈7.8,得到的正确结论是________. ①在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”; ②在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”; ③有99%以上的把握认为“爱好该项运动与性别有关”; ④有99%以上的把握认为“爱好该项运动与性别无关”. 4.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸 则有________的把握确定吸烟量与年龄有关. 5.下列说法正确的是________.(填序号) ①对事件A 与B 的检验无关,即两个事件互不影响;

----------专业最好文档,专业为你服务,急你所急,供你所需------------- ②事件A 与B 关系越密切,χ2就越大; ③χ2的大小是判断事件A 与B 是否相关的惟一数据; ④若判定两事件A 与B 有关,则A 发生B 一定发生. 6 设H 0:主修统计专业与性别无关,则 χ2的值约为________,从而得出结论有 把握认为主修统计专业与性别有关系,这种判断出错的可能性为________. 7.某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在[29.94,30.06)的 零件为优质品.从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表: (1)分别估计两个分厂生产的零件的优质品率; (2)由以上统计数据填写2×2列联表,并问是否有99%的把握认为“两个分厂生产的零件的质量有差异”.

(新)高中数学第一章统计案例1_1独立性检验假设检验素材新人教B版选修1-21

假设检验 1、某厂生产的化纤纤度服从正态分布 )04.0,(2 μN 。某天测得25根纤维的纤度的均值39.1=x ,问与原设计的标准值1.40有无显著差异?(取05.0=α) 解 设厂生产的化纤纤度为X ,则总体)04.0,(~2μN X ,且总体方差2204.0=σ已 知。顾客提出要检验的假设为 40 .1:0=μH , 40.1:1≠μH 因为已知总体标准差04.0=σ,所以选用U 检验,且在0H 成立的条件下有 )1,0(~25 04.00 N X U μ-= 针对备择假设40.1:1≠μH ,拒绝域的形式可取为 } /{0 c n X U W >-= =σμ 为使犯第一类错误的概率不超过05.0=α,就要在40.10 =μ时,使临界值c 满足 ()05 .0=>c U P 成立。由此,在给定显著性水平05.0=α时,得到临界值为 96 .1975.02/1===-u u c α 故相应的拒绝域为

{} 96.1>=U W 利用来自总体的样本值求得 25 .125 /04.040.139.1-=-= u 即 975 .096.125.1u u =<= 成立。显然,样本未落在拒绝域内,因此在05.0=α水平上认为纤维的纤度与原设计的标准值1.40没有显著差异。 2、设某厂生产的洗衣机的使用寿命(单位:小时)X 服从正态分布),(2σu N 但2 ,σu 未 知。随机抽取20台,算得样本均值1832=X ,样本标准差=S 497,检验该厂生产的洗衣机的平均使用时数“2000=μ”是否成立?(取检验水平05.0=α) 解 待检验假设 2000 0=μ:H 20001≠μ:H H 的拒绝域: 21α - >t T =2.093 T 的观测值 512 .1/2000 -=-=n S X T W ∈ 不能拒绝 H ,可以认为洗衣机的平均使用时数“2000=u ”. 3、在正常情况下,某炼钢厂的铁水含碳量(%)X ~ ),.(2 554σN (σ未知)。一日测得5炉铁水含碳量如下:

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

单元测试:选修2-3第三章《统计案例》

选修2-3第三章《统计案例》 (时间120分钟 满分150分) 一、选择题(共60分) 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相 同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1 次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( ) A.310 B.29 C.78 D.79 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( ) A.E B.C C.D D.A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95% C.99% D.100% 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90% C.95% D.99% 6.已知有线性相关关系的两个变量建立的回归直线方程为$ y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91 9965 晚上 白天 合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89

2015届高考数学二轮专题训练:专题七 第3讲 统计与统计案例

第3讲 统计与统计案例 考情解读 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等.2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题. 1.随机抽样 (1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数

(2)方差:s 2=1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 标准差: s = 1 n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q =∑i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是 则K 2 (χ2 )=n (ad -bc )2 (a +b )(c +d )(a +c )(b +d ) (其中n =a +b +c +d 为样本容量). 热点一 抽样方法 例1 (1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为( ) A .11 B .12 C .13 D .14 (2)(2014·石家庄高三调研)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________. 思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例. 答案 (1)B (2)200 解析 (1)由840 42=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为 720-48020=240 20 =12. (2)本题属于分层抽样,设该学校的教师人数为x ,所以1603 200=160-150 x ,所以x =200.

统计案例一_----独立性检验

统计案例一独立性检验 研修学院数学教研室闻岩 一、课标要求 学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。 内容与要求 1.统计案例(约14课时) 通过典型案例,学习下列一些常见的统计方法,并能初步应用这些方法解决一些实际问题。 (1)通过对典型案例(如“肺癌与吸烟有关吗”等)的探究,了解独立性检验(只要求22列联表)的基本思想、方法及初步应用。 (2)通过对典型案例(如“质量控制”“新药是否有效”等)的探究,了解实际推断原理和假设检验的基本思想、方法及初步应用(参见例1)。------删掉了 (3)通过对典型案例(如“昆虫分类”等)的探究,了解聚类分析的基本思想、方法及初步应用。------删掉了 (4)通过对典型案例(如“人的体重与身高的关系”等)的探究,进一步了解回归的基本思想、方法及初步应用。 说明与建议 1.统计案例的教学中,应鼓励学生经历数据处理的过程,培养他们对数据的直观感觉,认识统计方法的特点(如统计推断可能犯错误,估计结果的随机性),体会统计方法应用的广泛性。应尽量给学生提供一定的实践活动机会,可结合数学建模的活动,选择1个案例,要求学生亲自实践。对于统计案例内容,只要求学生了解几种统计方法的基本思想及其初步应用,对于其理论基础不作要求,避免学生单纯记忆和机械套用公式进行计算。 2.教学中,应鼓励学生使用计算器、计算机等现代技术手段来处理数据,有条件的学校还可运用一些常见的统计软件解决实际问题。 例1某地区羊患某种病的概率是0.4,且每只羊患病与否是彼此独立的。今研制一种新的预防药,任选5只羊做实验,结果这5只羊服用此药后均未患病。问此药是否有效。 初看起来,会认为这药一定有效,因为服药的羊均未患病。但细想一下,会有问题,因为大部分羊不服药也不会患病,患病的羊只占0.4左右。这5只羊都未患病,未必是药的作用。分析这问题的一个自然想法是:若药无效,随机抽取5只羊都不患病的可能性大不大。若这件事发生的概率很小,几乎不会发生,那么现在我们这几只羊都未患病,应该是药的效果,即药有效。 现假设药无效,5只羊都不生病的概率是 (1-0.4)5≈0.078. 这个概率很小,该事件几乎不会发生,但现在它确实发生了,说明我们的假设不对,药是有效的。 这里的分析思想有些像反证法,但并不相同。给定假设后,我们发现,一个概率很小几乎不会发生的事件却发生了,从而否定我们的“假设”。 应该指出的是,当我们作出判断“药是有效的”时,是可能犯错误的。犯错误的概率是0.078。也就是说,我们有近92%的把握认为药是有效的。 二、全国考纲的要求 17.统计案例 了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题. ①独立检验 列联表)的基本思想、方法及简单应用. 了解独立检验(只要求22

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

数学: 专题十五 统计、统计案例

专题十五 ? ?? 统计、统计案例 [题组全练]

1.(2018·石家庄模拟)某校高一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为() A.80B.120 C.160 D.240 解析:选A因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该 抽取男生的人数为140× 4 4+3 =80,故选A. 2.(2018·南宁模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为() A.100,20 B.200,20 C.200,10 D.100,10 解析:选B由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选 B. 3.从30个个体(编号为00~29)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列中的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为() 92644607202139207766381732561640 5858 7766 3170 0500 2593 0545 5370 7814 2889 6628 6757 8231 1589 0062 0047 3815 5131 8186 3709 4521 6665 5325 5383 2702 9055 7196 2172 3207 1114 1384 4359 4488 A.76,63,17,00B.16,00,02,30 C.17,00,02,25 D.17,00,02,07 解析:选D在随机数表中,将处于00~29的号码选出,满足要求的前4个号码为17,00,02,07. 4.(2019届高三.南昌调研)某校高三(2)班现有64名学生,随机编号为0,1,2, (63) 依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8

第一章 统计案例 复习题

第一章 统计案例 复习题 一、选择题 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.如果有95%的把握说事件A 和B 有关,那么具体算出的数据满足( ) A.2 3.841K > B.2 3.841K < C.2 6.635K > D.2 6.635K < 3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费; ③家庭的支出与收入.其中不是函数关系的有( ) A.0个 B.1个 C.2个 D.3个 4.当2 3.841K >时,认为事件A 与事件B ( ) A.有95%的把握有关 B.有99%的把握有关 C.没有理由说它们有关 D.不确定 5.已知回归直线方程 y bx a =+,其中3a =且样本点中心为(1 2),,则回归直线方程为( ) A.3y x =+ B.23y x =-+ C.3y x =-+ D.3y x =- 6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表: 你认为性别与是否喜欢数学课程之间有关系的把握有( ) A.0 B.95% C.99% D.100% 7.在回归直线方程 y a bx =+中,回归系数b 表示( ) A.当0x =时,y 的平均值 B.x 变动一个单位时,y 的实际变动量 C.y 变动一个单位时,x 的平均变动量 D.x 变动一个单位时,y 的平均变动量 8.对于回归分析,下列说法错误的是( ) A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定 B.线性相关系数可以是正的,也可以是负的 C.回归分析中,如果21r =,说明x 与y 之间完全相关 D.样本相关系数(11) r ∈-, 9. 在画两个变量的散点图时,下面哪个叙述是正确的( ) (A)预报变量在x 轴上,解释变量在y 轴上 (B)解释变量在x 轴上,预报变量在y 轴上 (C)可以选择两个变量中任意一个变量在x 轴上(D)选择两个变量中任意一个变量在y 轴上 10、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是( ) A.身高一定是145.83cm; B.身高在145.83cm 以上; C.身高在145.83cm 以下; D.身高在145.83cm 左右. 11、两个变量y 与x 的回归模型中,分别选择了4个不同模型,它们的相关指数2R 如下 ,其中拟合效果最好的模型是( ) A.模型1的相关指数2R 为0.98 B.模型2的相关指数2R 为0.80 C.模型3的相关指数2R 为0.50 D.模型4的相关指数2R 为0.25 12、在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是( ) A.总偏差平方和 B.残差平方和 C.回归平方和 D.相关指数R 2 13、工人月工资y (元)依劳动生产率x (千元)变化的回归直线方程为?6090y x =+,下列判断正确的是( ) A.劳动生产率为1000元时,工资为50元 B.劳动生产率提高1000元时,工资提高150元 C.劳动生产率提高1000元时,工资提高90元 D.劳动生产率为1000元时,工资d 的90元 14、对分类变量X 与Y 的随机变量2K 的观测值K ,说法正确的是( ) A . k 越大," X 与Y 有关系”可信程度越小; B . k 越小," X 与Y 有关系”可信程度 越小; C . k 越接近于0," X 与Y 无关”程度越小 D . k 越大," X 与Y 无关”程度越大 15、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )

高中数学统计案例--独立性检验 同步练习

统计案例--独立性检验 同步练习 1、下列关于卡方2χ的说法正确的是( ) A.2χ在任何相互独立问题中都可用与检验是否相关 B. 2χ的值越大,两个事件的相关性越大 C.2χ是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这类问题 D. ) )()()(() (2d b c a d c b a bc ad n ++++-= χ. 2、在吸烟与患肺病这两个分类变量的计算中,下列说法中正确的是( ) A. 若统计量635.62>χ,我们有99%的把握说吸烟与患肺病有关,则某人吸烟,那么他有99%的可能患有肺病 B. 若从统计中求出,有99%的把握说吸烟与患肺病有关,则在100个吸烟者中必有99人患有肺病 C. 若从统计量中求出有95%把握说吸烟与患肺病有关,是指有5%的可能性使得推断错误 D. 以上说法均错误 3 A. 种子经过处理跟是否生病有关 B. 种子经过处理跟是否生病无关 C. 种子是否经过处理决定是否生病 D. 以上都是错误的 4、若由一个22?列联表中的数据计算得013.42=χ,那么有 的把握认为两个变量有关系. 5、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 ,在此假设下构造2χ统计量.如果2χ的观测值较大,那么在一定程度上说明假设 . 6、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该搜集那些数据? . 7、打鼾不仅影响别人休息,而且可能与患某种疾病有关,下表是一次调查所得数据,试问:每一晚都打与患心脏病有关吗?有多大把握认为你的结论成立?

8、为了研究某种新药的副作用(如恶心等),给50位患者服用此新药,另外50名患者服用 9、某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查者中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查者中,工作积极的40人,工作一般的63人. (1)根据以上数据建立一个2 2 的列联表; (2)对于人力资源部的研究项目,根据以上数据可以认为企业的全体员工对待企业改革的 态度与其工作积极性是否有关系?

统计案例分析典型例题

统计案例分析及典型例题 §抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案3,9,18 4.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量n= . 答案80 例1某大学为了支援我国西部教育事业,决定从2007应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请 用抽签法和随机数表法设计抽样方案. 解抽签法: 第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀; 第四步:从盒子中逐个抽取6个号签,并记录上面的编号; 基础自测

第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09. 第四步:找出以上号码对应的志愿者,就是志愿小组的成员. 例2 某工厂有1 003名工人,从中抽取10人参加体检,试用系统抽样进行具体实施. 解 (1)将每个人随机编一个号由0001至1003. (2)利用随机数法找到3个号将这3名工人剔除. (3)将剩余的1 000名工人重新随机编号由0001至1000. (4)分段,取间隔k= 10 0001=100将总体均分为10段,每段含100个工人. (5)从第一段即为0001号到0100号中随机抽取一个号l. (6)按编号将l ,100+l ,200+l,…,900+l 共10个号码选出,这10个号码所对应的工人组成样本. 例3 (14分)某一个地区共有5个乡镇,人口3万人,其中人口比例为3∶2∶5∶2∶3,从3万人中抽取一个300人 的样本,分析某种疾病的发病率,已知这种疾病与不同的地理位置及水土有关,问应采取什么样的方法并写出具体过程. 解 应采取分层抽样的方法. 3分 过程如下: (1)将3万人分为五层,其中一个乡镇为一层. 5分 (2)按照样本容量的比例随机抽取各乡镇应抽取的样本. 300×153=60(人);300× 15 2 =40(人); 300×155=100(人);300×15 2=40(人); 300× 15 3=60(人), 10分 因此各乡镇抽取人数分别为60人,40人,100人,40人,60人. 12分 (3)将300人组到一起即得到一个样本. 14分

第一章统计案例单元检测题及答案

第一章统计案例 命题人:卧龙寺中学鲁向阳审题人:唐军宁 第I卷 说明:本试卷分第I卷(选择题)和第II卷(非选择题)两部分,共150分,时间90分钟 一、选择题:(每小题5分,共计60分) 1.下列结论正确的是() ①函数关系是一种确定性关系;②相关关系是一种非确定性关系; ③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系两个变量进行统计分析的一种常用方法.A.①②B.①②③C.①②④D.①②③④ 2.年劳动生产率x(千元)和工人工资y(元)之间回归方程为y=10+70x,这意味着年劳动生产率每提高1千元时,工人工资平均() A.增加70元B.减少70元C.增加80元D.减少80元 3.已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则 回归直线方程为() A.y=1.23x+4 B.y=1.23x+5 C.y=1.23x+0.08 D.y=0.08x+1.23 4.高二第二学期期中考试,按照甲、乙两个班级学生数学考试成绩优秀和不优秀统计后,得到班级与成绩列联表如下: 则随机变量2K的观测值约为() A.0.60 B.0.828 C.2.712 D.6.004 5.下列属于相关现象的是() A.利息与利率C.电视机产量与苹果产量 B.居民收入与储蓄存款D.某种商品的销售额与销售价格 6.下列关系中是函数关系的是() A.等边三角形的边长和周长关系C.电脑的销售额和利润的关系B.玉米的产量和施肥量的关系 D.日光灯的产量和单位生产成本关系7. 一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93。用这个模型预测这个孩子10岁时的身高,则正确的叙述是() A.身高一定是145.83cm C.身高在145.83cm以下 B.身高在145.83cm以上D.身高在145.83cm左右 8. 变量y与x之间的回归方程表示() A. y与x之间的函数关系 B. y与x之间的不确定性关系 C. y与x之间的真实关系 D. y与x之间的真实关系达到最大限度的吻合

2021届高三新题数学9月(适用新高考)专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例 一、单选题 1.(2020·河南宛城·南阳华龙高级中学月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥, 1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =???都在直线2 15 y x = +上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 二、多选题 2.(2020·江苏省丰县中学期末)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算2K 的观测值 5.059k ≈,则可以推断出( ) 附: A .该俱乐部的男性会员对运动场所满意的概率的估计值为 2 3 ; B .调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意; C .有97.5%的把握认为男性会员、女性会员对运动场所的评价有差异; D .有99%的把握认为男性会员、女性会员对运动场所的评价有差异. 第II 卷(非选择题)

三、解答题 3.(2020·河南宛城·南阳华龙高级中学月考(文))微信是现代生活中进行信息交流的重要工具.据统计,某公司200名员工中0090的人使用微信,其中每天使用微信时间少于一小时的有60人,其余的员工每天使用微信时间不少于一小时,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中0075是青年人.若规定:每天使用微信时间不少于一小时为经常使用微信,那么经常使用微信的员工中 2 3 都是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,完成22?列联表: (2)由列联表中所得数据判断,能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”? 2 2 ()()()()() n ad bc k a b c d a c b d -=++++ 4.(2020·江苏泰州·期末)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x , y 的数据如下:

相关文档
相关文档 最新文档