文档库 最新最全的文档下载
当前位置:文档库 › 高中数学第三章统计案例单元质量测评新人教A版选修23

高中数学第三章统计案例单元质量测评新人教A版选修23

高中数学第三章统计案例单元质量测评新人教A版选修23
高中数学第三章统计案例单元质量测评新人教A版选修23

高中数学第三章统计案例单元质量测评新人教A 版选修23

第三章 单元质量测评

本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分,考试时间120分钟.

第Ⅰ卷 (选择题,共60分)

一、选择题(本大题共12小题,每小题5分,共60分) 1.下列属于相关关系的是( ) A .利息与利率 B .居民收入与储蓄存款 C .电视机产量与苹果产量 D .某种商品的销售额与销售价格 答案 B

解析 A 与D 是函数关系,C 中两变量没有关系,B 中居民收入与储蓄存款是相关的,但不具有函数关系.

2.已知一个线性回归方程为y ^

=1.5x +45,其中x 的取值依次为1,7,5,13,19,则y -=( )

A .58.5

B .46.5

C .60

D .75

答案 A

解析 x -=1+7+5+13+195=9,因为回归直线必过样本点的中心(x -,y -),所以y -

1.5×9+45=13.5+45=58.5.故选A.

3.利用独立性检验来考察两个分类变量X 和Y 是否有关系时,通过查阅下表来确定“X 与Y 有关系”的可信程度.如果k ≥5.024,那么就有把握认为“X 与Y 有关系”的百分比为( )

A .25%

B .75%

C .2.5%

D .97.5%

答案 D

解析 k =5.024对应的0.025是“X 和Y 有关系”不合理的程度,因此两个分类变量有关系的可信程度约为97.5%.

4.工人月工资(元)依劳动生产率(千元)变化的回归方程为y ^

=50+80x ,下列判断正确的是( )

①劳动生产率为1000元时,则工资为130元;②劳动生产率提高1000元时,则工资提高80元;③劳动生产率提高1000元时,则工资提高130元;④当月工资210元,劳动生产率为200元.

A .①

B .②

C .③

D .④

答案 B

解析 ∵回归直线斜率为80,∴x 每增加1千元,y ^

增加80,即劳动生产率提高1000元时,工资提高80元.

5.如图,5个(x ,y )数据,去掉D (3,10)后,下列说法错误的是( )

A .相关系数r 变大

B .残差平方和变大

C .R 2

变大

D .解释变量x 与预报变量y 的相关性变强 答案 B

解析 由散点图知,去掉D 后,x ,y 的相关性变强,且为正相关,所以r 变大,R 2

变大,残差平方和变小.

6.如图所示的是一组观测值的四个线性回归模型对应的残差图,则对应的线性回归模型的拟合效果最好的残差图是( )

答案 A

解析 因为残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适.故选A.

7.已知方程y ^

=0.85x -85.7是根据女大学生的身高预报体重的回归方程,其中x ,y ^

的单位分别是cm ,kg ,则该方程在样本(165,57)处的残差是( )

A .54.55

B .2.45

C .3.45

D .111.55

答案 B

解析 当x =165时,y ^

=0.85×165-85.7=54.55,所以残差为57-54.55=2.45. 8.为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:

作文成绩优秀

作文成绩一般

总计 课外阅读量较大

22

10

32

课外阅读量一般

8 20 28 总计

30

30

60

由以上数据,计算得到K 2

的观测值k ≈9.643,根据临界值表,以下说法正确的是( ) A .没有充足的理由认为课外阅读量大与作文成绩优秀有关 B .有0.5%的把握认为课外阅读量大与作文成绩优秀有关

C .有99.9%的把握认为课外阅读量大与作文成绩优秀有关

D .有99.5%的把握认为课外阅读量大与作文成绩优秀有关 答案 D

解析 根据临界值表,9.643>7.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关,即有99.5%的把握认为课外阅读量大与作文成绩优秀有关.

9.根据一位母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单位:

岁)的线性回归方程y ^

=7.19x +73.93,用此方程预测10岁时的身高,有关叙述正确的是( )

A .身高一定为145.83 cm

B .身高大于145.83 cm

C .身高小于145.83 cm

D .身高在145.83 cm 左右 答案 D

解析 用线性回归方程预测的不是精确值,而是估计值.当x =10时,y ^

=145.83,只能说身高在145.83 cm 左右.

10.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:

由表中数据,求得线性回归方程为y =-4x +a ,若在这些样本点中任取一点,则它在回归直线左下方的概率为( )

A.13

B.12

C.16

D.2

3 答案 A

解析 由表中数据得x -=6.5,y -

=80.由点(6.5,80)在直线y ^

=-4x +a ^

上,求得a ^

=106,

即线性回归方程为y ^

=-4x +106.经过计算可知只有点(5,84)和点(9,68)在回归直线的左下方,于是所求概率为26=1

3

.故选A.

11.两个分类变量X 和Y ,值域分别为{x 1,x 2}和{y 1,y 2},其样本频数分别是a =10,b =21,c +d =35.若X 与Y 有关系的可信程度不小于97.5%,则c 等于( )

A .3

B .4

C .5

D .6

附:

答案 A

解析 列2×2列联表如下:

故K 2

k =66×[10(35-c )-21c ]2

31×35×(10+c )(56-c )≥5.024. 把选项A ,B ,C ,D 代入验证可知选A.

12.变量x 与y 具有线性相关关系,当x 分别取16,14,12,8时,通过观测得到与之对应的y 的值分别为11,9,8,5,若在实际问题中,y 的最大值是10,则x 的最大值不能超过( )

A .16

B .17

C .15

D .12

答案 C

解析 根据题意可知,y 与x 呈正相关关系,由最小二乘法或计算器求得回归系数a ^

≈-

0.857,b ^

≈0.729,所以回归直线方程为y ^

=0.729x -0.857,当y ^

=10时,得x ≈15.故应选C.

第Ⅱ卷 (非选择题,共90分)

二、填空题(本大题共4小题,每小题5分,共20分)

13.某种产品的广告费支出x 与销售额y (单位:万元)线性相关,两者之间有如下表所示

的数据,根据数据得到其回归方程为y ^

=6.5x +b ,现要使销售额达到100万元,则广告费支出约为________万元.

答案 12.7

解析 ∵x -=2+4+5+6+8

5

=5,

y -

30+40+60+50+70

5

=50,

又(x -,y -

)满足y ^

=6.5x +b , ∴50=32.5+b ,∴b =17.5,

∴当y =100时,x =100-17.5

6.5≈12.7万元.

14.下面是一个2×2列联表:

其中表示a ,b 处的值分别为________、________. 答案 52 37

解析 a =73-21=52,b =21+16=37. 15.下列关于K 2

的说法中,正确的有________. ①K 2

的值越大,两个分类变量的相关性越大; ②K 2

的计算公式是K 2

n (ad -bc )

(a +b )(c +d )(a +c )(b +d )

③若求出K 2

=4>3.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;

④独立性检验就是选取一个假设H 0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H 0的推断.

答案 ③④

解析 对于①,K 2

的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错误;对于②,(ad -bc )应为(ad -bc )2

,故②错误;③④正确.

16.若两个分类变量X 和Y 的列联表为:

则X与Y之间有关系的概率约为________.答案0.999

解析由题中所给数据易得

K2=(5+15+40+10)×(5×10-40×15)2

(5+15)×(40+10)×(5+40)×(15+10)

≈18.8,查表知P(K2≥10.828)≈0.001.

三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)

17.(本小题满分10分)以下是某地区不同身高的未成年男性的体重平均值表

(1)给出两个回归方程:

①y=0.4294x-25.318,

②y=2.004e0.0197x.

通过计算,得到它们的相关指数分别是:R21=0.9311,R22=0.998.试问哪个回归方程拟合效果最好?

(2)若体重超过相同身高男性平均值的1.2倍为偏胖,低于0.8为偏瘦,那么该地区某中学一男生身高为175 cm,体重为78 kg,他的体重是否正常?

解(1)∵R22>R21,

∴选择第二个方程拟合效果最好.

(2)把x=175代入y=2.004e0.0197x,得y=62.97,

由于78

62.97

=1.24>1.2,所以这名男生偏胖.

18.(本小题满分12分)某运动员训练次数与成绩之间的数据关系如下:

(1)作出散点图;

(2)求出回归方程;

(3)进行残差分析;

(4)计算相关指数R2.

解(1)作出该运动员训练次数(x)与成绩(y)之间的散点图,如图,由散点图可知,它们之间具有线性相关关系.

(2)x

=39.25,y

=40.875,∑

i=1

8

x2i=12656,

i=1

8

y2i=13731,∑

i=1

8

x i y i=13180,

∴b

^

i=1

8

x i y i-8x-y-

i=1

8

x2i-8x-2

≈1.0415,

a

^

=y

-b

^

x-=-0.003875.

∴回归方程为y

^

=1.0415x-0.003875.

(3)残差分析

某运动员训练次数与成绩之间的数据及相应的残差数据:

x 30333537

y 30343739

e

^

=y-y

^

-1.2411-0.36560.55140.4684

x 39 44 46 50 y

42 46 48 51 e ^

=y -y ^

1.3854

0.1779

0.0949

-1.0711

作残差图如图:

由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)计算相关指数R 2

计算得相关指数R 2=0.9855.说明了该运动员的成绩的差异在98.55%是由训练次数引起的.

19.(本小题满分12分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.

根据已知条件完成下面的2×2列联表,并据此资料,你是否认为“体育迷”与性别有关?

解 (1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25.

“非体育迷”人数为75,则据题意完成2×2列联表:

将2×2列联表的数据代入公式计算: K 2

=100×(30×10-45×15)2

75×25×45×55

≈3.030>2.706.

所以在犯错误的概率不超过0.10的前提下可以认为“体育迷”与性别有关.

20.(本小题满分12分)某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:

已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为2

5.

(1)求列联表中的数据x ,y ,A ,B 的值;

(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?

(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关?

附:K 2

=n (ad -bc )2

(a +b )(c +d )(a +c )(b +d )

P (K 2≥k 0) 0.15 0.10 0.05 0.025 0.010 0.005 0.001

k 0

2.072 2.706

3.841 5.024 6.635 7.879 10.828

解 (1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件A , 由已知得P (A )=

y +30100

=2

5

,所以y =10,B =40,x =40,A =60. (2)由(1)知北京暴雨后支持率为4050=4

5,

不支持率为1-45=1

5,

北京暴雨前支持率为2050=2

5,

不支持率为1-25=3

5

.

条形统计图如图所示,由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度.

(3)K 2

=100(30×40-20×10)2

50×50×40×60=100000050×20×60=50

3

≈16.7>10.828.

故至少有99.9%的把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.

21.(本小题满分12分)某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:

该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.

(1)求选取的2组数据恰好是相邻两个月数据的概率;

(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据求出y 关于x 的线性回

归方程y ^

=b ^

x +a ^

(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?

参考公式:b ^

∑i =1

n

(x i -x -)(y i -y -

)

∑i =1

n

(x i -x -

)2

,a ^ =y --b ^

x -.

解 (1)设抽到相邻两个月的数据为事件A .

从6组数据中选取2组数据,共有15种情况,每种情况都是等可能出现的.其中,抽到相邻两个月的数据的情况有5种.所以P (A )=515=1

3

.

(2)由数据求得x -=11,y -

=24,

由公式求得b ^

=187,a ^=y --b ^ x -=-307,所以y 关于x 的线性回归方程为y =187x -30

7

.

(3)当x =10时,y ^

1507,????

??1507-22<2;

当x =6时,y ^

787,????

??787-12<2, 所以该小组所得线性回归方程是理想的.

22.(本小题满分12分)某报社为了解大学生对国产电影的关注情况,就“是否关注国产电影”这一问题,随机调查了某大学的60名男生和60名女生,得到如下列联表:

(1)从这60名女生中按“是否关注国产电影”进行分层抽样,抽取一个容量为6的样本,再从中随机选取2名进行深度采访,求“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率;

(2)根据以上列联表,问有多大把握认为“大学生关注国产电影与性别有关”.

附:K 2

=n (ad -bc )2

(a +b )(c +d )(a +c )(b +d )

,其中n =a +b +c +d .

解 (1)根据分层抽样,可得抽取的容量为6的样本中,关注国产电影的女生有6

60

×40=4(名),不关注国产电影的女生有6

60

×20=2(名).

所以“选到关注国产电影的女生与不关注国产电影的女生各1名”的概率为P =C 14C 1

2C 26=8

15.

(2)根据题中的列联表,得K 2

的观测值 k =120×(50×20-40×10)290×30×60×60

≈4.444.

由P (K 2

≥3.841)=0.05,可知有95%的把握认为“大学生关注国产电影与性别有关”.

数学选修2-3第三章-统计案例阶段测试3(含详

数学选修2-3第三章-统计案例阶段测试3(含详细答案)

阶段测试三 (第三章统计案例) (时间:120分钟,满分:150分) 一、选择题(每小题5分,共60分) 1.下列关系中是相关关系的是() ①路程与时间、速度的关系; ②加速度与力的关系; ③产品成本与产量的关系; ④圆周长与面积的关系; ⑤广告费支出与销售额的关系. A.①②④B.①③⑤ C.③⑤D.③④⑤ 2.下列说法中表述恰当的个数为() ①相关指数R2可以刻画回归模型的拟合效果,R2越接近于1,说明模型的拟合效果越好; ②在线性回归模型中,R2表示解释变量对预报变量的贡献率,R2越接近于1,表示解释变量

和预报变量的线性相关关系越强; ③若残差图中个别点的残差比较大,则应确认在采集样本点的过程中是否有人为的错误或模型是否恰当. A.0 B.1 C.2 D.3 3.(2016·重庆南开中学期末)巧克力很甜、很好吃,数学很妙、很有趣,某中学统计了部分同学“爱吃巧克力”与“数学成绩好”的关系,得到下表: 经计算得k≈4.167,由此可以判断()

参考数据: A.至少有99%的把握认为“数学成绩好” 与“爱吃巧克力”有关 B .至少有95%的把握认为“数学成绩好” 与“爱吃巧克力”有关 C . 至少有99%的把握认为“数学成绩好” 与“爱吃巧克力”无关 D .至少有95%的把握认为“数学成绩好” 与“爱吃巧克力”无关 4.某车间为了规定工时定额,需要确定加 工零件所花费的时间,为此进行了5次试验,收集数据如下:

经检验,这组样本数据具有线性相关关系,那么对于加工零件的个数x与加工时间y这两个变量,下列判断正确的是() A.成正相关,其回归直线经过点(30,75) B.成正相关,其回归直线经过点(30,76) C.成负相关,其回归直线经过点(30,76) D.成负相关,其回归直线经过点(30,75) 5.下列关于等高条形图说法正确的是() A.等高条形图表示高度相对的条形图 B.等高条形图表示的是分类变量的频数 C.等高条形图表示的是分类变量的百分比 D.等高条形图表示的是分类变量的实际高度 6.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出()

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

数学选修23第三章统计案例教案

第三章 统计案例 §3.1 独立性检验(1) 1. 某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人, 不吸烟者295人.调查结果是:吸烟的220人中有37人患呼吸道疾病(简称患病),183人未患呼吸道疾病(简称未患病);不吸烟的295人中有21人患病,274人未患病. 问题:根据这些数据能否断定“患呼吸道疾病与吸烟有关”? 为了研究这个问题,(1)引导学生将上述数据用下表来表示: 一.建构数学 1.独立性检验: (1)假设0H :患病与吸烟没有关系. 若将表中“观测值”用字母表示,则得下表: 如果实际观测值与假设求得的估计值相差不大,就可以认为所给数据(观测值)不能否定假设0H .否则,应认为假设0H 不能接受,即可作出与假设0H 相反的结论. (2)卡方统计量: 为了消除样本对上式的影响,通常用卡方统计量(χ22 ()-=∑ 观测值预期值预期值 )来进行估计. 卡方χ2统计量公式: χ2() ()()()() 2 n ad bc a b c d a c b d -=++++(其中n a b c d =+++) 由此若0H 成立,即患病与吸烟没有关系,则χ2的值应该很小.把37,183,21,274a b c d ====代入计算得 χ211.8634=,统计学中有明确的结论,在0H 成立的情况下,随机事件“2 6.635χ≥” 发生的概率约为0.01,即2 ( 6.635)0.01P χ ≥≈,也就是说,在0H 成立的情况下,对统计量χ2进行多次观测, 观测值超过6.635的频率约为0.01.由此,我们有99%的把握认为0H 不成立,即有99%的把握认为“患病与吸烟有关系”. 象以上这种用2 χ统计量研究吸烟与患呼吸道疾病是否有关等问题的方法称为独立性检验.

高中数学专题――概率统计专题.

专题二概率统计专题 【命题趋向】概率与统计是高中数学的重要学习内容,它是一种处理或然问题的方法,在工农业生产和社会生活中有着广泛的应用,渗透到社会的方方面面,概率与统计的基础知识成为每个公民的必备常识.概率与统计的引入,拓广了应用问题取材的范围,概率的计算、离散型随机变量的分布列和数学期望的计算及应用都是考查应用意识的良好素材.在高考试卷中,概率与统计的内容每年都有所涉及,以解答题形式出现的试题常常设计成包含离散型随机变量的分布列与期望、统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.解答概率统计试题时要注意分类与整合、化归与转化、或然与必然思想的运用.由于中学数学中所学习的概率与统计内容是最基础的,高考对这一部分内容的考查注重考查基础知识和基本方法.该部分在高考试卷中,一般是2—3个小题和一个解答题. 【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有一个发生的概率,古典概型,几何概型,条件概率,独立重复试验与二项分布,超几何分布,离散型随机变量的分布列,离散型随机变量的期望和方差,抽样方法,总体分布的估计,正态分布,线性回归等.【例题解析】 题型1 抽样方法 -)中,在公证部门监督下按照随机抽取的方法确【例1】在1000个有机会中奖的号码(编号为000999 定后两位数为的号码为中奖号码,该抽样运用的抽样方法是() A.简单随机抽样B.系统抽样C.分层抽样D.以上均不对 分析:实际“间隔距离相等”的抽取,属于系统抽样. 解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B. 点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2)系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体. 例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为() A.24B.18C.16D.12 Array 分析:根据给出的概率先求出x的值,这样就可以知道三年级的学生人数,问题就解决了. x=?=,这样一年级和二年级学生的解析:C 二年级女生占全校学生总数的19%,即20000.19380 +++=,三年级学生有500人,用分层抽样抽取的三年级学生应是总数是3733773803701500 64 50016 ?=.答案C. 2000 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识. 例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系, 2500,3500(元)月收入段应抽要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[) 出人.

2018版高中数学第一章统计1.3统计图表学案

1.3 统计图表 1.掌握常用四种统计图表(条形统计图、扇形统计图、折线统计图和茎叶图)的功能及其特点.(重点) 2.能针对实际问题和收集到的数据的特点,选择科学的统计图表.(难点) 3.能从统计图表中获取有价值的信息.(难点、易错点) [基础·初探] 教材整理1 统计图表 阅读教材P16~P20“练习1”以上部分,完成下列问题. 1.条形统计图 条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按照一定的顺序排列起来.其优点是便于看出和比较各种数量的多少,即条形统计图能清楚地表示出每个项目的具体数目,易于比较数据间的差别.缺点是不能明确显示部分与整体的对比. 2.折线统计图 建立直角坐标系,用横轴上的数字表示样本值,用纵轴上的单位长度表示一定的数量,根据样本值和数量的多少描出相应点,然后用直线段顺次连接相邻点,得到一条折线,用这条折线表示样本数据情况,这种表述和分析数据的统计图称为折线统计图.折线统计图不但可以表示数量的多少,而且能够用折线的起伏清楚直观地表示数量的增减变化的情况,但不适合总体分布较多的情况. 3.扇形统计图 扇形统计图中,用圆面积代表总体,圆面中的各个扇形分别代表总体中的不同部分,扇形面积的大小反映所表示的那部分占总体的百分比的大小.优点:扇形统计图可以很清楚地表示各部分数量同总数之间的关系,即扇形统计图能清楚地表示出各部分在总体中所占的百分比.缺点:会丢失部分数据信息且不适合总体中部分较多的情况. 判断(正确的打“√”,错误的打“×”) (1)扇形统计图比其他统计图更优越.( )

(2)统计图和统计表相比,用直线、折线来说理比用数据说理来的形象一些,数量关系也更明显.( ) (3)要反映台州市某一周每天的最高气温的变化趋势,宜采用条形统计图.( ) 【解析】(1)×,扇形统计图与其他统计图各有优缺点. (2)√,统计图比统计表表达的更明确. (3)×,适合用折线统计图. 【答案】(1)×(2)√(3)× 教材整理2 茎叶图 阅读教材P21第三自然段到P22“信息技术应用”以上部分,完成下列问题. 1.茎叶图 茎叶图的制作:茎相同的共用一个茎,茎按从小到大的顺序从上到下列出,共茎的叶一般按从大到小或从小到大的顺序同时列出. 2.用茎叶图表示数据有两个突出特点 第一,统计图上没有信息的损失,所有的原始数据都可以从这个茎叶图中得到; 第二,茎叶图可以随时记录,方便表示与比较. 但是,当数据量很大或有多组数据时,茎叶图就不那么直观、清晰了. 判断(正确的打“√”,错误的打“×”) (1)制作茎叶图时,茎叶图的茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.( ) (2)茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.( ) (3)茎叶图对重复出现的数据不可以重复记录.( ) 【解析】(1)√,结合茎叶图的做法,茎按从小到大的顺序从上向下列出,叶无规定的顺序. (2)√,结合茎叶图的特点可知,用茎叶图表达两组数据很方便,但若是多组数据,却不是那么方便,直观、清晰了. (3)×,茎叶图中的数据应当全部记录,不可以遗漏,包括重复数据. 【答案】(1)√(2)√(3)× [小组合作型]

2020版高中数学 第三章 统计案例 3.2 独立性检验的基本思想及其初步应用学案 新人教A版选修2-3

§3.2 独立性检验的基本思想及其初步应用 学习目标 1.了解分类变量的意义.2.了解2×2列联表的意义.3.了解随机变量K 2 的意义.4.通过对典型案例分析,了解独立性检验的基本思想和方法. 知识点一 分类变量及2×2列联表 思考 山东省教育厅大力推行素质教育,增加了高中生的课外活动时间,某校调查了学生的课外活动方式,结果整理成下表: 体育 文娱 合计 男生 210 230 440 女生 60 290 350 合计 270 520 790 如何判定“喜欢体育还是文娱与性别是否有联系”? 答案 可通过表格与图形进行直观分析,也可通过统计分析定量判断. 梳理 (1)分类变量 变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量. (2)列联表 ①定义:列出的两个分类变量的频数表,称为列联表. ②2×2列联表 一般地,假设有两个分类变量X 和Y ,它们的取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(也称为2×2列联表)为下表. y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d a + b + c +d 知识点二 等高条形图 1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征. 2.如果通过直接计算或等高条形图发现a a + b 和 c c +d 相差很大,就判断两个分类变量之间有关系. 知识点三 独立性检验

1.定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. 2.K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d为样本容量. 3.独立性检验的具体做法 (1)根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定临界值k0. (2)利用公式计算随机变量K2的观测值k. (3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”. 1.列联表中的数据是两个分类变量的频数.( √) 2.事件A与B的独立性检验无关,即两个事件互不影响.( ×) 3.K2的大小是判断事件A与B是否相关的统计量.( √) 类型一等高条形图的应用 例1 为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下: 组别阳性数阴性数总计 铅中毒病人29736 对照组92837 总计383573 试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系? 考点定性分析的两类方法 题点利用图形定性分析 解等高条形图如图所示: 其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率. 由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系.

高中数学统计与概率知识点(原稿)

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高中数学第三章统计案例2独立性检验教学案北师大版选修2_3

§2独立性检验 [对应学生用书P40] 1.2×2列联表 设A ,B 为两个变量,每个变量都可以取两个值,变量A :A 1,A 2=A - 1;变量B :B 1,B 2 =B - 1,用下表表示抽样数据 并将此表称为2.χ2 的计算公式 χ2 = n ad -bc 2a +b c + d a +c b +d . 3.独立性判断的方法 (1)当χ2 ≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的; (2)当χ2>2.706时,有90%的把握判定变量A ,B 有关联; (3)当χ2>3.841时,有95%的把握判定变量A ,B 有关联; (4)当χ2>6.635时,有99%的把握判定变量A ,B 有关联. (1)独立性检验是一种假设检验,在对总体的估计中,通过抽取样本,构造合适的统计量,对假设的正确性进行判断. (2)使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性. [对应学生用书P41]

[例1] 在调查的6名患有色盲,试作出性别与色盲的列联表. [思路点拨] 在2×2列联表中,共有两类变量,每一类变量都有两个不同的取值,然后出相应的数据,列表即可. [精解详析] 根据题目所给的数据作出如下的列联表: [一点通] 1.下面是一个2×2列联表:则表中a ,b 处的值分别为( ) A.32,40 B C .74,82 D .64,72 解析:a =53-21=32,b =a +8=40. 答案:A 2.某学校对高三学生作一项调查后发现:在平时的模拟考试中,性格内向的426名学生中有332名在考前心情紧张,性格外向的594名学生中在考前心情紧张的有213人.试作出2×2列联表. 解:列联表如下:

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

单元测试:选修2-3第三章《统计案例》

选修2-3第三章《统计案例》 (时间120分钟 满分150分) 一、选择题(共60分) 1.下列属于相关现象的是( ) A.利息与利率 B.居民收入与储蓄存款 C.电视机产量与苹果产量 D.某种商品的销售额与销售价格 2.已知盒中装有3只螺口与7只卡口灯泡,这些灯泡的外形与功率都相 同且灯口向下放着,现需要一只卡口灯泡,电工师傅每次从中任取一只并不放回,则在他第1 次抽到的是螺口灯泡的条件下,第2次抽到的是卡口灯泡的概率为 ( ) A.310 B.29 C.78 D.79 3.如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大( ) A.E B.C C.D D.A 4.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人, 得到如下结果(单位:人) 根据表中数据,你认为吸烟与患肺癌有关的把握有( ) A.90% B.95% C.99% D.100% 5.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表: 你认为婴儿的性别与出生时间有关系的把握为( ) A.80% B.90% C.95% D.99% 6.已知有线性相关关系的两个变量建立的回归直线方程为$ y a bx =+,方程中的回归系数b ( ) A.可以小于0 B.只能大于0 C.可以为0 D.只能小于0 7.每一吨铸铁成本c y (元)与铸件废品率x %建立的回归方程568c y x =+,下列说法正确的是( ) A.废品率每增加1%,成本每吨增加64元 B.废品率每增加1%,成本每吨增加8% C.废品率每增加1%,成本每吨增加8元 D.如果废品率增加1%,则每吨成本为56元 8.下列说法中正确的有:①若0r >,则x 增大时,y 也相应增大;②若0r <,则x 增大时,y 也相应增大;③若1r =,或1r =-,则x 与y 的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上( ) A.①② B.②③ C.①③ D.①②③ 9.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计,得到一个卖出的热饮杯数与当天气温的对比表: 不患肺病 患肺病 合计 不吸烟 7775 42 7817 吸烟 2099 49 2148 合计 9874 91 9965 晚上 白天 合计 男婴 24 31 55 女婴 8 26 34 合计 32 57 89

高中数学 1.3 统计图表课后作业 北师大版必修3

§3统计图表 一、非标准 1.某支股票近10个交易日的价格如下: 下列几种统计图中,表示上面的数据较合适的是( ) A.条形统计图 B.扇形统计图 C.折线统计图 D.茎叶图 解析:对于股票,我们最关心它的涨跌情况,即价格的增减变化情况,因此用折线统计图较合适. 答案:C 2.某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用的时间的数据,结果用条形统计图(如下图)表示.根据条形统计图可得这50名学生这一天平均每人的课外阅读时间为( ) A.0.6时 B.0.9时 C.1.0时 D.1.5时 解析:这50名学生这一天平均每人的课外阅读时间为(0×5+0.5×20+1.0×10+1.5×10+2.0×5)÷50=0.9(时). 答案:B 3.如图是甲、乙、丙、丁四组人数的扇形统计图的部分结果,根据扇形统计图的情况可以知道丙、丁两组人数和为( ) A.250 B.150 C.400 D.300 解析:甲组人数是120,占30%,则总人数是=400.则乙组人数是400×7.5%=30,则丙、丁两组人数和为400-120-30=250. 答案:A 4.如图是某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图,则甲、乙两人这几场比赛得

的最高分分别为( ) A.51,83 B.41,47 C.51,47 D.41,83 答案:B 5.甲、乙两班学生的体育成绩的条形统计图如图所示,不用计算,体育成绩好的班级是( ) A.甲班 B.乙班 C.甲、乙一样 D.无法确定 解析:由两个条形统计图中各部分的人数可知乙班学生的体育成绩好一些. 答案:B 6.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委对参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91.复核员在复核时,发现有一个数字(茎叶图中的x)无法看清.若记分员计算无误,则数字x应该是( ) A.1 B.2 C.4 D.6 解析:若x≤4,因为平均分为91,所以总分应为637,即637=89+89+92+93+92+91+90+x,所以x=1.若x>4,637≠89+89+92+93+92+91+94=640,不合题意. 答案:A 7.某班学生在课外活动中参加文娱、美术、体育小组的人数之比为3∶1∶6,则在扇形统计图中表示参加体育小组人数的扇形对应的圆心角的度数是. 解析:所求圆心角的度数是×100%×360°=216°. 答案:216° 8.如图是某市5月1日至5月7日每天最高、最低气温的折线统计图,在这7天中,日温差最大的一天是,最大日温差等于℃. 解析:逐一计算发现,5月5日的日温差最大,最大日温差为24.5-12=12.5(℃). 答案:5月5日12.5

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习 A组 一、选择题 1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为() A.200 B.240 C.400 D.480 解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400. 2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为() A.3 B.4 C.12 D.21

解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为4 10= 2 5, 所以估计昆明市2020年4月份空气质量为优的天数为30×2 5=12,故选C. 3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是() A.最低气温与最高气温为正相关 B.10月的最高气温不低于5月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在1月 D.最低气温低于0 ℃的月份有4个 解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D. 4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关

高中数学必修三 概率与统计

高中数学必修三:概率与统计 1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,8,16,32 2.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克B.360千克C.36千克D.30千克 3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y的值分别为()A.2,5B.5,5C.5,8D.8,8 4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是( ). A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2 D.直线l1和l2必定重合 5..设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y=0.85x-85.71,则下列结论中不正确的是( ).A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg

高中数学统计、统计案例知识点总结和典例

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

高中数学概率与统计测试题

概率与统计 1.如果一个整数为偶数的 概率为 (1)a+b 为偶数的概率; (2)a+b+c 为偶数的概率。 0.6 ,且 a,b,c 均为整数,求 2.从 10 位同学 (其中 6 女,4 男)中随机选出 3 位参加测验,每位女同学能通过测验的概率 43 均为,每位男同学能通过测验的概率均为,求55 (1)选出的 3 位同学中,至少有一位男同学的概率; (2)10 位同学中的女同学甲和男同学乙同时被选中且通过测验的概率。 3.袋中有 6 个白球, 4 个红球,甲首先从中取出 3 个球,乙再从余下的 7 个球中取出 4 个球,凡取得红球多者获胜。试求 (1)甲获胜的概率; (2)甲,乙成平局的概率。 4.箱子中放着 3 个 1 元硬币, 3 个 5 角硬币, 4 个 1 角硬币,从中任取 3 个,求总钱数超过 1 元 8 角的概率。 5.有 10 张卡片,其号码分别位 1,2,3?,10,从中任取 3 张。 (1)求恰有 1 张的号码为 3 的倍数的概率; (2)记号码为 3 的倍数的卡片张数为ξ,求ξ的数学期望。 6.某种电子玩具按下按钮后,会出现白球或绿球,已知按钮第一次按下后,出现红球与绿球 1 的概率都是,从按钮第二次按下起,若前次出现红球,则下次出现红球、绿球的概率2 1 2 3 2 分别为, ;若前次出现绿球,则下次出现红球、绿球的概率分别为, ,记第 n(n ∈ 3 3 5 5 N,n ≥1) 次按下后,出现红球的概率为P n

(1)求P2的值; (2)当 n∈N,n ≥2 时,求用P n 1表示P n的表达式; (3)求P n关于 n 的表达式。 7.有甲、乙两个盒子 ,甲盒子中有 8 张卡片 ,其中两张写有数字 0,三张写有数字 1 ,三张写有数字 2 ;乙盒子中有 8 张卡片,其中三张写有数字 0,两张写有数字1,三张写有数字 2 , (1) 如果从甲盒子中取两张卡片,从乙盒子中取一张卡片,那么取出的 3 张卡片都写有 1 的概率是多少? (2)如果从甲、乙盒子中各取一张卡片,设取出的两张卡片数字之和为ξ,求ξ的分布列和期望。 8.甲、乙两位同学做摸球游戏,游戏规则规定:两人轮流从一个放有 1 个白球, 3 个黑球, 2 个红球且只有颜色不同的 6 个小球的暗箱中取球,每次每人只取一球,每取出一个后立即放回,另一个人接着取,取出后也立即放回,谁先取到红球,谁为胜者,现甲先取 (1) 求甲摸球次数不超过三次就获胜的概率; (2) 求甲获胜的概率。 9.设有均由 A,B,C 三个部件构成的两种型号产品甲和乙,当A或 B 是合格品并且 C 是合格 品时,甲是正品;当 A, B 都是合格品或者 C 是合格品时,乙是正品。若 A 、 B、C 合格的概率均是 P,这里 A ,B,C 合格性是互相独立的。 (1) 产品甲为正品的概率P1是多少? (2)产品乙为正品的概率P2 是多少? (3)试比较P1与P2的大小。 10.一种电路控制器在出厂时每四件一等品装成一箱,工人在装箱时不小心把两件二等品和两件一等品装入了一箱,为了找出该箱的二等品,我们对该箱中的产品逐一取出进行测试。 (1) 求前二次取出的都是二等品的概率; (2) 求第二次取出的是二等品的概率; (3)用随机变量ξ表示第二个二等品被取出时共取的件数,求ξ的分布列及数学

2020版人教A版数学选修2-3同步配套__第三章 统计案例第三章检测(B)

第三章检测(A) (时间:90分钟满分:120分) 附:K2- 一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的) 1在建立两个变量y与x的回归模型时,分别选择了4个不同的模型,它们的R2如下,其中拟合得最好的模型为 () A.模型1的R2为0.75 B.模型2的R2为0.90 C.模型3的R2为0.25 D.模型4的R2为0.55 2的值越大,意味着残差平方和越小,也就是说拟合效果越好. 2随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表. 由K2- 得K2的观测值k-9.616. 则正确的结论是() A.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别有关” B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关” C.在犯错误的概率不超过0.005的前提下,认为“生育意愿与城市级别有关” D.在犯错误的概率不超过0.005的前提下,认为“生育意愿与城市级别无关” 3工人月工资y(单位:元)与劳动生产率x(单位:千元)变化的线性回归方程为 下列说法中正确的是 A.劳动生产率每提高1 000元,月工资提高150元左右 B.劳动生产率每提高1 000元,月工资提高90元左右 C.劳动生产率为1 000元时,月工资提高90元

D.以上说法都不正确 ,而是预报变量可能取值的平均值,因此当劳动生产率每提高1 000元,月工资提高90元左右.故选B. 4根据如下样本数据: x345678 得到的回归方程为则 A C y值总体上是随x值的增大而减少 的,故又回归直线过第一象限故纵截距故选 5已知变量x与y正相关,且由观测数据算得样本平均 数则由该观测数据算得的线性回归方程可能是 A C x与y正相关,可知x的系数为正,排除C,D.而所有的回归直线必经过 点由此排除B,故选A. 6为考察A,B两种药物预防某疾病的效果,进行动物试验,分别得到如下等高条形图: 药物A试验结果药物B试验结果

相关文档
相关文档 最新文档