文档库 最新最全的文档下载
当前位置:文档库 › 考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例
考点46 随机抽样、用样本估计总体、变量间的相关关系、统计案例

温馨提示:

此题库为Word版,请按住Ctrl,滑动鼠标滚轴,调节合适的观看比例,关闭Word文档返回原板块。

考点46 随机抽样、用样本估计总体、变量间的

相关关系、统计案例

一、选择题

1. (2012·湖北高考文科·T2)容量为20的样本数据,分组后的频数如下表:

则样本数据落在区间[10,40)的频率为( )

(A)0.35 (B)0.45

(C)0.55 (D)0.65

【解题指南】解答本题先要读懂频数分布表,再结合频率的求法求解.

【解析】选B.数据落在区间[10,40)内的频数为9,样本容量为20,所求频率=0.45.

P=9

20

2.(2012·湖南高考文科·T5)与(2012·湖南高考理科·T4)相同

设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列结论中不正确的是()

(A)y与x具有正的线性相关关系

(B)回归直线过样本点的中心(x,y)

(C)若该大学某女生身高增加1cm,则其体重约增加0.85kg

(D)若该大学某女生身高为170cm,则可断定其体重必为58.79kg

【解题指南】根据线性相关,回归直线,样本点的中心等相关概念判断.

【解析】选D.

bx可知直线

3. (2012·陕西高考文科·T3)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是()(A)46,45,56 (B) 46,45,53

(C) 47,45,56 (D) 45,47,53

【解题指南】根据中位数、众数、极差的概念进行计算,注意观察茎叶图中的数据.

【解析】选A. 茎叶图中共有30个数据,所以中位数是第15个和第16个数字

的平均数,即1

(4547)46

2

+=

,排除C,D;再计算极差,最小数据是12,最大数据

是68,所以681256-=,故选A.

4.(2012·陕西高考理科·T6)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )

(A) x x <甲乙,m 甲>m 乙 (B) x x <甲乙,m 甲甲乙,m 甲>m 乙 (D) x x >甲乙,m 甲

【解题指南】平均数的大小可以根据茎叶图中数据分布的集中位置进行判断,中位数则需要确定第8个数与第9个数的平均值,然后再比较大小 【解析】选

B.观察茎叶图可知x x <甲乙,甲组数据中的中位数是1

(1822)20

2+=,乙组

数据中的中位数是1

(2731)292+=,∴m 甲

B.

5.(2012·安徽高考理科·T5)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )

()A 甲的成绩的平均数小于乙的成绩的平均数 ()B 甲的成绩的中位数等于乙的成绩的中位数 ()C 甲的成绩的方差小于乙的成绩的方差 ()D 甲的成绩的极差小于乙的成绩的极差

【解题指南】根据平均数、方差、中位数的定义计算即可.

【解析】选C .

甲的成绩的

方差为221(2212)25?+?=,乙的成绩的方差为221(1331) 2.4

5?+?=.甲的成绩的极差

为4,乙的成绩的极差为4.

6. (2012·新课标全国高考文科·T3)在一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )(n ≥2,x 1,x 2,…,x n 不全相等)的散点图中,若所有样本点(x i ,y i )(i=1,2,…,n)都在直线y=1

2x+1上,则这组样本数据的样本相关系数为( )

(A )-1 (B )0 (C )1

2

(D )1

【解题指南】理清相关系数与相关性强弱的关系是解决本题的关键. 【解析】选D. 样本相关系数越接近1,相关性越强,现在所有的样本点都在直线

1

12y x =

+上,样本的相关系数应为1.

7.(2012·江西高考文科·T6)小波一星期的总开支分布图如图1所示,一 星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比 为( )

(A)30% (B)10% (C)3% (D)不能确定

【解题指南】读图,理清鸡蛋开支、食品开支与总开支之间的百分比关系. 【解析】选C.由图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30

元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%.

8. (2012·江西高考理科·T9)样本()12,,n x x x …,的平均数为x ,样本

的平均数为y

()x y ≠.若样本

的平均数

()1z x y

αα=+-,其中

1

02α<<

,则,n m 的大小关系为( )

(A)n m < (B )n m > (C )n m = (D )不能确定 【解题指南】用,x y 表示出z ,结合已知条件,建立m n α、、所满足的关系式,由

α的范围获得,n m 所满足的不等关系,进而判断出n 与m 的大小关系.

【解析】选A.由已知得12+n x x x nx ++=…,12+m y y y my ++=…,

()()1212+n m x x x y y y z m n

++++++=

+……nx m y

m n +=+=()1x y αα+-

整理得

()()10x y m n αα-+-=????,

,x y ≠∴()10m n αα+-=

即1n m αα=

-,又10,,0121ααα??∈∴<< ?-??,1,n n m m ∴<∴<.

9.(2012·山东高考文科·T4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ) (A)众数 (B)平均数 (C)中位数 (D)标准差 【解题指南】本题考查用样本的数字特征来估计总体.

【解析】选D. B 样本数据恰好是A 样本数据都加2后所得数据,则众数、中位数、平均数比原来的都多2,而标准差不变.

10.(2012·山东高考理科·T4)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机

抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[]1,450的人做问卷A ,编号落入区间[]451,750的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷

B 的人数为( )

(A )7 (B )9 (C )10 (D )15

【解题指南】本题考查系统抽样方法和数列项数的计算方式,由系统抽样抽出的数的编号是等差数列.

【解析】选C. 采用系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即30=l ,第k 组的号码为

得2516≤≤k ,则满足2516≤≤k 的整数k 有10个,故应选C. 二、填空题

11.(2012·天津高考理科·T9)某地区有小学150所,中学75所,大学25所,现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取__________所学校,中学中抽取__________所学校. 【解题指南】根据抽取样本的比例计算. 【解析】从小学中抽取

1503

30=30=18150+75+255

??(所),同理可得从中学中抽取

753

30=30=9150+75+2510

??(所).

【答案】18 9

12. (2012·山东高考文科·T14)如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分

组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].

已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于

25.5℃的城市个数为____.

【解题指南】本题考查频率分布直方图,关键是抓住纵轴表示的是频率/组距. 【解析】最左边两个矩形面积之和为0.10×1+0.12×1=0.22,总城市数为11÷0.22=50,最右面矩形面积为0.18×1=0.18,50×0.18=9. 【答案】9

13.(2012·湖北高考文科·T11)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有______人.

【解题指南】本题考查分层抽样,解答本题的关键是求出入样率.

【解析】由8

42656?=,可知结果.

【答案】6

14.(2012·浙江高考文科·T11)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为____________.

【解题指南】利用抽样比乘以组内人数即可求出. 【解析】此样本中男生人数为

【答案】160

15.(2012·广东高考文科·T13)由正整数组成的一组数据1234,,,,x x x x 其平均数和中位数都是2,且标准差等于1,则这组数据为 .(从小到大排列) 【解题指南】本题是考查统计的有关知识,要知道平均数及中位数(按从小到大或从大到小的顺序排列,若奇数个数据取中间的数,若偶数个数据取中间两

个数的平均数)的求法,以及标准差公式.

【解析】假设这组数据按从小到大的顺序排列为1234,x x x x ,,,

则1234

142323+++=2,+=4,4

+=4,+=2,2x x x x x x x x x x ????∴??

????

2212(2)(2)2x x ∴-+-=,

同理可求得

22

34(2)(2)2x x -+-=, 由1234,x x x x ,,,均为正整数,且1234()()x x x x ,,

,均为圆22(2)(2)2x y -+-=上的点,分析知1234,x x x x ,,,应为1,1,3,3. 【答案】1,1,3,3

16.(2012·福建高考文科·T14)一支田径队有男女运动员98人,其中男运动员有56人.按男女比例用分层抽样的方法,从全体运动员中抽出一个容量为28的样本,那么应抽取女运动员人数是_______.

【解题指南】女运动员本来占多大的比例,抽取后也应该占多大的比例,这就是分层抽样的精髓.

【解析】由题意知,女运动员数为42,因此抽取的女运动员人数为42

281298?

=.

【答案】12

17.(2012·江苏高考·T2)某学校高一、高二、高三年级的学生人数之比为3:

3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_______名学生.

【解题指南】关键算出高二年级学生人数在总数中的比例.

【解析】高二年级学生人数占总数的

3

10,样本容量为50,则50×

3

10=15.

【答案】15.

18.(2012·辽宁高考文科·T19)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图;

将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.

(Ⅰ)根据已知条件完成下面的22 列联表,并据此资料你是否认为“体育迷”与性别有关?

(Ⅱ)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超

级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.

2

2

112212211212(),

n n n n n n n n n χ++++-

=

【解题指南】(1)据频率分布直方图可计算“体育迷”, “非体育迷”人数,按照提供的公式,计算相关数值,与所给数据比较,获得结论;(2)将所有的基本事件罗列,很容易解决问题. 【解析】由所给的频率分布直方图知, “体育迷”人数为100(100.020100.005)25??+?=

“非体育迷”人数为75,则据题意完成22?列联表:

非体育迷 体育迷 合计 男 30 15 45 女 45 10 55 合计

75

25

100

将22?列联表的数据代入公式计算:

2100(30104515)21122122175254555

11221221

()100 3.03033n n n n n n n n n χ?-????-===≈???22100(30104515)22122175254555221221)100 3.03033n n n n n n ?-????-==≈?? 因为3.030 3.841<,所以没有理由认为“体育迷”与性别有关. (2)由所给的频率分布直方图知 “超级体育迷”人数为100(100.005)5??=, 记(1,2,3)i a i =表示男性,

(1,2)

j b j =表示女性,所有可能结果构成的基本事件空间为

{}12132311213112223212(),(),(),(),(),(),(),(),(),()

a a a a a a a

b a b a b a b a b a b b b Ω=,共有10个基本事件组成,

且每个基本事件出现是等可能的;用A 表示事件“任选2人,至少1名女性”,

则{}11213112223212(),(),(),(),(),(),()A a b a b a b a b a b a b b b =,共有7个基本事件组成,故“任选2人,至少1名女性”的概率为

7()10P A =

.

19. (2012·安徽高考文科·T18)若某产品的直径长与标准值的差的绝对值不超过1mm 时,则视为合格品,否则视为不合格品.在近期一次产品抽样检查中,从某厂生产的此种产品中,随机抽取5000件进行检测,结果发现有50件不合格品.计算这50件不合格品的直径长与标准值的差(单位:mm ), 将所得数据分组,得到如下频率分布表:

(Ⅰ)将上面表格中缺少的数据填在相应的位置上;

(Ⅱ)估计该厂生产的此种产品中,不合格品的直径长与标准值的差落在区间(1,3]内的概率;

(Ⅲ)现对该厂这种产品的某个批次进行检查,结果发现有20件不合格品.据此估算这批产品中的合格品的件数. 【解析】(I )

(Ⅱ)不合格品的直径长与标准值的差落在区间(1,3]内的概率为0.50.20.7+=. (Ⅲ)合格品的件数为

5000

2020198050?

-=(件)

20.(2012·湖南高考文科·T17)(本小题满分12分)某超市为了解顾客的购物量及结算时间等信息,安排一名员工随机收集了在该超市购物的100位顾客的相关数据,如下表所示.

已知这100位顾客中的一次购物量超过8件的顾客占55%. (Ⅰ)确定x ,y 的值,并估计顾客一次购物的结算时间的平均值;

(Ⅱ)求一位顾客一次购物的结算时间不超过2分钟的概率.(将频率视为概率) 【解析】(Ⅰ)由已知得251055,35,15,20y x y x y ++=+=∴==,该超市所有顾客一次购物的结算时间组成一个总体,所收集的100位顾客一次购物的结算时间可视为总体的一个容量为100的简单随机样本,顾客一次购物的结算时间的平均值可用样本平均数估计,其估计值为:

115 1.530225 2.520310

1.9

100?+?+?+?+?=(分钟).

(Ⅱ)记A 为事件“一位顾客一次购物的结算时间不超过2分钟”,123,,A A A 分别表示事件“该顾客一次购物的结算时间为1分钟”, “该顾客一次购物的结算时间为1.5分钟”, “该顾客一次购物的结算时间为2分钟”.将频率视为概率,得

123153303251(),(),()10020100101004P A P A P A =

=====.

12

3123,,,A A A A A A A =且是互斥事件,

123123()()()()()

P A P A A A P A P A P A ∴==++3317

2010410=

++=

.

故一位顾客一次购物的结算时间不超过2分钟的概率为7

10.

21.(2012·福建高考文科·T18)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据: (Ⅰ)求回归直线方程y bx a =+,其中20b =-,a y bx =-;

(Ⅱ)预计在今后的销售中,销量与单价仍然服从(I )中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) 【解析】(Ⅰ)由于

1234561

()8.56x x x x x x x =

+++++=,

1234561

()80

6y y y y y y y =+++++=.

所以80208.5250a y bx =-=+?=,

从而回归直线方程为?20250y

x =-+. (Ⅱ)设工厂获得的利润为L 元,依题意得

22(20250)4(20250)20330100020(8.25)361.25L x x x x x x =-+--+=-+-=--+

当且仅当8.25x =时,L 取得最大值,

故当单价定为8.25元时,工厂可获得最大利润.

22.(2012·广东高考文科·T17)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100]

.

(1)求图中α的值;

(2)根据频率分布直方图,估计这100名学生语文成绩的平均分. (3)若这100名学生语文成绩某些分数段的人数(x )与数学成绩相应分数段的人数(y )之比如下表所示,求数学成绩在[50,90)之外的人数.

【解题指南】(1)本题根据每个区间上的矩形的面积和为1,可建立关于a 的方程,解出a 的值.

(2)由频率分布直方图求平均分:每个区间的中点值乘以区间上矩形面积之和. (3)本题关键是先把语文成绩在[50,60),[60,70),[70,80),[80,90)的人数求出来.根据每段的频率求出每段的频数.

【解析】(1)由频率分布直方图知(0.040.030.022)101,0.005a a +++?=∴=. (2)550.05650.4750.3850.2950.0573?+?+?+?+?=.

所以平均分为73分.

(3) 分别求出语文成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为

?=?=?=?=.

0.051005,0.410040,0.310030,0.210020

所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为:

-+++=(人). 5,20,40,25.所以数学成绩在[50,90)之外的人数有100(5204025)10

关闭Word文档返回原板块。

统计与统计案例真题与解析

统计与统计案例 A 级 基础 一、选择题 1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n 人中抽取81人进行问卷调查,已知高二被抽取的人数为30,那么n =( ) A .860 B .720 C .1 020 D .1 040 2.为规范学校办学,某省教育厅督察组对某所高中进行了抽样调查.抽到的班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中还有一位同学的编号应是( ) A .13 B .19 C .20 D .51 3.“关注夕阳、爱老敬老”——某爱心协会从2013年开始每年向敬老院捐赠物资和现金,下表记录了第x 年(2013年是第一年)与捐赠的现金y (单位:万元)的对应数据,由此表中的数据得到了y 关于x 的线性回归方程y ^ =mx +0.35,则预测2019年捐赠的现金大约是( ) A.5万元 C .5.25万元 D .5.5万元 4.如图所示的茎叶图记录了甲乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )

A.3,5 B.5,5 C.3,7 D.5,7 5.(2019·衡水中学检测)某超市从2019年甲、乙两种酸奶的日销售量(单位:箱)的数据中分别随机抽取100个,并按(0,10],(10,20],(20,30],(30,40],(40,50]分组,得到频率分布直方图如下: 记甲种酸奶与乙种酸奶的日销售量(单位:箱)的方差分别为s21,s22,则频率分布直方图(甲)中的a的值及s21与s22的大小关系分别是() A.a=0.015,s21s22 C.a=0.015,s21>s22D.a=0.15,s21

案例统计公式(绝对精华)

统计案例 一、回归分析 1. 线性回归方程???y bx a =+的求法 (1)求变量x 的平均值,即1231 ()n x x x x x n =+++???+ (2)求变量y 的平均值,即1231 ()n y y y y y n = +++???+ (3)求变量x 的系数?b ,即1 2 1 ()() ?() n i i i n i i x x y y b x x ==--=-∑∑(题目给出,不用记忆) 1 2 1()() ?() n i i i n i i x x y y b x x ==--=-∑∑ 1 1 1 1 2 2 1 1 1 2n n n n i i i i i i i i n n n i i i i i x y x y xy x y x xx x =======--+= -+∑∑∑∑∑∑∑1 22 21 2n i i i n i i x y nx y nx y nx y x nx nx ==--+= -+∑∑12 21 n i i i n i i x y nx y x nx ==-= -∑∑(理解记忆) (其中1 1 n n i i i x x nx ====∑∑,1 1 n n i i i y y ny ====∑∑,() ,x y 称为样本点中心) (4)求常数?a ,即??a y bx =- (5)写出回归方程???y bx a =+(?a ,?b 的意义:以?a 为基数,x 每增加1个单位,y 相应地平均增加?b 个单位) 注意:若?0b >则正相关,若?0b <则负相关. 2. 相关系数 假设两个随机变量的取值分别是()11,x y ,()22,x y ,……,(),n n x y ,则变量间线性相关系数的计算公式如下: ()() n n i i i i x x y y x y nx y r ---= = ∑∑ 相关系数r 的性质: (1)当0r >时,表明两个变量正相关;当0r <时,表明两个变量负相关;当0r =时,表明

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

【免费下载】概率论与数理统计案例

实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.解:设每张彩票中奖的数额为随机变量X , 则X 10000 5000 1000 100 10 0p 51/1052/10510/105100/1051000/100p 每张彩票平均能得到奖金 05512()10000500001010E X p =? +?++? 0.5(),=元每张彩票平均可赚20.50.3 1.2(), --=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().?=元实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则 X 8 -2p 0.3 0.7()80.320.71(),E X =?-?=万元存入银行的利息:故应选择投资.1050.5(),%?=万元实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500; 3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100, 0.x X x f x x Y -?>?=??≤? 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望定盒位置保护层防腐跨接地线弯曲半径标高等,要求技术交底。管线敷设技术、电气课校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料、电气设备调试高中中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并

专题突破练20 统计与统计案例

专题突破练20 统计与统计案例 1. (2020吉林辽源高三检测,18)某城市在进行创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数.满分为100分).从中随机抽取一个容量为120的样本.发现所有数据均在[40,100]内.现将这些分数分成以下6组并画出了样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,回答下列问题: (1)算出第三组[60,70)的频数,并补全频率分布直方图; (2)请根据频率分布直方图,估计样本的众数、中位数和平均数.(每组数据以区间的中点值为代表) 2.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①;y ^ =-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^ =99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

3.(2020河南郑州高三检测,19)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图: (1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表: (3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异? 附:K2=n(ad-bc)2 (a+b)(c+d)(a+c)(b+d) ,其中n=a+b+c+d.

计数原理、概率、随机变量及其分布、统计、统计案例

计数原理、概率、随机变量及其分布、统计、统计案例 第Ⅰ卷(选择题 共60分) 一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的) 1.已知随机变量ξ服从正态分布N (1,σ2),P (ξ≤4)=,则P (ξ≤-2)=( ) A . B . C . D . 2.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的平均数为17,乙组数据的中位数为17,则x ,y 的值分别为( ) A .2,6 B .2,7 C .3,6 D .3,7 3.将4个颜色互不相同的球全部收入编号为1和2的两个盒 子里,使得放入每个盒子里的球的个数不小于该盒子的编号,则不同的放球方法有( ) A .10种 B .20种 C .36种 D .52种 4.已知f (x )、g (x )都是定义在R 上的函数,g (x )≠0,f ′(x )g (x )-f (x )g ′(x )<0,fx gx =a x ,f 1g 1+ f -1 g -1=52,则关于x 的方程abx 2+2x +5 2=0(b ∈(0,1))有两个不同实根的概率为( ) 5.用0,1,…,9十个数字,可以组成有重复数字的三位数的个数为( ) A .243 B .252 C .261 D .279 6.四名同学根据各自的样本数据研究变量x ,y 之间的相关关系,并求得回归直线方程,分别得到以下四个结论: ①y 与x 负相关且y ^ =-; ② y 与x 负相关且y ^ =-+; ③y 与x 正相关且y ^ =+; ④y 与x 正相关且y ^ =--. 其中一定不正确的结论的序号是( ) A .①② B .②③

随机变量、统计案例

随机变量的分布列及统计案例复习学案参考答案 例1、解析 ∵P (A )=C 22+C 23 C 25=25,P (AB )=C 22C 25 =110, ∴P (B |A )=P (AB )P (A )=1 4 . 答案 B 例2、解析 该题为几何概型,圆的半径为1,正方形的边长为2,∴圆的面积为 π,正方形面积为2,扇形面积为π4.故P (A )=2π,P (B |A )=P (A ∩B )P (A )=1 4. 答案 (1)2π (2)1 4 例3、 专题三 离散型随机变量的分布列、均值与方差 例4、 解 设A 、B 、C 分别为甲、乙、丙三台机床各自独立加工同一种零件是一等品的事件,依题意得 ?????????P (A ·B -)=14,P (B ·C -)=112,P (A ·C )=29,即???? ??? ??P (A )·(1-P (B ))=14,P (B )·(1-P (C ))=112,P (A )·P (C )=29, 得27[P (C )]2-51P (C )+22=0, 解得P (C )=23或P (C )=119 (舍). ∴P (A )=13,P (B )=14,P (C )=2 3 . 即甲、乙、丙三台机床各自独立加工的零件是一等品的概率分别为13,14,2 3. (2)记D 为从甲、乙、丙加工的零件中各取一个检验,至少有一个一等品的事件. P (D )=1-P (D -)=1-(1-P (A ))·(1-P (B ))·(1-P (C ))=1-23× 34×13=56,即从甲、乙、丙加工的零件中各取一个检验,至少有一个一等品的概率为56.

2021届高三新题数学9月(适用新高考)专题二十 统计与统计案例(原卷版)

专题二十 统计与统计案例 一、单选题 1.(2020·河南宛城·南阳华龙高级中学月考(文))在一组样本数据()11,x y ,()22,x y ,…,(),n n x y (2n ≥, 1x ,2x ,……,n x 不全相等)的散点图中,若所有样本点()(),1,2,,i i x y i n =???都在直线2 15 y x = +上,则这组样本数据的样本相关系数为( ) A .-1 B .0 C . 12 D .1 二、多选题 2.(2020·江苏省丰县中学期末)某俱乐部为了解会员对运动场所的满意程度,随机调查了50名会员,每位会员对俱乐部提供的场所给出满意或不满意的评价,得到如图所示的列联表,经计算2K 的观测值 5.059k ≈,则可以推断出( ) 附: A .该俱乐部的男性会员对运动场所满意的概率的估计值为 2 3 ; B .调查结果显示,该俱乐部的男性会员比女性会员对俱乐部的场所更满意; C .有97.5%的把握认为男性会员、女性会员对运动场所的评价有差异; D .有99%的把握认为男性会员、女性会员对运动场所的评价有差异. 第II 卷(非选择题)

三、解答题 3.(2020·河南宛城·南阳华龙高级中学月考(文))微信是现代生活中进行信息交流的重要工具.据统计,某公司200名员工中0090的人使用微信,其中每天使用微信时间少于一小时的有60人,其余的员工每天使用微信时间不少于一小时,若将员工分成青年(年龄小于40岁)和中年(年龄不小于40岁)两个阶段,那么使用微信的人中0075是青年人.若规定:每天使用微信时间不少于一小时为经常使用微信,那么经常使用微信的员工中 2 3 都是青年人. (1)若要调查该公司使用微信的员工经常使用微信与年龄的关系,完成22?列联表: (2)由列联表中所得数据判断,能否在犯错误的概率不超过0.001的前提下认为“经常使用微信与年龄有关”? 2 2 ()()()()() n ad bc k a b c d a c b d -=++++ 4.(2020·江苏泰州·期末)某企业的甲、乙两种产品在东部地区三个城市以及西部地区两个城市的销售量x , y 的数据如下:

高考数学统计与统计案例.doc

高考数学统计与统计案例1.小吴一星期的总开支分布如图 1 所示,一星期的食品开支如图 2 所示,则小吴一星期的鸡蛋开支占总开支的百分比为() A.1%B.2%C.3%D.5% C[ 由图 1 所示,食品开支占总开支的 30%,由图 2 所示,鸡蛋开支占食 品开支的30 = 1 , 30+40+100+80+ 50 10 1 ∴鸡蛋开支占总开支的百分比为30%×10=3%.故选 C.] 2.(2019 德·州模拟 )某人到甲、乙两市各7 个小区调查空置房情况,调查得到的小区空置房的套数绘成了如图所示的茎叶图,则调查中甲市空置房套数的中位数与乙市空置房套数的中位数之差为() A.4B. 3C.2D.1 B[ 由茎叶图可以看出甲、乙两市的空置房的套数的中位数分别是79,76,因此其差是 79- 76=3,故选 B.] 3.某工厂对一批新产品的长度(单位: mm)进行检测,如图是检测结果的频

率分布直方,据此估批品的中位数() A.20B. 25C.22.5D.22.75 C[ 品的中位数出在概率是 0.5 的地方 . 自左至右各小矩形面依次 0.1,0.2,0.4,??,中位数是 x,由 0.1+0.2+0.08 ·(x-20)=0.5,得 x= 22.5, 故 C.] 4.(2019 ·三明模 )在某次高中数学中,随机抽取 90 名考生,其分数如所示,若所得分数的平均数,众数,中位数分 a, b, c, a,b,c 的大 小关系 () A.b

通用版2020版高考数学大二轮复习专题突破练20统计与统计案例理

专题突破练20 统计与统计案例 1.(2019四川成都二模,理18)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“专项附加扣除”就 是子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人等费用,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部职员对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表: (1)根据列联表,能否有99%的把握认为满意程度与年龄有关? (2)为了帮助年龄在40岁以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x(单位:分)给予相应的住房补贴y(单位:元),现有两种补贴方案,方案甲:y=1 000+700x;方案 乙:y=已知这8名员工的贡献积分为2分,3分,6分,7分,7分,11分,12分,12分,将采用方案甲比采用方案乙获得更多补贴的员工记为“A类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A类员工”的概率. 附:K2=-,其中n=a+b+c+d. 参考数据:

2.下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图. 为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为 … 7 建立模型①;=-30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为 … 7 建立模型②:=99+17.5t. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.

17统计与统计案例

二、考情分析 统计试题主要考察抽样方法、茎叶图、平均数、方差、频率分布表和频率分布直方图、正态分布,抽样方法主要考察系统抽样和分层抽样,较为简单,频率分布直方图和茎叶图是高考的另一个热点,应引起重视, 年高考试题已经设计变量的相关性、独立性检验,也应重视这一新动向三、经典例题: 题型一、抽样方法 (2010安徽)某地有居民100 000户,其中普通家庭99 000户,高收入 1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取l00户进行调查,发现共有120户家庭拥套或3套以上住房,其中普通家庭50户,高收人家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是. 题型二、频率分布直方图和茎叶图与样本的数字特征 (2011)有一个容量为66的样本,数据的分组及各组的频数如下: .5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) .5,27.5)18 [27.5,31.5)11 [31.5,35.5) .5.39.5)7 [39.5,43.5) 3 根据样本的频率分布估计,数据落在[31.5,43.5)的概率约是( 1 6B. 1 3 C. 1 2 D. 2 3 )某老师从星期一到星期五收到信件数分别是10,6,8,5,6,

四、专题训练: 1(2011)已知随机变量 ξ 服从正态分布 2(2,) N a ,且 (4)0.8p ξ<=,则(02)p ξ<<=( ) A.0.6 B .0.4 C .0.3 D .0.2 2(2011)变量X 、Y 对应的一组数据(10,1),(11.3,2),(11.8,3), (12.5,4),(13,5);变量U 与V 对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),1r 表示变量Y 与X 之间的线性相关系数,2r 表示变量V 与U 之间的线性相关系数,则 ( ) A .2 10r r << B .210r r << C .210r r << D .21r r = 3( 根据上表可得回归方程y bx a =+中的b 为9.4,据此模型预测广告费用为6万元时销售额为 ( ) A .63.6万元 B .65.5万元 C .67.7万元 D .72.0万元 4(2010)样本中共有5个个体,其值分别为,0,1,2,3a ,若样本的平均 值为1,则样本方差为( ) A B 65 C D 2 5、某项体育比赛中,七位裁判为一选手打出的分数如下: 90 89 90 95 93 94 93 去掉一个最高分和一个最低分以后,所剩数据的平均数和方差分别是( ) A 92 2 B 92 2.8 C 93 2 D 93 2.8 6、某校高一年级8个班参加合唱比赛的得分的茎叶图如图所示,则这组数据的中位数和平均数分别是( ) A 91.5 91 .5 B 91.5 92 C 91 91.5 D 92 92 7.(2012)样本(12,,,n x x x )的平均数为x ,样本( 12,,m y y y ) 的平均数为 ()y x y ≠,若样本(12,,,n x x x ,12,,m y y y )的平均 数(1)z ax a y =+-,其中1 02 a <<,则n,m 的大小关系为( ) A .n m < B .n m > C .n m = D .不能确定 8.(2011)调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关 系, 并由调查数据得到y 对x 的回归直线方程: 0.2540.321y x =+.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加____________万元. 9.(2010)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉 花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在 区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有 根在棉花纤维的长度小于20mm 。 10.(2010) 将容量为n 的样本中的数据分成6组,绘制频率分布直方图。若第一组至第六组数据的频率之比为2:3:4: 6:4:1,且前三组数据的频数之和等于27,则n 等于 。 11.(2011)一支田径队有男运动员48人,女运动员36人,若用分层抽样 的方法从该队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为___________ 12.(选做)(2011)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙. (I )假设4n =,在第一大块地中,种植品种甲的小块地的数目记为X , 求X 的分布列和数学期望; (II )试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种 2 结果,你认为应该种植哪一品种?

专题五 第1讲 统计与统计案例

本资料分享自千人QQ 群323031380 期待你的加入与分享 第1讲 统计与统计案例 [考情分析] 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度. 考点一 统计图表 核心提炼 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率 组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 例1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A .这11天复工指数和复产指数均逐日增加 B .这11天期间,复产指数增量大于复工指数的增量 C .第3天至第11天复工复产指数均增大都超过80% D .第9天至第11天复产指数增量大于复工指数的增量

答案CD (2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示: 将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是() A.抽样表明,该校约有一半学生为阅读霸 B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸 答案 A 解析根据频率分布直方图可列下表: 阅读时间(分钟)[0,10)[10,20)[20,30)[30,40)[40,50)[50,60] 抽样人数(名)1018222520 5 抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸. 易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率. 跟踪演练1(1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是() A.各月的平均最低气温都在0 ℃以上 B.七月的平均温差比一月的平均温差大

概率论与数理统计第四章 随机变量的数字特征

第四章 随机变量的数字特征 前面讨论了随机变量的分布函数,我们知道分布函数全面地描述了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完整地描述随机变量,但能更突出地描述随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩. 第一节 数学期望 1.数学期望的定义 粗略地说,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子. 要评判一个射手的射击水平,需要知道射手平均命中环数.设射手A 在同样条件下进行射击,命中的环数X 是一随机变量,其分布律如下: 表4-1 由X 的分布律可知,若射手A 共射击N 次,根据频率的稳定性,所以在N 次射击中,大约有0.1×N 次击中10环,0.1×N 次击中9环,0.2×N 次击中8环,0.3×N 次击中7环,0.1×N 次击中6环,0.1×N 次击中5环,0.1×N 次脱靶.于是在N 次射击中,射手A 击中的环数之和约为 10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N . 平均每次击中的环数约为 N 1 (10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N ) =10×0.1+9×0.1+8×0.2+7×0.3+6×0.1+5×0.1+0×0.1 =6.7(环). 由这样一个问题的启发,得到一般随机变量的“平均数”,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念”.一般地,有如下定义: 定义4.1 设离散型随机变量X 的分布律为 P {X =x k }=p k k =1,2,…, 若级数 ∑∞ =1 k k k p x 绝对收敛,则称级数 ∑∞ =1 k k k p x 为随机变量X 的数学期望(Mathematical expectation),记为E (X ).

统计与统计案例 专题

统计与统计案例专题 [考情考向分析] 1.以选择题、填空题的形式考查随机抽样、样本的数字特征、统计图表、回归方程、独立性检验等.2.在概率与统计的交汇处命题,以解答题中档难度出现. 热点一抽样方法 1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体数较少. 2.系统抽样特点是将总体平均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多. 3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 例1(1)某学校在高一新生入学后为了解学生的体质情况,决定从该校的1 000名高一新生中采用系统抽样的方法抽取50名学生进行体质分析,已知样本中第一个号为007号,则抽取的第10个学生的编号为() A.107 B.097 C.207 D.187 (2)已知某高级中学高一、高二、高三学生人数分别为880,860,820,现用分层抽样的方法从该校抽调128人,则在高二年级中抽调的人数为________. 思维升华(1)随机抽样的各种方法中,每个个体被抽到的概率都是相等的. (2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同. (3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例. 跟踪演练1(1) 为了解某地区的“微信健步走”活动情况,拟从该地区的人群中抽取部分

人员进行调查,事先已了解到该地区老、中、青三个年龄段人员的“微信健步走”活动情况有较大差异,而男女“微信健步走”活动情况差异不大.在下面的抽样方法中,最合理的抽样方法是( ) A .简单随机抽样 B .按性别分层抽样 C .按年龄段分层抽样 D .系统抽样 (2)(2018·永州模拟)现从已编号(1~50)的50位同学中随机抽取5位了解他们的数学学习状况,用每部分选取的号码间隔一样的系统抽样方法所选取的5位同学的编号可能是( ) A .5,10,15,20,25 B .3,13,23,33,43 C .1,2,3,4,5 D .2,10,18,26,34 热点二 用样本估计总体 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数 利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 例2 (1)一组数据共有7个数,记得其中有10,2,5,2,4,2,还有一个数没记清,但知道这组数的平均数、中位数、众数依次成等差数列,这个数的所有可能值的和为( ) A .-11 B .3 C .9 D .17 (2)某高校调查了320名学生每周的自习时间(单位:小时),制成了下图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图可知,这320名学生中每周的自习时间不足22.5小时的人数约是( )

变量间的相关关系与统计案例教案(绝对经典)

第3节变量间的相关关系与统计案例 【最新考纲】 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 【高考会这样考】考查回归分析、独立性检验的基本思想和简单应用. 要点梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n), 其回归方程为y^=b^x+a^__,则b^=∑ n i=1 (x i-x-)(y i-y-) ∑ n i=1 (x i-x-)2 = ∑ n i=1 x i y i-nx-y- ∑ n i=1 x2i-nx-2 ,a^=y--b^x-.其中, b^是回归方程的斜率,a^是在y轴上的截距. 回归直线一定过样本点的中心(x-,y-). 3.回归分析 (1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.

统计概率与统计案例

(十三)统计概率与统计案例 【命题解读】 考向1:事件与概率(包括古典概型与几何概型) 分析定位:古典概型、几何概型及其概率计算公式是概率计算的基础,为此,要根据题意把概率模型抽象出来,重点是理解好“要完成一件怎样的事”与“要发生的事件是什么”. 例1(2016年全国Ⅱ卷第10题)从区间[]0,1随机抽取2n 个数1x ,2x ,…,n x ,1y ,2y ,…,n y ,构成n 个数对()11,x y ,()22,x y ,…,(),n n x y ,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为 (A ) 4n m (B )2n m (C )4m n (D )2m n 分析:先审题,然后转化成几何概型的问题进行解决. 解:题意如右图,边长为1的正方形中有n 个点,其中有m 半径为1的41个圆中,则4π=n m ,所以n m 4π=,故选C. 总结:究竟是考查古典概型还是几何概型,需要考生从题意中把模型抽象出来. 考向2:统计与概率(包括离散型随机变量的分布列) 分析定位:史宁中教授关于统计与概率的观点如下: 1.统计学与数学的差异 研究起点:数学是基于定义与假设,统计是基于数据与模型; 思维方法:数学是着重于演绎推理,统计是着重于归纳推理; 结果判断:数学主要是判断对不对,统计主要是判断好不好.

2.统计学与概率的区别 共性:都是研究随机现象 差异:概率是用数学的方法,统计是用数据分析的方法(为预测、决策提供依据). 所以,基于“数据与信息,构建模型,进而判断好不好”是考查的基本方向. 例2(2016年全国Ⅰ卷第19题)某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个 200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更 以这100的概率,记X n 表示购买2台机器的(I )求(II (III 19n =与20n =之中选分析:(1)数据与信息:本题中是指某种机器中有一易损零件,购进机器时买一个是200元,购进机器后买一个是500元,这就产生了一个问题是:究竟购进机器时要买几个这个零件更好?题中给出了100台机器使用过程中更换零件的状况,其题意如下: X 知,则X 的可能的取值为16,17,18,19,20,21,22,把上表的频率当概率,列得分布列如下:

概率统计及统计案例知识点汇总

概率统计及统计案例知识点汇总 知识点一随机抽样 (一)、1.定义:设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫作简单随机抽样. 2.最常用的简单随机抽样的方法:抽签法和随机数法. 3.应用范围:总体中的个体数较少. (二)、系统抽样 1.定义:当总体中的个体数目较多时,可将总体分成均衡的几个部分,然后按照事先定出的规则,从每一部分抽取一个个体得到所需要的样本,这种抽样方法叫做系统抽样. 2.系统抽样的操作步骤 第一步编号:先将总体的N个个体编号; 第二步分段:确定分段间隔k,对编号进行分段,当N n(n是样本容量)是整数时, 取k=N n; 第三步确定首个个体:在第1段用简单随机抽样确定第一个个体编号l(l≤k);第四步获取样本:按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本. 3.应用范围:总体中的个体数较多. (三)、分层抽样 1.定义:在抽样时,将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本,这种抽样方法叫作分层抽样,有时也称为类型抽样. 2.应用范围:当总体是由差异明显的若干类型组成时,往往选用分层抽样. 知识点二用样本估计总体 (一)、用样本的频率分布估计总体分布 1.频率分布表与频率分布直方图

频率分布表与频率分布直方图的绘制步骤如下: ①求极差(即一组数据中最大值与最小值的差); ②定组距与组数;③将数据分组;④列频率分布表; ⑤画频率分布直方图. 2.频率折线图 在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图. 3.茎叶图 ①茎叶图是统计中用来表示数据的一种图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数. ②对于样本数据较少,但较为集中的一组数据:若数据是两位整数,则将十位数字作茎,个位数字作叶;若数据是三位整数,则将百位、十位数字作茎,个位数字作叶,样本数据为小数时做类似处理. (二)、用样本的数字特征估计总体的数字特征 1.众数 在一组数据中,出现次数最多的数据叫作这组数据的众数.体现了样本数据的最大集中点,不受极端值的影响而且不唯一. 2.中位数 将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数.它不受极端值的影响,仅利用了排在中间数据的信息,只有一个,且在频率分布直方图中,中位数左边和右边的直方图的面积相等. 3.平均数:样本数据的算术平均数,即x=1 n(x1+x2+…+x n),它与每一个样本 数据有关,仅有一个. 4.极差:一组数值中最大值与最小值的差,它反映一组数据的波动情况,但极差只考虑两个极端值,可靠性极差. 5.标准差:①考查样本数据的分散程度的大小,最常用的统计量是标准差,标准差是样本数据到平均数的一种平均距离,一般用s表示:

专题五 第1讲 统计与统计案例

第1讲 统计与统计案例 [考情分析] 高考对本讲内容的考查往往以实际问题为背景,考查随机抽样与用样本估计总体,线性回归方程的求解与运用,独立性检验问题.常与概率综合考查,中等难度. 考点一 统计图表 核心提炼 1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率 组距. 2.频率分布直方图中各小长方形的面积之和为1. 3.利用频率分布直方图求众数、中位数与平均数. 频率分布直方图中: (1)最高的小长方形底边中点的横坐标即众数. (2)中位数左边和右边的小长方形的面积和相等. (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 例1 (1)(多选)(2020·新高考全国Ⅱ)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( ) A .这11天复工指数和复产指数均逐日增加 B .这11天期间,复产指数增量大于复工指数的增量 C .第3天至第11天复工复产指数均增大都超过80% D .第9天至第11天复产指数增量大于复工指数的增量 答案 CD (2)学校为了了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:

将阅读时间不低于30分钟的学生称为“阅读霸”,则下列结论正确的是() A.抽样表明,该校约有一半学生为阅读霸 B.该校只有50名学生不喜欢阅读 C.该校只有50名学生喜欢阅读 D.抽样表明,该校有50名学生为阅读霸 答案 A 解析根据频率分布直方图可列下表: 阅读时间(分钟)[0,10)[10,20)[20,30)[30,40)[40,50)[50,60] 抽样人数(名)1018222520 5 抽样100名学生中有50名为阅读霸,占一半,据此可判断该校约有一半学生为阅读霸. 易错提醒(1)对于给出的统计图表,一定要结合问题背景理解图表意义,不能似懂非懂.(2)频率分布直方图中纵坐标不要误以为频率. 跟踪演练1(1)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是() A.各月的平均最低气温都在0 ℃以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同

相关文档
相关文档 最新文档