文档库 最新最全的文档下载
当前位置:文档库 › 高中数学统计 统计案例知识点总结和典例

高中数学统计 统计案例知识点总结和典例

高中数学统计 统计案例知识点总结和典例
高中数学统计 统计案例知识点总结和典例

统计

一.简单随机抽样:抽签法和随机数法

1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。

2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。

抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。

3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。

随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。

4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。

二.系统抽样:

1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。

系统抽样的一般步骤:

(1)采用随机抽样的方法将总体中的N个个编号。

(2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k).

(3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。

(4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。

在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。

三.分层抽样:

1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。

分层抽样的步骤:

(1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。

(3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。

2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点:

(1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。

(2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。

(3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。

四.用样本的频率分布估计总体分布:

1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。

其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图

2.频率分布折线图、总体密度曲线

频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

总体密度曲线:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线。它能够精确地反映了总体在各个范围内取值的百分比,给我们提供更加精细的信息。

3. 当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。

茎叶图的特征:

(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示。

(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。

五. 用样本的数字特征估计总体的数字特征:

1. 众数、中位数、平均数、方差、标准差的求法。

六.变量之间的相关关系:

1.相关关系:两个变量之间的关系可能是确定的关系(如:函数关系),或非确定性关系。当自变量取值一定时,因变量也确定,则为确定关系;当自变量取值一定时,因变量带有随机性,这种变量之间的关系称为相关关系。相关关系是一种非确定性关系。

2.散点图的概念:将各数据在平面直角坐标中的对应点画出来,得到表示两个变量的一组数据的图形,这样的图形叫做散点图。(1.如果所有的样本点都落在某一函数曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.2.如果所有的样本点都落在某一函数曲线附近,变量之间就有相关关系。

3. 如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系)。

3.正相关与负相关概念:如果散点图中的点散布在从左下角到右上角的区域内,称为正相关。如果散点图中的点散布在从左上角到右下角的区域内,称为负相关。(注:散点图的点如果几乎没有什么规则,则这两个变量之间不具有相关关系)

4. 从散点图上可以看出,这些点大致分布在通过散点图中心的一条直线。如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这这两个变量之间具有线形相关关系,直线叫回归直线。

5.教学最小二乘法:

(1)求回归方程的关键是如何用数学的方法刻画"从整体上看,各点与此直线的距离最小".

(2)最小二乘法公式:求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法。 题型一 抽样方法

例1(1)某高校甲、乙、丙、丁四个专业分别有150、150、400、300名学生,为了解学生的就业倾向,

用分层抽样的方法从该校这四个专业共抽取40名学生进行调查,应在丙专业抽取的学生人数为 .

(2)利用简单随机抽样的方法,从n 个个体(n >13)中抽取13个个体,依次抽取,若第二次抽取后,余下的每个个体被抽取的概率为36

1,则在整个抽样过程中,每个个体被抽取的概率为 变式1:某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆.为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取 ____,

____, ____辆.

变式2:经问卷调查,某班学生对摄影分别执“喜欢”、“不喜欢”和“一般”三种态度,其中执“一般”态度的比“不喜欢”态度的多12人,按分层抽样方法从全班选出部分学生座谈摄影,如果选出的5位“喜欢”摄影的同学、1位“不喜欢”摄影的同学和3位执“一般”态度的同学,那么全班学生中“喜欢”摄影的比全班人数的一半还多 人.

题型二 统计图表问题

例2 从一条生产线上每隔30分钟取一件产品,共取了n 件,测得其产品尺寸后,画得其频率直方图如下.尺寸在[15,45)内的频数为46.

(1)求n 的值;

(2)求尺寸在[20,25)内产品的个数.

变式3: ⑴有一个容量为100的样本,数据的分组及各组的频数如下:

[12.5,15.5],6;[15.5,18.5],16;[18.5,21.5],18;[21.5,24.5],22;

[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.

①列出样本的频率分布表;②画出频率分布直方图;③估计数据小于30.5的概率

题型三 平均数、标准差(方差)的计算问题

例3一次歌手大奖赛上,七位评委为歌手打出的分数如下:

9.4 8.4 9.4 9. 9 9.6 9.4 9.7

去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( )

A .9.4,0.484

B .9.4,0.016

C .9.5,0.04

D .9.5,0.016

变式4: x 是12100,,x x x K 的平均数,a 是1240,,x x x K 的平均数,b 是4142100,,x x x K 的平均数,则x ,a ,b 之间的关系为 .

变式5:某人5次上班途中所花时间(单位:分钟)分别为x 、y 、10、11、9.已知这组数据的平均数为10,方差为2,则y x -的值为( )

A .1

B .2

C .3

D .4

题型四 线性回归分析

例4下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据:

(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于

x的线性

回归方程$y bx a =+$; (3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤;试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?

变式6: 为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x 、物理成绩y 进行分析.下面是该生7次考试的成绩.

(1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明;

(2)已知该生的物理成绩y 与数学成绩x 是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.

高中数学统计、统计案例知识点总结和典例说课讲解

统计 一.简单随机抽样:抽签法和随机数法 1.一般地,设一个总体含有N个个体(有限),从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等(n/N),就把这种抽样方法叫做简单随机抽样。 2.一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本,这种抽样方法叫做抽签法。 抽签法的一般步骤:a、将总体的个体编号。 b、连续抽签获取样本号码。 3. 利用随机数表、随机数骰子或计算机产生的随机数进行抽样,叫随机数表法。 随机数表法的步骤:a、将总体的个体编号。b、在随机数表中选择开始数字。c、读数获取样本号码。 4. 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不是很方便,但是比抽签法公平,因此这两种方法只适合总体容量较少的抽样类型。 二.系统抽样: 1.一般地,要从容量为N的总体中抽取容量为n的样本,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样的方法叫做系统抽样。 系统抽样的一般步骤: (1)采用随机抽样的方法将总体中的N个个编号。 (2)将整体按编号进行分段,确定分段间隔k=N/n。(k∈N,L≤k). (3)在第一段用简单随机抽样确定起始个体的编号L(L∈N,L≤k)。 (4)按照一定的规则抽取样本,通常是将起始编号L加上间隔k得到第2个个体编号L+K,再加上K得到第3个个体编号L+2K,这样继续下去,直到获取整个样本。 在确定分段间隔k时应注意:分段间隔k为整数,当N/n不是整数时,应采用等可能剔除的方剔除部分个体,以获得整数间隔k。 三.分层抽样: 1.一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。(2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。(4)综合每层抽样,组成样本。 2.分层抽样是当总体由差异明显的几部分组成时采用的抽样方法,进行分层抽样时应注意以下几点: (1)分层抽样中分多少层、如何分层要视具体情况而定,总的原则是,层内样本的差异要小,面层之间的样本差异要大,且互不重叠。 (2)为了保证每个个体等可能入样,所有层应采用同一抽样比等可能抽样。 (3)在每层抽样时,应采用简单随机抽样或系统抽样的方法进行抽样。 四.用样本的频率分布估计总体分布: 1.频率分布是指一个样本数据在各个小范围内所占比例的大小。一般用频率分布直方图反映样本的频率分布。 其一般步骤为:(1)计算一组数据中最大值与最小值的差,即求极差(2)决定组距与组数(3)将数据分组(4)列频率分布表(5)画频率分布直方图 2.频率分布折线图、总体密度曲线 频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。

高中数学 专题 统计与统计案例

一、选择题 1.利用系统抽样法从编号分别为1,2,3,…,80的80件不同产品中抽出一个容量为16的样本,如果抽出的产品中有一件产品的编号为13,则抽到产品的最大编号为( ) A .73 B .78 C .77 D .76 解析:样本的分段间隔为80 16=5,所以13号在第三组,则最大的编号为13+(16-3)×5 =78.故选B. 答案:B 2.某课外小组的同学们在社会实践活动中调查了20户家庭某月的用电量如下表所示: 则这20A .180,170 B .160,180 C .160,170 D .180,160 解析:用电量为180度的家庭最多,有8户,故这20户家庭该月用电量的众数是180,排除B ,C ;将用电量按从小到大的顺序排列后,处于最中间位置的两个数是160,180,故这20户家庭该月用电量的中位数是170.故选A. 答案:A 3.(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图,根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加 C .各年的月接待游客量高峰期大致在7,8月 D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳

解析:根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都在减少,所以A 错误.由图可知,B 、C 、D 正确. 答案:A 4.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为( ) A .5 B .7 C .10 D .50 解析:根据题中的频率分布直方图可知,三等品的频率为1-(0.050 0+0.062 5+0.037 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50. 答案:D 5.(2018·兰州模拟)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据: 根据表中提供的全部数据,用最小二乘法得出y 与x 的线性回归方程为y ^ =6.5x +17.5,则表中m 的值为( ) A .45 B .50 C .55 D .60 解析:∵x =2+4+5+6+8 5=5, y = 30+40+50+m +705=190+m 5 , ∴当x =5时,y =6.5×5+17.5=50, ∴190+m 5=50,解得m =60. 答案:D

(典型题)高考数学二轮复习-知识点总结-统计与统计案例

统计和统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率和统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1. 随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2. 常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3. 用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图 众数 出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数 将数据按大小依次排列,处在最 中间位置的一个数据(或最中间两个数据的平均数) 把频率分布直方图划分左右两个面积相等的分界线和x 轴交点的横坐标 平均数 样本数据的算术平均数 每个小矩形的面积乘以小矩形底边中点的横坐标之和 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2 +x 2-x 2 +…+x n -x 2 ]. 4. 变量的相关性和最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5. 独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: y 1 y 2 总计 x 1 a b a +b x 2 c d c +d 总计 a +c b +d n 则K 2 = n ad -bc 2a +b c + d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 分析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样

高中数学专题――概率统计专题.

专题二概率统计专题 【命题趋向】概率与统计是高中数学的重要学习内容,它是一种处理或然问题的方法,在工农业生产和社会生活中有着广泛的应用,渗透到社会的方方面面,概率与统计的基础知识成为每个公民的必备常识.概率与统计的引入,拓广了应用问题取材的范围,概率的计算、离散型随机变量的分布列和数学期望的计算及应用都是考查应用意识的良好素材.在高考试卷中,概率与统计的内容每年都有所涉及,以解答题形式出现的试题常常设计成包含离散型随机变量的分布列与期望、统计图表的识别等知识为主的综合题,以考生比较熟悉的实际应用问题为载体,以排列组合和概率统计等基础知识为工具,考查对概率事件的识别及概率计算.解答概率统计试题时要注意分类与整合、化归与转化、或然与必然思想的运用.由于中学数学中所学习的概率与统计内容是最基础的,高考对这一部分内容的考查注重考查基础知识和基本方法.该部分在高考试卷中,一般是2—3个小题和一个解答题. 【考点透析】概率统计的考点主要有:概率与统计包括随机事件,等可能性事件的概率,互斥事件有一个发生的概率,古典概型,几何概型,条件概率,独立重复试验与二项分布,超几何分布,离散型随机变量的分布列,离散型随机变量的期望和方差,抽样方法,总体分布的估计,正态分布,线性回归等.【例题解析】 题型1 抽样方法 -)中,在公证部门监督下按照随机抽取的方法确【例1】在1000个有机会中奖的号码(编号为000999 定后两位数为的号码为中奖号码,该抽样运用的抽样方法是() A.简单随机抽样B.系统抽样C.分层抽样D.以上均不对 分析:实际“间隔距离相等”的抽取,属于系统抽样. 解析:题中运用了系统抽样的方法采确定中奖号码,中奖号码依次为:088,188,288,388,488,588,688,788,888,988.答案B. 点评:关于系统抽样要注意如下几个问题:(1)系统抽样是将总体分成均衡几个部分,然按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本的一种抽样方法.(2)系统抽样的步骤:①将总体中的个体随机编号;②将编号分段;③在第一段中用简单随机抽样确定起始的个体编号;④按事先研究的规则抽取样本.(3)适用范围:个体数较多的总体. 例2(2008年高考广东卷理3)某校共有学生2000名,各年级男、女生人数如表.已知在全校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为() A.24B.18C.16D.12 Array 分析:根据给出的概率先求出x的值,这样就可以知道三年级的学生人数,问题就解决了. x=?=,这样一年级和二年级学生的解析:C 二年级女生占全校学生总数的19%,即20000.19380 +++=,三年级学生有500人,用分层抽样抽取的三年级学生应是总数是3733773803701500 64 50016 ?=.答案C. 2000 点评:本题考查概率统计最基础的知识,还涉及到一点分析问题的能力和运算能力,题目以抽样的等可能性为出发点考查随机抽样和分层抽样的知识. 例3.(2009江苏泰州期末第2题)一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系, 2500,3500(元)月收入段应抽要从这10000人中再用分层抽样方法抽出100人作进一步调查,则在[) 出人.

高中数学知识点之统计及统计案例分析

高中数学知识点之统计及统计案例分析 第十一编统计、统计案例 §11.1 抽样方法 1.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个 问题中,总体的一个样本是 . 答案 200个零件的长度 2.某城区有农民、工人、知识分子家庭共计2 004户,其中农民家庭1 600户,工人 家庭303户,现要从中抽取容量为40的样本,则在整个抽样过程中,可以用到下列抽样 方法:①简单随机抽样,②系统抽样,③分层抽样中的 . 答案①②③ 3.某企业共有职工150人,其中高级职称15人,中级职称45人,初级职称90人.现 采用分层抽样抽取容量为30的样本,则抽取的各职称的人数分别为 . 答案 3,9,18 4.(2019·广东理)某校共有学生2 000名,各年级男、女生人数如下表.已知在全 校学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取 64名学生,则应在三年级抽取的学生人数为 . 女生男生 答案 16 5.某工厂生产A、B、C三种不同型号的产品,其相应产品数量之比为2∶3∶5,现用 分层抽样方法抽出一个容量为n的样本,样本中A型号产品有16件,那么此样本的容量 n= .答案 80 例1 某大学为了支援我国西部教育事业,决定从2019应届毕业生报名的18名志愿者中,选取6人组成志愿小组.请用抽签法和随机数表法设计抽样方案.解抽签法:第一步:将18名志愿者编号,编号为1,2,3, (18) 第二步:将18个号码分别写在18张外形完全相同的纸条上,并揉成团,制成号签; 第三步:将18个号签放入一个不透明的盒子里,充分搅匀;第四步:从盒子中逐个抽取 6个号签,并记录上面的编号;第五步:所得号码对应的志愿者,就是志愿小组的成员. 随机数表法: 第一步:将18名志愿者编号,编号为01,02,03, (18) 第二步:在随机数表中任选一数作为开始,按任意方向读数,比如第8行第29列的 数7开始,向右读; 第三步:从数7开始,向右读,每次取两位,凡不在01—18中的数,或已读过的数,都跳过去不作记录,依次可得到12,07,15,13,02,09.

高中数学统计案例分析及知识点归纳总结

统计 一、知识点归纳 1、抽样方法: ①简单随机抽样(总体个数较少) ②系统抽样(总体个数较多) ③分层抽样(总体中差异明显) 注意:在N 个个体的总体中抽取出n 个个体组成样本,每个个体被抽到的机会(概率)均为N n 。 2、总体分布的估计: ⑴一表二图: ①频率分布表——数据详实 ②频率分布直方图——分布直观 ③频率分布折线图——便于观察总体分布趋势 注:总体分布的密度曲线与横轴围成的面积为1。 ⑵茎叶图: ①茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众位数等。 ②个位数为叶,十位数为茎,右侧数据按照从小到大书写,相同的数据重复写。 3、总体特征数的估计: ⑴平均数:n x x x x x n ++++= 321; 取值为n x x x ,,,21 的频率分别为n p p p ,,,21 ,则其平均数为n n p x p x p x +++ 2211; 注意:频率分布表计算平均数要取组中值。 ⑵方差与标准差:一组样本数据n x x x ,,,21 方差:2 1 2)(1 ∑=-= n i i x x n s ; 标准差:2 1 )(1∑=-= n i i x x n s 注:方差与标准差越小,说明样本数据越稳定。 平均数反映数据总体水平;方差与标准差反映数据的稳定水平。 ⑶线性回归方程 ①变量之间的两类关系:函数关系与相关关系; ②制作散点图,判断线性相关关系 ③线性回归方程:a bx y +=∧ (最小二乘法) 1 221n i i i n i i x y nx y b x nx a y bx ==? -? ?=??-??=-??∑∑ 注意:线性回归直线经过定点),(y x 。

高中数学统计与概率知识点(原稿)

高中数学统计与概率知识点(文) 第一部分:统计 一、什么是众数。 一组数据中出现次数最多的那个数据,叫做这组数据的众数。 众数的特点。 ①众数在一组数据中出现的次数最多;②众数反映了一组数据的集中趋势,当众数出现的次数越多,它就越能代表这组数据的整体状况,并且它能比较直观地了解到一组数据的大致情况。但是,当一组数据大小不同,差异又很大时,就很难判断众数的准确值了。此外,当一组数据的那个众数出现的次数不具明显优势时,用它来反映一组数据的典型水平是不大可靠的。 3.众数与平均数的区别。 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。 二、.中位数的概念。 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)叫做这组数据的中位数。 三 .众数、中位数及平均数的求法。 ①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。 四、中位数与众数的特点。 ⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数; ⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同; (6)众数可能是一个或多个甚至没有; (7)平均数、众数和中位数都是描述一组数据集中趋势的量。

高中数学统计与统计案例概率知识点上课讲义

高中数学统计与统计案例概率知识点

统计与统计案例概率(文科) 知识点 1.抽样调查 (1)抽样调查 通常情况下,从调查对象中按照一定的方法抽取一部分,进行______,获取数据,并以此对调查对象的某项指标作出______,这就是抽样调查. (2)总体和样本 调查对象的称为总______体,被抽取的称为样______本. (3)抽样调查与普查相比有很多优点,最突出的有两点: ①______ ②节约人力、物力和财力. 2.简单随机抽样 (1)简单随机抽样时,要保证每个个体被抽到的概率. (2)通常采用的简单随机抽样的方法:_____ 3.分层抽样 (1)定义:将总体按其属性特征分成若干类型(有时称作层),然后在每个类型中按照所占比例随机抽取一定的样本.这种抽样方法通常叫作分层抽样,有时也称为类型抽样. (2)分层抽样的应用范围: 当总体是由差异明显的几个部分组成时,往往选用分层抽样. 4.系统抽样 系统抽样是将总体中的个体进行编号,等距分组,在第一组中按照简单随机抽样抽取第一个样本,然后按______(称为抽样距)抽取其他样本.这种抽样方法有时也叫等距抽样或机

械抽样. 5.统计图表 统计图表是______数据的重要工具,常用的统计图表有______ 6.数据的数字特征 (1)众数、中位数、平均数 众数:在一组数据中,出现次数最多的数据叫作这组数据的众数. 中位数:将一组数据按大小依次排列,把处在______位置的一个数据(或最中间两个数据的平均数)叫作这组数据的中位数. 平均数:样本数据的算术平均数,即x =1n (x 1+x 2+…+x n ). 在频率分布直方图中,中位数左边和右边的直方图的面积应该______ (2)样本方差 标准差s = 1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2], 其中x n 是样本数据的第n 项,n 是,______x 是______ 标准差是刻画数据的离散程度的特征数,样本方差是标准差的______.通常用样本方差估计总体方差,当______时,样本方差很接近总体方差. 7.用样本估计总体 (1)通常我们对总体作出的估计一般分成两种,一种是______,另一种______. (2)在频率分布直方图中,纵轴表示,______数据落在各小组内的频率用______表示,各小长方形的面积总和等于.______ (3)在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间.从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,称之为频率折线图. (4)当样本数据较少时,用茎叶图表示数据的效果较好,它没有信息的缺失,而且______,方便表示与比较.

(最全)高中数学概率统计知识点总结

概率与统计 一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。 2、平均数:①、常规平均数:12n x x x x n ++???+= ②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+ 3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。 4、方差:2222121 [()()()]n s x x x x x x n = -+-+???+- 二、频率直方分布图下的频率 1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数 2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=; 三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。 2、平均数: 112233n n x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+- 四、线性回归直线方程:???y bx a =+ 其中:1 1 2 22 1 1 ()() ?() n n i i i i i i n n i i i i x x y y x y nxy b x x x nx ====---∑∑== --∑∑ , ??a y bx =- 1、线性回归直线方程必过样本中心(,)x y ; 2、?0:b >正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析 1、残差:??i i i e y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n i i i y y =-∑, 分析:①意义:越小越好; ②计算:222211221 ????()()()()n i i n n i y y y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221 2 1 ?()1() n i i i n i i y y R y y ==-∑=- -∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高; 4、相关系数 :()() n n i i i i x x y y x y nx y r ---?∑∑= = 分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关 ③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2 2() ()()()() n ad bc k a b c d a c b d -= ++++ ②.犯错误上界P 对照表 3、独立性检验步骤

高考知识点变量间的相关关系与统计案例

第3节变量间的相关关系与统计案例 最新考纲 1.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系;2.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程(线性回归方程系数公式不要求记忆);3.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用;4.了解回归分析的基本思想、方法及其简单应用. 知识梳理 1.相关关系与回归分析 回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法;判断相关性的常用统计图是:散点图;统计量有相关系数与相关指数. (1)在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关. (3)如果散点图中点的分布从整体上看大致在一条直线附近,称两个变量具有线性相关关系. 2.线性回归方程 (1)最小二乘法:使得样本数据的点到回归直线的距离的平方和最小的方法叫做最小二乘法. (2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,y1),(x2,y2),…,(x n,y n),其回归方程为y^=b^x+a^,则 ^是回归方程的斜率,a^是在y轴上的截距. 其中,b 回归直线一定过样本点的中心(x,y). 3.回归分析

(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心:对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中(x ,y )称为样本点的中心. (3)相关系数 当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关. r 的绝对值越接近于1,表明两个变量的线性相关性越强. r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性. (4)相关指数: 其中21()n i i i y y =-∑是残差平方和,其值越小, 则R 2越大(接近1),模型的拟合效果越好. 4.独立性检验 (1)利用随机变量K 2来判断“两个分类变量有关系”的方法称为独立性检验. (2)列联表:列出的两个分类变量的频数表,称为列联表.假设有两个分类变量X 和Y ,它们的可能取值分别为{x 1,x 2}和{y 1,y 2},其样本频数列联表(2×2列联表)为 则随机变量K 2 =n (ad -bc )2 (a +b )(a +c )(b +d )(c +d ),其中n =a +b +c +d 为样 本容量. [常用结论与微点提醒] 1.求解回归方程的关键是确定回归系数a ^,b ^,应充分利用回归直线过样本中心点 (x ,y ). 2.根据K 2的值可以判断两个分类变量有关的可信程度,若K 2越大,则两分类变

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习 A组 一、选择题 1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为() A.200 B.240 C.400 D.480 解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400. 2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为() A.3 B.4 C.12 D.21

解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为4 10= 2 5, 所以估计昆明市2020年4月份空气质量为优的天数为30×2 5=12,故选C. 3.(成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图. 已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是() A.最低气温与最高气温为正相关 B.10月的最高气温不低于5月的最高气温 C.月温差(最高气温减最低气温)的最大值出现在1月 D.最低气温低于0 ℃的月份有4个 解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D. 4.(承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是() A.是否倾向选择生育二胎与户籍有关 B.是否倾向选择生育二胎与性别无关

高考数学二轮复习-统计与统计案例知识点总结

统计与统计案例 1.该部分常考内容:样本数字特征的计算、各种统计图表、线性回归方程、独立性检验等;有时也会在知识交汇点处命题,如概率与统计交汇等. 2.从考查形式上来看,大部分为选择题、填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中低档题. 1.随机抽样 (1)简单随机抽样特点为从总体中逐个抽取,适用范围:总体中的个体较少. (2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取,适用范围:总体中的个体数较多. (3)分层抽样特点是将总体分成几层,分层进行抽取,适用范围:总体由差异明显的几部分组成. 2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距× 频率 组距 =频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1 组距. (2)茎叶图 在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 (2)方差:s 2=n [(x 1-x )2+(x 2-x )2+…+(x n -x )2 ]. 标准差:

s = 1n [ x 1-x 2+ x 2-x 2+…+ x n -x 2 ]. 4.变量的相关性与最小二乘法 (1)相关关系的概念、正相关和负相关、相关系数. (2)最小二乘法:对于给定的一组样本数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),通过求Q = i =1 n (y i -a -bx i )2 最小时,得到线性回归方程y ^ =b ^ x +a ^ 的方法叫做最小二乘法. 5.独立性检验 对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是: 则K 2 =n a +b c +d a +c b +d (其中n =a +b +c +d 为样本容量). 考点一 抽样方法 例1 (2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机 编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为 ( ) A .7 B .9 C .10 D .15 答案 C 解析 由系统抽样的特点知:抽取号码的间隔为 960 32 =30,抽取的号码依次为9,39,69,…,939.落入区间[451,750]的有459,489,…,729,这些数构成首项为459,公差为30的等差数列,设有n 项,显然有729=459+(n -1)×30,解得n =10.所以做问卷B 的有10人. 在系统抽样的过程中,要注意分段间隔,需要抽取几个个体,样本就需要分 成几个组,则分段间隔即为N n (N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,

高中数学必修三 概率与统计

高中数学必修三:概率与统计 1.要从已编号(1-50)的50枚最新研制的某型号导弹中随机抽取5枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5枚导弹的编号可能是( ). A.5,10,15,20,25B.3,13,23,33,43C.1,2,3,4,5D.2,4,8,16,32 2.从鱼塘捕得同一时间放养的草鱼240尾,从中任选9尾,称得每尾鱼的质量分别是1.5,1.6,1.4,1.6,1.3,1.4,1.2,1.7,1.8(单位:千克).依此估计这240尾鱼的总质量大约是( ).A.300克B.360千克C.36千克D.30千克 3.以下茎叶图记录了甲.乙两组各五名学生在一次英语听力测试中的成绩(单位:分) 已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y的值分别为()A.2,5B.5,5C.5,8D.8,8 4.为了考查两个变量x和y之间的线性关系,甲、乙两位同学各自独立作了10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1,l2,已知两人得的试验数据中,变量x和y的数据的平均值都分别相等,且值分别为s与t,那么下列说法正确的是( ). A.直线l1和l2一定有公共点(s,t)B.直线l1和l2相交,但交点不一定是(s,t) C.必有直线l1∥l2 D.直线l1和l2必定重合 5..设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为$y=0.85x-85.71,则下列结论中不正确的是( ).A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重比为58.79kg

高中数学选修1-2《统计案例》知识点讲义教学内容

第一章统计案例一、回归分析的基本思想及其初步应用 1、数学变量相关关系 的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不 确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关负相关不相关 (2)相关性系数r(在《必修3》中有介绍) 用相关系数r来衡量两个变量之间的相关关系 ()() ()() 1 22 11 n i i i n n i i i i x x y y r x x y y = == -- = -- ∑ ∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

高中数学概率与统计测试题

概率与统计 1.如果一个整数为偶数的 概率为 (1)a+b 为偶数的概率; (2)a+b+c 为偶数的概率。 0.6 ,且 a,b,c 均为整数,求 2.从 10 位同学 (其中 6 女,4 男)中随机选出 3 位参加测验,每位女同学能通过测验的概率 43 均为,每位男同学能通过测验的概率均为,求55 (1)选出的 3 位同学中,至少有一位男同学的概率; (2)10 位同学中的女同学甲和男同学乙同时被选中且通过测验的概率。 3.袋中有 6 个白球, 4 个红球,甲首先从中取出 3 个球,乙再从余下的 7 个球中取出 4 个球,凡取得红球多者获胜。试求 (1)甲获胜的概率; (2)甲,乙成平局的概率。 4.箱子中放着 3 个 1 元硬币, 3 个 5 角硬币, 4 个 1 角硬币,从中任取 3 个,求总钱数超过 1 元 8 角的概率。 5.有 10 张卡片,其号码分别位 1,2,3?,10,从中任取 3 张。 (1)求恰有 1 张的号码为 3 的倍数的概率; (2)记号码为 3 的倍数的卡片张数为ξ,求ξ的数学期望。 6.某种电子玩具按下按钮后,会出现白球或绿球,已知按钮第一次按下后,出现红球与绿球 1 的概率都是,从按钮第二次按下起,若前次出现红球,则下次出现红球、绿球的概率2 1 2 3 2 分别为, ;若前次出现绿球,则下次出现红球、绿球的概率分别为, ,记第 n(n ∈ 3 3 5 5 N,n ≥1) 次按下后,出现红球的概率为P n

(1)求P2的值; (2)当 n∈N,n ≥2 时,求用P n 1表示P n的表达式; (3)求P n关于 n 的表达式。 7.有甲、乙两个盒子 ,甲盒子中有 8 张卡片 ,其中两张写有数字 0,三张写有数字 1 ,三张写有数字 2 ;乙盒子中有 8 张卡片,其中三张写有数字 0,两张写有数字1,三张写有数字 2 , (1) 如果从甲盒子中取两张卡片,从乙盒子中取一张卡片,那么取出的 3 张卡片都写有 1 的概率是多少? (2)如果从甲、乙盒子中各取一张卡片,设取出的两张卡片数字之和为ξ,求ξ的分布列和期望。 8.甲、乙两位同学做摸球游戏,游戏规则规定:两人轮流从一个放有 1 个白球, 3 个黑球, 2 个红球且只有颜色不同的 6 个小球的暗箱中取球,每次每人只取一球,每取出一个后立即放回,另一个人接着取,取出后也立即放回,谁先取到红球,谁为胜者,现甲先取 (1) 求甲摸球次数不超过三次就获胜的概率; (2) 求甲获胜的概率。 9.设有均由 A,B,C 三个部件构成的两种型号产品甲和乙,当A或 B 是合格品并且 C 是合格 品时,甲是正品;当 A, B 都是合格品或者 C 是合格品时,乙是正品。若 A 、 B、C 合格的概率均是 P,这里 A ,B,C 合格性是互相独立的。 (1) 产品甲为正品的概率P1是多少? (2)产品乙为正品的概率P2 是多少? (3)试比较P1与P2的大小。 10.一种电路控制器在出厂时每四件一等品装成一箱,工人在装箱时不小心把两件二等品和两件一等品装入了一箱,为了找出该箱的二等品,我们对该箱中的产品逐一取出进行测试。 (1) 求前二次取出的都是二等品的概率; (2) 求第二次取出的是二等品的概率; (3)用随机变量ξ表示第二个二等品被取出时共取的件数,求ξ的分布列及数学

(完整版)数学知识点--考点14--统计与统计案例

极差 组数、组距 分组 列表 咼频率/组距 面积=频率= 频数 样本容量 小矩形面积和=1 统计与统计案例 1. 统计的基本思想是用部份来估计总体。 2. 统计中所考察的对象的全体构成的集合看做总体, 构成总体的每个元素作为个体,从总 体中抽取的一部份个体所组成的集合叫做样本,样本中个体的数目叫做样本容量。 一、抽样方法 2.图形特征 1) 茎叶图 2) 直方图 、用样本估计总体 1.数字特征 注意: 2 2 i am b ,贝U i 的平均数为ax b ,方差为a s

3)条形图与直方图的区别:直方图中矩形通常连续排列,条形图则是分开排开; 直方图是用面积表示各 组频率的多少, 高表示每一组的频率除以组距, 组距,条形图的高表示频数的多少,其宽是固定的,表示类别。 三、变量间的相关关系 确定关系:函数关系 2.样本相关系数r : r 0.75时,认为两个变量有很强的线性相关关系。 3. 最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法。 过样本中心X, y 2 2 6. 相关指数R : R 的值越大,说明残差平方和越小,即模型的拟合效果起好。 回归效果越好。 7. 回归方程:只适用于研究的样本的总体;具有时间性;样本的取值范围会影响总 体的范围;预报值与精 确值往往不一样。 8. 步骤 宽表示 关系 非确定:相关关系 回归分析 散点图 回归曲线 回归直线 y $x $b X i y i i 1 nxy -2 x y i y X i nx 5.随机误差 e y bX i a 估计值 残差 y i bX i $ 残差分析 形:残差图 数:R 2 0,1 线性回归模型中, R 2表示解释变量对预报变量的贡献率, R 2越接近于 1,表示

高中数学选修1-2《统计案例》知识点讲义汇编

第一章 统计案例 一、回归分析的基本思想及其初步应用 1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系. (1)按方向分类 ①正相关:两个变量的变化趋势相同,从散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。 ②负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。 正相关 负相关 不相关 (2)相关性系数r (在《必修3》中有介绍) 用相关系数r 来衡量两个变量之间的相关关系 ()() ()() 1 2 2 1 1 n i i i n n i i i i x x y y r x x y y ===--= --∑∑∑

2、两变量之间的关系存在两种不同的类型 (1)相关关系——非确定性关系 (2)函数关系——确定性关系 3、回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。 其基本步骤是:①画出两个变量的散点图; ②求回归直线方程; ③并用回归直线方程进行预报。 4、回归直线方程:∧ ∧∧+=a x b y ?? ?? ????? -=--=---=∧∧====∧∑∑∑∑x b y a x n x y x n y x x x y y x x b n i i n i i i n i i n i i i ,)())((1 221121 ()()()10.00,2,. b b r x y ≠==说明:回归系数因为当时,相关系数这时不具有线性相关关系. 称为样本点的中心,回归直线必定经过样本点的中心

相关文档
相关文档 最新文档