概率与统计
一、普通的众数、平均数、中位数及方差 1、 众数:一组数据中,出现次数最多的数。
2、平均数:①、常规平均数:12n
x x x x n
++???+=
②、加权平均数:112212n n n x x x x ωωωωωω++???+=++???+
3、中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数。
4、方差:2222121
[()()()]n s x x x x x x n
=
-+-+???+- 二、频率直方分布图下的频率
1、频率 =小长方形面积:f S y d ==?距;频率=频数/总数
2、频率之和:121n f f f ++???+=;同时 121n S S S ++???+=;
三、频率直方分布图下的众数、平均数、中位数及方差 1、众数:最高小矩形底边的中点。
2、平均数: 112233n n
x x f x f x f x f =+++???+ 112233n n x x S x S x S x S =+++???+ 3、中位数:从左到右或者从右到左累加,面积等于0.5时x 的值。 4、方差:22221122()()()n n s x x f x x f x x f =-+-+???+-
四、线性回归直线方程:???y
bx a =+ 其中:1
1
2
22
1
1
()()
?()
n
n
i i i i i i n
n
i i i i x x y y x y nxy
b
x x x nx ====---∑∑==
--∑∑ , ??a
y bx =- 1、线性回归直线方程必过样本中心(,)x y ;
2、?0:b
>正相关;?0:b <负相关。 3、线性回归直线方程:???y bx a =+的斜率?b 中,两个公式中分子、分母对应也相等;中间可以推导得到。 五、回归分析
1、残差:??i i i e
y y =-(残差=真实值—预报值)。分析:?i e 越小越好; 2、残差平方和:21?()n
i i i y y
=-∑, 分析:①意义:越小越好; ②计算:222211221
????()()()()n
i i n n i y y
y y y y y y =-=-+-+???+-∑ 3、拟合度(相关指数):221
2
1
?()1()
n
i i i n
i i y y
R y y ==-∑=-
-∑,分析:①.(]20,1R ∈的常数; ②.越大拟合度越高;
4、相关系数
:()()
n
n
i i i i x x y y x y nx y
r ---?∑∑=
=
分析:①.[r ∈-的常数; ②.0:r >正相关;0:r <负相关
③.[0,0.25]r ∈;相关性很弱; (0.25,0.75)r ∈;相关性一般; [0.75,1]r ∈;相关性很强; 六、独立性检验 1、2×2列联表: 2、独立性检验公式 ①.2
2()
()()()()
n ad bc k a b c d a c b d -=++++
②.犯错误上界P 对照表
3、独立性检验步骤
①.计算观察值k :2
()()()()()
n ad bc k a b c d a c b d -=++++;
②.查找临界值0k :由犯错误概率P,根据上表查找临界值0k ;
③.下结论:0k k ≥:即犯错误概率不超过P的前提下认为: ,有1-P 以上的把握认为: ; 0k k <:即犯错误概率超过P 的前提认为: ,没有1-P以上的把握认为: ; 【经典例题】
题型1 与茎叶图的应用
例1(2014全国)某市为考核甲、乙两部门的工作情况,学科网随机访问了50位市民。根据这50位市民 (1)分别估计该市的市民对甲、乙部门评分的中位数;
(2)分别估计该市的市民对甲、乙部门的评分做于90的概率;
(3)根据茎叶图分析该市的市民对甲、乙学科网两部门的评价。
题型2 频率直方分布图的应用
例2(2015广东)某城市100户居民的月平均用电量(单位:度),以160,180,180,200,200,220,220,240,240,260,260,280,280,300分组的频率分布直方图如图2,
(1)求直方图中x 的值;
(2)求月平均用电量的众数和中位数; (3)在月平均用电量为220,240,
240,260,260,280,280,300的四组用户中,用分层抽样的方
法抽取11户居民,则月平均用电量在220,240的用户中应抽取多少户?
练习2 (2014全国1)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量表得质量指标值分组 [75,85) [85,95) [95,10[105,11[115,
5)
5) 125) 频数 6 26
38
22
8
(1图:
(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);
(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?
题型3 计算线性回归方程
例3(2015重庆)随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余年份 2 2013 2014 时间代号t 1 2 3 4 5 储蓄存款y (千亿元) 5 6 7 8 10
(1)求y 关于t 的回归方程???y
bt a =+ (2)用所求回归方程预测该地区2015年(t =6)的人民币储蓄存款.
:千元)的数据如下表:
年份 2 2 2013 年份代号t 1 2 3 4 5 6 7 人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 (2)利用(1)中的回归方程,分析2007年至2013年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2015年农村居民家庭人均纯收入.
题型4 线性回归分析
例4(2016全国3)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.