统计概率知识点归纳总结大全
1.了解随机事件的发生存在着规律性和随机事件概率的意义.
2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率.
3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率.
4.会计算事件在n 次独立重复试验中恰好发生k 次的概率.
5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归.
考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识:
(1)等可能性事件(古典概型)的概率:P (A )=)
()(I card A card =n
m ;
等可能事件概率的计算步骤:
(1) 计算一次试验的基本事件总数n ;
(2) 设所求事件A ,并计算事件A 包含的基本事件的个数m ; (3) 依公式()m P A n
=求值;
(4) 答,即给问题一个明确的答复.
(2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B );
特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项.
(4)解决概率问题要注意“四个步骤,一个结合”: ① 求概率的步骤是:
第一步,确定事件性质????
???等可能事件
互斥事件 独立事件 n 次独立重复试验
即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算??
?和事件积事件
即是至少有一个发生,还是同时发生,分别运用相加或相乘事件.
第三步,运用公式()()()()()()()()(1)
k k n k n n m P A n
P A B P A P B P A B P A P B P k C p p -?
=???+=+?
??=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 考点2离散型随机变量的分布列 1.随机变量及相关概念
①随机试验的结果可以用一个变量来表示,这样的变量叫做随机变量,常用希腊字母ξ、η等表示.
②随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. ③随机变量可以取某区间内的一切值,这样的随机变量叫做连续型随机变量. 2.离散型随机变量的分布列
①离散型随机变量的分布列的概念和性质
一般地,设离散型随机变量ξ可能取的值为1x ,2x ,……,i x ,……,ξ取每一个值i
x (=i 1,2,……)的概率P (i x =ξ)=i P ,则称下表.
为随机变量ξ的概率分布,简称ξ的分布列.
由概率的性质可知,任一离散型随机变量的分布列都具有下述两个性质: (1)0≥i P ,=i 1,2,…;(2)++21P P …=1. ②常见的离散型随机变量的分布列: (1)二项分布
n 次独立重复试验中,事件A 发生的次数ξ是一个随机变量,其所有可能的取值为0,
1,2,…n ,并且k n k k n k q p C k P P -===)(ξ,其中n k ≤≤0,p q -=1,随机变量ξ的分布列如下:
ξ
1
… k
… n
P
n n q p C 00
1
11-n n q p C
…
k n k k
n q p C -
q p C n n n
称这样随机变量ξ服从二项分布,记作),(~p n B ξ,其中n 、p 为参数,并记:
),;(p n k b q p C k
n k k n =- .
(2) 几何分布
在独立重复试验中,某事件第一次发生时所作的试验的次数ξ是一个取值为正整数的离散型随机变量,“k ξ=”表示在第k 次独立重复试验时事件第一次发生.
随机变量ξ的概率分布为:
ξ
1x
2x
… i x
… P
P 1
P 2
…
i P
…
ξ
1 2 3
… k
… P
p
qp
2q p
…
1k q p -
…
考点3 离散型随机变量的期望与方差 随机变量的数学期望和方差
(1)离散型随机变量的数学期望:++=2211p x p x E ξ…;期望反映随机变量取值的平均水平. ⑵离散型随机变量的方差:+-+-=222121)()(p E x p E x D ξξξ…+-+n n p E x 2)(ξ…; 方差反映随机变量取值的稳定与波动,集中与离散的程度. ⑶基本性质:b aE b a E +=+ξξ)(;ξξD a b a D 2)(=+.
(4)若ξ~B(n ,p),则 np E =ξ ; D ξ =npq (这里q=1-p ) ;
如果随机变量ξ服从几何分布,),()(p k g k P ==ξ,则p
E 1=ξ,D ξ =2
p
q 其中q=1-p.
考点4 抽样方法与总体分布的估计 抽样方法
1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.
2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).
3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样. 总体分布的估计
由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体的分布,一般地,样本容量越大,这种估计就越精确.
总体分布:总体取值的概率分布规律通常称为总体分布.
当总体中的个体取不同数值很少时,其频率分布表由所取样本的不同数值及相应的频率表示,几何表示就是相应的条形图.
当总体中的个体取值在某个区间上时用频率分布直方图来表示相应样本的频率分布. 总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线. 考点5 正态分布与线性回归 1.正态分布的概念及主要性质 (1)正态分布的概念
如果连续型随机变量ξ 的概率密度函数为 2
22)(21)(σμπσ
--
=
x e
x f ,x R ∈ 其中σ、μ为
常数,并且σ>0,则称ξ服从正态分布,记为~N ξ(μ,2σ).
(2)期望E ξ =μ,方差2σξ=D . (3)正态分布的性质 正态曲线具有下列性质:
①曲线在x 轴上方,并且关于直线x =μ对称.
②曲线在x=μ时处于最高点,由这一点向左右两边延伸时,曲线逐渐降低.
③曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越“矮胖”;反之越“高瘦”.
(4)标准正态分布
当μ=0,σ=1时ξ服从标准的正态分布,记作~N ξ(0,1) (5)两个重要的公式
①()1()x x φφ-=-,② ()()()P a b b a ξφφ<<=-.
(6)2(,)N μσ与(0,1)N 二者联系.
(1)若2~(,)N ξμσ,则~(0,1)N ξμησ
-= ;
②若2~(,)N ξμσ,则()()()b a P a b μμξφφσ
σ
--<<=-.
2.线性回归
简单的说,线性回归就是处理变量与变量之间的线性关系的一种数学方法.
变量和变量之间的关系大致可分为两种类型:确定性的函数关系和不确定的函数关系.不确定性的两个变量之间往往仍有规律可循.回归分析就是处理变量之间的相关关系的一种数量统计方法.它可以提供变量之间相关关系的经验公式.
具体说来,对n 个样本数据(11,x y ),(22,x y ),…,(,n n x y ),其回归直线方程,或经验公式为:a bx y +=?.其中
,
,)(1
2
21
x b y a x n x
y
x n y
x b n
i i
n
i i
i
?-=--=
∑∑==,其中y x ,分别为|i x |、|i y |的平均
数.