文档库 最新最全的文档下载

当前位置：文档库 › 概率与数理统计公式大全

概率与数理统计公式大全

概率与数理统计公式大全

概率与数理统计公式大全

第1章随机事件及其概率第二章随机变量及其分布

（1）离散型随机变量的分布律

设离散型随机变量X的可能取值为X k(k=1,2,…)且取各个值的概率，即事件(X=X k)的概率为

P(X=x k)=p k，k=1,2,…，

则称上式为离散型随机变量X的概率分布或分布律。有时也用分布列的形式给出：

Λ

Λ

Λ

Λ

,

,

,

,

,

,

,

,

|

)

(2

1

2

1

k

k

k p

p

p

x

x

x

x

X

P

X

=。

显然分布律应满足下列条件：

（1）

≥

k

p，Λ,2,1

=

k，（2）

∑∞

=

=

1

1

k

k

p

。

（2）连续型随机变量的分布密度设

)

(x

F是随机变量X的分布函数，若存在非负函数)

(x

f，对任意实数x，有?∞-=x dx

x

f

x

F)

(

)

(

，

则称X为连续型随机变量。)

(x

f称为X的概率密度函数或密度函数，简称概率密度。

密度函数具有下面4个性质：

1°

)

(≥

x

f。

2°

?+∞∞-=1

)

(dx

x

f

。

（3）离散与连续型随机变量的关系

dx

x

f

dx

x

X

x

P

x

X

P)

(

)

(

)

(≈

+

≤

<

≈

=

积分元dx

x

f)

(在连续型随机变量理论中所起的作用与k

k p

x

X

P=

=)

(在离散型随机变量理论中所起的作用相类似。

（4）分布函数

设X 为随机变量，x 是任意实数，则函数

)()(x X P x F ≤=

称为随机变量X 的分布函数，本质上是一个累积函数。

)()()(a F b F b X a P -=≤< 可以得到X 落入区间],(b a 的概率。分布

函数)(x F 表示随机变量落入区间（– ∞，x]内的概率。

分布函数具有如下性质：

1° ,1)(0≤≤x F +∞<<∞-x ；

2° )(x F 是单调不减的函数，即21x x <时，有 ≤)(1x F )(2x F ； 3° 0)(lim )(==-∞-∞

→x F F x ， 1)(lim )(==+∞+∞

→x F F x ；

4° )()0(x F x F =+，即)(x F 是右连续的； 5° )0()()(--==x F x F x X P 。对于离散型随机变量，∑≤=

x x k

k p

x F )(；

对于连续型随机变量，?∞

-=

x

dx x f x F )()( 。

（5）八大分布

0-1分布 P(X=1)=p, P(X=0)=q

二项分布

在n 重贝努里试验中，设事件A 发生的概率为p 。事件A 发生的次数是随机变量，设为X ，则X 可能取值为n ,,2,1,0Λ。

k

n k k

n n q p C k P k X P -===)()(，其中

n k p p q ,,2,1,0,10,1Λ=<<-=，

则称随机变量X 服从参数为n ，p 的二项分布。记为

),(~p n B X 。

当1=n 时，k

k

q

p k X P -==1)(，1.0=k ，这就是（0-1）分

布，所以（0-1）分布是二项分布的特例。

泊松分布设随机变量X 的分布律为

λλ-=

=e k k X P k

!

)(，0>λ，Λ2,1,0=k ，

则称随机变量X 服从参数为λ的泊松分布，记为)(~λπX 或者P(λ)。

泊松分布为二项分布的极限分布（np=λ，n →∞）。

超几何分布

),min(,2,1,0,)(n M l l k C C C k X P n

N

k

n M

N k M ==?==--Λ 随机变量X 服从参数为n,N,M 的超几何分布，记为H(n,N,M)。

几何分布

Λ,3,2,1,)(1===-k p q k X P k ，其中p ≥0，q=1-p 。

随机变量X 服从参数为p 的几何分布，记为G(p)。

均匀分布

设随机变量X 的值只落在[a ，b]内，其密度函数)(x f 在[a ，b]上为常数a

b -1

，即

??

?

??-=,0,1)(a

b x f 其他，则称随机变量X 在[a ，b]上服从均匀分布，记为X ~U(a ，b)。

分布函数为

?∞

-=

=x

dx x f x F )()(

当a ≤x 1

a

b x x x X x P --=

<<1

221)(。

0， x

x -- a ≤x ≤b

其中0>λ，则称随机变量X 服从参数为λ的指数分布。 X 的分布函数为

记住积分公式：

设随机变量X 的密度函数为

x f ， +∞<<∞-x ，

其中μ、0>σ为常数，则称随机变量X 服从参数为μ、

σ的正态分布或高斯（Gauss ）分布，记为

σμN X 。 )(x f 具有如下性质：

1° )(x f 的图形是关于μ=x 对称的； 2° 当μ=x 时，σπμ21

f 为最大值；

若),(~2σμN X ，则X 的分布函数为 dt e x F x t ?∞---=22

2)(21)(σμπσ。。

参数0=μ、1=σ时的正态分布称为标准正态分布，记为

)1,0(~N X ，其密度函数记为 2

x -=π?，+∞<<∞-x ，

分布函数为

)(x Φ是不可求积函数，其函数值，已编制成表可供查用。

Φ(-x)＝1-Φ(x)且Φ(0)＝

21。如果X ~),(2

σμN ，则σμ-X ~)1,0(N 。

??-Φ-??? ??-Φ=≤<σμσμ1221)(x x x X x P 。

=)(x f ,x e λλ- 0≥x ,

e λ-- 0≥x , ,0 x<0。

（6）分位数下分位表：α

P；上分位表：α

（7）函数分布离散型

已知X的分布列为

Y=的分布列（)

y=互不相等）如下：

g相等，则应将对应的

先利用X的概率密度f X(x)写出Y的分布函数F Y(y)＝P(g(X)≤

y)，再利用变上下限积分的求导公式求出f Y(y)。

第三章二维随机变量及其分布

（1）联合分布离散型

如果二维随机向量ξ（X，Y）的所有可能取值为至多可列个有序对（x,y），则称ξ为离散型随机量。

设ξ=（X，Y）的所有可能取值为)

，且事件{ξ=)

x}的概率为p ij,,称

为ξ=（X，Y）的分布律或称为X和Y的联合分布律。联合分

布有时也用下面的概率分布表来表示：

x1p11p12…p1j…

x2p21p22…p2j…

这里p ij具有下面两个性质：

（1）p ij≥0（i,j=1,2,…）；

对于二维随机向量),(Y X =ξ，如果存在非负函数

),)(,(+∞<<-∞+∞<<-∞y x y x f ，使对任意一个其邻边

分别平行于坐标轴的矩形区域D ，即D={(X,Y)|a

dxdy y x f D Y X P ,),(}),{(

则称ξ为连续型随机向量；并称f(x,y)为ξ=（X ，Y ）的分布密度或称为X 和Y 的联合分布密度。

分布密度f(x,y)具有下面两个性质：（1） f(x,y)≥0; （2）

-=.1),(dxdy y x f

（2）二维随机变量的本质 )(),(y Y x X y Y x X =====I ξξ

（3）联合分布函数

设（X ，Y ）为二维随机变量，对于任意实数x,y,二元函数

},{),(y Y x X P y x F ≤≤=

称为二维随机向量（X ，Y ）的分布函数，或称为随机变量X 和Y 的联合分布函数。

分布函数是一个以全平面为其定义域，以事件

})(,)(|),{(2121y Y x X ≤<-∞≤<-∞ωωωω的概率为函数值的一个实值函

数。分布函数F(x,y)具有以下的基本性质：（1）;1),(0≤≤y x F

（2）F （x,y ）分别对x 和y 是非减的，即

当x 2>x 1时，有F （x 2,y ）≥F(x 1,y);当y 2>y 1时，有F(x,y 2) ≥F(x,y 1); （3）F （x,y ）分别对x 和y 是右连续的，即

);0,(),(),,0(),(+=+=y x F y x F y x F y x F

（4）.1),(,0),(),(),(=+∞+∞=-∞=-∞=-∞-∞F x F y F F （5）对于，，2121y y x x <<

0)()()()(11211222≥+--y x F y x F y x F y x F ，，，，.

型与连续型的关系

dxdy y x f dy y Y y dx x X x P y Y x X P )()()(，，，≈+≤<+≤<≈==

（5）边缘分布

离散型 X 的边缘分布为

),2,1,()(Λ====∑?j i p x X P P ij j

Y 的边缘分布为

),2,1,()(Λ====∑?j i p y Y P P ij i

连续型 X 的边缘分布密度为

-=；dy y x f x f X ),()(

Y 的边缘分布密度为

-=dx y x f y f Y

（6）条件分布

在已知X=x i 的条件下，Y 取值的条件分布为

==i ij i j p p x X y Y P )|( 在已知Y=y j 的条件下，X 取值的条件分布为

ij j i p p y Y x X P ?=

在已知Y=y 的条件下，X 的条件分布密度为

,()|(y f y x f y x f Y =

；在已知X=x 的条件下，Y 的条件分布密度为

,()|(x f y x f x y f X =

（7）独立性

一般型 F(X,Y)=F X (x)F Y (y)

j i ij p p p ??=

有零不独立

f(x,y)=f X (x)f Y (y) 直接判断，充要条件： ①可分离变量

②正概率密度区间为矩形

二维正态分布

),(2222121211221))((2)1(21

?-+---???? ??---

σσμμρσμρρ

σπσy y x x e

随机变量的函数

若X 1,X 2,…X m ,X m+1,…X n 相互独立， h,g 为连续函数，则： h （X 1，X 2,…X m ）和g （X m+1,…X n ）相互独立。

特例：若X 与Y 独立，则：h （X ）和g （Y ）独立。例如：若X 与Y 独立，则：3X+1和5Y-2独立。

其中S D 为区域D 的面积，则称（X ，Y ）服从D 上的均匀分布，记为（X ，Y ）～U （D ）。

例如图3.1、图3.2和图3.3。

),(2222121211221))((2)1(21

?-+---???? ??---

σσμμρσμρρ

σπσy y x x e

其中1||,0,0,21,21<>>ρσσμμ是5个参数，则称（X ，Y ）服从二维正态分布，

记为（X ，Y ）～N （).,,,2

221,21ρσσμμ

由边缘密度的计算公式，可以推出二维正态分布的两个边缘分布仍为正态分布，

即X ～N （).(~),,2

2,2211σμσμN Y

但是若X ～N （)(~),,22,2211σμσμN Y ，(X ，Y)未必是二维正态分布。

根据定义计算：)()()(z Y X P z Z P z F Z ≤+=≤=

对于连续型，f Z (z)＝

dx x z x f ?+∞

两个独立的正态分布的和仍为正态分布（2

121,σσμμ++）。 n 个相互独立的正态分布的线性组合，仍服从正态分布。

i i C μμ， ∑=i

X 1,X 2,…X n )

若n X X X Λ21,相互独立，其分布函数分别为

)()()(21x F x F x F n x x x Λ，，则Z=max,min(X 1,X 2,…X n )的分布

)()()()(21max x F x F x F x F n x x x Λ?=

)](1[)](1[)](1[1)(21min x F x F x F x F n x x x --?--=Λ

2χ分布设n 个随机变量n X X X ,,,21Λ相互独立，且服从标准正态分布，可以证明它们的平方和

的分布密度为

???????<≥??? ??Γ=--.

)(2122u u e u n u f u n n

我们称随机变量W 服从自由度为n 的2

χ分布，记为W ～)(2

-∞+-?=??? ??Γ 所谓自由度是指独立正态随机变量的个数，它是随机变量分布中的一个重要参数。

2χ分布满足可加性：设

),(2i i n Y χ-

i i n n n Y Z +++=∑=Λχ

t 分布设X ，Y 是两个相互独立的随机变量，且

),(~),1,0(~2n Y N X χ

可以证明函数

的概率密度为

?? ??+Γ=n n t n n n t f π

我们称随机变量T 服从自由度为n 的t 分布，记为T ～t(n)。

)()(1n t n t αα-=-

12n Y n X χχ，且X 与Y 独立，可以证明

的概率密度函数为 ???

????? ??Γ??? ??Γ???

111y y y n n y n n n n n n y f n n n n

我们称随机变量F 服从第一个自由度为n 1，第二个自由度为n 2的F 分布，记为F ～f(n 1, n 2).

),(12211n n F n n F αα=

第四章随机变量的数字特征

（1）一维随机变量的数字特征

期望就是平均值

设X 是离散型随机变量，其分布律为P(k x X =)＝p k ，k=1,2,…,n ，

k k k p x X E 1

（要求绝对收敛）

设X 是连续型随机变量，其概率密

dx x xf X E )()(

（要求绝对收敛）

函数的期望

k k k p x g Y E 1

dx x f x g Y E )()()(

D(X)=E[X-E(X)]2

)()(X D X =σ，

k k p X E x X D 2)]([)(

--=dx x f X E x X D )()]([)(2

①对于正整数k ，称随机变量X 的k 次幂的数学期望为X 的k 阶原点矩，记为v k ,即

②对于正整数k ，称随机变量X 与E （X ）差的k 次幂的数学期望为X 的k 阶中心矩，记为k μ，即

①对于正整数k ，称随机变量X 的k 次幂的数学期望为X 的k 阶原点矩，记为v k ,即 νk =E(X k

②对于正整数k ，称随机变量X 与E （X ）差的k 次幂的数学期望为X

的k 阶中心矩，记为k μ，即 .

--,)())((dx x f X E x k

切比雪夫不等式

设随机变量X 具有数学期望E （X ）=μ，方差D （X ）=σ2

，则对于任意正数ε，有下列切比雪夫不等式

σεμ≤≥-X P

切比雪夫不等式给出了在未知X 的分布的情况下，对概率

的一种估计，它在理论上有重要意义。

（2）期望的性质

（2） E(CX)=CE(X)

（3） E(X+Y)=E(X)+E(Y)，∑∑===n

（4） E(XY)=E(X) E(Y)，充分条件：X 和Y 独立；充要条件：X 和Y 不相关。

（3）方差的性质

（1） D(C)=0；E(C)=C

（2） D(aX)=a 2

D(X)； E(aX)=aE(X)

（3） D(aX+b)= a 2

D(X)； E(aX+b)=aE(X)+b

（4） D(X)=E(X 2)-E 2

（5） D(X ±Y)=D(X)+D(Y)，充分条件：X 和Y 独立；充要条件：X 和Y 不相关。

D(X ±Y)=D(X)+D(Y) ±2E[(X-E(X))(Y-E(Y))]，无条件成立。

而E(X+Y)=E(X)+E(Y)，无条件成立。（4）常见分布

0-1分布),1(p B

的期望和方差

np-泊松分布)

Pλλ几何分布)

超几何分布)

nM 均匀分布)

b-指数分布)

（5）二维随机变量的数字特征期望

函数的期望

对于随机变量X 与Y ，称它们的二阶混合中心矩11μ为X 与Y 的协方差或相关矩，记为),cov(Y X XY 或σ，即

))].())(([(11Y E Y X E X E XY --==μσ

与记号XY σ相对应，X 与Y 的方差D （X ）与D （Y ）也可分别记为XX σ与YY σ。

对于随机变量X 与Y ，如果D （X ）>0, D(Y)>0，则称

为X 与Y 的相关系数，记作XY ρ（有时可简记为ρ）。

|ρ|≤1，当|ρ|=1时，称X 与Y 完全相关：1)(=+=b aY X P

时负相关，当，

时正相关，当)0(1)0(1a a ρρ

而当0=ρ时，称X 与Y 不相关。以下五个命题是等价的： ①0=XY ρ； ②cov(X,Y)=0; ③E(XY)=E(X)E(Y); ④D(X+Y)=D(X)+D(Y); ⑤D(X-Y)=D(X)+D(Y).

协方差矩阵

??YY YX XY XX σσσσ 混合矩

对于随机变量X 与Y ，如果有)(l

Y X E 存在，则称之为X 与Y 的

k+l 阶混合原点矩，记为kl ν；k+l 阶混合中心矩记为：

].))(())([(l k kl Y E Y X E X E u --=

协方差的性质

(i) cov (X, Y)=cov (Y, X); (ii) cov(aX,bY)=ab cov(X,Y);

(iii) cov(X 1+X 2, Y)=cov(X 1,Y)+cov(X 2,Y); (iv)

cov(X,Y)=E(XY)-E(X)E(Y).

（7）独立和不相关（i）若随机变量X与Y相互独立，则0

ρ；反之不真。（ii）若（X，Y）～N（ρ

则X与Y相互独立的充要条件是X和Y不相关。

第五章大数定律和中心极限定理

（1）大数定律

设随机变量X1，X2，…相互独立，均具有有限方差，且被同一

常数C所界：D（X i）

特殊情形：若X1，X2，…具有相同的数学期望E（X I）=μ，则上式成为

设μ是n次独立试验中事件A发生的次数，p是事件A在每次试验中发生的概率，则对于任意的正数ε，有

伯努利大数定律说明，当试验次数n很大时，事件A发生的频率与概率有较大判别的可能性很小，即

这就以严格的数学形式描述了频率的稳定性。

设X1，X2，…，X n，…是相互独立同分布的随机变量序列，且E

（X n）=μ，则对于任意的正数ε有

（2）中心极限定理

列维－林德伯格定理

设随机变量X 1，X 2，…相互独立，服从同一分布，且具有相同的数学期望和方差：),2,1(0)(,)(2Λ=≠==k X D X E k k σμ，则随机变量

的分布函数F n (x )对任意的实数x ，有

t n k k n n n dt e

x n n X P x F .21lim )(lim 2

此定理也称为独立同分布的中心极限定理。

－拉普拉斯定理

设随机变量n X 为具有参数n, p(0

x p np np X P .21)1(lim 2

（3）二项定理

不变时k n p N

N →∞→，则 k n k k n n

N k M p p C C C C ----→)1( ).(∞→N

超几何分布的极限分布为二项分布。

（4）泊松定理

若当0,>→∞→λnp n 时，则

其中k=0，1，2，…，n ，…。二项分布的极限分布为泊松分布。

第六章样本及抽样分布

（1）数理统计的基本概念

在数理统计中，常把被考察对象的某一个（或多个）指标的全体称为总体（或母体）。我们总是把总体看成一个具有分布的随机变量（或随机向量）。个体

总体中的每一个单元称为样品（或个体）。

我们把从总体中抽取的部分样品n x x x ,,,21Λ称为样本。样本中所含的样品数称为样本容量，一般用n 表示。在一般情况下，总是把样本看成是n 个相互独立的且与总体有相同分布的随机变量，这样的样本称为简单随机样本。在泛指任一次抽取的结果时，n x x x ,,,21Λ表示n 个随机变量（样本）；在具体的一次抽取之后，n x x x ,,,21Λ表示n 个具体的数值（样本值）。我们称之为样本的两重性。

样本函数和

设n x x x ,,,21Λ为总体的一个样本，称

??= （n x x x ,,,21Λ）

为样本函数，其中?为一个连续函数。如果?中不包含任何未知参数，则称?（n x x x ,,,21Λ）为一个统计量。

常见统计量及其性质

2.)(11 样本标准差

i i x x n S 样本k 阶原点矩

样本k 阶中心矩

k x x n M 1.,3,2,)(1Λ μ=)(X E ，n

22)(σ=S E ，2

, 其中∑=-=n i i X X n S 1

)(1*，为二阶中心矩。

（2）正态总体下的四大分布正态分布

Λ为来自正态总体)

N的一个样本，则样本函数

Λ为来自正态总体)

N的一个样本，则样本函数

其中t(n-1)表示自由度为n-1的t分布。

Λ为来自正态总体)

N的一个样本，则样本函数

χ表示自由度为n-1的2χ分布。

Λ为来自正态总体)

N的一个样本，而

Λ为来自正态总体)

N的一个样本，则样本函数

F表示第一自由度为1

n，第二自由度为

X与2S独立。

第七章参数估计

（1）点估计矩估计

设总体X的分布中包含有未知数

Λ，则其分布函数可以表成

θΛ它的k阶原点矩)

包含了未知参数

Λ为总体X的n个样本值，其样本的k阶原点矩为

这样，我们按照“当参数等于其估计量时，总体矩等于相应的样本矩”

的原则建立方程，即有

由上面的m个方程中，解出的m个未知参数)

θΛ即为参数

Λ）的矩估计量。

θ为θ的矩估计，)

g为连续函数，则)?(θ

g的矩估计。

极大似然估计

当总体X为连续型随机变量时，设其分布密度为

Λ为未知参数。又设n

Λ为总体的一个样本，称

为样本的似然函数，简记为L n.

当总体X为离型随机变量时，设其分布律为

为样本的似然函数。

若似然函数)

1Λ处取到最大值，则称m

1Λ分别为mθ

Λ的最大似然估计值，相应的统计量称为最大似然估计量。

θ为θ的极大似然估计，)

g为单调函数，则)?(θ

g的极大似然估计。

（2）估计量的评选标准无偏性

θ为未知参数θ的估计量。若E （∧θ）=θ，则称

θ为θ的无偏估计量。

E（X）=E（X）， E（S2）=D（X）

θ是未知参数θ的两个无偏估计量。若)