文档视界 最新最全的文档下载
当前位置:文档视界 > 浅析二项分布、泊松分布和正态分布之间的关系

浅析二项分布、泊松分布和正态分布之间的关系

浅析二项分布、泊松分布和正态分布之间的关系

1预备知识

1.1二项分布

在同一条件下重复做n次独立试验,每次试验只可能有两种对立的结果:A和A之一,并设在同一次试验中A发生的

概率是P (A) = p,0

在n次独立试验中,出现A的总计次数k是一个随机变量.

并且总有

P夏X=k卜心Pk9-_k,(k=o,LZ,…,n)

班分布称为二项分布,是因为CApk9"-kt.&为(9+ p)k

二项展开式的各项系数.这种概率模型也被称为伯努利概

型。X服从参数为n, p的二项分布,记为X一b (n, p)。

由二项分布的定义知.随机变量X是n重伯努利试验中事

件A发生的次数,且在每次试验中A发生的概率为p。二项

分布的数学期望和方差分别是EX = np,DX=np(l一月。

1.2泊松分布

泊松分布刻画了稀有李件在一段时间内发生次数这一随机变盘的分布,如电话交换台单位时间内接到的呼唤次数.某公

共汽车站在单位时间内来站乘车的乘客数,宇宙中单位体积内星球的个数.耕地上单位面积内杂草的数目等。

设随机变量x所有可能取得值为0,1,2,-..,而取各个值的

概率为P{X=月二

兄ke_x

k!

k=0,1,2,---,其中A. >0是常数,

则称X服从参数为兄的泊松分布,记为X一‘(刃。

泊松分布的重要性质是它的数学期望和方差都等于参数兄。

1 .3正态分布

设连续型随机变量x的概率密度为:

I(x) _ 1- e

一J27rs

(x一月产

2,5'

-00 < x < +00,其中PIC为

常数,口>0,则称溯及从参数为从口的正态分布或高斯分

布,记为X一N(u,a2)。

正态分布的概率密度中的两个参数产和a,分别就是该分

布的数学期望和方差。特别地,当,t=O,a2 =1时的正态分

布.称为标准正态分布,记为X一N(0,1),标准正态分布的

密度函数记为(Pkx) -了歹e2r‘,-0o < x <+00·

正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的。文献【1]指出,

如果一个随机指标受到许多微小的、独立的随机因素的影响,

而其中任何一个因素都不起决定性作用,则可认为该随机指标

[作者简介】于洋(1979-),男,大连人,东北财经大学讲师,硕士学位.研究方向:概率统计、数f经济学。

108

1

“不石e2}rnpg

(k-v)'

服从或近似服从正态分布,这正是正态分布在理论与实践上都

极其重要的原因。

1_(、一np l

一nP9 wl np-q)

2主要结果

2.1二项分布与泊松分布之间的关系

定理I(泊松定理)在n重伯努利试验中,

验中发生的概率为Pn,它与试验次数有关,

=.A>0,则对任意给定的m,有

P夏a‘戈‘b}

(2)

事件A在每次试

如果辣nPn

_。l。一,_

一厂飞np(1-p)“

戈一nP

Jnp,一,)

_。一np}

“np(1-p) j

llmC"P- (1一。)一羊。一,、一。,1,2...

”冲。一K二

__{b-np)_{。一,)

‘’{nP(I-P){一’{np(I-p){

泊松定理的证明见文献【1]。由该定理可知,当二项分

布b (n, p)的参数n很大,P很小,而兄二np大小适中时,

实际中n'a100,pS0.1,np<_10时(见文献[21),二项

分布可用参数为兄=np的泊松分布来近似,即

C pk (1一PT‘二

ak

,.一一几

—匕

k!

只要查一查标准正态分布函数表4o容易得到尸{。‘X-

的相当精确的值。原则上(1)式和(2)式适用于任何给定的p和

充分大的n。不过,当p较大或较小时近似效果较差,应用

时p最好满足O.15P50.9(参见文献[21). At外,文献[3]

还指出,由于我们是用一个连续分布来近似离散分布,在实际应用中.为了减少近似误差.常用

这就是二项分布的泊松逼近。当然n应尽可能地大,否则近似效果往往不佳。

二项分布的泊松近似常常被应用于研究稀有事件(即每次试验中事件出现的概率p很小)’,当伯努利试验的次数n很大时,事件发生的频数的分布。实际表明,在一般情况下,当

p<0.1时,这种近似是很好的,甚至n不必很大都可以,这

点从比较二项分布与泊松分布的概率分布表也可以看出。例如,当p = 0.01时,甚至”=2时,这种近似程度已经很好了。表1说明了这一情况,其中np = 0.02。

衰,二项分布与泊松分布的比较

P{a‘戈‘小。

来代替(2)式。

(b+0.5一,、‘厂。一0.5一,、

{nP(l_p){一(np(l_p){

2.3泊松分布与正态分布之间的关系

由定理1和定理2可知二项分布既可以用泊松分布近似,也可以用正态分布近似。显然,泊松分布和正态分布在一定条件下也具有近似关系,下面的定理说明泊松分布的正态通近。

定理3对任意的a

,jk_一4,

飞,几‘1 r0

乙-石-=了万Ja“

a

2去,其中

浊a=

┌─┬─────────┬───────┐

│k │C.I Pk (1一P )"-k │(,)‘e一”Ik!│

├─┼─────────┼───────┤

│0 │0. 9801 │0. 9802 │

│1 │0. 0198 │0. 0196 │

│2 │0. 0001 │0. 0002 │

└─┴─────────┴───────┘

“一几

万不,”-

18一兄

。定理3的证明见文献[1〕。

2.2二项分布和正态分布之间的关系

定理2设随机变里X。一b (n, pX0

则对于任意x,有

lim{ Xn -npn-am np(1-p)·丹·Jr瓮-Zdt00 2;r一、

定理2就是概率论中著名的棣莫弗一拉普拉斯中心极限定理,它的证明见文献【27。该定理表明,当n充分大时,二项分布可用正态分布来近似,即二项分布的正态逼近。例如,

P {Xn·、卜心,‘(1一,)n_‘和P毛a、Xn、b}-

E CRpkqn-kx#。充分大时计算是十分困难的。根据定理:,nsk

由于

戈一nP

InP(1-P)

近似服从N(0,1)或等价地Xn近似服从

以np,np(1-P)),于是可以近似地用正态分布来计算上述概

率,即P毛Xn=*}=心,‘(1一,)”一‘

如前文所述,二项分布的泊松近似和正态近似各自适用的条件是不同的。当P很小时,即使n不是很大,用泊松分布近似二项分布,已经相当吻合。但是在这种倩形下,用正态分布去近似二项分布,却会产生较大的误差。直观上也可以想象得到,p很小,n又不大,则np =几一定不会很大。由定理3

可知,正态分布就不能很好地近似泊松分布,因而也就不能近似被泊松分布十分逼近的二项分布。

在”充分大,P既不接近于0也不接近于1时(实际上最好满足0.1 S p S 0.9),用正态分布去近似二项分布,效果就

较好。

表2是用泊松分布与正态分布去近似二项分布b (n, p)

的比较,其中,二2500,p一0.02,np二50,了而万=

了49=7。可见,在数值上三者是大致相等的。

由定理3易知,泊松分布X一二(刃当A-+树的极限分

布是正态分布N(A, a.)。

为了进一步讨论泊松分布和正态分布的分布函数之间的近似关系,需要用到随机变量的特征函数的相关知识,首先给出特征函数的定义:

109

1

“不石e2}rnpg

(k-v)'

服从或近似服从正态分布,这正是正态分布在理论与实践上都极其重要的原因。

1_(、一np l

一nP9 wl np-q)

2主要结果

2.1二项分布与泊松分布之间的关系

定理I(泊松定理)在n重伯努利试验中,

验中发生的概率为Pn,它与试验次数有关,

=.A>0,则对任意给定的m,有

P夏a‘戈‘b}

(2)

事件A在每次试

如果辣nPn

_。l。一,_

一厂飞np(1-p)“

戈一nP

Jnp,一,)

_。一np}

“np(1-p) j

llmC"P- (1一。)一羊。一,、一。,1,2...

”冲。一K二

__{b-np)_{。一,)

‘’{nP(I-P){一’{np(I-p){

泊松定理的证明见文献【1]。由该定理可知,当二项分

布b (n, p)的参数n很大,P很小,而兄二np大小适中时,

实际中n'a100,pS0.1,np<_10时(见文献[21),二项

分布可用参数为兄=np的泊松分布来近似,即

C pk (1一PT‘二

ak

,.一一几

—匕

k!

只要查一查标准正态分布函数表4o容易得到尸{。‘X-

时p最好满足O.15P50.9(参见文献[21). At外,文献[3]

还指出,由于我们是用一个连续分布来近似离散分布,在实际应用中.为了减少近似误差.常用

这就是二项分布的泊松逼近。当然n应尽可能地大,否则近似效果往往不佳。

二项分布的泊松近似常常被应用于研究稀有事件(即每次试验中事件出现的概率p很小)’,当伯努利试验的次数n很大时,事件发生的频数的分布。实际表明,在一般情况下,当

p<0.1时,这种近似是很好的,甚至n不必很大都可以,这

点从比较二项分布与泊松分布的概率分布表也可以看出。例如,当p = 0.01时,甚至”=2时,这种近似程度已经很好了。表1说明了这一情况,其中np = 0.02。

衰,二项分布与泊松分布的比较

P{a‘戈‘小。

来代替(2)式。

(b+0.5一,、‘厂。一0.5一,、

{nP(l_p){一(np(l_p){

2.3泊松分布与正态分布之间的关系

由定理1和定理2可知二项分布既可以用泊松分布近似,

也可以用正态分布近似。显然,泊松分布和正态分布在一定条件下也具有近似关系,下面的定理说明泊松分布的正态通近。

定理3对任意的a

,jk_一4,

飞,几‘1 r0

乙-石-=了万Ja“

a

2去,其中

浊a=

┌─┬─────────┬───────┐

│k │C.I Pk (1一P )"-k │(,)‘e一”Ik!│

├─┼─────────┼───────┤

│0 │0. 9801 │0. 9802 │

│1 │0. 0198 │0. 0196 │

│2 │0. 0001 │0. 0002 │

└─┴─────────┴───────┘

“一几

万不,”-

18一兄

。定理3的证明见文献[1〕。

2.2二项分布和正态分布之间的关系

定理2设随机变里X。一b (n, pX0

则对于任意x,有

lim{ Xn -npn-am np(1-p)·丹·Jr瓮-Zdt00 2;r一、

定理2就是概率论中著名的棣莫弗一拉普拉斯中心极限定理,它的证明见文献【27。该定理表明,当n充分大时,二项分布可用正态分布来近似,即二项分布的正态逼近。例如,

P {Xn·、卜心,‘(1一,)n_‘和P毛a、Xn、b}-

E CRpkqn-kx#。充分大时计算是十分困难的。根据定理:,nsk

由于

戈一nP

InP(1-P)

近似服从N(0,1)或等价地Xn近似服从

以np,np(1-P)),于是可以近似地用正态分布来计算上述概

率,即P毛Xn=*}=心,‘(1一,)”一‘

如前文所述,二项分布的泊松近似和正态近似各自适用的条件是不同的。当P很小时,即使n不是很大,用泊松分布近似二项分布,已经相当吻合。但是在这种倩形下,用正态分布去近似二项分布,却会产生较大的误差。直观上也可以想象得到,p很小,n又不大,则np =几一定不会很大。由定理3

可知,正态分布就不能很好地近似泊松分布,因而也就不能近

似被泊松分布十分逼近的二项分布。

在”充分大,P既不接近于0也不接近于1时(实际上最好满足0.1 S p S 0.9),用正态分布去近似二项分布,效果就

较好。

表2是用泊松分布与正态分布去近似二项分布b (n, p)

的比较,其中,二2500,p一0.02,np二50,了而万=

了49=7。可见,在数值上三者是大致相等的。

由定理3易知,泊松分布X一二(刃当A-+树的极限分

布是正态分布N(A, a.)。

为了进一步讨论泊松分布和正态分布的分布函数之间的近似关系,需要用到随机变量的特征函数的相关知识,首先给出特征函数的定义:

109

相关文档
  • 二项分布与泊松分布

  • 正态分布与二项分布

  • 二项分布和正态分布

  • 泊松分布和二项分布

  • 二项分布和泊松分布参

相关推荐: