文档库 最新最全的文档下载
当前位置:文档库 › 二项分布方差公式推导

二项分布方差公式推导

二项分布方差公式推导
二项分布方差公式推导

二项分布方差公式推导

若ξ~B(n,p),q=1-p ,求证D ξ=npq

∵E ξ=np , kC n k p k q n-k =n p 11

k n C --p k-1q n-k , kk C n k p k q n-k =np[(k-1)11

k n C --p k-1q n-k +11k n C --p k-1q n-k ] =np[(n -1)p 22k

n C --p k-2q n-k +11k n C --p k-1q n-k

] 而D ξ=22()E E ξξ-,

∴D ξ=(1×1×C n 1p 1q n-1+2×2 C n 2p 2q n-2+…+k ×k C n k p k q

n-k +…+n ×n C n n p n q 0)2()

np - =np(1×C n-10p 0q n-1+2C n-11p 1q n-2+3C n-12p 2q n-2+…+

k C n-1k-1p k-1q n-k

+…+n C n-1n-1p n-1q 0)-2np E ξ+n 2p 2(p +q)n

=np{[0×C n-10p 0q n-1+1C n-11p 1q n-2+2C n-12p 2q n-2+…+

(k-1) C n-1k-1p k-1q n-k +…+(n-1)C n-1n-1p n-1q 0]+(C n-10p 0q n-1+

C n-11p 1q n-2+C n-12p 2q n-2+…+C n-1k-1p k-1q n-k +…+

C n-1n-1p n-1q 0)}2()np -

=np[E η+(p +q)n-1] 2()

np - =np[(n -1)p +1] 2()

np -

=np(1-p)

=npq .

泊松分布的概念及表和查表方法

目录 1命名原因 2分布特点 3关系 4应用场景 5应用示例 6推导 7形式与性质 命名原因 泊松分布实例

泊松分布(Poisson distribution),台译卜瓦松分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一种统计与概率学里常见到的离散机率分布(discrete probability distribution)。泊松分布是以18~19 世纪的法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)命名的,他在1838年时发表。这个分布在更早些时候由贝努里家族的一个人描述过。 分布特点 泊松分布的概率函数为: 泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。 泊松分布的期望和方差均为特征函数为 关系 泊松分布与二项分布 泊松分布 当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧20,p≦时,就可以用泊松公式近似得计算。 事实上,泊松分布正是由二项分布推导而来的,具体推导过程参见本词条相关部分。 应用场景 在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布P(λ)。因此,泊松分布在管理科学、运筹学以及自然科学的某些问题中都占有重要的地位(在早期学界认为人类行为是服从泊松分布,2005年在nature上发表的文章揭示了人类行为具有高度非均匀性)。 应用示例

二项分布、数学期望与方差专题复习word有详解重点中学用

第十讲二项分布及应用随机变量的均值与方差 知识要点 1.事件的相互独立性(概率的乘法公式) 设A、B为两个事件,如果P(AB)=P(A)P(B),则称事件A与事件B相互独立. 2. 互斥事件概率的加法公式:如果事件A与事件B互斥,则P(A+B)=P(A)+P(B). 3.对立事件的概率:若事件A与事件B互为对立事件,则P(A)=1-P(B). 4.条件概率的加法公式:若B、C是两个互斥事件,则P(B∪C|A)=P(B|A)+P(C|A) 5.独立重复试验:在相同条件下重复做的n次试验称为n次独立重复试验,即若用A i(i=1,2,…,n)表示第i次试验结果,则P(A1A2A3…A n)=P(A1)P(A2)P(A3)…P(A n). 注:判断某事件发生是否是独立重复试验,关键有两点 (1)在同样的条件下重复,相互独立进行;(2)试验结果要么发生,要么不发生. 6.二项分布:在n次独立重复试验中,设事件A发生的次数为X,在每次试验中事件A发生的概率为p,那么在n次独立重复试验中,事件A恰好发生k次的概率为P(X=k)=C k n p k·(1-p)n-k(k=0,1,2,…,n),此时称随机变量X服从二项分布,记作X~B(n,p),并称p为成功概率. 注:判断一个随机变量是否服从二项分布,要看两点 (1)是否为n次独立重复试验.(2)随机变量是否为在这n次独立重复试验中某事件发生的次数. 7.离散型随机变量的均值与方差及其性质 定义:若离散型随机变量X的分布列为P(ξ=x i)=p i,i=1,2,…,n. (1)均值:称E(X)=x1p1+x2p2+…+x i p i+…+x n p n为随机变量X的均值或数学期望. n (2)方差:D(X)=∑ (x i-E(X))2p i为随机变量X的方差,其算术平方根D?X?为随机变量X的标准差.i=1 (3)均值与方差的性质:(1)E(aX+b)=aE(X)+b;(2)D(aX+b)=a2D(X).(a,b为常数) 8.两点分布与二项分布的均值、方差 变量X服从两点分布:E(X)=p,D(X)=p(1-p);X~B(n,p): E(X)=np ,D(X)=np(1-p)典例精析 例1.【2015高考四川,理17】某市A,B两所中学的学生组队参加辩论赛,A中学推荐3名男生,2名女生,B中学推荐了3名男生,4名女生,两校推荐的学生一起参加集训,由于集训后队员的水平相当,从参加集训的男生中随机抽取3人,女生中随机抽取3人组成代表队 (1)求A中学至少有1名学生入选代表队的概率. (2)某场比赛前,从代表队的6名队员中随机抽取4人参赛,设X表示参赛的男生人数,求X得分布列和数学期望.

样本平均数的方差的推导

样本平均数的方差的推导: 假定从任意分布的总体中抽选出一个相互独立的样本 1,,n x x ,则有 22 (),i i x X E x X σσ== 即每一个样本单位都是与总体同分布的。 在此基础上, 证明样本平均数以总体平均数为期望值。 []121212()() 1 ()1 ()()()1 ()n n n x x x E x E n E x x x n E x E x E x n X X X X n +++==+++=+++=+++= 接着,再以此为基础,推导样本平均数的方差。 在此,需要注意方差的计算公式为: 22(())X E X E X σ=- 以下需要反复使用这一定义:

22 2 122 122 2122222 122222 122(())()1(())1 ()()()1()()()()()1()()()()()1x n n n n i j i j n i j i j E x E x x x x E X n E x x x nX n E x X x X x X n E x X x X x X x X x X n E x X E x X E x X E x X x X n σ≠≠=-++ +=-= +++-??=-+-++-? ???=-+-++-+--???? ??=-+-++-+--????=∑∑∑∑222n n n σσ?= 在证明中,一个关键的步骤是()()0i j i j E x X x X ≠--=∑,其原 因在于这一项事实上是i x 与j x 的协方差。由于任意两个样本都是相互独立的,因此其协方差均为0。 如果采用的是无放回的抽样,则样本间具有相关性,协方差小于0。此时样本均值的方差为221 X x N n n N σσ-= ? - 样本方差的期望: 证明了样本平均数的方差公式后,我们可以来分析一下样本方差的情况。 先构造一个统计量为2 1 () n i i x x S n =-'= ∑,我们来求它的期望。 根据方差的简捷计算公式:()2 2 2X X X n σ = -∑,可得

期望 方差公式的证明全集

期望与方差的相关公式的证明 -、数学期望的来由 早在17世纪,有一个赌徒向法国著名数学家帕斯卡挑战,给他出了一道题目,题目是这样的:甲乙两个人赌博,他们两人获胜的机率相等,比赛规则是先胜三局者为赢家,赢家可以获得100法郎的奖励。当比赛进行到第三局的时候,甲胜了两局,乙胜了一局,这时由于某些原因中止了比赛,那么如何分配这100法郎才比较公平? 用概率论的知识,不难得知,甲获胜的概率为1/2+(1/2)*(1/2)=3/4,或者分析乙获胜的概率为(1/2)*(1/2)=1/4。因此由此引出了甲的期望所得值为100*3/4=75法郎,乙的期望所得值为25法郎。 这个故事里出现了“期望”这个词,数学期望由此而来。 定义1 若离散型随机变量ξ可能取值为i a (i =1,2,3 ,…),其分布列为i p (i =1,2,3, …),则当i i i p a ∑ ∞ =1 <∞时, 则称ξ存在数学期望,并且数学期望为E ξ=∑∞ =1 i i i p a , 如果i i i p a ∑ ∞ =1 =∞,则数学期望不存在。 [] 1 定义2 期望:若离散型随机变量ξ,当ξ=x i 的概率为P (ξ=x i )=P i (i =1,2,…,n ,…),则称E ξ=∑x i p i 为ξ的数学期望,反映了ξ的平均值. 期望是算术平均值概念的推广,是概率意义下的平均.E ξ由ξ的分布列唯一确定. 二、数学期望的性质 (1)设C 是常数,则E(C )=C 。 (2)若k 是常数,则E (kX )=kE (X )。 (3))E(X )E(X )X E(X 2121+=+。 三、 方差的定义 前面我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量一个重要的数字特征。但是在一些场合下,仅仅知道随机变量取值的

概率论与数理统计课程报告:泊松分布及其在实际中的应用

泊松分布及其在实际中的应用 摘要:本文从泊松分布的定义和基本性质出发,举例讨论了泊松分布在实际中的重要应用。 关键字:泊松分布;应用;运筹学;分子生物学;核衰变 泊松分布是法国数学家泊松于1837年引入的,是概率论中的几大重要分布之一。作为一种常见的离散型随机变量的分布,其在实际中有着非常广泛的应用。 1泊松分布的定义及基本知识 1.1定义: (1)若随机变量X 的分布列为 ), ?=>= =-,2,1,0(0,! )(k k e k X P k λλλ 则称X 服从参数为λ的泊松分布,并用记号X~P(λ)表示。 (2)泊松流: 随机质点流:随机现象中源源不断出现的随机质点构成的序列。 若质点流具有平稳性、无后效性、普通性, 则称该质点流为泊松事件流(泊松流)。 例如某电话交换台收到的电话呼叫数; 到某机场降落的飞机数; 一个售货员接待的顾客数等这些事件都可以看作泊松流。 1.2有关泊松分布的一些性质 (1)满足分布列的两个性质:P(X=k)≥0(k=0,1,2,…), 且有 1! ! )(0 =?====-∞ =-∞=∞ =-∑∑∑ λλλ λ λλe e k e k e k X P k k k o k k . (2)若随机变量X 服从参数为λ的泊松分布,则X 的期望和方差分别为:E (X)=λ; D(X)=λ. (3)以n ,p 为参数的二项分布,当n →∞,p →0时,使得np=λ保持为正常数,则 λλ--→ -e k p p C k k n k k n ! ) 1(对于k=0,1,2,…一致成立。 由如上定理的条件λ=np 知,当n 很大时,p 很小时,有下面的近似公式 λλ--→ -=e k p p C k P k k n k k n n ! ) 1()( 2泊松分布的应用 对于试验成功概率很小而试验次数很多的随机过程, 都可以很自然的应用于泊松分布的理论。在泊松分布中的概率表达式只含一个参数λ,减少了对参数的确定与修改工作量, 模型构建比较简单, 具有很重要的实际意义。 以下具体举例说明泊松分布在实际中的重要应用。 (1)泊松分布在经济生活中的应用: 泊松分布是经济生活中的一种非常重要的分布形式,尤其是经常被运用在运筹学研究中的一个分布模型。如物料订单的规划,道路交通信号灯的设计,生产计划的安排,海港发

t检验计算公式

t 检验计算公式: 当总体呈正态分布,如果总体标准差未知,而且样本容量n <30,那么这时一切可能的样本平均数与总体平均数的离差统计量呈t 分布。 t 检验是用t 分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。t 检验分为单总体t 检验和双总体t 检验。 1.单总体t 检验 单总体t 检验是检验一个样本平均数与一已知的总体平均数的差异是否显 著。当总体分布是正态分布,如总体标准差σ未知且样本容量n <30,那么样本平均数与总体平均数的离差统计量呈t 分布。检验统计量为: X t μ σ-=。 如果样本是属于大样本(n >30)也可写成: X t μ σ-=。 在这里,t 为样本平均数与总体平均数的离差统计量; X 为样本平均数; μ为总体平均数; X σ为样本标准差; n 为样本容量。 例:某校二年级学生期中英语考试成绩,其平均分数为73分,标准差为17分,期末考试后,随机抽取20人的英语成绩,其平均分数为79.2分。问二年级学生的英语成绩是否有显著性进步? 检验步骤如下: 第一步 建立原假设0H ∶μ=73 第二步 计算t 值 79.273 1.63X t μ σ--=== 第三步 判断 因为,以0.05为显著性水平,119df n =-=,查t 值表,临界值0.05(19) 2.093t =,而样本离差的t =1.63小与临界值2.093。所以,接受原假设,即进步不显著。

2.双总体t 检验 双总体t 检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t 检验又分为两种情况,一是相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。二是独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性。 现以相关检验为例,说明检验方法。因为独立样本平均数差异的显著性检验完全类似,只不过0r =。 相关样本的t 检验公式为: t = 在这里,1X ,2X 分别为两样本平均数; 12X σ,2 2X σ分别为两样本方差; γ为相关样本的相关系数。 例:在小学三年级学生中随机抽取10名学生,在学期初和学期末分别进行了两次推理能力测验,成绩分别为79.5和72分,标准差分别为9.124,9.940。问两次测验成绩是否有显著地差异? 检验步骤为: 第一步 建立原假设0H ∶1μ=2μ 第二步 计算t 值 t = =3.459。 第三步 判断 根据自由度19df n =-=,查t 值表0.05(9) 2.262t =,0.01(9) 3.250t =。由于实际计算出来的t =3.495>3.250=0.01(9)t ,则0.01P <,故拒绝原假设。 结论为:两次测验成绩有及其显著地差异。 检验。

二项分布概念及图表和查表方法

二项分布概念及图表 二项分布就是重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。 目录 1 定义 ?统计学定义 ?医学定义 2 概念 3 性质 4 图形特点 5 应用条件 6 应用实例 定义 统计学定义 在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为伯努利试验。实际上,当 时,二项分布就是伯努利分布,二项分布是显著性差异的二项试验的基础。

医学定义 在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。 考虑只有两种可能结果的随机试验,当成功的概率()是恒定的,且各次试验相互独立,这种试验在统计学上称为伯努利试验(Bernoulli trial)。如果进行次伯努利试验,取得成功次数为的概率可用下面的二项分布概率公式来描述:P=C(X,n)*π^X*(1-π)^(n-X) 二项分布公式 二项分布公式 P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k),其中C(n, k) =n!/(k!(n-k)!),注意:第二个等号后面的括号里的是上标,表示的是方幂。

正确理解 泊松分布 通俗解释

很多人在上概率论这门课的时候就没搞明白过泊松分布到底是怎么回事,至少我就是如此。如果我们学习的意义是为了通过考试,那么我们大可停留在“只会做题”的阶段,因为试卷上不会出现“请发表一下你对泊松公式的看法”这样的题目,因为那样一来卷子就变得不容易批改,大部分考试都会出一些客观题,比如到底是泊松分布还是肉松分布。而如果我们学习的目的是为了理解一样东西,那么我们就有必要停下来去思考一下诸如“为什么要有泊松分布?”、“泊松分布的物理意义是什么?”这样的“哲学”问题。 如果我们要向一个石器时代的人解释什么是电话,我们一定会说:“电话是一种机器,两个距离很远的人可以通过它进行交谈”,而不会说:“电话在1876 年由贝尔发明,一台电话由几个部分构成……”(泊松分布在1876 年由泊松提出,泊松分布的公式是……)所以我们问的第一个问题应该是“泊松分布能拿来干嘛?” 泊松分布最常见的一个应用就是,它作为了排队论的一个输入。比如在一段时间t(比如 1 个小时)内来到食堂就餐的学生数量肯定不会是一个常数(比如一直是200 人),而应该符合某种随机规律:假如在 1 个小时内来200 个学生的概率是10%,来180 个学生的概率是20%……一般认为,这种随机规律服从的就是泊松分布。 这当然只是形象化的理解什么是泊松分布,若要公式化定义,那就是:若随机变量X 只取非负整数值0,1,2,..., 且其概率分布服 从则随机变量X 的分布称为泊松分布,记作P(λ)。这个分布是S.-D.泊松研究二项分布的渐近公式时提出来的。泊松分布P (λ)中只有一个参数λ ,它既是泊松分布的均值,也是泊松分布的方差。生活中,当一个随机事件,例如来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从

二项分布概念及图表和查表方法

目录 1 定义 ?统计学定义 ?医学定义 2 概念 3 性质 4 图形特点 5 应用条件 6 应用实例 定义 统计学定义 在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为p。这样的单次成功/失败试验又称为伯努利试验。实际上,当 时,二项分布就是伯努利分布,二项分布是显著性差异的二项试验的基础。 医学定义 在医学领域中,有一些随机事件是只具有两种互斥结果的离散型随机事件,称为二项分类变量(dichotomous variable),如对病人治疗结果的有效与无效,某种化验结果的阳性与阴性,接触某传染源的感染与未感染等。二项分布(binomial distribution)就是对这类只具有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。

考虑只有两种可能结果的随机试验,当成功的概率()是恒定的,且各次试验相互独立,这种试验在统计学上称为伯努利试验(Bernoulli trial)。如果进行次伯努利试验,取得成功次数为的概率可用下面的二项分布概率公式来描述:P=C(X,n)*π^X*(1-π)^(n-X) 二项分布公式 表示随机试验的结果。 二项分布公式 如果事件发生的概率是P,则不发生的概率q=1-p,N次独立重复试验中发生K次的概率是P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k),其中C(n, k) =n!/(k!(n-k)!),注意:第二个等号后面的括号里的是上标,表示的是方幂。 那么就说这个属于二项分布。其中P称为成功概率。记作ξ~B(n,p) 期望:Eξ=np; 方差:Dξ=npq; 其中q=1-p 证明:由二项式分布的定义知,随机变量X是n重伯努利实验中事件A发生的次数,且在每次试验中A发生的概率为p。因此,可以将二项式分布分解成n个相互独立且以p为参数的(0-1)分布随机变量之和。 设随机变量X(k)(k=1,2,3...n)服从(0-1)分布,则X=X(1)+X(2)+X(3)....X(n). 因X(k)相互独立,所以期望:

数学分布(泊松分布、二项分布、正态分布、均匀分布、指数分布) 生存分析 贝叶斯概率公式 全概率公式讲解

数学期望:随机变量最基本的数学特征之一。它反映随机变量平均取值的大小。又称期望或均值。它是简单算术平均的一种推广。例如某城市有10万个家庭,没有孩子的家庭有1000个,有一个孩子的家庭有9万个,有两个孩子的家庭有6000个,有3个孩子的家庭有3000个,则此城市中任一个家庭中孩子的数目是一个随机变量,记为X,它可取值0,1,2,3,其中取0的概率为0.01,取1的概率为0.9,取2的概率为0.06,取3的概率为0.03,它的数学期望为0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一个家庭平均有小孩1.11个,用数学式子表示为:E(X)=1.11。 也就是说,我们用数学的方法分析了这个概率性的问题,对于每一个家庭,最有可能它家的孩子为1.11个。 可以简单的理解为求一个概率性事件的平均状况。 各种数学分布的方差是: 1、一个完全符合分布的样本 2、这个样本的方差 概率密度的概念是:某种事物发生的概率占总概率(1)的比例,越大就说明密度越大。比如某地某次考试的成绩近似服从均值为80的正态分布,即平均分是80分,由正态分布的图形知x=80时的函数值最大,即随机变量在80附近取值最密集,也即考试成绩在80分左右的人最多。 下图为概率密度函数图(F(x)应为f(x),表示概率密度):

离散型分布:二项分布、泊松分布 连续型分布:指数分布、正态分布、X 2分布、t 分布、F 分布 抽样分布只与自由度,即样本含量(抽样样本含量)有关 二项分布(binomial distribution ):例子抛硬币 1、 重复试验(n 个相同试验,每次试验两种结果,每种结果概率恒定————伯努利试验) 2、 抽样分布

样本方差的抽样分布

样本方差的抽样分布 样本方差 先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数,就叫做样本方差。 在许多实际情况下,人口的真实差异事先是不知道的,必须以某种方式计算。当处理非常大的人口时,不可能对人口中的每个物体进行计数,因此必须对人口样本进行计算。样本方差也可以应用于从该分布的样本的连续分布的方差的估计。[ 从一个样本取n个值y1,...,y n,其中n

估计值可以简单地称为样本方差。同样的证明也适用于从连续概率分布中抽取的样本。 样本方差分布 作为随机变量的函数,样本方差本身就是一个随机变量,研究其分布是很自然的。在yi是来自正态分布的独立观察的情况下,s2服从卡方分布: 所以可求;和 如果y i独立同分布,但不一定是正态分布,那么 如果大数定律的条件对于平方观测值同样适用,则s2是σ2的一致估计量。 抽样分布 抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。样本估计量是样本的一个函数,在统计学中称作统计量,因此抽样分布也是指统计量的分布。以样本平均数为例,它是总体平均数的一个估计量,如果按照相同的样本容量,相同的抽样方式,反复地抽取样本,每次可以计算一个平均数,所有可能

样本的平均数所形成的分布,就是样本平均数的抽样分布。 抽样分布定理 (1)从总体中随机抽取容量为n的一切可能个样本的平均数之平均数,等于总体的平均数,即(E为平均的符号,为样本的平均数,μ为总体的平均数)。 (2)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。 (3)虽然总体不是正态分布,如果样本容量较大,反映总体μ和σ的样本平均数的抽样分布,也接近于正态分布。 样本方差的抽样分布 样本方差的抽样分布是指在重复选取容量为n的样本时,样本方差的所有可能取值形成的概率分布。 χ2分布具有如下性质和特点: (1)χ2分布的变量值始终为正。 (2)χ2(n)分布的形状取决与其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称,如图7-2所示。 (3)χ2分布的期望为E(χ2)=n,方差为D(χ2)=2n(n为自由度)。 (4)χ2分布具有可加性。若U和V为两个独立的χ2分布随机变量,U~χ2(n1),V~χ2(n2),则随机变量U+V服从自由度为n1+n2的χ2分布。

泊松分布的概念及表和查表方法

泊松分布的概念及表和查表方法 Poisson分布,是一种统计与概率学里常见到的离散概率分布,由法国数学家西莫恩·德 目录 1命名原因 2分布特点 3关系 4应用场景 5应用示例 6推导 7形式与性质

命名原因 泊松分布实例 泊松分布(Poisson distribution),台译卜瓦松分布(法语:loi de Poisson,英语:Poisson distribution,译名有泊松分布、普阿松分布、卜瓦松分布、布瓦松分布、布阿松分布、波以松分布、卜氏分配等),是一种统计与概率学里常见到的离散机率分布(discrete probability distribution)。泊松分布是以18~19 世纪的法国数学家西莫恩·德尼·泊松(Siméon-Denis Poisson)命名的,他在1838年时发表。这个分布在更早些时候由贝努里家族的一个人描述过。 分布特点 泊松分布的概率函数为: 泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。 泊松分布的期望和方差均为特征函数为 关系 泊松分布与二项分布 泊松分布 当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似,其中λ为np。通常当n≧20,p≦0.05时,就可以用泊松公式近似得计算。 事实上,泊松分布正是由二项分布推导而来的,具体推导过程参见本词条相关部分。应用场景

在实际事例中,当一个随机事件,例如某电话交换台收到的呼叫、来到某公共汽车站的乘客、某放射性物质发射出的粒子、显微镜下某区域中的白血球等等,以固定的平均瞬时速率λ(或称密度)随机且独立地出现时,那么这个事件在单位时间(面积或体积)内出现的次数或个数就近似地服从泊松分布P(λ)。因此,泊松分布在管理科学、运筹学以及自然科学的某些问题中都占有重要的地位(在早期学界认为人类行为是服从泊松分布,2005年在nature上发表的文章揭示了人类行为具有高度非均匀性)。 应用示例 泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等。 观察事物平均发生m次的条件下,实际发生x次的概率P(x)可用下式表示: 例如采用0.05J/㎡紫外线照射大肠杆菌时,每个基因组(~4×106核苷酸对)平均产生3个嘧啶二体。实际上每个基因组二体的分布是服从泊松分布的,将取如下形式: …… 是未产生二体的菌的存在概率,实际上其值的5%与采用0.05J/㎡照射时的大肠杆菌uvrA-株,recA-株(除去既不能修复又不能重组修复的二重突变)的生存率是一致的。由于该菌株每个基因组有一个二体就是致死量,因此就意味着全部死亡的概率。 推导 泊松分布是最重要的离散分布之一,它多出现在当X表示在一定的时间或空间内出现的事件个数这种场合。在一定时间内某交通路口所发生的事故个数,是一个典型的例子。泊松分布的产生机制可以通过如下例子来解释。

样本方差与总体方差的区别

样本方差与总体方差的区别 之前一直对于样本方差与总体方差的概念区分不清,对于前者不仅多了样本”两个字,而且公式中除数是N-1 ,而不是N。现在写下这么写东西,以能彻底把他们的区别搞清楚。 总体方差: 也叫做有偏估计,其实就是我们从初高中就学到的那个标准定义的方差,除数是N。女0果实现已知期望值,比如测水的沸点,那么测量 立的(期望值不依测量值而改变,随你怎么折腾,温度计坏了也好,看反了也好,总之,期望值应该是100度),那么E『(X-期望)人2』,就有10个自由度。事实上,它等于(X- 期望)的方差,减去(X-期望)的平方。”所以叫做有偏估计,测量结果偏于那个”已知的期望值“。样本方差: 无偏估计、无偏方差(unbiased varianee )。对于一组随机变量,从中随机抽取N个样本, 这组样本的方差就是Xi^2平方和除以N-1。这可以推导出来的。如果现在往水里撒把盐, 水的沸点未知了,那我该怎么办?我只能以样本的平均值,来代替原先那个期望100度。同 样的过程,但原先的(X-期望),被(X-均值)所代替。设想一下(Xi-均值)的方差,它 不在等于Xi的方差,而是有一个协方差,因为均值中,有一项Xi/n是和Xi相关的,这就 是那个”偏"的由来 刊屮)二 Ei a.—-£(A;-W) f=l 9 =rr 一 证明: 10次,测量值和期望值之间是独

DGH 兀) 担工加D (X ;)) g ? u 曰右力m-工P) 占E (m :-寸) __________ ■!■ A^(E :=iCV —2A ;T + X-)) 闵肯) ) + £:D) n(<7- + //-) E(X 力二丫) nE(X~) MD(X) + E2(X)) M 吟+ “?) 尙e + //-) - 角F + "') t7- 证毕?? D(X)二 --- ◎ E(f)= D(X) + Eh 工) E{S-)= £(E ; =1 A ;y )=

二项分布期望和方差的推导过程

二项分布期望和方差推导 若随机变量),(~p n B X ,则np X E =)(,)1()(p np X D -= 二项分布数学期望的证明: 注意到11--=k n k n nC kC (证明:11)]! 1()1[()!1()!1()!()!1()!1()!(!!--=---?--?=-?--?=-??=k n k n nC k n k n n k n k n n k n k n k kC ) 所以n n p p C X E )1(0)(00-?=111)1(1--?+n n p p C Λ+-?+-222) 1(2n n p p C Λ+-?+-k n k k n p p C k )1( 111)1()1(p p C n n n n -?-+--0)1(p p C n n n n -?+ 1101)1(---?=n n p p C n Λ+-?+--2211)1(n n p p C n Λ+-+---k n k k n p p nC ) 1(11 1121)1(p p C n n n n -?+---011 )1(p p C n n n n -?+-- 101)1([---=n n p C np Λ+-+--2111)1(n n p p C Λ+-+----k n k k n p p C )1(1111221)1(p p C n n n -+---])1(0111p p C n n n -+--- np p p np n =+-=-1])1[(,故np p p C i X E n i i n i i n ∑=-=-?=0)1()(; 二项分布方差的证明:)1()(p np X D -= 证明:i n i i p X E x X D ?-= ∑-12)]([)(i n i i i p X E X E x x ∑-?+-=122)]()(2[∑-??+?-?=n i i i i i i p X E p X E x p x 122])()(2[ ∑∑∑-=-?+?-?=n i n i i n i i i i i p X E p X E x p x 11 212 )()(2)()(22X E X E -= 故任何离散随机变量的方差均满足式子:)()()(22X E X E X D -= 当随机变量),(~p n B X 时,=)(X D 20 2)()1(np p p C i i n i n i i n --?-=∑ i n i n i i n p p C i i -=-?-=∑)1()1(0 220)1(p n p p C i i n i n i i n --?+-=∑(注意np p p C i X E n i i n i i n ∑=-=-?=0)1()() i n i n i i n p p iC i -=-?-=∑)1()1(222p n np -+i n i n i i n p p nC i -=---?-=∑)1()1(21122p n np -+ i n i n i i n p p C i n -=---?-?=∑)1()1(21122p n np -+i n i n i i n p p C n n --=---?-?=∑)1()1(22 2222p n np -+ i n i n i i n p p C n n -=---?-=∑)1()1(22222p n np -+i n i n i i n p p C p n n --=---?-=∑)1()1(22 22222p n np -+ (指数之后凑组合数下标2-n ,利用展开式i i n n i i n n b a C b a ---=--∑=+22022) () i n i n i i n p p C p n n ---=--?-=∑22 022 )1()1(22p n np -+

泊松过程与泊松分布的基本知识

泊松过程与泊松分布的基本知识泊松过程是随机过程的一个经典模型,是一种累积随机事件的发生次数的独立增量过程。也就是说,每次事件的发生是相互独立的。那么泊松分布和泊松过程又什么关系呢?可以说泊松分布是描述稀有事件的统计规律,即可以描述一段时间内发生某个次数的概率。而泊松过程呢,就适合刻画“稀有事件流”的概率特性。 比较:泊松分布 泊松过程的主要公式: 其实没多少不一样对不对?不一样的是泊松过程是一个可以查看在时间t内发生次数的概率,这个t是可变的。泊松分布则是给定了时间。 泊松过程的关键在于,它的到达间隔序列Tn,即每两次发生的时间是服从的独立同指数分布的。如果每次发生的间隔时间不服从指数分布,那么这个随机过程就会更一般化,我们成为是更新过程,这也是随机过程的推广。 泊松过程分为齐次泊松过程和非齐次泊松过程,齐次的意思很简单,就是说过程并不依赖于初始时刻,强度函数是一个常数,从上面的公式也看得出来。而非齐次则是变成了,这意味着什么呢?这以为着随着与时间的改变,强度是会改变的,改变服从强度函数,说了这

么久,强度究竟是个什么概念?强度的意思就是泊松过程的该事件发生的频率,或者说快慢,泊松分布中我们知道期望就是,实际含义就是,在一段时间内,发生的次数平均水平是次。 复合泊松过程:泊松过程我们已经知道,用描述一段时间累积发生的次数,但是如果每次发生带来的后果都是不一样的,我们怎么描述这个过程呢?比如,火车站到达的乘客是服从泊松过程的,但是每个乘客携带有不同重量的行李,我们如何刻画在[0,t]时间内行李总重量呢,这个过程就是复合泊松过程。复合泊松过程的均值函数和方差函数一般可以用全期望和全方差公式进行计算,因为简单泊松过程的期望很容易求。 更新过程: 上文已经说到,更新过程作为泊松过程的推广,更具有一般性,那么在讨论更新过程时,我们更多地讨来更新函数,更新函数是更新过程的均值函数m(t)=E[N(t)],怎么理解呢,就是说需要用t时刻的累积计数的期望特性来表达更新过程。有一条定理: 这个定理是可以证明的,Fn(t)是分布函数,就是说:在t时刻,更新函数值就是在这个时刻,n取遍所有值的分布之和。 那么是否可以这样理解,更新过程和泊松过程的区别就是更新间隔序列不同,那么如果已知了更新间隔序列的概率密度函数,就可以求解该过程的更新函数了,详细的推导就不写了。扔结论出来:对间隔序列概率密度函数做拉氏变换得到Lf(s),然后求 Lm(s)=Lf(s)/s(1-Lf(s)),再对Lm(s)进行逆变换,就得到了m(t),这就是更新函数。

二项分布中方差的计算

二项分布中方差的计算 假设ξ~B (n ,p ), 即k n k k n q p C k P -==}{ξ 考虑E [ξ(ξ-1)]=Eξ2-Eξ 而 ∑∑ ∑∑=----=-=-=--=-----?-?=--=-=-n k k n k k n n k k n k n k k n k n k k n k k n q p C p n n q p k n k n n n q p k n k n k k q p C k k E 2 222222 )1()]!2(2[)!2()!2()1()! (!! ) 1()1()]1([ξξ 令2-=k i 上式=222220 22 2 )1()1(np p n p n n q p C p n n n i i n i i n -=-=-∑-=--- 即2222np p n E E -=-ξξ, 再将E ξ=np 代入上式,得)1(222222p np p n np np p n E -+=+-=ξ 最后得npq np p np p n E E D =--+=-=22222)()1()(ξξξ 例1的分布图 例2的分布图 4.2 超几何分布 例1的图形:

例2的图形: 定义4.2 设N 个元素分为两类, 有N 1个属于第一类, N 2个属于第二类(N 1+N 2=N ). 从中不重复抽样取n 个, 令ξ表示这n 个中第一类元素的个数, 则ξ的分布称为超几何分布, ),....,1,0()(2 1n m C C C m P n N m n N m N == =-ξ 规定: 如n

3二项分布、泊松分布与泊松逼近

二项分布、泊松分布与泊松逼近 雅各布·伯努利与二项分布公式 雅各布·伯努利(Jacob Bernoulli,1654—1705)来自数学史上的传奇家族—瑞士巴塞尔的伯努利家族,该家族的三代成员中产生了8位数学家,在17世纪和18世纪微积分理论及应用的发展中占有领先地位,雅各布·伯努利是其家族第一代数学家中的第一位,他与弟弟约翰·伯努利(Johann Bernoulli,1667—1748)、侄子丹尼尔·伯努利(Daniel Bernoulli,1700—1782)在数学史上享有声誉。 家族简介 在科学史上,父子科学家、兄弟科学家并不鲜见,然而,在一个家族跨世纪的几代人中,众多父子兄弟都是科学家的较为罕见,其中,瑞士的伯努利(也译作贝努力、伯努利)家族最为突出。 伯努利家族3代人中产生了8位科学家,出类拔萃的至少有3位;而在他们一代又一 代的众多子孙中,至少有一半相继成为杰出人物。伯努利家族的后裔有不少于120位被人们系统地追溯过,他们在数学、科学、技术、工程乃至法律、管理、文学、艺术等方面享有名望,有的甚至声名显赫。最不可思议的是这个家族中有两代人,他们中的大多数数学家,并非有意选择数学为职业,然而却忘情地沉溺于数学之中,有人调侃他们就像酒鬼碰到了烈酒。 老尼古拉·伯努利(Nicolaus Bernoulli,公元1623~1708年)生于巴塞尔,受过良好教育,曾在当地政府和司法部门任高级职务。他有3个有成就的儿子。其中长子雅各布(Jocob,公元1654~1705年)和第三个儿子约翰(Johann,公元1667~1748年)成为著名的数学家,第二个儿子小尼古拉(Nicolaus I,公元1662~1716年)在成为彼得堡科学院数学界的一员之前,是伯尔尼的第一个法律学教授。 雅各布·伯努利

第三章附录:相关系数r 的计算公式的推导

相关系数r AB 的计算公式的推导 设A i 、B i 分别表示证券A 、证券B 历史上各年获得的收益率;A 、B 分别表示证券A 、证券B 各年获得的收益率的平均数;P i 表示证券A 和证券B 构成的投资组合各年获得的收益率,其他符号的含义同上。 2 A σ=11-n 2 )(∑-A A i 2B σ=11-n )(B B i -∑2 2P σ= 11-n 2 )1 (∑∑ - i i P n P =2 )](1 )[(11i B i A i B i A B A A A n B A A A n +- +-∑∑ =2 )]()[(11 B A A A B A A A n B A i B i A +-+-∑ =2 )]()([1 1 B B A A A A n i B i A -+--∑ = )])((2)()([1 1 2 222B B A A A A B B A A A A n i i B A i B i A --+-+--∑ =A 2A × 22 1 ) (B i A n A A +--∑× 1 )] )([(21 ) (2 ---+ --∑∑n B B A A A A n B B i i B A i =A 1 )])([(22222---? ++∑n B B A A A A A i i B A B B A A σ σ 对照公式(1)得: = 1 )(2 --∑ n A A i × 1 )(2 --∑ n B B i × r AB ∴ r AB = ∑∑∑-? ---2 2 ) ()()] )([(B B A A B B A A i i i i 这就是相关系数r AB 的计算公式。 投资组合风险分散化效应的内在特征 1.两种证券构成的投资组合为最小方差组合(即风险最小)时各证券投资比例的测定 公式(1)左右两端对A A 求一阶导数,并注意到A B =1—A A : (2 P σ)′=2 A A 2 A σ-2 (1-A A )2 B σ+2 (1-A A )B A σσ r AB -2A A B A σσ r AB 令 (2 P σ)′= 0 并简化,得到使2 P σ取极小值的A A : AB B A i i r n B B A A σσ=---∑1 )])([(

二项分布的数学期望和方差

4EX np ∴== 100.40.6 2.4DX npq ==??= 222() 2.4418.4EX DX EX =+=+= 12. 解:8n =,0.2p = 根据二项分布的数学期望和方差的公式 1.6EX np == (1) 1.28DX npq np p ==-= 求解得 8n =,0.2p = 13. 解: ~(1,)B p ξ 2(1)9D p p ξ∴=-= 解方程2209 p p -+=,得23p =或13p = ξ∴的概率函数为 {}1(1)(0,1)k k p k p p k ξ-==-= 将13p =或23 p =代入,得ξ的概率函数为 {}121()()33 k k p k ξ-== 或 {}112()()(0,1)33k k p k k ξ-=== 14. 解:设ξ的概率密度为 1,()0, a x b f x b a ?≤≤?=-???其他 =3E ξ,1=3D ξ ∴得方程组2+=32()1 =12 3a b b a ????-???,解得24a b =??=?

1,24()=20x f x ?≤≤?∴???其他 ξ为连续型随机变量 {}=2=0p ξ∴ {}3312111<<3=()==22 p f x dx dx ξ?? 15. 解:设ξ表示直到取到废品为止所要取的产品个数,则ξ的概率函数 {}-1 ==0.050.95(=1,2,)k p k k ξ???? 当{}-1 ==(1)(=1,2,)k p k p p k ξ-???时,由幂级数 -12=1 1= (1)n n nx x ∞-∑ 2-13 =11=(1)n n x n x x ∞+-∑ 可计算 -1=11=(1)=k k E kp p p ξ∞-∑ 2-122=1 1=(1)()= k k p D k p p E p ξξ∞---∑ 本题中=0.05p 1==200.05 E ξ∴, 210.05==19.490.05 D ξ- 16. 解:8 22[()]DX EX E x =- 222[()]428EX DX E x ∴=+=+= 17. 解:由题意X 的分布律为 {}=(0)!k p X k e k λλλ-=>

相关文档
相关文档 最新文档