文档库 最新最全的文档下载
当前位置:文档库 › 二项分布 通俗解释

二项分布 通俗解释

二项分布 通俗解释
二项分布 通俗解释

二项分布通俗解释

一个事件必然出现,就说它100%要出现。100%=1,所以100%出现的含义就是出现的概率P=1。即必然事件的出现概率为1。

如果掷一枚硬币,正面向上的结局的概率为0.5 。反面向上的结局的概率也是0.5 。那么出现正面向上事件或者反面向上事件的概率就是0.5+0.5=1 ,即二者必居其一。

如果掷两次硬币,根据独立事件的概率乘法定理那么两次都是正面(反面)向上的概率是0.5×0.5=0.25。另外第一个是正第二个是反的出现概率也是 0.5×0.5=0.25。同理第一个反第二个正的出现概率也是0.5×0.5=0.25。于是一正一反的概率是前面两个情况的和,即 0.25+0.25=2×0.25=0.5 。它们的合计值仍然是1。列成表就是:两个正面的概率一正一反的概率两个反面的概率

0.252×0.25=0.5 0.25

注意到代数学中 (a+b)^2=a^2+2ab+b^2, 而在a=0.5,b=0.5时,有 1^2=(0.5+0.5)^2=0.25+2×0.5×0.5+0.25=1。这说明掷两次硬币的各个结局的出现概率可以通过对二项式的平方展开而得到。

顺此,对于掷n次硬币的各种结局的出现概率也可以通过对二项式的n次方的展开而得到。例如n=3时,有(注意0.5×0.5×0.5=0.125)1^3=(0.5+0.5)^3=0.125+3×0.125+3×0.125+0.125 =

0.125+0.375+0.375+0.125 = 1。

3个正面的概率 2正1反的概率 1正2反的概率 3个反面的概率

0.125 0.375 0.375 0.125

二项式展开的牛顿公式表示为:

(a+b)^n=a^n + … + [n!/m!(n-m)!][a^(n-m)b^m]+ … + b^n (其中m=1,2,……n-1)。

即这种类型的问题(如掷多次硬币)的概率分布恰好可以用二项式展开的牛顿公式表示。而这也就是为什么把这种概率分布类型称为二项分布的原因。

如果a,b并不等于0.5,那么只要把A事件出现的概率以p代入,把B事件的出现概率以(1-p)代入,以上公式仍然正确,(a+b仍然=1)。所以对于仅有A,B两个结局的随机事件,如果A事件出现概率为p,B事件的出现概率为1-p,那么在n次随机实验中A事件出现n-m次、B事件出现m次的情况(对应一种复合事件)的出现概率P应当是(这里的P是大写的): P=[n!/m!(n-m)!][p^(n-m) (1-p)^m] (其中m=0,1,……,n)

注意到上面公式的对称性,它也可以写为 P=[n!/m!(n-m)!][p^m (1-p)^(n-m)]。它就是所谓二项分布概型的随机事件的出现概率公式,也是牛顿二项式展开在变量为对应概率值的情况下的通项。

二项分布 - 正文

概率论中最常用的一种离散型概率分布。若随机变量X 取整数值k 的概率为

式中n 是给定的正整数;是从n 个对象中任意选取k 个的组合数,则称X 的分布为二项分布,记作B (n ,p )。它的命名来源于b (k ;n ,p)恰好是【(1-p)+p 】n 的二项式展开的第k +1项。 从不合格品率为p 的产品中独立地抽出n 个(每次抽一个,抽出后又放回),其中恰有k 个不合格品的概率就是b (k ;n ,p);统计学由此建立检验产品质量的方案。类似的例子在生产实践和科学试验中是常见的。将这类问题模型化,假设每一次试验只有两个可能结果:A 以及它的对立事件A c ,出现A 的概率为P (A )=p ,出现A c 的概率则为 1-p 。这种只有两个可能结果的随机试验称为伯努利试验,将这种试验独立地重复进行n 次所组成的随机试验称为n 重伯努利试验,其中A 出现的次数X 是一个服从二项分布B (n ,p)的随机变量。

若随机变量服从二项分布B (n ,p),则它的数学期望为n p,方差为n p(1-p),特征函数为(1-p+pe it )n ,母函数为(1-p+p s )n

。当k 由0依次增大到n 时,b (k ;n ,p)先增大后减小,当k =【(n +1)p 】(记号【α】表示不超过实数α的最大整数)时,b (k ;n ,p)取最大值;若(n +1)p 是整数,则k 在(n +1)p-1及(n +1)p 处都使b (k ;n ,p)取最大值(见图

)。

如果X i服从B(n i,p),i=1,2,…n,而且X1,X2,…,X n独立,则服从。如果X n服从B(n,p),则对任何实数α

式中

这说明,若p固定,当n充分大时,B(n,p)近似于正态分布。这个渐近公式最早由A.棣莫弗就p =1/2的情形加以证明,而后由P.-S.拉普拉斯加以推广,常称为棣莫弗-拉普拉斯中心极限定理。S.-D.泊松又证

明了:若则

这说明,当p很小而n较大时,B(n,p)可以用泊松分布近似。

正是这两个定理揭示了概率论中最重要的正态分布和泊松分布的意义,对概率论的发展有着深远的影响。

此外,多重伯努利试验中在出现第r个A以前A不出现的试验次数的概率分布就是负二项分布,又称帕斯卡分布。特别当r=1时,就是几

何分布。如果每次试验的可能结果多于两个,则二项分布就推广为多项分布。

二项分布 - 应用条件

1.各观察单位只能具有相互对立的一种结果,如阳性或阴性,生存或死亡等,属于两分类资料。

2.已知发生某一结果(阳性)的概率为π,其对立结果的概率为1-π,实际工作中要求π是从大量观察中获得比较稳定的数值。

二项分布公式

3.n次试验在相同条件下进行,且各个观察单位的观察结果相互独立,即每个观察单位的观察结果不会影响到其他观察单位的结果。如要求疾病无传染性、无家族性等。

二项分布 - 分布区别

两点分布又称伯努利分布

两点分布的分布列就是

x 0 1

P 1-p p

不论题目有什么区别,只有两种可能,要么是这种结果要么是那种结果,通俗点,要么成功要么失败

而二项分布的可能结果是不确定的甚至是没有尽头的,

列一个二项分布的分布列就是

X 0 1 2 ……… n

P C(0)(n)·(1-p)^n C(1)(n)·p·(1-p)^(n-1) ……

C(n)(n)·p^n·(1-p)^0

也就是说当n=1时,这个特殊二项分布就会变成两点分布,

即两点分布是一种特殊的二项分布

像其他地方说的二项分布是两点分布的多重实验也不无道理,因为两者都是独立的重复实验,只不过次数不同罢了

E(n) = np

var(n) = np(1-p) (n是实验次数,p是每次实验的概率)

社会统计学习题集--二项分布与正态分布.

第七章假设检验 第一节二项分布 二项分布的数学形式·二项分布的性质 第二节统计检验的基本步骤 建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定 第三节正态分布 正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法 第四节中心极限定理 抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节总体均值和成数的单样本检验 σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验·关于总体成数的检验一、填空 1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于(正态)分布。 2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( 显著性水平,它决定了否定域的大小。 3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(大),原假设为真而被拒绝的概率越(小)。 4.二项分布的正态近似法,即以将B(x;n,p视为(( np ,npq查表进行计算。 5.已知连续型随机变量~(0,1,若概率P{≥}=0.10,则常数= ()。 6.已知连续型随机变量~(2,9,函数值,则概率=()。 二、单项选择

1.关于学生t分布,下面哪种说法不正确( B )。 A 要求随机样本 B 适用于任何形式的总体分布 C 可用于小样本 D 可用样本标准差S代替总体标准差 2.二项分布的数学期望为( C )。 A n(1-np B np(1- p C np D n(1- p。 3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( D )。 A 大于0.5 B -0.5 C 1 D 0.5。 4.假设检验的基本思想可用( C )来解释。 A 中心极限定理 B 置信区间 C 小概率事件 D 正态分布的性质 5.成数与成数方差的关系是(D)。 A 成数的数值越接近0,成数的方差越大 B 成数的数值越接近0.3,成数的方差越大 C 成数的数值越接近1,成数的方差越大 D 成数的数值越接近0.5,成数的方差越大 6.在统计检验中,那些不大可能的结果称为( D 。如果这类结果真的发生了, 我们将否定假设。 A 检验统计量 B 显著性水平 C 零假设 D 否定域 7.对于大样本双侧检验,如果根据显著性水平查正态分布表得Zα/2=1.96,则当零假设被否定时,犯第一类错误的概率是( C 。 A 20% B 10% C 5% D.1% 8.关于二项分布,下面不正确的描述是( A )。 A 它为连续型随机变量的分布;

论正态分布的重要性和意义(优.选)

论正态分布的重要性和意义 一、正态分布的概论 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。 若随机变量X服从一个位置参数为、尺度参数为的概率分布,且其概率密度函数为 则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作,读作服从,或服从正态分布。 二、正态分布的重要性 正态分布是概率统计中最重要的一种分布。其重要性我们可以从以下两方面来理解: (1)一方面。正态分布是自然界最常见的一种分布。一般说来.若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。例如,产品尺寸是一类典型的总体。对于成批生产的产品.如果生产条件正常并稳定,即工艺、设备、技术、操作、原料、环境等可以控制的条件都相对稳定.而且不存在产生系统误差的明显因素。那么,产品尺寸的总体分布就服从正态分布。又如测量的误差,炮弹落点的分布,人的生理特征的量:身高.体重等,农作物的收获量等等.都服从或近似服从正态分布。 (2)另一方面.正态分布具有许多良好的性质.很多分布可以用正态分布来近似描述.另外.一些分布又可以通过正态分布来导出.因此在理论研究中正态分布也十分重要。 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种

二项分布与正态分布 练习题

二项分布与正态分布 1.用电脑每次可以自动生成一个(0,1)内的实数,且每次生成每个实数都是等可能的,若用该电脑连续生成3个实数,则这3个实数都大于1 3 的概率为( ) A.1 27 B.23 C. 827 D.49 解析:选C 由题意可得,用该电脑生成1个实数,且这个实数大于1 3的概率为P = 1-13=23,则用该电脑连续生成3个实数,这3个实数都大于13的概率为? ????233=8 27.故选 C. 2.(2019·汕头模拟)甲、乙两人参加“社会主义价值观”知识竞赛,甲、乙两人能荣获一等奖的概率分别为23和3 4,甲、乙两人是否获得一等奖相互独立,则这两个人中 恰有一人获得一等奖的概率为( ) A.34 B.23 C.57 D.512 解析:选D 根据题意,恰有一人获得一等奖就是甲获得乙没有获得或甲没有获得乙获得,则所求概率是23×? ????1-34+34×? ????1-23=5 12 ,故选D. 3.(2018·厦门二模)袋中装有2个红球,3个黄球,有放回地抽取3次,每次抽取1球,则3次中恰有2次抽到黄球的概率是( ) A.25 B.35 C.18125 D.54125 解析:选D 袋中装有2个红球,3个黄球,有放回地抽取3次,每次抽取1球,每次取到黄球的概率为35,∴3次中恰有2次抽到黄球的概率是P =C 23? ????352? ????1-35= 54 125 . 4.(2018·唐山二模)甲、乙等4人参加4×100米接力赛,在甲不跑第一棒的条件下,乙不跑第二棒的概率是( ) A.2 9 B.49

C.23 D.79 解析:选D 甲不跑第一棒共有A 13·A 3 3=18种情况,甲不跑第一棒且乙不跑第二棒共有两类:(1)乙跑第一棒,共有A 33=6种情况;(2)乙不跑第一棒,共有A 12·A 12·A 2 2=8 种情况,∴甲不跑第一棒的条件下,乙不跑第二棒的概率为6+818=79 .故选D. 5.(2019·福建四校联考)某校在高三第一次模拟考试中约有1 000人参加考试,其数学考试成绩X 近似服从正态分布N (100,a 2)(a >0),试卷满分150分,统计结果显示数学考试成绩不及格(低于90分)的人数占总人数的1 10,则此次数学考试成绩在100 分到110分之间的人数约为( ) A .400 B .500 C .600 D .800 解析:选A 由题意得,P (X ≤90)=P (X ≥110)=110,所以P (90≤X ≤110)=1-2× 1 10=45,所以P (100≤X ≤110)=2 5,所以此次数学考试成绩在100分到110分之间的人数约为 1 000×2 5 =400.故选A. 6.(2018·河北“五个一名校联盟”二模)某个电路开关闭合后会出现红灯或绿灯闪烁,已知开关第一次闭合后出现红灯的概率为12,两次闭合后都出现红灯的概率为1 5, 则在第一次闭合后出现红灯的条件下第二次闭合后出现红灯的概率为( ) A.1 10 B.15 C.25 D.12 解析:选C 设“开关第一次闭合后出现红灯”为事件A ,“第二次闭合后出现红灯”为事件B ,则由题意可得P (A )=12,P (AB )=1 5,则在第一次闭合后出现红灯的条件 下第二次闭合出现红灯的概率是P (B |A )=P AB P A =1 512 =25 .故选C. 7.(2019·淄博一模)设每天从甲地去乙地的旅客人数为随机变量X ,且X ~ N (800,502),则一天中从甲地去乙地的旅客人数不超过900的概率为( )

随机变量及其分布考点总结

第二章 随机变量及其分布 复习 一、随机变量. 1. 随机试验的结构应该是不确定的.试验如果满足下述条件: ①试验可以在相同的情形下重复进行;②试验的所有可能结果是明确可知的,并且不止一个;③每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果. 它就被称为一个随机试验. 2. 离散型随机变量:如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量.若ξ是一个随机变量,a ,b 是常数.则b a +=ξη也是一个随机变量.一般地,若ξ是随机变量,)(x f 是连续函数或单调函数,则)(ξf 也是随机变量.也就是说,随机变量的某些函数也是随机变量. 3、分布列:设离散型随机变量ξ可能取的值为:ΛΛ,,,,21i x x x ξ取每一个值),2,1(Λ=i x 的概率p x P ==)(,则表称为随机变量ξ的概率分布,简称ξ的分布列. 121i 注意:若随机变量可以取某一区间内的一切值,这样的变量叫做连续型随机变量.例如:]5,0[∈ξ即ξ可以取0~5之间的一切数,包括整数、小数、无理数. 典型例题: 1、随机变量ξ的分布列为(),1,2,3(1) c P k k k k ξ== =+……,则P(13)____ξ≤≤= 2、袋中装有黑球和白球共7个,从中任取两个球都是白球的概率为1 7 ,现在甲乙两人从袋中轮流摸去一 球,甲先取,乙后取,然后甲再取……,取后不放回,直到两人中有一人取到白球时终止,用ξ表示取球的次数。(1)求ξ的分布列(2)求甲取到白球的的概率 3、5封不同的信,放入三个不同的信箱,且每封信投入每个信箱的机会均等,X 表示三哥信箱中放有信件树木的最大值,求X 的分布列。 4 已知在全部50人中随机抽取1人抽到喜爱打篮球的学生的概率为5 . (1)请将上面的列联表补充完整; (2)是否有99.5%的把握认为喜爱打篮球与性别有关?说明你的理由; (3)已知喜爱打篮球的10位女生中,12345,,A A A A A ,,还喜欢打羽毛球,123B B B ,,还喜欢打乒乓球,12C C ,还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出1名进行其他方面的调查,求1B 和1C 不全被选中的概率. (参考公式:2 ()()()()() n ad bc K a b c d a c b d -=++++,其中n a b c d =+++)

论正态分布的重要性和意义

论正态分布的重要性和 意义 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

论正态分布的重要性和意义 一、正态分布的概论 正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。 若随机变量X服从一个位置参数为、尺度参数为?的概率分布,且其概率密度函数为 则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作??,读作??服从??,或??服从正态分布。 二、正态分布的重要性 正态分布是概率统计中最重要的一种分布。其重要性我们可以从以下两方面来理解: (1)一方面。正态分布是自然界最常见的一种分布。一般说来.若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。例如,产品尺寸是一类典型的总体。对于成批生产的产品.如果生产条件正常并稳定,即工艺、设备、技术、操作、原料、环境等可以控制的条件都相对稳定.而且不存在产生系统误差的明显因素。那么,产品尺寸的总体分布就服从正态分布。又如测量的误差,

炮弹落点的分布,人的生理特征的量:身高.体重等,农作物的收获量等等.都服从或近似服从正态分布。 (2)另一方面.正态分布具有许多良好的性质.很多分布可以用正态分布来近似描述.另外.一些分布又可以通过正态分布来导出.因此在理论研究中正态分布也十分重要。 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t 分布、F分布等。 三、正态分布的意义 正态分布的意义在于它的应用领域。 ⒈估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。 ⒉制定参考值范围 ⑴正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

二项分布应用举例说课讲解

二项分布应用举例

二项分布及其应用 知识归纳 1.条件概率及其性质 (1)对于任何两个事件A和B,在已知事件A发生的条件下,事件B发生的概率叫做,用符号来表 示,其公式为P(B|A)= . 在古典概型中,若用n(A)表示事件A中基本事件的个 数,则P(B|A)= . (2)条件概率具有性质: ①; ②如果B和C是两互斥事件,则P(B+C|A)=. 2.相互独立事件 (1)对于事件A、B,若A的发生与B的发生互不影响,则称A、B是相互独立事件. (2)若A与B相互独立,则P(B|A)=, P(AB)=P(B|A)·P(A)=. (3)若A与B相互独立,则,,也都相互独立. (4)若P(AB)=P(A)P(B),则. 3.二项分布 (1)独立重复试验是指在相同条件下可重复进行的,各次之间相互独立的一种试验,在这种试验中每一次试验只有两种相互对立的结果,即要么发生,要么不发生,且任何一次试验中发生的概率都是一样的.

(2)在n 次独立重复试验中,事件A 发生k 次的概率为 (p 为事件A 发生的概率),若一个随机变量X 的分布列如上所述,称X 服从参数为n ,p 的 二项分布,简记为 . 自我检测 1.(2011·辽宁高考,5)从1,2,3,4,5中任取2个不同的数,事件A =“取到的2个数之和为偶 数”,事件B =“取到的2个数均为偶数”,则P (B |A )=( ) A.18 B.14 C.25 D.12 解析:条件概率P (B |A )=P AB P A P (A )=C 23+1C 25=410=25,P (AB )=1C 25=110,∴P (B |A )=11025=1 4. 2.一袋中有5个白球,3个红球,现从袋中往外取球,每次任取一个记下颜色后放回,直 到红球出现10次时停止,设停止时共取了ξ次球,则P (ξ=12)等于( ) A .C 1012? ????3810? ????582 B . C 911? ????389? ????58238 C .C 911? ????589? ????382 D .C 911? ????389? ?? ??582 解:事件{ξ=12}表示第12次取到红球,前11次取到9个红球,故P (ξ=12)=C 911? ????389·? ?? ??582·38. 3.(2011·广东高考)甲、乙两队进行排球决赛,现在的情形是甲队只要再赢一局就获冠军, 乙队需要再赢两局才能得冠军,若两队胜每局的概率相同,则甲队获得冠军的概率为( ) A.12 B.35 C.23 D.34 解析:∵甲、乙两队决赛时每队赢的概率相等,∴每场比赛甲、乙赢的概率均为12. 记甲获冠军为事件A ,则P (A )=12+12×12=34 4.(2010·福建高考,13)某次知识竞赛规则如下:在主办方预设的5个问题中,选手若能连 续正确回答出两个问题,即停止答题,晋级下一轮.假设某选手正确回答每个问题的概率

二项分布与正态分布

二项分布与正态分布 [最新考纲] 1.了解条件概率和两个事件相互独立的概念. 2.理解n 次独立重复试验的模型及二项分布. 3.能解决一些简单的实际问题. 知 识 梳 理 1.条件概率及其性质 设A ,B 为两个事件,如果P (AB )=P (A )P (B ),则称事件A 与事件B 相互独立. 若事件A ,B 相互独立,则P (B |A )=P (B );事件A 与B ,A 与B ,A 与B 都相互独立. 3.独立重复试验与二项分布 (1)独立重复试验 在相同条件下重复做的n 次试验称为n 次独立重复试验,若用A i (i =1,2,…,n )表示第i 次试验结果,则 P (A 1A 2A 3…A n )=P (A 1)P (A 2)P (A 3)…P (A n ). (2)二项分布 在n 次独立重复试验中,用X 表示事件A 发生的次数,设每次试验中事件A 发 生的概率为p ,则P (X =k )=C k n p k (1-p ) n -k (k =0,1,2,…,n ),此时称随机变量X 服从二项分布,记为X ~B (n ,p ),并称p 为成功概率. 4.正态分布 (1)正态分布的定义及表示 如果对于任何实数a ,b (a

机变量X 服从正态分布,记为X ~N (μ,σ2). 函数φμ,σ(x )=,x ∈R 的图象(正态曲线)关于直线x =μ对称,在x =μ处达到峰值1σ2π. (2)正态总体三个基本概率值 ①P (μ-σ

数学分布(泊松分布、二项分布、正态分布、均匀分布、指数分布) 生存分析 贝叶斯概率公式 全概率公式讲解

数学期望:随机变量最基本的数学特征之一。它反映随机变量平均取值的大小。又称期望或均值。它是简单算术平均的一种推广。例如某城市有10万个家庭,没有孩子的家庭有1000个,有一个孩子的家庭有9万个,有两个孩子的家庭有6000个,有3个孩子的家庭有3000个,则此城市中任一个家庭中孩子的数目是一个随机变量,记为X,它可取值0,1,2,3,其中取0的概率为0.01,取1的概率为0.9,取2的概率为0.06,取3的概率为0.03,它的数学期望为0×0.01+1×0.9+2×0.06+3×0.03等于1.11,即此城市一个家庭平均有小孩1.11个,用数学式子表示为:E(X)=1.11。 也就是说,我们用数学的方法分析了这个概率性的问题,对于每一个家庭,最有可能它家的孩子为1.11个。 可以简单的理解为求一个概率性事件的平均状况。 各种数学分布的方差是: 1、一个完全符合分布的样本 2、这个样本的方差 概率密度的概念是:某种事物发生的概率占总概率(1)的比例,越大就说明密度越大。比如某地某次考试的成绩近似服从均值为80的正态分布,即平均分是80分,由正态分布的图形知x=80时的函数值最大,即随机变量在80附近取值最密集,也即考试成绩在80分左右的人最多。 下图为概率密度函数图(F(x)应为f(x),表示概率密度):

离散型分布:二项分布、泊松分布 连续型分布:指数分布、正态分布、X 2分布、t 分布、F 分布 抽样分布只与自由度,即样本含量(抽样样本含量)有关 二项分布(binomial distribution ):例子抛硬币 1、 重复试验(n 个相同试验,每次试验两种结果,每种结果概率恒定————伯努利试验) 2、 抽样分布

实验十三 二项分布的计算与中心极限定.

实验十三二项分布的计算与中心极限定 [实验目的] 1.研究用Poisson逼近与正态逼近进行二项分布近似计算的条件 2.检验中心极限定理 §1 引言 二项分布在概率论中占有很重要的地位。N次Bernoulli实验中正好出现K次成功的概 率有下式给出b k;n,p C n k p k1p n k ,k=0,1,2,……..n.二项分布的 值有现成的表可查,这种表对不同的n及p给出了b(k;n.p)的数值。在实际应用中。通常可用二项的Poisson逼近与正态逼近来进行二项分布的近似计算。在本实验中,,我们来具体地研究在什么条件下,可用Poisson逼近与正态逼近来进行二项分布的近似计算。 在概率论中,中心极限定理是一个很重要的内容,在本实验中,我们用随即模拟的方法来检验一个重要的中心极限定理——Liderberg-Levi中心极限定理。 §2 实验内容与练习 1.1二项分布的Poisson逼近 用Mathematica软件可以比较方便地求出二项分布的数值。例如n=20;p=0,1;Table[Binomial[n,k]*p^k*(1-p)(n-k),{k,0,20}]给出了b(k;20,0.1)(k=0,1,2,…..,20)的值。 联系 1 用Mathematica软件给出了b(k;20,0.1),b(k;20,0.3)与 b (k;20,0.5)(k=0,1,2,…..,20)的值。 我们可用Mathematica软件画出上述数据的散点图,下面的语句给出了b(k;20.0.1)的(连线)散点图(图13。1): LISTpOLT[table[Binomi al[20,k]*0.1^k*0.9^(20-k), {k,0,20}],PlotJoined->True] 图13.1 b(k;20,0.1) b k;n,p C n k p k1p n k (k=1,1,2,……,20)的散点图 练习2绘出b(l;20,0.3)与b(k;20,0.5)(k=0,1,2,…,20)的散点图 根据下面的定理,二项分布可用Poisson分布来进行近似计算。 定理13。1 在Bernoulli实验中,以P n 代表事件A在试验中出现的概率,它与试验总数有关. 如果np n→→λ,则当n→∞时,b k;n,p k k e 。 由定理13,1在n很大,p很小,而λ=np大小适中时,有 b k;n.p c k n p k1p n k k k e

二项分布与正态分布的特点及联系

二项分布与正态分布的特点及他们的联系 2008-05-23 09:22:10| 分类:数学|举报|字号订阅 正态分布的特点如下: 1.正态分布的形式是对称的,它的对称轴是过平均数点的垂直线,即关于x=u对称。 2.曲线在Z=0处为最高点,向左右延伸时,在正负1个标准差之内,既向下又向内弯。从正负1个标准差开始,既向下又向外弯。拐点位于正负一个标准差处,曲线两端向靠近基线处无限延伸和接近,但不相交。 3.正态分布下的面积为1,过平均数的垂直线将面积分为左右各0.50的部分。正态曲线下的每一面积都可以被看成是概率,即对应着横坐标值的随机变量出现的概率。 4.正态分布是一族分布,它随着随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。但是所有的正态分布都可以通过公式Z=(Xl—M)/S,转换成标准正态分布,即平均数为0,标准差为1的正态分布。 5.在正态分布曲线中,标准差与概率(面积)有一定的关系。 二项分布的特点如下: 1、二项分布的均值为np,方差为npq。 2、以事件A出现的次数为横坐标,以概率为纵坐标,画出二项分布的图象,可以看出: (1)、二项分布是一种离散性分布 (2)、当p=q=0.5时,图象对称;当p不等于q时,图形是偏斜的。p>q 时,呈负偏态; 3、n->∞时,趋近于正态分布N(np,npq)

一般1/2np>=5且nq>=5时,二项分布就非常接近正态分布。 二项分布函数在教育中主要用来判断试验结果的机遇性与真实性的界限,例如,求测验猜测行为的判断标准:在选择题测验中,通过二项分布计算得出被试凭猜测答对N道以上的概率。 阅读(744)|评论(0)

先给出正态分布的定义,再对其重要性和意义进行阐述

正态分布,也称“常态分布”,又名高斯分布,最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。若随机变量X 服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ=0,σ=1时的正态分布是标准正态分布。 正态分布是一种概率分布。正态分布是具有两个参数μ和σ2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ2是此随机变量的方差,所以正态分布记作N(μ,σ2 )。服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。 正态分布最早由A.棣莫弗在求二项分布的渐近公式中得到。C.F.高斯在研究测量误差时从另一个角度导出了它。P.S.拉普拉斯和高斯研究了它的性质。 生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。

高中数学人教版 选修2-3(理科) 第二章 随机变量及其分布 2.2.3独立重复试验与二项分布D卷

高中数学人教版选修2-3(理科)第二章随机变量及其分布 2.2.3独立重复试验与 二项分布D卷 姓名:________ 班级:________ 成绩:________ 一、选择题 (共10题;共19分) 1. (2分) (2016高一下·兰州期中) 从一批羽毛球产品中任取一个,质量小于4.8g的概率是0.3,质量不小于4.85g的概率是0.32,那么质量在[4.8,4.85)g范围内的概率是() A . 0.62 B . 0.38 C . 0.7 D . 0.68 2. (2分)已知随机变量ξ服从二项分布ξ~B(n,p),且E(ξ)=7,D(ξ)=6,则p等于() A . B . C . D . 3. (2分) (2016高二下·邯郸期中) 设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)= ,则P(Y≥1)为() A . B . C .

D . 1 4. (2分) (2017高二下·洛阳期末) 设随机变量X~B(2,p),随机变量Y~B(3,p),若P(X≥1)= ,则D( Y+1)=() A . 2 B . 3 C . 6 D . 7 5. (2分)设随机变量X~B(2,P),随机变量Y~B(3,P),若P(X≥1)=,则D(3Y+1)=() A . 2 B . 3 C . 6 D . 7 6. (2分)随机变量ξ服从二项分布ξ~B(n,p),且Eξ=300,Dξ=200,则p等于() A . B . 0 C . 1 D . 7. (2分)某人射击一次击中目标的概率为0.6,此人射击3次恰有两次击中目标的概率为() A . B .

C . D . 8. (2分) (2017高二下·南阳期末) 设随机变量ξ~B(2,p),随机变量η~B(3,p),若,则Eη=() A . B . C . 1 D . 9. (2分) (2018高二下·黄陵期末) 若随机变量X服从二项分布,且 ,则 =________ , =________. 10. (1分) (2018高二下·枣庄期末) 已知随机变量,且,则 ________. 二、填空题 (共2题;共6分) 11. (1分)已知随机变量X服从二项分布B(n,p),若E(X)=40,D(X)=30,则p=________ 12. (5分)(2019·天津) 设甲、乙两位同学上学期间,每天7:30之前到校的概率均为 .假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立. (Ⅰ)用表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量的分布列和数学期望; (Ⅱ)设为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件发生的概率. 三、解答题 (共2题;共20分) 13. (10分)(2019·大连模拟) 随着电子阅读的普及,传统纸质媒体遭受到了强烈的冲击.某杂志社近9

二项分布、超几何分布、正态分布总结归纳及练习

二项分布与超几何分布辨析 二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析. 例 袋中有8个白球、2个黑球,从中随机地连续抽取3次,每次取1个球.求: (1)有放回抽样时,取到黑球的个数X的分布列; (2)不放回抽样时,取到黑球的个数Y的分布列. 解:(1)有放回抽样时,取到的黑球数X可能的取值为0,1,2,3.又由于每次取到黑球的概率均 为,3次取球可以看成3次独立重复试验,则1~35X B ?? ???,. 3 03 1464(0)55125P X C ???? ==?= ? ????? ∴; 12 13 1448(1)55125 P X C ???? ==?= ? ?????; 21 231412(2)55125P X C ???? ==?= ? ?????; 3 33 141(3)55125 P X C ???? ==?= ? ?????. 因此,X 的分布列为 X 0 1 2 3 P 64125 48125 12125 1125 2.不放回抽样时,取到的黑球数Y可能的取值为0,1,2,且有: 03283107(0)15C C P Y C ===;12283107(1)15C C P Y C ===;21283101 (2)15 C C P Y C ===. 因此,Y 的分布列为 Y 0 1 2 P 715 715 115 辨析:通过此例可以看出:有放回抽样时,每次抽取时的总体没有改变,因而每次抽到某物的概率都是相同的,可以看成是独立重复试验,此种抽样是二项分布模型.而不放回抽样时,取出一个则总体中就少一个,因此每次取到某物的概率是不同的,此种抽样为超几何分布模型.因此,二项分布模型和超几何分布模型最主要的区别在于是有放回抽样还是不放回抽样.所以,在解有关二项分布和超几何分布问题时,仔细阅读、辨析题目条件是非常重要的. 超几何分布和二项分布都是离散型分布

二项分布、超几何分布、正态分布总结归纳与练习

二项分布?还是超几何分布 二项分布与超几何分布是两个非常重要的、应用广泛的概率模型,实际中的许多问题都可以利用 这两个概率模型来解决.在实际应用中,理解并区分两个概率模型是至关重要的.下面举例进行对比辨析.例 1 袋中有 8 个白球、 2 个黑球,从中随机地连续抽取 3 次,每次取 1 个球.求:( 1)有放回抽样时,取到黑球的个数X的分布列; ( 2)不放回抽样时,取到黑球的个数Y的分布列. 解:( 1)有放回抽样时,取到的黑球数X可能的取值为0,1, 2, 3.又由于每次取到黑球的概率 均为1 , 3 次取球可以看成 3 次独立重复试验,则 1 ,.5X~B 35 0312 ∴ P(X 0) C301 464 ;P(X 1)C31 1 448 ; 5512555125 21 P(X 3) C33 130 P(X 2) C321 412 ;4 1 .5512555125 因此, X 的分布列为 X0123 P 6448121 125125125125 (2)不放回抽样时,取到的黑球数Y可能的取值为0, 1,2,且有: P(Y 0)C20C837 ;P(Y1)C21C82 7 ;P(Y2)C22C81 1 . C10315C10315C10315 因此, Y 的分布列为 Y012 771 P 1515 15 例 2 某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上的40 件产品作为样本称出它们的重量(单位:克),重量的分组区间为(490,495] , (495,500] ,,, ,(510,515] ,由此得到样本的频率分布直方图,如图4 ( 1)根据频率分布直方图,求重量超过505 克的产品数量 , ( 2)在上述抽取的40 件产品中任取 2 件,设 Y 为重量超过505 克 的产品数量,求Y 的分布列; ( 3)从该流水线上任取 5 件产品,求恰有 2 件产品的重量超过505 克的概率。

统计分布临界值表

附录 附表一:随机数表 _________________________________________________________________________ 2附表二:标准正态分布表 ___________________________________________________________________ 3附表三:t分布临界值表____________________________________________________________________ 4 附表四: 2 分布临界值表 __________________________________________________________________ 5 附表五:F分布临界值表(α=0.05)________________________________________________________ 7附表六:单样本K-S检验统计量表___________________________________________________________ 9附表七:符号检验界域表 __________________________________________________________________ 10附表八:游程检验临界值表 _________________________________________________________________ 11附表九:相关系数临界值表 ________________________________________________________________ 12附表十:Spearman等级相关系数临界值表 ___________________________________________________ 13附表十一:Kendall等级相关系数临界值表 ___________________________________________________ 14附表十二:控制图系数表 __________________________________________________________________ 15

正态分布在生活中的应用

正态分布在生活中的应用 摘要:正态分布和概率论在统计学中占有非常重要的地位,它广泛存在于自然现象、生产、生活以及科技领域,本文运用正态分布理论对现实生活中的一些问题进行详细解答。 在概率论与数理统计中,最重要的分布就是正态分布。正态分布的重要性在于:实际生活中有许多随机变量服从或近似服从正太分布(如一个人群中成年男子的身高、体重,工件的测量误差,气象学中的温度、湿度等);正态分布的密度函数与分布函数具有许多良好的性质;正态分布是许多分布的极限分布;正态分布在数理统计中的基础作用等。所以,许多实际问题与理论问题的解决,都离不开正态分布。 一、安排座位数量问题 某学院有学生1600人,午餐时间到学院食堂就餐人数最多,约占学生人数的3/4,问学院食堂最多安排多少座位,使空座位超过100个的概率不超过 解:设X表示午餐时就餐人数,则X~B(1600,3/4),np=1200,npq=300,近似地有X~ N(1200,300).设应安排N个座位,因为(N-100-1200)/ √300~N(0,1),则 P(X≤N-100)≈Φ[(N-100-1200)/√300]≤ 查表得Φ()=,故有(N-1300)/√300 ≤ 从而有N≤,即最多安排1259个座位。 二、学生考试问题 某专业招收研究生20名,其中有10名免费,报考人数为1000人,考试满分为500分。经过考试后才知道此专业考试总平均成绩为μ=300分,如果招收研究生的分数线确定为350分,试问,现在某人考360分,他有没有可能被录取为免费生 解:研究生考试成绩X~N(μ,σ2),由已知μ=300,而σ未知。研究生考试分数超过350分的考生频率应该近似等于事件(X≥350)的概率, 所以有P(X≥350)=20/1000=,即P(X<350)=,即Φ((350-300)/σ)= 查标准正态分布表Φ=≈ 所以取50/σ = ,解得σ=50/ 此人能否被录取为免费生,需估计一下他的排名,也就是算一下分数高于360分的概率,

正态分布——概念、特征、广泛应用

正态分布——概念、特征、广泛应用 一、概念 指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。 正态分布的由来 正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss(Carl Friedrich Gauss,1777—1855)率先将其应用于天文学家研究,故正态分布又叫高斯分布。 高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。 在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。但随着各种理论的深入研究,高斯理论的卓越贡献日显重要。 1.正态分布的重要性 正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。

2.正态曲线及其性质 3.标准正态曲线 标准正态曲线N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在任一区间(a,b)内取值概率。 4.一般正态分布与标准正态分布的转化 由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。5.“小概率事件”和假设检验的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。 二、正态分布的特征 均数处最高

二项分布临界值表

附表1 二项分布临界值表 在p=q=下,x或n–x(不论何者为大)的临界值 n 单侧检验()双侧检验()0.050.010.050.01 55———66—6—7777—8788—98989 10910910 119101011 1210111011 1310121112 1411121213 1512131213 1612141314 1713141315 1813151415 1914151516 2015161517 2115171617 2216171718 2316181719 2417191819

2518191820 2618201920 2719202021 2819212022 2920222122 3020222123

附表2 正态分布概率表 Z F(Z)Z F(Z)Z F(Z)Z F(Z) 0.000.00000.350.27370.700.5161 1.050.7063 0.010.00800.360.28120.710.5223 1.060.7109 0.020.01600.370.28860.720.5285 1.070.7154 0.030.02390.380.29610.730.5346 1.080.7199 0.040.03190.390.30350.740.5407 1.090.7243 0.050.03990.400.31080.750.5467 1.100.7287 0.060.04780.410.31820.760.5527 1.110.7330 0.070.05580.420.32550.770.5587 1.120.7373 0.080.06380.430.33280.780.5646 1.130.7415 0.090.07170.440.34010.790.5705 1.140.7457 0.100.07970.450.34730.800.5763 1.150.7499 0.110.08760.460.35450.810.5821 1.160.7540 0.120.09550.470.36160.820.5878 1.170.7580 0.130.10340.480.36880.830.5935 1.180.7620 0.140.11130.490.37590.840.5991 1.190.7660 0.150.11920.500.38290.850.6047 1.200.7699 0.160.12710.510.38990.860.6102 1.210.7737 0.170.13500.520.39690.870.6157 1.220.7775 0.180.14280.530.40390.880.6211 1.230.7813 0.190.15070.540.41080.890.6265 1.240.7850

相关文档
相关文档 最新文档