文档库 最新最全的文档下载
当前位置:文档库 › 正态分布的概念及表和查表方法

正态分布的概念及表和查表方法

正态分布的概念及表和查表方法
正态分布的概念及表和查表方法

正态分布概念及图表

正态分布(Normal distribution),也称“常态分布”,又名高斯分布(Gaussian distribution),最早由A·棣莫弗在求二项分布的渐近公式中得到。.高斯在研究测量误差时从另一个角度导出了它。P·S·拉普拉斯和高斯研究了它的性质。是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。

目录

1历史发展

2定理

3定义

?一维正态分布

?标准正态分布

4性质

5分布曲线

?图形特征

?参数含义

6研究过程

7曲线应用

?综述

?频数分布

?综合素质研究

?医学参考值

历史发展

正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布,高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。但现今德国10马克的印有高斯头像的钞票,其上还印有正态分布的密度曲线。这传达了一种想法:在高斯的一切科学贡献中,其对人类文明影响最大者,就是这一项。在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。这要到20世纪正态小样本理论充分发展起来以后。拉普拉斯很快得知高斯的工作,并马上将其与他发现的中心极限定理联系起来,为此,他在即将发表的一篇文章(发表于1810年)上加上了一点补充,指出如若误差可看成许多量的叠加,根据他的中心极限定理,误差理应有高斯分布。这是历史上第一次提到所谓“元误差学说”——误差是由大量的、由种种原因产生的元误差叠加而成。后来到1837年,海根()在一篇论文中正式提出了这个学说。

其实,他提出的形式有相当大的局限性:海根把误差设想成个数很多的、独立同分布的“元误差” 之和,每只取两值,其概率都是1/2,由此出发,按狄莫佛的中心极限定理,立即就得出误差(近似地)服从正态分布。拉普拉斯所指出的这一点有重大的意义,在于他给误差的正态理论一个更自然合理、更令人信服的解释。因为,高斯的说法有一点循环论证的气味:由于算术平均是优良的,推出误差必须服从正态分布;反过来,由后一结论又推出算术平均及最小二乘估计的优良性,故必须认定这二者之一(算术平均的优良性,误差的正态性)为出发点。但算术平均到底并没有自行成立的理由,以它作为理论中一个预设的出发点,终觉有其不足之处。拉普拉斯的理论把这断裂的一环连接起来,使之成为一个和谐的整体,实有着极重大的意义。

定理

由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x 的概率。只要会用它求正态总体在某个特定区间的概率即可。

为了便于描述和应用,常将正态变量作数据转换。将一般正态分布转化成标准正态分布。

服从标准正态分布,通过查标准正态分布表就可以直接计算出原正态分布的概率值。故该变换被称为标准化变换(标准正态分布表:标准正态分布表中列出了标准正态曲线下从-∞到X(当前值)范围内的面积比例)。

定义

一维正态分布

若随机变量服从一个位置参数为、尺度参数为的概率分布,且其概率密度函数为

f( - x ) = 1 –f( x )

则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作

,读作服从,或服从正态分布。

μ维随机向量具有类似的概率规律时,称此随机向量遵从多维正态分布。多元正态分布有很好的性质,例如,多元正态分布的边缘分布仍为正态分布,它经任何线性变换得到的随机向量仍为多维正态分布,特别它的线性组合为一元正态分布。

本词条的正态分布是一维正态分布,此外多维正态分布参见“二维正态分布”。

标准正态分布

当时,正态分布就成为标准正态分布

性质

正态分布的一些性质:

(1)如果且a与b是实数,那么(参见期望值和方差)。

(2)如果与是统计独立的正态随机变量,那么:

它们的和也满足正态分布

它们的差也满足正态分布

U与V两者是相互独立的(要求X与Y的方差相等)。

(3)如果和是独立常态随机变量,那么:

它们的积XY服从概率密度函数为p的分布。

其中是修正贝塞尔函数(modified Bessel function)

它们的比符合柯西分布,满足

(4)如果为独立标准常态随机变量,那么服从自由度为n的卡方分布。

分布曲线

图形特征

集中性:正态曲线的高峰位于正中央,即均数所在的位置。

对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。

均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。

曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

正态分布

关于μ对称,并在μ处取最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点,形状呈现中间高两边低,正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。

参数含义

正态分布有两个参数,即期望(均数)μ和标准差σ,σ2为方差。

正态分布公式

正态分布具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ2)。

μ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μ邻近的值的概率大,而取离μ越远的值的概率越小。正态分布以X=μ为对称轴,左右完全对称。正态分布的期望、均数、中位数、众数相同,均等于μ。

σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

面积分布

1.实际工作中,正态曲线下横轴上一定区间的面积反映该区间的例数占总例数的百分比,或变量值落在该区间的概率(概率分布)。不同范围内正态曲线下的面积可用公式计算。

⒉正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为%。

P{|X-μ|<σ}=P(μ-σ

2Φ(1)-1=

横轴区间(μσ,μ+σ)内的面积为%。

P{|X-μ|<2σ}=2Φ(2)-1=。

横轴区间(μσ,μ+σ)内的面积为%。

P{|X-μ|<3σ}=2Φ(3)-1=。

由于“小概率事件”和假设检验的基本思想是指“小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。由此可见X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件是不会发生的,基本上可

以把区间(μ-3σ,μ+3σ)看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。

研究过程

概念及特征

一、正态分布的概念

由一般分布的频数表资料所绘制的直方图,图⑴可以看出,高峰位于中部,左右两侧大致对称。我们

正态分布研究图1

设想,如果观察例数逐渐增多,组段不断分细,直方图顶端的连线就会逐渐形成一条高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图⑶。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布(normal distribution)。由于频率的总和为100%或1,故该曲线下横轴上的面积为100%或1。

为了应用方便,常对正态分布变量X作变量变换。

该变换使原来的正态分布转化为标准正态分布(standard normal distribution),亦称u分布。u被称为标准正态变量或标准正态离差(standard normal deviate)。

正态分布研究图2

正态分布研究图3

实际工作中,常需要了解正态曲线下横轴上某一区间的面积占总面积的百分数,以便估计该区间的例数占总例数的百分数(频数分布)或观察值落在该区间的概率。正态曲线下一定区间的面积可以通过附表1求得。对于正态或近似正态分布的资料,已知均数和标准差,就可对其频数分布作出概约估计。

查附表1应注意:①表中曲线下面积为-∞到u的左侧累计面积;②当已知μ、σ和X 时先按式u=(X-μ)/σ求得u值,再查表,当μ、σ未知且样本含量n足够大时,可用样本均数X1和标准差S分别代替μ和σ,按u=(X-X1)/S式求得u值,再查表;③曲线下对称于0的区间面积相等,如区间(-∞,)与区间(,∞)的面积相等,④曲线下横轴上的总面积为100%或1。

正态曲线与标准正态曲线的面积分布

正态分布的应用某些医学现象,如同质群体的身高、红细胞数、血红蛋白量、胆固醇等,以及实验中的随机误差,呈现为正态或近似正态分布;有些资料虽为偏态分布,但经数据变换后可成为正态或近似正态分布,故可按正态分布规律处理。

正态分布面积图1

正态分布面积图2

一般正态分布与标准正态分布的区别与联系

正态分布也叫常态分布,是连续随机变量概率分布的一种,自然界、人类社会、心理和教育中大量现象均按正态形式分布,例如能力的高低,学生成绩的好坏等都属于正态分布。它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布是正态分布的一种,其平均数和标准差都是固定的,平均数为0,标准差为1。

曲线应用

综述

⒈估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

⒉制定参考值范围

⑴正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

⑵百分位数法常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。

⒊质量控制:为了控制实验中的测量(或实验)误差,常以作为上、下警戒值,以作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

⒋正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

频数分布

例某地1993年抽样调查了100名18岁男大学生身高(cm),其均数=,标准差s=,①估计该地18岁男大学生身高在168cm以下者占该地18岁男大学生总数的百分数;②分别求X+-1s、X+、X+范围内18岁男大学生占该地18岁男大学生总数的实际百分数,并与理论百分数比较。

本例,μ、σ未知但样本含量n较大,按式()用样本均数X和标准差S分别代替μ和σ,求得u值,u=()/=。查附表标准正态曲线下的面积,在表的左侧找到,表的上方找到,两者相交处为=%。该地18岁男大学生身高在168cm以下者,约占总数%。其它计算结果见表3。

表3 100名18岁男大学生身高的实际分布与理论分布

综合素质研究

教育统计学统计规律表明,学生的智力水平,包括学习能力,实际动手能力等呈正态分布。因而正常的考试成绩分布应基本服从正态分布。考试分析要求绘制出学生成绩分布的直方图,以“中间高、两头低”来衡量成绩符合正态分布的程度。其评价标准认为:考生成绩分布情况直方图,基本呈正态曲线状,属于好,如果略呈正(负)态状,属于中等,如果呈严重偏态或无规律,就是差的。

从概率统计规律看,“正常的考试成绩分布应基本服从正态分布”是正确的。但是必须考虑人与物的本质不同,以及教育的有所作为可以使“随机”受到干预,用曲线或直方图的形状来评价考试成绩就有失偏颇。许多教育专家(如上海顾泠沅、美国布鲁姆等)已经通过实践论证,教育是可以大有作为的,可以做到大多数学生及格,而且多数学生可以得高分,考试成绩曲线是偏正态分布的。但是长期受到“中间高、两头低”标准的影响,限制了教师的作为,抑制了多数学生能够学好的信心。这是很大的误会。通常正态曲线有一条对称轴。当某个分数(或分数段)的考生人数最多时,对应曲线的最高点,是曲线的顶点。该分数值在横轴上的对应点与顶点连接的线段就是该正态曲线的对称轴。考生人数最多的值是峰值。我们注意到,成绩曲线或直方图实际上很少对称的,称之为峰线更合适。

医学参考值

某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

医学参考值范围亦称医学正常值范围。它是指所谓“正常人”的解剖、生理、生化等指标的波动范围。制定正常值范围时,首先要确定一批样本含量足够大的“正常人”,所谓“正常人”不是指“健康人”,而是指排除了影响所研究指标的疾病和有关因素的同质人群;其

次需根据研究目的和使用要求选定适当的百分界值,如80%,90%,95%和99%,常用95%;根据指标的实际用途确定单侧或双侧界值,如白细胞计数过高过低皆属不正常须确定双侧界值,又如肝功中转氨酶过高属不正常须确定单侧上界,肺活量过低属不正常须确定单侧下界。另外,还要根据资料的分布特点,选用恰当的计算方法。常用方法有:

⑴正态分布法:适用于正态或近似正态分布的资料。

双侧界值:X±u(u)S;单侧上界:X+u(u)S,或单侧下界:X-u(u)S

⑵对数正态分布法:适用于对数正态分布资料。

双侧界值:lg-1[X(lgx)±u(u)S(lgx)];单侧上界:lg-1[X(lgx)+u(u)S(lgx)],或单侧下界:lg-1[X(lgx)-u(u)S(lgx)]。

常用u值可根据要求由表4查出。

⑶百分位数法:常用于偏态分布资料以及资料中一端或两端无确切数值的资料。

双侧界值:和;单侧上界:P95,或单侧下界:P5。

表4常用u值表

统计的理论基础

如t分布、F分布、分布都是在正态分布的基础上推导出来的,u检验也是以正态分布为基础的。此外,t分布、二项分布、Poisson分布的极限为正态分布,在一定条件下,可以按正态分布原理来处理。

概率论中最重要的分布

正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量等等。一般

来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。

主要内涵

在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征(以后谈及正态分布及正态分布论就要浮现此图),进行抽象与提升,抓住其中的主要哲学内涵,归纳正态分布论(正态哲学)的主要内涵如下:

整体论

正态分布启示我们,要用整体的观点来看事物。“系统的整体观念或总体观念是系统概念的精髓”。正态分布曲线及面积分布图由基区、负区、正区三个区组成,各区比重不一样。用整体来看事物才能看清楚事物的本来面貌,才能得出事物的根本特性。不能只见树木不见森林,也不能以偏概全。此外整体大于部分之和,在分析各部分、各层次的基础上,还要从整体看事物,这是因为整体有不同于各部分的特点。用整体观来看世界,就是要立足在基区,放眼负区和正区。要看到主要方面,还要看到次要方面,既要看到积极的方面还要看到事物消极的一面,看到事物前进的一面还要看到落后的一面。片面看事物必然看到的是偏态或者是变态的事物,不是真实的事物本身。

重点论

正态分布曲线及面积分布图非常清晰的展示了重点,那就是基区占%,是主体,要重点抓,此外95%,99%则展示了正态的全面性。认识世界和改造世界一定要住住重点,因为重点就是事物的主要矛盾,它对事物的发展起主要的、支配性的作用。抓住了重点才能一举其纲,万目皆张。事物和现象纷繁复杂,在千头万绪中不抓住主要矛盾,就会陷入无限琐碎之中。由于我们时间和精力的相对有限性,出于效率的追求,我们更应该抓住重点。在正态分布中,基区占了主体和重点。如果我们结合20/80法则,我们更可以大胆的把正区也可以看做是重点。

发展论

联系和发展是事物发展变化的基本规律。任何事物都有其产生、发展和灭亡的历史,如果我们把正态分布看做是任何一个系统或者事物的发展过程的话,我们明显的看到这个过程经历着从负区到基区再到正区的过程。无论是自然、社会还是人类的思维都明显的遵循这样一个过程。准确的把握事物或者事件所处的历史过程和阶段极大的有助于掌握我们对事物、

事件的特征和性质,是我们分析问题,采取对策和解决问题的重要基础和依据。发展的阶段不同,性质和特征也不同,分析和解决问题的办法要与此相适应,这就是具体问题具体分析,也是解放思想、实事求是、与时俱乐进的精髓。正态发展的特点还启示我们,事物发展大都是渐进的和累积的,走渐进发展的道路是事物发展的常态。例如,遗传是常态,变异是非常态。

总之,正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。

弗朗西斯·高尔顿 [Francis Galton ,英国探险家、优生学家、心理学家,差异心理学之父,也是心理测量学上生理计量法的创始人。

高尔顿对心理学的贡献,大概可以归纳未差异心理学、心理测量的量化和实验心理学三方面:

心理学研究之量化,始自高尔顿。他发明了许多感官和运动的测试,并以数量代表所测得的心理特质之差异。他认为人的所有特质,不管是物质的还是精神的,最终都可以定量叙述,这是实现人类科学的必要条件,故最先应用统计法处理心理学研究资料,重视数据的平均数与高中差数。他收集了大量资料证明人的心理特质在人口中的分布如同身高、体重那样符合正态分布曲线。他在论及遗传对个体差异的影响时,为相关系数的概念作了初步提示。如他研究了“居间亲”和其成年子女的身高关系,发现居间亲和其子女的身高有正相关,即父母的身材较高,其子女的身材也有较高的趋势。反之,父母的身材较低,其子女也有较矮的趋势。同时发现子女的身高常与其父母略有差别,而呈现“回中”趋势,即离开其父母的身高数,而回到一般人身高的平均数。

智力、能力

理查德·赫恩斯坦 [(Richard J. Herrnstein ),美国比较心理学家]和默瑞(Charles Murray)合著《正态曲线》一书而闻名,在该书中他们指出人们的智力呈正态分布。智力主要是遗传的并因种族的不同而不同,犹太人、东亚人的智商最高,其次为白人,表现最差的是黑人、西班牙裔人。他们检讨了数十年来心理计量学与政策学的研究成果,发现美国社会轻忽了智商的影响愈变愈大的趋势。他们力图证明,美国现行的偏向于以非洲裔和南美裔为主的低收入阶层的社会政策,如职业培训、大学教育等,完全是在浪费资源。他们利用应募入伍者的测试结果证明,黑人青年的智力低于白人和黄种人;而且,这些人的智力已经定型,对他们进行培训收效甚微。因此,政府应该放弃对这部分人的教育,把钱用于包括所有种族

在内的启蒙教育,因为孩子的智力尚未定型,开发潜力大。由于此书涉及黑人的智力问题,一经出版便受到来自四面八方的围攻。

附标准正态分布表

注:本表最后一行自左至右依次是φ、…、φ的值

使用方法:

例 6-9 :设 u 服从标准正态分布 N (0,1),试求( 1 )、随机变量 u 落入(0,)区间的概率;( 2 )、随机变量 u 落入(,)区间的概率;( 3 )、随机变量 u 落入(,)区

间的概率。

P(0

P

P

正态分布有几个常用的概率值和标准差要记住的。

z=,p=;z=2,p=;z=1,p=;z=,p=;z=,p=。用的时候注意单双侧。

标准正态分布表

标准正态分布表 集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

标准正态分布表

4432198653 1.80.964 1 0.964 8 0.965 6 0.966 4 0.967 2 0.967 8 0.968 6 0.969 3 0.970 0.970 6 1.90.971 3 0.971 9 0.972 6 0.973 2 0.973 8 0.974 4 0.975 0.975 6 0.976 2 0.976 7 20.977 2 0.977 8 0.978 3 0.978 8 0.979 3 0.979 8 0.980 3 0.980 8 0.981 2 0.981 7 2.10.982 1 0.982 6 0.983 0.983 4 0.983 8 0.984 2 0.984 6 0.985 0.985 4 0.985 7 2.20.986 1 0.986 4 0.986 8 0.987 1 0.987 4 0.987 8 0.988 1 0.988 4 0.988 7 0.989 2.30.989 3 0.989 6 0.989 8 0.990 1 0.990 4 0.990 6 0.990 9 0.991 1 0.991 3 0.991 6 2.40.991 8 0.992 0.992 2 0.992 5 0.992 7 0.992 9 0.993 1 0.993 2 0.993 4 0.993 6 2.50.993 8 0.994 0.994 1 0.994 3 0.994 5 0.994 6 0.994 8 0.994 9 0.995 1 0.995 2 2.60.995 3 0.995 5 0.995 6 0.995 7 0.995 9 0.996 0.996 1 0.996 2 0.996 3 0.996 4 2.70.996 5 0.996 6 0.996 7 0.996 8 0.996 9 0.997 0.997 1 0.997 2 0.997 3 0.997 4 2.80.997 4 0.997 5 0.997 6 0.997 7 0.997 7 0.997 8 0.997 9 0.997 9 0.998 0.998 1 2.90.998 1 0.998 2 0.998 2 0.998 3 0.998 4 0.998 4 0.998 5 0.998 5 0.998 6 0.998 6 x00.10.20.30.40.50.60.70.80.9 30.998 7 0.999 0.999 3 0.999 5 0.999 7 0.999 8 0.999 8 0.999 9 0.999 9 1.000 正态分布概率表 Φ( u ) =

(完整版)t分布的概念及表和查表方法.doc

t分布介绍 在概率论和统计学中,学生 t - 分布(t -distribution ),可简称为 t 分布,用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。 t 分布曲线形态与 n(确切地说与自由度 df )大小有关。与标准正态分布曲线相比,自由度df 越小, t 分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度 df 愈大, t 分布曲线愈接近正态分布曲线,当自由度 df= ∞时, t 分布曲线为标准正态分布曲线。 中文名t 分布应用在对呈正态分布的总体 外文名t -distribution 别称学生 t 分布 学科概率论和统计学相关术语t 检验 目录 1历史 2定义 3扩展 4特征 5置信区间 6计算 历史 在概率论和统计学中,学生 t -分布( Student's t-distribution )经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t 测定的基础。 t 检定改进了Z 检定(en:Z-test ),不论样本数量大或小皆可应用。在样本数量大(超过 120 等)时,可以应用Z 检定,但 Z 检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t 检定。在数据有三组以上时,因为误差无法压低,此时可以用变异数分析代替学生t 检定。 当母群体的标准差是未知的但却又需要估计时,我们可以运用学生t-分布。 学生 t-分布可简称为t 分布。其推导由威廉·戈塞于 1908 年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student )这一笔名。之后t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布。 定义

标准正态分布

标准正态分布 标准正态分布(英语:standard normal distribution,德语Standardnormalverteilung),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。 定义: 标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。 正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是位置参数均数为0, 尺度参数:标准差为1的正态分布 特点: 密度函数关于平均值对称 平均值与它的众数(statistical mode)以及中位数(median)同一数值。 函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。 95.449974%的面积在平均数左右两个标准差的范围内。 99.730020%的面积在平均数左右三个标准差的范围内。 99.993666%的面积在平均数左右四个标准差的范围内。 函数曲线的反曲点(inflection point)为离平均数一个标准差距离的位置。 标准偏差:

深蓝色区域是距平均值小于一个标准差之内的数值范围。在正态分布中,此范围所占比率为全部数值之68%,根据正态分布,两个标准差之内的比率合起来为95%;三个标准差之内的比率合起来为99%。 在实际应用上,常考虑一组数据具有近似于正态分布的概率分布。若其假设正确,则约68.3%数值分布在距离平均值有1个标准差之内的范围,约95.4%数值分布在距离平均值有2个标准差之内的范围,以及约99.7%数值分布在距离平均值有3个标准差之内的范围。称为“68-95-99.7法则”或“经验法则”

卡方分布概念及表和查表方法

若n个相互独立的随机变量ξ?,ξ?,...,ξn,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为卡方分布(chi-square distribution)。 目录 1简介 2定义 3性质 4概率表 简介 分布在数理统计中具有重要意义。分布是由阿贝(Abbe)于1863年首先提出的,后来由海尔墨特(Hermert)和现代统计学的奠基人之一的卡·皮尔逊(C K·Pearson)分别于1875年和1900年推导出来,是统计学中的一个非常有用的著名分布。 定义 若n个相互独立的随机变量ξ?、ξ?、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n个服从标准正态分布的随机变量的平方和构成一新的随机变量,其分布规律称为分布(chi-square distribution), 卡方分布是由正态分布构造而成的一个新的分布,当自由度很大时,分布近似为正态分布。

对于任意正整数x,自由度为的卡方分布是一个随机变量X的机率分布。 性质 1) 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数 的增大,分布趋近于正态分布;卡方分布密度曲线下的面积都是1。 2) 分布的均值与方差可以看出,随着自由度的增大,分布向正无穷方向延伸(因为均值越来越大),分布曲线也越来越低阔(因为方差越来越大)。 3)不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。 4) 若互相独立,则:服从分布,自由度为 。 5) 分布的均数为自由度,记为 E( ) = 。 6) 分布的方差为2倍的自由度( ),记为 D( ) = 。 概率表 分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在 分布中得对每个分布编制相应的概率值,这通过分布表中列出不同的自由度来表示, 查分布概率表时,按自由度及相应的概率去找到对应的值。如上图所示的单侧概率(7)=的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率这一列,行列的交叉处即是。 表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为7的卡方分布中,得到双侧概率为所对应的上下端点可以这样来考虑:双侧概率指的是在

标准正态分布表

标准正态分布表 x 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0 0.500 0 0.504 0 0.508 0 0.512 0 0.516 0 0.519 9 0.523 9 0.527 9 0.531 9 0.535 9 0.1 0.539 8 0.543 8 0.547 8 0.551 7 0.555 7 0.559 6 0.563 6 0.567 5 0.571 4 0.575 3 0.2 0.579 3 0.583 2 0.587 1 0.591 0 0.594 8 0.598 7 0.602 6 0.606 4 0.610 3 0.614 1 0.3 0.617 9 0.621 7 0.625 5 0.629 3 0.633 1 0.636 8 0.640 4 0.644 3 0.648 0 0.651 7 0.4 0.655 4 0.659 1 0.662 8 0.666 4 0.670 0 0.673 6 0.677 2 0.680 8 0.684 4 0.687 9 0.5 0.691 5 0.695 0 0.698 5 0.701 9 0.705 4 0.708 8 0.712 3 0.715 7 0.719 0 0.722 4 0.6 0.725 7 0.729 1 0.732 4 0.735 7 0.738 9 0.742 2 0.745 4 0.748 6 0.751 7 0.754 9 0.7 0.758 0 0.761 1 0.764 2 0.767 3 0.770 3 0.773 4 0.776 4 0.779 4 0.782 3 0.785 2 0.8 0.788 1 0.791 0 0.793 9 0.796 7 0.799 5 0.802 3 0.805 1 0.807 8 0.810 6 0.813 3 0.9 0.815 9 0.818 6 0.821 2 0.823 8 0.826 4 0.828 9 0.835 5 0.834 0 0.836 5 0.838 9 1 0.841 3 0.843 8 0.846 1 0.848 5 0.850 8 0.853 1 0.855 4 0.857 7 0.859 9 0.86 2 1 1.1 0.864 3 0.866 5 0.868 6 0.870 8 0.872 9 0.87 4 9 0.877 0 0.879 0 0.881 0 0.883 0 1.2 0.884 9 0.886 9 0.888 8 0.890 7 0.892 5 0.894 4 0.89 6 2 0.898 0 0.899 7 0.901 5 1.3 0.903 2 0.904 9 0.906 6 0.90 8 2 0.90 9 9 0.911 5 0.913 1 0.914 7 0.916 2 0.917 7 1.4 0.919 2 0.920 7 0.922 2 0.923 6 0.925 1 0.926 5 0.927 9 0.929 2 0.930 6 0.931 9 1.5 0.933 2 0.934 5 0.935 7 0.937 0 0.938 2 0.939 4 0.940 6 0.941 8 0.943 0 0.944 1 1.6 0.945 2 0.946 3 0.947 4 0.948 4 0.949 5 0.950 5 0.951 5 0.952 5 0.953 5 0.953 5 1.7 0.955 4 0.956 4 0.957 3 0.958 2 0.959 1 0.959 9 0.960 8 0.961 6 0.962 5 0.963 3 1.8 0.964 1 0.964 8 0.965 6 0.966 4 0.967 2 0.967 8 0.968 6 0.969 3 0.970 0 0.970 6 1.9 0.971 3 0.971 9 0.972 6 0.973 2 0.973 8 0.974 4 0.975 0 0.975 6 0.976 2 0.976 7 2 0.977 2 0.977 8 0.978 3 0.978 8 0.979 3 0.979 8 0.980 3 0.980 8 0.981 2 0.981 7 2.1 0.982 1 0.982 6 0.983 0 0.983 4 0.983 8 0.984 2 0.984 6 0.98 5 0 0.985 4 0.985 7 2.2 0.98 6 1 0.986 4 0.986 8 0.98 7 1 0.987 4 0.987 8 0.988 1 0.988 4 0.988 7 0.98 9 0 2.3 0.989 3 0.989 6 0.989 8 0.990 1 0.990 4 0.990 6 0.990 9 0.991 1 0.991 3 0.991 6 2.4 0.991 8 0.992 0 0.992 2 0.992 5 0.992 7 0.992 9 0.993 1 0.993 2 0.993 4 0.993 6 2.5 0.993 8 0.994 0 0.994 1 0.994 3 0.994 5 0.994 6 0.994 8 0.994 9 0.995 1 0.995 2 2.6 0.995 3 0.995 5 0.995 6 0.995 7 0.995 9 0.996 0 0.996 1 0.996 2 0.996 3 0.996 4 2.7 0.996 5 0.996 6 0.996 7 0.996 8 0.996 9 0.997 0 0.997 1 0.997 2 0.997 3 0.997 4 2.8 0.997 4 0.997 5 0.997 6 0.997 7 0.997 7 0.997 8 0.997 9 0.997 9 0.998 0 0.998 1 2.9 0.998 1 0.998 2 0.998 2 0.998 3 0.998 4 0.998 4 0.998 5 0.998 5 0.998 6 0.998 6 x 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 3 0.998 7 0.999 0 0.999 3 0.999 5 0.999 7 0.999 8 0.999 8 0.999 9 0.999 9 1.000 0

标准正态分布表

标准正态分布表 就力二「冷=亡P(X

正态分布概率表 0( u ) t F(t)t F(0t F( t)t F(t) 0+00O.COOO0,230.181 90,460.354 50.690.509 8 0.010.008 00.24o, m70.470,361 60J00.516 1 0+020.016 00,250,197 40,480.368 80+710,522 3 0+030023 90 260.205 10,490.375 91720.528 5 0.04 C.031 90.270.212 80.500.382 90.730.534 6 0.050+039 90.280.220 50.510.389 90.740.540 7 0.060.047 80 290. 22S 20.520.396 90.750.546 7 0,070,055 S0. 300.235 80.530.403 90.760.552 7 0.0S0.063 8(1. 310.243 40.540.410 80.770.558 7 0 + 090.071 7C,320.251 00&0.417 70+780.564 6 (k 1U0079 7(J. 330.258 60.560.424 50+790.570 5 0.11O.fi87 6 C. 340.266 10.570.431 3o.so0, 57 6 3 4 120.09 5 50 350.273 70,5S0,43S 1 0.S10.582 1 A130.103 1 C. 360.281 20.590.444 80,820.587 8 0.140,111 30. 370.288 60.600.451 50.S30.593 5 0+150.119 20.380,29 6 10.610.458 1 (U40*599 1 0.160,12 7 ] 0.390, 303 50.620.464 70.350,604 7 0.170 135 0G.400310 80.630.471 30, R60.6102 0.180J42 S0.410.31 8 20.640.477 S0+870,15 7 0.190.150 70 420325 50.650.484 30+880.621 1 0.200.158 50.430. 332 80.660.490 70.890 . 62 6 5 0,210J66 3C,440.340 10.670.497 1 0.900.631 9 A 220.174 ] 0.45(L 347 30.680.503 50.910.637 2

标准正态分布查询表

附表1. 标准正态分布表 x0.000.010.02 0.0 3 0.0 4 0.0 5 0.0 6 0.0 7 0.0 8 0.0 9 0 .0 0 .1 0 .2 0 .3 0 .4 0 .5 0 .6 0 .7 0 .8 0 .9 1 .0 1 0.5 00 0 0.5 39 8 0.5 79 3 0.6 17 9 0.6 55 4 0.6 91 5 0.7 25 7 0.7 58 0 0.7 88 1 0.8 15 9 0.8 41 3 0.8 0.5 04 0 0.5 43 8 0.5 83 2 0.6 21 7 0.6 59 1 0.6 95 0 0.7 29 1 0.7 61 1 0.7 91 0 0.8 18 6 0.8 43 8 0.8 0.5 08 0 0.5 47 8 0.5 87 1 0.6 25 5 0.6 62 8 0.6 98 5 0.7 32 4 0.7 64 2 0.7 93 9 0.8 21 2 0.8 46 1 0.8 0.5 12 0 0.5 51 7 0.5 91 0 0.6 29 3 0.6 66 4 0.7 01 9 0.7 35 7 0.7 67 3 0.7 96 7 0.8 23 8 0.8 48 5 0.8 0.5 16 0 0.5 55 7 0.5 94 8 0.6 33 1 0.6 70 0 0.7 05 4 0.7 38 9 0.7 70 3 0.7 99 5 0.8 26 4 0.8 50 8 0.8 0.5 19 9 0.5 59 6 0.5 98 7 0.6 36 8 0.6 73 6 0.7 08 8 0.7 42 2 0.7 73 4 0.8 02 3 0.8 28 9 0.8 53 1 0.8 0.5 23 9 0.5 63 6 0.6 02 6 0.6 40 4 0.6 77 2 0.7 12 3 0.7 45 4 0.7 76 4 0.8 05 1 0.8 35 5 0.8 55 4 0.8 0.5 27 9 0.5 67 5 0.6 06 4 0.6 44 3 0.6 80 8 0.7 15 7 0.7 48 6 0.7 79 4 0.8 07 8 0.8 34 0 0.8 57 7 0.8 0.5 31 9 0.5 71 4 0.6 10 3 0.6 48 0 0.6 84 4 0.7 19 0 0.7 51 7 0.7 82 3 0.8 10 6 0.8 36 5 0.8 59 9 0.8 0.5 35 9 0.5 75 3 0.6 14 1 0.6 51 7 0.6 87 9 0.7 22 4 0.7 54 9 0.7 85 2 0.8 13 3 0.8 38 9 0.8 62 1 0.8

标准正态分布表

标准正态分布表 标准正态分布表怎么看 将未知量Z对应的列上的数与行所对应的数字结合查表定位 例如要查Z=1.96的标准正态分布表 首先在Z下面对应的数找到1.9 然后在Z右边的行中找到6 这两个数所对应的值为0.9750 即为所查的值 有谁知道,为什么标准正态分布表x的右边和下边都有值啊,难道一个x可以有两个值,看表是怎么看啊 那是一个精度问题,例如当x=0.12,那么应该先在x下方找到0.1,再在右边找到0.02,那么这两个同时对应的那个数就应该是你所要的! 标准正态分布的x值算出来介于两个之间,取哪一个。概论值如果介于两个间,取更大的还是更近的啊 精度要求不是很高的话,在正中取中间值,靠一边取更近的,四舍五入。 精度要求高的话用插值函数,比如在两点间作一次函数逼近。 为什么u0.025等于1.96?标准正态分布表查不到这个结果啊。u0.05是多少?u0.1是多少? 因为P{Z<1.96}=1-0.025=0.975 u0.05=1.645 因为P{Z<1.645}=1-0.05 u0.1类似 统计学中,标准正态分布表中Z值代表意义 Z值只是一个临界值,他是标准化的结果,本身没有意义,有意义的在于在标准正态分布模型中它代表的概率值。通过查表便可以知道。 标准正态分布 期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。 标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。 标准正态分布的密度函数为:

标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。

标准正态分布查询表

附表1. 标准正态分布表 令狐采学 x0.000.010.020.030.040.050.060.070.080.09 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 0.500 0 0.539 8 0.579 3 0.617 9 0.655 4 0.691 5 0.725 7 0.758 0 0.788 1 0.815 9 0.841 3 0.864 3 0.884 9 0.903 2 0.919 2 0.933 2 0.945 2 0.955 4 0.964 1 0.971 3 0.977 2 0.982 1 0.986 1 0.989 3 0.991 8 0.993 8 0.995 3 0.996 5 0.997 4 0.998 1 0.504 0 0.543 8 0.583 2 0.621 7 0.659 1 0.695 0 0.729 1 0.761 1 0.791 0 0.818 6 0.843 8 0.866 5 0.886 9 0.904 9 0.920 7 0.934 5 0.946 3 0.956 4 0.964 8 0.971 9 0.977 8 0.982 6 0.986 4 0.989 6 0.992 0 0.994 0 0.995 5 0.996 6 0.997 5 0.998 2 0.508 0 0.547 8 0.587 1 0.625 5 0.662 8 0.698 5 0.732 4 0.764 2 0.793 9 0.821 2 0.846 1 0.868 6 0.888 8 0.906 6 0.922 2 0.935 7 0.947 4 0.957 3 0.965 6 0.972 6 0.978 3 0.983 0 0.986 8 0.989 8 0.992 2 0.994 1 0.995 6 0.996 7 0.997 6 0.998 2 0.512 0 0.551 7 0.591 0 0.629 3 0.666 4 0.701 9 0.735 7 0.767 3 0.796 7 0.823 8 0.848 5 0.870 8 0.890 7 0.908 2 0.923 6 0.937 0 0.948 4 0.958 2 0.966 4 0.973 2 0.978 8 0.983 4 0.987 1 0.990 1 0.992 5 0.994 3 0.995 7 0.996 8 0.997 7 0.998 3 0.516 0 0.555 7 0.594 8 0.633 1 0.670 0 0.705 4 0.738 9 0.770 3 0.799 5 0.826 4 0.850 8 0.872 9 0.892 5 0.909 9 0.925 1 0.938 2 0.949 5 0.959 1 0.967 2 0.973 8 0.979 3 0.983 8 0.987 4 0.990 4 0.992 7 0.994 5 0.995 9 0.996 9 0.997 7 0.998 4 0.519 9 0.559 6 0.598 7 0.636 8 0.673 6 0.708 8 0.742 2 0.773 4 0.802 3 0.828 9 0.853 1 0.874 9 0.894 4 0.911 5 0.926 5 0.939 4 0.950 5 0.959 9 0.967 8 0.974 4 0.979 8 0.984 2 0.987 8 0.990 6 0.992 9 0.994 6 0.996 0 0.997 0 0.997 8 0.998 4 0.523 9 0.563 6 0.602 6 0.640 4 0.677 2 0.712 3 0.745 4 0.776 4 0.805 1 0.835 5 0.855 4 0.877 0 0.896 2 0.913 1 0.927 9 0.940 6 0.951 5 0.960 8 0.968 6 0.975 0 0.980 3 0.984 6 0.988 1 0.990 9 0.993 1 0.994 8 0.996 1 0.997 1 0.997 9 0.998 5 0.527 9 0.567 5 0.606 4 0.644 3 0.680 8 0.715 7 0.748 6 0.779 4 0.807 8 0.834 0 0.857 7 0.879 0 0.898 0 0.914 7 0.929 2 0.941 8 0.952 5 0.961 6 0.969 3 0.975 6 0.980 8 0.985 0 0.988 4 0.991 1 0.993 2 0.994 9 0.996 2 0.997 2 0.997 9 0.998 5 0.531 9 0.571 4 0.610 3 0.648 0 0.684 4 0.719 0 0.751 7 0.782 3 0.810 6 0.836 5 0.859 9 0.881 0 0.899 7 0.916 2 0.930 6 0.943 0 0.953 5 0.962 5 0.970 0 0.976 2 0.981 2 0.985 4 0.988 7 0.991 3 0.993 4 0.995 1 0.996 3 0.997 3 0.998 0 0.998 6 0.535 9 0.575 3 0.614 1 0.651 7 0.687 9 0.722 4 0.754 9 0.785 2 0.813 3 0.838 9 0.862 1 0.883 0 0.901 5 0.917 7 0.931 9 0.944 1 0.953 5 0.963 3 0.970 6 0.976 7 0.981 7 0.985 7 0.989 0 0.991 6 0.993 6 0.995 2 0.996 4 0.997 4 0.998 1 0.998 6 x0.00.10.20.30.40.50.60.70.80.9

利用Excel的NORMSDIST计算正态分布函数表

利用Excel的NORMSDIST 函数建立正态 分布表 董大钧,乔莉 理工大学应用技术学院、信息与控制分院,113122 摘要:利用Excel办公软件特有的NORMSDIST函数可以很准确方便的建立正态分布表、查找某分位数点的正态分布概率值,极大的提高了数理统计的效率。该函数可返回指定平均值和标准偏差的正态分布函数,将其引入到统计及数据分析处理过程中,代替原有的手工查找正态分布表,除具有直观、形象、易用等特点外,更增加了动态功能,极大提高了工作效率及准确性。 关键词:Excel;正态分布;函数;统计 引言 正态分布是应用最广泛的连续概率分布,生产与科学实验中很多随机变量的概率分布都 可以近似地用正态分布来描述。例如,在生产条件不变的情况下,某种产品的力、抗压强度、 口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个 量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 在科学研究及数理统计计算过程中,人们往往要通过某本概率统计教材附录中的正态分布表 去查找,非常麻烦。若手头有计算机,并安装有Excel软件,就可以利用Excel的NORMSDISTX )函数进行计算某分位数点的正态分布概率值,或建立一个正态分布表,准确又方便。 1正态分布及其应用 正态分布(normal distribution )又名高斯分布(Gaussian distribution),是一个在数学、 物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为卩、标准方差为 /的高斯分布,记为N(卩,/ )。则其概率密度函数为正态分布的期望值□决定了其位置,其标准差b决定了分布的幅度。因其曲线呈钟

相关文档