文档库 最新最全的文档下载
当前位置:文档库 › Weibull分布的若干性质

Weibull分布的若干性质

Weibull分布的若干性质
Weibull分布的若干性质

第22卷第4期2010年12月河南工程学院学报(自然科学版)

J OURNA L O F HENAN I N ST ITUTE OF ENG I N EER I NG V o l 22,N o 4

D ec .2010

W ei bull 分布的若干性质

赵呈建,徐文青

(河南工程学院数理科学系,河南郑州451191)

摘 要:W eibu ll 分布是可靠性系统常用的分布之一,它主要应用于电子元件、设备等产品使用寿命的研究.通过对

W eibu ll 分布常用的性质进行讨论,导出了某些服从W e i bu ll 分布随机变量的函数的数字特征.

关键词:W e i bu ll 分布;极值分布;G a mm a 函数;数字特征

中图分类号:O 213.2 文献标识码:A 文章编号:1674-330X (2010)04-0071-04

收稿日期:2010-03-23

作者简介:赵呈建(1961-),男,河南郑州人,副教授,硕士,主要从事概率统计教学与研究.

在研究产品寿命以及断裂力学问题中,有很多随机变量都是服从W ei b u ll 分布的.通过对W ei b ull 分布的讨论可以对这些随机变量的取值概率进行计算和推断,从而解决工程技术的相关问题.然而,W e i b ull 分布不同于正态分布等常见分布,它是一类比较复杂的分布,在应用中具有一定的难度.要解决相关的问题,就必须计算出W eibull 分布随机变量函数的分布.本研究从W e i b u ll 分布的性质讨论出发,给出了W eibull 分布的一些常用函数的数字特征.

1 W ei bull 分布的定义与特征

1.1 W e ibull 分布的定义

定义1[1-2]

如果随机变量T 的分布函数F (t)

为:

F (t)=

0 t 0,1-e

-(

1

)m

t >0,

(1)

则称随机变量T 服从W e ibu ll 分布,其中m >0, >0,m 叫形状参数, 叫刻度参数.这是两参数的W e ibu ll 分布,常记T ~W (m, ).

W e ibu ll 分布形式类似指数分布形式,但比指数分布复杂得多.W e ibu ll 分布有三参数的分布详见参考文献[2].

由W e ibu ll 分布定义1知两参数W e ibu ll 分布的密度函数为:

f(t)= 0

t 0.m t m-1

m e -(1

)m

t >0.

(2)

1.2 W eibull 分布两个参数与密度函数图像的关系

1.2.1形状参数m

W e i b u ll 分布中形状参数m 是最重要的参数,它的值决定了密度函数曲线的形状.当m =1时,W e i b u ll 分布就是指数分布;当01时,图像有一个峰,随着m >1的增大,峰值越高,图像越窄,见图1.

图1 形状参数对密度函数的影响

F i g .1 Th e inf l uence of s hape p ara m eter on th e curve

of den sity fun cti on

1.2.2刻度参数

对于刻度参数 ,如果固定m,例如m =2,随着刻度参数 的增大,图像的峰值降低,图像变得偏

河南工程学院学报(自然科学版)

2010年

平.图2是不同的 值密度函数图像的形状

.

图2 刻度参数对密度函数曲线的影响F i g .2 Th e inf l uence of sca l e para m e ter

on the den sity cu rve

2 W ei bull 分布的性质

下面以定理形式给出关于W eibull 分布的性质并加以证明.

2.1 W e i b u ll 分布常用的性质

定理1 设X ~W (1,1),T = X 1

( >0, >0),则T ~W ( , ).

证明 X ~W (1,1),即F (x )=1-e -x

是指数分布(当m =1时W e i b u ll 分布是指数分布),因此对任何t >0有

F (t)=P (T t)=P ( X

1

t)=P [X

(1

) ]=1-e -(1 ) ,即T ~W ( , ).证毕.

定理1说明任何W e ibu ll 分布可以通过指数分布的变换得到.

定理2 设T 1,T 2, ,T n 是相互独立且同分布的,共同分布是W (m, ), =m in {T 1,T 2, ,T n },则 ~W (m, ,n

-1

m

).

证明 对任何t >0有P ( >t)=[P (T 1>t)]n

=[e -(t )n

]=

e

-(

t

)m n =e

-(

t

)m (1n -1m

)m

=exp [-(t n

-1m

)m

],

F ( )=1-P ( >t)=1-exp [-(

t n

-1

m

)m

].

(3)

这说明 服从W e i b u ll 分布,形状参数是m,刻

度参数是 n -1

m .

定理2是可靠性理论中的有名的夭折试验.定理3 设T ~W (m, ),则X =ln T 服从极值分布,其中参数

=l n , =

1

m

.(4)

证明 对任何t >0,有P (X x )=P (T e T

)=1-e -(

1

e x )m =1-

exp [-e

m (x-ln )

].证毕.

定理3说明极值分布是在W e ibu ll 分布中当 =

1

m

, =l n 时得出,这也是W e ibu ll 分布与极值分布参数间的关系,它为用极值分布研究W e i b u ll 分布打下良好的基础.

定理4 设T ~W (m, ),令Y =T

,则Y ~W (m,1).

证明 对任何t >0,有F Y (t)=P (Y t)

=P (

T

t)=

P (T t )=1-e

-(t

)m

=1-e

-(t)m

.证毕.

定理4说明研究W eibu ll 分布问题重点应放在对形状参数m 的研究上.

定理5

[3]

设T ~W (m, ),Y =

T

,对任意k =1,2, ,则

E (ln k

Y)= (k)

(1)/m k

.

其中, ( )是G a mm a 函数, (k )

( )是 ( )的k 阶

导数.

证明 由数学期望定义和定理4知E (ln k Y)=

(ln y )k d [1-exp (-y m

)],

令Z =Y m ,则有

E (ln k

Y)=

(ln z 1

m )k

d [1-exp (-z )]=

(1m

ln z )k e z dz =m -k

0(ln z )k e -z

dz .

根据G a mm a 函数 ( )在域 >0内有各阶连续导数并且可在积分号下求导的性质

[4]

,有

(k)

( )=[

0z

-1e -z

dz ]

(k )

=

(ln z )k z -1e -z

dz .

72

第4期赵呈建:W e i bull 分布的若干性质

当 =1时可得

E [l n k

Y]= (k)

(1)/m k

,

(5)结论成立.

用 (z )(z >0)记D igamm a 函数[5]

,其定义

为:

(z )=d

dz

[l n (z )], (z )=

d dz [l n (z )]= (z) (z )=li m n

{ln n -

n

k=0

1

z +k }=- -

k=0

(

1z +k -1k +1

)[5]

,

是欧拉常数.

d

n

dz

n [ (z )]=(-1)

n+1n!

k=0

1

(z +k )

n+1

[5]

.(n =1,2,3, )

由上式以及 (z )与 (z )之间的关系可求出

(k)

(z):

(1)= (1) (1)=- , (2)

(1)= 2

6

+ 2

,

(3)

(1)=-2 (3)- 2

2

- 3

,

(6)

(4)

(1)=-6 (4)+8 (3) + 4

12

+ 2 2+ 4

,

其中, (z)=

n =1

1n

z 是zeta 函数

[3]

.2.2 W eibull 分布随机变量函数的数字特征

定理6 设T ~W (m, ),Y =T ,则

(1)E [ln |Y]=- m ,D [ln |Y]=

2

6m 2;(7)(2)E [ln |T ]=ln - m D [,l n |T ]= 26m 2.(8)证明 (1)由定理5、(5)式及(6)式知E [ln |T ]=

(1)m = (1) (1)m =-

m

,D [ln |Y]=E [ln 2

Y]-[E (ln Y)]2=

(2)

(1)m 2- 2m 2= 26m 2+ 2m 2- 2m 2= 2

6m 2.

(2)由数学期望和方差的性质知T = Y ,ln T =l n +ln Y ,那么

E [l n T ]=E [ln +ln Y]=l n +E [ln Y]=ln -

m

,D [l n T ]=D [ln +ln Y]=D [ln Y]=

2

6m 2

证毕.

定理7 设T ~W (m , ),则有:(1)C ov[l n T,l n 2

T ]=m -1

[-2 (3)-13

2

+

12

m (l n ) 2].

(9)

(2)D (l n 2

T )=m

-4{

1190 4+8 (3) +23

2 2

-4(ln )m [2 (3)+13 2]}+2(ln )2m 2

2

3

}.

(10)

证明 (1)令Y =

T

,由定理5、(5)及(6)式知

C ov [ln Y ,ln 2

Y]=E [ln 3

Y]-E [l n Y]E [ln 2

Y]=m -3

(3)

(1)-m -1 (1) m -2

(2)

(1)=

m -3

[-2 (3)-13

2

].(11)

C ov[ln T,ln 2

T ]

=Cov [ln Y +ln ,ln 2

Y +

2ln ln Y +ln 2 ]=E{[ln Y +ln ] [ln 2

Y +2ln ln Y +ln 2

]}-E [ln Y +ln ].

E [ln 2

Y +2ln ln Y +ln 2

]=

E [ln 2

Y ]+3ln E [ln 2

Y ]+3ln 2

E[ln Y]+ln 3

-E [ln Y ] E [ln 2

Y ]-2ln E 2

[ln Y ]-3ln 2

E[ln Y]-ln E [ln 2

y]-ln 3 =

E [ln 3

Y ]-E [ln Y] E[ln 2Y]+2ln E[ln 2

Y]-2ln E 2

[ln Y ]=C ov [lnY,ln 2

Y]+2ln D [ln Y]=m -3

[-2 (3)-13 2+13

m ln 2

].对于(2),由定理5知

D [l n 2

Y]=E [l n 4

Y]-E 2

[ln 2

Y]=m -4

(4)

(1)-[m -2

(2)

(1)]2

=

m -4

[

1190 4+8 (3) +23

2 2

].(12)

上式最后一个等式使用了 (4)= 2

90.因此,

D[ln 2

T]=D[(ln Y +ln )2

]=

D[ln 2

Y]+4ln C ov [ln 2

Y,ln Y]+4(ln )2

D [ln Y].

由定理6、(11)、(12)和上式知(10)式成立,证毕.

73

河南工程学院学报(自然科学版)

2010年

3 结语

本文重点讨论了W e i b u ll 分布两个参数与其密度函数的关系,并对常用的性质给予了详细的推导,特别导出了某些服从W eibull 分布的随机变量函数的数字特征,为W eibull 分布的应用打下了基础.

参考文献:

[1] 茆诗松,王玲玲.可靠性统计[M ].上海:华东师范大

学出版社,1984.

[2] 陈家鼎.生存分析与可靠性[M ].北京:北京大学出版

社,2005.

[3] 叶慈南.完全样本情形下W e i bu ll 分布的参数的估计

[J].应用概率统计,2003,19(3):259-266.

[4] 格 马 菲赫金哥尔茨.数学分析原理[M ].丁寿田

译.北京:人民教育出版社,1979.

[5] 数学手册 编写组.数学手册[M ].北京:人民教育出

版社,1979.

Som e P roperties ofW eibull D istribution

ZHAO C hengji a n ,XU W enqi n g

(D e p art m ent of M athe matical and Phy sical sciences ,H enan Institute of Eng ineering,Zhengzhou 451191,Ch i n a)

Abstrac t :W e i bull d i str i bu tion is one of t he co mmon l y used d i str i bu ti ons i n syste m re liability ,and it is m a i nly used i n t he resea rch of

the life of e l ectronic co m ponents&dev i ces .Through t he discussi on of co mm on properties ofW e i bu ll d istri buti on ,the a rtic l e der i ves the nume rical character istics o f the functi ons o f random variab le fo llo w i ng certa i n W eibull d istri buti on .

K ey word s :W e i bu ll distr i bution ;ex tre m e va l ue d istri buti on ;G a mma functi on ;d i g ital features

(上接第52页)

[4] OLI V EI RA M M,B I SHOP G,MCALLI STER D.

Relief Texture M apping[C ].Proc SI G GRAP H,2000.

[5] 郝爱民,何兵,赵沁平.虚拟现实中的增强现

实技术[J].北京航空航天大学学报,2003,29(10):909-913.

[6] 芳贤勇,张佑生,张淮声.一种虚拟物体和真

实场景合成的新算法[J].小型微型计算机系统,2003,24(9):1682-1685.

[7] 涂子琰,孙济洲.增强现实技术的应用和研究

[J].计算机工程与应用,2003(10):100-103.

The D esign and R ealization of a V irtualR ealit y Syste m Based on I m age and Geom etr icM ode li n g

TAO B i n ,ZHAO Yaf e i

(Depart m ent of Co m puter Science ,H enan Instit u te o f E ng ineering,Zhengzhou 451191,China)

Abstrac t :A virtual rea lity sy stem based on i m age and geo m e tric m ode li ng has been desi gned and realized .In t he ana l ysis and compar-i

son o f t he ex isti ng v irt ua l rea lity techno logy and m ethod ,the ne w syste m comb i nes w ith i m age render i ng and m ode li ng techn-i ca l advantages ,t he rea l scene is rea li zed based on i m age render i ng o f modeli ng.V irtual ob j ect is m ode l ed usi ng geo m etry m ethod ,then construct the v irtua l reality env iron m ent comb i ning the v irt ua l ob j ec ts and the pano rama scene ry .T he v i r t ua l rea lit y syste m o f h i gh fide lity ,hi gh renderi ng speed and good i n terac ti on o f effecti ve i n teg ra tion is obta i ned .

K ey word s :v irtua l reality syste m;

i m age m ode li ng ;g eom etr i c mode li ng

74

Weibull分布

Weibull分布(韦伯分布) (2006-07-04 22:04:01) 转载 分类:学习 Weibull分布,又称韦伯分布、韦氏分布或威布尔分布,由瑞典物理学家WallodiWeibull于1939年引进,是可靠性分析及寿命检验的理论基础。 Weibull分布能被应用于很多形式,包括1参数、2参数、3参数或混合Weibull。3参数的该分布由形状、尺度(范围)和位置三个参数决定。其中形状参数是最重要的参数,决定分布密度曲线的基本形状,尺度参数起放大或缩小曲线的作用,但不影响分布的形状。 另外,通过改变形状参数可以表示不同阶段的失效情况;也可以作为许多其他分布的近似,如,可将形状参数设为合适的值近似正态、对数正态、指数等分布。形状参数通常在[1,7]间取值。

一般由W(α,β)表示2个参数的Weibull分布,其分布函数为: ,其中x>0,α、β>0。 可以看出有两个参数α、β,其中β为形状参数,α为尺度参数。若取β为1,则F(x)为指数分布。 Weibull分布的概率密度函数(pdf)为:。 Weibull双参数的PDF分布见上图。(自己做的,有点粗糙) 下面我们以其pdf图看Weibull分布各参数的作用。 下图是形状参数β对pdf的影响(α固定): 下图为尺度参数α对pdf的影响(β固定),横轴为变量x,纵轴为f(x):

另外,由于Weibull分布可以近似表示其他别的分布,eg,β=1时,F(x)为指数分布。将其用到复杂网络中,则此时对应指数网络?当β逐渐增大时,是不是对应分布极不均匀的无尺度网络?这样的话可以通过调整一个参数构造不同的网络? 而**人的层次故障节点动态模型就是因此而引入Weibull分布(1参数)的吧?这样的话,β大的网络发生层次故障的规模比较大就可以理解了。再继续深入分析。

统计学中英文对照表

统计学中英文对照表

统计学中英文对照表 2008-03-21 11:39 Absolutedeviation,绝对离差 Absolutenumber,绝对数 Absoluteresiduals,绝对残差 Accelerationarray,加速度立体阵Accelerationinanarbitrarydirection,任意方向上的加速度Accelerationnormal,法向加速度Accelerationspacedimension,加速度空间的维数Accelerationtangential,切向加速度Accelerationvector,加速度向量Acceptablehypothesis,可接受假设 Accumulation,累积 Accuracy,准确度 Actualfrequency,实际频数 Adaptiveestimator,自适应估计量 Addition,相加 Additiontheorem,加法定理 Additivity,可加性 Adjustedrate,调整率 Adjustedvalue,校正值 Admissibleerror,容许误差 Aggregation,聚集性 Alternativehypothesis,备择假设 Amonggroups,组间 Amounts,总量 Analysisofcorrelation,相关分析Analysisofcovariance,协方差分析Analysisofregression,回归分析Analysisoftimeseries,时间序列分析Analysisofvariance,方差分析Angulartransformation,角转换 ANOVA(analysisofvariance),方差分析ANOVAModels,方差分析模型 Arcing,弧/弧旋 Arcsinetransformation,反正弦变换Areaunderthecurve,曲线面积

重尾论文:重尾分布理论及在保险精算中的应用研究

重尾论文:重尾分布理论及在保险精算中的应用研究 【中文摘要】由于重尾分布能够刻画一些极端事件的损失特征,将风险模型中的索赔额约束到重尾子族,研究极端事件中保险公司的破产概率,是当前风险论研究的热点。本篇论文将重尾理论应用到风险模型中,研究索赔额随机变量属于亚指数族时,有限时间内常利力更新风险模型的破产概率渐近等价式。本文具体内容如下:第一章介绍选题的背景和本文的研究工作。第二章首先引出重尾的概念,借助一些辅助知识,系统的介绍每一子族定义及性质。重点探讨子族间的包含关系和性质,以便把重尾理论应用到以下的风险模型中。第三章以经典风险理论为起点,采用新角度从模型里的基本构造ct、S (t )推广讨论,给出各类型中具有代表性的风险模型,并根据风险模型的构造原理,介绍风险模型的研究热点。第四章假定索赔额随机变量独立同分布,其分布函数属于亚指数族,利用得到的推论,研究在常利力更新风险模型中的应用。改进以前的论证,重新证明得到有限时间内常利力更新风险模型的破产概率渐近等价式。第五章假定索赔额随机变量同分布负相依,通过推广引理,得到其分布函数属于亚指数族时的一个等价式推论。研究该等价式在改进的常利力更新风险模型中有关破产理论的应用,得到有限时间内常利力更新风险模型的破产概率渐近等价式,此结果和索赔额在独立同分布时的渐近等价式相同。第六章假定索赔额随机变量上层尾部独立。首先通过亚指数族和上层尾部独立理论的性质推广其它子族中存在的结论,然后利用该结论研究

在常利力更新风险模型中,索赔额随机变量上层尾部独立且服从亚指数分布时的破产概率,得到和独立同分布时相同的破产概率渐进等价式。最后,第七章对全文进行总结分析,并在此基础上提出几个可以依据本文内容进一步展开的研究方向。 【英文摘要】Many rare events can be modeled as heavy-tailed random variable. Scholars round home and abroad got some perfect results of the asymptotic estimate for the finite-time ruin probability, for the case that the random variables of the claimsizes are real-valued with common heavy-tailed distribution function, which has been a hot topic of the current risk theory research. In this paper, heavy-tailed theory will be applied to risk model. The precise asymptotic estimate for the finite-time ruin probability is established in the renewal risk model under constant interest force most by the assumption that the random variables of the claimsizes are subexponential distributions. Main contents of this dissertation are as follows:In chapter 1, the background and main research work of this dissertation are introduced.In chapter 2, the clear description of heavy-tailed is given, and then the definitions and propositions of heavy-tailed subclasses will be introduced systematically, supported from a few assistance lemmas. Since the full class of heavy-tailed distribution appears to be too

正态分布的性质及实际应用举例

华北水利水电学院 正态分布的性质及实际应用举例 课程名称:概率论与数理统计 专业班级:电气工程及其自动化091班 成员组成:姓名:邓旗学号: 2 姓名:王宇翔学号:1 姓名:陈涵学号:2 联系方式: 2012年5月24日

1 引言:正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在 统计学的许多方面有着重大的影响力。本文就从正态分布的实际性质应用举例等各个方面进行简单阐述并进行探讨,使同学们能够对所掌握的知识有更清楚地认识。 2 研究问题及成果: 正态分布性质; 3原则及标准正态分布; 实际应用举例说明 摘要:正态分布是最重要的一种概率分布。正态分布概念是由德国数学家与天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss率先将其应用于天文学研究,故此正态分布又称高斯分布。在许多实际问题中遇到的随机变量都服从或近似服从正态分布:在生产中,产品的质量指标,如电子管的使用寿命,电容器的电容量,零件的尺寸。铁水含磷量,纺织品的纤度和强度等一般都服从正态分布。在测量中,如大地测量,天平称量物体,化学分析某物之中某元素的含量等,测量结果一般服从正态分布。在生物学中,同一群体的某种特性指标,如某地同龄儿童的身高,体重,肺活量,在一定条件下生长的农作物的产量等一般服从正态分布。在气象学中,某地每年7月份的平均气温,平均温度以及降水量等一般也服从正态分布。总之。正态分布广泛存在于自然现象,社会现象以及生产,科学技术的各个领域中。本文就从正态分布的实际性质应用举例等各个方面进行简单阐述并进行探讨,使同学们能够对所掌握的知识有更清楚地认识。 关键词:正态分布 The nature of the normal distribution and the example of practical application

统计学中英文对照表

统计学中英文对照表 2008-03-21 11:39 Absolutedeviation,绝对离差 Absolutenumber,绝对数 Absoluteresiduals,绝对残差 Accelerationarray,加速度立体阵Accelerationinanarbitrarydirection,任意方向上的加速度Accelerationnormal,法向加速度Accelerationspacedimension,加速度空间的维数Accelerationtangential,切向加速度Accelerationvector,加速度向量 Acceptablehypothesis,可接受假设 Accumulation,累积 Accuracy,准确度 Actualfrequency,实际频数 Adaptiveestimator,自适应估计量 Addition,相加 Additiontheorem,加法定理 Additivity,可加性 Adjustedrate,调整率 Adjustedvalue,校正值 Admissibleerror,容许误差 Aggregation,聚集性 Alternativehypothesis,备择假设 Amonggroups,组间 Amounts,总量 Analysisofcorrelation,相关分析 Analysisofcovariance,协方差分析Analysisofregression,回归分析 Analysisoftimeseries,时间序列分析Analysisofvariance,方差分析 Angulartransformation,角转换 ANOVA(analysisofvariance),方差分析 ANOVAModels,方差分析模型 Arcing,弧/弧旋 Arcsinetransformation,反正弦变换

基于极值理论的重尾分布的尾部参数估计及理论推导

哈尔滨工业大学理学硕士学位论文 Abstract In light of the increasing number of events which result in catastrophic loss and occur with extremely small probability, we are increasingly concerned about the way to deal with these events. If we are able to accurately predict these extreme events, we can make the appropriate preparations before they happen. This requires accurate estimation of model parameters. At present, the generalized Pareto distribution is commonly used to model the extreme value data. The value of the extreme value index of the distribution can be used to measure the possibility which the extreme events happen. Before the extreme value index is estimated an appropriate threshold has to be selected. By combining the selected threshold with the parameter estimation method, the extreme value index of the generalized Pareto distribution can be estimated. This thesis discusses the method of threshold selection and the method of extreme value index estimation for the generalized Pareto distribution. An unconditional threshold selection method is proposed for the generalized Pareto distribution. This thesis use the mean excess plot as a preliminary analysis for possible candidates of the threshold. Note that the mean excess plot can not choose a unique threshold. Using the distribution function of the GP distribution, the likelihood ratio statistic and score statistic are calculated, and the two statistics are respectively analysed with the mean excess plot to select the appropriate threshold. The mean excess plot can be used to find out a possible range of the threshold candidates. Based on the maximum value of the likelihood ratio statistic and the score statistic in this range, the appropriate threshold value can be selected. The method of selecting the threshold not only overcomes the shortcomings of the mean excess plot, but also increases the accuracy of threshold selection. In parameter estimation, the MLE method is used to estimate the parameters of the generalized Pareto distribution. The maximum likelihood method is based on the principle of maximum likelihood which maximize the log-likelihood function defined by logarithm of the joint probability density function of the generalized Pareto distribution. When the maximum value of the log-likelihood function is reached, the value of the extreme value index is the estimated extreme value index. By maximizing

正态分布的概念

1. 正态分布的概念 随机变量X 的概率密度2()2(),()x f x x μσ--=-∞<<+∞, 称X 服从正态分布, 记作),(~2σμN X 。 标准正态分布(0,1)N ,其概率密度22 (),()x x x ?- =-∞<<+∞,分布函数 为 2 2 ()t x x e dt φ- -∞ = 。 2. 设 ) ,(~2σμN X , 则 {}x P X x μφσ-?? ≤= ? ?? , {}b a P a X b μμφφσσ--???? <≤=- ? ????? ,()x φ的数值有表可查,特别有 (0)0.5,()1,()1()x x φφφφ=+∞=-=-。 3. 设),(~2σμN X ,则2(),()E X D X μσ==。 4. 设),(~2σμN X ,则),(~22σμb b a N bX a Y ++=)0(≠b 。 若),(~211σμN X ,),(~2 22σμN Y ,X 与Y 相互独立,则 ),(~2 22121σσμμ+++N Y X 。 若12,,,n X X X 相互独立,),,2,1)(,(~2n i N X i i i =σμ,则 ∑∑∑===n i n i n i i i i n i i i c c c c c N X c 1 1 21221 )(,(~为常数) ,,, σμ 5. 二维随机变量(,)X Y 服从二维正态分布,记作 ),,,,(),(γσσμμ222121~N Y X ,其中12(),() E X E Y μμ==, 2212(),()D X D Y σσ==,(,)r R X Y =。 设(,)X Y 服从二维正态分布,则X 与Y 相互独立的充分必要条件是0r =。 6. 当n 充分大时,独立同分布的随机变量12,,,n X X X 的和1n i i X =∑近似服从正态 分布2(,)N n n μσ。 特别是当n 充分大时,若相互独立的随机变量12,,,n X X X 都服从“0-1”分

非参数统计讲义(2010版)

第一章 绪 论 第一章主要是通过与所学的参数统计的比较来介绍非参数统计的概念、背景、理论与应用的价值,目的是激发学生学习本课程的兴趣。为更好地掌握本课程的内容,本章将介绍和回忆所需的基本概念、基本公式和方法。 本章主要内容: 1.非参数方法介绍 2.预备知识 第一节 非参数方法介绍 一. 非参数方法的概念和实例 我们从接触数理统计开始,一直学习的都是参数统计,比如参数估计,总体 为正态时的假设检验等等。首先回忆什么是参数方法? 定义:设总体X 的分布函数的形式是已知的,而未知的仅仅是分布函数具体的参数值,用样本对这些未知参数进行估计或进行某种形式的假设检验,这类推断方法称为参数方法。 先来看两个实例。 例1.1 供应商供应的产品是否合格? 某工厂产品的零件由某个供应商供应。合格零件标准长度为(8.5±0.1)cm 。这也就是说合格零件长度的中心位置为8.5cm ,允许误差界为0.1cm ,即长度在 8.4-8.6cm 之间的零件是合格的。为评估近年来供应的零件是否合格,随机抽查了n=100个零件,它们的长度数据X 见第一章附表1.1。 解答: 根据我们已学过的参数统计的方法,如何根据数据来判断这批零件合格否? 用参数数据分析方法,在参数统计中,运用得最多的是正态分布,所以考虑假设供应商供应的零件长度X 服从正态分布,即 X ~),(2σμN 其中两个参数均未知,但可用样本均值估计μ,样本方差估计2σ。 由已知的数据计算可得:零件的平均长度,即样本均值为x =8.4958cm ,样本标准差为s=0.1047cm 。 则零件合格的可能性近似等于 )/)4.8(()/)6.8(()6.84.8(σμσμ-Φ--Φ=≤≤X P )1047.0/)4958.84.8(()1047.0/)9458.86.8((-Φ--Φ≈ %66≈ 这个说明:约有三分之一的零件不合格,该工厂需要换另一个供销商了。 但这个结论与实际数据符不符合呢?这是我们要思考的问题。 我们可以对数据做一个描述性分析,先对这100个样本数据做一个频率分布。 观察到:在这100个零件中有91个零件的长度在8.4cm ~8.6cm 之间,所以零件合格的比例为91%,超过66%很多!

箱图的简介

箱图的简介 箱线图百科名片箱线图(Boxplot)也称箱须图(Box-whiskerPlot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。 目录简介绘制步骤功能应用举例简介箱线图Boxplot(又称盒形图、箱图、盒子图) 简单箱线图图形简单箱线图由五部分组成,分别是最小值、中位数、最大值和两个四分位数。 目录1箱线图概述2箱线图的绘制步骤3箱线图的功能4箱线图应用举例绘制步骤1、画数轴,度量单位大小和数据批的单位一致,起点比最小值稍小,长度比该数据批的全距稍长。 2、画一个矩形盒,两端边的位置分别对应数据批的上下四分位数(Q1和Q3)。在矩形盒内部中位数(Xm)位置画一条线段为中位线。 3、在Q3+1.5IQR(四分位距)和Q1-1.5IQR处画两条与中位线一样的线段,这两条线段为异常值截断点,称其为内限;在F+3IQR和F-3IQR处画两条线段,称其为外限。处于内限以外位置的点表示的数据都是异常值,其中在内限与外限之间的异常值为温和的异常值(mildoutliers),在外限以外的为极端的异常值extremeoutliers。 4、从矩形盒两端边向外各画一条线段直到不是异常值的最远点,表示该批数据正常值的分布区间。 5、用“〇”标出温和的异常值,用“*”标出极端的异常值。相同值的数据点并列标出在同一数据线位置上,不同值的数据点标在不同数据线位置上。至此一批数据的箱线图便绘出了。统计软件绘制的箱线图一般没有标出内限和外限。功能箱线图作为描述统计的工具之一,其功能有独特之处,主要有以下几点: 1.直观明了地识别数据批中的异常值一批数据中的异常值值得关注,忽视异常值的存在是十分危险的,不加剔除地把异常值包括进数据的计算分析过程中,对结果会带来不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。箱线图为我们提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR的值。虽然这种标准有点任意性,但它来源于经验判断,经验表明它在处理需要特别注意的数据方面表现不错。这与识别异常值的经典方法有些不同。众所周知,基于正态分布的3σ法则或z分数方法是以假定数据服从正态分布为前提的,但实际数据往往并不严格服从正态分布。它们判断异常值的标准是以计算数据批的均值和标准差为基础的,而均值和标准差的耐抗性极小,异常值本身会对它们产生较大影响,这样产生的异常值个数不会多于总数0.7。显然,应用这种方法于非正态分布数据中判断异常值,其有效性是有限的。箱线图的绘制依靠实际数据,不需要事先假定数据服从特定的分布形式,没有对数据作任何限制性要求,它只是真实直观地表现数据形状的本来面貌;另一方面,箱线图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响,箱线图识别异常值的结果比较客观。由此可见,箱线图在识别异常值方面有一定的优越性。 2.利用箱线图判断数据批的偏态和尾重比较标准正态分布、不同自由度的t 分布和非对称分布数据的箱线图的特征,可以发现:对于标准正态分布的大样本,

浅谈正态分布的重要性质1

浅谈正态分布的重要性质 摘 要:正态分布是概率论中最常见、最重要的一个分布,原因有三:一、许多实际问题中的变量都服从或者近似服从正态分布;二、正态分布的密度函数和分布函数具有各种优良性质;三、一些重要分布的极限分布为正态分布。四、一般正态变量都可以变换为标准正态变量,而人们制定了标准正态变量的分布函数值以供查询,这给有关正态分布的计算问题带来了极大的方便。本文就正态分布的这些特点做简要归纳。 关键词:正态分布;正态变量;性质 以下首先介绍正态分布的定义,接着介绍正态变量的数字特征、曲线性质、 取值范围,然后说明一般正态变量与标准正态变量的关系以及多个正态变量的和分布。最后介绍正态分布与其他分布的关系。 1正态分布的定义 如果一个连续型随机变量ξ的密度函数为 2 22)(21)(σμσ π--= x e x f , 其中,(0)μσσ>为常数,那么就称ξ服从正态分布,记作),(~2σμξN .正态分布也叫高斯(Gauss )分布。 2实际问题中的正态变量 在实际问题中,气象学中的温度、湿度、降雨量,有机体的长度、重量,实验中的测量误差、热力学中理想气体分子的速度、经济学中的众多度量等都服从或者近似服从正态分布. 3 正态变量的重要性质 3.1数学期望和方差 若正态变量),(~2σμξN ,则2,σξμξ==D E .即正态变量的两个参数正是它的期望和方差。 证明 有

dx e x E x ?∞ +∞ --- ? =2 22)(21σμσ πξ 令 σμ -= x z ,则 dz e z E z 2 2)(21 - ∞ +∞ -?+= μσπ ξ = dz e dz ze z z ? ? ∞ +∞ --∞ +∞ --+ 2 2 2222π μπ σ =μ ξD =2)(ξξE E -= dx e x x 2 22)(2 21)(σμσ πμ-- ∞ +∞ -? - 令 σ μ -=x y ,则有 ξD = ?∞ +∞ -- dy e y y 2 22 2 2π σ ?∞ +∞ -- -= )(22 2 2 y e yd π σ = ??? ?????+∞-∞+-?∞+∞---dy e ye y y 222 222π σ = ?∞+∞ -- dy e y 2 2 2 2π σ =2σ 3.2图形性质 正态分布的密度曲线图形呈钟形,关于μ=x 对称,在μ=x 时取最大值 σ π21.当μ不变时,σ越大,图形越平、越宽,在μ点附近取值的概率越小;σ 越小,图形越尖、越窄,在μ点附近取值的概率越大。当σ不变时,μ变大,图形往右移,μ变小,图形往左移.直观地说,正态变量在μ点附近取值概率最大,在远离μ点处取值概率很小。 3.3 ”“σ3法则 若),(~2σμξN ,则有

正态分布讲解(含标准表)

2.4正态分布 复习引入: 总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线. 总体密度曲线 b 单位 O 频率/组距 a 它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积. 观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示: 2 2 () 2 , 1 (),(,) 2 x x e x μ σ μσ ? πσ - - =∈-∞+∞ 式中的实数μ、)0 (> σ σ是参数,分别表示总体的平均数与标准差,, ()x μσ ? 的图象为正态分布密度曲线,简称正态曲线. 讲解新课:

一般地,如果对于任何实数a b <,随机变量X 满足 ,()()b a P a X B x dx μσ?<≤=?, 则称 X 的分布为正态分布(normal distribution ) .正态分布完全由参数μ和σ确定,因此正态分布常记作),(2 σ μN .如果随机变量 X 服从正态分布,则记为X ~),(2σμN . 经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.例如,高尔顿板试验中,小球在下落过程中要与众多小木块发生碰撞,每次碰撞的结果使得小球随机地向左或向右下落,因此小球第1次与高尔顿板底部接触时的坐标 X 是众多随机碰撞的结果,所以它近似服从正态分布.在现实生活中,很多随机变量都服从或近似地服从正态分布.例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.因此,正态分布广泛存在于自然现象、生产和生活实际之中.正态分布在概率和统计中占有重要的地位. 说明:1参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值去佑计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计. 2.早在 1733 年,法国数学家棣莫弗就用n !的近似公式得到了正态分布.之后,德国数学家高斯在研究测量误差时从另一个角度导出了它,并研究了它的性质,因此,人们也称正态分布为高斯分布. 2.正态分布),(2 σ μN )是由均值μ和标准差σ唯一决定的分布 通过固定其中一个值,讨论均值与标准差对于正态曲线的影响

weibull分布资料

ZZ】关于Weibull分布(2008-11-05 15:01:16) 标签:杂谈分类:ImageProcessing 以下是从文献上看到的: 以下是https://www.wendangku.net/doc/b516721385.html,/s/blog_54c7e90e010005og.html Weibull分布,又称韦伯分布、韦氏分布或威布尔分布,由瑞典物理学家Wallodi Weibull 于1939年引进,是可靠性分析及寿命检验的理论基础。

Weibull分布能被应用于很多形式,包括1参数、2参数、3参数或混合Weibull。3参数的该分布由形状、尺度(范围)和位置三个参数决定。其中形状参数是最重要的参数,决定分布密度曲线的基本形状,尺度参数起放大或缩小曲线的作用,但不影响分布的形状。 另外,通过改变形状参数可以表示不同阶段的失效情况;也可以作为许多其他分布的近似,如,可将形状参数设为合适的值近似正态、对数正态、指数等分布。形状参数通常在[1,7]间取值。 一般由W(α,β)表示2个参数的Weibull分布,其分布函数为:,其中x>0,α、β>0。 可以看出有两个参数α、β,其中β为形状参数,α为尺度参数。若取β为1,则F(x)为指数分布。 Weibull分布的概率密度函数(pdf)为:。 Weibull双参数的PDF分布见上图。(自己做的,有点粗糙) 下面我们以其pdf图看Weibull分布各参数的作用。 下图是形状参数β对pdf的影响(α固定): 下图为尺度参数α对pdf的影响(β固定),横轴为变量x,纵轴为f(x): 另外,由于Weibull分布可以近似表示其他别的分布,eg,β=1时,F(x)为指数分布。将其用到复杂网络中,则此时对应指数网络?当β逐渐增大时,是不是对应分布极不均匀的无尺度网络?这样的话可以通过调整一个参数构造不同的网络? 而**人的层次故障节点动态模型就是因此而引入Weibull分布(1参数)的吧?这样的话,β大的网络发生层次故障的规模比较大就可以理解了。再继续深入分析。 Weibull分布(韦伯分布)(2006-07-04 22:04:01) 分类:学习

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ 分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条件: αχχαχα==>? +∞ ) (2 22 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

正态分布——概念、特征、广泛应用

正态分布——概念、特征、广泛应用 一、概念 指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布。 正态分布的由来 正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss(Carl Friedrich Gauss,1777—1855)率先将其应用于天文学家研究,故正态分布又叫高斯分布。 高斯这项工作对后世的影响极大,他使正态分布同时有了“高斯分布”的名称,后世之所以多将最小二乘法的发明权归之于他,也是出于这一工作。高斯是一个伟大的数学家,重要的贡献不胜枚举。 在高斯刚作出这个发现之初,也许人们还只能从其理论的简化上来评价其优越性,其全部影响还不能充分看出来。但随着各种理论的深入研究,高斯理论的卓越贡献日显重要。 1.正态分布的重要性 正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不太大,则这个指标服从正态分布。

2.正态曲线及其性质 3.标准正态曲线 标准正态曲线N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在任一区间(a,b)内取值概率。 4.一般正态分布与标准正态分布的转化 由于一般的正态总体其图像不一定关于y轴对称,对于任一正态总体,其取值小于x的概率。只要会用它求正态总体在某个特定区间的概率即可。5.“小概率事件”和假设检验的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。 二、正态分布的特征 均数处最高

分布的可加性与正态分布的性质--matlab

第三次试验报告 试验六:分布的可加性 poison分布可加性 分析:由最后一图可知:P(10)与P(5)的人数总和与P(15)的人数和几乎一致,泊松分布具有可加性。 二项分布可加性 分析:由最后一图可知:B(3,0.6)与B(2,0.6)的人数总和与B(5,0.6)的人数和几乎一致,二项分布具有可加性。

分析:由最后一图可知:N(10,2)与N(30,4)的人数总和与N(40,6)的人数和几乎一致,正态分布具有可加性。 实验七:期中考试成绩分析 数据省略列举。 代码: n1=length(x) %x y 长度 n2=length(y) Ex=sum(x)/n1 % x y 期望 Ey=sum(y)/n2 Dx=sum((x(1,:)-Ex).^2)/n1 %X Y 方差 Dy=sum((y(1,:)-Ey).^2)/n2 Dxx=sqrt(Dx) % x y 标准差 Dyy=sqrt(Dy) cov=sum((x-Ex).*(y-Ey))/n1 %cov(x, y) 结果 n1 = 65 n2 = 65 Ex = 64.7231 Ey = 81.8154 Dx = 428.323 Dy = 162.9813 Dxx = 20.6960 Dyy = 12.7664 cov = 259.8258 分析:1、期望来看本班 较低; 2、方差来看,本班较大, 成绩比较分散; 3、cov(x, y)不懂正态分布可加性

成绩评价:总的来说本次成绩是不理想的。 1、基础知识不牢固,虽然当时知道但却错了填空题; 2、思维过于复杂,将计算题第一题想太多了; 3、得复习高数积分求导的公式,不得再弄错了; 4、看题得仔细,不能把离散分布变量与连续分布变量弄混了 学习及复习计划: 1、绝对不能缺课,上课要仔细听讲; 2、作业不能对照例题来做,要先看例题,在独立完成作业; 3、多与老师同学沟通,了解最新信息。 期末成绩期望:力争达到90分及其以上 实验八:正态分布的质 N(mu, sigma^2) I)f(x)关于x=mu对称; II)f(x)在x=mu处有最大值f(x)=1/sqrt(2*pi*sigma); III)二维正态分布的边缘分布还是正态分布; IV)二维正态分布中,X与Y相互独立的充要条件为p=0; V)当X~N(mu, sigma^2)时,Y=kX+c~N(k*mu+c, (k*sigma)^2); VI)正态分布具有可加性;

相关文档
相关文档 最新文档