卡方分布
一、 卡方分布的定义:
若n 个相互独立的随机变量ξ1,ξ2,…,ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这n 个服从标准正态分布的随机变量的平方和∑ξi∧2构成一新的随机变量,其分布规律称为χ2(n)分布(chi-square distribution ),其中参数 n 称为自由度。
二、 卡方分布的性质::
(1) (可加性) 设i Y ~且相互独立,则,,,1,,2k i i
i n =λχ
,~2,1λχn k Y Y ++
这里.,∑∑==
i
i
n n λλ
(2) ,)(2
,λχλ+=n E n
.42)(2
,λχλ+=n Var n
证明 (1)根据定义易得。 (2)设则依定义,
,~
2
,λχn Y 可表示为Y ,2
2121n n X X X Y +++=-
其中且相互独立,于是),1,(~,1,,1),1,0(~λN X n i N X n i -=
)
2(.
)()()
1(,
)()(1
21
2∑∑====n
i i n
i i X Var Y Var X E Y E
因为
?
?
?+=+=,1,1)()()(22λi i i X E X Var X E .,
1,,1n i n i =-=
代入(1),第一条结论可得证。直接计算可得
.
36,1,,1,3244
++=-==λλn i EX n i EX 于是
,1,,1,
213)()(2
242-==-=-=n i EX EX X Var i i i
.42)()(2
242λ+=-=n n n EX EX X Var
代入(2)便证明了第二条结论。
三、 卡方分布的概率密度函数:
()???
????≥?
?? ??Γ=--,其他当00,221
21222x e x n x f x n n
x 数)。现在来推导随机变,(相互独立且都服从设随机变量10n ,....1N X X
的分布。2^.....2^2^1n X ++X =χ
()()()
2^x 2^x 2
1
^2
n ^n 21n 1n 1++-X X θ的密度函数为,
[
]()[]()
[]()[]()
()()x
x x d D X P P o z z X P P n σχ
χ2^2^2
1
-
2
n
2
n 21
2
2
n 2
121e n 21
z z z 0
z 0z ++??
=+X
==++X =≤ 时,当时,当
其中Dx 为n 维x 空间内由不等式z x x n 2
2
1+所定的区域。
即,Dz 为n 维x 空间内以坐标原点为球心、z 为半径的球面所围成的区域(边界不在内)
可以利用极坐标来计算这积分。令 ?????
????=-===-----11
112121211cos sin 2cos sin sin cos sin sin sin n n n n n n n r x r x r x r x θθ
θθθθθθθ
与这变换相应的函数行列式为:
()
()()()()()()()()()()Φ
==??-1-n 111,,,,,r r
r r
r r r r x x n n
θθ 其中括号和Φ都表示1,,1-n θθ 的函数。因此。当z>0时,
[]()
()
C P z ???
?????=?z 0dr r -1-n 2
n 22
r 21
z θπχ C 是常数。
为了定出C,在上述等式的两端令,∝+→r 得到
()
C dr r z r n n
???
?????=
?∝+--012
2
21
1θπ 从而,
()
?
∝
+--=
2122dr
r C z
n n
θ
π
在分母内的积分中令μ=22
1
r ,即,用21
2μ=r 作代换,那么,这个积分等
于??? ??Γ==?-∝+----
--∝
+??22221221201212212
10
21-n n d d n
n n n n μθμμμθ
μ
μ
因此,()
??
? ??Γ=
-22
212
2
n C n n
π
从而,当z>0时,
[
]()
?-
--??
?
??Γ=
z n n d n z x P 0 2 1 12 2 22 1 γθγ ?- --?? ? ??Γ= z n n d n 0 212 12 22 1νθνν 即,2χ的密度函数为 ()??? ??? ?≥? ?? ??Γ=--,其他当00,221 21222z e z n x f z n n z 称这个密度函数所定的分布为自由度为n 的2χ分布,记作2 )(n χ。它的图像如下: 图(一)2 χ分布密度函数图 四、卡方分布的累积分布函数为: ()()dx x f x F x k ?+∞ ∞-=2 dx e x n x n n ? ∞ +--? ? ? ??Γ=0 2 122 221 ()() () 22,2k x k x F k Γ= γ, 其中γ(k,z)为不完全Gamma 函数。其图像如下: 分布的分布函数图 图(二)2 五、卡方分布的特征函数及其推导: 特征函数:ψ(t) = f(x)dx =dx = 六、论证过程中的心得体会: 首先通过对卡方的研究和证明,提高了我们对数学的兴趣。其次,通过这次的推导和搜索资料进行分析,大大提高了我们的独立思考的能力,我们当中很多同学之前都很害怕类似的证明题,这一次的合力解决难题使我们信心倍增。当然同时,这个合作锻炼了我们团队合作的能力,分工合作解决问题,有的人负责收集资料,有点人负责推导公式,有的人负责输入文章,整理公式,等等。这让大家明白了团结的力量。做出合理的时间安排,做任何事情,合理的时间安排非常重要,多元课程设计也是一样,事先要做好一个规划,课程设计一共分5个板块(定义,性质,特征函数,密度函数,分布函数,心得体会)。你每天要做完哪几个板块事先要确定好,这样做才会使自己游刃有余,保证在2周时间内内完成论文,以避免由于时间上的不妥,以致于最后无法完成论文。 另外,写论文的过程中也使我们对论文的格式有了一个了解,更规范更具体,为以后的学业报告做了一次很好的准备。论文属于科学性的文章,它有严格 的书写格式规范,因此一篇好的论文一定 要有正确的格式,论文格式错误就不能得到好成绩,因此我们写论文时要端正态度,注意书写格式。 多元课程的设计更加是丰富了我们的业余生活,让大家聚在一起讨论题目,其乐融融。这样的课程设计也能使我们找到志同道合的朋友,发现生活中的点滴数学趣事,从实际出发思考题目,同时我们对计算机的知识也有了一定的加深,matlab 的使用等等。 学生t -分布可简称为t 分布。其推导由威廉·戈塞于1908年首先发表,当时他还在都柏林的健力士酿酒厂工作。因为不能以他本人的名义发表,所以论文使用了学生(Student )这一笔名。之后t 检验以及相关理论经由罗纳德·费雪的工作发扬光大,而正是他将此分布称为学生分布 由于在实际工作中,往往σ是未知的,常用s 作为σ的估计值,为了与u 变换区别,称为 t 变换t = x s u x ,统计量t 值的分布称为t 分布。 t 分布的分布函数及证明 用);(n x T 表示n t 分布的分布函数,则 { 00 )21,21(121)21,21(21);()2/(22)/(≤>??? ?? ?+=++x x n I n I n x T x n x x n n 证明 根据分布函数的定义有 dy n y n B dy n y t n x T n x x 2 /)1(2)1() 2 1,21(1);();(+-∞ -∞ -+?= =?? π 当0>x 时,上式为 212/)1(202/)1(20 )1()2 1,21(1)1()21,21(1);(A A dy n y n B dy n y n B n x T n x n +=+++= ∧ +-+-∞ -?? ππ 由于? ∞ ∞ -=1);(dy n y t ,故立即可得2/11=A ,为了计算2A ,我们做变换)/(2 2 y n y t +=则 dt t t dt ny y n dy 2 32 1 22)1(2 )2/()(- - -= ?+=π ,因此 dt t t t n B dy n y n B A n x n x n x 2 32 12 1 02/)1(2 02)1(2 ) 1()2 1,21(1 )1()21,21(12 2 - - +++--? -=+=??π ππ )2 1,21(21)/(22n I x n x += 故)2 1 ,21(2121);()/(2122n I A A n x T x n X ++=+= ?? ????+= +)21,21(121)/(22n I x n x 而当0≤x 时,我们有 ???-∞-=-=-=x x x dy n y t dy n y t dy n y t n x T 0 0);(21 );(21);(1);( 然后利用刚刚的讨论可知 )2 1,21(21)21,21(2121);()/()/(222n I n I n x T x n n x n x ++=-= 综上所述便得我们所要的结论。 t 分布的密度函数及证明 设z ,ζ为相互独立随机变量,ζ服从正态z N ),1,0(服从自由度为n 的2 χ—分布,则