注: 相关系数XY ρ刻画了随机变量Y 与X 之间的“线性相关”程度. ||XY ρ的值越接近1, Y 与X 的线性相关程度越高; ||XY ρ的值越近于0, Y 与Y 的线性相关程度越弱.
当1||=XY ρ时, Y 与X 的变化可完全由X 的线性函数给出. 当0=XY ρ时, Y 与X 之间不是线性关系.
4. 设,)]([2b aX Y E e +-=称为用b aX +来近似Y 的均方误差,则有下列结论. 设,0)(,0)(>>Y D X D 则)()(,)
()
,cov(000X E a Y E b X D Y X a -==
使均方误差达到最小.
注: 我们可用均方误差e 来衡量以b aX +近似表示Y 的好坏程度, e 值越小表示b aX +与
Y 的近似程度越好.且知最佳的线性近似为.0b X a +而其余均方误差)1)((2
XY
Y D e ρ-=. 从这个侧面也能说明. ||XY ρ越接近1, e 越小.反之, ||XY ρ越近于0, e 就越大.Y 与X 的线性相关
性越小.
四、矩的概念
定义 设X 和Y 为随机变量, l k ,为正整数, 称
)(k X E 为k 阶原点矩(简称k 阶矩阵); ))](([k X E X E - 为k 阶中心矩; )|(|k X E 为k 阶绝对原点矩; )|)((|k X E X E - 为k 阶绝对中心矩;
)(l k Y X E 为X 和Y 的l k +阶混合矩;
})]([)]({[l k Y E Y X E X E -- 为X 和Y 的l k +阶混合中心矩;
注: 由定义可见:
(1) X 的数学期望)(X E 是X 的一阶原点矩; (2) X 的方差)(X D 是X 的二阶中心矩;
(3)协方差),(Y X Cov 是X 和Y 的二阶混合中心矩.
五、协方差矩阵
将二维随机变量),(21X X 的四个二阶中心矩
)]}.
()][({[)]},()][({[},)]({[},)]({[1122212211122222221111X E X X E X E c X E X X E X E c X E X E c X E X E c --=--=-=-=
排成矩阵的形式: ???
?
??22211211c c c c (对称矩阵),称此矩阵为),(21X X 的协方差矩阵. 类似定义n 维随机变量),,,(21n X X X 的协方差矩阵.
若n j i X E X X E X E X X Cov c j j i i j i ij ,,2,1,)]}()][({[),( =--==都存在, 则称
??
?
?
?
?
?
??=nn n n n n c c c
c c c
c c c C 2
1222
21112
11
为),,,(21n X X X 的协方差矩阵.
六、n 维正态分布的概率密度
七、n 维正态分布的几个重要性质
例题选讲:
协方差的性质
例1 (E01) 已知离散型随机向量),(Y X 的概率分布为
求),cov(Y X .
解 容易求得X 的概率分布为,3.0}0{==X P ,45.0}1{==X P ;25.0}2{==X P Y 的概率分布为,55.0}1{=-=Y P ,25.0}0{==Y P ,2.0}2{==Y P
于是有
25.0245.013.00)(?+?+?=X E ,95.0= 2.0225.0055.0)1()(?+?+?-=Y E .15.0-=
计算得
0202.0001.0)1(0)(??+??+?-?=XY E 1.0215.0013.0)1(1??+??+?-?+
1.02200215.0)1(2??+??+?-?+
.0=
于是 )()()(),cov(Y E X E XY E Y X -=.1425.015.095.0=?=
例2 (E02) 设连续型随机变量),(Y X 的密度函数为 ?
??≤≤≤=其它,01
0,8),(y x xy y x f
求),cov(Y X 和)(Y X D +.
解 由),(Y X 的密度函数可求得其边缘密度函数分别为:
,,010),1(4)(2???≤≤-=其它x x x x f X ,,01
0,4)(3?
??≤≤=其它y y y f Y
于是 ?+∞
∞
-=dx x xf X E X )()(?-?=
1
02
)1(4dx x
x x ,15/8=
?
+∞
∞
-=
dy y yf Y E Y )()(?
?=
10
34dy y y ,5/4=
??+∞∞-+∞
∞
-=
dxdy y x xyf XY E ),()(?
???=1
1
8x
dy xy xy dx ,9/4=
从而)()()(),cov(Y E X E XY E Y X -=,225/4= 又?
+∞∞
-=dx x f x X E X )()(22?-?=
1
22
)1(4dx x x x
,3/1=
?
+∞
∞
-=
dy y f y Y E Y )()(22?
?=
1
324dy y y ,3/2=
所以22)]([)()(X E X E X D -=,225/11=,75/2)]([)()(22=-=Y E Y E Y D 故),cov(2)()()(Y X Y D X D Y X D ++=+.9/1=
相关系数的性质
例3 (E03)
易知)(X E 于是XY 不相关. 这表示Y X ,不存在线性关系. 但},1{}2{0}1,2{=-=≠==-=Y P X P Y X P 知Y X ,不是相互独立的.
事实上, X 和Y 具有关系: ,2
X Y =Y 的值完全可由X 的值所确定.
例4 (E04) 设θ服从],[ππ-上的均匀分布, ,sin θ=X θcos =Y 判断X 与Y 是否不相关, 是否独立.?
解 由于,0sin 21)(==?-ππθθπd X E ,0cos 21)(==?
-π
π
θθπd Y E
而.0cos sin 21)(2==
?
π
π
θθθπd XY E 因此),()()(Y E X E XY E =从而X 与Y 不相关.但由于X 与Y 满足关系: 122=+Y X 所以X 与Y 不独立.
例5 已知)3,1(~2N X , ),4,0(~2N Y 且X 与Y 的相关系数 .2
1
-=XY ρ 设,2
3Y
X Z -= 求)(Z D 及.XZ ρ 解 因,3)(2=X D ,4)(2=Y D 且XY Y D X D Y X ρ)()(),cov(=??
?
??-??=2143,6-=
所以
??? ??-=23)(Y X D Z D ??
?
??-+=2,3cov 2)(41)(91Y X Y D X D
),cov(2
1
312)(41)(91Y X Y D X D ??-+=,7= 又因
??? ??-=23,cov ),cov(Y X X Z X ??
?
??-??? ??=2,cov 3,cov Y X X X
),cov(21),cov(31Y X Y X -=,6),cov(2
1
)(31=-=Y X X D 故.7
7
27
36)
()(),cov(=
?=
=Z D X D Z X XZ ρ
例6 (E05) 设二维随机变量),,,,,(~),(2121ρσσμμN Y X 求相关系数.XY ρ 解
根据二维正态分布的边缘概率密度知
,)(1μ=X E ,)(2μ=Y E ,)(21σ=X D ,)(22
σ=Y D 而 dxdy y x f x x Y X ),())((),cov(21??
+∞∞-+∞
∞
---=
μμ??
+∞∞-+∞
∞
----=
))((121212
21μμρ
σπσy x
.2)()1(21exp 2121211222dxdy x x y ???
?????--???? ??-----?σμσμρσμρ 令,11
11222????
??----=
σμρσμρx y t ,11σμ-=x u 则有 ??
+∞∞-+∞
∞
--=
tu Y X 2211(21
),cov(ρσσπ
dtdu e u t u 2
/)(22122
)+-+σρσ
???? ?
?????
?
?=
?
?
∞+∞
--
∞
+∞
--dt e
du e
u t u 2
2
221222πσρσ???
? ?
????? ?
?-+?
?
∞
+∞
--
∞
+∞
--
dt te
du ue
t u 2
2
2212221πρσσ ,2222
1πππ
σρσ?=
即有,),cov(21σρσ=Y X 于是.)
()(),cov(ρρ==
Y D X D Y X XY
注: 从本例的结果可见, 二维正态随机变量),(Y X 的分布完全由X 和Y 各自的数学期望、方差以及它们的相关系数所确定. 此外, 易见有结论: 若),(Y X 服从二维正态分布, 则
X 与Y 相互独立, 当且仅当X 与Y 不相关.
n 维正态分布的几个重要性质
例7 (E06) 设随机变量X 和Y 相互独立,且),.2,1(~N X )1,0(~N Y ,试求
32+-=Y X Z 的概率密度.
解 ),1,0(~),2,1(~N Y N X 且X 与Y 独立, 故X 和Y 的联合分布为正态分布, X 和
Y 的任意线性组合是正态分布, 即
)),(),((~Z D Z E N Z
,5323)()(2)(=+=+-=Y E X E Z E ,918)()(4)(=+=+=Y D X D Z D ),3,5(~2N Z
即Z 的概率密度是.,231)(18
)5(2+∞<<∞-=--
z e
z f z Z π
课堂练习
对不同品牌的某种机械的两项重要指标评分, 设21,X X 为其所得分数(百分制). 已知
,9.68)(1=X E 8.72)(2=X E ; ,81)(1=X D ;49)(2=X D .36),cov(21=X X
现以服从正态分布的综合分2116
7
169X X Y +=来决定各参评品牌的名次 .(1) 试求Y 的分布; (2) 如果对综合分85≥Y 的品牌颁奖, 试计算获奖者的百分比.