文档库 最新最全的文档下载
当前位置:文档库 › 03 第三节 协方差及相关系数

03 第三节 协方差及相关系数

03 第三节 协方差及相关系数
03 第三节 协方差及相关系数

第三节 协方差及相关系数

对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没能反映随机变量之间的关系. 本节将要讨论的协方差是反映随机变量之间依赖关系的一个数字特征.

内容分布图示

★ 引言

★ 协方差的定义 ★ 协方差的性质 ★ 例1 ★ 例2

★ 相关系数的定义 ★ 相关系数的性质

★ 例3 ★ 例4 ★ 例5 ★ 例6

★ 矩的概念 ★ 协方差矩阵 ★ n 维正态分布的概率密度

★ n 维正态分布的几个重要性质 ★ 例7

★ 内容小结 ★ 课堂练习 ★ 习题4-3

内容要点:

一、 协方差的定义

定义 设),(Y X 为二维随机向量,若

)]}()][({[Y E Y X E X E --

存在, 则称其为随机变量X 和Y 的协方差, 记为),(Y X Cov ,即

)]}.()][({[),cov(Y E Y X E X E Y X --=

按定义, 若),(Y X 为离散型随机向量,其概率分布为

),2,1,(},{ ====j i p y Y x X P ij

j i

则 ∑--=j

i j i Y E y X E x E Y X ,)]}.()][({[),cov(

若),(Y X 为连续型随机向量, 其概率分布为),,(y x f 则

?

?

+∞∞-+∞∞

---=dxdy y x f Y E y X E x E Y X ),()]}()][({[),cov(.

此外, 利用数学期望的性质, 易将协方差的计算化简.

).

()()()()()()()()()()]}

()][({[),cov(Y E X E XY E Y E X E X E Y E Y E X E XY E Y E Y X E X E Y X -=+--=--= 特别地, 当X 与Y 独立时, 有 .0),cov(=Y X

二、协方差的性质

1. 协方差的基本性质 );(),cov()1(X D X X = );,cov(),cov()2(X Y Y X =

),cov(),cov()3(Y X ab bY aX =,其中b a ,是常数;

C X C ,0),cov()4(=为任意常数;

).,cov(),cov(),cov()5(2121Y X Y X Y X X +=+

(6) 若X 与Y 相互独立时,则.0),cov(=Y X

2. 随机变量和的方差与协方差的关系

),,cov(2)()()(Y X Y D X D Y X D ++=+ 特别地, 若X 与Y 相互独立时, 则

)()()(Y D X D Y X D +=+.

三、相关系数的定义与性质

定义 设),(Y X 为二维随机变量,,0)(,0)(>>Y D X D 称

)

()()

,(Y D X D Y X Cov XY =

ρ

为随机变量X 和Y 的相关系数.有时也记XY ρ为ρ. 特别地,当0=XY ρ时,称X 与Y 不相关. 相关系数的性质

1. ;1||≤XY ρ

2. 若X 和Y 相互独立, 则0=XY ρ.

3. 若0,0>>DY DX ,则1||=XY ρ当且仅当存在常数).0(,≠a b a 使1}{=+=b aX Y P , 而且当0>a 时, 1=XY ρ;当0

注: 相关系数XY ρ刻画了随机变量Y 与X 之间的“线性相关”程度. ||XY ρ的值越接近1, Y 与X 的线性相关程度越高; ||XY ρ的值越近于0, Y 与Y 的线性相关程度越弱.

当1||=XY ρ时, Y 与X 的变化可完全由X 的线性函数给出. 当0=XY ρ时, Y 与X 之间不是线性关系.

4. 设,)]([2b aX Y E e +-=称为用b aX +来近似Y 的均方误差,则有下列结论. 设,0)(,0)(>>Y D X D 则)()(,)

()

,cov(000X E a Y E b X D Y X a -==

使均方误差达到最小.

注: 我们可用均方误差e 来衡量以b aX +近似表示Y 的好坏程度, e 值越小表示b aX +与

Y 的近似程度越好.且知最佳的线性近似为.0b X a +而其余均方误差)1)((2

XY

Y D e ρ-=. 从这个侧面也能说明. ||XY ρ越接近1, e 越小.反之, ||XY ρ越近于0, e 就越大.Y 与X 的线性相关

性越小.

四、矩的概念

定义 设X 和Y 为随机变量, l k ,为正整数, 称

)(k X E 为k 阶原点矩(简称k 阶矩阵); ))](([k X E X E - 为k 阶中心矩; )|(|k X E 为k 阶绝对原点矩; )|)((|k X E X E - 为k 阶绝对中心矩;

)(l k Y X E 为X 和Y 的l k +阶混合矩;

})]([)]({[l k Y E Y X E X E -- 为X 和Y 的l k +阶混合中心矩;

注: 由定义可见:

(1) X 的数学期望)(X E 是X 的一阶原点矩; (2) X 的方差)(X D 是X 的二阶中心矩;

(3)协方差),(Y X Cov 是X 和Y 的二阶混合中心矩.

五、协方差矩阵

将二维随机变量),(21X X 的四个二阶中心矩

)]}.

()][({[)]},()][({[},)]({[},)]({[1122212211122222221111X E X X E X E c X E X X E X E c X E X E c X E X E c --=--=-=-=

排成矩阵的形式: ???

?

??22211211c c c c (对称矩阵),称此矩阵为),(21X X 的协方差矩阵. 类似定义n 维随机变量),,,(21n X X X 的协方差矩阵.

若n j i X E X X E X E X X Cov c j j i i j i ij ,,2,1,)]}()][({[),( =--==都存在, 则称

??

?

?

?

?

?

??=nn n n n n c c c

c c c

c c c C 2

1222

21112

11

为),,,(21n X X X 的协方差矩阵.

六、n 维正态分布的概率密度

七、n 维正态分布的几个重要性质

例题选讲:

协方差的性质

例1 (E01) 已知离散型随机向量),(Y X 的概率分布为

求),cov(Y X .

解 容易求得X 的概率分布为,3.0}0{==X P ,45.0}1{==X P ;25.0}2{==X P Y 的概率分布为,55.0}1{=-=Y P ,25.0}0{==Y P ,2.0}2{==Y P

于是有

25.0245.013.00)(?+?+?=X E ,95.0= 2.0225.0055.0)1()(?+?+?-=Y E .15.0-=

计算得

0202.0001.0)1(0)(??+??+?-?=XY E 1.0215.0013.0)1(1??+??+?-?+

1.02200215.0)1(2??+??+?-?+

.0=

于是 )()()(),cov(Y E X E XY E Y X -=.1425.015.095.0=?=

例2 (E02) 设连续型随机变量),(Y X 的密度函数为 ?

??≤≤≤=其它,01

0,8),(y x xy y x f

求),cov(Y X 和)(Y X D +.

解 由),(Y X 的密度函数可求得其边缘密度函数分别为:

,,010),1(4)(2???≤≤-=其它x x x x f X ,,01

0,4)(3?

??≤≤=其它y y y f Y

于是 ?+∞

-=dx x xf X E X )()(?-?=

1

02

)1(4dx x

x x ,15/8=

?

+∞

-=

dy y yf Y E Y )()(?

?=

10

34dy y y ,5/4=

??+∞∞-+∞

-=

dxdy y x xyf XY E ),()(?

???=1

1

8x

dy xy xy dx ,9/4=

从而)()()(),cov(Y E X E XY E Y X -=,225/4= 又?

+∞∞

-=dx x f x X E X )()(22?-?=

1

22

)1(4dx x x x

,3/1=

?

+∞

-=

dy y f y Y E Y )()(22?

?=

1

324dy y y ,3/2=

所以22)]([)()(X E X E X D -=,225/11=,75/2)]([)()(22=-=Y E Y E Y D 故),cov(2)()()(Y X Y D X D Y X D ++=+.9/1=

相关系数的性质

例3 (E03)

易知)(X E 于是XY 不相关. 这表示Y X ,不存在线性关系. 但},1{}2{0}1,2{=-=≠==-=Y P X P Y X P 知Y X ,不是相互独立的.

事实上, X 和Y 具有关系: ,2

X Y =Y 的值完全可由X 的值所确定.

例4 (E04) 设θ服从],[ππ-上的均匀分布, ,sin θ=X θcos =Y 判断X 与Y 是否不相关, 是否独立.?

解 由于,0sin 21)(==?-ππθθπd X E ,0cos 21)(==?

π

θθπd Y E

而.0cos sin 21)(2==

?

π

π

θθθπd XY E 因此),()()(Y E X E XY E =从而X 与Y 不相关.但由于X 与Y 满足关系: 122=+Y X 所以X 与Y 不独立.

例5 已知)3,1(~2N X , ),4,0(~2N Y 且X 与Y 的相关系数 .2

1

-=XY ρ 设,2

3Y

X Z -= 求)(Z D 及.XZ ρ 解 因,3)(2=X D ,4)(2=Y D 且XY Y D X D Y X ρ)()(),cov(=??

?

??-??=2143,6-=

所以

??? ??-=23)(Y X D Z D ??

?

??-+=2,3cov 2)(41)(91Y X Y D X D

),cov(2

1

312)(41)(91Y X Y D X D ??-+=,7= 又因

??? ??-=23,cov ),cov(Y X X Z X ??

?

??-??? ??=2,cov 3,cov Y X X X

),cov(21),cov(31Y X Y X -=,6),cov(2

1

)(31=-=Y X X D 故.7

7

27

36)

()(),cov(=

?=

=Z D X D Z X XZ ρ

例6 (E05) 设二维随机变量),,,,,(~),(2121ρσσμμN Y X 求相关系数.XY ρ 解

根据二维正态分布的边缘概率密度知

,)(1μ=X E ,)(2μ=Y E ,)(21σ=X D ,)(22

σ=Y D 而 dxdy y x f x x Y X ),())((),cov(21??

+∞∞-+∞

---=

μμ??

+∞∞-+∞

----=

))((121212

21μμρ

σπσy x

.2)()1(21exp 2121211222dxdy x x y ???

?????--???? ??-----?σμσμρσμρ 令,11

11222????

??----=

σμρσμρx y t ,11σμ-=x u 则有 ??

+∞∞-+∞

--=

tu Y X 2211(21

),cov(ρσσπ

dtdu e u t u 2

/)(22122

)+-+σρσ

???? ?

?????

?

?=

?

?

∞+∞

--

+∞

--dt e

du e

u t u 2

2

221222πσρσ???

? ?

????? ?

?-+?

?

+∞

--

+∞

--

dt te

du ue

t u 2

2

2212221πρσσ ,2222

1πππ

σρσ?=

即有,),cov(21σρσ=Y X 于是.)

()(),cov(ρρ==

Y D X D Y X XY

注: 从本例的结果可见, 二维正态随机变量),(Y X 的分布完全由X 和Y 各自的数学期望、方差以及它们的相关系数所确定. 此外, 易见有结论: 若),(Y X 服从二维正态分布, 则

X 与Y 相互独立, 当且仅当X 与Y 不相关.

n 维正态分布的几个重要性质

例7 (E06) 设随机变量X 和Y 相互独立,且),.2,1(~N X )1,0(~N Y ,试求

32+-=Y X Z 的概率密度.

解 ),1,0(~),2,1(~N Y N X 且X 与Y 独立, 故X 和Y 的联合分布为正态分布, X 和

Y 的任意线性组合是正态分布, 即

)),(),((~Z D Z E N Z

,5323)()(2)(=+=+-=Y E X E Z E ,918)()(4)(=+=+=Y D X D Z D ),3,5(~2N Z

即Z 的概率密度是.,231)(18

)5(2+∞<<∞-=--

z e

z f z Z π

课堂练习

对不同品牌的某种机械的两项重要指标评分, 设21,X X 为其所得分数(百分制). 已知

,9.68)(1=X E 8.72)(2=X E ; ,81)(1=X D ;49)(2=X D .36),cov(21=X X

现以服从正态分布的综合分2116

7

169X X Y +=来决定各参评品牌的名次 .(1) 试求Y 的分布; (2) 如果对综合分85≥Y 的品牌颁奖, 试计算获奖者的百分比.

相关文档