文档库 最新最全的文档下载
当前位置:文档库 › 方差与协方差理解

方差与协方差理解

方差与协方差理解
方差与协方差理解

§2方差、协方差与相关系数

2.1方差

例1

比较甲乙两人的射击技术,已知两人每次击中环数分布为

p 8

9<6

7 8

9 10^

巴.Q1

0.6 01 丿

” :vQ1 0.2 0.4 0.2 01 丿

问哪一个技术较好?

首先看两人平均击中环数,此时 E =E =8,从均值来看无法分辩孰优孰劣 ?但从直观上 看,甲基本上稳定在 8环左右,而乙却一会儿击中 10环,一会儿击中6环,较不稳定.因此 从直观上可以讲甲的射击技术较好 .

上例说明:对一随机变量,除考虑它的平均取值外,还要考虑它取值的 离散程度.

称-E

为随机变量 对于均值

E

的离差(deviation ),它是一随机变量.为了给出一个描述

离散程度的数值,考虑用

E -E

,但由于E

-E = ^ -

E

=0对一切随机变量均

成立,即'

2

的离差正负相消,因此用 E -E 是不恰当的.我们改用

E E

描述取

值的离散程度,这就是方差

Vat=EZ 叮

deviatio n ).

2

方差是随机变量函数(一 一E 」)的数学期望,由§的⑸式,即可写出方差的计算公式

(x 「E )2P 「二 xj,离散型, 巴 产(x-E?2

dFKx) f 「(x-E?2

pKx)dx ,连续型.

Var - ■ = a

-

= L -°0

进一步,注意到

E G —E ? 2 = E

F -2春 +(E : )2] = E ?2 -(E ? )2

即有

许多情况,用(3)式计算方差较方便些 例1(续)计算例1中的方差Var 与Var .

定义1

2

存在,为有限值, 就称它是随机变量 ■的方差(varianee),记作 Var -,

但Var ?的量纲与 不同,为了统一量纲,有时用

Var

,称为

的标准差(standard

(1)

Var

_E 2_ E

■. 2 - 解利用⑶式 匚 2 ' X :P( ―) 2

2

2

E = i =7 X0.1+8 X 0.8+9 >0.1=64.2,

2 2

Var =

E _ E

=64.2-- 82

=0.2.

2 2

同理,Var = E

- E

= 65.2-64 = 1.2 > Var ,所以 取值较 分散. 术较好.

例2

这说明甲的射击技

试计算泊松分布 P (入的方差.

-■ k E 2

八 k 2

—e k z0 k!

:: k

k e _ 心(k-1)!

:' -k

:"

■ k

所以

设 服从[a, b ]上的均匀分布 U [a, b ],求Var .

b 2 1

dx 」a 2

ab b b —a

Var

1

a 2

ab b 2 _ 1 a b 3 _2

2

1 I 2

b _ a I 12

设■服从正态分布N a

,;",求Var .

解此时用公式⑵,由于

E 二

a

-bo

Var 询违厂"

a)

-□0

2 - ::2

ze dz

2 二 s

f

2 ,

-bo

-be

2 2

\ -ze" z /2 +

r

—z /2 ■

e dz

I

-oO

这就得(4)式.

切贝雪夫不等式无论从证明方法上还是从结论上都有一定意义 」:,E —与E ,;内

的概率小于等于

Var

/ ;

2

,或者说, 落在区间

E

一 ;,E ;内的概率大于1-Var / ;2,从而只用数学期望和方差就可对上述概率进 行估计.例

如,取 £ =3 Var ,则

P (|— E q 兰^/VO ^ 比1 —Var ”(37V0^ (?089

P (|E

E

| E3 '、V ar )=卩(|“| 乞3 扌胡.997 ).

性质1

Var

- =0的充要条件是 P(手C )=1,其中C 是常数.

证 显然条件充分.反之,如果

Var

= 0,记E = C,由切贝雪夫不等式

E 巴>

P(冷

E

| - £=0

对一切正数£成立.从而

2

可见正态分布中参数 C 就是它的方差,二就是标准差? 方差也有若干简单而重要的性质 ?先介绍一个不等式?

切贝雪夫(Chebyshev)不等式若随机变量的方差存在,则对任意给定的正数

P (|E —E ? ")兰Var L/y

恒有

证设?的分布函数为F x ,则

P (|E-E 律让仁込dF(x) <

"E )2

|X -E |_ ;

dF(x)

1

-j 2

「(x-E )2dF(x)

= Var / 2

.事实上,该式断言 落在

当然这个估计还是比较粗糙的(当

N a,

' 时,在第二章曾经指出,

P G=c)=1_P(G_c =0)

=1「lim_P -c -1 n =1

性质2设c,b 都是常数,则

Var(

c

+b)=c

2

Var

Var(

c

+b)=E(c +b-E(c +b))?=E(c

+b-c E

-b )2

c 2

E( -E )2

=c 2

Var

性质 3 若 c

= E [则

Var :: E -c

.

证 因

Var

=E 2 -(E )[而 E( E C )2 = E 2

-2C E

+c 2

,

度最小.

n n

Var (迟 Ej 迟 Var? 送 E& — E ?"? — 性质4 i 土 = i 4 +2 1

丄::j 岂

特别若1,川,n 两两独立,则

n

n n n

i )

y

i 7 i )、2 (' ( i -E i ))2

i 珀

=E ( i £

-E ( i =1 ) =E i 叫

n

(、(i -E i )2

( i -E J(〔 -E J)

=E i 仝

i _i ::j 』

n

' Var i ' E( i -E J( j -E j )

=i 仝

+21 生

,

得证⑹式成立.当1,川,n 两两独立时,对任何

1

- I > j -

n

有E i j — E i E j , 故

E

( i -E i )( j -E j )=E( i i E j - j E i E i E j )

-i - i - E E - i

=E i j i j =0,

这就得证(7)式成立.

利用这些性质,可简化某些随机变量方差的计算 例5设E 服从二项分布B(n, p),求Var

.

解 如§例12构造

rhlll,

n

,它们相互独立同分布,此时

两边相减得 Var - E - c 2 = _ E

2

_c ::: 0

.这说明随机变量

E 对数学期望

E

的离散

证 Var(

若 E (; -E ;)(二j 一E 了)< +处

就称

Va 「£ =E¥

_(E £)2 =i 2

”p+°2 q_p 2

=pq.

由于相互独立必是两两独立的,由性质 4

n

n

w $ =Var(E 耳)=瓦 Var?

Var

i j y

npq

设随机变量i 川I ,n 相互独立同分布,E i = a , V a r i^2

解由§性质2和本节性质

?作为各i 的算术平均,它的数学期望与各 i 的数学期望相同,

但方差只有i 的1/ n 倍.这一事实在数理统计中有重要意义 例7设随机变量E 的期望与方差都存在,

Va

「?°.令

*

_

-E ^Var £

1

称它为随机变量E 的标准化?求E 与Var 解由均值与方差的性质可知

2.2协方差

数学期望和方差反映了随机变量的分布特征

?对于随机向量

J",n ),除去各分量的期

望和方差外,还有表示各分量间相互关系的数字特征 一协方差?

定义2记-i 和的联合分布函数为F j (X, y ).

—1仁

(

i =1,HI,n ).记二=n y

,求 ^,Var"

_s n

E_「n v

=

a,

1 n

Var 一 KF ,,

1 2 n ?? J n

这说明在独立同分布时,

E — EC_)

5/Var -

=0

Var

Var( _ E )

Var

Var Var

(8)

E( i —E J( j —E j )二:;.:;(x-E i )(y — E j )dF j (x,y) 为 _i ' j 的协方差

(covarianee),记作 Cov( _i ^j ).

显然,

Cov j

=Var

i

?公式⑹可改写为

n

n ' i

'、Var i ' Cov( i , j )

Var (v )=第

+21L ::j _n

容易验证,协方差有如下性质: 性质 1 Cov( , ) = Cov( ,

)

=

E -E E

.

性质2设

a,b

是常数,则

Cov( a ,b )二 abCov(,)

n

n

Cov(E 守)=Z Cov&n)

性质3

y

i 吕

其中 b j =Cov (qt j )

C 11 C 1n

则C ?的协方差阵为CBC ,其中B 是E 的协方差阵.

J 1,川,J

\C m1

C mn

5

对于n 维随机向量 可写出它的协方差阵

b

21

■ a

G

b

12

b

1

n

b 2n

B = E (?_E : X?_E :)" =

b n2

b

nn

(9)

由性质1可知B 是一个对称阵,且对任何实数

t j j

n

' b jk t j t k

j,k 1

八 WE( j - E j )( k - E k )二 E(' t j ( j - E j ))2 一0 j,心 jw

即随机向量 性质4设

E 的协方差阵B 是非负定的.

Excel数据分析相关系数与协方差

Excel数据分析相关系数与协方差 化学合成实验中经常需要考察压力随温度的变化情况。某次实验在两个不同的反应器中进行同一条件下实验得到两组温度与压力相关数据,试分析它们与温度的关联关系,并对在不同反应器内进行同一条件下反应的可靠性给出依据。 相关系数是描述两个测量值变量之间的离散程度的指标。用于判断两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零)。设(X,Y)为二元随机变量,那么: 为随机变量X与Y的相关系数。p是度量随机变量X与Y之间线性相关密切程度的数字特征。 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘中加载“分析数据库”。加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项。 操作步骤 1. 打开原始数据表格,制作本实例的原始数据需要满足两组或两组以上的数据,结果将给出其中任意两项的相关系数。 2. 选择“工具”-“数据分析”-“描述统计”后,出现属性设置框,依次选择:

输入区域:选择数据区域,注意需要满足至少两组数据。如果有数据标志,注意同时勾选下方“标志位于第一行”; 分组方式:指示输入区域中的数据是按行还是按列考虑,请根据原数据格式选择; 输出区域可以选择本表、新工作表组或是新工作簿; 3.点击“确定”即可看到生成的报表。 可以看到,在相应区域生成了一个3×3的矩阵,数据项目的交叉处就是其相关系数。显然,数据与本身是完全相关的,相关系数在对角线上显示为1;两组数据间在矩阵上有两个位置,它们是相同的,故右上侧重复部分不显示数据。左下侧相应位置分别是温度与压力A、B和两组压力数据间的相关系数。

协方差矩阵和相关矩阵

一、协方差矩阵 变量说明: 设为一组随机变量,这些随机变量构成随机向量 ,每个随机变量有m 个样本,则有样本矩阵 11 12121 212...... ..... ......m m n n nm x x x x x M x x x ????????=? ??????? 其中对应着每个随机向量X 的样本向量,对应着第i 个随机单变量的所有样本值构成的向量。 单随机变量间的协方差: 随机变量 之间的协方差可以表示为 根据已知的样本值可以得到协方差的估计值如下: 可以进一步地简化为: 协方差矩阵:

(5) 其中,从而得到了协方差矩阵表达式。 如果所有样本的均值为一个零向量,则式(5)可以表达成:

二、相关矩阵(相关系数矩阵) 相关系数: 著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。 依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。 相关系数用r表示,它的基本公式(formula)为: 相关系数的值介于–1与+1之间,即–1≤r≤+1。其性质如下: ?当r>0时,表示两变量正相关,r<0时,两变量为负相关。 ?当|r|=1时,表示两变量为完全线性相关,即为函数关系。 ?当r=0时,表示两变量间无线性相关关系。 ?当0<|r|<1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱。 ?一般可按三级划分:|r|<0.4为低度线性相关;0.4≤|r|<0.7为显著性相关;0.7≤|r|<1为高度线性相关。 相关矩阵也叫相关系数矩阵,是由矩阵各列间的相关系数构成的。也就是说,相关矩阵第i行第j列的元素是原矩阵第i列和第j列的相关系数。 3、协方差矩阵和相关矩阵的关系 由二者的定义公式可知,经标准化的样本数据的协方差矩阵就是原始样本数据的相关矩阵。这里所说的标准化指正态化,即将原始数据处理成均值为0,方差为1的标准数据。 即: X'=(X-EX)/DX

方差与协方差理解

§2 方差、协方差与相关系数 方差 例1 比较甲乙两人的射击技术,已知两人每次击中环数分布为: ξ:7 8901 0601...?? ??? η:67891001 02040201.....?? ???. 问哪一个技术较好 首先看两人平均击中环数,此时8E E ξη==,从均值来看无法分辩孰优孰劣. 但从直观上看,甲基本上稳定在8环左右,而乙却一会儿击中10环,一会儿击中6环,较不稳定.因此从直观上可以讲甲的射击技术较好. 上例说明:对一随机变量,除考虑它的平均取值外,还要考虑它取值的离散程度. 称ξ-E ξ为随机变量ξ对于均值E ξ的离差(deviation),它是一随机变量. 为了给出一个描述离散程度的数值,考虑用()E E ξξ-,但由于 ()E E ξξ-=E E ξξ-=0对一切随机变量均成立,即ξ的离差正负相消,因此 用()E E ξξ-是不恰当的. 我们改用()2 E E ξξ-描述取值ξ的离散程度,这 就是方差. 定义 1 若()2 E E ξξ-存在,为有限值,就称它是随机变量ξ的方差(variance),记作Var ξ, Var ξ=()2E E ξξ- (1) 但Var ξ的量纲与ξξ的标准差(standard deviation). 方差是随机变量函数()2 E ξξ-的数学期望,由§1的(5)式,即可写出方差的计算公式

Var ξ=2()d ()x E F x ξ ξ+∞ -∞-?=22()(),,()()d .i i i x E P x x E p x x ξξξξ+∞ -∞?-=???-?∑?离散型,连续型 (2) 进一步,注意到 ()2 E E ξξ-= ()222E E E ξξξξ??-+??=()22E E ξξ- 即有 Var ξ=()2 2 E E ξξ-. (3) 许多情况,用(3)式计算方差较方便些. 例1(续) 计算例1中的方差Var ξ与Var η. 解 利用(3)式 2 E ξ= ∑=i i i x P x ) (2 ξ=72×+82×+92×=, Var ξ= ()2 2E E ξξ-=82=. 同理, Var η= ()2 2 E E ηη-= = > Var ξ, 所以η取值较ξ分散. 这说明甲的射击技术较好. 例2 试计算泊松分布P(λ)的方差. 解 2 2 01 ! (1)!k k k k E k e k e k k λ λ λλξ∞ ∞ --====-∑∑ 1 1(1) (1)! (1)!k k k k k e e k k λ λ λλ∞ ∞ --===-+--∑∑ 2 ! ! j j j j j e e j j λ λ λλλ λ∞ ∞ --===+∑∑ 2 λλ=+ 所以Var ξ=22 λλλλ+-=. 例3 设ξ服从[ a, b ]上的均匀分布U [a, b],求Var ξ.

相关系数与协方差的关系

探究协方差与相关系数 罗燕 摘要:协方差),(Y X Cov 是描述二维随机变量两个分量间相互关联程度的一个特征数,如果将协方差相应标准化变量就得到相关系数),(Y X Corr 。从而可以引进相关系数),(Y X Corr 去刻画二维随机变量两个分量间相互关联程度。且事实表明,相关系数明显被广泛应用。本文的目的在于从协方差与相关系数的关系的角度去探讨协方差与相关系数的优缺点,并具体介绍协方差和相关系数这两个描述二维随机变量间相关性的特征数。 关键字:协方差),(Y X Cov 相关系数),(Y X Corr 相互关联程度 1 协方差、相关系数的定义及性质 设(X ,Y )是一个二维随机变量,若E{ [ X-E(X) ] [ Y -E(Y) ] }存在,则称此数学期望为X 与Y 的协方差,并记为Cov(X,Y)=E{ [ X-E(X) ] [ Y -E(Y) ] },特别有Cov(X,X)=)(X Var 。 从协方差的定义可以看出,它是X 的偏差“X-E(X) ”与Y 的偏差“Y -E(Y)”的乘积的数学期望。由于偏差可正可负,故协方差也可正可负,也可为零,其具体表现如下: ·当Cov(X,Y)>0时,称X 与Y 正相关,这时两个偏差 [ X-E(X) ] 与[ Y -E(Y) ] 同时增加或同时减少,由于E(X)与E(Y)都是常数,故等价于X 与Y 同时增加或同时减少,这就是正相关的含义。 ·当Cov(X,Y)<0时,称X 与Y 负相关,这时X 增加而Y 减少,或Y 增加而X 减少,这就是负相关的含义。 ·当Cov(X,Y)=0时,称X 与Y 不相关。 也就是说,协方差就是用来描述二维随机变量X 与Y 相互关联程度的一个特征数。协方差Cov(X,Y)是有量纲的量,譬如X 表示人的身高,单位是米(m ),Y 表示人的体重,单位是公斤(k g ),则Cov(X,Y)带有量纲(m ·kg )。为了消除量纲的影响,对协方差除以相同量纲的量,就得到一个新的概念—相关系数,它的定义如下: 设(X ,Y )是一个二维随机变量,且)(X Var >0,)(Y Var >0.则称 ),(Y X C o r r =)()() ,(Y Var X Var Y X Cov =y x Y X Cov σσ),( 为X 与Y 的(线性)相关系数。 利用施瓦茨不等式我们不难得到-1≤),(Y X Corr ≤1.也就是说相关系数是介于-1到1之间的,并且可以对它作以下几点说明: ·若),(Y X Corr =0,则称X 与Y 不相关。不相关是指X 与Y 没有线性关系,但也有可能有其他关系,比如平方关系、立方关系等。 ·若),(Y X Corr =1,则称X 与Y 完全正相关;若),(Y X Corr =-1,则称X 与Y 完全,负相关。

协方差和相关系数

二维随机变量的期望与方差 对于二维随机变量,如果存在,则 称为二维随机变量的数学期望。 1 、当( X ,Y ) 为二维离散型随机变量时 2 、当( X ,Y ) 为二维连续型随机变量时 例题 2.39 设,求。与一维随机变量函数的期望一样,可求出二维随机变量函数的期望。 对二维离散型随机变量( X ,Y ) ,其函数的期望为 对二维连续型随机变量( X ,Y ) ,其函数的期望为

例题 2.40 设,求 2.41 设( X ,Y ) 服从区域A 上的均匀分布,其中A 为x 轴、y 轴及直线 围成的三角形区域,如图2-10 所示。求函数的数学期望。 随机变量的数学期望和方差的三个重要性质: 1 、 推广: 2 、设X 与Y 相互独立,则 推广:设相互独立,则 3 、设X 与Y 相互独立,则 推广:设相互独立,则 仅对性质 3 就连续型随机变量加以证明 证明3

由于X 与Y 相互独立,所以与相互独立,利用性质 2 、知道 从而有, 可以证明:相互独立的随机变量其各自的函数间,仍然相互独立。 例题 2.42 某学校流行某种传染病,患者约占,为此学校决定对全校1000 名师生进 行抽血化验。现有两个方案:①逐个化验;②按四个人一组分组,并把四个人抽到的血混合在一起化验,若发现有问题再对四个人逐个化验。问那种方案好? 2.10.2 协方差与相关系数 分析协方差与相关系数反映随机变量各分量间的关系;结合上面性质 3 的证明,可以得到以下结论: 若X 与Y 相互独立,则 可以用来刻划X 与Y 之间的某种关系。 定义设( X ,Y ) 为二维随机变量,若 存在,则称它为随机变量X 与Y 的协方差,记作或,即 特别地 故方差,是协方差的特例。计算协方差通常采用如下公式:

03 第三节 协方差及相关系数

第三节 协方差及相关系数 对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没能反映随机变量之间的关系. 本节将要讨论的协方差是反映随机变量之间依赖关系的一个数字特征. 内容分布图示 ★ 引言 ★ 协方差的定义 ★ 协方差的性质 ★ 例1 ★ 例2 ★ 相关系数的定义 ★ 相关系数的性质 ★ 例3 ★ 例4 ★ 例5 ★ 例6 ★ 矩的概念 ★ 协方差矩阵 ★ n 维正态分布的概率密度 ★ n 维正态分布的几个重要性质 ★ 例7 ★ 内容小结 ★ 课堂练习 ★ 习题4-3 内容要点: 一、 协方差的定义 定义 设),(Y X 为二维随机向量,若 )]}()][({[Y E Y X E X E -- 存在, 则称其为随机变量X 和Y 的协方差, 记为),(Y X Cov ,即 )]}.()][({[),cov(Y E Y X E X E Y X --= 按定义, 若),(Y X 为离散型随机向量,其概率分布为 ),2,1,(},{ ====j i p y Y x X P ij j i 则 ∑--=j i j i Y E y X E x E Y X ,)]}.()][({[),cov( 若),(Y X 为连续型随机向量, 其概率分布为),,(y x f 则 ? ? +∞∞-+∞∞ ---=dxdy y x f Y E y X E x E Y X ),()]}()][({[),cov(. 此外, 利用数学期望的性质, 易将协方差的计算化简. ). ()()()()()()()()()()]} ()][({[),cov(Y E X E XY E Y E X E X E Y E Y E X E XY E Y E Y X E X E Y X -=+--=--= 特别地, 当X 与Y 独立时, 有 .0),cov(=Y X 二、协方差的性质 1. 协方差的基本性质 );(),cov()1(X D X X = );,cov(),cov()2(X Y Y X = ),cov(),cov()3(Y X ab bY aX =,其中b a ,是常数;

协方差矩阵和相关矩阵

一、协方差矩阵 变量说明: 设为一组随机变量,这些随机变量构成随机向量,每个随机变量有m个样本,则有样本矩阵 (1) 其中对应着每个随机向量X的样本向量,对应着第i个随机单变量的所有样本值构成的向量。 单随机变量间的协方差: 随机变量之间的协方差可以表示为 (2) 根据已知的样本值可以得到协方差的估计值如下: (3) 可以进一步地简化为: (4) 协方差矩阵:

(5)其中,从而得到了协方差矩阵表达式。 如果所有样本的均值为一个零向量,则式(5)可以表达成: (6) 补充说明: 1、协方差矩阵中的每一个元素是表示的随机向量X的不同分量之间的协方差,而不是不同样本之间的协方差,如元素C ij就是反映的随机变量X i, X j的协方差。

2、协方差是反映的变量之间的二阶统计特性,如果随机向量的不同分量之间的相关性很小,则所得的协方差矩阵几乎是一个对角矩阵。对于一些特殊的应用场合,为了使随机向量的长度较小,可以采用主成分分析的方法,使变换之后的变量的协方差矩阵完全是一个对角矩阵,之后就可以舍弃一些能量较小的分量了(对角线上的元素反映的是方差,也就是交流能量)。特别是在模式识别领域,当模式向量的维数过高时会影响识别系统的泛化性能,经常需要做这样的处理。 3、必须注意的是,这里所得到的式(5)和式(6)给出的只是随机向量协方差矩阵真实值的一个估计(即由所测的样本的值来表示的,随着样本取值的不同会发生变化),故而所得的协方差矩阵是依赖于采样样本的,并且样本的数目越多,样本在总体中的覆盖面越广,则所得的协方差矩阵越可靠。 4、如同协方差和相关系数的关系一样,我们有时为了能够更直观地知道随机向量的不同分量之间的相关性究竟有多大,还会引入相关系数矩阵。 二、相关矩阵 相关系数: 著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。 依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。 相关系数用r表示,它的基本公式(formula)为: 相关系数的值介于–1与+1之间,即–1≤r≤+1。其性质如下:

方差协方差和相关系数

§2 方差、协方差与相关系数 一、方差 二、协方差 三、相关系数 四、矩 一、方差 例1 例1 比较甲乙两人的射击技术,已知两人每次击中环数ξ分 布为 ξ: 789010601...?? ??? η:67 891001 02040201.....?? ???. 问哪一个技术较好? 首先看两人平均击中环数,此时8E E ξη==,从均值来看无法分辩孰优孰劣. 但从直观上看,甲基本上稳定在8环左右,而乙却一会儿击中10环,一会儿击中6环,较不稳定.因此从直观上可以讲甲的射击技术较好. 上例说明:对一随机变量,除考虑它的平均取值外,还要考虑它取值的离散程度. 称ξ-E ξ为随机变量ξ对于均值E ξ的离差(deviation),它是一随机变量. 为了给出一个描述离散程度的数值,考虑用()E E ξξ-,但由于 ()E E ξξ-=E E ξξ-=0对一切随机变量均成立,即ξ的离差正负相消,因此用 ()E E ξξ-是不恰当的. 我们改用()2 E E ξξ-描述取值ξ的离散程度,这就是方差. 定义1 若 () 2 E E ξξ-存在,为有限值,就称它是随机变量ξ的方差 (variance),记作Var ξ, Var ξ=()2 E E ξξ- (1) 但Var ξ的量纲与ξ ξ的标准差

(standard deviation). 方差是随机变量函数()2 E ξξ-的数学期望,由§1的(5)式,即可写出方差的 计算公式 Var ξ=2()d ()x E F x ξ ξ+∞-∞-?=22()(),, ()()d .i i i x E P x x E p x x ξξξξ+∞ -∞?-=???-?∑?离散型,连续型 (2) 进一步,注意到 ()2 E E ξξ-=()222E E E ξξξξ??-+??=()22E E ξξ- 即有 Var ξ=()2 2E E ξξ-. (3) 许多情况,用(3)式计算方差较方便些. 例1(续) 计算例1中的方差Var ξ与Var η. 解 利用(3)式 2 E ξ= ∑=i i i x P x ) (2 ξ=72×0.1+82×0.8+92 ×0.1=64.2, Var ξ=()2 2E E ξξ-=64.2--82=0.2. 同理, Var η=()2 2E E ηη-= 65.2-64 = 1.2 > Var ξ, 所以η取值较ξ分散. 这说 明甲的射击技术较好. 例2 试计算泊松分布P(λ)的方差. 解 2 2 01 ! (1)!k k k k E k e k e k k λ λ λλξ∞ ∞ --====-∑∑ 1 1(1) (1)!(1)!k k k k k e e k k λ λ λλ∞ ∞ --===-+--∑∑ 2 ! ! j j j j j e e j j λ λ λλλ λ∞ ∞ --===+∑∑ 2 λλ=+ 所以Var ξ=22 λλλλ+-=. 例3 设ξ服从[ a, b ]上的均匀分布U [a, b],求Var ξ.

用Excel做相关系数与协方差

用Excel做数据分析——相关系数与协方差相关系数是描述两个测量值变量之间的离散程度的指标。用于判断两个测量值变量的变化是否相关,即,一个变量的较大值是否与另一个变量的较大值相关联(正相关);或者一个变量的较小值是否与另一个变量的较大值相关联(负相关);还是两个变量中的值互不关联(相关系数近似于零)。设(X,Y)为二元随机变量,那么: 为随机变量X与Y的相关系数。p是度量随机变量X与Y之间线性相关密切程度的数字特征。 注:本功能需要使用Excel扩展功能,如果您的Excel尚未安装数据分析,请依次选择“工具”-“加载宏”,在安装光盘中加载“分析数据库”。加载成功后,可以在“工具”下拉菜单中看到“数据分析”选项。 操作步骤 1. 打开原始数据表格,制作本实例的原始数据需要满足两组或两组以上的数据,结果将给出其中任意两项的相关系数。 2. 选择“工具”-“数据分析”-“描述统计”后,出现属性设置框,依次选择:

输入区域:选择数据区域,注意需要满足至少两组数据。如果有数据标志,注意同时勾选下方“标志位于第一行”; 分组方式:指示输入区域中的数据是按行还是按列考虑,请根据原数据格式选择; 输出区域可以选择本表、新工作表组或是新工作簿; 3.点击“确定”即可看到生成的报表。 可以看到,在相应区域生成了一个3×3的矩阵,数据项目的交叉处就是其相关系数。显然,数据与本身是完全相关的,相关系数在对角线上显示为1;两组数据间在矩阵上有两个位置,它们是相同的,故右上侧重复部分不显示数据。左下侧相应位置分别是温度与压力A、B和两组压力数据间的相关系数。

从数据统计结论可以看出,温度与压力A、B的相关性分别达到了0.95和0.94,这说明它们呈现良好的正相关性,而两组压力数据间的相关性达到了0.998,这说明在不同反应器内的相同条件下反应一致性很好,可以忽略因为更换反应器造成的系统误差。 协方差的统计与相关系数的方法相似,统计结果同样返回一个输出表和一个矩阵,分别表示每对测量值变量之间的相关系数和协方差。不同之处在于相关系数的取值在 -1 和 +1 之间,而协方差没有限定的取值范围。相关系数和协方差都是描述两个变量离散程度的指标。

相关文档
相关文档 最新文档