文档库 最新最全的文档下载
当前位置:文档库 › 计量经济学课件:第五章-异方差性汇总

计量经济学课件:第五章-异方差性汇总

计量经济学课件:第五章-异方差性汇总
计量经济学课件:第五章-异方差性汇总

第五章异方差性

本章教学要求:根据类型,异方差性是违背古典假定情况下线性回归模型建立的另一问题。通过本章的学习应达到,掌握异方差的基本概念包括经济学解释,异方差的出现对模型的不良影响,诊断异方差的方法和修正异方差的方法。经过学习能够处理模型中出现的异方差问题。

第一节异方差性的概念

一、例子

例1,研究我国制造业利润函数,选取销售收入作为解释变量,数据为1998年的食品年制造业、饮料制造业等28个截面数据(即n=28)。数据如下表,其中y表示制造业利润函数,x表示销售收入(单位为亿元)。

Y对X的散点图为

从散点图可以看出,在线性的基础上,有的点分散幅度较小,有的点分散幅度较大。因此,这种分散幅度的大小不一致,可以认为是由于销售收入的影响,使得制造业利润偏离均值的程度发生了变化,而这种偏离均值的程度大小不同是一种什么现象?如何定义?如果非线性,则属于哪类非线性,从图形所反映的特征看并不明显。

下面给出制造业利润对销售收入的回归估计。

模型的书写格式为

2

?12.03350.1044(0.6165)(12.3666)

0.8547,..84191.34,152.9322213.4639,

146.4905

Y Y

X R S E F

Y s =+=====

通过变量的散点图、参数估计、残差图,可以看到模型中(随机误差)很有可能存在一种系统性的表现。

例2,改革开放以来,各地区的医疗机构都有了较快发展,不仅政府建立了一批医疗机构,还建立了不少民营医疗机构。各地医疗机构的发展状况,除了其他因素外主要决定于对医疗服务的需求量,而医疗服务需求与人口数量有关。为了给制定医疗机构的规划提供依据,分析比较医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。根据四川省2000年21个地市州医疗机构数与人口数资料对模型估计的结果如下:

i i

X Y 3735.50548.563?+-= (291.5778) (0.644284) t =(-1.931062) (8.340265)

785456.02=R 774146.02

=R 56003.69=F

式中Y 表示卫生医疗机构数(个),X 表示人口数量(万人)。从回归模型估计的

结果看,人口数量对应参数的标准误差较小,t 统计量远大于临界值,说明人口数量对医疗机构确有显著影响,可决系数和修正的可决系数还可以,F 检验结果也明显显著。表明该模型的估计效果还不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。

然而,这里得出的结论可能是不可靠的,按照四川省的经济水平和实际情况看,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。那末,有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢? 二、异方差的定义

设模型为

122331,2,,i i i k ki i

Y X X X u i n ββββ=+++++=L L

如果对于模型中随机误差项i u ,有

22(|)(|),

1,2,3,,.i i i i i Var u X E u X i n σ===L (()0i E u =)

则称i u 具有异方差性。进一步,把异方差看成是由于某个解释变量的变化而引起的,则

22(|)()i i i i Var u X f X σσ==

例1,一个食品支出与收入的关系。表明异方差的产生与人们的收入状况有关。设食品支出与收入之间的关系为 2123t t t t Y X X u βββ=+++

式中,Y 为食品支出,X 为收入,X 2为收入的平方,并且230,0ββ><。在食品支出与收入这种假定关系下,当X 很大的时候,Y 与均值2123()E Y X X βββ=++的偏差有可能比当X 很小时大。这是由于低收入住户的食品支出几乎全部由收入来解释,而高收入住户的食品支出在很大程度上取决于其它因素,这样就出现了高收入住户的食品支出有一部分没有得到其收入的解释,而这一部分可能会相当大。

例2,研究浙江省农业总产值与农业劳动力人数、耕地面积之间的关系。选

取该省17个县市1992年的数据资料(截面数据),为了研究的方便,将各县市按农业总产值从小到大进行了排列。通过EViews的操作可以看到该问题中的农业总产值与其均值之间差异程度的变化现象。

例3,根据美国一项制造业调查的资料,可以看到企业规模越大,平均生产力会越高,但生产力的波动也变大了(用标准差反映),数据见下表。

表明生产力的波动随着企业人数的增加而变大。

三、产生异方差的背景

1、由于模型中缺失了某些重要解释变量,或者是随着时间的推移有可能成为重要影响因素的变量,但也应注意设定误差问题。

2、截面数据更易引起异方差(时间序列数据也要引起异方差,比如人们的打字技术随时间推移而出现的差异)。

3、由于样本数据的观测误差。

4、异方差的出现与某个解释变量的变动有关。

5、模型的设定误差。

在实际经济问题中,人们很难得到总体u的信息,因此,我们只能够通过对残差e的认识和处理,来实现对总体随机误差是否存在异方差的推断和分析。

第二节异方差性对模型的影响

一、在异方差存在的前提下,参数估计值的特性

1、参数估计值仍是无偏的。 设模型为

n i U X Y i i i ,,2,1,

21Λ=++=ββ

对于参数2β的估计量2

?β用如下离差形式表示 ∑∑=22

?i

i

i x

y

x β

式中Y Y y X X x i i i i -=-=,。则

i i i u x y +=2β U U u i i -=

2

22

22

2

22

222

22

2

2

)()()?()(?ββββββββ=+=+=+

=+=+=

=

∑∑∑∑∑∑∑∑∑∑∑∑i

i i i

i

i i

i

i i

i

i

i

i

i

i i

i

i

i

x u x E x u x E E x

u

x x

u x x x u x x x

y x

在证明中用了假定0)(=i i u x E 。 2、参数估计值的方差不再是最小。 在异方差下

[]

()

)

()?()()

()

()

()

()(2)()(2?)?(?)?(2

2

2

22222222222222222

22

2222

2

22

222b x Var a x x x u E x x u u E x x u

E x x u u x x u x E x u x E x u x E E E E Var i

i j i i i i

j

i i

i i

j

i j i j i j i i

i i j

i j

i j i j i i i i i i i i i ∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑===

+=????

?

??+=?

???

?

?=???

? ??-+=-=-====≠=≠σβσβββββββ同方差下有

同理在上述推导中用了假定j i u u E j i ≠=,0)(。在上述讨论的过程中,用到了边际分析的思想。

比较上述(a )式与(b )式的结果,可以看到只有当对每个i 都有22i σσ=时,才能相等。因此,在同方差假定下,有参数估计值的方差最小,而在异方差下,参数估计值的方差就不再最小了。

二、参数显著性检验失效

在参数估计中,如果忽略上述差异,仍然用(b )作为参数估计方差去衡量,

可能会使得参数估计值的方差低估其真实方差。同时,当出现异方差时,)?(?2

βe s 与X i 的变化有关,它不再为一固定值。从而t 统计量不确定,这时参数(如2β)的置信区间将会无意义。

三、预测精度降低

由于受上述差异的影响,这时k

n e i

-=

∑2

2?σ

不再是2σ的无偏估计,从而置信区

间将受到严重的误导,并且预测区间也会随着方差的变动而变化,从而使Y 的预测区间的精度会降低。

第三节 异方差性的检验

对异方差性的检验主要有以下一些方法, 1、图形法。

2、Goldfeld-Quandt 方法。

3、Glejser 方法。

4、White 方法。

5、ARCH 方法。

6、Park 检验。

7、Spearman 等级相关检验。 8、Breusch-Pagan-Godfrey 检验。 9、Koenker-Bassett 检验。 等等。

下面只介绍前1-5检验方法。

1、图形法。

由残差?e Y Y =-,得到2e 。以2e 为纵轴,某个解释变量j

X 为横轴,画出散点图,由此可粗略判断异方差的存在。

利用前面制造业利润与销售收入之间短系的例子,由残差平方与解释变量的散点图说明异方差存在。

2、Goldfeld-Quandt 方法。 (1)前提条件。

●样本容量要充分的大(为什么?);

●随机误差项~i u 正态分布,除异方差以外,其它基本假定成立。 (2)检验的基本步骤。

●将解释变量的取值按从小到大排序(也可从大到小,但F 统计量的分子于分母需要交换,为什么?)。

●将排列在中间的约1/4的观察值删除掉,记为c ,再将剩余的分为两个部分,每部分观察值的个数为(n-c)/2(根据Goldfeld 和Quandt 的证实,一元线性模型里当样本容量大于60时,c 可取16,而当n=30时,取c 为4)。

Jack Johnston ,John DiNardo (2002)指出,在除去其它因素之外,该检验

功效有赖于剔除的c 的多少。如果c 太大,∑∑2

221i i e e 和的自由度会很小,检验功效自然会很低;如果c 太小,将会减弱∑∑2221i i e e 和之间的对比,检验供销也

会很低。因此,按照经验,一般c 的选取大致在n 左右。

●提出假设。即2

22211220:;

,,2,1,:n i H n i H σσσσσ≤≤≤==ΛΛ

●构造F 统计量。分别对上述两个部分的观察值求回归模型,由此得到的两

个部分的残差平方和为∑∑2

221i i e e 和,它们的自由度均为[(n-c)/2]-k ,其中k 为参

数的个数。(这里如果假定u 服从正态分布,并且同方差性假定是真实的,则可证明下式成立)于是在原假设成立的前提下,有

)2

,2(~]

2/[]

2/[

2122*k c n k c n F k c n e k c

n e F i i --------=∑∑

●判断。给定显著性水平α,查F 分布表,得临界值)()2

,

2

(

αk c

n k c

n F ----,如果

F *>)()2

,

2

(αk c

n k c

n F ----

则拒绝原假设,接受备择假设,即模型中的随机误差存在异方差。

例如,分析某地区家庭消费与收入之间的关系,n=30。下面是在EViews 上运用G-Q 检验的操作过程。

3、Glejser 方法。

Glejser 检验的基本思想是,由OLS 法得到残差i e ,取i e 的绝对值i e ,然后将i e 对某个解释变量i X 回归,根据回归模型的显著性和拟合优度来判断是否存在异方差。该检验的特点是不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。

Glejser 检验的具体步骤:

(1)根据样本数据建立回归模型,并求残差序列?i i i e Y Y =-。 (2)用残差绝对值i e 对i X 的进行回归,由于i e 与X 的真实函数形式并不知道,只能用样本数据对各种函数形式进行试验,从中选择最佳形式。Glejser 曾提出如下一些假设的函数形式:

i

i i v X e ++=βα

i i e v α=+

1

i i i

e v X αβ

=++

i i e v αβ

=+ 式中v 为随机误差项。

(3)通常可用2i e 作为i e 的替代变量,对所选函数形式回归。用回归所得到的2R 、t 、F 等信息判断,若表明参数β显著不为零,即认为存在异方差性。

如果是小样本情况,Glejser 检验只能作为了解异方差性某些信息的一种手段。

4、White 检验方法。

(1) 检验条件,要求在大样本下(为什么?)。

(2) White 检验的基本步骤,以一个二元线性回归模型为例。 设模型为

12233t t t t Y X X u βββ=+++ 并且,设异方差与23,t t X X 的一般关系为

222122334253623t t t t t t t t X X X X X X v σαααααα=++++++ 其中t v 为随机误差项。具体操作如下

●求样本回归模型。 ●计算残差t e ,并求2t e 。

●用残差平方2t e 作为异方差2t σ的估计,并建立2t e 对22232323,,,,t t t t t t

X X X X X X 的辅助回归,即

22

2122334253623???????t t t t t t t e X X X X X X αααααα=+++++。

●由此计算统计量2nR ,其中n 为样本容量,2R 为辅助回归函数的可决系

数。

●提出假设

j H H ααα:,

0:1620===Λ中至少有一个不为零,6,,3,2Λ=j

2nR 渐进服从自由度为5(在本例中除了截距项以外,斜率系数有5项)的2χ分

布,给定显著性水平α,查2χ分布表得临界值)5(2

α

χ。 ●判断,计算2nR 值,如果2nR >)5(2

α

χ,则拒绝原假设,表明模型中随机误差存在异方差。

●注意,该检验的功效易受自由度的影响,一般地,当有k-1个解释变量时,

2χ分布的自由度为(1)/21k k --。

●Wooldridge (2000)指出在解释变量过多时,White 检验存在自由度减少的缺陷,因此,建议采用如下方法可较好弥补其不足。

设样本回归模型为

12233?????i i k ki

Y X X X ββββ=++++L 将Y 的拟合值平方,构建解释变量所有平方项和所有交叉乘积项的特殊函数

22012

??e Y Y v δδδ=+++ 其中,v 为随机误差项。

提出原假设H 0:120,0δδ==。则可根据估计结果的F 检验值判断是否存在异方差,这时,F 统计量服从自由度为(2,n-3)的F 分布。因此,便可根据显著性水平查得临界值,通过与F 统计量值比较,最终得到对模型异方差的检验。

●EViews 操作结果及判断分析。见实例。 5、ARCH 检验方法。 (1) 检验的步骤。 ●建立ARCH 过程

t p t p t t v ++++=--221102σασαασΛ 式中t v 为随机误差。

●提出假设,

j p H H αααα:;0:1210====Λ中至少有一个不为零p j ,,2,1Λ=

●对原模型进行回归,求残差e ,并计算残差平方序列2212,,,p t t t e e e --Λ。 ●求辅助回归

222011????t t p t p e

e e ααα--=+++L ●计算辅助回归得可决系数2R ,并且在H 0成立下,基于大样本,有2

)(R p n -渐进服从)(2p χ,因此,ARCH 检验要求为大样本。

●给定显著性水平α,查卡方分布表得临界值)(2

p αχ,如果2)(R p n ->

)(2p αχ,则拒绝原假设,表明模型中得随机误差存在异方差。

(2) ARCH 检验的EViews 操作及对结果的解释。

White 检验与ARCH 检验的共同特点是能比较方便地对异方差进行诊断,但ARCH 检验不能确定是哪一个解释变量以什么形式引起的异方差现象。

第四节 异方差性的补救措施

如果经过检验后模型中发现存在异方差,就需要采取必要的措施对异方差问题进行修正。基本想法是运用适当的估计方法,消除或减弱异方差性对模型的影响,以提高估计参数的精度。

一、加权最小二乘法(WLS )

1、加权最小二乘法的基本含义:在异方差性的情况下,由于不同的X i 使得u i 偏离均值的离散程度不一样,但是,在人们对总体异方差并无信息的情况下,要直接对异方差进行修正是很困难的。基于样本的信息,则存在当)(i u Var 的值较小时,残差e i 所提供的信息较少,这时需要给予重视,则对较小的2i e 给予较大的权数;而当)(i u Var 的值较大时,残差e i 所提供的信息较大,这时需要给予折扣,则对较大的2i e 给予较小的权数。从而,使得∑2i e 更好地反映)(i u Var 对残差平方和的影响程度。

2、按照上述意义,如果2i σ已知,则假设权数为2

1i i W σ=,(n i ,,2,1Λ=),

)()??

(2*2*1

2a X Y W e W i

i

i

i

i ∑∑--=ββ

对()a 运用最小二乘法,得参数估计式:

)(??*

*2

**1b X Y ββ-=

)(?2****

2

c x

W x y W i

i i i i

∑∑=

β

式中,*

i i

i

WY Y

W

=

∑∑,*

i i

i

W X X

W

=

∑∑,**i i y Y Y =-,**i i x X X =-。所以,加权最

小二乘法是对()a 式运用最小二乘法,所得的估计量称为加权最小二乘估计量。并且,当权数i W 为1或相同时,加权最小二乘估计量就是普通最小二乘估计量。

3、加权的结果,即对原模型中每一个变量进行转换,转换的目的使得随机误差满足同方差假定。

122**222

2

**12

2

2

**121()

1

1

(

)() 1.1??)()

1??()

i i i

i i

i

i i i i i i i

i

i i i

i

i

i

i i i

i

i

i

i i i i i

i i Y X u Y X u d u Var Var u Y X e d e e Y X f ββσσββσσσσσσσσ

ββσσσσββσσσσ=++=++=

===++????

=-- ???

????∑∑设模型为

当已知时,用去除上式,这时式(的样本回归函数为

由此可知,新的随机误差i

i

u σ的方差为同方差。 (练习:试说明式(a )与式(f )

等价)

二、对原模型变换的方法

基本思路:设模型为i i i u X Y ++=21ββ,并且i u 存在异方差。

(1)设)()(22i i i X f u Var σσ==()(i X f 的具体形式可由Glejser 检验得以

证实)。

(2)令权数为)

(1i X f ,将该权数同乘上述模型式的两端,这时新的随

机误差项为

)

(i i

X f u ,并且是同方差。事实上

2211

()()()()Var Var u f X f X f X σσ===

表明)

(i i

X f u 为同方差了。

(3))(i X f 可有如下若干种形式:

i i X X f =)( 2)(i i X X f = 210)()(i i X a a X f +=

注意,对模型变换的方法与加权最小二乘法是等价的。

三、模型的对数变换

1、对数变换的含义,对变量取对数强调应符合经济意义。

2、运用对数变换具有以下特点:

(1)对数变换可以缩小测定变量值尺度的差异。 (2)对数变换后的随机误差是相对误差。

12

''12'

'

??????ln ln ln ln ln()????ln()ln(1)????Y Y e e Y Y

Y Y X e e Y Y

Y

Y Y Y Y Y

e Y Y

Y Y e Y

ββα

α=++=-=++=-=+--=+=-≈(泰勒展式)

(3)对数变换模型(全对数模型)又称弹性不变模型,这在实际分析中有较强的应用意义。

四、举例

北京市人均储蓄与人均收入之间关系的实证分析。

五、几个证明的补充

(一)在异方差性条件下参数估计统计性质的证明 1、参数估计的无偏性仍然成立 设模型为

n i v X Y i i i ,,2,1,

21Λ=++=ββ (1)

用离差形式表示

i i i u x y +=2β (其中v v u i i -=) (2)

参数2β的估计量2

?β为 )

4()()()?()3()(?2

22

22

2

22

222

222

2

ββββββββ

=+=+=+

=+=+==∑

∑∑∑∑∑∑∑∑∑∑∑∑i

i i i

i i i

i i i

i

i i

i

i

i i

i

i

i x u x E x u x E E x

u x x

u x x x u x x x y x 在证明中仅用到了假定0)(=i i u x E 。

2、参数估计的有效性不成立

假设(1)式存在异方差,且222)var(i i i X u σσ==,则参数2β的估计2

?β的方差为

[]

()

2

2222

2

22

22*2?)?(?)?(???

? ??-+=-=-=∑∑βββββββi i i x u x E E E E Var ∑∑∑∑∑∑∑∑=≠=≠+=????

?

?

?+=???

?

?

?=222222222

2

)

()(2)()(2i

j

i j i j i j i i

i i j

i j i j i j i i i i i

i x u u E x x u

E x x u u x x u x E x u x E

∑∑∑∑∑∑∑∑∑?==

=

=

==222

2222

2222222222)()

()

()

(i

i

i i i i i i

j

i i

i i

j

i i

i

x

X x x x X x x x x u E x σ

σσ (5)

在上述推导中用了假定j i u u E j i ≠=,0)(。

下面对(2)式运用加权最小二乘法(WLS )。设权数为i

i z w 1

=

,对(2)式

变换为

i

i i i i i z u

z x z y +=2β (6)

可求得参数的估计2

?β,根据本章第四节变量变换法的讨论,这时新的随机误差项

i i z u 为同方差,即2)var(σ=i

i z u ,而 2

?β的方差为 ∑???

?

??=2

2

2)?var(i i wls

z x σβ (7)

为了便于区别,用(2?β)wls 表示加权最小二乘法估计的2

β,用(2?β)ols 表示OLS 法估计的2β。

比较(5)式与(7)式,即在异方差下用OLS 法得到参数估计的方差与用WLS 法得到参数估计的方差相比较为

()

()

()

()

∑∑∑∑∑∑∑∑∑???

? ??=????

??=?

???

??=222

22222

222

2

22222

2

22)?var()?var(i

i i

i i

i

i i i i i

i

i i i ols

wls

z x z x x x z x z x x x z x σσσσββ (8)

i

i i i i

i

b x z a z x ==,,由初等数学知识有

()12

2

2

≤∑∑∑b

a a

b ,因此(10)式右端有

()()

1222

2

2≤???

? ??∑∑∑i

i i i

i

z x z x x (9) 从而,有

ols

wls )?var()?var(22ββ≤ 这就证明了在异方差下,仍然用普通最小二乘法所得到的参数估计值的方差不再最小。

(二)对数变换后残差为相对误差的证明

事实上,设样本回归函数为

i

i i e X Y ++=21??ββ (10) 其中Y

Y e i i ?-=为残差,取对数后的样本回归函数为 *21ln ??ln e X Y ++=αα

(11) 其中残差为Y

Y e ?ln ln *-=,因此 )??

1ln()???ln()?ln(?ln ln *Y

Y Y Y Y Y Y Y Y Y

Y e -+=-+==-= (12) 对(12)式的右端,依据泰勒展式

ΛΛ+-++-+-=+-n

X X X X X X n

n 1432)1(432)1ln( (13) 将(13)式中的X 用Y

Y

Y ??-替换,则*e 可近似地表示为

Y

Y Y e ??*

-≈ (14)

即表明(11)式中的误差项为相对误差。

计量经济学异方差性参考答案讲解

第五章 异方差性课后题参考答案 5.1 (1)因为22()i i f X X =,所以取221i i W X =,用2i W 乘给定模型两端,得 31232222 1i i i i i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即 2 2221 ()()i i i i u Var Var u X X σ== (2)根据加权最小二乘法,可得修正异方差后的参数估计式为 ***12233???Y X X βββ=-- ()()( )()()( )( )** *2 ** * *222323 22 32 2 *2*2** 2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑ ∑ ∑∑∑∑ ()()()()()()( )** *2 ** ** 232222223 3 2 *2 *2** 2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑ ∑ ∑ ∑∑∑ 其中 2223 2***23222, , i i i i i i i i i W X W X W Y X X Y W W W = = = ∑∑∑∑∑∑ ***** *222333 i i i i i x X X x X X y Y Y =-=-=- 5.2 (1) 22222 11111 ln()ln()ln(1)1 u ln()1 Y X Y X Y u u X X X u ββββββββββ--==+≈=-∴=+ [ln()]0 ()[ln()1][ln()]11 E u E E u E u μ=∴=+=+=又 (2) [ln()]ln ln 0 1 ()11 i i i i P P i i i i P P i i E P E μμμμμμμ===?====∑∏∏∑∏∏不能推导出 所以E 1μ()=时,不一定有E 0μ(ln )= (3)对方程进行差分得: 1)i i βμμ--i i-12i i-1lnY -lnY =(lnX -X )+(ln ln

计量经济学课后答案第五章 异方差性汇总

第五章课后答案 5.1 (1)因为22()i i f X X =,所以取221i i W X =,用2i W 乘给定模型两端,得 31232222 1i i i i i i i Y X u X X X X βββ=+++ 上述模型的随机误差项的方差为一固定常数,即 2 2221 ()()i i i i u Var Var u X X σ== (2)根据加权最小二乘法,可得修正异方差后的参数估计式为 ***12233???Y X X βββ=-- ()()()() ()()() ***2*** *22232322 322*2*2** 2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑∑∑∑∑∑ ()()( )()()( )( )** *2 ** ** 232222223 3 2 *2 *2** 2223223?i i i i i i i i i i i i i i i i i i W y x W x W y x W x x W x W x W x x β-= -∑∑ ∑ ∑ ∑∑∑ 其中 2223 2***23222, , i i i i i i i i i W X W X W Y X X Y W W W = = = ∑∑∑∑∑∑ ***** *222333 i i i i i x X X x X X y Y Y =-=-=- 5.2 (1) 22222 11111 ln()ln()ln(1)1 u ln()1 Y X Y X Y u u X X X u ββββββββββ--==+≈=-∴=+ [ln()]0 ()[ln()1][ln()]11 E u E E u E u μ=∴=+=+=又 (2) [ln()]ln ln 0 1 ()11 i i i i P P i i i i P P i i E P E μμμμμμμ===?====∑∏∏∑∏∏不能推导出 所以E 1μ()=时,不一定有E 0μ(ln )= (3) 对方程进行差分得: 1)i i βμμ--i i-12i i-1lnY -lnY =(lnX -X )+(ln ln 则有:1)]0i i μμ--=E[(ln ln

计量经济学课件整理

计量经济学课件整理 第一章导论 一、计量经济学的发展历史 1926 年,计量经济学一词“ Econometrics ”最早由挪威经济学家弗里希( R.Frish ) 仿效生物计量学 (Biometrics )提出,但人们一般认为1930 年世界计量经济学会的成立及创办的刊物《Econometrics 》于1933 年的出版,标志着计量经济学的正式诞生。 计量经济学自诞生之日起,就显示出强大的生命力,经过40、50 年代的大发展和60年代的扩张,已在经济学中占有极其重要的地位,是当今西方国家经济类专业三门核心课程(宏观、微观、计量)之一。 计量经济学的重要地位还可以从诺贝尔经济学奖获得者的数量中反映出来,自1969 年设立诺贝尔经济学奖,首届获得者就是计量经济学的创始人弗里希和荷兰经济学家丁伯根,表彰他们开辟了用计量经济方法研究经济问题这一领域,之后,直接因为

对计量经济学的发展作出贡献而获奖者达9 人,因为在研究中应用计量经济方法而获奖者占获奖总数的三分之二。2000 年度,诺贝尔经济学奖获得者是詹姆斯.赫克曼和丹尼尔.麦克法登,原因是他们在微观计量经济学领域的贡献。200 3年诺贝尔经济学奖授予美国计量经济学家罗伯特?恩格尔和英国计量经济学家克莱夫?格兰杰,以表彰他们

分别用“随着时间变化的异方差性”和“协整理论”两 种新方法分析经济时间序列,从而给经济学研究和经济 发展带来巨大影响。 二、计量经济学的性质 计量经济学是以经济理论和经济数据的事实为依据, 运用数学和统计学的方法,通过建立数学模型(计量经 济模型)来研究经济数量关系和规律的一门经济学学 科。计量经济学(或经济计量学)是一门经济 学、统计学、数学的交叉学科,但归根到底是一门经济 学。 四、计量经济学的作用四、计量经济学的作用 1、结构分析:分析变量之间的数量比例关系分析变量 之间的数量比例关系。例如:边际分析、弹性分析、乘 计量经济学与其它学科的关系 数理 / 数理 ! \统计学/ 经济学 I,: J. / i | n 「u *. \ - , : / t P M O 於邁「1 — 2 Z >1;1- .rflh C M ■亠石 T

(完整word版)《计量经济学》各章主要知识点

第一章:绪论 1.计量经济学的学科属性、计量经济学与经济学、数学、统计学的关系; 2.计量经济研究的四个基本步骤 (1)建立模型(依据经济理论建立模型,通过模型识别、格兰杰因果关系检验、协整关系检验建立模型); (2)估计模型参数(满足基本假设采用最小二乘法,否则采用其他方法:加权最小二乘估计、模型变换、广义差分法等); (3)模型检验:经济意义检验(普通模型、双对数模型、半对数模型中的经济意义解释,见例1、例2),统计检验(T 检验,拟合优度检验、F 检验,联合检验等);计量经济学检验(异方差、自相关、多重共线性、在时间序列模型中残差的白噪声检验等); (4)模型应用。 例1:在模型中,y 某类商品的消费支出,x 收入,P 商品价格,试对模型进行经济意义检验,并解释21,ββ的经济学含义。 t t t P x y 31.0ln 25.0213.0ln -+=∧, 其中参数21,ββ都可以通过显著性检验。 经济意义检验可以通过(商品需求与收入正相关、与商品价格负相关)。 商品消费支出关于收入的弹性为0.25()/ln(25.0)/ln(11-∧ -=t t t t x x y y ); 价格增加一个单位,商品消费需求将减少31%。 例2:研究金融发展与贫富差距的关系,认为金融发展先使贫富差距加大(恶化),尔后会使贫富差距降低(好转),成为倒U 型。 贫富差距用GINI 系数表示,金融发展用(贷款余额/存款总额)表示。回归结果

为: 229.164.034.2t t t x x GINI -+=∧, 模型参数都可以通过显著性检验。 在x 的有意义的变化范围内,GINI 系数的值总是大于1,细致分析后模型变的毫无意义; 同样的模型还有:GINI 系数的值总是为负 231.1412.734.13t t t x x GINI -+-=∧。 3.计量经济学中的一些基本概念 数据的三种类型:横截面数据、时间序列数据、面板数据; 线性模型的概念;模型的解释变量与被解释变量,被解释变量为随机变量(如 果一个变量为随机变量,并与随机扰动项相关,这个变量称为内生变量),被解释变量为内生变量,有些解释变量也为内生变量。 第二章:回归模型 1.两个变量的相关关系,相关关系与随机因果关系的区别; 2.总体回归函数与线性总体回归函数; 3.一元与多元线性回归模型,回归模型的基本假设; 4.最小二乘估计的基本原理与最小二乘估计量的具体表达式,随机扰动项的方差的估计方法; 5.最小二乘估计的数值性质与最小二乘估计的统计性质,样本容量变化对统计性质的影响; 6.在回归模型中(包括对数模型)计量单位变化对模型参数估计的影响(例3); 7.样本回归直线及其性质;

计量经济学课件word版

《计量经济学》教学大纲 第一章绪论 教学目的和要求:掌握计量经济学的学科性质和研究内容,了解计量经济学发展简史;掌握计量经济学与其他学科之间的关系;掌握计量经济研究的运用步骤;了解计量经济学内容体系。 第一节计量经济学的涵义和发展 一、定义 计量经济学(Econometrics)是应用经济学的一个分支学科。它以一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技术,通过建立计量经济模型,定量分析经济变量之间的随机因果关系。 二、研究内容 定量分析经济变量之间的随机因果关系。 三、研究方法 建立并运用计量经济模型。 四、学科基础 经济学、统计学、数学和计算机技术。 五、计量经济学发展简史(略) 第二节计量经济学与其它学科的关系 一. 一.计量经济学与经济学 经济理论与数理经济学是计量经济学的理论基础,计量经济学利用各种具体数量关系以统计方式描述经济规律,可以验证和充实经济理论。 二. 二.计量经济学与统计学 经济统计学是对经济统计资料的收集、加工和整理,并列表图示,以描述整个观察期间的发展模式,或推测各种经济变量之间的关系。统计资料仅仅是计量经济研究的“素材”。 计量经济学要以经济统计学提供的经济统计指标及数据研究经济现象的定量关系。所以,计量经济研究也是对统计资料一种深层次“挖掘”和“开发利用”。 三. 三.计量经济学与数学 由于计量经济学研究的主要是随机关系,所以需要引入数理统计方法以及集合与矩阵等理论和方法,并在此基础上发展了计量经济方法,成为计量经济研究

的建模工具。数理统计学是计量经济学的数学理论基础。

第三节计量经济研究的步骤 一.模型设定 模型设定一般包括总体设计和个体设计。总体设计的目标是能正确反映经济系统的运行机制。个体设计的目标是能正确反映经济变量之间的因果关系。 ㈠研究经济理论 根据一定经济理论揭示影响研究对象的因素及其影响方向和作用大小。对同一经济问题,所依据的经济理论不同,所分析的影响因素和构造的计量模型就可能不同。 ㈡确定变量 选择变量必须正确把握所研究经济活动的经济学内容。 确定纳入模型中的变量的性质,即哪个是被解释变量,哪个或哪些是解释变量。 一般将将影响研究对象最主要的、定量的、经常发生作用的、有统计数据支持的因素纳入模型之中。 慎重使用虚拟变量。 ㈢确定模型的数学形式 一般有两种方式:一是根据经济行为理论,利用数理经济学推导出的模型形式;一是根据实际统计资料绘制被解释变量与解释变量的相关图。 ㈣设定模型中待估参数的符号和大小的理论期望值。 二、模型估计 ㈠样本数据 样本数据类型:时间序列数据,应用此类数据建模时要注意数据的口径和易使模型产生序列相关;截面数据,此类数据易使模型产生异方差性;虚变量数据;平行数据(混合数据)。 选择样本数据的出发点:模型的研究目的;模型的应用期限。 样本数据的质量:完整性,准确性,可比性。 ㈡模型识别 仅对联立经济计量模型而言,判断能否方程组估计出模型参数。 ㈢估计方法选择 根据模型特点和估计方法的应用条件进行选择。 ㈣软件使用

计量经济学-异方差性

计量经济学——异方差性 5.3解: (1)构建以家庭消费支出(Y)为被解释变量,家庭人均纯收入(X)为解释变量的线性回归模型: Y i=β1+β2X i+u i 建立Eviews文件,生成家庭消费支出(Y)、家庭人均纯收入(X)等数据,利用OLS方法估计模型参数,得到的回归结果如下图所示: Dependent Variable: Y Method: Least Squares Date: 11/05/14 Time: 00:56 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 179.1916 221.5775 0.808709 0.4253 X 0.719500 0.045700 15.74411 0.0000 R-squared 0.895260 Mean dependent var 3376.309 Adjusted R-squared 0.891649 S.D. dependent var 1499.612 S.E. of regression 493.6240 Akaike info criterion 15.30377 Sum squared resid 7066274. Schwarz criterion 15.39628 Log likelihood -235.2084 Hannan-Quinn criter. 15.33392 F-statistic 247.8769 Durbin-Watson stat 1.461684 Prob(F-statistic) 0.000000 即参数估计与检验的结果为 Y i=179.1916+0.719500X i (221.5775)(0.045700) t=(0.808709) (15.74411) R2=0.895260 F=247.8769 n=31 (2)利用White方法检验异方差,则White检验结果见下表: Heteroskedasticity Test: White F-statistic 7.194463 Prob. F(2,28) 0.0030 Obs*R-squared 10.52295 Prob. Chi-Square(2) 0.0052 Scaled explained SS 30.08105 Prob. Chi-Square(2) 0.0000 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 11/05/14 Time: 01:11 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob.

计量经济学课件(第1讲绪论)

绪论 一、计量经济学概述 1、什么是计量经济学 R.Frish(挪威)1926年提出:Ecnometrics 定义:经济学、数学及统计学的三者结合 三园图: 依据经济理论、数据资料为基础,运用数学、统计学和计算机技术,以建立经济计量模型为主要手段,定量分析带有随机性特征的经济变量之间关系的规律,验证或发展经济理论、评价经济政策及预测经济活动的一门应用经济学科。 例:前提假设条件:消费主要取决于收入、并随着收入增长呈线性增长、边际消费递减等,则可设定消费C及Y具有下述理论计量经济模型:

u Y C ++=βα 其中:100<<<βα、,u 为随机扰动项(表示:除收入外其它因素对消费的影响) 利用数据资料n i Y C i i ,...,2,1),,(= 并进一步作计量经济学假设:假设模型满足经典(古典)条件, 则可采用普通最小二乘法估计模型参数建立样本数据经验模型,比如 Y C 67.038.2+= 检验模型:t 检验、F 检验、拟合优度检验,经济理论检验、计量经济检验 应用: 2、计量经济学的特点 (1)计量性: (2)模型性: (3)随机性: (4)实证性: 3、计量经济学内容范畴 (1)经典计量经济分析模型和方法 单方程计量经济分析模型和方法(一元、多元线性回归模型和方法) 估计: OLS (普通最小二乘法)、ML (极大似然法)、

GMM(广义矩法)、 BAYES法 检验:t检验、F检验、拟合优度检验 预测:点预测、区间预测 联立方程计量经济分析模型和方法 识别:结构式法、简化式法 估计: IlS(间接)、2SLS(二阶段)、3SLS(三阶段)、LIML(有限 信息极大似然)、FLML(完全信息ML)、最小方差比等 预测:简化式的多重多元线性回归 (2)非经典计量经济分析模型和方法 异方差性线性回归模型(估计:GLS、WLS、数学变换法;检验) 自相关性线性回归模型(估计:GLS、广义差分变换;检验) 多重共线性线性回归模型 随机解释变量线性回归模型 非正态扰动线性回归模型 非线性回归模型 虚变量线性回归模型 误差变量线性回归模型

计量经济学:异方差性

异方差性 在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只是其中一个方面,本章将讨论违背基本假定的另一个方面——异方差性。虽然它们都是违背了基本假定,但前者属于解释变量之间存在的问题,后者是随机误差项出现的问题。本章将讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干方法。 第一节异方差性的概念

一、异方差性的实质 第二章提出的基本假定中,要求对所有的i (i=1,2,…,n )都有 2 )(σ=i u Var (5.1) 也就是说i u 具有同方差性。这里的方差2σ度量的是随机误差项围绕其均值的分散程度。由于0)(=i u E ,所以等价地说,方差2σ度量的是被解释变量Y 的观测值围绕回归线 )(i Y E =ki k i X X βββ+++ 221的分散程度,同方差性实际指的是相对于回归线被解释变 量所有观测值的分散程度相同。 设模型为 n i u X X Y i ki k i i ,,2,1221 =++++=βββ (5.2) 如果其它假定均不变,但模型中随机误差项i u 的方差为 ).,,3,2,1(, )(22n i u Var i i ==σ (5.3) 则称i u 具有异方差性。 由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,如图5.1所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则 )()(2 22i i i X f u Var σσ== (5.4) 图5.1 二、产生异方差的原因

由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的影响,导致随机误差项的方差相异。通常产生异方差有以下主要原因: 1、模型中省略了某些重要的解释变量 异方差性表现在随机误差上,但它的产生却与解释变量的变化有紧密的关系。如果计量模型本来应当为i i i i u X X Y +++=33221βββ,假如被略去了i X 3,而采用了 *221i i i u X Y ++=ββ (5.5) 当被略去的i X 3与i X 2有呈同方向或反方向变化的趋势时,i X 3随i X 2的有规律变化会体现在(5.5)式的* i u 中。如果将某些未在模型中出现的重要影响因素归入随机误差项,而且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的方差随之变化,即产生异方差性。在第四章已经讨论过,可以通过剔除变量的方法去避免多重共线性的影响,但是如果删除了重要的变量又有可能引起异方差性。这是在建模过程中应当引起注意的问题。 2、模型设定误差 模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。 3、测量误差的变化 样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。例如生产函数模型,由于生产要素投入的增加与生产规模相联系,在其他条件不变的情况下,测量误差可能会随生产规模的扩大而增加,随机误差项的方差会随资本和劳动力投入的增加而变化。另一方面当用时间序列数据估计生产函数时,由于抽样技术和数据收集处理方法的改进,观测误差有可能会随着时间的推移而降低。 4、截面数据中总体各单位的差异 通常认为,截面数据较时间序列数据更容易产生异方差。例如,运用截面数据研究消费和收入之间的关系时,如果采取不同家庭收入组的数据,低收入组的家庭用于购买生活必需品的比例相对较大,消费的分散程度不大,组内各家庭消费的差异也较小。高收入组的家庭有更多自由支配的收入,家庭消费有更广泛的选择范围,消费的分散程度较大,组内各家庭

计量经济学重点(简答题)

计量经济学重点(简答题) 一、什么是计量经济学?计量经济学,又称经济计量学,它是以一 定的经济理论和实际统计资料为依据,运用数学、统计学和计算机技术,通过建立计量经济学模型,定量分析经济变量之间的随机因果关系.。 二、计量经济学的研究的步骤是什么? 1)理论模型的设计 A.理论或假说的陈述; B.理论的数学模型的设定; C.理论的计量经济模型的设定。 i.把模型中不重要的变量放进随机误差项中; ii.拟定待估参数的理论期望值。 2)获取数据 数据来源:网络、统计年鉴、报纸、杂志 数据类别:时间序列数据、截面数据、混合数据、虚变量 数据。 数据要求:完整性、准确性、可比性、一致性 i.完整性:模型中包含的所有变量都必须得到相同容量 的样本观察值。 ii.准确性:统计数据或调查数据本身是准确的。

iii.可比性:数据口径问题。 iv.一致性:指母体与样本的一致性。 3)模型的参数估计:普通最小二乘法。 4)模型的检验:经济学检验;统计学检验;计量经济学检验; 模型的预测检验。 5)模型的应用:结构分析;经济预测;政策评价;经济理论的 检验与发展。 三、简述统计数据的类别? 时间序列数据、截面数据、混合数据、虚变量数据。 1)时间序列数据:按时间先后排列收集的数据。 采纳时间序列数据的注意事项: A.所选择的样本区间的经济行为一致性问题。 B.样本数据在不同样本点之间的可比性问题。 C.样本数据过于集中的问题。不能反映经济变量间的结构关 系,应增大观察区间。 D.模型的随机误差项序列相关问题。 2)截面数据:又称横向数据,是一批发生在同一时间截面上的 调查数据。研究某时点上的变化情况。 采纳截面数据的注意事项: A.样本与母体的一致性问题。 B.随机误差项的异方差问题。

计量经济学截面数据异方差检验

某家庭对某种消费品的消费需要研究 一、经济理论陈述,变量确定 某家庭对某消费品的消费需要可以由该家庭的消费支出来表示,消费支出受商品价格、家庭月收入两个因素影响。用EVIEWS软 件对相关数据进行了多元回归分析,得出了相关结论。 其中,被解释变量为:对某商品的消费支出(丫) 解释变量为:商品单价(X1 )、家庭月收入(X2) 二、模型形式的确定:散点图通过OLS可得模型的散点图如 下: 20000 15000 10000 5000 550 600 G50 700 750 800 从散点图可以看出该家庭对某商品的消费支出(丫)和商品单价(X1 )、家庭月收入(X2 )大体呈现为线性关系,三、建立 模型利用书P105页第11题数据,建立截面数据的计量经济模

型, 并进行回归分析。假设建立如下线性二元回归模型: Y=C+ B 1X计B 2X2+ 卩 其中,Y表示对某商品的消费支出,X1表示商品单价,X2表示家庭月收入,□表示随机误差项。 1、参数估计: 假定所建模型及随机扰动项□满足古典假定,可以用OLS 法估计其参数,运用计算机软件EViews作计量经济分析。 通过OLS可得: Dependent Variable: Y Method' Least Squares Date: 11/26/08 Time: 20:25 Sample:1 10 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. c626.509340 13010 15.61195 □.DC00 X1 -9790570 3.197843-3.061617 0.0183 X2 0.02861 B 0.005838 4 902030 0.0017 R-squared0.902218 Mean depende nt var670.3300 Adjusted R-squared0 874281S.D. dependent var49.04504 S.E. of regression 117.30905 Akaike info criterion 8.792975 Sum squared resid 2116.847 Schwarz criterion S 883751 Log likelihood-40.96488 F-statistic 32.2940B Durbin-Watson stat 1.650804Prob(F-statistic) 0.000292 参数和估计结果为: 丫=626.5093-9.79057 X1+0.028618 X2 2、经济意义检验

计量经济学名词解释

1、计量经济学 计量经济学是一门从数量上研究物质资料的生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学。 2、数据质量 数据满足明确或隐含需求程度的指标 3、相关分析 主要研究变量之间的相互关联程度,用相关系数表示。包括简单相关和多重相关(复相关)。 4、回归分析(Regression Analysis) 研究一个变量(因变量)对于一个或多个其他变量(解释变量)的数量依存关系。其目的在于根据已知的解释变量的数值来估计或预测因变量的总体平均值。 5.内生变量 指由模型系统内决定的变量,取值在系统内决定 6、面板数据 时间序列数据和截面数据的混合 7.异方差: 总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,则称线性回归模型存在异方差性。 8.自相关 自相关是在时间序列资料中按时间顺序排列的观测值之间的相关或在横截面资料中按空间顺序排列的观测值之间的相关 9.多重共线性

解释变量之间存在完全的线性关系或近似的线性关系。解释变量存在完全的线性关系叫完全多重共线;解释变量之间存在近似的线性关系叫不完全多重共线。 10.虚拟变量 虚拟变量:在建立模型时,有一些影响经济变量的因素无法定量描述 构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D 11.平稳序列 是指时间序列的统计规律不会随着时间的推移而发生变化。 12.伪回归 所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。 13.协整 所谓协整,是指多个非平稳变量的某种线性组合是平稳的 14.前定变量 所有的外生变量和滞后的内生变量。前定变量=外生变量+滞后内生变量+滞后外生变量 15.恰好识别 恰好识别:能够唯一地估计出结构参数值。 16.结构式模型 体现经济理论中经济变量之间的关系结构的联立方程模型,称为结构式模型17.过度识别 过度识别:结构参数的估计值具有多个确定值 18.自回归模型

计量经济学知识点整理:异方差

(2)X-~e i 2的散点图进行判断异方差性 1、定义: 如果出现即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。 同方差性:σi2 = 常数 ≠ f(Xi) 异方差时:σi2 = f(Xi) 2、后果: 参数估计量非有效 OLS 估计量仍然具有无偏性,但不具有有效性 因为在有效性证明中利用了 E(μμ’)=σ2I 而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。 变量的显著性检验失去意义 变量的显著性检验中,构造了t 统计量如果出现了异方差性,估计的S 出现偏误则t 检验失去意义。其他检验也是如此。 模型的预测失效 一方面,由于上述后果,使得模型不具有良好的统计性质;另一方面在预测的置信区间中,同样包含参数方差的估计量。所以,当模型出现异方差性时,参数OLS 估计值的变异程度增大,从而造成对Y 的预测误差变大,降低预测精度,预测功能失效。 3、检验: 检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。 图示法 (1)用X-Y 的散点图进行判断,看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中) 看是否形成一斜率为零的直线 帕克(Park)检验与戈里瑟(Gleiser)检验 偿试建立方程: i ji i X f e ε+=)(~2Var i i ()μσ=2

i ji i X e εασ++=ln ln )~ln(22i e X X f ji ji εασ2)(=)12,12(~)12 (~)12(~2122------------=∑∑k c n k c n F k c n e k c n e F i i 选择关于变量X 的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。 如: 帕克检验常用的函数形式: 若α在统计上是显著的,表明存在异方差性。 戈德菲尔德-奎恩特(Goldfeld-Quandt)检验 ①将n 对样本观察值(Xi,Yi)按观察值Xi 的大小排队 ②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的相同的两个子样本,每个子样样本容量均为(n-c)/2,即3n/8 ③对每个子样分别进行OLS 回归,并计算各自的残差平方和 ④在同方差性假定下,构造如下满足F 分布的统计量 ⑤给定显著性水平α,确定临界值F α(v1,v2), 若F> F α(v1,v2), 则拒绝同方差性假设,表明存在异方差。 怀特(White )检验 然后做如下辅助回归 可以证明,在同方差假设 下:R2为(*)的可决系数, h 为(*)式解释变量的个数。 (1) 辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。 (2)如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t 检验值较大。 (3)在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。 4、修正(加权最小二乘法WLS ) i i i i X X Y μβββ+++=22110

计量经济学:异方差性

计量经济学:异方差性 在现实经济活动中,最小二乘法的基本假定并非都能满足,上一章介绍的多重共线性只是其中一个方面,本章将讨论违背基本假定的另一个方面——异方差性。虽然它们都是违背了基本假定,但前者属于解释变量之间存在的问题,后者是随机误差项出现的问题。本章将讨论异方差性的实质、异方差出现的原因、异方差的后果,并介绍检验和修正异方差的若干方法。

第一节 异方差性的概念 一、异方差性的实质 第二章提出的基本假定中,要求对所有的i (i=1,2,…,n )都有 2 )(σ=i u Var (5.1) 也就是说i u 具有同方差性。这里的方差2σ度量的是随机误差项围绕其均值的分散程度。由于0)(=i u E ,所以等价地说,方差2σ度量的是被解释变量Y 的观测值围绕回归线)(i Y E =ki k i X X βββ+++ 221的分散程度,同方差性实际指的是相对于回归线被解释变量所有观测值的分散程度相同。 设模型为 n i u X X Y i ki k i i ,,2,1221 =++++=βββ (5.2) 如果其它假定均不变,但模型中随机误差项i u 的方差为 ).,,3,2,1(, )(22n i u Var i i ==σ (5.3) 则称i u 具有异方差性。 由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,如图 5.1所示,所以进一步可以把异方差看成是由于某个解释变量的变化而引起的,则 )()(222i i i X f u Var σσ== (5.4)

图5.1 二、产生异方差的原因 由于现实经济活动的错综复杂性,一些经济现象的变动与同方差性的假定经常是相悖的。所以在计量经济分析中,往往会出现某些因素随其观测值的变化而对被解释变量产生不同的影响,导致随机误差项的方差相异。通常产生异方差有以下主要原因: 1、模型中省略了某些重要的解释变量 异方差性表现在随机误差上,但它的产生却与解释变量的变化有紧密的关系。如果计量模型本来应当为i i i i u X X Y +++=33221βββ,假如被略去了i X 3,而采用了 *221i i i u X Y ++=ββ (5.5) 当被略去的i X 3与i X 2有呈同方向或反方向变化的趋势时,i X 3随i X 2的有规律变化会体现在(5.5)式的*i u 中。如果将某些未在模型中出现的重要影响因素归入随机误差项,而且这些影响因素的变化具有差异性,则会对被解释变量产生不同的影响,从而导致误差项的方差随之变化,即产生异方差性。在第四章已经讨论过,可以通过剔除变量的方法去避免多重共线性的影响,但是如果删除了重要的变量又有可能引起异方差性。这是在建模过程中应当引起注意的问题。 2、模型设定误差 模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。 3、测量误差的变化 样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。例如生产函数模型,由于生产要素投入的增加与生产规模相联系,在其他条件不变的情况下,测量误差可能会随生产规模的扩大而增加,随机误差项的方差会随资本和劳动力投入的增加而变化。另一方面当用时间序列数据估计生产函数时,由于抽样技术和数据收集处理方法的改进,观测误差有可能会随着时间的推移而降低。 4、截面数据中总体各单位的差异 通常认为,截面数据较时间序列数据更容易产生异方差。例如,运用截面数据研究消费和收入之间的关系时,如果采取不同家庭收入组的数据,低收入组的家庭用于购买生活必需

相关文档
相关文档 最新文档