第12章自相关:误差项相关会怎么样?
1.自相关的性质是什么?
22.自相关会导致什么理论上和实际上的后果?
3.怎样知道一个任给的情况中是否有自相关?
4.怎样补救自相关的问题?
12.1 自相关的性质
自相关的含义:按时间(时间序列数据)或空间(横截面数据)排列的观测值序列的成员之间的相关。经典线性回归模型假定在干扰项之间不存在自相关:
cov(,|x ,x )()(320..5)i j i j i j u u E u u i j
==≠出现自相关时则为
()(12.1.1)
0i j i j
E u u ≠≠出现自相关时,则为:将自相关和序列相关看成同义语。
自相关产生的原因
?惯性:GNP 、价格指数、生产、就业和失业等时间序列变量都呈现出商业循
变量都呈现出商业循环。?设定偏误:应含而未含变量(excluded variables )比如:
)2.1.12(4433221t
t t t t u X X X Y ++++=ββββ时间消费者收入牛肉价格牛肉需求量其中:===X X Y i ,,,32时间。猪肉价格==t X ,4由于某种原因,把回归做成:
)
3.1.12(33221t t t t v X X Y +++=βββ在猪肉价格影响牛肉消费的情形下残差v 在猪肉价格影响牛肉消费的情形下,残差将表现出某种系统的模式。
v
?设定偏误:不正确的函数形式
假如在成本—产出研究中,“真实”模型为:
i
i i i u +++=2321)4.1.12(:
但我们拟合了以下模型产出产出边际成本βββi i i i
i i u v v +=++=2321)
5.1.12(产出于是有:产出边际成本βαα由于函数形式的错误使用,残差将反映出自相关性质?蛛网现象(Cobweb phenomenon )
供给对价格的反应要滞后个时期供给对价格的反应要滞后一个时期
)
6.1.12(121t t t u ++=?价格供给ββ
?滞后效应
在消费支出对收入的时间序列回归中,当期消费还会受到前期消费水平的影响:
这种带有因变量的滞后值的回归也叫自回归(auto
1231 (12.1.7)
t t t t u βββ?=+++消费收入消费auto-regression )
?数据的“编造”
从月度数据计算得出季度数据,会减小波动,引进匀滑作用,使扰动项出现系统性模式
数据的内插(interpolation )
p 数据的外推(extrapolation )
?数据的变换
12t t t
Y X u ββ=++水平值形式
11211t t t Y X u ββ???=+++1211
()t t t t t t Y Y X X u u β????=??阶差分形式
2t t t Y X v βΔ=Δ+一阶差分形式?非平稳性等其他原因
一般经验告诉我们,对于采用
般经验告诉我们,对于采用时间序列数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其他因素在时间上的连续性,带来它们对被解释变量的影响的连续性,所以往往存在序列相关性。
注:自相关一般出现在时间序列数据中,但也可能出现在横截面数据中。
12.2 自相关出现时的OLS 估计量
对于双变量回归:
12(1221)t t t
t Y X u u ββ=++<<可能由不同的机制产生。一种可能是:
111(12.2.1)
,t t t coefficient of autocovarianc u u e ρερρ?=+?其中被称为自协方差系数()0t OL E S εε=并且是满足下述标准假定的随机干扰:
()
2var()(12.2.2)
t t εσ==≠cov(,)0
0t t s s εε+(12.2.1)马尔可夫一阶自回归模式,或一阶自回归模()式被称为马尔可夫阶自回归模式或阶自回归模式,记做AR (1),因此又称为一阶自相关系数或滞后1期的自相关系数。
ρ
给定AR (1)模型可以证明
222var()()1t t u E u εσ==?2
2cov(,)()1s t t s t t s u u E u u ερ
σρ+?==?(,)s
t t s cor u u ρρ+=(2):
AR 1122t t t t
u u u ρρε??=++
u 还可能由下述机制产生:
1
t t t t u v v λ?=+其中,v 是有零均值和恒定方差的一个随机干扰项,是常数,λ1
<λ称为一阶移动平均,或MA (1)模式。
11t ARMA u )过程产生:
,(是由此外,还可以假定)
4.2.12(11??++=t t t t v v u u λρARMA (1,1)过程是一阶自回归和一阶移动平均两过程的组合。
222
?(12.2.6)i i
OLS x y ββ=∑的估计量是:
2?1i
i n n x u AR β??
∑在由()模式产生的情形下,的方差为:
212
2123
12122
22?var()1222(12.2.8)t t t t n t t n AR n n n t x x x
x x x x x x x σβρρρ???==??
??=++++??∑∑∑"1112
?t
t t t t t σ
===????
∑∑∑对照:没有自相关情形:
22
var()(12.2.7)t
x β=∑一般而言221??var()var()AR ββ,我们无法知道和哪一个大
22??12.2.612.2.8ββ如果我们使用()中的,但使用()中的方差公式,可以证明,仍然是线性的和无偏的,但不是最优的,即不具有最小方差
12.3 BLUE 自相关出现时的估计量
21A R B L U E β对于双变量模型,假定()过程,的估计量为:
112()()
?(12.3.1)n t t t t G L S t x x y y C
ρρβ??=??=+∑2212
()n t t t x x ρ?=?∑一222?var (12.3.2)G L S n C D σβ=+∑其中是校正因子,实际中可忽略。其方差是:
12()
t t t x
x D ρ?=?其中也是实际中可以忽略的一个校正因子
GLS 估计量最大限度地利用了现有的信息,在出现自相关情形下是BLUE
(12.2.8),尤其(12.2.7),都没有给出最小方差。
12.4 出现自相关时使用OLS的后果
现自相时使用的果考虑到自相关的OLS估计
忽视自相关的OLS估计
1. 残差方差很可能低估了真实的;2
σ22??/(2)i u n σ=?∑2. 高估了;
2R 2?var()β3. 可能低估了
;2(1)?var()AR β4检验都不再可靠了
4. 通常的t 和F 检验都不再可靠了。2
?(22var()t
x σβ=∑n n ??∑2122123121222
2?var()1222t t t t n t t n AR n n n t x x x x x x x x x
x σβρρρ???==????=++++??∑∑∑"111t t t t t t ===????∑∑
变量的显著性检验失去意义
在变量的显著性检验中,统计量是建立在参数方差正
在变量的显著性检验中统计量是建立在参数方差正确估计基础之上的。当存在序列相关时,参数的OLS估计量的方差增大,标准差也增大,因此实际的t 统计量变小,从的方差增大标准差也增大因此实际的t统计量变小从而接受原假设的可能性增大,t检验就失去意义。
模型的预测失效
区间预测与参数估计量的方差有关在方差有偏误的情况区间预测与参数估计量的方差有关,在方差有偏误的情况下,使得预测估计不准确,预测精度降低。
12612.6
侦察自相关图解法
经典模型的非自相关假定是对不可直接观测的总体干扰而言的,然而是无法获知的。
t u u 但对做一图象检查,往往可以对中可能存在的自相关提供一些线索。t u ?t u t 自相关提供些线索。残差图形的生成和分析,作为统计分析的一个标准部分,其重要性无论怎样强调都不过分。
可以将残差和标准化残差()对时间i l t u ?σ??t u
描点得到的时间顺序图(time sequence plot )
该图表明,也许不是随机的u t
1??1t t u u AR ?也可用对描点,这是对()方案的一种经验检验。