基于ARIMA模型对河南省2010年GDP预
测
摘要:ARIMA模型是对ARMA模型的差分得到的平稳时间序列模型,具有序列相关性,本文收集了1978-2009年河南省GDP数据,根据ARIMA模型的性质、利用统计软件对河南省2010年GDP进行预测。
关键字:平稳性、ARMA模型、ARIMA模型
由于2008年金融海啸的全面性的爆发,我国的整体经济水平难免呈现不良的发展趋势,4万亿的救市计划,终于达到2009年的保八目标。在这个时候如果对我国GDP进行预测,难免有些偏差,因此本文选择受金融危机影响较小、地处中原、经济持续平稳增长的河南省为例,收集改革开放30年来的数据对2010年的GDP进行预测。GDP时间序列具有明显的增长趋势,因此ARMA模型显然的不稳定的,基于ARMA模型进行差分,发现二次差分的结果不仅稳定,而且表示出良好的序列相关性,所以能用ARMIMA模型对为例GDP 进行预测。比较原始值GDP和预测值GDPF,两曲线吻合的比较好。
一、ARIMA模型的建立
时间序列模型有四种:自回归模型AR、移动平均模型MA、自回归移动平均模型ARMA、自回归差分移动平均模型ARIMA,可以
说前三种都是ARIMA 模型的特殊形式。
1. 自回归模型AR(p)
p 阶自回归模型记作AR(p),满足下面的方程:
t p t p t t t y y y c y εφφφ+++++=--- 2211
其中:参数 c 为常数;1,2 ,…,p 是自回归模型系数;p 为自回归模型阶数;t ε是均值为0方差为 2σ 的白噪声序列。
2. 移动平均模型MA(q)
q 阶移动平均模型记作MA(q) ,满足下面的方程:
q t q t t t y ---+++=εθεθεθμ 2211
其中:参数μ为常数;q θθθ,,,21 是 q 阶移动平均模型的系数;
t ε是均值为0,方差为2σ 的白噪声序列。
3. ARMA(p,q)模型
q t q t t p t p t t y y c y ----++++++=εθεθεφφ 1111 显然此模型是模型AR(p)与MA(q)的组合形式,称为混合模型,常记作ARMA(p,q)。当 p=0 时,ARMA(0, q) = MA(q);当q = 0时,ARMA(p, 0) = AR(p)。
4. ARIMA (p,d,q )模型
对于非平稳序列,经过几次差分后,如果能得到平稳的时间序列,就称这样的序列为单整序列。设t y 是 d 阶单整序列,记作:t y ~ I(d),则
t d
t
d t y L y w )1(-=?= t w 为平稳序列,即t w ~ I(0) ,于是可以对t w 建立ARMA(p,q) 模
型 :
q t q t t p t p t t w w c w ----+++++++=εθεθεφφ 1111 如果时间序列{}t y 经过d 次差分后是一个ARIMA(p,q)过程,则称原时间序列是一个p 阶自回归、d 阶求整、q 阶移动平均过程,记作ARIMA (p,d,q ),d 代表差分的次数。 二、基于ARIMA 模型对河南省GDP 进行预测
改革开放以来,随着对传统的计划经济体制的一系列突破,河南经济焕发出新的生机和活力,国民经济不断跃上新台阶。改革开放之初的1978年全省GDP 总量仅为162.92亿元,1991年跨上千亿元台阶,2000年GDP 突破5000亿元,2005年GDP 突破1万亿元大关,未来两三年内有望进一步突破20000亿元大关。在全国各省市的排位由1978年的第9位上升到2009年的第5位,居中西部地区首位。30年来全省GDP 以年均11.2%的速度增长,高于同期全国平均水平1.4个百分点。河南省1978--2009年的GDP 以及取对数后时间序列图如下:
(Y=ln(GDP) 单位:亿元数据来自全球EPS数据库)博克斯—詹金斯的建模思想如为:
根据博克斯—詹金斯的建模ln(GDP)进行识别、估计、诊断、预测。
1.模型识别
在识别阶段,我们可以利用自相关函数和偏自相关函数来试探性用ARIMA模型表现数据的产生机制。
根据上表中的数据,用Eviews计算GDP的对数Y的自相关函数和偏自相关函数的表如下:
从上图可以看出,GDP 的对数Y 的自相关函数随着时间的间隔的增加,很缓慢的下降,因此序列Y 是非平稳的。这些年来GDP 有明显的增长趋势从中也可以判断Y 不是平稳的,可以对此序列进行差分。
现在对Y 进行一次差分,令y1=d(y)则: 11--=?=t t t y y y y
用Eviews 对y1分析,其相关图和散步图如下:
0.00
0.050.100.150.200.250.300.3580
85
90
9500
05
Y1
从y1的相关图没有观察到相关函数和偏自相关函数急剧下降的情况,不能判断时间序列是平稳的还是非平稳的。从y1的散步图的分布图可以判断此序列是非平稳的。
现在对y1进行差分,即y 的二次差分。令y2=d(y1)
2
12)(12--+-=??=?=t t t t y y y y y y
用Eviews 对y2分析,其相关图和散步图如下:
-0.2
-0.1
0.0
0.1
0.2
80
85
90
9500
05
Y2
无论从y2的相关图,还是从其散步图的分布来看,均可以判断y2是平稳的,所以y2可以用ARMA 模型来拟合,即ln(GDP)可以
用二阶求整的ARIMA过程来拟合。
2.估计
经差分过程得到平稳的时间序列后,要估计模型中所含的自回归和移动平均项的参数。由于ARMA涉及非线性估计问题,我们用数据处理软件对此估计。
非平稳的ln(GDP),经差分得到平稳的时间序列y2,根据适应性期望模型的思路进行对y2的ARMA拟合。分别对ARMA(1,1)、ARMA(1,2)、ARMA(2,1)、ARMA(2,2)做回归,然后根据赤池信息准则得到ARMA(1,2)的AIC值最小,所以样本模型的参数为P=1,Q=2。回归结果如下:
方程为:
3.诊断
在选定ARIMA (1,2,2)后诊断的目的就是看所选的模型对数据拟合的是否够好。为了选取正确的ARIMA 模型,需要有高度的技巧。对所选模型的一个简单的检验,是看从该模型估计算出来的残差是不是白噪声;如果是,就可以接受这个拟合;如果不是就需进行修改,知道残差是白噪声为止。
Y2的ARMA (1,2)残差的相关函数与非相关函数分布如下:
残差的自相关函数的AC 值和偏自相关函数的PAC 值全部落
在置信区间内。因此残差服从白噪声分布,所以说模型ARIMA 参数选择是正确了,拟合的效果能符合要求。
4.预测
依据时间序列数据进行预测的方法有五种:指数平滑法、单一方程回归法、联立方程回归模型、自回归求积移动平均模型以及向量自回归模型。在这里我用指数平滑法预测。
指数平滑法是针对给定时间序列的历史数据拟合出一条适当曲线的基本方法。将样本容量扩大到预测点2010年选择静态预测。
根据估计结果,y2超前一期的预期模型为:
2008
200920092010225786.0725512.0227692.0000247.02εε?-?-?+-=y y
=0.038132
()()
29
.21157))(ln(2ln 2201020102
2010
2=??=?=GDP GDP y GDP y 即预测河南省2010年的GDP 值为21157.29亿元。 三、总结
河南省历年GDP 值与预测值GDPF 的散步图分布如下,从整体分布来看比较吻合。
5000
10000
15000
20000
25000
80
85
9095
00
05
根据预测的结果河南省2010年的GDP 将达到21157.29亿元,比2009年增长9.24%。
ARMA 模型预测方法是当前比较先进的时间序列预测方法,它真实地刻画动态变化规律,在一定的要求下可以为经济做判断与预测,具有良好的政策性指导意义。它根据时间序列反映出来的规律和发展趋势进行推导和延伸,从而预测以后时期可能达到的水平。但是
这种预测方法适合短期预测,预测长期将出现较大的偏差,因此本文只预测了2010年河南省GDP值。ARMA的不足之处是ARMA模型对突发时间影响因素模拟不够精确,所以预测值仅作参考。
参考文献:
[1]古扎拉蒂著,林少宫译.计量经济学基础[M].北京:中国人民大学出版社,2005
[2]郝香芝,李少颖.我国GDP时间序列的模型建立与预测[J].统计与决策.2007年第23期
[3]高铁梅.计量经济学分析方法与建模[M].北京:清华大学出版社,2005
[4]张卫国.以ARIMA模型估计2003年山东GDP增长速度[J].东岳丛林.2004年第1期