当前位置：文档库 › 时间序列论文(国内生产总值的预测)

时间序列论文(国内生产总值的预测)

文档收集于互联网，已重新整理排版.word 版本可编辑.欢迎下载支持.

1文档来源为:从网络收集整理.word 版本可编辑.

江西财经大学 2015 ～ 20 16学年第二学期期末考试

论文题目：

关于国内生产总值的时间序列分析及

预测

课程编码 06163 选课班 A01

课程名称时间序列分析任课教师万兆泉

学号姓名

学院统计学院专业会统核算

考试时间 2016年6月21日星期二

江西财经大学2015～2016第二学期课程论文考试评分表课程名称及代码：时间序列分析06163 提交时间：2016年6月21日星期二

注：教师提供选题者，选题项不予评分

任课教师：万兆泉

摘要

国内生产总值（Gross Domestic Product，简称GDP）是指一个（国界范围内）所有常住单位在一定时期内生产的所有最终产品和劳务的市场价值。GDP是国民经济核算的核心指标，也是衡量一个国家或地区总体经济状况重要指标。近日，随着2012年世界各国GDP实力排名的发出，关于中国成为世界第二大经济强国的说法越来越多。本文从《中国统计年鉴》中选取中国1952 年2014 年共52年的GDP 作为数据，运用时间序列分析的基本的分析方法随机时序分析，对数据进行绘图分析、模型识别、参数估计、模型估计，模型拟合、建立GDP 时间序列模型、模型检验，应用选定时间序列方法预测未来GDP，并对未来中国的经济发展做出短期预测，为政府制定经济发展战略提供依据。

【关键词】：国内生产总值GDP；时间序列；ARIMA模型

一、背景 (1)

二、基础数据 (2)

三、数据分析 (2)

1、平稳性检验及平稳化处理 (2)

2. 纯随机性检验 (5)

3. 时间序列模型的建立 (6)

3.1模型定阶 (6)

3.2参数估计 (9)

3.3模型检验 (10)

4.国民生产总值的预测及分析 (11)

四、结论 (12)

附录 (12)

一、背景

上世纪80年代初，中国开始研究联合国国民经济核算体系的国内生产总值（GDP）指标。中国于1985年开始建立GDP核算制度。1993年，中国正式取消国民收入核算，GDP 成为国民经济核算的核心指标。

23年国家统计局宣布中国将改进GDP核算与数据发布制度，取消容易引起误解的预计数，建立定期修正和调整GDP数据的机制，在发布GDP数据的同时发布相关的重要数据，必要时还将公布核算方法。这是中国提高GDP数据的准确性和透明度，向国际通行办法迈进的重要一步。

2014年国家统计局将积极稳妥的推进国家统一核算地区生产总值，深化固定资产投资统计，加快改进能耗统计进一步完善社会消费品零售统计，同时将精心组织实施第三次全国经济普查认真做好普查登记。尽快制定经济核算图，指定全国统一的核算办法，为2015年正式实施全国统一的核算GDP来打下一个基础。此举将有效消除近10年来各省GDP总和与国家统计局核算的全国GDP存在较大出入的情况。

国民生产总值（）是一个国民概念，是指某国国民所拥有的全部生产要素在一定时期内所生产的最终产品的市场价值。举例说明：一个在日本工作的美国公民所创造的财富计入美国的GNP，但不计入美国的GDP，而是计入日本的GDP。在1991年之前，美国均是采用GNP 作为经济总产出的基本测量指标，后来因为大多数国家都采用GDP，加之国外净收入数据不足，GDP相对于GNP来说是衡量国内就业潜力的更好指标，易于测量，所以美国才改用GDP。

在季度GDP核算时，将所有可以在核算时获得的、适用的经济统计调查数据都用于GDP 核算。资料来源主要包括两部分：

一是国家统计调查资料，指由国家统计系统实施的统计调查获得的各种统计资料，如农林牧渔业、工业、建筑业、批发和零售业、住宿和餐饮业、房地产业等统计调查资料、服务业抽样调查资料、人口与劳动工资统计资料、价格统计资料等。

二是行政管理部门的行政记录资料，主要包括：财政部、中国人民银行、国家税务总局、保监会、证监会等行政管理部门的相关数据，例如中国人民银行的金融机构本外币信贷收支情况、国家税务总局分行业的税收资料等。

GDP核算有三种方法，即、、，三种方法从不同的角度反映国民经济生产活动成果，理论上三种方法的核算结果相同。

生产法是从生产的角度衡量常住单位在核算期内新创造价值的一种方法，即从国民经济各个部门在核算期内生产的总产品价值中，扣除生产过程中投入的中间产品价值，得到增加值。核算公式为：增加值=总产出-中间投入。收入法是从生产过程创造收入的角度，根据生产要素在生产过程中应得的收入份额反映最终成果的一种核算方法。按照这种核算方法，增加值由劳动者报酬、生产税净额、固定资产折旧和营业盈余四部分相加得到。支出法是从最终使用的角度衡量核算期内产品和服务的最终去向，包括最终消费支出、资本形成总额和货物与服务净出口三个部分。

发布的季度GDP是以生产法为基础核算的结果。

而本文的数据摘自中经网统计数据库，使用了中国1952-2014年的GDP数值。

二、基础数据

下面以中国1952—2014年国内生产总值数据(见表1-1)为例，选取最为合理的预测方法对未来5年GDP 的做出预测。

表1-1 中国1952—2014年国内生产总值（单位：亿元）

三、数据分析

1、平稳性检验及平稳化处理

平稳性是一些时间序列具有的统计特征,对数据进行平稳性检验是分析时间序列的关键步骤。平稳时间序列有两种定义，根据限制条件的严格程度，分为严平稳时间序列和宽平稳时间序列。对序列的平稳性有两种检验方法，一种是根据时序图和自相关图显示的特征做出判断的图检验方法；一种是构造检验统计量进行假设检验的方法。

（1）时序图检验

平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动，而且波动范围有界的特点。如果观察序列的时序图，显示出该序列有明显的趋势性或周期性，那它不是平稳序列。

（2）自相关图检验

自相关图是一个平面二位坐标悬垂线图，一个坐标轴表示延时期数，另一个坐标轴表示自相关系数，通常以悬垂线表示自相关系数的大小。在平稳序列中，随着延迟期数k的增加，

自相关系数k的增加，自相关系数会很快地衰减向零。反之，非平稳序列的自相关系

数衰减向零的速度通常比较慢，这就是我们利用自相关图进行平稳性判断的标准。（3）单位根检验法

由于图检验带有很强的主观色彩，为了客观起见，人们开始研究各种

序列平稳性的统计检验方法，其中应用最广的是单位根检验。

ADF 检验：

首先绘制原始GDP 的时间序列图，从图2-1可以看出GDP 在1978年之前一直很平稳的在2000-3000亿元波动，但1978年后具有很明显的上升趋势，到2000年以后更是迅猛增长，可以看出原始序列显然是非平稳的。这很符合中国的国情，改革开放以后中国的经济快速发展，故GDP也指数式快速增长。

图2-1 1952-2014年GDP 时序图

为了能够对序列进行分析，要使其平稳化。故将选择两种方法：取对数法和差分法，对序列进行平稳化处理，从而进一步分析预测。由差分的选择我们可以知道序列蕴含着曲线趋势，通常低阶(二阶或三阶)差分就可以提取出曲线趋势的影响，我们对原始数据进行一、二阶差分，并验证其平稳性。

我们先进行一阶差分，即相距一期的两个序列值之间的减法运算。

?x t=x t?x t?1

差分后的序列{?x t}的时序图如图2-2所示。

图2-2 一阶差分时序图

图2-3 一阶差分单位根检验

检验结果表明Tau统计量的P值显著大于0.05，所以我们可以认定差分后的序列是非平稳的。故还要再次进行差分计算。

图2-4 二阶差分时序图

图2-5 二阶差分单位根检验

由检验结果我们可以看到Tau统计量的P值显著小于0.0001，所以我们可以确定二阶差分后序列平稳。所以，我们认为ARIMA模型的差分阶数d等于2。

2. 纯随机性检验

在将数据平稳化之后，还要判断序列是否有分析价值，必须对序列进行纯随机性检验，即白噪声检验。

为了判断序列是否有分析价值，必须对序列进行纯随机性检验，即白噪声检验，因此在建模之前需要进行纯随机性检验。若是到平稳的白噪声序列，则该序列没有分析价值；若是平稳非白噪声序列，可进行模型拟合。

原假设：延迟期数小于或等于m期的序列值之间相互独立。

备择假设：延迟期数小于或等于m期的序列值之间有关联性。

该假设条件用数学语言描述为：

检验统计量：

则

图2-6 二阶差分后白噪声检验

SAS 里面的白噪声检验假设是所给的时间序列属于白噪声。所以当P值（Pr>ChiSq）小于置信水平（α<0.0001）时，拒绝检验假设；而当P值大于置信水平时，不拒绝检验假设。在二阶差分后白噪声检验（图2-6）中显示，LB 统计量的P值小于0.0001，所以可以断定二阶差分序列属于非白噪声序列。结合前面的平稳性检验结果，说明该序列是平稳非白噪声序列，可进行模型拟合。

3. 时间序列模型的建立

3.1模型定阶

移动平均模型：

自回归移动平均模型：

时间序列模型选择标准：

平稳的序列的自相关图和偏相关图不是拖尾就是截尾。截尾就是在某阶之后，系数都为0；拖尾就是有一个衰减的趋势，但是不都为0。

首先根据二阶差分序列自相关图（图2-7）及二阶差分序列偏自相关图（图2-8）

图2-7 二阶差分序列自相关图

图2-8 二阶差分序列偏自相关图

除了延迟1~3阶的自相关系数在2倍标准差范围之外，其他阶数的自相关系数都在2倍标准差范围内波动。根据自相关系数的这个特点可以判断该序列具有短期的相关性，进一步确定序列平稳。

再进一步考察自相关系数衰减到零的过程，可以看到有明显的正弦波动轨迹，这说明自相关系数衰减到零不是一个突然的过程，而是一个渐变的过程，这是自相关系数拖尾的典型特征，我们可以把拖尾特征形象地描述为“坐着滑梯落水”。

最后考察偏自相关系数衰减到零的过程，除了1~3阶偏自相关系数在2倍标准差范围之外，其他阶数打的偏自相关系数都在2倍标准差范围之内，这是一个偏自相关系数3阶截尾的典型特征，我们可以把这种截尾形象地描述为“3阶之后高台跳水，溅起水花点点”。

二阶差分自相关图（图2-8）显示出该序列有自相关系数3阶拖尾的性质，而偏相关系数显示出3阶截尾的性质，所以可以考虑用MA（3）模型拟和2阶差分后的序列。为了检验所选择模型是否合适，我们可以用SAS系统提供的MINIC命令做最优模型识别。

图2-9 BIC 定阶

由图2-9显示，在自相关延迟阶数小于等于5，移动平均延迟阶数小于等于5的所有MA（q）模型中MA（3）最优，故我们选择ARIMA（0,2,3）模型。

3.2参数估计

确定模型阶数后，应对拟合的模型进行参数估计。参数最优估计应该是在前面分析的基础上，利用序列的观察值确定该模型的口径，即估计模型中未知参数的值，将所有参数联合求解。

SAS 支持三种参数估计方法，如果不特别指出制定参数估计的方法，系统默认的估计方法是条件最小二乘估计方法。对ARIMA（0,2,3）模型进行参数估计，结果为：

图2-10 参数估计

由结果中可以看到MU不显著，而其它参数均显著，所以要去掉常数项再次估计未知参数结果如图3-11。

图2-11 去掉常数后参数估计

由结果中可以看到MA1,1不显著，而其它参数均显著，所以要去掉常数项再次估计未知参数结果如图3-12。显然2个未知参数都显著。

图2-12去掉第1个因子后的参数估计

图2-13

得到拟合结果为：

图2-14 拟合结果

可表示为：

3.3模型检验

图2-15 拟合模型检验

从上图2-15可以看出，延迟6阶、12阶、18阶、24阶的LB统计量P值均显著大于α（α= 0.05），可知残差通过了白噪声检验，即认为残差序列为白噪声序列，该拟合模型MA（3）显著成立。

4.国民生产总值的预测及分析

我们利用此模型对国内生产总值之后5年的GDP 进行预测结果如下：

图2-16 预测结果

图2-17 序列在两种方差假定下的置信区间效果图

由图2-17可以从图中看出，模型拟合效果很好，国内生产总值在未来5年内还是会稳定地上涨。

四、结论

本文根据1952－2014年中国的国内生产总值（GDP）的统计资料，针对GDP的非平稳特征，通过差分变成平稳序列，建立GDP时间序列的ARIMA模型，并在此基础上用于国内生产总值GDP的预测分析。计算结果表明，该模型能较好地解决国内生产总值GDP的估计和预测问题，预测精度较为精确。

附录

附录1参考文献：

[1]王燕. 应用时间序列分析[M]. 北京:中国人民大学出版社，第三版.

[2]刘薇. 时间序列分析在吉林省GDP预测中的应用[D]. 东北师范大学硕士学位论

文，2009.

[3]周文娟. 我国GDP的统计分析及预测[EB/OL].

-7282.html，2014.

[4]徐雅静. ARIMA模型在河南省GDP预测中的应用及SAS实现[J]. 中国科技信息，2006，10:216-219.

[5]张丽. 天津市人均GDP时间序列模型及预测[J]. 北方经济，2007,(6):44-46.

[6] 中经网统计数据库.cn/page/Default.aspx

附录2 原始数据：

附录3 sas程序：

一阶差分

data example3_1; input x;

difx=dif(x);

time=_n_; cards;

679

824.19

859.38

910

1028

1068

1307

1439

1457.47

1220

1149.3

1233.3

1454

1716.1

1868

1773.9

1723.1

文档收集于互联网，已重新整理排版.word版本可编辑.欢迎下载支持.

1937.9

2252.7

2426.4

2518.1

2720.9

2789.9

2997.3

2943.7

3201.9

3650.17

4067.67

4551.58

4898.15

5333.05

5975.59

7226.26

9039.95

10308.76

12102.18

15101.07

17090.33

18774.32

21895.53

27068.32

35524.35

48459.64

61129.8

71572.32

79429.48

84883.69

90187.74

99776.25

110270.36

121002.04

136564.64

160714.42

185895.76

217656.59

268019.35

316751.75

345629.23

408902.95

484123.5

534123.04

588018.76

636138.73

；

proc gplot data=example3_1;

plot x*time=1 difx*time=1;

symbol1c=red I=join v=star;

proc arima data= example3_1; identify var=x(1) nlag=24stationarity=(adf=1); estimate q=3;

forecast lead=5id=time out=results;

proc gplot data=results; plot x*time=1 forecast*time=2 l95*time=3 u95*time=3/overlay; symbol1c=black i=none v=star; symbol2c=red i=join v=none; symbol3c=green i=join v=none l=2; run;

二阶差分