文档库 最新最全的文档下载
当前位置:文档库 › 第十二章 中国人口总量与GDP总量关系模型研究

第十二章 中国人口总量与GDP总量关系模型研究

第十二章中国人口与GDP总量关系建模研究

人口经济问题是当代人口学与经济学领域研究的热点问题。国内外学者对我国的人口模型研究由来已久,并取得了不少研究成果。从现有文献看,人们虽然注意到人口增长与经济增长之间存在着复杂的传递关系,对传统的简单回归方法提出了质疑,并试图发展其它的理论模型,例如,“人口——经济运行动态模型”,“人口预测动力学模型”等,但在探求二者之间较高精度的数量关系模型方面,成果一直不很理想。换言之,人口与经济总量之间的内在关系问题长期以来一直是并将继续成为人口经济学界关注的重点。

本章采用经济计量学中无约束混合有限多项式分布滞后模型,利用1952~2000年间年度GDP与总人口数据,构建了总人口与GDP总量之间的非线性经济计量学模型。该模型除1960年处的拟合有较大偏差外,在其余观察期均有较好的拟合效果。该模型预测的2001年总人口数(不含港澳台)为127477.9862万人,与《中国统计年鉴》(2002)中公布的数据127627万人相差仅149.0138万人。这表明该模型初步揭示了总人口与GDP总量之间的内在关系,对未来中国人口总量预测也有一定帮助。

从模型影响诊断分析结果看,1960年对应的人口与GDP数据为本质性异常值点。为克服异常值点对模型性能的影响,并从中国人口发展自身因素揭示人口内在变动规律,在最终综合模型中导入了反映中国人口政策与人口生存周期影响的重要指标——出生率与死亡率。从各项评价指标看,所获模型是一个反映总人口与GDP总量之间内在关系的、较为理想的综合模型。模型分析表明:1960年所对应总人口与GDP数据的本质性异常,其主要原因来自于1960年的高死亡率。此外,该综合模型预测的2001年总人口数(不含港澳台)为127580.6633万人,与《中国统计年鉴》(2002)中公布的数据127627万人相差仅46.3367万人。可见,该综合模型更好地揭示了总人口与GDP总量之间的内在关系,对未来中国人口总量预测也更理想。

§12.1 引言

人口总量关系与人口预测问题是人口学理论研究的核心问题。由于预测技术的不断创新与完善,使得人口预测模型日益丰富多彩,各具特色。从人口学的起源——生命表,到现代的人口动力学模型中的分岔与混沌理论,从单区域分要素人口预测法,到多区域人口动态迁移预测模型,等等,均反映了现代人口学理论的发展趋势,并形成内涵与外延仍在不断扩展的、富有生机和活力的独立学科分支——应用数理人口学。其显著特征是将数学、统计学、经济计量学、系统动力学及其它新兴学科发展的尖端理论与方法不断融合,在宏观模型与微观人口数据之间寻求结合点,更准确地反映人口变动的内在规律,揭示人口发展的本质。

为获取精度较高的、不同类型的连续人口数据,国内外专家、学者从多个角度进行了研究,发展了诸如生命表分析、死亡分析、婚姻分析、生育分析、迁移分析、空间人口分析等理论与技术,文献浩瀚。就我国的人口数据预测问题,新近的文献南亮进和薛进军(2002)利用人口普查等资料,采用国际通行的统计口径与其创立的链接比率方法,推算了1949~1999年中国人口和劳动力数据;林正祥和原新(2002)视孩次为生育模式的基本变量,编制了我国新的人口生育表;王周喜,胡斌和王洪萍(2002)运用分岔与混沌理论讨论了人口预测模型的非线性动力学特性;《人口研究》2002年第4期则专门约请李小平、李建新和刘爽三位专家就“中国人口数量究竟多少亿才合适?”这一论题展开专题性讨论等。其它相关文献在此不一一列举。

众所周知,人口数量问题不仅仅是人口学本身研究的热点问题,同时还是其它人文社会科学研究的重点问题。经济学对人口数量问题(当然更包括人口质量问题)的研究更是情有独钟。有

关经济增长、经济发展与人口增长的关系问题,国内外学者进行了大量的实证研究,但所得结论大相径庭。在不同的时期,在不同的国家,人口增长与经济增长之间表现出不同的相关关系。有的为正相关,有的为负相关,而有的甚至不存在相关关系。对此,李建民,王金营(2000)进行了较为详尽的概述,并认为现有文献中采用的传统简单相关与回归分析法不能真正揭示人口增长与经济增长(主要是用GDP指标)之间的复杂关系,进而在一组较为严格的约束条件下发展了针对我国的“人口——经济运行动态模型”,通过模拟方法研究了中国生育率下降及控制人口增长对中国经济增长和人民生活水平提高的贡献。从该文的模拟结果看,无论是该文所指三个方案中的哪一个方案,其总人口的模拟结果与实际数据均相差甚远,表明该文所发展的“人口——经济运行动态模型”还不能较为理想地揭示人口增长与经济增长之间的内在传导机制。此外,王谦,郭震威(2001)从定性角度质疑了胡鞍钢(1999)使用简单回归方法研究人口增长对经济增长影响所产生的“伪回归”结果,并与众多文献一样,认为:“目前,我们还很难计算经济增长与人口增长的数量关系。”

与此同时,我们注意到:中国人口数据与GDP数据存在着很强的相关性。事实上,在1952~2000年间二者之间的样本复相关系数达到0.740213。因此,在理论上探讨二者之间的内在连接关系成为可能。但如何获取理想的内在关系模型,这却是个艰难而复杂的数学、经济计量学建模问题。因为在总人口与GDP之间确实并非简单的线性回归关系,这可以从下段的回归分析结果看出。

为揭示总人口与GDP之间微妙的结构依存关系,在第三段我们首先简要介绍了经济计量学理论中有关分布滞后模型,为进一步分析进行了理论准备;在第四段,我们利用1952~2000年中国人口与GDP数据,构建了中国人口关于GDP及人口滞后的无约束三阶三次混合多项式分布滞后模型,所得结果在1955~2000年(除1960年外)每个观测点处的拟合情况均很满意。将此模型应用于2001年中国人口的外推预测,也较为理想。

此外,从模型影响诊断分析结果看,1960年对应的人口与GDP数据为本质性异常值点。为克服异常值点对模型性能的影响,并从中国人口发展自身因素揭示人口内在变动规律,在第五段的最终综合模型中导入了反映中国人口政策与人口生存周期影响的重要指标——出生率与死亡率。从各项评价指标看,所获模型是一个反映总人口与GDP总量之间内在关系的、较为理想的综合模型,它揭示了中国人口、GDP总量、人口政策及人口生存周期之间微妙的变动关系。模型分析表明:1960年所对应总人口与GDP 数据的本质性异常,其主要原因来自于1960年的高死亡率。在文章最后结束语部分,我们对本文未能展开讨论的问题进行了简单说明。

§12.2 中国人口与GDP之间的简单线性回归分析

下面的表12.2.1和表12.2.2是利用1952~2000年间中国人口与GDP统计数据获得的总人口数关于GDP的简单线性回归结果及各项评价指标:

列相关,模型不能用于实际预测。这表明中国实际总人口数与实

际GDP之间并不是简单的线性回归关系,因而不能采用简单的线

性回归模型来揭示人口增长与经济增长之间的相互影响。表12.2.3

给出了实际总人口数、实际GDP及相应回归模型下的观测值和预

测残差值。图12.2.1给出了实际总人口数、总人口预测数与预测

残差值的拟合效果图。

表12.2.3 中国总人口关于GDP的简单线性回归结果

实际数据:《中国统计年鉴》(2002),中国统计出版社。

图12.2.1 简单线性回归下实际总人口数、总人口

预测数与预测残差的拟合效果图

§12.3 多项式分布滞后模型简介

为使下述讨论更清楚、明了,我们先给出其理论模型的一般

形式。说明简单计,我们只考虑模型含有一个独立解释变量情形。在经济计量学文献中,称如下模型为外生变量有限分布滞后模型:

011t t t s t s t Y X X X αβββε--=+++++ (12.3.1)

其中,t ε为随机扰动项,满足Gauss-Markov 假定条件,而s 称为分布滞后的阶数。这类模型在实际经济问题中经常会遇到。许多

经济变量不仅受到解释变量当期的影响,而且还受到解释变量若

干滞后期的影响。例如,家庭耐用消费品的消费,不仅取决于现期的收入,而且取决于过去许多时期收入的储蓄等。

此外,往往还会遇到更一般的外生变量无限分布滞后模型情形:

t i t i

t i Y X

αβε∞

-==+

+∑ (12.3.2)

例如,在投资分析中,通常认为资本存量是以本期后的一个“科伊克几何滞后”形式同产出相关联的。

另一种分布滞后模型为内生变量有限分布滞后模型:

1

s

t i t i t t i Y c Y X u αβ-==+++∑ (12.3.3)

若s 取正无穷,则得到相应的内生变量无限分布滞后模型:

1

t i t i t t i Y c Y X u αβ∞

-==+++∑ (12.3.4)

将内生变量与外生变量分布滞后一起考虑,则得到混合有限分布滞后模型及混合无限分布滞后模型:

10s

m

t i t i

j t j t i j Y cY

X u αβ--===+

++∑∑ (12.3.5)

10s

t i t i

j t j t i j Y cY

X u αβ∞

--===+

++∑∑ (12.3.6)

1

m

t i t i

j t j t i j Y cY

X u αβ∞

--===+

++∑∑ (12.3.7)

1

t i t i

j t j t i j Y cY

X u αβ∞

--===+

++∑∑ (12.3.8)

为解决分布滞后模型下解释变量之间复共线性关系对参数估

计的影响,以及滞后阶数对样本容量要求等的限制等问题,阿尔蒙(Almon ,S )发展了多项式分布滞后模型。例如,在(12.3.1)下,阿尔蒙多项式分布滞后模型中滞后变量的参数β具有如下多项式形式:

20121r z z z z βαααα=++++ (12.3.9)

在阿尔蒙方法下,若给定α项和多项式次数r ,则可获得z β的估计值,从而获得较为满意的回归结果。对于上述其他形式的分布滞后模型,也可类似进行。

§12.4 不考虑政策等因素影响下的 中国人口总量与GDP 总量关系模型

为探求中国人口总量与GDP 总量之间的内在关系模型,我们

采用上述混合有限多项式分布滞后模型进行拟合,样本期为1952~2000年间年度数据。下面是我们创建的中国总人口数关于GDP 的三阶三次无约束混合多项式分布滞后关系模型,所得结果见表12.4.1,使用的模型形式为:

012132112233t t t t t t t t

y x x x y y y ααααβββε-----=+++++++

(12.4.1)

其中,t y 为第t 年的总人口数,t x 为第t 年的GDP 值,其它为相

应变量的不同滞后,并且,

230123i i i i βλλλλ=+++ , 1,2,3.i = (12.4.2)

表12.4.1 三阶三次无约束混合多项式

分布滞后模型下LS 回归结果

表12.4.2给出了实际总人口数、实际GDP 及分布滞后模型下的总人口数预测值和预测残差。图12.4.1给出了该模型下实际总人口数、人口预测数与预测残差的拟合效果图;图12.4.2给出了分布滞后模型下预测值与预测残差的附加变量图。此外,该模型的最终二次损失为8220654.1749,复相关系数为0.99980,方差解释程度为99.96%。

表12.4.2 总人口关于GDP的三阶三次多项式滞后回归结果

单位:亿元、万人

实际数据来源:《中国统计年鉴》(2002),中国统计出版社。

图12.4.1 分布滞后模型下实际人口总数、 人口预测数与预测残差的拟合效果图

图12.4.2 分布滞后模型下预测值与预测残差的附加变量图

从表12.4.2及图12.4.2可以看出,1960年的人口数据拟合情况并不理想,其缘由何在?事实上,从我国历史发展过程看,由

于1958年“大跃进”,接着进入困难时期,出现饥荒,发生大面积非正常死亡,从而导致1960年总人口数较以前相邻年份第一次出现下降,人口负增长。关于此定性分析结论,将在下段进行实际定量验证。除此之外,模型在其它年份处拟合得均较为理想。

此模型不仅对历史数据总体拟合较好,而且对2001年总人口数的实证性预测也很满意。按照中国统计出版社出版的《中国统计年鉴》(2002)公布数据,2001年全国GDP (不含港澳台)实现95933.30亿元人民币,由此预测的2001年总人口数(不含港澳台)为127477.9862万人。而《中国统计年鉴》(2002)中公布的数据为127627万人,二者相差仅149.0138万人。

§12.5 考虑政策等因素影响下的中国人口

总量与GDP 总量关系综合模型

在上段中探讨的中国人口总量与GDP 总量之间的关系模型,虽然基本上揭示了二者之间的内在依存规律,但我们注意到该模型在1960年的拟合效果很不理想,该年份数据相对于该模型讲可能为异常值点。事实上,从模型影响分析与诊断理论看,1960年数据为该模型下的强影响点,对应的Cook 距离为

19600.199951D 。由进一步的分析得知,单独剔除它后进行相

应建模分析,模型并未有实质性改进。这说明该点为本质性异常点,应从模型本身的设置寻求改进措施。另一方面,我们知道影响人口变动的因素很多,其中,人口政策与生命周期等因素的影响尤其不可忽视。为此,将出生率与死亡率这两项重要指标同时引入模型,以此更加综合而科学地揭示中国人口总量与GDP 总量之间的结构依存关系。

下面是我们利用1952~2000年间年度数据创建的含有出生率与死亡率在内的中国总人口数关于GDP 的三阶三次无约束混合多项式分布滞后综合模型,所得结果见表12.5.1,使用的模型形

式为:

01213211t t t t t y x x x y ααααβ---=+++++

2233t t t t t y y ββμηγρε--++++ (12.5.1)

其中,t y 为第t 年的总人口数,t x 为第t 年的GDP 值,t η为第t 年的人口出生率(‰),t ρ为第t 年的人口死亡率(‰),其它为相应变量的不同滞后,并且,

230123i i i i βλλλλ=+++ , 1,2,3.i = (12.5.2)

表12.5.1 三阶三次无约束混合多项式

分布滞后模型下LS 回归结果

的总人口数预测值和预测残差及出生率与死亡率数据。图12.5.1给出了该模型下实际总人口数、人口预测数与预测残差的拟合效果图;图12.5.2给出了该模型下总人口预测值与总人口预测残差

的附加变量图。此外,该模型的最终二次损失为1001512.6214,

复相关系数为0.99998,方差解释程度为99.995%。显然,本模型与上段讨论中给出的模型相比,有很大改进,并且,1960年处的数据拟合不在异常。

表12.5.2 出生率与死亡率引入后总人口关于

图12.5.1 综合模型下实际人口总数、人口

预测数与预测残差的拟合效果图

图12.5.2 综合模型下人口预测值与人口预测残差的附加变量图

为说明1960年所对应总人口与GDP 数据本质性异常的主要原因来自于1960年的高死亡率,我们在段四模型基础上单独引入

出生率指标,进行类似分析。结果表明:不但1960年数据为异常值点,而且1962年数据也成为异常值点。这说明出生率单项指标还不能解释1960年数据异常的原因。图12.5.3给出了该模型下总人口预测值与总人口预测残差的附加变量图。图12.5.4给出了段四模型(I)、同时引入出生率与死亡率后模型(II)及单独引入出生率后模型(III)这三个模型下总人口预测残差分布的比较图。

图12.5.3 单独引入出生率后对应模型下总人口

预测值与总人口预测残差的附加变量图

另一方面,此综合模型不仅对历史数据总体拟合较好,而且对2001年总人口数的实证性预测也十分满意。按照中国统计出版社出版的《中国统计年鉴》(2002)公布数据,2001年全国GDP (不含港澳台)实现95933.30亿元人民币,由此模型预测的2001年总人口数(不含港澳台)为127580.6633万人。而《中国统计年鉴》(2002)中公布的数据为127627万人,二者相差仅46.3367万人。可见,此模型较段四中给出的模型预测效果更理想。

图12.5.4 三个不同分布滞后模型下预测残差的分布比较图

§12.6 结束语

从前面的讨论可以看出:总人口与GDP之间存在着高度的相关性,但并非简单的线性相关关系,它们之间较为理想的内在关系基本上可以通过无约束的三阶三次混合多项式分布滞后模型(12.5.1)~(12.5.2)来揭示。这不仅反映出中国人口总量与GDP 总量有直接的依存关系,同时反映出这种依存关系还受人口政策与寿命分布的影响。

值得指出的是,虽然本章在较深层次上揭示了人口增长与经济增长的关系问题,但并不意味着经济发达后人口即可无限制地增长。相反,一如本章模型结果所揭示的那样,人口增长与经济增长的协同发展离不开人口政策的宏观指导与生活质量的改善。

此外,人口增长与经济增长的各自影响因素十分复杂,是人口经济学研究的热点与难点问题。相信在众多同行专家、学者的共同努力下,人口经济学研究将向更深层次不断延伸。

相关文档
相关文档 最新文档