文档库 最新最全的文档下载
当前位置:文档库 › 计量经济学,多重共线性异方差虚拟变量随机解释变量大作业

计量经济学,多重共线性异方差虚拟变量随机解释变量大作业

计量经济学,多重共线性异方差虚拟变量随机解释变量大作业
计量经济学,多重共线性异方差虚拟变量随机解释变量大作业

影响我国居民消费因素分析

班级:

组员:

一、提出问题:

1、原因:

居民消费水平是按国民收入或国内生产总值的使用总量中用于居民消费的总额除以年平均人口计算的,它反映一个国家或一个地区居民的一般消费水平。居民消费水平是GDP中一个重要组成部分,是拉动经济增长的三驾马车之一,在拉动经济增长的三架马车中,最终消费对经济影响的最大,是拉动经济增长最重要最稳定的因素。我国经济正逐渐由投资拉动型增长向消费拉动型增长转变,居民消费一直是经济学家关注的焦点和研究的热门领域。居民消费对经济的发展和社会的进歩有着重要的引导作用,居民消费的结构、质量和增长趋势如何,在很大程度上决定着经济、社会的发展情况。

要充分发挥消费对经济的拉动作用,关键问题是如何保证居民的消费水平。在人均国民生产总值为一千美元时,世界各国的居民消费率一般为60%左右。而我国的人均国民生产总值早已超过了一千美元,但2013年全国居民的消费率仅36%,严重低于正常水平。消费需求的偏低导致消费对经济增长的拉动作用也偏弱,因此提高居民消费率,增加居民消费对经济增长的贡献

度,是一项重要工作。

通过对历年我国居民消费水平的分析,我们可以对消费水平发展有一个清晰的画面,并且能透过数据的表象来分析更深层次的国家调控手段和战略使用。

2、研究立场:政策制定者

二、文献综述:

根据国外相关研究成果,主要有恩格尔的理论、绝对收入、相对收入、持久收入和生命周期消费理论等。Caballero (1990)指出,当期劳动收入发生变化表明未来的收入发生变化的可能性比较大,为维持未来消费的稳定性,需要进行预防性储蓄,从而会降低当期消费,使得长期的消费得到"平滑"。

国内研究得出的消费率的影响因素主要包括:居民收入占比,收入分配差距,不确定性,流动性约束和房价。齐吴珍认为居民消费的主要影响因素有:居民收入的增长率、收入分配差距、不确定性、流动性约束和房价等。

目前,多数学者通过建立消费与收入的模型或者消费分别与城乡居民收入建立模型进行分析,结果显示:1、收入是决定居民消费水平的主要因素,收入增加的快慢是影响居民消费需求变化的重要原因。

2、农村居民收入、财政支出水平、城市化水平、农村社会保障制度均对农村居民消费需求起正向作用,城乡居民收入差距起负向作用,农村内部收入分配差距与消费需求不存在显著相关关系。

3、收入的不确定性、以及出于预防动机,我国居民储蓄率高,在一定程度上影响

消费水平。

三、模型建立:

1、假设提出:

影响居民消费的因素主要有居民收入、物价水平、国家货币政策、利率水平、居民消费观念、商品供给、消费者心理、风俗习惯、人均国民生产总值等,其中,居民收入又可以分为城镇居民收入水平和农村居民收入水平。所以。我们选取人均居民消费作为被解释变量Y,人均国内生产总值X1、居民消费价格指数X2、活期利率X3、城镇居民可支配收入X4、农村居民可支配收入X5为解释变量。由于国家的货币政策也可能对居民消费水平产生一定的影响,而货币政策为定性变量,于是以货币政策为虚拟变量D1引入模型。

其中,X1、X4、X5为正影响,而X2、X3为负影响。

2、理论基础:

有关居民消费与消费收入的关系。现代西方宏观经济学的奠基人——凯恩斯的绝对收入消费理论对此做出了很好的解释。凯恩斯消费理论可以用来有效地描述与分析消费与收入的关系,凯恩斯认为:随着收入的增加。消费也会随着增加,但是消费的增加不及收入增加多。

根据宏观经济学,不同消费阶层的消费倾向不同,因此城乡居民收入对消费的影响并不相同。城乡收入差距,也会对居民消费产

生影响。

同时,当收入一定,利率水平也会对消费水平产生影响。当利率水平高,人们倾向于增加储蓄,导致消费减少;当利率水平低,人们倾向于减少储蓄,增加当期消费。

3、理论模型:

1、形式确定---散点图

通过OLS可得模型的散点图如下:

从散点图可以看出人均居民消费水平(Y)与人均国内生产总值(X1)、居民消费价格指数(X2)、活期利率(X3)、城镇居民可支配收入(X4)、农村居民可支配收入(X5)大体呈现为线性关系。

因此我们建立线性模型。

2、建立模型:

数据来源:通过《中国统计年鉴》和国家统计总局收集的数据

建立时间序列数据的计量经济模型,并进行回归分析。假设建立如下线性一元回归模型:

Y=C+β1X1+β2X2+β3X3+β4+X4+β5X5+μ

其中,Y表示人均居民消费水平,X1表示人均国内生产总值、X2表示居民消费价格指数、X3表示活期利率、X4表示城镇居民可支配收入、X5表示农村居民可支配收入、μ表示随机误差项。四、实证研究:

1、参数估计:

假定所建模型及随机扰动项μ满足古典假定,可以用OLS 法估计其参数,运用计算机软件EViews 作计量经济分析。通过OLS 可得:

参数和估计结果为:

R 2=0.999819 F=28720.5

=∧

Y 51.43143+0.010105X1-0.153435X2-34.23191X3+0.322822X4+0.6

31562X5 2、经济意义检验

所估计的参数β1>0,β2<0,β3<0,β4>0,β5>0这与经济理论——X1、X4、X5为正影响,而X2、X3为负影响相符。

3、统计学检验

(1)拟合优度检验:

从回归估计的结果看,模型拟合较好:可决系数R2=0.999819说明所建模型整体上对样本数据拟合较好,即五个解释变量整体对被解释变量“人均居民消费”的绝大部分差异作出了解释。

(2)统计学检验:

C的Prob=0.7148>0.05,β1的Prob=0.5076>0.05,β2的Prob=0.9285>0.05,β3的Prob=0.1391>0.05,β4的Prob=0<0.05,β5的Prob=0<0.05因此,在置信度 =0.05时,Y与X4、X5之间存在显著的函数关系,Y与X1、X2、X3之间不存在显著性关系,有可能是由于序列相关或多重共线性导致。

F值=28720.5>F0.05(5,26)=2.59,因此拒绝原假设,认为Y与X1、X2、X3、X4、X5之间存在显著的函数关系。

4、序列相关性检验

为了保证回归参数估计量具有良好的统计性质,对模型进行序列相关性检验。

(1)DW检验

DW=1.371177,表明在5%的显著性水平下,n=32,k=6(包含常数项),查表得d L=1.11,d U=1.82,由于d L

(2)拉格朗日乘数检验

假设随机干扰项存在P阶序列相关,建立辅助回归模型:

e t=β0+β1X t1+…+βk X tk+ρ1e t-1+ρp e t-p+εt

假设约束条件

H0=ρ1=ρ2=…=ρp=0

则LM统计量服从如下分布:

LM=nR2 ~X2(p)

通过OLS可得:

一阶滞后:

e t=-26.71645+0.006116X1+0.331876X2-3.37547X3-0.014957X4+0.1 9273X5+0.330864e t-1

R2=0.100409

LM=31*0.100409=3.112679,该值小于显著性水平为5%、自由度为1的X2分布的临界值X20.05(1)=3.84,并且C、X1、X2、X3、X4、X5的P 值均大于0.05,由此判断原模型不存在1阶序列相关性。

二阶滞后:

e t=-28.62072-0.000698X1-0.233834X2-0.836444X3+0.003502X4-0. 00893X5+0.399594e t-1-0.326993e t-2

R2=0.179172

LM=30*0.179172=5.37516,该值小于显著性水平为5%、自由度为2的X2分布的临界值X20.05(2)=5.99,并且C、X1、X2、X3、X4、X5的P 值均大于0.05,由此判断原模型不存在2阶序列相关性。

三阶滞后:

e t=44.91375-0.001751X1-0.309242X2-3.288791X3+0.007639X4-0.0 19222X5+0.358667e t-1-0.296108e t-2-0.130782e t-3

R2=0.189971

LM=29*0.189971=5.509159,该值小于显著性水平为5%、自由度为3的X2分布的临界值X20.05(3)=7.81,并且C、X1、X2、X3、X4、X5的P 值均大于0.05,由此判断原模型不存在3阶序列相关性。

因此,结合1阶、2阶和3阶滞后残差项的辅助回归情况,可判断原模型不存在序列相关性。

5、多重共线性检验

(1)检验简单相关系数

X1、X2、X3、X4、X5的相关系数如下:

由表中数据可粗略得出结论:X1、X4、X5间存在高度相关性,相关程度达到98%以上。

(2)综合统计检验法

在OLS法下,R2=0.999819较大,F=28720.5较大,各参数t值普遍较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立性作用不能分辨。

(3)判定系数检验法

如果回归:X ji=a1X1i+a2X2i+…aLX Li的判定系数较大,说明X j与其他X 间存在共线性。

建立X1与其余解释变量之间的关系:X1~X2、X3、X4、X5

X1=1893.87-37.86014X2+696.1210X3+2.130994X4-1.918884X5 (1.086)(-1.856)(2.742)(12.191)(-3.141)

R2=0.995958 F=1663.318

建立X2与其余解释变量之间的关系:X2~X1、X3、X4、X5

X2=77.84993-0.002987X1+10.20504X3+0.006291X4-0.001881X5

(15.276) (-1.856)(6.276)(1.668)(-0.769) R2=0.631553 F=11.57012

建立X3与其余解释变量之间的关系:X3~X1、X2、X4、X5

X3=-3.311418+0.000313X1+0.058135X2-0.000638X4+0.000104X5 (-3.278) (2.742)(6.276)(-2.342)(0.217)

R2=0.90731 F=66.07369

建立X4与其余解释变量之间的关系:X4~X1、X2、X3、X5

X4=-866.8531+0.39712X1+14.85791X2-264.5762X3+1.284184X5 (-1.155) (12.191)(1.668)(-2.342)(6.974) R2=0.998386 F=4175.417

建立X5与其余解释变量之间的关系:X5~X1、X2、X3、X4

X5=256.5322-0.139437X1-1.731949X2+16.78327X3+0.500744X4

(0.537) (-3.141)(-0.297)(0.217)(6.974)

R2=0.992853 F=937.6933

由上结果可知:X1、X4、X5作为被解释变量时,R2均较大且接近于1,F值均大于临界值F0.05(3,28)=2.95,可知拒绝原假设,即X1、X4、X5与其他解释变量之间存在显著的线性关系。

(4)逐步回归法

分别做Y对X1、X2、X3、X4、X5的一元线性回归,检验和解决多重共线的问题。

根据比较系数由大到小排序为:X4、X5、X1、X3、X2

建立Y与X4之间的关系:Y~X4

R2=0.998438,参数符号合理且通过t检验。

引入X5,R2=0.999775,拟合优度显著提高,且参数符号合理,变量也通过了t检验,X5应保留。

引入X1,R2=0.999775,拟合优度没有明显提高,且X1参数符号不合理,没有通过t检验,可知X1与其他变量存在明显共线性,应删去。

引入X3,R2=0.999815,拟合优度显著提高,且参数符号合理,变量也通过了t检验,X3应保留。

引入X2,R2=0.999816,拟合优度没有明显提高,且X1、X2没有通过t检验,可知X2与其他变量存在明显共线性,应删去。

因此,删去X1、X2,保留X3、X4、X5,最后修正多重共线性的模型

为:Y=26.9384-31.11X3+0.34X4+0.61X5

6、内生性检验

(1)检验X3内生性:引入X3(-1)作为工具变量,建立X3与X3(-1)的关系,做OLS估计,得出残差项。

X3=1.039965403+0.0002967850097*X4-0.001205628266*X5+0.72178 87473*X3(-1)

将残差项带入原模型后,再进行OLS估计:

随机干扰项E3参数P值为0.0276<0.05,可知在显著性水平5%情况下,拒绝原假设,即X3为同期内生变量。

(2)检验X4内生性:引入X4(-1)作为工具变量,建立X4与X4(-1)的关系,做OLS估计,得出残差项。

多重共线性的解决之法

第七章 多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews 软件解决多重共线性的实际问题。 第一节 多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X 1,X 2,……,X k 中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型 i ki k i i i X X X Y μββββ+++++= 22110 (7-1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共线性。 从矩阵形式来看,就是0' =X X , 即1)(-

(2)不完全多重共线性 不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。 如对于多元线性回归模型(7-1)存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=++++i ki k i i u λλλ (7-3) 其中i u 为随机误差项,则可以说解释变量k X ,,X ,X 21 之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。 完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。 二、多重共线性产生的原因 多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。 (一)经济变量间具有相同方向的变化趋势 在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。 (二)经济变量间存在较密切关系 由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。 (三)采用滞后变量作为解释变量较易产生多重共线性 一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。 (四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。 三、多重共线性产生的后果 由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模

计量经济学复习资料——虚拟变量

虚拟变量习题 一、 单项选择题 1、 若一个回归模型包含截距项,对一个具有m 个特征的质的因素需要引入的虚拟变量个数为 A.m-2 B.m-1 C.m D.m+1 2、 某商品需求函数为:Y i =β0+β1X i +μi ,其中Y 为需求量,X 为价格,为了考虑“性别”(男性、女性)和“地区”(东部、中部、西部)两个因素的影响,考虑引入虚拟变量,则应引入虚拟变量的个数为( ) A. 5 B. 4 C. 3 D. 2 3、 消费函数Y i =α0+α1D+β0X i +β1DX i +μi ,其中 虚拟变量D=???农村家庭城镇家庭 01,当统计检验表明下列哪项成立时,表示城镇家庭 与农村家庭有一样的消费行为( ) A. α1=0, β1=0 B. α1=0, β1≠0 C. α1≠0, β1=0 D. α1≠0, β1≠0 4、 根据样本资料建立某消费函数如下:?100.5055.350.45t t C D X =++,其中C 为消费,X 为收入,虚拟变量 1 D 0 ?=??城镇家庭 农村家庭,所有参数均检验显著,则城 镇家庭的消费函数 为 ( ) A 、?155.850.45t t C X =+ B 、?100.500.45t t C X =+ C 、?100.5055.35t t C X =+ D 、?100.9555.35t t C X =+ 5、 假设某需求函数为01i i i Y X ββμ=++,为了考虑“季节”因素(春、夏、秋、 冬四个不同的状态),引入4个虚拟变量形成截距变动模型,则模型的 ( ) A 、参数估计量将达到最大精度 B 、参数估计量是有偏估计量 C 、参数估计量是非一致估计量 D 、参数将无法估计 6、 对于模型01i i i Y X ββμ=++,为了考虑“地区”因素(北方、南方),引入2 个虚拟变量形成截距变动模型,则会产生 ( ) A 、序列的完全相关 B 、序列的不完全相关 C 、完全多重共线性 D 、不完全多重共线性

《计量经济学》第四章精选题及答案

第四章:多重共线性 二、简答题 1、导致多重共线性的原因有哪些? 2、多重共线性为什么会使得模型的预测功能失效? 3、如何利用辅回归模型来检验多重共线性? 4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。 (1)尽管存在完全的多重共线性,OLS 估计量还是最优线性无偏估计量(BLUE )。 (2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。 (3)如果某一辅回归显示出较高的2 i R 值,则必然会存在高度的多重共线性。 (4)变量之间的相关系数较高是存在多重共线性的充分必要条件。 (5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。 12233i i i Y X X βββ=++ 来对以上数据进行拟合回归。 (1) 我们能得到这3个估计量吗?并说明理由。 (2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计 算过程。 6、考虑以下模型: 23 1234i i i i i Y X X X ββββμ=++++ 由于2X 和3 X 是X 的函数,那么它们之间存在多重共线性。这种说法对吗?为什么? 7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。我们考虑以下模型: 12313233i t t t t t Y X X X X βββββμ---=+++++ 其中Y ——消费,X ——收入,t ——时间。该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。 (1) 在这一类模型中是否会存在多重共线性?为什么? (2) 如果存在多重共线性的话,应该如何解决这个问题? 8、设想在模型 12233i i i i Y X X βββμ=+++ 中,2X 和3X 之间的相关系数23r 为零。如果我们做如下的回归:

第七章 虚拟变量

第七章虚拟变量 第一节虚拟变量的引入 一、什么是虚拟变量 前面几章介绍的解释变量都是可以直接度量的,称为定量变量。如收入、支出、价格、资金等等。但在现实经济生活中,影响应变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些无法定量的解释变量的影响,如性别、民族、国籍、职业、文化程度、政府经济政策变动等因素,他们只表示某种特征的存在与不存在,所以称为属性变量或定性变量。 属性变量:不能精确计量的说明某种属性或状态的定性变量。 在计量经济模型中,应当包含属性变量对应变量的影响作用。那怎么才能把定性变量包括在模型中呢?属性变量通常是非数值变量,直接纳入回归方程中进行回归,显然是很困难的。为此,人们采取了一种构造人工变量的方法,将这些定性变量进行量化,使其能与定量变量一样在回归模型中得以应用。 由于定性变量通常是表明某种特征或属性是否存在,如性别变量中以男性为分析基础的话,那就只有男性、非男性;政策变动变量中以政策不变为基准,则有政策不变,和政策变动;至于有两种以上的状态的话,比如学历分高中,本科,本科以上等等,我们又怎么办呢?把疑问留到后面去解决。既然定性变量只有存在或不存在两种状态,所以量化的一般方法是取值为0或1。称为虚拟变量。 虚拟变量:人工构造的取值为0或1的作为属性变量代表的变量。一般常用D表示。 D=0,表示某种属性或状态不存在D=1,表示某种属性或状态存在 比如前面说的性别变量,以男性为基准,则当样本为男性时,虚拟变量取0,当样本为女性时,则虚拟变量取1。 当虚拟变量作为解释变量引入计量经济模型时,对其回归系数的估计和统计检验方法都与定量解释变量相同。 二、虚拟变量的作用 1、作为属性因素的代表,如,性别、种族等 2、作为某些非精确计量的数量因素的代表,如:受教育程度、年龄段等; 3、作为某些偶然因素或政策因素的代表,如战争、911等。 4、时间序列分析中作为季节(月份)的代表(比如对某些明显有淡季、旺季之分的产品) 5、分段回归,研究斜率、截距的变动; 6、比较两个回归模型; 7、虚拟应变量概率模型,应变量本身是定性变量(比如你研究某产品的购买率,应变量本 身就是买或不买) 三、虚拟变量的设置规则 1、虚拟变量D取值为0,还是取值为1,要根据研究的目的决定。D取值为0的类型,是基础类型,是比较的基准。不如前面说的性别变量,如果你研究是以男性为研究基准,则样本为男性,D取值为0, 2、避免落入“虚拟变量陷阱”。 当一个定性变量含有m个相互排斥的类型时,应向模型引入m—1个虚拟变量。比如“性别”含男性和女性两个类别,所以当性别作为解释变量时,应向模型引入一个虚拟变量。取值方式是:D=1(男性)、D=0(女性)或D=0(男性)、D=1(女性) 而当“学历”含有四个类别时,即大学、中学、小学、无学历。当“学历”作为解释变量时,应向模型引入三个虚拟变量。一种取值方式是: 1 (大学)1(中学)1(小学) D1= 0 (非大学)D2 = 0(非中学)D3= 0(非小学) 所谓的“虚拟变量陷阱”就是当一个定性变量含有m个类别时,模型引入m个虚拟变量,造成了虚拟变量之间产生完全多重共线性,无法估计回归参数。 在m-1个虚拟变量中,虚拟变量可以同时取值为0,但不能全部取值为1。 3、当定性变量含有m个类别时,不能把虚拟变量的值设为D=0(第一类)D=1(二类)D=2(三类)等等。

多重共线性问题的几种解决方法

多重共线性问题的几种解决方法 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释 变量之间不存在线性关系,也就是说,解释变量X 1,X 2 ,……,X k 中的任何一个 都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考: 1、保留重要解释变量,去掉次要或可替代解释变量 2、用相对数变量替代绝对数变量 3、差分法 4、逐步回归分析 5、主成份分析 6、偏最小二乘回归 7、岭回归 8、增加样本容量 这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。 逐步回归分析方法的基本思想是通过相关系数r、拟合优度R2和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。具体方法分为两步: 第一步,先将被解释变量y对每个解释变量作简单回归: 对每一个回归方程进行统计检验分析(相关系数r、拟合优度R2和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。

第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别: 1.如果新引进的解释变量使R2得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。 2.如果新引进的解释变量对R2改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。 3.如果新引进的解释变量不仅改变了R2,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。如果通过检验证明回归模型存在明显线性相关的两个解释变量中的其中一个可以被另一个很好地解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。 下边我们通过实例来说明逐步回归分析方法在解决多重共线性问题上的具体应用过程。 具体实例 例1设某地10年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数的调查数据如表1,请建立需求函数模型。 表1 服装消费及相关变量调查数据

计量经济学实验教学案例实验9_虚拟变量

实验九虚拟变量 【实验目的】 掌握虚拟变量的设置方法。 【实验内容】 一、试根据表9-1的1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料建立我国城镇居民彩电需求函数; 资料来源:据《中国统计年鉴1999》整理计算得到 二、试建立我国税收预测模型(数据见实验一); 资料来源:《中国统计年鉴1999》 三、试根据表9-2的资料用混合样本数据建立我国城镇居民消费函数。

资料来源:据《中国统计年鉴》1999-2000整理计算得到 【实验步骤】 一、我国城镇居民彩电需求函数 ⒈相关图分析; 键入命令:SCAT X Y ,则人均收入与彩电拥有量的相关图如9-1所示。 从相关图可以看出,前3个样本点(即低收入家庭)与后5个样本点(中、高收入)的拥有量存在较大差异,因此,为了反映“收入层次”这一定性因素的影响,设置虚拟变量如下: ?? ?=低收入家庭 中、高收入家庭 1D 图9-1 我国城镇居民人均收入与彩电拥有量相关图 ⒉构造虚拟变量; 方式1:使用DATA 命令直接输入; 方式2:使用SMPL 和GENR 命令直接定义。 DATA D1 GENR XD=X*D1 ⒊估计虚拟变量模型: LS Y C X D1 XD 再由t 检验值判断虚拟变量的引入方式,并写出各类家庭的需求函数。 按照以上步骤,虚拟变量模型的估计结果如图9-2所示。

图7-2 我国城镇居民彩电需求的估计 我国城镇居民彩电需求函数的估计结果为: i i i i XD D x y 0088.08731.310119.061.57?-++= =t (16.249)(9.028) (8.320) (-6.593) 2R =0.9964 2R =0.9937 F =366.374 S.E =1.066 虚拟变量的回归系数的t 检验都是显著的,且模型的拟合优度很高,说明我国城镇居民低收入家庭与中高收入家庭对彩电的消费需求,在截距和斜率上都存在着明显差异,所以以加法和乘法方式引入虚拟变量是合理的。低收入家庭与中高收入家庭各自的需求函数为: 低收入家庭: i i x y 0119.061.57?+= 中高收入家庭: ()()i i x y 0088.00119.08731.3161.57 ?-++=i x 003.048.89+= 由此可见我国城镇居民家庭现阶段彩电消费需求的特点:对于人均年收入在3300元以下的低收入家庭,需求量随着收入水平的提高而快速上升,人均年收入每增加1000元,百户拥有量将平均增加12台;对于人均年收入在4100元以上的中高收入家庭,虽然需求量随着收入水平的提高也在增加,但增速趋缓,人均年收入每增加1000元,百户拥有量只增加3台。事实上,现阶段我国城镇居民中国收入家庭的彩电普及率已达到百分之百,所以对彩电的消费需求处于更新换代阶段。 二、我国税收预测模型 要求:设置虚拟变量反映1996年税收政策的影响。 方法:取虚拟变量D1=1(1996年以后),D1=0(1996年以前)。 键入命令:GENR XD=X*D1 LS Y C X D1 XD 则模型估计的相关信息如图7-3所示。

虚拟变量案例

虚拟变量(dummy variable) 在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中。 由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量,用D表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。 1.截距移动 设有模型, y t = 0 + 1 x t + 2D + u t , 其中y t,x t为定量变量;D为定性变量。当D= 0 或1时,上述模型可表达为, + 1x t + u t , (D = 0) y t = (0 + 2) + 1x t + u t , (D = 1) D =0 D = 1 +2 图8.1 测量截距不同 D= 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若2显著不为零,说明截距不同;若2为零,说明这种分类无显著性差异。 例:中国成年人体重y(kg)与身高x(cm)的回归关系如下: –105 + x D = 1 (男) y = - 100 + x - 5D = – 100 + x D = 0 (女) 注意: ①若定性变量含有m个类别,应引入m-1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap)。 ②关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。

③定性变量中取值为0所对应的类别称作基础类别(base category)。 ④对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1 (大学) D =0 (中学) -1 (小学)。 【案例1】中国季节GDP数据的拟合(虚拟变量应用,file:case1及case1-solve) GDP序列图不用虚拟变量的情形若不采用虚拟变量,得回归结果如下, GDP = 1.5427 + 0.0405 T (11.0) (3.5) R2 = 0.3991, DW = 2.6,s.e. = 0.3 定义 1 (1季度) 1 (2季度) 1 (3季度) D1 = D2 = D3 = 0 (2, 3,4季度) 0 (1, 3, 4季度) 0 (1, 2, 4季度) 第4季度为基础类别。 GDP = 2.0922 + 0.0315 T – 0.8013 D1 – 0.5137 D2– 0.5014 D3 (64.2) (15.9) (-24.9) (-16.1) (-15.8) R2 = 0.9863, DW = 1.96,s.e. = 0.05 附数据如下: 年GDP t D1D2D3 1996:11.31561100 1996:21.66002010

2019年1计量经济学作业多重共线性p171.doc复习进程

2019年1计量经济学作业多重共线性 p171.d o c

计量经济学作业 ——多重共线性P171 8.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值: 时间序列观测值表 3 6.5 47.5 5.2 108 86 4 7.1 49.2 6.8 100 100 5 7.2 52.3 7.3 99 107 6 7.6 58.0 8. 7 99 111 7 8.0 61.3 10.2 101 114 8 9.0 62.3 14.1 97 116 9 9.0 64.7 17.1 93 119 10 9.3 66.8 21.3 102 121 (1)采用适当的方法检验多重共线性。 (2)多重共线性对参数估计值有何影响? (3)用Frisch法确定一个较好的回归模型。 解:(1)采用参数估计值的统计检验法检验多重共线性。 用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:

图1-1 在Eviews中建立样本回归模型 图1-2 样本回归模型数据表 输入被解释变量与解释变量: 图1-3 整体样本回归模型建立

用最小二乘法求得结果如下所示: 图1-4 Eviews的结果分析一元线性样本回归方程为: 1.拟合优度检验 由上表可知,样本可决系数为: R-squared=0.978915 修正样本可决系数为: Adjusted-squared=0.962046 即

计算结果表明,估计的样本回归方程较好的拟合了样本观测值。 2.F检验 提出检验的原假设为 对立假设为 由图1-4,得F统计量为 F-statistic=58.03254 对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。因为 F=58.03254>5.19,所以否定H0,总体回归方程显著。 3.t检验 提出检验的原假设为 由上表可知,t统计量为 β0的t-statistic=1.975329 β1的t-statistic=1.149646 β2的t-statistic=2.401806 β3的t-statistic=-0.662938

第七章 多共线性及其处理

第七章 多重共线性及其处理 第一部分 学习辅导 一、本章学习目的与要求 1.理解多重共线性的概念; 2.掌握多重共线性存在的主要原因; 3.理解多重共线性可能造成的后果; 4.掌握多重共线性的检验与修正的方法。 二、本章内容提要 本章主要介绍计量经济模型的计量经济检验。即多重共线性问题。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 (一)多重共线性及其产生的原因 当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。 1.多重共线性的基本概念 多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。 如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21ΛΛ间存在完全多重共线性。解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。因此,必有一个列向量可由其余列向量线性表示。 同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。 2.多重共线性产生的原因 多元线性回归模型产生多重共线性的原因很多,主要有: (1)经济变量的内在联系 这是产生多重共线性的根本原因。 (2)解释变量中含有滞后变量 (3)经济变量变化趋势的“共向性” 必须指出,多重共线性基本上是一种样本现象。因为人们在设定模型时,总是尽量避免将理论上具有严格线性关系的变量作为解释变量收集在一起,因此,实际问题中的多重共线性并不是解释变量之间存在理论上或实际上的线性关系造成的,而是由所收集的数据(解释变量观察值)之间存在近似的线性关系所致。 (二)多重共线性的影响 多重共线性会产生以下问题: (1)增大了OLS 估计量的方差 (2)难以区分每个解释变量的单独影响 (3)回归模型缺乏稳定性 (4)t 检验的可靠性降低 (三)多重共线性的判别 在应用多元回归模型中,人们总结了许多检验多重共线性的方法。 1.系数判定法

计量经济学范本

第八章 虚拟变量 一、单选题: 1、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则α ==)0|(i i D Y E 表示( B ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其他; 2、虚拟变量模型i i i D Y μβα++=中,i Y 为居民的年可支配收入,i D 为虚拟解释变量, i D =1代表城镇居民,i D =0代表非城镇居民。当i μ满足古典假设时,则βα+==)1|(i i D Y E 表示( A ) A 、城镇居民的年平均收入, B 、非城镇居民的年平均收入, C 、所有居民的年平均收入, D 、其它; 3、在没有定量解释变量的情形下,以加法形式引入虚拟解释变量,主要用于( C )。 A 、共线性分析, B 、自相关分析, C 、方差分析 , D 、其它 4、如果你有连续几年的月度数据,如果只有2、4、6、8、10、12月表现季节类型,则需要引入虚拟变量的个数是( B )。 A 、模型中有截距项时,引入12个, B 、模型中有截距项时,引入5个 C 、模型中没有截距项时,引入11个, D 、模型中没有截距项时,引入12个 5、下列不属于常用的虚拟变量模型是( D ); A 、解释变量中只包含虚拟变量, B 、解释变量中既含定量变量又含虚拟变量, C 、被解释变量本身为虚拟变量的模型, D 、解释变量和被解释变量中不含虚拟变量。 6、考虑虚拟变量模型:i i i X D D D Y μβαααα+++++=3322110,其中 ???=其他一季度011D ???=其他二季度012D ???=其他 三季度013D , 当其随机扰动项服从古典假定时,则下列回归方程中表示一季度的是:( B ) A 、i i i X D D D X Y E βαα++====)()0,1,|(20312 B 、i i i X D D D X Y E βαα++====)()0,1,|(10321 C 、i i i X D D D X Y E βαα++====)()0,1,|(30213 D 、i i i X D D D X Y E βα+====0321)0,|( 7、在含有截距项的分段线性回归分析中,如果只有一个属性变量,且其有三种类型,则引入虚拟变量个数应为( B ) A 、 1个, B 、 2个, C 、3个, D 、4个; 8、某商品需求函数为 u x b b y i i i ++=10,其中y 为需求量,x 为价格。为了考虑“地

多重共线性与虚拟变量

多重共线性 以下是美国1971-1986年间的年数据。 其中,y为售出新客车的数量(千辆);x1为新车,消费者价格指数,1967=100;x2为所有物品所有居民的消费者价格指数,1967=100;x3为个人可支配收入(PDI,10亿美元);x4为利率;x5为城市就业劳动力(千人)。 考虑下面的客车需求函数: Lny=b0+b1lnx1+b2lnx2+b3lnx3+b4lnx4+b5lnx5+u (1)用OLS法估计样本回归方程。 (2)如果模型存在多重共线性,试估计各辅助回归方程,并找出哪些变量是高度共线性的。 (3)如果存在严重的共线性,你会剔除哪一个变量,为什么? (4)在剔除一个或多个解释变量后,最终的客车需求函数是什么?这个模型在哪些方面好于包括所有解释变量的原始模型? (5)你认为还有哪些变量可以更好地解释美国的汽车需求? 美国人个可支配收入与储蓄模型(EP129.wf1)

问题描述:研究1970~1995年间美国个人可支配收入与个人储蓄的关系。在1982年,美国遭受到和平时期最严重的经济衰退,当年的城市失业率高达9.7%,是自1948年以来失业率最高的一年。这种事件会扰乱收入和储蓄之间的关系,现考察这种情况是否会发生。 美国个人可支配收入与个人储蓄数据 思考:实际上是对模型稳定性的检验,除了用CHOW 检验,也可用虚拟变量模型进行判断。 1.构造虚拟变量 { 110 1982 1982D = 年以后 年及以前 2.建立虚拟变量模型 在命令窗口输入LS saving c d1 income income*d1,执行后会发现income*d1的系数不显著,可以将其剔除,再次进行LS saving c d1 income ,则发现d1的系数是显著的,因此1982年的事件对美国个人可支配收入与个人储蓄的关系有显著的影响,原模型不具有稳定性。 也可以做分段线性回归,在命令窗口输入LS saving c income (income -2374.3)*d1,执行后也会发现(income -2374.3)*d1的系数显著不为零,可以得到同样的结论。 实验:虚拟变量模型

解决多元线性回归中多重共线性问题的方法分析

解决多元线性回归中多重共线性问题的方法分析 谢小韦,印凡成 河海大学理学院,南京 (210098) E-mail :xiexiaowei@https://www.wendangku.net/doc/8f5640691.html, 摘 要:为了解决多元线性回归中自变量之间的多重共线性问题,常用的有三种方法: 岭回 归、主成分回归和偏最小二乘回归。本文以考察职工平均货币工资为例,利用三种方法的 SAS 程序进行了回归分析,根据分析结果总结出三种方法的优缺点,结果表明如果能够使用 定性分析和定量分析结合的方法确定一个合适的k 值,则岭回归可以很好地消除共线性影 响;主成分回归和偏最小二乘回归采用成份提取的方法进行回归建模,由于偏最小二乘回归 考虑到与因变量的关系,因而比主成分回归更具优越性。 关键词:多重共线性;岭回归;主成分回归;偏最小二乘回归 1. 引言 现代化的工农业生产、社会经济生活、科学研究等各个领域中,经常要对数据进行分析、 拟合及预测,多元线性回归是常用的方法之一。多元线性回归是研究多个自变量与一个因变 量间是否存在线性关系,并用多元线性回归方程来表达这种关系,或者定量地刻画一个因变 量与多个自变量间的线性依存关系。 在对实际问题的回归分析中,分析人员为避免遗漏重要的系统特征往往倾向于较周到地 选取有关指标,但这些指标之间常有高度相关的现象,这便是多变量系统中的多重共线性现 象。在多元线性回归分析中,这种变量的多重相关性常会严重影响参数估计,扩大模型误差, 破坏模型的稳健性,从而导致整体的拟合度很大,但个体参数估计值的t 统计量却很小,并 且无法通过检验。由于它的危害十分严重,存在却又十分的普遍,因此就要设法消除多重线 性的不良影响。 常用的解决多元线性回归中多重共线性问题的模型主要有主成分回归、岭回归以及偏最 小二乘回归。三种方法采用不同的方法进行回归建模,决定了它们会产生不同的效果。本文 以统计职工平均货币工资为例,考察一组存在共线性的数据,运用SAS 程序对三种回归进 行建模分析,并对结果进行比较,总结出它们的优势与局限,从而更好地指导我们解决实际 问题。 2. 共线性诊断 拟合多元线性回归时,自变量之间因存在线性关系或近似线性关系,隐蔽变量的显著性, 增加参数估计的方差,导致产生一个不稳定的模型,因此共线性诊断的方法是基于自变量的 观测数据构成的矩阵T x x 进行分析,使用各种反映自变量间相关性的指标。共线性诊断常 用统计量有方差膨胀因子VIF (或容限TOL )、条件指数和方差比例等。 一般认为:若VIF>10,说明模型中有很强的共线性关系;若条件指数值在10与30间 为弱相关,在30与100间为中等相关,大于100为强相关;在大的条件指数中由方差比例 超过0.5的自变量构成的变量子集就认为是相关变量集[1]。 3. 三种解决方法 岭回归基本思想: 当出现多重共线性时,有0T X X ≈,从而使参数的1?()T T X X X Y β ?=很不稳定,出现不符合含义的估计值,给T X X 加上一个正常数矩阵(0)KI K >,则T X X KI +等

最新多重共线性的解决之法

多重共线性的解决之 法

第七章多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews软件解决多重共线性的实际问题。 第一节多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型

i ki k i i i X X X Y μββββ+++++= 22110 (7- 1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: 0X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共 线性。 从矩阵形式来看,就是0'=X X , 即1)(-

《计量经济学》虚拟变量练习题及参考答案

一、选择题 1、 对于一个含有截距项的计量经济模型,若某定性因素有m 个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为( B ) A. m B. m-1 C. m+1 D. m-k 2、 在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X 的回归关系明显不同。现以1991年为转折时期,设虚拟变 量???=年以前,年以后,1991019911t D ,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作( D ) A. t t t u X Y ++=10ββ B. t t t t t u X D X Y +++=210βββ C. t t t t u D X Y +++=210βββ D. t t t t t t u X D D X Y ++++=3210ββββ 3、设某地区消费函数中,消费支出不仅与收入x 有关,而且与消费者的年龄构成有关,若将年龄构成分为小孩、青年人、成年人和老年人4个层次。假设边际消费倾向不变,考虑上述年龄构成因素的影响时,该消费函数引入虚拟变量的个数为 ( C ) A.1个 B.2个 C.3个 D.4个 4、在利用月度数据构建计量经济模型时,如果一年里的12个月全部表现出季节模式,则应该引入虚拟变量个数为( C ) A. 4 B. 12 C. 11 D. 6 5、在利用月度数据构建计量经济模型时,如果一年里的1、3、5、9四个月表现出季节模式,则应该引入虚拟变量个数为( 3个 ) 6、个人保健支出的计量经济模型为:i i i i X D Y μβαα+++=221 ,其中i Y 为保健年度 支出;i X 为个人年度收入;虚拟变量 ???=大学以下大学及以上 012i D ;i μ满足古典假定。则大学以上群体的平均年度保健支出为 ( B ) A. i i i i X D X Y E βα+==12)0,/( B.i i i i X D X Y E βαα++==212)1,/(

计量经济学Eviews多重共线性实验报告

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期:2014 年05 月11日

广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日

说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 R值。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98 至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ (2.1) 2.1录入数据,得到图。

第七章_虚拟变量

虚拟变量(dummy variable ) 在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。这些因素也应该包括在模型中。 由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量,用D 表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法与定量变量相同。 1.截距移动 设有模型, y t = β0 + β1 x t + β2D + u t , 其中y t ,x t 为定量变量;D 为定性变量。当D = 0 或1时,上述模型可表达为, β0 + β1x t + u t , (D = 0) y t = (β0 + β2) + β1x t + u t , (D = 1) 20 40 60 20 40 60X Y 图8.1 测量截距不同 D = 1或0表示某种特征的有无。反映在数学上是截距不同的两个函数。若β2显著不为零,说明截距不同;若β2为零,说明这种分类无显著性差异。 例:中国成年人体重y (kg )与身高x (cm )的回归关系如下: –105 + x D = 1 (男) y = - 100 + x - 5D = – 100 + x D = 0 (女) 注意: ① 若定性变量含有m 个类别,应引入m -1个虚拟变量,否则会导致多重共线性,称作虚拟变量陷阱(dummy variable trap )。 ② 关于定性变量中的哪个类别取0,哪个类别取1,是任意的,不影响检验结果。 ③ 定性变量中取值为0所对应的类别称作基础类别(base category )。 ④ 对于多于两个类别的定性变量可采用设一个虚拟变量而对不同类别采取赋值不同的方法处理。如: 1 (大学) D = 0 (中学) -1 (小学)。 β0 β0+β2 D = 1 D =0

计量经济学实验报告(虚拟变量)

计量经济学实验报告 实验三:虚拟变量模型 姓名:上善若水 班级: 序号: 学号: 中国人均消费影响因素 一、理论基础及数据 1. 研究目的 本文在现代消费理论的基础,分析建立计量模型,通过对 1979—— 2008 年全国城镇居民的人均消费支出做时间序列分析和对2004— 2008年各地区(31 个省市)城镇居民的人均消费支出做面板数据分析,比较分析了人均可支配收入、消费者物价指数和银行一年期存款利率等变量对居民消费的不同影响。

2. 模型理论 西方消费经济学者们认为,收入是影响消费者消费的主要因素,消费是需求的函数。消费经济学有关收入与消费的关系,即消费函数理论有:( 1)凯恩斯的绝对收入理论。他认为消费主要取决于消费者的净收入,边际消费倾向小于平均消费倾向。他假定,人们的现期消费,取决于他们现期收入的绝对量。(2)杜森贝利的相对收入消费理论。他认为消费者会受自己过去的消费习惯以及周围消费水准来决定消费,从而消费是相对的决定的。当期消费主要决定于当期收入和过去的消费支出水平。(3)弗朗科?莫迪利安的生命周期的消费理论。这种理论把人生分为三个阶段:少年、壮年和老年;在少年与老年阶段,消费大于收入;在壮年阶段,收入大于消费,壮年阶段多余的收入用于偿还少年时期的债务或储蓄起来用来防老。( 4)弗里德曼的永久收入消费理论。他认为消费者的消费支出主要不是由他的现期收入来决定,而是由他的永久收入来决定的。这些理论都强调了收入对消费的影响。除此之外,还有其他一些因素也会对消费行为产生影响。(1)利率。传统的看法认为,提高利率会刺激储蓄,从而减少消费。当然现代经济学家也有不同意见,他们认为利率对储蓄的影响要视其对储蓄的替代效应和收入效应而定,具体问题具体分析。( 2)价格指数。价格的变动可以使得实际收入发生变化,从而改变消费。 基于上述这些经济理论,我找到中国 1979-2008 年全国城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数和 2004— 2008年各地区城镇居民人均消费以及城镇居民人均可支配收入、城镇居民消费者物价指数、以及银行一年期存款利率的官方数据。想借此来分析中国消费的影响因素以及它们具体是如何对消费产生影响的。针对这一模型,有以下两个假定。一,自改革开放以来,我国人均消费倾向呈现缓慢的递减趋势,即保持粘性。这一假定符合我国居民的储蓄——消费心理,也与其他一些发展中国家的情况大体一致。二,由储蓄和消费的替代关系,可以假定刺激储蓄的因素,会制约消费。我们知道提高利率会刺激储蓄,因而我把利率也引入模型的分析中。 以下对我所找的数据作一一说明 : 1、城镇居民人均消费水平。借此来代表城镇居民的消费支出情况,这是将要建立计量经济学模型的被解释变量。由下图可以看到消费是逐年增加的,与此同时,人均可支配收入也是逐年增加,隐含着两者可能有很高的线性相关性这层意思。

相关文档
相关文档 最新文档