文档库 最新最全的文档下载
当前位置:文档库 › 第7章分布滞后模型与自回归模型多重共线性.doc

第7章分布滞后模型与自回归模型多重共线性.doc

第7章分布滞后模型与自回归模型多重共线性.doc
第7章分布滞后模型与自回归模型多重共线性.doc

第7章分布滞后模型与自回归模型

7.1 滞后效应与滞后变量模型在经济运行过程中,广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响,而且也受到过去某些时期的各种因素甚至自身的过去值的影响。

通常把这种过去时期的,具有滞后作用的变量叫做滞后变量( Lagged Variable ),含有滞后变

量的模型称为滞后变量模型。

滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型,又称动态模型( Dynamical Model )。

一、滞后效应与与产生滞后效应的原因因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。表

示前几期值的变量称为滞后变量。

如:消费函数通常认为,本期的消费除了受本期的收入影响之外,还受前1期,或前2期收入的影响:

C t= 0+ 1Y t+ 2Y t-1+ 3Y t-2+ t

Y t-i, Y t-2为滞后变量。

产生滞后效应的原因

1、心理因素:人们的心理定势,行为方式滞后于经济形势的变化,如中彩票的人不可能很快改变其生活方式。

2、技术原因:如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。

3、制度原因:如定期存款到期才能提取,造成了它对社会购买力的影响具有滞后性。二、滞后变量模型

以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为:

Y t 0 1Y t 1 2Y t 2 q Y t q 0 X t 1X t 1

s X t s q, s:滞后时间间隔

自回归分布滞后模型 (autoregressive distributed lag model, ADL ):既含有Y对自身滞后

变量的回归,还包括着X分布在不同时期的滞后变量

有限自回归分布滞后模型:滞后期长度有限

无限自回归分布滞后模型:滞后期无限,

( 1)分布滞后模型( distributed-lag model )

分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X的当期值及其若干期的滞后值:

s

Y t i X t i t

i0

0:短期(short-run) 或即期乘数(impact multiplier) ,表示本期X变化一单位对Y平均值的影

响程度。

i (i=1,2 …,s):动态乘数或延迟系数,表示各滞后期X的变动对Y平均值影响的大小。

s

i 0称为长期(Iong-run )或均衡乘数(total distributed-lag multiplier ),表示X变动一

个单位,由于滞后效应而形成的对丫平均值总影响的大小。

如果各期的X值保持不变,则X与Y间的长期或均衡关系即为:

s

E(Y) ( i )X

i0

q

i

X t

i

Y t i

i 1

§ 7.2分布滞后模型的参数估计 一、 分布滞后模型估计的困难

无限期的分布滞后模型,由于样本观测值的有限性,使得无法直接对其进行估计。 有限期的分布滞后模型,

OLS 会遇到如下问题:

1、 没有先验准则确定滞后期长度;

2、 如果滞后期较长,将缺乏足够的自由度进行估计和检验;

3、 同名变量滞后值之间可能存在高度线性相关,即模型存在高度的多重共线性。

二、 分布滞后模型的修正估计方法

人们提出了一系列的修正估计方法,但并不很完善。

各种方法的基本思想大致相同:都是通过对各滞后变量加权,组成线性合成变量而有目的地减 少滞后变量的数目,以缓解多重共线性,保证自由度。

(1) 经验加权法

根据实际问题的特点、实际经验给各滞后变量指定权数,滞后变量按权数线性组合,构成新的 变量。权数据的类型有:

递减型

即认为权数是递减的,X 的近期值对Y 的影响较远期值大。 如消费函数中,收入的近期值对消费的影响作用显然大于远期值的影响。

例如:滞后期为3的一组权数可取值如下:1/2, 1/4, 1/6,1/8

矩型:

即认为权数是相等的,X 的逐期滞后值对值Y 的影响相同。 如滞后期为3,指定相等权数为1/4,则新的线性组合变量为:

产出贡献最大。如滞后期为4,权数可取为1/6,

1/4, 1/2, 1/3, 1/5

1

1 1 1 W 1t

X t X t 1 X t 2 X t 3 2 4 6 8

则新的线性组合变量为: 自回归模型:模型中的解释变量仅包含

X 的当期值与被解释变量

Y 的一个或多个滞后值

Y t

0 1X t

称为一阶自回归模型( first-order autoregressive model

)。

1

1 W 2t -X t

-X t1 4

4

1-X t 2 4

£X t3 4

倒V 型

权数先递增后递减呈倒“ ' V ”型。

例如:在一个较长建设周期的投资中, 历年投资

X 为产出丫的影响,往往在周期期中投资对本期

1

1 1 W 3t -X t

X t 1 X t 2 则新变量为 6

4 2

1 1

— X t 3 X t 4 3 5

经验权数法的优点是:简单易行 缺点是:设置权数的随意性较大

通常的做法是:多选几组权数,分别估计出几个模型,然后根据常用的统计检验(R 方检验,

F 检验,t 检验,D - W 检验),从中选择最佳估计式。

(2) 阿尔蒙(A Imon )多项式法 主要思想:针对有限滞后期模型,通过阿尔蒙变换,定义新变量,以减少

解释变量个数,然后 用OLSt 估计参数。

主要步骤为: 第一步,阿尔蒙变换

其中,m

k ,例如取k=2,得

2

1

(i 1)

2

(i 1) 2

Y t

s2

k

k

(i 1)k

( k (i 1) )X t

k1

i 0 k1

s s 1

(i 1)X t i

2

2 (i 1)2 X t 2 t

i0

i0

(3) 科伊克(Koyck )方法 科伊克方法是将无限分布滞后模型转换为自回归模型,然后进行估计。

科伊克变换假设 i 随滞后期 i 按几何级数衰减: i 其中, 0< <1,称为分布滞后衰减率, 1- 称为调整速率 科伊克模型的特点:

1 )以一个滞后因变量 Yt-1 代替了大量的滞后解释变量

了滞后期长度s 难以确定的问题;

(2)由于滞后一期的因变量 Yt-1与Xt 的线性相关程度可以肯定

小于

X 的各期滞后值之间的相关

程度,从而缓解了多重共线性。

但科伊克变换也同时产生了两个新问题: ( 1 )模型存在随机项和 vt 的一阶自相关性; ( 2)滞后被解释变量 Yt-1 与随机项 vt 不独立。 这些新问题需要进一步解决。

§7.3 自回归模型的构造 一个无限期分布滞后模型可以通过科伊克变

换转化为自回归模型。 事实上, 许多滞后变量模型都可以转化为自回归模型, 自回归模型是经济生活中更常见的模型。 以适应预期模型以及局部调整模型为例进行说明。

一、自适应预期( Adaptive expectation )模型 在某些实际问题中,因变量Yt 并不取决于解释变量的当前实际值

Xt ,而取决于Xt 的“预期水平”

或“长期均衡水平” Xte 。

Y t

对于分布滞后模型

s

i X t i t

i0

假定其回归系数i 可用一个关于滞后期i 的适当阶数的多项式来表示,即

k

(i k1

1)

Y t

对于无限分布滞后模型:

i X t i

t

i 0

Speed of adjustment )。

Xt-i ,最大限度地节省了自由度,解决

例如,家庭本期消费水平,取决于本期收入的预期值; 市场上某种商品供求量,决定于本期该商品价格的均衡值。

其中: r 为预期系数( coefficient of expectation ) , 0 r 1。 该式的经济含义为:“经济行为者将根据过去的经验修改他们的预期”,即本期预期值的形成 是一个逐步调整过程,本期预期值的增量是本期实际值与前一期预期值之差的一部分,其比例为 r

可将自适应预期模型转化为自回归模型。 二、局部调整 (Partial Adjustment) 模型 局部调整模型主要是用来研究物资储备问题的。

例如,企业为了保证生产和销售,必须保持一定的原材料储备。对应于一定的产量或销售量 存在着预期的最佳库存 Yte 。

Yte 不可观测。由于生产条件的波动,生产管理方面的原因,库存储备

变化的一部分。可见,局部调整模型转化为自回归模型

§7.4 自回归模型的参数估计

q

Y t

0 1

X t

i Y t i t

i1

估计时的主要问题:滞后被解释变量的存在可能导致它与随机扰动项相关,以及随机扰动项出 现序列相关性。 因此,对自回归模型的估计主要需视滞后被解释变量与随机扰动项的不同关系进行估计。 以一阶自回归模型为例说明 :

一、 工具变量法 对于一阶自回归模型 Y t

1X t

2Y t 1 t

若Yt-1与t 同期相关,则OLS 估计是有偏的,并且不是一致估计。 因此,对上述模型,通常采用工具变量法,即寻找一个新的经济变量 Zt ,用来代替 Yt-1 。

参数估计量具有一致性。

在实际估计中,一般用 X 的若干滞后的线性组合作为 Yt-1的工具变量:

Y?

t 1 0 1X t 1 2 X t 2 s X t s

由于原模型已假设随机扰动项 t 与解释变量X 及其滞后项不存在相关性,因此上述工具变量与 t

不再线性相关。

一个更简单的情形是直接用 Xt-1作为Yt-1的工具变量。

二、 普通最小二乘法

因此,自适应预期模型最初表现形式是

Yt

0 1X t

由于预期变量是不可实际观测的,往往作如下自适应预期假定

X t e

X t e 1 r(X t

X t e

1)

这个假定还可写成:

X t e

rX t (1 r)X t e

1

Xt , 局部调整模型的最初形式为

Y t e

0 1X t

Yt 的实际变化量只是预期

对于自回归模型

若滞后被解释变量Yt-1与随机扰动项t 同期无关(如局部调整模型),可直接使用OLSt 进行估 计,得到一致估计量。注意:上述工具变量法只解决了解释变量与 t 相关对参数估计所造成的影响,

但没有解决t 的自相关问题。

事实上,对于自回归模型,

t 项的自相关问题始终存在,对于此问题,至今没有完全有效的解

决方法。唯一可做的,就是尽可能地建立“正确”的模型,以使序列相关性的程度减轻。

例741 建立中国长期货币流通量需求模型 经验表明:中国改革开放以来,对货币需求量 (Y)的影响因素,主要有资金运用中的贷款额 (X)

以及反映价格变化的居民消费者价格指数

(P)。

尽管D.W.=1.733,但不能据此判断自回归模型不存在自相关 (Why?)。

但 LM=0.7855

,

=5%F ,临界值 2(1)=3.84 ,

判断:模型已不存在一阶自相关。 § 7.5格兰杰因果关系检验

自回归分布滞后模型旨在揭示:某变量的变化受其自身及其他变量过去行为的影响。 然而,许多经济变量有着相互的影响关系

问题:当两个变量在时间上有先导一一滞后关系时,能否从统计上考察这种关系是单向的还是 双向的?即:主要是一个变量过去的行为在影响另一个变量的当前行为呢?还是双方的过去行为在 相互影响着对方的当前行为?

格兰杰因果关系检验(

Gran ger test of causality )

对两变量Y 与 X ,格兰杰因果关系检验要求估计

分别做包含与不包含 X 滞后项的回归,记前者与后者的残差平方和分别为

RSSU RSSR 再计算F

F

(RSQ RSgJ/m

统计量:

RSSj /(n k)

如果:F>F (m,n-k),则拒绝原假设,认为 X 是丫的格兰杰原因。

注意:格兰杰因果关系检验对于滞后期长度的选择有时很敏感。不同的滞后期可能会得到完全 不同的检验结果。因此,一般而言,常进行不同滞后期长度的检验,以检验模型中随机误差项不存 在序列相关的滞后期长度来选取滞后期。

思考题

1、 什么是滞后现象?产生滞后现象的原因是什么?

2、 对分布滞后模型进行估计存在哪些困难?实际应用中如何处理这些困难?

3、 检验一阶自回归模型随机扰动项是否存在自相关,为什么用德宾

h 检验而不用DW 检验?

m

.X t

- I t I

i 1

.

Y t

I 1

1t

m

m

X t

.

i

i X t

i 1 i 1

2t

最新第二章(简单线性回归模型)2-3答案

2.3拟合优度的度量 一、判断题 1.当 ()∑-2i y y 确定时,()∑-2 i y y ?越小,表明模型的拟合优度越好。(F ) 2.可以证明,可决系数2R 高意味着每个回归系数都是可信任的。(F ) 3.可决系数2R 的大小不受到回归模型中所包含的解释变量个数的影响。(F ) 4.任何两个计量经济模型的2R 都是可以比较的。(F ) 5.拟合优度2R 的值越大,说明样本回归模型对数据的拟合程度越高。( T ) 6.结构分析是2R 高就足够了,作预测分析时仅要求可决系数高还不够。( F ) 7.通过2R 的高低可以进行显著性判断。(F ) 8.2R 是非随机变量。(F ) 二、单项选择题 1.已知某一直线回归方程的可决系数为0.64,则解释变量与被解释变量间的线性相关系数为( B )。 A .±0.64 B .±0.8 C .±0.4 D .±0.32 2.可决系数2R 的取值范围是( C )。 A .2R ≤-1 B .2R ≥1 C .0≤2R ≤1 D .-1≤2R ≤1 3.下列说法中正确的是:( D ) A 如果模型的2R 很高,我们可以认为此模型的质量较好 B 如果模型的2R 较低,我们可以认为此模型的质量较差 C 如果某一参数不能通过显著性检验,我们应该剔除该解释变量 D 如果某一参数不能通过显著性检验,我们不应该随便剔除该解释变量 三、多项选择题 1.反映回归直线拟合优度的指标有( ACDE )。 A .相关系数 B .回归系数 C .样本可决系数 D .回归方程的标准差 E .剩余变差(或残差平方和) 2.对于样本回归直线i 01i ???Y X ββ+=,回归变差可以表示为( ABCDE )。 A .2 2i i i i ?Y Y -Y Y ∑ ∑  (-) (-) B .2 2 1 i i ?X X β∑ (-) C .2 2 i i R Y Y ∑ (-) D .2 i i ?Y Y ∑(-) E .1 i i i i ?X X Y Y β∑ (-()-) 3.对于样本回归直线i 01i ???Y X ββ+=,?σ为估计标准差,下列可决系数的算式中,正确的有( ABCDE )。 A .2i i 2 i i ?Y Y Y Y ∑∑(-)(-) B .2i i 2 i i ?Y Y 1Y Y ∑∑ (-)-(-)

自回归分布滞后模型ADL的运用试验指导-时间序列分析

案例六 自回归分布滞后模型(ADL )的运用实验指导 一、实验目的 理解ADL 模型的原理与应用条件,学会运用ADL 模型来估计变量之间长期稳定关系。理解从经济理论上来说,两个经济变量之间的确有长期关系采用使用该模型进行估计。理解ADL 模型的优点:不管回归项是不是1阶单整或平稳都可以进行检验和估计。而进行标准的协整分析前,必须把变量分类成(0)I 和(1)I 。 二、基本概念 Jorgenson(1966)提出的(,p q )阶自回归分布滞后模型ADL(autoregressive distributed lag):011111 i t t p t p t t q t q i t i i y y y ταφφεθεθεβ-----='=++++--+∑x ,其中t i -x 是滞后i 期 的外生变量向量(维数与变量个数相同),且每个外生变量的最大滞后阶数为i τ,i β是参数向量。当不存在外生变量时,模型就退化为一般ARMA (,p q )模型。 如果模型中不含有移动平均项,可以采用OLS 方法估计参数,若模型中含有移动平均项,线性OLS 估计将是非一致性估计,应采用非线性最小二乘估计。 三、实验内容及要求 (1)实验内容 运用ADL 模型研究1992年1月到1998年12月我国城镇居民月对数人均生活费支出yt 和对数可支配收入xt 之间的长期稳定关系。 (2)实验要求 在认真理解模型应用条件的基础上,通过实验掌握ADL 模型的实际应用方法,并熟悉Eniews 的具体操作过程。 四、实验指导 (1)数据录入 打开Eviews 软件,选择“File”菜单中的“New --Workfile”选项,在“Workfile structure type ”栏选择“Dated-regular frequency ”,在“Data specification ”栏中“Frequency ”中选择“Monthly ”即月份数据,起始时间输入1992m1即1992年1月份,止于1998m12,点击ok ,见图6-1,这样就建立了一个工作文件。 图6-1 建立工作文件窗口

多元线性回归模型的案例分析

1. 表1列出了某地区家庭人均鸡肉年消费量Y 与家庭月平均收入X ,鸡肉价格P 1,猪肉价格P 2与牛肉价格P 3的相关数据。 年份 Y/千 克 X/ 元 P 1/(元/千克) P 2/(元/千克) P 3/(元/千克) 年份 Y/千克 X/元 P 1/(元/ 千克) P 2/(元/ 千克) P 3/(元/千克) 1980 2.78 397 4.22 5.07 7.83 1992 4.18 911 3.97 7.91 11.40 1981 2.99 413 3.81 5.20 7.92 1993 4.04 931 5.21 9.54 12.41 1982 2.98 439 4.03 5.40 7.92 1994 4.07 1021 4.89 9.42 12.76 1983 3.08 459 3.95 5.53 7.92 1995 4.01 1165 5.83 12.35 14.29 1984 3.12 492 3.73 5.47 7.74 1996 4.27 1349 5.79 12.99 14.36 1985 3.33 528 3.81 6.37 8.02 1997 4.41 1449 5.67 11.76 13.92 1986 3.56 560 3.93 6.98 8.04 1998 4.67 1575 6.37 13.09 16.55 1987 3.64 624 3.78 6.59 8.39 1999 5.06 1759 6.16 12.98 20.33 1988 3.67 666 3.84 6.45 8.55 2000 5.01 1994 5.89 12.80 21.96 1989 3.84 717 4.01 7.00 9.37 2001 5.17 2258 6.64 14.10 22.16 1990 4.04 768 3.86 7.32 10.61 2002 5.29 2478 7.04 16.82 23.26 1991 4.03 843 3.98 6.78 10.48 (1) 求出该地区关于家庭鸡肉消费需求的如下模型: 01213243ln ln ln ln ln Y X P P P u βββββ=+++++ (2) 请分析,鸡肉的家庭消费需求是否受猪肉及牛肉价格的影响。 先做回归分析,过程如下: 输出结果如下:

(完整版)第二章(简单线性回归模型)2-2答案

2.2 简单线性回归模型参数的估计 一、判断题 1.使用普通最小二乘法估计模型时,所选择的回归线使得所有观察值的残差和达到最小。(F) 2.随机扰动项和残差项是一回事。(F ) 3.在任何情况下OLS 估计量都是待估参数的最优线性无偏估计。(F ) 4.满足基本假设条件下,随机误差项i μ服从正态分布,但被解释变量Y 不一定服从正态分 布。 ( F ) 5.如果观测值i X 近似相等,也不会影响回归系数的估计量。 ( F ) 二、单项选择题 1.设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是( D )。 A . ()() () i i 1 2 i X X Y -Y ?X X β--∑∑= B .() i i i i 12 2i i n X Y -X Y ? n X -X β∑∑∑∑∑= C .i i 122i X Y -nXY ?X -nX β∑∑= D .i i i i 12x n X Y -X Y ?βσ∑∑∑= 2.以Y 表示实际观测值,?Y 表示回归估计值,则普通最小二乘法估计参数的准则是使( D )。 A .i i ?Y Y 0∑(-)= B .2 i i ?Y Y 0∑ (-)= C .i i ?Y Y ∑(-)=最小 D .2 i i ?Y Y ∑ (-)=最小 3.设Y 表示实际观测值,?Y 表示OLS 估计回归值,则下列哪项成立( D )。 A .?Y Y = B .?Y Y = C .?Y Y = D .?Y Y = 4.用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( D )。 A .X Y (,) B . ?X Y (,) C .?X Y (,) D .X Y (,) 5.以Y 表示实际观测值,?Y 表示OLS 估计回归值,则用OLS 得到的样本回归直线i 01i ???Y X ββ+=满足( A )。 A .i i ?Y Y 0∑(-)= B .2 i i Y Y 0∑ (-)= C . 2 i i ?Y Y 0∑ (-)= D .2i i ?Y Y 0∑ (-)= 6.按经典假设,线性回归模型中的解释变量应是非随机变量,且( A )。 i u i e

自回归分布滞后模型

案例六自回归分布滞后模型(ADL)的运用实验指 导 一、实验目的 理解ADL模型的原理与应用条件,学会运用ADL模型来估计变量之间长期稳定关系。理解从经济理论上来说,两个经济变量之间的确有长期关系采用使用该模型进行估计。理解ADL模型的优点:不管回归项是不是1阶单整或平稳都可以进行检验和估计。而进行标准的协整分析前,必须把变量分类成 和 。 二、基本概念 Jorgenson(1966)提出的( )阶自回归分布滞后模型ADL(autoregressive distributed lag): ,其中 是滞后 期的外生变量向量(维数与变量个数相同),且每个外生变量的最大滞后阶数为 , 是参数向量。当不存在外生变量时,模型就退化为一般ARMA( )模型。 如果模型中不含有移动平均项,可以采用OLS方法估计参数,若模型中含有移动平均项,线性OLS估计将是非一致性估计,应采用非线性最小二乘估计。

三、实验内容及要求 (1)实验内容 运用ADL模型研究1992年1月到1998年12月我国城镇居民月对数人均生活费支出yt和对数可支配收入xt之间的长期稳定关系。 (2)实验要求 在认真理解模型应用条件的基础上,通过实验掌握ADL模型的实际应用方法,并熟悉Eniews的具体操作过程。 四、实验指导 (1)数据录入 打开Eviews软件,选择“File”菜单中的“New--Workfile”选项,在“Workfile structure type”栏选择“Dated-regular frequency”,在“Data specification”栏中“Frequency”中选择“Monthly”即月份数据,起始时间输入1992m1即1992年1月份,止于1998m12,点击ok,见图6-1,这样就建立了一个工作文件。 图6-1 建立工作文件窗口

一元线性回归模型案例分析

一元线性回归模型案例分析 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为6029.88元, 最低的黑龙江省仅为人均4462.08元,最高的上海市达人均10464元,上海是黑龙江的2.35倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y 选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表2.5的数据: 表2.52002年中国各地区城市居民人均年消费支出和可支配收入

第十三章 时间序列回归

第十三章 时间序列回归 本章讨论含有ARMA 项的单方程回归方法,这种方法对于分析时间序列数据(检验序列相关性,估计ARMA 模型,使用分布多重滞后,非平稳时间序列的单位根检验)是很重要的。 §13.1序列相关理论 时间序列回归中的一个普遍现象是:残差和它自己的滞后值有关。这种相关性违背了回归理论的标准假设:干扰项互不相关。与序列相关相联系的主要问题有: 一、一阶自回归模型 最简单且最常用的序列相关模型是一阶自回归AR(1)模型 定义如下:t t t u x y +'=β t t t u u ερ+=-1 参数ρ是一阶序列相关系数,实际上,AR(1)模型是将以前观测值的残差包含到现观测值的回归模型中。 二、高阶自回归模型: 更为一般,带有p 阶自回归的回归,AR(p)误差由下式给出: t t t u x y +'=β t p t p t t t u u u u ερρρ++++=--- 2211 AR(p)的自回归将渐渐衰减至零,同时高于p 阶的偏自相关也是零。 §13.2 检验序列相关 在使用估计方程进行统计推断(如假设检验和预测)之前,一般应检验残差(序列相关的证据),Eviews 提供了几种方法来检验当前序列相关。 1.Dubin-Waston 统计量 D-W 统计量用于检验一阶序列相关。 2.相关图和Q-统计量 计算相关图和Q-统计量的细节见第七章 3.序列相关LM 检验 检验的原假设是:至给定阶数,残差不具有序列相关。 §13.3 估计含AR 项的模型 随机误差项存在序列相关说明模型定义存在严重问题。特别的,应注意使用OLS 得出的过分限制的定义。有时,在回归方程中添加不应被排除的变量会消除序列相关。 1.一阶序列相关 在EViews 中估计一AR(1)模型,选择Quick/Estimate Equation 打开一个方程,用列表法输入方程后,最后将AR(1)项加到列表中。例如:估计一个带有AR(1)误差的简单消费函数 t t t u GDP c c CS ++=21 t t t u u ερ+=-1 应定义方程为: cs c gdp ar(1) 2.高阶序列相关 估计高阶AR 模型稍稍复杂些,为估计AR(k ),应输入模型的定义和所包括的各阶AR 值。如果想估计一个有1-5阶自回归的模型 t t t u GDP c c CS ++=21 t t t t u u u ερρ+++=--5511 应输入: cs c gdp ar(1) ar(2) ar(3) ar(4) ar(5) 3.存在序列相关的非线性模型 EViews 可以估计带有AR 误差项的非线性回归模型。例如: 估计如下的带有附加AR(2)误差的非线性方程 t c t t u GDP c CS ++=21

第二章(简单线性回归模型)2-2答案教学文稿

第二章(简单线性回归模型)2-2答案

2.2 简单线性回归模型参数的估计 一、判断题 1.使用普通最小二乘法估计模型时,所选择的回归线使得所有观察值的残差和达到最小。(F) 2.随机扰动项i u 和残差项i e 是一回事。(F ) 3.在任何情况下OLS 估计量都是待估参数的最优线性无偏估计。(F ) 4.满足基本假设条件下,随机误差项i μ服从正态分布,但被解释变量Y 不一定服从正态分 布。 ( F ) 5.如果观测值i X 近似相等,也不会影响回归系数的估计量。 ( F ) 二、单项选择题 1.设样本回归模型为i 01i i ??Y =X +e ββ+,则普通最小二乘法确定的i ?β的公式中,错误的是( D )。 A . ()() () i i 1 2 i X X Y -Y ?X X β--∑∑= B . () i i i i 1 2 2i i n X Y -X Y ?n X -X β ∑∑∑∑∑= C .i i 122i X Y -nXY ?X -nX β∑∑= D .i i i i 12 x n X Y -X Y ?βσ∑∑∑= 2.以Y 表示实际观测值,?Y 表示回归估计值,则普通最小二乘法估计参数的准则是使( D )。 A .i i ?Y Y 0∑(-)= B .2 i i ?Y Y 0∑ (-)= C .i i ?Y Y ∑(-)=最小 D .2 i i ?Y Y ∑ (-)=最小 3.设Y 表示实际观测值,?Y 表示OLS 估计回归值,则下列哪项成立( D )。 A .?Y Y = B .?Y Y = C .?Y Y = D .?Y Y = 4.用OLS 估计经典线性模型i 01i i Y X u ββ+=+,则样本回归直线通过点( D )。 A .X Y (,) B . ?X Y (,) C .?X Y (,) D .X Y (,) 5.以Y 表示实际观测值,?Y 表示OLS 估计回归值,则用OLS 得到的样本回归直线

多元线性回归模型案例分析

多元线性回归模型案例分析 ——中国人口自然增长分析一·研究目的要求 中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的降到1980年,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。 影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。 二·模型设定 为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。 从《中国统计年鉴》收集到以下数据(见表1): 表1 中国人口增长率及相关数据

, 设定的线性回归模型为: 1222334t t t t t Y X X X u ββββ=++++ 三、估计参数 利用EViews 估计模型的参数,方法是: 1、建立工作文件:启动EViews ,点击File\New\Workfile ,在对 话框“Workfile Range ”。在“Workfile frequency ”中选择“Annual ” (年 年份 @ 人口自然增长率 (%。) 国民总收入 (亿元) 居民消费价格指数增长 率(CPI )% 人均GDP (元) 1988 15037 1366 1989 … 17001 18 1519 1990 18718 1644 1991 【 21826 1893 1992 26937 2311 1993 . 35260 2998 1994 48108 4044 1995 — 59811 5046 1996 70142 5846 1997 ~ 78061 6420 1998 83024 6796 1999 【 88479 7159 2000 98000 7858 2001 [ 108068 8622 2002 119096 9398 2003 : 135174 10542 2004 159587 12336 2005 、 184089 14040 2006 213132 16024

(完整版)第二章(简单线性回归模型)2-2答案

2.2简单线性回归模型参数的估计 、判断题 1. 使用普通最小二乘法估计模型时, (F ) 2. 随机扰动项u i 和残差项e i 是一回事。 (F ) 3. 在 任何情况下OLS 估计量都是待估参数的最 优线性无偏估计。 (F ) 布。 5.如果观测值X i 近似相等,也不会影响回归系数的估计量 】、单项选择题 1.设样本回归模型为 Y i =" ? X i +e i D )。 A. ?= ■ 1 X i X X i X Y i -Y ? X i Y i -nXY c. - X i 2-nX 2 2 ?以 丫表示实际观测值 ,Y?表示回归估计值, 则普通最小二乘法确定的 ?的公式中, 错误的是 ?n X i Y i - X i Y i i n X i 2- X i 2 ?_ n X i Y i - X i Y i i 1 2 x 则普通最小二乘法估计参数的准则是使 (D ) A. (丫— Y i )=o c. (Y — £ )=最小 「? 一 Y A . (X, 丫 ) 5.以丫表示实际观测值, 丫?表示OLS 估计回归值,则用 OLS 得到的样本回归直线 丫 ?一 ?) 4?满足基本假设条件下,随机误差项 i 服从正态分布,但被解释变量 Y 不一定服从正态分 所选择的回归线使得所有观察值的残差和达到最 3. 丫表示实际观测值 丫?表示OLS 估计回归值,则下列哪项成立( D A. 4.用OLS 估计经典线性模型 Y i — 0 i X i + u i ,则样本回归直线通过点( .(X, Y?)

满足(A)。 A.(Y i—丫i)一0 B . (Y i —Y)2 - 0 C.(Y—丫)2-0 D .(丫Y)-0 6.按经典假设,线性回归模型中的解释变量应是非随机变量,且(

案例分析 一元线性回归模型

案例分析报告 (2014——2015学年第一学期) 课程名称:预测与决策 专业班级:电子商务1202 学号: 2204120202 学生姓名:陈维维 2014 年 11月 案例分析(一元线性回归模型) 我国城镇居民家庭人均消费支出预测 一、研究目的与要求 居民消费在社会经济的持续发展中有着重要的作用,居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。从理论角度讲,消费需求的具体内容主要体现在消费结构上,要增加居民消费,就要从研究居民消费结构入手,只有了解居民消费结构变化的趋势和规律,掌握消费需求的热点和发展方向,才能为消费者提供良好的政策环境,引导消费者合理扩大消费,才能促进产业结构调整与消费结构优化升级相协调,才能推动国民经济平稳、健康发展。例如,2008年全国城镇居民家庭平均每人每年消费支出为11242.85元,?最低的青海省仅为人均8192.56元,最高的上海市达人均19397.89元,上海是黑龙江的2.37倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定?

我研究的对象是各地区居民消费的差异。居民消费可分为城镇居民消费和农村居民消费,由于各地区的城镇与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城镇居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。 所以模型的被解释变量Y选定为“城镇居民每人每年的平均消费支出”。 因为研究的目的是各地区城镇居民消费的差异,并不是城镇居民消费在不同时间的变动,所以应选择同一时期各地区城镇居民的消费支出来建立模型。因此建立的是2008年截面数据模型。影响各地区城镇居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。 为了与“城镇居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 以下是2008年各地区城镇居民人均年消费支出和可支配收入表

五多重共线性分布滞后模型或机动

实验五多重共线性、分布滞后模型(或机动) [实验目的]让学生掌握如何辨别模型中是否存在多重共线性现象,并能够对多重共线性加以处理。[实验内容]①相关系数矩阵计算;②方差膨胀因子计算;③多重共线性处理。 [实验步骤]数据导入—查看t 统计量值和F 统计量值以及R 平方的值--计算相关系数矩阵和方差 膨胀因子—对多重共线问题加以处理(改变模型、去除不重要的变量、岭回归主成分分析等) 问题:对于1960年至1982年期间美国人均鸡肉消费量(Y),人均实际可支配收入(X1),鸡肉的实际零售价格(X2),猪肉的实际零售价格(X3),牛肉的实际零售价格(X4)等数据,见表4-1,利用它们的对数估计如下模型: 表4-1 1960年至1982年期间美国人均鸡肉消费量等数据y x1x2x3x427.8397.542.250.778.329.9413.338.15279.229.8439.240.35479.230.8459.739.555.379.231.2492.937.354.777.433.3528.638.163.780.235.6560.339.369.880.436.4624.637.865.983.936.7666.438.464.585.538.4717.840.17093.740.4768.238.673.2106.140.3843.339.867.8104.841.8911.639.779.111440.4931.152.195.4124.140.71021.548.994.2127.640.11165.958.3123.5142.942.71349.657.9129.9143.644.11449.456.5117.6139.246.71575.563.7130.9165.550.61759.161.6129.8203.350.11994.258.9128219.651.72258.166.4141221.652.9 2478.7 70.4 168.2 232.6 把数据导入GRETL 软件,产生各变量的对数变量,分别为ly、lx1、lx2、lx3、lx4,估计要求的模型,参数估计的结果为: ε βββββ+++++=443322110ln ln ln ln ln X X X X Y

第二章(简单线性回归模型)2-5答案(可编辑修改word版)

一、判断题 2.5 回归模型预测 1. Y ?f 是对个别值Y f 的点估计。(F ) 2.预测区间的宽窄只与样本容量 n 有关。(F ) 3. Y ?f 对个别值Y f 的预测只受随机扰动项的影响。(F ) 4.一般情况下,平均值的预测区间比个别值的预测区间宽。(F ) 5.用回归模型进行预测时,预测普通情况和极端情况的精度是一样的。(F ) 二、单项选择题 1. 某一特定的 X 水平上,总体 Y 分布的离散度越大,即 2 越大,则( A )。 A. 预测区间越宽,精度越低 B .预测区间越宽,预测误差越小 C 预测区间越窄,精度越高 D .预测区间越窄,预测误差越大 2. 在缩小参数估计量的置信区间时,我们通常不采用下面的那一项措施(D )。 A. 增大样本容量 n B. 预测普通情形而非极端情形 C.提高模型的拟合优度 D.提高样本观测值的分散度 三、多项选择题 1. 计量经济预测的条件是(ABC ) A. 模型设定的关系式不变 B .所估计的参数不变 C.解释变量在预测期的取值已作出预测 D .没有对解释变量在预测期的取值进行过预测 E .无条件 2. 对被解释变量的预测可以分为(ABC ) A. 被解释变量平均值的点预测 B.被解释变量平均值的区间预测 C.被解释变量的个别值预测 D.解释变量预测期取值的预测 四、简答题 1. 为什么要对被解释变量的平均值以及个别值进行区间预测? 答:由于抽样波动的存在,用样本估计出的被解释变量的平均值Y ?f 与总体真实平均值 E (Y f X f 之间存在误差,并不总是相等。而用Y ?f 对个别值Y f 进行预测时,除了上述 提到的误差,还受随机扰动项的影响,使得总体真实平均值 E (Y f X f 并不等于个别值 Y f 。 一般而言,个别值的预测区间比平均值的预测区间更宽。 2. 分别写出 E ( Y f X f 和Y f 的置信度为1 -的预测区间。 ? 1 (X - X )2 ? ? 1 (X - X )2 ? 答: E ( Y X : Y ? ± t ? + f ? ; Y : Y ? ± t ? 1 + + f ? 。 f f f n ? 2 x 2 ? i ? f f n ? 2 x 2 ? i ? ∑ ∑

多元线性回归模型案例

我国农民收入影响因素的回归分析 本文力图应用适当的多元线性回归模型,对有关农民收入的历史数据和现状进行分析,探讨影响农民收入的主要因素,并在此基础上对如何增加农民收入提出相应的政策建议。?农民收入水平的度量常采用人均纯收入指标。影响农民收入增长的因素是多方面的,既有结构性矛盾因素,又有体制性障碍因素。但可以归纳为以下几个方面:一是农产品收购价格水平。二是农业剩余劳动力转移水平。三是城市化、工业化水平。四是农业产业结构状况。五是农业投入水平。考虑到复杂性和可行性,所以对农业投入与农民收入,本文暂不作讨论。因此,以全国为例,把农民收入与各影响因素关系进行线性回归分析,并建立数学模型。 一、计量经济模型分析 (一)、数据搜集 根据以上分析,我们在影响农民收入因素中引入7个解释变量。即:2x -财政用于农业的支出的比重,3x -第二、三产业从业人数占全社会从业人数的比重,4x -非农村人口比重,5x -乡村从业人员占农村人口的比重,6x -农业总产值占农林牧总产值的比重,7x -农作物播种面积,8x —农村用电量。

资料来源《中国统计年鉴2006》。 (二)、计量经济学模型建立 我们设定模型为下面所示的形式: 利用Eviews 软件进行最小二乘估计,估计结果如下表所示: DependentVariable:Y Method:LeastSquares Sample: Includedobservations:19 Variable Coefficient t-Statistic Prob. C X1 X3 X4 X5 X6 X7 X8 R-squared Meandependentvar AdjustedR-squared 表1最小二乘估计结果 回归分析报告为: () ()()()()()()()()()()()()()()() 2345678 2? -1102.373-6.6354X +18.2294X +2.4300X -16.2374X -2.1552X +0.0100X +0.0634X 375.83 3.7813 2.066618.37034 5.8941 2.77080.002330.02128 -2.933 1.7558.820900.20316 2.7550.778 4.27881 2.97930.99582i Y SE t R ===---=230.99316519 1.99327374.66 R Df DW F ====二、计量经济学检验 (一)、多重共线性的检验及修正 ①、检验多重共线性 (a)、直观法 从“表1最小二乘估计结果”中可以看出,虽然模型的整体拟合的很好,但是x4x6

第七章分布滞后模型与自回归模型答案(最新整理)

第七章 分布滞后模型与自回归模型 一、判断题 1. 无限分布滞后模型不可以转换为一阶自回归模型。( F ) 2. 局部调整模型变换后得到的一阶自回归模型可以应用 OLS 法估计。( T ) 3. 估计自回归模型的问题仅在于滞后被解释变量的存在可能导致它与随机扰动项相关。(F ) 4. 自回归模型的产生背景都是相同的。( F ) 5. 库伊克模型和自适应预期模型都存在解释变量与随机扰动项相关问题。( T ) 二、单项选择题 1. 设无限分布滞后模型为Y t = + 0 X t + 1 X t-1 +2X t-2 + + U t ,且该模型满足 Koyck 变换的假定,则长期影响系数为( C )。 A. B. 1+ C. 1- D. 不确定 2. 对于分布滞后模型,时间序列的序列相关问题,就转化为( B )。 A .异方差问题 B .多重共线性问题 C .多余解释变量 D .随机解释变量 3.在分布滞后模型Y t =+ 0 X t + 1 X t -1 + 2 X t -2 + + u t 中,短期影响乘数为( D )。 A. 1 1- B. 1 C. 1- D. 4. 对于自适应预期模型变换后的自回归模型,估计模型参数应采用( D ) 。 A. 普通最小二乘法 B .间接最小二乘法 C .二阶段最小二乘法 D .工具变量法 5. 经过库伊克变换后得到自回归模型,该模型参数的普通最小二乘估计量是 ( D ) 。 A. 无偏且一致 B .有偏但一致 C .无偏但不一致 D .有偏且不一致 6.下列属于有限分布滞后模型的是( D )。 A . Y t =+ 0 X t + 1Y t -1 + 2Y t -2 + + u t B . Y t =+ 0 X t + 1Y t -1 + 2Y t -2 + + k Y t -k + u t C . Y t =+ 0 X t + 1 X t -1 + 2 X t -2 + + u t D . Y t =+ 0 X t + 1 X t -1 + 2 X t -2 + + k X t -k + u t 7. 消费函数模型C ?t = 400 + 0.5I t + 0.3I t -1 + 0.1I t -2 ,其中 I 为收入,则当期收入 I t 对未来 消费C t +2 的影响是: I t 增加一单位, C t +2 增加( C )。 A .0.5 个单位 B .0.3 个单位 C .0.1 个单位 D .0.9 个单位

第7章 分布滞后模型与自回归模型多重共线性

计量经济学课程教案

第7章 分布滞后模型与自回归模型 7.1 滞后效应与滞后变量模型 在经济运行过程中,广泛存在时间滞后效应。某些经济变量不仅受到同期各种因素的影响,而且也受到过去某些时期的各种因素甚至自身的过去值的影响。 通常把这种过去时期的,具有滞后作用的变量叫做滞后变量(Lagged Variable ),含有滞后变量的模型称为滞后变量模型。 滞后变量模型考虑了时间因素的作用,使静态分析的问题有可能成为动态分析。含有滞后解释变量的模型,又称动态模型(Dynamical Model )。 一、滞后效应与与产生滞后效应的原因 因变量受到自身或另一解释变量的前几期值影响的现象称为滞后效应。 表示前几期值的变量称为滞后变量。 如:消费函数 通常认为,本期的消费除了受本期的收入影响之外,还受前1期,或前2期收入的影响: C t =β0+β1Y t +β2Y t-1+β3Y t-2+μt Y t-1,Y t-2为滞后变量。 产生滞后效应的原因 1、心理因素:人们的心理定势,行为方式滞后于经济形势的变化,如中彩票的人不可能很快改变其生活方式。 2、技术原因:如当年的产出在某种程度上依赖于过去若干期内投资形成的固定资产。 3、制度原因:如定期存款到期才能提取,造成了它对社会购买力的影响具有滞后性。 二、滞后变量模型 以滞后变量作为解释变量,就得到滞后变量模型。它的一般形式为: q ,s :滞后时间间隔 自回归分布滞后模型(autoregressive distributed lag model, ADL ):既含有Y 对自身滞后变量的回归,还包括着X 分布在不同时期的滞后变量 有限自回归分布滞后模型:滞后期长度有限 无限自回归分布滞后模型:滞后期无限, (1)分布滞后模型(distributed-lag model ) 分布滞后模型:模型中没有滞后被解释变量,仅有解释变量X 的当期值及其若干期的滞后值: β0:短期(short-run)或即期乘数(impact multiplier),表示本期X 变化一单位对Y 平均值的影响程度。 βi (i=1,2…,s):动态乘数或延迟系数,表示各滞后期X 的变动对Y 平均值影响的大小。 称为长期(long-run )或均衡乘数(total distributed-lag multiplier ),表示X 变动一 个单位,由于滞后效应而形成的对Y 平均值总影响的大小。 如果各期的X 值保持不变,则X 与Y 间的长期或均衡关系即为: X Y E s i i )()(0 ∑=+=βα∑=s i i 0β t i t i s i t X Y μβα++=-=∑0 t s t s t t q t q t t t X X X Y Y Y Y μαααββββ+++++++++=----- 11022110

(完整版)第二章(简单线性回归模型)2-4答案

2.4 回归系数的区间估计和假设检验 一、判断题 1.如果零假设H 0:B 2=0,在显著性水平5%下不被拒绝,则认为B 2一定是0。 (F ) 2.k β的置信度为()α-1的置信区间指真实参数落入该区间的概率是()α-1。(F) 3.假设检验为单侧检验还是双侧检验本质上取决于备择假设的形式。(F ) 4.回归系数的显著性检验是用来检验解释变量对被解释变量有无显著解释能力的检验。(T ) 二、单项选择题 1.对回归模型i i 10i u X Y ++=ββ进行检验时,通常假定i u 服从( C )。 A .() 2 i 0N σ, B .()2n t - C .( )2 0N σ , D .()n t 2.用一组有30个观测值的样本估计模型i i 10i u X Y ++=ββ,在0.05的显著性水平下对1β的显著性作检验,则1β显著地不等于零的条件是其统计量大于( D )。 A .()30t 050. B .()30t 0250.) C .()28t 050. D .()28t 0250. 3.回归模型i i i u X Y ++=10ββ中,关于检验010=β:H 所用的统计量)?(?1 11βββVar -,下 列说法正确的是( D )。 A .服从)(22-n χ B .服从)(1-n t C .服从) (12-n χ D .服从)(2-n t 4.用一组有30个观测值的样本估计模型后,在0.05的显著性水平上对的显著性作检验,则显著地不等于零的条件是其统计量大于等于( C ) A. B. C. D. 三、简答题 1.当α给定后,回归系数2β的置信区间是什么样的? 答:总体方差2 σ已知时,置信区间为??? ? ??? ? +-∑∑2i 2 2i 2x z x z σ βσ β?,?;总体方差2σ未知则使用2 n e 2 i 2 -=∑σ ?估计2 σ:①样本容量充分大时,统计量仍服从正态,则置信区间为 t t 01122t t t t y b b x b x u =+++1b t 1b t )30(05.0t )28(025.0t )27(025.0t )28,1(025.0F

SPSS线性回归分析案例

回归分析 实验内容:基于居民消费性支出与居民可支配收入的简单线性回归分析 【研究目的】 居民消费在社会经济的持续发展中有着重要的作用。影响各地区居民消费支出的因素很多,例如居民的收入水平、商品价格水平、收入分配状况、消费者偏好、家庭财产状况、消费信贷状况、消费者年龄构成、社会保障制度、风俗习惯等等。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的经济模型去研究。 【模型设定】 : 我们研究的对象是各地区居民消费的差异。由于各地区的城市与农村人口比例及经济结构有较大差异,现选用城镇居民消费进行比较。模型中被解释变量Y选定为“城市居民每人每年的平均消费支出”。从理论和经验分析,影响居民消费水平的最主要因素是居民的可支配收入,故可以选用“城市居民每人每年可支配收入”作为解释变量X,选取2010年截面数据。 1、实验数据 表1: —

2010年中国各地区城市居民人均年消费支出和可支配收入

| 数据来源:《中国统计年鉴》2010年 2、实验过程 作城市居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)的散点图,如图1:

表2 模型汇总b — 模型 R R方调整R方标准估计的误差 - 1 .965a.932.930 ~ a.预测变量:(常量),可支配收入X(元)。 b.因变量:消费性支出Y(元) 表3 相关性 、 消费性支出Y (元) 可支配收入X(元) Pearson相关 性消费性支出Y(元)& .965 ! 从散点图可以看出居民家庭平均每人每年消费支出(Y)和城市居民人均年可支配收入(X)大体呈现为线性关系,所以建立如下线性模型:Y=a+bX

简单线性回归模型练习题

第二章 简单线性回归模型练习题 一、术语解释 1 解释变量 2 被解释变量 3 线性回归模型 4 最小二乘法 5 方差分析 6 参数估计 7 控制 8 预测 二、填空 1 在经济计量模型中引入反映( )因素影响的随机扰动项t ξ,目的在于使模型更符合( )活动。 2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的( )、社会环境与自然环境的( )决定了经济变量本身的( );(2)建立模型时其他被省略的经济因素的影响都归入了( )中;(3)在模型估计时,( )与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了( )与( )之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。 3 ( )是因变量离差平方和,它度量因变量的总变动。就因变量总变动的变异来源看,它由两部分因素所组成。一个是自变量,另一个是除自变量以外的其他因素。( )是拟合值的离散程度的度量。它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。( )是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。 4 回归方程中的回归系数是自变量对因变量的( )。某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。 5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。 6 样本观察值与回归方程理论值之间的偏差,称为( ),我们用残差估计线性模型中的( )。 三、简答题 1 在线性回归方程中,“线性”二字如何理解 2 用最小二乘法求线性回归方程系数的意义是什么 3 一元线性回归方程的基本假设条件是什么 4 方差分析方法把数据总的平方和分解成为两部分的意义是什么 5 试叙述t 检验法与相关系数检验法之间的联系。 6 应用线性回归方程控制和预测的思想。 7 线性回归方程无效的原因是什么 8 回归分析中的随机误差项i ε有什么作用它与残差项t e 有何区别

相关文档
相关文档 最新文档