文档库 最新最全的文档下载
当前位置:文档库 › 计量经济学多重共线性的诊断及处理Eviews

计量经济学多重共线性的诊断及处理Eviews

计量经济学多重共线性的诊断及处理Eviews
计量经济学多重共线性的诊断及处理Eviews

数学与统计学院实验报告

院(系):数学与统计学学院 学号: 姓名: 实验课程: 计量经济学 指导教师:

实验类型(验证性、演示性、综合性、设计性): 综合性 实验时间:2017年 4 月 5 日 一、实验课题

多重共线性的诊断及处理 二、实验目的和意义

第8周练习 多重共线性

右表是某城市财政收入rev 、第一、第二、第三产业gdp1、gdp2、gdp3的有关数据。

1).建立rev 对gdp1,gdp2,gdp3的多元线性回归,并从经济和数理统计上简要说明模型存在着哪些不足。

2).写出rev ,gdp1,gdp2,gdp3的相关系数矩阵。

3).利用判别系数法判断模型是否存在着多重共线性。

4).用逐步回归的方法排除引起共线性的变量,重新建立多元回归。

5).如果不想排除变量,通过经验,假设:gdp1对财政收入的贡献是 gdp3

年份 rev gdp1 gdp2 gdp3 1983 6604 27235 26781 7106 1984 6634 26680 28567 10240 1985 6710 26762 31766 11912 1986 6823 33595 40062 14160 1987 8103 38510 52935 16960 1988 8578 41529 61337 18777 1989 8469 47994 67848 30498 1990 11118 65138 98946 39700 1991 16053 86983 112531 66960 1992 20221 105825 143545 92231 1993 27076 129136 223697 117031 1994 31888 138619 216161 151334 1995 35139 146637 305940 193573 1996 42436 149788 371066 227561 1997 56204 161800 426925 256684 1998 93828 162960 614341 372177 1999 130532 199519 821302 524562 2000

179063

246648

1121058

688567

的三倍,而且gdp2与财政收入是对数线性关系。那么请建立ln(rev)对(3gdp1+gdp3)及ln(gdp2)的半对数线性回归模型,看看模型在经济和数学上是否合理,并从中你得到了什么启示(自己随意发挥)。

三、解题思路(eviews6)

1、建立多元线性回归:quick—estimate equation—(rev c gdp1 gdp2 gdp3)

2、建立相关系数矩阵:quick--group statistic--correlation--rev gdp1 gdp2 gdp3)

3、判定系数法:利用一解释变量由其他解释变量变出

模型一::quick—estimate equation—(gdp1 c gdp2 gdp3)模型二::quick—estimate equation—(gdp2 c gdp1 gdp3)模型三::quick—estimate equation—(gdp3 c gdp1gdp2)4、逐步回归:quick—estimate equation—method:stepwise—rev c- gdp1 gdp2 gdp3

5、建立对数线性关系:quick—estimate equation—LOG(REV) C 3*GDP1+GDP3 LOG(GDP2)

四、实验过程记录与结果

1、建立多元回归方程:

模型:REV = 7726.69598122 - 0.180508326923*GDP1 + 0.0759120320555*GDP2 + 0.185205459439*GDP3

通过多元回归模型可见,该模型通过假设检验,但是两个解释变量的效果并不好(p>0.05);第二点是GDP1表示第一产业,不存在负值,所以不满足经济条件

2、相关系数矩阵:

3、判定系数法:(利用一解释变量由其他解释变量变出,检验拟合优度)

由系数判定法,可以看出三个模型都显著性成立,即任意一个解释变量都能由其他解释变量线性变出,所以可以得出该模型存在多重共线性。

4、逐步回归法:

5、建立ln(rev)对(3gdp1+gdp3)及ln(gdp2)的半对数线性回归模型

五、结果的讨论和分析

1、模型:REV = 7726.69598122 - 0.180508326923*GDP1 + 0.0759120320555*GDP2 + 0.185205459439*GDP3

模型不足:通过多元回归模型可见,该模型通过假设检验,但是两个解释变量的效果并不好(p>0.05);第二点是GDP1表示第一产业,不存在负值,所以不满足经济条件

2、相关系数:有四(2)可知,变量间存在严重相关性(比较接近1)

3、由系数判定法,可以看出三个模型都显著性成立,即任意一个解释变量都能由其他解释变量线性变出,所以可以得出该模型存在多重共线性。

4、通过逐步回归方法,发现该模型拟合效果并不好,因为该模型的gdp1为负值,不满足经济假设。而且,有两个解释变量的t检验不也满足假设。

5、利用先验信息对模型进行对数线性化ln(rev)对(3gdp1+gdp3)及ln(gdp2),运用eviews6进行方程估计,发现模型F、T检验都满足假设,即该模型都满足经济与数学上的理论。

启示:在模型存在多重共线性时,在逐步回归不能克服多重共线性,就应当在生活中,多积累变量之间存在的定量关系。

六、实验小结

通过本次实验,掌握了如何运用eviews6判断模型是否存在多重共线性以及如何消除多重共线性,使模型达到最好。

多重共线性诊断:直观判别法、判定系数法、逐步回归法、方差膨胀

因子(VIF)、特征根法(C.R)

(经验:当模型不符合经济意义时或者模型F通过检验,但是T检验大多不通过检验,该模型就有可能存在多重共线性)

消除

如何克服多重共线性:剔除解释变量、减小参数估计量的方差(增加样本量、岭回归法)

多重共线性的解决之法

第七章 多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews 软件解决多重共线性的实际问题。 第一节 多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X 1,X 2,……,X k 中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型 i ki k i i i X X X Y μββββ+++++= 22110 (7-1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共线性。 从矩阵形式来看,就是0' =X X , 即1)(-

(2)不完全多重共线性 不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。 如对于多元线性回归模型(7-1)存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=++++i ki k i i u λλλ (7-3) 其中i u 为随机误差项,则可以说解释变量k X ,,X ,X 21 之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。 完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。 二、多重共线性产生的原因 多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。 (一)经济变量间具有相同方向的变化趋势 在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。 (二)经济变量间存在较密切关系 由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。 (三)采用滞后变量作为解释变量较易产生多重共线性 一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。 (四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。 三、多重共线性产生的后果 由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模

《计量经济学》第四章精选题及答案

第四章:多重共线性 二、简答题 1、导致多重共线性的原因有哪些? 2、多重共线性为什么会使得模型的预测功能失效? 3、如何利用辅回归模型来检验多重共线性? 4、判断以下说法正确、错误,还是不确定?并简要陈述你的理由。 (1)尽管存在完全的多重共线性,OLS 估计量还是最优线性无偏估计量(BLUE )。 (2)在高度多重共线性的情况下,要评价一个或者多个偏回归系数的个别显著性是不可能的。 (3)如果某一辅回归显示出较高的2 i R 值,则必然会存在高度的多重共线性。 (4)变量之间的相关系数较高是存在多重共线性的充分必要条件。 (5)如果回归的目的仅仅是为了预测,则变量之间存在多重共线性是无害的。 12233i i i Y X X βββ=++ 来对以上数据进行拟合回归。 (1) 我们能得到这3个估计量吗?并说明理由。 (2) 如果不能,那么我们能否估计得到这些参数的线性组合?可以的话,写出必要的计 算过程。 6、考虑以下模型: 23 1234i i i i i Y X X X ββββμ=++++ 由于2X 和3 X 是X 的函数,那么它们之间存在多重共线性。这种说法对吗?为什么? 7、在涉及时间序列数据的回归分析中,如果回归模型不仅含有解释变量的当前值,同时还含有它们的滞后值,我们把这类模型称为分布滞后模型(distributed-lag model )。我们考虑以下模型: 12313233i t t t t t Y X X X X βββββμ---=+++++ 其中Y ——消费,X ——收入,t ——时间。该模型表示当期的消费是其现期的收入及其滞后三期的收入的线性函数。 (1) 在这一类模型中是否会存在多重共线性?为什么? (2) 如果存在多重共线性的话,应该如何解决这个问题? 8、设想在模型 12233i i i i Y X X βββμ=+++ 中,2X 和3X 之间的相关系数23r 为零。如果我们做如下的回归:

计量经济学论文(eviews分析)计量经济作业.(精选)

我国旅游收入的计量分析 一、经济理论陈述 在研读了大量统计和计量资料的基础上,选择了三个大方面进行研究,既包括旅游人数,人均旅游花费和基本交通建设。其中,在旅游人数这个解释变量的划分上,我们考虑到随着全球经济一体化的发展,越来越多的外国游客来中国旅游消费。中国旅游的国际市场是个有发展潜力的新兴市场,尽管外国游客前来旅游的方式包罗万象而且消费能力也不尽相同,但从国际服务贸易的角度出发,我们在做变量选择时,运用国际营销的知识进行市场细分,划分了国际和国内两个市场。这样,在旅游人数这个解释变量的最终确定上,我们选择了2X国内旅游人数,3X入境旅游人数。这点选择除了理论支持外,在现实旅游业发展中我们也看到很多景区包括成都的近郊也有不少外国游客的身影。所以,我们选取这两个解释变量等待下一步进行模型设计和检验。 另外,对于人均旅游花费,我们在进行市场细分时,没有延续前两个变量的选择模式,有几个原因。首先,外国游客前来旅游的形式和消费方式各异且很难统计。我们在花大力气收集数据后,仍然没有比较权威的统计数据资料。其次,随着国家对农业的不断重视和扶持,我国农业有了长足发展。农村居民纯收入增加,用于旅游的花费也有所上升。而且鉴于农村人口较多,前面的市场细分也不够细化,在这个解释变量的确定上,我们选择农村人均旅游花费,既是从我国基本国情出发,也是对第一步研究分析的补充。所以我们确定了4X城镇居民人均旅游花费和5X农村居民人均旅游花费。 旅游发展除了对消费者市场的划分研究,还应考虑到该产业的基础硬件设施。

在众多可选择对象中我们经分析研究结合大量文献资料决定从交通建设着手。在我国,交通一般分布为公路,铁路,航班,航船等。由于考虑到我国一般大众的旅游交通方式集中在公路和铁路上,为了避免解释变量的过多过繁以及可能带来的多重共线形等问题,我们只选取了前二者。即确定了6X公路长度和7X铁路长度这两个解释变量。其中,考虑到我国旅游业不断发展过程中,高速公路的修建也不断增多,在6X的确定过程中,我们已经将其拟合,尽量保证解释变量的完整和真实。 二、相关数据 三、计量经济模型的建立 Y=c(1)+c(2)*X2+c(3)*X3+c(4)*X4+c(5)*X5+c(6)*X6+U 我们建立了下述的一般模型:

多重共线性问题的几种解决方法

多重共线性问题的几种解决方法 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释 变量之间不存在线性关系,也就是说,解释变量X 1,X 2 ,……,X k 中的任何一个 都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 这里,我们总结了8个处理多重共线性问题的可用方法,大家在遇到多重共线性问题时可作参考: 1、保留重要解释变量,去掉次要或可替代解释变量 2、用相对数变量替代绝对数变量 3、差分法 4、逐步回归分析 5、主成份分析 6、偏最小二乘回归 7、岭回归 8、增加样本容量 这次我们主要研究逐步回归分析方法是如何处理多重共线性问题的。 逐步回归分析方法的基本思想是通过相关系数r、拟合优度R2和标准误差三个方面综合判断一系列回归方程的优劣,从而得到最优回归方程。具体方法分为两步: 第一步,先将被解释变量y对每个解释变量作简单回归: 对每一个回归方程进行统计检验分析(相关系数r、拟合优度R2和标准误差),并结合经济理论分析选出最优回归方程,也称为基本回归方程。

第二步,将其他解释变量逐一引入到基本回归方程中,建立一系列回归方程,根据每个新加的解释变量的标准差和复相关系数来考察其对每个回归系数的影响,一般根据如下标准进行分类判别: 1.如果新引进的解释变量使R2得到提高,而其他参数回归系数在统计上和经济理论上仍然合理,则认为这个新引入的变量对回归模型是有利的,可以作为解释变量予以保留。 2.如果新引进的解释变量对R2改进不明显,对其他回归系数也没有多大影响,则不必保留在回归模型中。 3.如果新引进的解释变量不仅改变了R2,而且对其他回归系数的数值或符号具有明显影响,则认为该解释变量为不利变量,引进后会使回归模型出现多重共线性问题。不利变量未必是多余的,如果它可能对被解释变量是不可缺少的,则不能简单舍弃,而是应研究改善模型的形式,寻找更符合实际的模型,重新进行估计。如果通过检验证明回归模型存在明显线性相关的两个解释变量中的其中一个可以被另一个很好地解释,则可略去其中对被解释变量影响较小的那个变量,模型中保留影响较大的那个变量。 下边我们通过实例来说明逐步回归分析方法在解决多重共线性问题上的具体应用过程。 具体实例 例1设某地10年间有关服装消费、可支配收入、流动资产、服装类物价指数、总物价指数的调查数据如表1,请建立需求函数模型。 表1 服装消费及相关变量调查数据

2019年1计量经济学作业多重共线性p171.doc复习进程

2019年1计量经济学作业多重共线性 p171.d o c

计量经济学作业 ——多重共线性P171 8.下表是被解释变量Y,解释变量X1,X2,X3,X4的时间序列观测值: 时间序列观测值表 3 6.5 47.5 5.2 108 86 4 7.1 49.2 6.8 100 100 5 7.2 52.3 7.3 99 107 6 7.6 58.0 8. 7 99 111 7 8.0 61.3 10.2 101 114 8 9.0 62.3 14.1 97 116 9 9.0 64.7 17.1 93 119 10 9.3 66.8 21.3 102 121 (1)采用适当的方法检验多重共线性。 (2)多重共线性对参数估计值有何影响? (3)用Frisch法确定一个较好的回归模型。 解:(1)采用参数估计值的统计检验法检验多重共线性。 用OLS最小二乘法,估计被解释变量Y与解释变量X1,X2,X3,X4的样本方程,如下所示:

图1-1 在Eviews中建立样本回归模型 图1-2 样本回归模型数据表 输入被解释变量与解释变量: 图1-3 整体样本回归模型建立

用最小二乘法求得结果如下所示: 图1-4 Eviews的结果分析一元线性样本回归方程为: 1.拟合优度检验 由上表可知,样本可决系数为: R-squared=0.978915 修正样本可决系数为: Adjusted-squared=0.962046 即

计算结果表明,估计的样本回归方程较好的拟合了样本观测值。 2.F检验 提出检验的原假设为 对立假设为 由图1-4,得F统计量为 F-statistic=58.03254 对于给定的显著性水平α=0.05,查出分子自由度为4,分母自由度为5的F分布上侧分位数F0.05(4,5)=5.19。因为 F=58.03254>5.19,所以否定H0,总体回归方程显著。 3.t检验 提出检验的原假设为 由上表可知,t统计量为 β0的t-statistic=1.975329 β1的t-statistic=1.149646 β2的t-statistic=2.401806 β3的t-statistic=-0.662938

计量经济学论文(eviews分析)-房价的计量经济分析

房价的计量经济分析 引言:近改革开放20多年来,从来没有哪一个行业像房地产业这样盛产亿万富翁,各种富豪排行榜上,房地产富豪连年占据半壁江山;“中国十大暴利行业”中,房地产业每年都是“第一名”。是什么造就了这样的状况。房地产的问题,在开发商,政府,购房者三者来看,就是一场完完全全的博弈。而这场博弈的焦点则是房价问题。如果说开发商与政府之间的博弈是围绕“土地”这个关键词,那么整个房地产市场则在价格上开展了新一轮的对峙。先是开发商与购房者在房价涨跌上僵持不下;再有开发商与政府之间的土地成本论;最后则是关于房地产是否归为暴利行业的争执,“价格”成了市场关注的焦点。而对于房价的构成因素,至今仍然是不透明的。公布房价成本成为另政府极为头疼的一件事。房价成本是一个非常复杂的集合体,并且项目间差异性较大,同时还有软资产、品牌等组成部分,特别是现在的商品房,追求品质、功能完善以及个性化成本构成越来越难衡量。 写作目的:通过对一系列影响房价的基本因素的分析,了解对其主要因素和次要因素。并对这些因素进行统计推断和经济意义上的检验。选择拟和效果最好的最为结论。在一定层面上分析房地产如此暴利的因素。当然笔者的能力有限,并不能全面的分析这一问题。仅仅就几个因素进行分析。 写作方法:理论分析及计量分析方法,将会用到Eviews软件进行帮助分析。 关键词:房价成本计量假设检验最小二乘法拟合优度 现在我们以2003年的数据,选取30个省市的数据为例进行分析。在Eviews软件中选择建立截面数据。现在我们以2003年的数据,选取31个省市的数据为例进行分析。令Y=各地区建筑业总产值。(万元)X1=各地区房屋竣工面积。(万平方米)X2=各地区建筑业企业从业人员。(人)X3=各地区建筑业劳动生产率。(元/人)X4=各地区人均住宅面积。(平方米)X5=各地区人均可支配收入。(元) 数据如下: Y X1 X3 X2 X4 X5 12698521 4254.800 569767.0 129961.0 24.77140 13882.62 5208402. 1465.800 238957.0 147063.0 23.09570 10312.91 7799313. 4748.300 989317.0 70048.00 23.16710 7239.060 5401279. 1313.300 591276.0 89151.00 22.99680 7005.030 2576575. 1450.700 265953.0 61074.00 20.05310 7012.900 10170794 3957.100 966790.0 82496.00 20.23510 7240.580 3469281. 1626.800 303837.0 77486.00 20.70590 7005.170 4401878. 2181.300 441518.0 68033.00 20.49200 6678.900 11958034 3609.200 505185.0 153910.0 29.34530 14867.49

第七章 多共线性及其处理

第七章 多重共线性及其处理 第一部分 学习辅导 一、本章学习目的与要求 1.理解多重共线性的概念; 2.掌握多重共线性存在的主要原因; 3.理解多重共线性可能造成的后果; 4.掌握多重共线性的检验与修正的方法。 二、本章内容提要 本章主要介绍计量经济模型的计量经济检验。即多重共线性问题。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 (一)多重共线性及其产生的原因 当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。 1.多重共线性的基本概念 多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。 如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21ΛΛ间存在完全多重共线性。解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。因此,必有一个列向量可由其余列向量线性表示。 同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。 2.多重共线性产生的原因 多元线性回归模型产生多重共线性的原因很多,主要有: (1)经济变量的内在联系 这是产生多重共线性的根本原因。 (2)解释变量中含有滞后变量 (3)经济变量变化趋势的“共向性” 必须指出,多重共线性基本上是一种样本现象。因为人们在设定模型时,总是尽量避免将理论上具有严格线性关系的变量作为解释变量收集在一起,因此,实际问题中的多重共线性并不是解释变量之间存在理论上或实际上的线性关系造成的,而是由所收集的数据(解释变量观察值)之间存在近似的线性关系所致。 (二)多重共线性的影响 多重共线性会产生以下问题: (1)增大了OLS 估计量的方差 (2)难以区分每个解释变量的单独影响 (3)回归模型缺乏稳定性 (4)t 检验的可靠性降低 (三)多重共线性的判别 在应用多元回归模型中,人们总结了许多检验多重共线性的方法。 1.系数判定法

解决多元线性回归中多重共线性问题的方法分析

解决多元线性回归中多重共线性问题的方法分析 谢小韦,印凡成 河海大学理学院,南京 (210098) E-mail :xiexiaowei@https://www.wendangku.net/doc/b416050167.html, 摘 要:为了解决多元线性回归中自变量之间的多重共线性问题,常用的有三种方法: 岭回 归、主成分回归和偏最小二乘回归。本文以考察职工平均货币工资为例,利用三种方法的 SAS 程序进行了回归分析,根据分析结果总结出三种方法的优缺点,结果表明如果能够使用 定性分析和定量分析结合的方法确定一个合适的k 值,则岭回归可以很好地消除共线性影 响;主成分回归和偏最小二乘回归采用成份提取的方法进行回归建模,由于偏最小二乘回归 考虑到与因变量的关系,因而比主成分回归更具优越性。 关键词:多重共线性;岭回归;主成分回归;偏最小二乘回归 1. 引言 现代化的工农业生产、社会经济生活、科学研究等各个领域中,经常要对数据进行分析、 拟合及预测,多元线性回归是常用的方法之一。多元线性回归是研究多个自变量与一个因变 量间是否存在线性关系,并用多元线性回归方程来表达这种关系,或者定量地刻画一个因变 量与多个自变量间的线性依存关系。 在对实际问题的回归分析中,分析人员为避免遗漏重要的系统特征往往倾向于较周到地 选取有关指标,但这些指标之间常有高度相关的现象,这便是多变量系统中的多重共线性现 象。在多元线性回归分析中,这种变量的多重相关性常会严重影响参数估计,扩大模型误差, 破坏模型的稳健性,从而导致整体的拟合度很大,但个体参数估计值的t 统计量却很小,并 且无法通过检验。由于它的危害十分严重,存在却又十分的普遍,因此就要设法消除多重线 性的不良影响。 常用的解决多元线性回归中多重共线性问题的模型主要有主成分回归、岭回归以及偏最 小二乘回归。三种方法采用不同的方法进行回归建模,决定了它们会产生不同的效果。本文 以统计职工平均货币工资为例,考察一组存在共线性的数据,运用SAS 程序对三种回归进 行建模分析,并对结果进行比较,总结出它们的优势与局限,从而更好地指导我们解决实际 问题。 2. 共线性诊断 拟合多元线性回归时,自变量之间因存在线性关系或近似线性关系,隐蔽变量的显著性, 增加参数估计的方差,导致产生一个不稳定的模型,因此共线性诊断的方法是基于自变量的 观测数据构成的矩阵T x x 进行分析,使用各种反映自变量间相关性的指标。共线性诊断常 用统计量有方差膨胀因子VIF (或容限TOL )、条件指数和方差比例等。 一般认为:若VIF>10,说明模型中有很强的共线性关系;若条件指数值在10与30间 为弱相关,在30与100间为中等相关,大于100为强相关;在大的条件指数中由方差比例 超过0.5的自变量构成的变量子集就认为是相关变量集[1]。 3. 三种解决方法 岭回归基本思想: 当出现多重共线性时,有0T X X ≈,从而使参数的1?()T T X X X Y β ?=很不稳定,出现不符合含义的估计值,给T X X 加上一个正常数矩阵(0)KI K >,则T X X KI +等

计量经济学论文(eviews分析)

我国限额以上餐饮企业营业额的 影响因素分析 班级: 姓名: 学号: 指导老师:

我国限额以上餐饮企业营业额的影响因素分析 摘要:本文收集了1999—2009共11年的相关数据,选取餐饮企业的数量、城镇居民人均年消费性支出、全国城镇人口数以及公路里程数作为解释变量构建模型,对我国限额以上餐饮企业营业额的影响因素进行分析。并利用Eviews软件对模型进行参数估计和检验,且加以修正,最后根据模型的最终结果进行经济意义分析,然后提出自己的看法。 关键词:餐饮企业营业额、影响因素、计量分析 一、研究背景 近十年来,投资者进入餐饮企业的数量一直持递增趋势。在他们进入一个行业之前,势必要对该行业的营业额、营业利润等进行估计,当这些因素的估计值能够达到他们的预期的时候,他们才会对其进行投资。由于餐饮企业的营业额是影响投资者是否进入餐饮业的一个重要因素,那么对于我国餐饮企业的营业额问题的深入研究就相当的有必要,这有助于投资者作出合理的决策。下面即进行了对我国限额以上餐饮企业营业额的计量模型研究。 二、变量的选取 影响餐饮企业营业额的因素有很多,包括餐饮企业的数量、营业面积、从业人员、城镇居民人均年消费性支出、全国城镇人口数、餐饮企业的平均价格水平及公路里程数(表示交通状况),但综合考虑后,选取了其中的一部分变量(企业数、城镇居民人均年消费性支出、全国城镇人口数、公路里程数)进行研究,并对各个变量对餐饮企业营业额的影响进行预测。 1.企业数

本文认为餐饮企业营业额与餐饮企业的数量有关,并预测两者之间呈正相关2. 城镇居民人均年消费性支出 本文认为餐饮企业营业额与城镇居民人均年消费性支出有关,并预测两者之间呈正相关 3. 全国城镇人口数 本文认为餐饮企业营业额与全国城镇人口数有关,并预测两者之间呈正相关4. 公路里程数 本文认为餐饮企业营业额与公路里程数有关,并预测两者之间呈正相关三、相关数据:其中营业额(单位:亿元),企业数(单位:个),人均年消费性 支出(单位:元),全国城镇人口数(单位:万人),公路里程数(单位:万公里) 年度 营业额 (Y)企业数(x1) 人均年消费性 支出(x2) 全国城镇人口 数(x3) 公路里程 数(x4) 1999351955932664615.9143748135.2 200040524453508499845906140.3 2001489894341325309.0148064169.8 2002624247150216029.8850212176.5 2003747000059356510.9452376181 200411605000100677182.154283187.1 20051260200099227942.8856212334.5

最新多重共线性的解决之法

多重共线性的解决之 法

第七章多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews软件解决多重共线性的实际问题。 第一节多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型

i ki k i i i X X X Y μββββ+++++= 22110 (7- 1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: 0X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共 线性。 从矩阵形式来看,就是0'=X X , 即1)(-

用Eviews分析计量经济学问题

计量经济学案例分析 一、问题背景 高新区自开始设立至今短短十多年的时间,以其惊人的经济发展速度为世人所关注。随着我国经济发展模式的逐步转变,高新区已经成为我国依靠科技进步和技术创新推动经济社会发展、走中国特色自主创新道路的一面旗帜。“十二五”时期,面对新的机遇和挑战,国家高新区应注重提升五种能力,努力成为加快转变经济发展方式的排头兵。为了探索高新经济发展的内在规律性,本文采用截面数据对高新区的投入产出进行分析,力求能够增进对高新区经济发展的了解,对高新区的进一步发展有所帮助。 二、模型设定 本文研究的是高新区投入对产出的影响,所以本模型的被解释变量Y 即为高新区的产出。就目前对高新区数据的统计来看,反映高新区产出的主要有“工业总产值”、“工业增加值”、“技工贸总收入”、“利润”和“上缴税额”几个总量指标。按照生产函数理论,产出利用增加值,所以模型中我们将使用“工业增加值”指标数据来估计各高新区的总产出。 从高新区的投入来看,对产出有重要影响的因素主要包括以下几个方面: 资本K ,劳动力L ,技术投入T ,此外,体制改革,管理模式创新也可以看作是投入的要素,但因其不可量化,因此归入模型的扰动项中。 这样,按照科布道格拉斯形式的生产函数,我们设定函数形式为: u T L AK Y γβα= 两边取自然对数得:u T L K A Y ln ln ln ln ln ln ++++=γβα 其中,资本数据K 我们利用的是当年的年末净资产来进行估计,即当年年末资产减去当年年末负债后得到的数据;用当年年末从业人员来估计劳动力L ;用当年技术研发投入来估计技术投入T 。数据选用的是截面数据。 从《国家高新技术产业开发区十年发展报告(1991-2000年)》得到1999年全国53个高新区各项指标统计数据: 园区 工业增加值(千 元)Y 净资产(千元)K 年末从业人员(人) L 技术开发费(千 元)T 北京 246422 天津 4138312 106970 1004739 石家庄 1428436 8427194 40404 437677 保定 1320169 5564045 35743 78798 太原 1261311 4755833 39469 254922 包头 877062 3798540 19793 56816 沈阳 3835694 21547 525425 大连 2099833 9922822 61713 328710

计量经济学Eviews多重共线性实验报告

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期:2014 年05 月11日

广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日

说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 R值。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。 为分析Y 与X1、X2、X3、X4、X5、X6、X7之间的关系,做如下折线图: 能源消费Y 在1986到1996年间缓慢增长,在96至98年有短暂的下跌,但是98 至02年开始缓慢回升,02年到06年开始快速增长。 国民总收入X1和国内生产总值X2以相同的趋势逐年缓慢增长。 工业增加值X3在1985年-1999年期间一直是缓慢增长,但在2000年出现了急剧下降的现象,2001年又急剧增长,达到下降前的水平,2001年以后开始缓慢增长。建筑业增长值x4、交通运输邮电业增加值x5、人均生活电力消费x6、能源加工转换效率x7数值较低,但都以较平缓的方式增长。 2、设定并估计多元线性回归模型 t t t t t t t u X X X X X Y ++++++=66554433221ββββββ (2.1) 2.1录入数据,得到图。

计量经济学eviews软件案例分析

计量经济学课程案例分析论文 本小组案例:影响税收收入的因素 摘要:我国经济增长与税收增长之间是正相关的,经济增长是税收增长的源泉,而税收又是国家财政收入的主要来源,国家把税收收入用于经济建设,发展科学、教育、文化、卫生等事业,反过来又促进经济的进一步增长。 关键字:税收国内生产总值财政支出商品零售价格指数 一、引言:改革开放以来,随着经济体制的改革的深化和经济的快速增长,中国的财政收支状况发生很大的变化,为了研究中国税收收入增长的主要原因,分析中央和地方税收收入的增长规律,预测中国税收未来的增长趋势,需要建立计量经济学模型。 二、经济理论分析:影响中国税收收入增长的主要因素可能有: 【1】从宏观经济上看经济增长是税收增长的基本源泉 【2】社会经济的发展和社会保障等对公共财政提出要求,公共财政的需求可能对当年的税收入可能会有一定的影响。 【3】物价水平。中国的税制结构以“流转税”为主,以现行价格计算的GDP和经营者的收入水平都与物价水平有关。 【4】税收政策因素 三、建立模型:以各项税收收入Y作为解释变量 以GDP表示经济增长水平 以财政支出表示公共财政的需求 以商品零售价格指数表示物价水平 税收政策因素较难用数量表示,暂时不予考虑 模型设定为Y=β1X1+β2X3+β3X3+C 其中:Y—各项税收收入(亿元)

X1—国内生产总值(亿元) X2—财政支出(亿元) X3—商品零售价格指数(%) 四、数据收集: 年份x1 x2 x3 y 1978 3645.20 1122.09 100.70 519.28 1979 4062.60 1281.79 102.00 537.82 1980 4545.60 1228.83 106.00 571.70 1981 4891.60 1138.41 102.40 629.89 1982 5323.40 1229.98 101.90 700.02 1983 5962.70 1409.53 101.50 775.59 1984 7208.10 1701.02 102.80 947.35 1985 9016.00 2004.25 108.80 2040.79 1986 10275.20 2204.91 106.00 2090.73 1987 12058.60 2262.18 107.30 2140.36 1988 15042.80 2491.21 118.50 2390.47 1989 16992.30 2823.78 117.80 2727.40 1990 18667.80 3083.59 102.10 2821.86 1991 21781.50 3386.62 102.90 2990.17 1992 26923.50 3742.20 105.40 3296.91 1993 35333.90 4642.30 113.20 4255.30 1994 48197.90 5792.62 121.70 5126.88 1995 60793.70 6823.72 114.80 6038.04 1996 71176.60 7937.55 106.10 6909.82 1997 78973.00 9233.56 100.80 8234.04 1998 84402.30 10798.18 97.40 9262.80 1999 89677.10 13187.67 97.00 10682.58 2000 99214.60 15886.50 98.50 12581.51 2001 109655.20 18902.58 99.20 15301.38 2002 120332.70 22053.15 99.70 17636.45 2003 135822.80 24649.95 99.90 20017.31 2004 159878.30 28486.89 102.80 24165.68 2005 184937.40 33930.28 100.80 28778.54 2006 216314.40 40422.73 101.00 34809.72 2007 265810.30 49781.35 103.80 45621.97 2008 314045.40 62592.66 105.90 54223.79 2009 340902.80 76299.90 98.80 59521.59 2010 401202.00 89874.16 103.10 73210.79 回归分析: 相关分析

计量经济学多重共线性

2014-8-8 商学院 王中昭 教学内容 一、多重共线性 二、实际经济问题中的多重共线性 三、多重共线性的后果 四、多重共线性的检验 五、克服多重共线性的办法和实例 §4.3 多重共线性

2014-8-8商学院 王中昭 对于模型Y i =β0+ β1x 1i + β2x 2i +…… βk x ki +μi 如果某两个或多个解释变量之间出现相关性,即:C 1x 1i +C 2X 2i +……C k X ki =0 其中C i 不全为0,即某一个解释变量是其他解释变量的线性组合,则称为完全多重共线性。 完全多重共线性的情况并不多见,一般是出现不同程度的多重共线性。 注意多重共线性不 是指因变量与解释 一、多重共线性概念

2014-8-8商学院 王中昭 Y=Xβ+μ完全共线性:∣X′X ∣=0,(X′X)-1不存在, 使B ^=(X′X)-1X′Y 无法求解。 例如:, 0)(0020 1631084104213211 x x x 3213322113 21≠'=+-=++??????? ??=X X x x x X i i i i i i x c x c x c 这里,完全多重共线性

2014-8-8商学院 王中昭完全多重共线性的情况不多,一般出现不同程度的多重共线性。 多重共线性:∣X′X∣≈0,(X′X)-1存在,但 (X′X)-1主对角线上的元素很大。 ????? ?='≈'?≈+??????? ??=400300000300000100040030000030000010002100010004X)X ( ,0)( 0,0x x - x 199 .2993001001.4004001099.1992001101.1001001 x x x 1 -3i 2i 1i 3 21||这里,X X X 近似多重共线性

计量经济学论文(eviews分析)《消费状况的影响因素研究》

计量经济学论文及作业 姓名:陈敏捷 学号:2011012475

消费状况的影响因素研究 摘要:本文选取的是现已充分掌握数据资料的2013年全国31个省市的城镇居民的人均全年可支配收入和人均全年消费支出,以及各地区的失业率。通过建模分析,找出三者之间的量化关系,进一步分析得出现实指导意义。 关键词:消费支出可支配收入失业率(%) 具体数据如下: 消费支出(元/每人全年) Y 可支配收入 (元/每人全年) X1 失业率 (%) X2 北京11123.84 13882.62 1.4 天津7867.53 10312.91 3.8 河北5439.77 7239.06 3.9 山西5105.38 7005.03 3 内蒙5419.14 7012.9 4.5 辽林6077.92 7240.58 6.5 吉林5492.1 7005.17 4.3 黑龙江5015.19 6678.9 4.2 上海11040.34 14867.49 4.9 江苏6708.58 9262.46 4.1 浙江9712.89 13179.53 4.2 安徽5064.34 6778.03 4.1 福建7356.26 9999.54 4.1 江西4914.55 6901.42 3.6 山东6069.35 8399.91 3.6 河南4941.6 6926.21 3.1 湖北5963.25 7321.98 4.3 湖南6082.62 7674.2 3.8 广东9636.27 12380.43 2.9 广西5763.5 7785.04 3.6 海南5502.43 7259.25 3.4 重庆7118.06 8093.67 4.1 四川5759.21 7041.87 4.4

多重共线性的检验与处理

实验名称:多重共线性的检验与处理 实验时间:2011.12.10 实验要求: 主要是学习多重共线性的检验与处理,主要是研究解释变量与其余解释变量之间有严重多重共线性的模型,分析变量之间的相关系数。通过具体案例建立模型,然后估计参数,求出相关的数据。再对模型进行检验,看数据之间是否存在多重共线性。最后利用所求出的模型来进行修正。 实验内容: 实例:我国钢材供应量分析 通过分析我国改革开放以来(1978-1997)钢材供应量的历史资料,可以建立一个单一方程模型。根据理论及对现实情况的认识,影响我国钢材供应量 Y(万吨)的主要因素有:原油产量X1(万吨),生铁产量X2(万吨),原煤产量X3(万吨),电力产量X4(亿千瓦小时),固定资产投资X5(亿元),国内生产总值 X6(亿元),铁路运输量X7(万吨)。 (一)建立我国钢材供应量的计量经济模型: (二)估计模型参数,结果为: Dependent Variable: Y Method: Least Squares Date: 11/02/09 Time: 16:09 Sample: 1978 1997 Included observations: 20 Variable Coefficient Std. Error t-Statistic Prob. C 139.2362 718.2493 0.193855 0.8495 X1 -0.051954 0.090753 -0.572483 0.5776 X2 0.127532 0.132466 0.962751 0.3547 X3 -24.29427 97.48792 -0.249203 0.8074 X4 0.863283 0.186798 4.621475 0.0006 X5 0.330914 0.105592 3.133889 0.0086 X6 -0.070015 0.025490 -2.746755 0.0177 X7 0.002305 0.019087 0.120780 0.9059 R-squared 0.999222 Mean dependent var 5153.350 Adjusted R-squared 0.998768 S.D. dependent var 2511.950 S.E. of regression 88.17626 Akaike info criterion 12.08573 Sum squared resid 93300.63 Schwarz criterion 12.48402 Log likelihood -112.8573 F-statistic 2201.081 Durbin-Watson stat 1.703427 Prob(F-statistic) 0.000000 由此可见,该模型可绝系数很高,F检验值2201.081,明显显著。但当,系数的t检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 (三)计算各解释变量的相关系数,选择数据,得相关系数矩阵(表3.1)。

实验四-多重共线性模型的检验和处理

实验报告 课程名称:计量经济学 实验项目:实验四多重共线性模型的 检验和处理 实验类型:综合性□设计性□验证性 专业班别:11本国贸五班 姓名: 学号: 实验课室:厚德楼A207 指导教师: 实验日期:2014/5/20 广东商学院华商学院教务处制

一、实验项目训练方案 小组合作:是□否 小组成员:无 实验目的: 掌握多重共线性模型的检验和处理方法: 实验场地及仪器、设备和材料 实验室:普通配置的计算机,Eviews软件及常用办公软件。 实验训练内容(包括实验原理和操作步骤): 【实验原理】 多重共线性的检验:直观判断法(R2值、t值检验)、简单相关系数检验法、方差扩大因子法(辅助回归检验) 多重共线性的处理:先验信息法、变量变换法、逐步回归法 【实验步骤】 (一)多重共线性的检验 1.直观判断法(R2值、t值检验) 根据广东数据(见附件1),先分别建立以下模型: 【模型1】财政收入CS对第一产业产值GDP1、第二产业产值GDP2和第三产业产值GDP3的多元线性回归模型; (请对得到的图表进行处理,以上在一页内)

【模型2】固定资产投资TZG对固定资产折旧ZJ、营业盈余YY和财政支出CZ的多元线性回归模型。 观察模型结果,初步判断模型自变量之间是否存在多重共线性问题。 【模型1】从上图可以得到,估计方程的判定系数R 2 很高,但三个参数t检验值两个不显著,有一个较显著,其中 一个参数估计值还是负的,不符合经济理论。所以,出现了严重的多重共线性。 【模型2】1】从上图可以得到,估计方程的判定系数R 2 很高,方程显著性F检验也显著,但只有两个参数显著性 t检验比较显著,这与很高的判定系数不相称,出现了严重的多重共线性。 2.简单相关系数检验法 分别计算【模型1】和【模型2】的自变量的简单相关系数。 【模型1】 【模型2】 (请对得到的图表进行处理,以上在一页内) 根据计算的简单相关系数,判断模型是否存在多重共线性。 【模型1】可看出三个解释变量GDP1 、GDP2和GDP3之间高度相关,存在严重的多重共线性。 【模型2】可以看出三个解释变量ZJ 、YY和CZ之间也高度相关,特别是ZJ和CZ之间高度相关,必然也存在严重的多重共线性。

相关文档
相关文档 最新文档