文档库 最新最全的文档下载
当前位置:文档库 › 多重共线性处理经典例题

多重共线性处理经典例题

多重共线性处理经典例题
多重共线性处理经典例题

理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费总量Y (万吨标准煤)、国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等在1985-2007年期间的统计数据,具体如表4.2所示。

表4.12 1985~2007年统计数据

资料来源:《中国统计年鉴》,中国统计出版社2000、2008年版。

要求:

1)建立对数多元线性回归模型,分析回归结果。

2)如果决定用表中全部变量作为解释变量,你预料会遇到多重共线性的问题吗?为什么?

3)如果有多重共线性,你准备怎样解决这个问题?明确你的假设并说明全部计算。

参考解答:

(1)建立对数线性多元回归模型,引入全部变量建立对数线性多元回归模型如下:

生成: lny=log(y), 同样方法生成: lnx1,lnx2,lnx3,lnx4,lnx5,lnx6,lnx7.

作全部变量对数线性多元回归,结果为:

从修正的可决系数和F统计量可以看出,全部变量对数线性多元回归整体对样本拟合很好,,各变量联合起来对能源消费影响显著。可是其中的lnX3、lnX4、lnX6对lnY影响不显著,而且lnX2、lnX5的参数为负值,在经济意义上不合理。所以这样的回归结果并不理想。

(2) 预料此回归模型会遇到多重共线性问题, 因为国民总收入与GDP本来就是一对关联指标;而工业增加值、建筑业增加值、交通运输邮电业增加值则是GDP的组成部分。这两组指标必定存在高度相关。

解释变量国民总收入(亿元)X1(代表收入水平)、国内生产总值(亿元)X2(代表经济发展水平)、工业增加值(亿元)X3、建筑业增加值(亿元)X4、交通运输邮电业增加值(亿元)X5(代表产业发展水平及产业结构)、人均生活电力消费(千瓦小时)X6(代表人民生活水平提高)、能源加工转换效率(%)X7(代表能源转换技术)等很可能线性相关,计算相关系数如下:

可以看出lnx1与lnx2、lnx3、lnx4、lnx5、lnx6之间高度相关,许多相关系数高于0.900以上。如果决定用表中全部变量作为解释变量,很可能会出现严重多重共线性问题。 (3)因为存在多重共线性,解决方法如下:

A :修正理论假设,在高度相关的变量中选择相关程度最高的变量进行回归建立模型:而对变量取对数后,能源消费总量的对数与人均生活电力消费的对数相关程度最高,可建立这两者之间的回归模型。如

22ln 9.9320.421ln 6

(0.116) (0.026)

0.926 0.922 261.551

y x R R F =+===

B :进行逐步回归,直至模型符合需要研究的问题,具有实际的经济意义和统计意义。采用逐步回归的办法,去检验和解决多重共线性问题。分别作ln Y 对

1234567ln ,ln ,ln ,ln ,ln ,ln ,ln X X X X X X X 的一元回归,结果如下:

一元回归结果:

其中加入lnX6的方程调整的可决系数最大, 以lnX6为基础, 顺次加入其他变量逐步回归。结果如下表:

经比较,新加入lnX5的方程调整可决系数改进最大, 各参数的t检验也都显著,但是lnX5参数的符号与经济意义不符合。若再加入其他变量后的逐步回归,若剔除不显著的变量和无经济意义的变量后, 仍为第一步所建只包含lnX6的一元回归模型。

如果需要建立多元线性回归模型,则需寻找新的变量或改变模型形式。

例如, 不取对数作全部变量多元线性回归,结果为:

可以看出还是有严重多重共线性。作逐步回归:

可以发现加入X2、X5、X6、X7后参数的符号不合理,加入X4后并不显著。只有加入X3后修正的可决系数有所提高,而且参数符号的经济意义合理, X3参数估计值的p值为0.0821,在10%的显著性水平下是显著的。所以相对较为合理的模型估计结果可以为:

多重共线性习题及答案

多重共线性 一、单项选择题 1、当模型存在严重的多重共线性时,OLS估计量将不具备() A、线性 B、无偏性 C、有效性 D、一致性 2、经验认为某个解释与其他解释变量间多重共线性严重的情况是这个解释变量的VIF() A、大于 B、小于 C、大于5 D、小于5 3、模型中引入实际上与解释变量有关的变量,会导致参数的OLS估计量方差() A、增大 B、减小 C、有偏 D、非有效 4、对于模型y t=b0+b1x1t+b2x2t+u t,与r12=0相比,r12=0.5时,估计量的方差将是原来的() A、1倍 B、1.33倍 C、1.8倍 D、2倍 5、如果方差膨胀因子VIF=10,则什么问题是严重的() A、异方差问题 B、序列相关问题 C、多重共线性问题 D、解释变量与随机项的相关性 6、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明模型中存在( ) A 异方差 B 序列相关 C 多重共线性 D 高拟合优度 7、存在严重的多重共线性时,参数估计的标准差() A、变大 B、变小 C、无法估计 D、无穷大 8、完全多重共线性时,下列判断不正确的是() A、参数无法估计 B、只能估计参数的线性组合 C、模型的拟合程度不能判断 D、可以计算模型的拟合程度 二、多项选择题 1、下列哪些回归分析中很可能出现多重共线性问题() A、资本投入与劳动投入两个变量同时作为生产函数的解释变量 B、消费作被解释变量,收入作解释变量的消费函数 C、本期收入和前期收入同时作为消费的解释变量的消费函数 D、商品价格、地区、消费风俗同时作为解释变量的需求函数 E、每亩施肥量、每亩施肥量的平方同时作为小麦亩产的解释变量的模型 2、当模型中解释变量间存在高度的多重共线性时() A、各个解释变量对被解释变量的影响将难以精确鉴别 B、部分解释变量与随机误差项之间将高度相关 C、估计量的精度将大幅度下降 D、估计对于样本容量的变动将十分敏感 E、模型的随机误差项也将序列相关 3、下述统计量可以用来检验多重共线性的严重性() A、相关系数 B、DW值 C、方差膨胀因子 D、特征值 E、自相关系数 4、多重共线性产生的原因主要有() A、经济变量之间往往存在同方向的变化趋势 B、经济变量之间往往存在着密切的关联 C、在模型中采用滞后变量也容易产生多重共线性 D、在建模过程中由于解释变量选择不当,引起了变量之间的多重共线性 E、以上都正确 5、多重共线性的解决方法主要有() A、保留重要的解释变量,去掉次要的或替代的解释变量 B、利用先验信息改变参数的约束形式 C、变换模型的形式 D、综合使用时序数据与截面数据 E、逐步回归法以及增加样本容量 6、关于多重共线性,判断错误的有() A、解释变量两两不相关,则不存在多重共线性 B、所有的t检验都不显著,则说明模型总体是不显著的

多重共线性的解决之法

第七章 多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews 软件解决多重共线性的实际问题。 第一节 多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X 1,X 2,……,X k 中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型 i ki k i i i X X X Y μββββ+++++= 22110 (7-1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共线性。 从矩阵形式来看,就是0' =X X , 即1)(-

(2)不完全多重共线性 不完全多重共线性是指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。 如对于多元线性回归模型(7-1)存在不全为零的数k λλλ,,,21 ,使得下式成立: X X X 2211=++++i ki k i i u λλλ (7-3) 其中i u 为随机误差项,则可以说解释变量k X ,,X ,X 21 之间存在不完全多重共线性。随机误差项表明上述线性关系是一种近似的关系式,大体上反映了解释变量间的相关程度。 完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。 二、多重共线性产生的原因 多重共线性在经济现象中具有普遍性,其产生的原因很多,一般较常见的有以下几种情况。 (一)经济变量间具有相同方向的变化趋势 在同一经济发展阶段,一些因素的变化往往同时影响若干经济变量向相同方向变化,从而引起多重共线性。如在经济上升时期,投资、收入、消费、储蓄等经济指标都趋向增长,这些经济变量在引入同一线性回归模型并作为解释变量时,往往存在较严重的多重共线性。 (二)经济变量间存在较密切关系 由于组成经济系统的各要素之间是相互影响相互制约的,因而在数量关系上也会存在一定联系。如耕地面积与施肥量都会对粮食总产量有一定影响,同时,二者本身存在密切关系。 (三)采用滞后变量作为解释变量较易产生多重共线性 一般滞后变量与当期变量在经济意义上关联度比较密切,往往会产生多重共线性。如在研究消费规律时,解释变量因素不但要考虑当期收入,还要考虑以往各期收入,而当期收入与滞后收入间存在多重共线性的可能很大。 (四)数据收集范围过窄,有时会造成变量间存在多重共线性问题。 三、多重共线性产生的后果 由前述可知,多重共线性分完全多重共线性和不完全多重共线性两种情况,两种情况都会对模

EVIEWS案例:(消除多重共线性)影响国内旅游市场收入的主要因素分析

第四章 案例分析 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长 22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的 1994—2003年的统 计数据,如表4.2所示: 表4.2 1994年—2003年中国旅游收入及相关数据

数据来源:《中国统计年鉴2004》 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3 由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据, Views/Open Selected/One Windows/Open Group 点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。

计量经济学习题及全部答案

《计量经济学》习题(一) 一、判断正误 1.在研究经济变量之间的非确定性关系时,回归分析是唯一可用的分析方法。() 2.最小二乘法进行参数估计的基本原理是使残差平方和最小。() 3.无论回归模型中包括多少个解释变量,总离差平方和的自由度总为(n-1)。() 4.当我们说估计的回归系数在统计上是显着的,意思是说它显着地异于0。() 5.总离差平方和(TSS)可分解为残差平方和(ESS)与回归平方和(RSS)之和,其中残差平方和(ESS)表示总离差平方和中可由样本回归直线解释的部分。() 6.多元线性回归模型的F检验和t检验是一致的。() 7.当存在严重的多重共线性时,普通最小二乘估计往往会低估参数估计量的方差。() 8.如果随机误差项的方差随解释变量变化而变化,则线性回归模型存在随机误差项的 自相关。() 9.在存在异方差的情况下,会对回归模型的正确建立和统计推断带来严重后果。() 10... DW检验只能检验一阶自相关。() 二、单选题

1.样本回归函数(方程)的表达式为( )。 A .i Y =01i i X u ββ++ B .(/)i E Y X =01i X ββ+ C .i Y =01??i i X e ββ++ D .?i Y =01??i X ββ+ 2.下图中“{”所指的距离是( )。 A .随机干扰项 B .残差 C .i Y 的离差 D .?i Y 的离差 3.在总体回归方程(/)E Y X =01X ββ+中,1β表示( )。 A .当X 增加一个单位时,Y 增加1β个单位 B .当X 增加一个单位时,Y 平均增加1β个单位 C .当Y 增加一个单位时,X 增加1β个单位 D .当Y 增加一个单位时,X 平均增加1β个单位 4.可决系数2R 是指( )。 A .剩余平方和占总离差平方和的比重 B .总离差平方和占回归平方和的比重 C .回归平方和占总离差平方和的比重 D .回归平方和占剩余平方和的比重 5.已知含有截距项的三元线性回归模型估计的残差平方和为2i e ∑=800,估

第四章多重共线性答案(1)

第四章 多重共线性 一、判断题 1、多重共线性是一种随机误差现象。(F ) 2、多重共线性是总体的特征。(F ) 3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F ) 4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T ) 5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T ) 6、变量的两两高度相关并不表示高度多重共线性。(F ) 7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T ) 8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。(F ) 9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F ) 10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T ) 12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F ) 13、多重共线性的存在会降低OLS 估计的方差。(F ) 14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T ) 17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F ) 二、单项选择题 1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非 零 常 数 , 则 表 明 模 型 中 存 在 ( B ) A 、异方差 B 、多重共线性 C 、序列相关 D 、随机解释变量 2、 在多元线性回归模型中,若某个解释变量对其余解释变量的可决系数接近1,则表明模型 中存在

多重共线性考试考试与答案

第七章 多重共线性习题与答案 1、多重共线性产生的原因是什么? 2、检验多重共线性的方法思路是什么?有哪些克服方法? 3、考虑一下模型: Y t =β1+β2X t +β3X 1-t +4βX 2-t +5βX 3-t +6βX 4-t +u t 其中Y =消费,X =收入,t =时间。上述模型假定了时间t 的消费支出不仅是时间t 的收入,而且是以前多期的收入的函数。例如,1976年第一季度的消费支出是同季度收入合1975年的四个季度收入的函数。这类模型叫做分布滞后模型(distributed lag models )。我们将在以后的一掌中加以讨论。 (1) 你预期在这类模型中有多重共线性吗?为什么? (2)如果预期有多重共线性,你会怎么样解决这个问题? 4、已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。随机扰动项μ的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释α和β。 (2)OLS 估计量α ?和β?满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由。 5、根据1899—1922年在美国制造业部门的年度数据,多尔蒂(Dougherty )获得如下回归结果: LogY=2.81 - 0.53logK+ 0.91logL + 0.047t Se =(1.38)(0.34) (0.14) (0.021) R 2=0.97 F=189.8 其中Y =实际产生指数,K=实际资本投入指数,L=实际劳力投入指数,t =时间或趋势。利用同样数据,他又获得一下回归: (1)回归中有没有多重共线性?你怎么知道? (2)在回归(1)中,logK 的先验符号是什么?结果是否与预期的一致?为什么或为什么不? (3)你怎样替回归的函数形式(1)做辩护:(提示:柯柏—道格拉斯生产函数。) (4)解释回归(1)在此回归中趋势变量的作用为何? (5)估计回归(2)的道理何在? (6)如果原先的回归(1)有多重共线性,是否已被回归(2)减弱?你怎样知道?

多重共线性 多重共线性实验案例与独立实验问题

实验五 多重共线性模型的检验与处理(1) 一、研究的目的要求 近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。 二、模型设定及其估计 经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数2X ,城镇居民人均旅游支出3X ,农村居民人均旅游支出4X ,并以公路里程5X 和铁路里程6X 作为相关基础设 施的代表。为此设定了如下对数形式的计量经济模型: 23456123456t t t t t t t Y X X X X X u ββββββ=++++++ 其中 :t Y ——第t 年全国旅游收入 2X ——国内旅游人数 (万人) 3X ——城镇居民人均旅游支出 (元) 4X ——农村居民人均旅游支出 (元) 5X ——公路里程(万公里) 6X ——铁路里程(万公里) 为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4.2所示: 利用Eviews 软件,输入Y 、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS 回归,结果如表4.3: 表4.3

由此可见,该模型9954.02=R ,9897.02 =R 可决系数很高,F 检验值173.3525,明 显显著。但是当05.0=α时776 .2)610()(025.02=-=-t k n t α,不仅2X 、6X 系数的t 检 验不显著,而且6X 系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵(如表4.4): 表4.4 由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。 三、消除多重共线性 采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y 对X2、X3、X4、X5、X6的一元回归,结果如表4.5所示: 表4.5

多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n

异方差性习题及答案

异方差性 一、单项选择 1.Goldfeld-Quandt 方法用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 2.在异方差性情况下,常用的估计方法是( ) A.一阶差分法 B.广义差分法 C.工具变量法 D.加权最小二乘法 3.White 检验方法主要用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 4.Glejser 检验方法主要用于检验( ) A.异方差性 B.自相关性 C.随机解释变量 D.多重共线性 5.下列哪种方法不是检验异方差的方法 ( ) A.戈德菲尔特——匡特检验 B.怀特检验 C.戈里瑟检验 D.方差膨胀因子检验 6.当存在异方差现象时,估计模型参数的适当方法是 ( ) A.加权最小二乘法 B.工具变量法 C.广义差分法 D.使用非样本先验信息 7.加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即 ( ) A.重视大误差的作用,轻视小误差的作用 B.重视小误差的作用,轻视大误差的作用 C.重视小误差和大误差的作用 D.轻视小误差和大误差的作用 8.如果戈里瑟检验表明,普通最小二乘估计结果的残差i e 与i x 有显著的形式 i i i v x e +=28715.0的相关关系(i v 满足线性模型的全部经典假设),则用加权最小二 乘法估计模型参数时,权数应为 ( ) A. i x B. 21i x C. i x 1 D. i x 1 9.如果戈德菲尔特——匡特检验显著,则认为什么问题是严重的 ( ) A.异方差问题 B.序列相关问题 C.多重共线性问题 D.设定误差问题 10.设回归模型为i i i u bx y +=,其中i i x u Var 2)(σ=,则b 的最有效估计量为( ) A. ∑∑=2?x xy b B. 2 2)(?∑∑∑∑∑--=x x n y x xy n b C. x y b =? D. ∑=x y n b 1? 二、多项选择 1.下列计量经济分析中那些很可能存在异方差问题( ) A.用横截面数据建立家庭消费支出对家庭收入水平的回归模型 B.用横截面数据建立产出对劳动和资本的回归模型 C.以凯恩斯的有效需求理论为基础构造宏观计量经济模型

第四章-多重共线性-答案(1)

) 第四章 多重共线性 一、判断题 1、多重共线性是一种随机误差现象。(F ) 2、多重共线性是总体的特征。(F ) 3、在存在不完全多重共线性的情况下,回归系数的标准差会趋于变小,相应的t 值会趋于变大。(F ) 4、尽管有不完全的多重共线性,OLS 估计量仍然是最优线性无偏估计量。(T ) 5、在高度多重共线的情形中,要评价一个或多个偏回归系数的个别显著性是不可能的。(T ) 6、变量的两两高度相关并不表示高度多重共线性。(F ) - 7、如果分析的目的仅仅是预测,则多重共线性一定是无害的。(T ) 8、在多元回归中,根据通常的t 检验,每个参数都是统计上不显著的,你就不会得到一个高的2R 值。(F ) 9、如果简单相关系数检测法证明多元回归模型的解释变量两两不相关,则可以判断解释变量间不存在多重共线性。( F ) 10、多重共线性问题的实质是样本问题,因此可以通过增加样本信息得到改善。(T ) 11、虽然多重共线性下,很难精确区分各个解释变量的单独影响,但可据此模型进行预测。(T ) 12、如果回归模型存在严重的多重共线性,可不加分析地去掉某个解释变量从而消除多重共线性。(F ) 13、多重共线性的存在会降低OLS 估计的方差。(F ) 14、随着多重共线性程度的增强,方差膨胀因子以及系数估计误差都在增大。(T ) : 15、解释变量和随机误差项相关,是产生多重共线性的原因。(F ) 16、对于模型i ni n i 110i u X X Y ++++=βββ ,n 1i ,, =;如果132X X X -=,模型必然存在解释变量的多重共线性问题。(T ) 17、多重共线性问题是随机扰动项违背古典假定引起的。(F ) 18、存在多重共线性时,模型参数无法估计。(F ) 二、单项选择题 1、在线性回归模型中,若解释变量1X 和2X 的观测值成比例,既有12i i X kX =,其中k 为 非零常数,则表明模型中存在 ( B ) A 、异方差 B 、多重共线性 '

第七章 多共线性及其处理

第七章 多重共线性及其处理 第一部分 学习辅导 一、本章学习目的与要求 1.理解多重共线性的概念; 2.掌握多重共线性存在的主要原因; 3.理解多重共线性可能造成的后果; 4.掌握多重共线性的检验与修正的方法。 二、本章内容提要 本章主要介绍计量经济模型的计量经济检验。即多重共线性问题。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性,这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的参数的标准差往往较大,从而使得t 统计值减小,参数的显著性下降,导致某些本应存在于模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 (一)多重共线性及其产生的原因 当我们利用统计数据进行分析时,解释变量之间经常会出现高度多重共线性的情况。 1.多重共线性的基本概念 多重共线性(Multicollinearity )一词由弗里希(Frish )于1934年在其撰写的《借助于完全回归系统的统计合流分析》中首次提出。它的原义是指一个回归模型中的一些或全部解释变量之间存在有一种“完全”或准确的线性关系。 如果在经典回归模型Y X βε=+中,经典假定(5)遭到破坏,则有()1R X k <+,此时称解释变量k X X X ,,,21ΛΛ间存在完全多重共线性。解释变量的完全多重共线性,也就是解释变量之间存在严格的线性关系,即数据矩阵X 的列向量线性相关。因此,必有一个列向量可由其余列向量线性表示。 同时还有另外一种情况,即解释变量之间虽然不存在严格的线性关系,但是却有近似的线性关系,即解释变量之间高度相关。 2.多重共线性产生的原因 多元线性回归模型产生多重共线性的原因很多,主要有: (1)经济变量的内在联系 这是产生多重共线性的根本原因。 (2)解释变量中含有滞后变量 (3)经济变量变化趋势的“共向性” 必须指出,多重共线性基本上是一种样本现象。因为人们在设定模型时,总是尽量避免将理论上具有严格线性关系的变量作为解释变量收集在一起,因此,实际问题中的多重共线性并不是解释变量之间存在理论上或实际上的线性关系造成的,而是由所收集的数据(解释变量观察值)之间存在近似的线性关系所致。 (二)多重共线性的影响 多重共线性会产生以下问题: (1)增大了OLS 估计量的方差 (2)难以区分每个解释变量的单独影响 (3)回归模型缺乏稳定性 (4)t 检验的可靠性降低 (三)多重共线性的判别 在应用多元回归模型中,人们总结了许多检验多重共线性的方法。 1.系数判定法

多重共线性案例分析实验报告

《多重共线性案例分析》实验报告

表2 由此可见,该模型,可决系数很高,F 检验值 173.3525,明显显著。但是当时,不仅、 系数的t 检验不显著,而且系数的符号与预期的相反,这表明很可能存在严重的多重共线性。 9954.02=R 9897.02 =R 05.0=α776 .2)610()(025.02=-=-t k n t α2X 6X 6X

②.计算各解释变量的相关系数,选择X2、X3、X4、X5、X6数据,点”view/correlations ”得相关系数矩阵 表3 由关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性相。 4.消除多重共线性 ①采用逐步回归的办法,去检验和解决多重共线性问题。 分别作Y 对X2、X3、X4、X5、X6的一元回归 如下图所示 变量 X2 X3 X4 X5 X6 参数估计值 0.0842 9.0523 11.6673 34.3324 2014.146 t 统计量 8.6659 13.1598 5.1967 6.4675 8.7487 0.9037 0.9558 0.7715 0.8394 0.9054 表4 按的大小排序为:X3、X6、X2、X5、X4。 以X3为基础,顺次加入其他变量逐步回归。首先加入X6回归结果为: t=(2.9086) (0.46214) 2R 2 R 6 31784.285850632.7639.4109?X X Y t ++-=957152.02 =R

1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 表1:1994年—2003年中国游旅收入及相关数据

第11章 多重线性回归分析思考与练习参考答案

第11章 多重线性回归分析 思考与练习参考答案 一、 最佳选择题 1. 逐步回归分析中,若增加自变量的个数,则( D )。 A. 回归平方和与残差平方和均增大 B. 回归平方和与残差平方和均减小 C. 总平方和与回归平方和均增大 D. 回归平方和增大,残差平方和减小 E. 总平方和与回归平方和均减小 2. 下面关于自变量筛选的统计学标准中错误的是( E )。 A. 残差平方和(残差SS )缩小 B. 确定系数(2 R )增大 C. 残差的均方(残差MS )缩小 D. 调整确定系数(2 ad R )增大 E. p C 统计量增大 3. 多重线性回归分析中,能直接反映自变量解释因变量变异百分比的指标为 ( C )。 A. 复相关系数 B. 简单相关系数 C.确定系数 D. 偏回归系数 E. 偏相关系数 4. 多重线性回归分析中的共线性是指( E )。 A.Y 关于各个自变量的回归系数相同 B.Y 关于各个自变量的回归系数与截距都相同 C.Y 变量与各个自变量的相关系数相同 D.Y 与自变量间有较高的复相关 E. 自变量间有较高的相关性 5. 多重线性回归分析中,若对某一自变量的值加上一个不为零的常数K ,则有( D )。 A. 截距和该偏回归系数值均不变 B. 该偏回归系数值为原有偏回归系数值的K 倍 C. 该偏回归系数值会改变,但无规律 D. 截距改变,但所有偏回归系数值均不改变 E. 所有偏回归系数值均不会改变 二、思考题 1. 多重线性回归分析的用途有哪些? 答:多重线性回归在生物医学研究中有广泛的应用,归纳起来,可以包括以下几个方面:定量地建立一个反应变量与多个解释变量之间的线性关系,筛选危险因素,通过较易测量的变量估计不易测量的变量,通过解释变量预测反应变量,通过反应变量控制解释变量。

计量经济学题库及答案71408

计量经济学题库(超完整版)及答案 一、单项选择题(每小题1分) 1.计量经济学是下列哪门学科的分支学科(C )。 A .统计学 B .数学 C .经济学 D .数理统计学 2.计量经济学成为一门独立学科的标志是(B )。 A .1930年世界计量经济学会成立 B .1933年《计量经济学》会刊出版 C .1969年诺贝尔经济学奖设立 D .1926年计量经济学(Economics )一词构造出来3.外生变量和滞后变量统称为(D )。 A .控制变量 B .解释变量 C .被解释变量 D .前定变量 4.横截面数据是指(A )。 A .同一时点上不同统计单位相同统计指标组成的数据 B .同一时点上相同统计单位相同统计指标组成的数据 C .同一时点上相同统计单位不同统计指标组成的数据 D .同一时点上不同统计单位不同统计指标组成的数据 5.同一统计指标,同一统计单位按时间顺序记录形成的数据列是(C )。 A .时期数据 B .混合数据 C .时间序列数据 D .横截面数据 6.在计量经济模型中,由模型系统内部因素决定,表现为具有一定的概率分布的随机变量,其数值受模型中其他变量影响的变量是()。 A .内生变量 B .外生变量 C .滞后变量 D .前定变量 7.描述微观主体经济活动中的变量关系的计量经济模型是()。 A .微观计量经济模型 B .宏观计量经济模型 C .理论计量经济模型 D .应用计量经济模型 8.经济计量模型的被解释变量一定是()。 A .控制变量 B .政策变量 C .内生变量 D .外生变量 9.下面属于横截面数据的是()。 A .1991-2003年各年某地区20个乡镇企业的平均工业产值 B .1991-2003年各年某地区20个乡镇企业各镇的工业产值 C .某年某地区20个乡镇工业产值的合计数 D .某年某地区20个乡镇各镇的工业产值10.经济计量分析工作的基本步骤是()。 A .设定理论模型→收集样本资料→估计模型参数→检验模型 B .设定模型→估计参数→检验模型→应用模型 C .个体设计→总体估计→估计模型→应用模型 D .确定模型导向→确定变量及方程式→估计模型→应用模型 11.将内生变量的前期值作解释变量,这样的变量称为()。 A .虚拟变量 B .控制变量 C .政策变量 D .滞后变量 12.()是具有一定概率分布的随机变量,它的数值由模型本身决定。 A .外生变量 B .内生变量 C .前定变量 D .滞后变量 13.同一统计指标按时间顺序记录的数据列称为()。 A .横截面数据 B .时间序列数据 C .修匀数据 D .原始数据 14.计量经济模型的基本应用领域有()。 A .结构分析、经济预测、政策评价 B .弹性分析、乘数分析、政策模拟 C .消费需求分析、生产技术分析、 D .季度分析、年度分析、中长期分析 15.变量之间的关系可以分为两大类,它们是()。 A .函数关系与相关关系 B .线性相关关系和非线性相关关系

最新多重共线性的解决之法

多重共线性的解决之 法

第七章多重共线性 教学目的及要求: 1、重点理解多重共线性在经济现象中的表现及产生的原因和后果 2、掌握检验和处理多重共线性问题的方法 3、学会灵活运用Eviews软件解决多重共线性的实际问题。 第一节多重共线性的产生及后果 一、多重共线性的含义 1、含义 在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量X1,X2,……,X k中的任何一个都不能是其他解释变量的线性组合。如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的古典假设,将给普通最小二乘法带来严重后果。 2、类型 多重共线性包含完全多重共线性和不完全多重共线性两种类型。 (1)完全多重共线性 完全多重共线性是指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。 如对于多元线性回归模型

i ki k i i i X X X Y μββββ+++++= 22110 (7- 1) 存在不全为零的数k λλλ,,,21 ,使得下式成立: 0X X X 2211=+++ki k i i λλλ (7-2) 则可以说解释变量k X ,,X ,X 21 之间存在完全的线性相关关系,即存在完全多重共 线性。 从矩阵形式来看,就是0'=X X , 即1)(-

计量经济学习题及答案汇总

期中练习题 1、回归分析中使用的距离是点到直线的垂直坐标距离。最小二乘准则是指( ) A .使∑=-n t t t Y Y 1)?(达到最小值 B.使∑=-n t t t Y Y 1达到最小值 C. 使 ∑=-n t t t Y Y 1 2 ) (达到最小值 D.使 ∑=-n t t t Y Y 1 2)?(达到最小值 2、根据样本资料估计得出人均消费支出 Y 对人均收入 X 的回归模型为 ?ln 2.00.75ln i i Y X =+,这表明人均收入每增加 1%,人均消费支出将增加 ( ) A. 0.75 B. 0.75% C. 2 D. 7.5% 3、设k 为回归模型中的参数个数,n 为样本容量。则对总体回归模型进行显著性检验的F 统计量与可决系数2 R 之间的关系为( ) A.)1/()1()/(R 2 2---=k R k n F B. )/(1)-(k )R 1/(R 22k n F --= C. )/()1(22k n R R F --= D. ) 1()1/(22R k R F --= 6、二元线性回归分析中 TSS=RSS+ESS 。则 RSS 的自由度为( ) A.1 B.n-2 C.2 D.n-3 9、已知五个解释变量线形回归模型估计的残差平方和为 8002=∑t e ,样本容量为46,则随机误 差项μ的方差估计量2 ?σ 为( ) A.33.33 B.40 C.38.09 D. 20 1、经典线性回归模型运用普通最小二乘法估计参数时,下列哪些假定是正确的( ) A.0)E(u i = B. 2i )Var(u i σ= C. 0)u E(u j i ≠ D.随机解释变量X 与随机误差i u 不相关 E. i u ~),0(2i N σ 2、对于二元样本回归模型i i i i e X X Y +++=2211???ββα,下列各式成立的有( ) A.0 =∑i e B. 0 1=∑i i X e C. 0 2=∑i i X e D. =∑i i Y e E. 21=∑i i X X 4、能够检验多重共线性的方法有( ) A.简单相关系数矩阵法 B. t 检验与F 检验综合判断法 C. DW 检验法 D.ARCH 检验法 E.辅助回归法

计量经济学中多重共线性案例问题研究报告方案

计量经济学中多重共线性案例问题研究 摘要:本论文主要通过案例来研究计量经济学中的多重共线性的问题,对案例进行EVIEWS分析,并利用诊断共线性的经验方法及修正共线性的经验方法和通过EVIEWS分析对案例中的多重共线性进行诊断与修正,以能够完成减弱多重共线性的目标。 关键字:多重共线性诊断共线性的经验方法修正共线性的经验方法经典的线性回归模型的假定之一是各解释变量X之间不存在多重共线性。然而,在计量经济学中所说的多重共线性(mnlti-collinearity),不仅包含解释变量之间精确的线性关系,还包含解释变量之间近似的线性关系。下面来通过研究国内生产总值的增加会影响财政收入的增加还是减少的案例对多重共线性进行研究。 一、研究的目的和要求 国内生产总值GDP按照支出法的公式为:国内生产总值=消费+投资+政府购买支出+净出口,而财政收入的主要来源为各项税收收入如增值税等。只有经济持续的增长,才能提供稳定的税收来源。所以,影响财政收入的主要因素是税收收入。但是,税收收入还影响着国内生产总值。因此,为了中国未来经济的发展,需要定量的分析影响中国财政收入的因素。 二、模型设定及其估计 经过研究与分析,影响财政收入的主要因素,除了税收收入以外,还有与一些其他因素有关。为此,考虑的影响因素主要有财政支出CZZC/亿元用X2表示,国内生产总值GDP/亿元用X3表示,税收总额SSZE/亿元用X4表示。各影响变量与财政收入之间呈现正相关。因此设定了如下形式的计量经济模型来研究“国内生产总值的增加会减少财政收入吗”这个问题: Y t=β1+β2X2t+β3X3t+β4X4t+μt 式中,Yt为第t年国内财政收入(亿元);X2为财政支出(亿元);X3为国内生产总值(亿元);X4为税收总额(亿元)。各解释变量前的回归系数预期都大于0. 为估计模型参数,1985~2011年阶段财政收入的统计数据,如下表:

计量经济学Eviews多重共线性实验报告记录

计量经济学Eviews多重共线性实验报告记录

————————————————————————————————作者:————————————————————————————————日期:

实验报告 课程名称计量经济学 实验项目名称多重共线性 班级与班级代码 专业 任课教师 学号: 姓名: 实验日期:2014 年05 月11日

广东商学院教务处制 姓名实验报告成绩 评语: 指导教师(签名) 年月日

说明:指导教师评分后,实验报告交院(系)办公室保存。 计量经济学实验报告 一、实验目的:掌握多元线性回归模型的估计方法、掌握多重共线性模型的识别和修正。 二、实验要求:应用教材第127页案例做多元线性回归模型,并识别和修正多重共线性。 三、实验原理:普通最小二乘法、简单相关系数检验法、综合判断法、逐步回归法。 四、预备知识:最小二乘法估计的原理、t检验、F检验、2 R值。 五、实验步骤 1、选择数据 理论上认为影响能源消费需求总量的因素主要有经济发展水平、收入水平、产业发展、人民生活水平提高、能源转换技术等因素。为此,收集了中国能源消费标准煤总量、国民总收入、国内生产总值GDP、工业增加值、建筑业增加值、交通运输邮电业增加值、人均生活电力消费、能源加工转换效率等1985——2007年的统计数据。本题旨在通过建立这些经济变量的线性模型来说明影响能源消费需求总量的原因。主要数据如下: 1985~2007年统计数据 年份 能源消费 国民 总收入 国内生 产总值 工业 增加值 建筑业 增加值 交通运输邮电 增加值 人均生活 电力消费 能源加工 转换效率 y X1 X2 X3 X4 X5 X6 X7 1985766829040.7 9016 3448.7 417.9 406.9 21.3 68.29 198680850 10274.4 10275.2 3967 525.7 475.6 23.2 68.32 198786632 12050.6 12058.6 4585.8 665.8 544.9 26.4 67.48 198892997 15036.8 15042.8 5777.2 810 661 31.2 66.54 198996934 17000.9 16992.3 6484 794 786 35.3 66.51 199098703 18718.3 18667.8 6858 859.4 1147.5 42.4 67.2 1991103783 21826.2 21781.5 8087.1 1015.1 1409.7 46.9 65.9 1992109170 26937.3 26923.5 10284.5 1415 1681.8 54.6 66.00 1993115993 35260 35333.9 14188 2266.5 2205.6 61.2 67.32 1994122737 48108.5 48197.9 19480.7 2964.7 2898.3 72.7 65.2 1995131176 59810.5 60793.7 24950.6 3728.8 3424.1 83.5 71.05 1996138948 70142.5 71176.6 29447.6 4387.4 4068.5 93.1 71.5 1997137798 77653.1 78973 32921.4 4621.6 4593 101.8 69.23 1998132214 83024.3 84402.3 34018.4 4985.8 5178.4 106.6 69.44 1999133831 88189 89677.1 35861.5 5172.1 5821.8 118.2 69.19 2000138553 98000.5 99214.6 40033.6 5522.3 7333.4 132.4 69.04 2001143199 108068.2 109655.2 43580.6 5931.7 8406.1 144.6 69.03 2002151797 119095.7 120332.7 47431.3 6465.5 9393.4 156.3 69.04 2003174990 135174 135822.8 54945.5 7490.8 10098.4 173.7 69.4 2004203227 159586.7 159878.3 65210 8694.3 12147.6 190.2 70.71 2005223319 183956.1 183084.8 76912.9 10133.8 10526.1 216.7 71.08 2006 246270 213131.7 211923.5 91310.9 11851.1 12481.1 249.4 71.24

相关文档
相关文档 最新文档