当前位置：文档库 › 面板数据题目

面板数据题目

阳桦 Yang Hua

复旦大学中国经济研究中心 https://www.wendangku.net/doc/0014516304.html,

Email:yanghuamail@https://www.wendangku.net/doc/0014516304.html, 052015039@https://www.wendangku.net/doc/0014516304.html,

1. FD 和FE 方法是处理面板数据的常用方法，因为他们在某些情况下能很好的降低遗漏变

量带来的参数估计误差。那么应用FD 和FE 方法需要一些什么条件。（1）必须是对面板数据进行处理的时候能用这两种方法。（2）遗漏变量是不能随时间而发生变化的（3）要考察的解释变量必须有一定的variance

2. 什么是异方差？异方差的出现会对OLS 估计量的无偏性、一致性和方差会产生什么样

的影响。请分别介绍一种检验和消除异方差的方法。（1）异方差是指回归方程中的干扰项的方差不再是常数。（2）异方差性不会导致估计产生偏误或不一致性。但是估计量的方差在存在异方差的情况下是有偏的。因此在出现异方差的情况下普通最OLS 下的t 统计量就不服从t 分布，F 统计量也不服从F 分布，我们也就没有办法用这两个统计量进行假设检验。

（3）WHITE 检验可以用来进行异方差检验。在同方差情况下，方差与解释变量是没有相关性的，White 方法就是针对这一情形提出的一种检验方法。它将所有原方程的解释变量、解释变量的平方以及所有解释变量的交叉乘积对残差进行OLS 回归，检验他们之间是否存在显著相关性。

0112231

3412u x x x x x x δδδδδδε=++++++

（4）GLS （广义最小二乘法）是一种常见的消除异方差的方法。它的主要思想是为解释变量加上一个权重，从而使得加上权重后的回归方程方差是相同的。因此在GLS 方法下我们可以得到估计量的无偏和一致估计，并可以对其进行OLS 下的t 检验和F 检验。

4. 当一个回归方程因缺乏数据而排除了一个关键变量时，就会导致遗漏变量偏误。当该遗漏变量数据无法获得时，我们通常应该如何消除或减少偏误，并简单阐述这些方法为何能得到无偏估计。

解决遗漏变量偏误的方法主要有：（1）固定效应或一阶差分法。使用该方法的条件是遗漏变量必须是不随时间而发生变化。（2）代理变量。为未观测到的变量找一个代理变量。代理变量必须是与该未观测到的变

量相关的。例如对回归方程：

0112233y x x x δδδδε=++++

如果

3x 是遗漏变量，我们找到另外一个变量1z 。1

与

3x 存在如下的相关性：

3011x z ββμ=++。将此方程代入原来的回归方程可以得到：

0301122311y x x z δδβδδδβεμε=++++++。

因此如果能满足

μ与1x 和2x 不相关，且1z 与ε也不相关的话，我们就可以通过OLS

回归得到无偏估计。不过3δ的估计我们是无法得到。

郭陈孜 052015028

1、请说明处理面板数据时，固定效应和随机效应回归方法的异同。

2、请结合”Do Institutions Cause Growth?”这篇文章谈一谈工具变量的使用。

徐鸣 052015031

1 哪些情况下要加log ？如何解读这些情况下的参数估计量？

2 如何解决面板数据中出现的时间序列问题？朱萸

052015051

1．评估下列5方程系统的参数可识别性：

t t t t t t u z z y y y 14141114142121=++++γγββ t t t t t u z y y y 22225253232=+++γββ t t t t u z z y 33331313=++γγ

t t t t t u z y y y 44444343141=+++γββ

其中z 为外生变量，y 为内生变量，u 为残差项。

2 . 简述Hausman 检验的主要内容及其应用。刘敦

管理学院数量经济学专业05级硕士研究生 139-1754-7531

1. 请问在多元线性回归模型中，主要有哪些假设？当某些假设不满足，会产生什么问题，

如何解决或减轻这些问题？当其中一些假设同时成立时，会有什么结论？答：在多元线性回归模型中，有以下假设：

1. 回归方程对参数而言是线性的，即：

02253=-+t t t z y y

01122...k k y x x x u ββββ=+++++

当该条件不满足时，说明回归方程设定存在偏误。此时可依据经济理论或实际研究背景，对回归变量进行一定改变，如对变量取对数，增加平方项，增加交互项等。 2. 样本是通过随机抽样获得的。当该条件不满足时，如果非随机抽样的原因是外生的，即外生样本选择（exogenous sample selection ）,这样对回归结果并没有影响。如果原因是内生的，则需要用到样本选择纠正（sample selection correction ）的一些方法予以解决。 3. 误差项条件均值为0。

当该条件不满足时，说明被解释变量存在内生性。内生性的问题主要可能是由于方程设定偏误，遗漏重要变量，测量误差，解释变量与被解释变量的联立性引起的。要减轻内生性问题，应尽量采用明显的外生变量，或者采用一些工具变量的方法。 4. 解释变量间不存在完全共线性。只要样本量比解释变量个数大很多，即

n k ，且不要在解释变量中同时出

现如Year, Month 的变量，基本上不会存在完全共线性的问题。但是如果解释变量高度相关的话，还是可能对统计推倒的显著性产生一定影响。因此可以考虑对高度相关的解释变量进行一定的取舍。

● 当以上4个假设满足时，OLS 估计量将具有无偏性和一致性：

?E()=, 0,1,...,j

j j k ββ=

?lim P{||}=1j j

n ββε→∞

-< 5. 误差项同方差：

212Var(|,,...,)k u x x x σ=

当该条件不满足时，并不影响估计量的无偏性和一致性，但是影响估计量的有效性。当存在异方差的时候，可以采用Heteroskedasticity-Robust 的方法进行统计推断，或者用WLS 进行估计。

● 当以上5个假设满足时，OLS 估计量将是最优线性无偏估计量（BLUE ）。 6. 误差项服从正态分布：

2~N(0,)u σ

当该条件不满足时，t 统计量，F 统计量，LM 统计量将不在服从标准的t 分布，F 分布，

2χ分布。但是在大样本的条件下，它们将渐进服从标准分布。所以说在大样

本条件下，这个问题不是很严重。

● 当以上6个假设满足时，OLS 估计量不仅在线性估计中而且在任何估计中都是最

优无偏估计量。

2. 当被解释变量为0－1变量时，请问有哪些基本模型可用？

答：首先，我们可以把取0－1值的被解释变量看作普通的被解释变量，用OLS 进行回归，即线性概率模型（LPM ）：

011P(1|)E(|)...k k

y y x x βββ===+++x x 这样回归得到的参数还有统计推断都与被解释变量为普通变量时得到的结果是一样的。

但是，LPM 有一些缺点：1.被解释变量的预测值可能小于0，或者大于1；2.参数是线性的，说明不管

i x 的大小，它对E(|)y x 的边际贡献都是一样的。3。存在明

显的异方差问题，这是因为：

Var(|)()[1()]y p p =-x x x 。

因此，我们考虑运用Logit 或者Probit 模型来做一些改进。现在我们利用模型

011P(1|)G(...)

k k y x x βββ==+++x ，其中

0G (

z <<，G()z 可以是逻辑函数或者是标准正态分布的累计密度函数。然后通过极大似然估计，便可得到所有参数的估计量。

Logit 或Probit 模型相对LPM 来说有一下优点：1. 被解释变量的预测值一定是大于0，小于1的。2.各个解释变量对被解释变量的边际贡献，都随着解释变量的变化而变化。3. Logit 或Probit 模型都是对异方差稳健的。

截面与面板数据课程

王亦琳 052015172 劳动经济学经济系

题目一：（1）出现内生性的情况有哪些？请举例说明。

（2）写出内生性问题的一般克服方法，并简述这些方法分各自的优缺点。

答案：（1）出现内生性的情况主要有四类：A. 函数形式写错了。比如，漏了加平方项，或者应该用水平值却误取了对数。B. 遗漏了与解释变量相关的变量。比如，估计收入与教育的关系，遗漏了能力这一变量，能力影响教育，因此会造成对教育的回报高估。C. 度量的误差。比如，调查收入时，被调查者告知的收入与真实收入的误差进入u ，但其实与解释变量相关。D. 联立性偏误。即X,Y 互成因果。比如，考察警察数量与犯罪率的关系。犯罪率高的地方往往警察多，并不是警察越多，犯罪率越高。

（2）A ．找代理变量PV 。但是，很多时候要找到合适的代理变量并非易事。而且u 中一般包含不止一种遗漏变量，无法一一为之找到适合的替代变量，更是个问题。B ．固定效应法FE 。但是，只有在被遗漏的变量是不随时间变化的变量时才能用FE 。C ．工具变量法IV 。但IV 的问题是，选取的IV 变量与误差项不相关这一条件是否真正满足无法严格检验。当

一个遗漏变量可以找到多于一个的IV 时，假设其中一个IV 是外生的前提下，可以检验其他IV 是否是外生的。此外，统计上好的IV 并非完全等同于经济学意义的好IV 。如果选取的IV 对于被工具的变量的影响确实有经济学意义，这样就更好了。

题目二：（1）Tobit 模型适用于哪些情况下的问题，请举例。

（2）简述Tobit 模型的局限性，并举例说明。

答案：（1）Tobit 模型适用于涉及时间问题的情况，比如劳动时间，以及耐用品或高档用品的消费问题。其他情况下不适用。

（2）Tobit 模型有一个潜在的局限性，就是以Y>0为条件的期望值与Y>0的概率有密切联系。也就是说，Xj 对P （y>0︱x ）的影响，就像对E （y ︱y>0,x ）的影响一样，这就排除了某些情况的可能性。比如，在考虑人寿保险政策的价值与年龄之间的关系时。对于是否参加人寿保险的决策，年龄越大的人越倾向于参加人寿保险，所以y>0的概率随年龄的增加而提高。但是在参加了人寿保险的人群中，随着年龄增加，这项政策的价值越小。Tobit 模型不许出现这种相反的情况。而只有在相同的情况下，Tobit 模型才适用。比如决策是否加入劳动力市场和决策加入劳动力市场后供应多少劳动力这个决策过程是一致的，Tobit 模型就适用。

面板数据题目

朱萸 052015051

评估下列5方程系统的参数可识别性：

t t t t t t u z z y y y 14141114142121=++++γγββ t t t t t u z y y y 22225253232=+++γββ t t t t u z z y 33331313=++γγ

t t t t t u z y y y 44444343141=+++γββ

02253=-+t t t z y y

其中z 为外生变量，y 为内生变量，u 为残差项。

答：因为识别的过程可以看作为每个方程中的内生变量寻找工具变量。因此，每个方程的可识别的条件是该方程中出现的内生变量的个数减1要小于或等于出现在其他方程中的系数不为零外生变量的个数。由上诉规则可看出，该五方程系统可被识别。

简述Hausman 检验的主要内容及其应用。答：Hausman 检验是用于检验模型是否有误设。其基本思想是检验不同设定下得出的系数是否有显著的差别。过程如下：

建立零假设，即某种模型设定无误。在此假设下估计出系数的值0β及相应的方差协方差矩阵()0βV 。然后，假设模型存在误设，在考虑了误设的情况下估计出系数1β及其方差协方差矩阵。在零假设下，两个估计量均为一致估计量。但0β 是最优的。于是可以得到Hausman 检验值()()()()

()011

0101ββββββ--'

--V V 渐进服从卡方分布，自由度为β的行数。然

后选取显著水平，若超过，则认为原假设有误，不超过则接受零假设。 Hausman 检验可以应用于检验内生性是否存在，或者说内生性是否影响了系数的估计。在这个检验中，实际是看OLS 估计量和IV 估计量是否有显著差别。 Hausman 检验常用于检验固定效应和随机效应。即检查随机效应设定下得出的系数和固定效应下得出的系数是否有显著区别。

考试题目

某人手中有第五次全国人口普查的原始数据，并利用该数据考察教育程度对于个人工资水平的影响。考虑到用OLS 方法估计在存在内生性问题时无法保证参数的无偏性和一致性，他在大样本下采用2SLS 方法估计教育对于收入水平的偏效应。他在出生于1965－1974年出生的人群中随机抽取3％（假如为600，000）作为样本。

在控制了性别哑变量，年龄，年龄平方，出生地哑变量(城市/农村)解释变量后，教育程度仍有可能与一些诸如能力的不可观测因素相关，于是其选取人们在一年中出生的不同季度作为教育程度的IV ,理由是一方面，国家9年义务教育法以及相关地方法规的实施使得同年9月份前出生的孩子要比9月份后出生晚一年达到法定入学年纪；另一方面，直觉上，出生于不同时间似乎与人们的收入水平无直接关系。

1. 被解释变量log(wage)为Y1潜educ 为Y2,控制变量为性别哑变量，年龄，年龄平方，婚姻状况哑变量（已婚为1），家庭成员收入水平（父母，配偶的收入水平），出生地哑变量(城市/农村)，educ 的工具变量分别为出生时间哑变量（Da,Db,Dc ，分别代表在一年的一，二，三季度出生，在一年中的第四季度出生为参照组），出生地哑变量（D1,D2…D30，分别代表三十个省，直辖市，北京市为参照组）与出生时间哑变量的交

互项，这是为了控制各地的相关法规与管理力度差异。

试写出2SLS估计方法下的方程。

2.若上题的IV法参数估计值具有一致性，误差项需要满足那些假设条件。这些条件能够

保证IV法估计的参数有效吗？

3.假设仅有一个潜在内生变量做解释变量x，n个IV Z=(z1 z2 z3…z n ),证明在IV法估计参

数的一致性。

4.参考以下信息：

a)若部分回归结果如下：

log(wage)

OLS IV（1）IV（2）IV（3）coefficient stand error coefficient stand error coefficient stand error coefficient stand error educ 0.05 0.0001 0.17 0.025 0.05 0.015 0.048 0.020 age agesq ××

IV number 3 90 90

此外，在first-stage中，工具变量的系数非常小，但统计显著。

b)有实证资料表明：上半年出生者与下半年出生者在IQ上在一定显著性水平上存在

差异（前者较后者高）；上半年出生者较下半年出生者有更高概率患肾病；出生的季度性的

地区分布在不同年度间有差异。

问题：可以看到在增加了工具变量数目后，教育程度的IV估计参数与OLS很相近，这是否意味着两种方法效果接近,educ没有显著的内生性？

比较两种方法下的参数估计的标准误，有什么发现？比较IV（2）和IV（3），前者在first-stage

regression 中，没有加入原回归方程的其他控制变量，二者的结果有何差异？

从第二段资料中，可以获得哪些有关IV估计方法一致性的信息？

如果这些资料反映了现实情况，那个其选用了大样本进行IV估计是否可以保证其一致性？

某人手中有1995，2000年5000家工业企业的面板数据，希望考察外国直接投资对于国内企业绩效的影响。根据相关理论，外国直接投资在东道国企业的影响主要包括横向的竞争效应，带来同类企业生产效率的提升（行业内的溢出效应）；通过产业链分工对相关行业的前向与后向影响、技术，专业知识溢出效应、国内人力资本积累增加国内企业利润（行业内的溢出效应）。于是，构造回归模型，自变量为log(real profit),解释变量包括，企业层面的控制变量，企业规模（雇员总数），企业投入（技术工人真实工资，各期期初的资本存量，原材料成本）；行业层面虚拟变量，时间哑变量，所关心的变量是企业的外资比重，企业所在行业的外资比重，二者的交互项。

问题：

1. 试分别写出FE ，RE 下的回归方程。二者在哪些条件下优于OLS 估计。

2. 如何解释企业外资比重与企业所在行业外资比重的交互项系数

3. 考虑到企业的利润增长能力很可能与企业规模有关，从而有异方差可能。写出WLS 下回归方程。

4. 考虑到外商投入资本的规模或增长率与企业利润增长率可能同时决定，是否可能找到相应的工具变量？假如可以掌握样本企业的外资主要成分，即具体来源，是否可以考虑从外商直接投资的母国或者跨国公司特性寻找工具变量？

殷华祥 052025025

1. 工具变量解决回归中的什么问题？需要满足什么条件？

Suggested answer:

父母的教育作为edu的工具变量，与子女的能力不相关，与子女的教育有相关。因此是比较好的工具变量。

兄弟姐妹的数目作为edu的工具变量，与能力不相关，与其教育相关。因此是比较好的工具变量。

是否出生在第一季度作为edu的工具变量，由于义务教务法的原因导致年初出生的学生入学较晚，因此受的教育较少，同时与能力不相关。因此也是可行的工具变量。

不过父母的教育与兄弟姐妹的数目在一定程度上还是会影响子女的能力，有一定的相关性。是否出生在第一季度这个二值变量与教育的相关性不高，也影响了其做为工具变量的效果。

1 在回归模型中，如果遗漏解释变量时，一般会导致参数的有偏估计。但是在何种情况下，却依然会得到参数的无偏估计？

2 工具变量应该具备何种性质？

余央央

042015014 汪海燕

一、简单比较代理变量和工具变量异同。

参考答案：代理变量和工具变量都是解决遗漏变量问题的可行方法。假设方程为y=a+bx+u ，如果遗漏的变量z与x不相关，则b的估计偏大，因为该方程将全部y的变化归功于x一方的贡献，高估了x的作用；如果z与x相关时，可用代理变量或工具变量等方法处理。

（1）代理变量法。替代变量必须和x高度相关，才具有对他的替代功能。

（2）工具变量法。如果一个变量z满足如下三个条件（其中u为误差项，x为内生性变量）：1）(,)0

Cov z u=，也就是说该变量和误差项无关，它对被解释变量y没有直接影响。2）(,)0

Cov z x≠，也就是说变量z必须和x相关。我们就称z为一个可行的工具变量（IV）。3）从逻辑上看，z通过影响x达到影响y的目的, 如果这个逻辑不成立，z就不是好的IV。（3）代理变量不是一个好的工具变量，因为代理变量不满足(,)0

Cov z x≠。

二、用受教育时间、工作时间和工作时间的平方来估计个人工资的方法会出现什么问题？

wage = a

0 + a

edu + a

exp + u.

参考答案：（1）理论有问题。该方程的理论基础是人力资本理论，即教育、经验、健康等方面的投资决定了一个人人力资本（综合能力）的大小。该方程（如果不考虑健康的影响）的致命缺陷是只考虑了教育、经验的数量（时间），没有考虑他们的质量，但是恰恰是质量决定了工资。（2）还是理论缺陷。该方程

忽略了教育和经验之间的相互关系和相互作用。对于人力资本的提高，教育和经验有着相同和不同的作用，是以两者具有明显的替代和互补关系，这种关系并非简单的线性关系，因为两者在不同条件下的替代率非恒常不变。（3）用方程wage = a 0 + a 1edu + a 2exp + a 3exp

+ u. 代替原方程也许可以缓解第二个

问题，但是无法解决第一个问题。（4）用ability (IQ)作为遗漏变量的代理变量加入原方程，首先ability 不是与教育和经验平行的解释变量，从逻辑上说不通；其次教育和经验的时间本身就隐含了ability 的作用，在用它就会出现重复计量；最后用IQ 来代表ability 可信度有争议。

至于最好的解决上述问题的办法，学生正在思考当中：）

厉家鼎 052015171

1、简述一般线性模型的经典假设，并证明对于这种模型最小二乘估计量是线性无偏估计量。

答案要点：

a 、参数的线性性：y=β0+β1x+u ；

b 、随机抽样：从总体模型中随机抽取样本；

c 、零条件均值：E (u│x)=0；

d 、自变量的样本有变异：在样本中，自变量x i (i=1、2、…、n)不为相同的常数。证明：根据假设，有 β^

1=Σ(x i -x -)y i /Σ(x i

-x -)2

=Σ(x i -x -)(β0+β1x i +u i )/s 2 =β1+Σ(x i -x -)u i /s 2

=β1+(1/s 2) Σd i u i 则 E(β^

1)=β1+E[(1/s 2)]Σd i u i

=β1+(1/s 2)ΣE(d i u i ) =β1+(1/s 2)Σd i E(u i ) =β1+(1/s 2)Σd i ·0 =β1

又 β^

0=y -

-β^1x -=β0+(β1-β^

1)x -+u -

则 E(β^

0)=β0+E(β1-β^

1)x -+E(u -) =β0+E(β1-β^

1)x -

=β0+[β1-E(β^1)]x -

=β0

得证。

2、请简述固定效应和一阶差分的区别。

答案要点：

固定效应和这里的一阶差分都是相对于面板数据而言。面板数据最大的优点之一在于可以消除残差项中的与解释变量相关而造成的估计量有偏的问题。我们既可以通过固定效应模型，也可以通过一阶差分来消除残差项中的。但是在某些情况下，这两种方法存在着效率上

的区别。将设u i,t符合同方差假设：

a、当u i,t无序列相关时，FE比FD更有效；

b、如果u i,t遵循随机游走过程u i,t=u i,t-1+v i,t，v i,t:n(0,σ2)，Δu i,t是无序列相关的，此时FD相对更有效；

c、如果严格外生性假定不满足，则FD相对FE比较好；

d、当T很大时，或者N不足够大时，FD更有效；

e、可以同时使用两种方法，比较两种统计量估计的结果，并分析差异存在的原因。

侯振新052015001

一、使用

1、使用自然对数使得对系数的解释颇具吸引力

2、由于斜率系数不随测度单位的变化而变化，所以可以忽略以对数形式出现的变量的

测度单位

3、当y>0时，使用log(y)作为因变量的模型，通常比使用y的水平值作为因变量的模

型更接近CLM假定

4、严格为正的变量，其条件分布常常具有异方差性或偏态性，取对数后，即使不能消

除这两方面的问题，也可以使之有所缓和

5、取对数通常会缩小变量的取值范围，在某些情况下还相当可观，这就使得估计值对

因变量或自变量的异常（或极端）观测不是那么敏感

二、利用GPA.RAW中的数据，我们得到预测大学GPA的如下方程：

co lg^= 1.493 + 0.00149 sat - 0.01386 hsperc-0.06088 hsize + 0.00546 hsize2

(0.075) (0.00007) (0.00056) (0.01650) (0.00227)

n = 4137 , R2= 0.278 , R2= 0.277 , σ^= 0.560

有一名学生，sat ＝1200 ，hsper ＝30 ，hsize ＝ 5 。定义一个新的自变量组：sat0 = sat – 1200 , hsperc0 = hsperc – 30 , hsize0 = hsize – 5 , hsizeq0 = hsize2- 25 .

将colpga对这些新变量进行回归时得到

co lg^= 2.700 + 0.00149 sat - 0.01386 hsperc-0.06088 hsize + 0.00546 hsize2 pa

(0.020) (0.00007) (0.00056) (0.01650) (0.00227)

n = 4137 , R2= 0.278 , R2= 0.277 , σ^= 0.560

问题1：该学生GPA 的预测值是多少？

问题2：该学生大学预期GPA 的一个95％的置信区间是多少？问题3：该学生未来的大学GPA 的一个95％的置信区间是多少？

答案1：2.70

答案2：2.70-1.96*0.020～2.70+1.96*0.020 ，或约为 2.66～2.74 答案3：2.70 -）（560.0*560.0020.0*020.02

/1+

~2.70+)

560.0*560.0020.0*020.02

/1+（

约为1.60～3.80

截面数据和面板数据分析题目

042015045 唐正东

1．你能分别举出三个时间序列数据、截面数据、混合数据、虚拟变量数据的实际例子吗？答：（1）时间序列数据如：每年的国民生产总值、各年商品的零售总额、各年的年均人口增长数、年出口额、年进口额等等；

（2）截面数据如：复旦大学2002年各位教师年收入、2002年各省总产值、2002年5月上海市各区罪案发生率等等；

（3）混合数据如：1990年~2000年各省的人均收入、消费支出、教育投入等等；

（4）虚拟变量数据如：婚否，身高是否大于170厘米，受教育年数是否达到10年等等。

2．判断下列说法是否正确，并简要说明为什么。

（1）当异方差出现时，最小二乘估计是有偏的和不具有最小方差特性；答：不正确。这个时候估计式是无偏的，但是不具有最小方差性。（2）当异方差出现时，常用的t 和F 检验失效；

答：正确。由于方差不是常数而是变数，这时一般意义上t 比值的分布是未知的，但肯定不再遵从t-分布，使得t 检验失效；同理，在异方差条件下，F 比值也不再是遵从F-分布，F 检验也失效。

（3）异方差情况下，通常的OLS 估计一定高估了估计量的标准差；答：一般是低估了其标准差。

（4）如果OLS 回归的残差表现出系统性，则说明数据中有异方差性；答：是，但同时也要考虑自相关性的存在。

（5）如果回归模型中遗漏一个重要变量，则OLS 残差必定表现出明显的趋势；

答：是。尤其是在经济、金融数据中，这种异方差性的现象更为突

出。

（6）如果模型遗漏一个非恒定方差的回归元，则残差将会呈异方差。

答：一般来说是的，但是有时候不见得会表现出来或者说不一定能够观察得到。

赵忠辉（052015126）

1、一个研究者将估计包含一个滞后变量得下列计量经济模型：

12233411223341t t t t t

t t t t t

y x x y y x x y ββββμγγγγν=-?-++++=++++

式中t μ和t ν为独立分布（iid ）的扰动项。

这些模型是否有同样的下列值：（a ）残差平方和（RSS ）；（b ）2R ；（c ）经调整的2R ？请解释你对上述每一种情况给出的答案。

2、为什么经济学家希望从回归方程中剔除不显著的变量？

3、（a ）为什么有必要假定回归模型的扰动项是正态分布的？

(b) 实际运用模型时，应该怎样解决残差并不是正态分布这一问题？范惠众 052015024 一

请

问

对

于

一

个

计

量

模

型

，

例

如

：

要检验单个变量参数的统计显著情况我们可以使用t 统计量，要检验多个变量参数的联合统计显著情况，我们可以使用F 统计量。那么请问：

1， F 统计量可以用来检验单个变量参数的统计显著情况吗？如果可以，请问这个检验和t

统计量有区别吗？（答案：F 统计量可以用来检验单个变量参数的统计显著情况。并且F 统计量和t 统计量的检验是没有差别的，检验单一变量之排除性的F 统计量等于对应的t 统计量的平方。）

2，如果F 统计量可以用来检验单个变量的参数的统计显著情况，那么请问为什么我们还需

要t 统计检验？（答案：首先：t 统计量相对F 统计量比较容易获得。其次，F 统计量之所以被需要是因为其检验联合统计显著的功能。因为F 统计量是t 统计量的平方，所以t 统计量还可以方便的用于单侧对立假设的检验。综上，F 统计量的比较优势是检验联合统计显著，虽然也可用于检验单个统计量的显著性，但是操作不方便。单个统计量的显著性检验主要使用t 统计量。）

二，对于模型交互项参数的解释：

一个棒球队员的收入salary可能取决于如下因素：

Year投身棒球运动的年数

Gamesyr参加正规棒球比赛以来的年数

……

Black表示人种为黑人。

Hispan表示西班牙人。

Perblack表示黑人人口在一个城市中的比例。

Perchisp表示一个城市中西班牙人口所占的比例。

对330个大型俱乐部的棒球运动员估计了如下模型：

Log(salary)=a1+a2*years+a3*gamesyr+a4*black+a5*hispan+a6*black*percblack+a7*hispan*per chisp+u

其中回归结果是：a4=-0.198（0.125）、a5=-0.190（0.153）、a6=0.0125（0.0050）、a7=0.020(0.0098) n=330 R平方=0.638

请问从上面的回归结果对交互项进行分析可以分析出一个城市中黑人或西班牙人比例对黑人或西班牙人球员的薪水的影响的什么结论？你将如何解释这个结论？能否简单的人为存在对黑人或者西班牙人的歧视？

（答：对交互项进行分析：首先，保持perchisp不变的情况下，black的系数为-0.198，这确实意味着如果一名黑人运动员在一个没有黑人的城市里——perblack=0，那么这个黑人比一个条件相当的白人少挣约19.8%。随着perblack的提高，因为hispan不变，所以相当于白人比例在减少，黑人的薪水相对白人的薪水逐渐增加。在一个拥有10%的黑人城市里，黑人的log（salary）要比白人小-0.198+0.0125*10=-0.073，甚至当黑人比例高到20%时黑人挣得比白人还多。同样的分析可以对hispan适用。

但是这不能简单就得出存在对黑人和西班牙人存在歧视，因为在那些少数民族聚居的城市里，白人挣得比黑人西班牙人还要少。城市种族构成对薪水的重要性可能源于运动员的偏好：可能最好的黑人运动员不成比例的居住在那些黑人较多的城市，而最好的西班牙籍运动员则倾向于居住在那些西班牙人较多的城市里。）