文档库 最新最全的文档下载
当前位置:文档库 › 计量经济学5-一元线性回归:假设检验和置信区间

计量经济学5-一元线性回归:假设检验和置信区间

计量经济学5-一元线性回归:假设检验和置信区间
计量经济学5-一元线性回归:假设检验和置信区间

假设检验和置信区间
Chapter 5
Regression with a Single Regressor: Hypothesis Tests and Confidence Intervals 一元线性回归:假设检验和置信区间
概述 ? 当知道 OLS 估计量的样本分布,就可以对β1 进行假设检 验,以及求取其置信区间。本章内容将涉及以下问题: Also, we will cover some loose ends about regression: ? 当 X 是二元回归变量情形 ? 异方差(Heteroskedasticity)和同方差( homoskedasticity) ? OLS 估计量的有效性 ? t 统计量在假设检验中的应用
2
回顾
根据样本数据了解总体回归线斜率的有关信息的步骤如 下: 1. 界定关注研究对象。 2. 在一定假设为前提,得到估计量的样本分布。 3. 估计样本分布的离散程度,即计算出 OLS 估计量的标 准误差(SE)。 ? 4. 用估计量 β1 得到点估计,结合标准误差进行假设检验 和构造置信区间。
研究对象:β1
Yi = β0 + β1Xi + ui, i = 1,…, n
β1 = ΔY/ΔX
最小二乘假设: 1. E(u|X = x) = 0. 2. (Xi,Yi), i =1,…,n, 为 i.i.d. 3. 不大可能存在异常值 (E(X4) < ∞, E(Y4) < ∞. ? β1 的抽样分布为:
? 当上述最小二乘假设成立时,若 n 为大样本, β1 近似服从:
? β1 ~ N ? β1 ,
? ?
σ v2 ? , 其中 vi = (Xi – μX)ui 4 ? nσ X ?
4
3
一般方法:计算 t 统计量,计算 p 值(或者与 N(0,1)的临界值
关于某个回归系数的检验
要根据样本数据检验一个关于斜率真值的假设,例如β1 = 0,步骤为: 原假设对应双边备择假设为: H0: β1 = β1,0 ;. H1: β1 ≠ β1,0 原假设含义为假设总体斜率β1 的真值为某个具体值β1,0 原假设对应单边备择假设为: H0: β1 = β1,0 ; H1: β1 < β1,0
进行比较) ? 一般形式: t=
估计量 -假设值 估计量的标准误差
? 对于检验 Y 的均值 : ? 对于检验 β1,
t=
Y ? μY ,0 sY / n
? β ? β1,0 t= 1 , ? SE ( β1 )
1
? ? ? 其中 SE( β1 )为 β1 的标准误差σ β? 的估计值,是 β1 抽样分布
的标准差。
5 6
1

? SE ( β )的计算公式(见附录5.1)
1
根据4.21式
? 回顾:大样本条件下, β1 的方差为:
? var( β1 ) =
var[( X i ? μ x )ui ] σ2 = v4 , 其中 vi = (Xi – μX)ui. 2 2 nσ X n (σ X ) 自由度调整,
2 v 2 X
1 n 2 ? ∑ vi 1 n ? 2 i =1 ?2 ? ? × σ β? = , 其中 vi = ( X i ? X )ui . 2 1 n ?1 n 2? ? n ∑( X i ? X ) ? ? i =1 ? ? ? ? SE( β ) = σ 2 = β 的标准误差
1 ? β1 1
?2 σ β? =
1
1 σ 的估计量 1 × = × 5.4 2 n ( σ 的估计量) 2 n ? 1 n ? ( X i ? X )2 ? ?n ∑ ? i =1 ? ? ? 其中 vi = ( X i ? X )ui .
1 n 2 ? ∑ vi n ? 2 i =1
修正向下偏差
? 上式中,分子用来估计 var(v),分母用来估计 var(X)。 ? 为何自由度修正使用 n – 2? 这是由于式中需要估计两个 系数 (即β0 和 β1).
? ? SE( β1 ) 可以由软件很方便的到。
7
8
总结,检验H0: β1 = β1,0 v. H1: β1 ≠ β1,0,
? 计算 t-统计量
OLS regression: STATA output
regress testscr str, robust Regression with robust standard errors Number of obs F( 1, 418) Prob > F R-squared Root MSE = = = = = 420 19.26 0.0000 0.0512 18.581
? ? β ? β1,0 β1 ? β1,0 = t= 1 ? SE ( β1 ) ?2 σ β?
1
? 如果|t| > 1.96,则在 5%显著水平下拒绝原假设。 ? 如果 p 值< 0.05,则在 5%显著水平下拒绝原假设。 ? n = 50,便可视为近似效果很好。
------------------------------------------------------------------------| Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 -------------------------------------------------------------------------
TestScore = 698.9 – 2.28×STR
? SE( β 0 ) = 10.4
9
? SE( β1 ) = 0.52
10
例:测试成绩、师生比
TestScore = 698.9 – 2.28×STR, (10.4) (0.52)
R2=0.051 SER=18.6
另一种方法:计算P值
另一方方法是计算与t act = -4.38 对应的p值。 这一概率为图中所示标准正态分布的尾部面积。 其值非常小,接近0.000 01,或0.001%。 即若原假设β classsize = 0为真,则得到距离原假设的 ? 值至少有实际观测值距离原假设的值一样远的β
1
? ? SE( β1 ) = 0.52 SE( β 0 ) = 10.4 ? ?β β ?2.28 ? 0 1,0 = = –4.38 t 统计量检验 β1,0 = 0 = 1 ? 0.52 SE ( β1 )
检验班级规模对测试成绩没有影响的假设(β1,0 = 0), 5%显著水平下,双边检验的临界值为1.96 1 显著水平下,双边检验的临界值为2.58, ? 1% t act = 4.38 > 2.58, 故在5%、 显著水平下拒绝原假设。
11
的概率非常小,小于0.001%。由于这件事几乎不可能 发生,所以得出原假设错误的结论是合理的。
12
2

β1的置信区间
95%置信区间有两种等价的定义: ? 一是在 5%显著水平下利用双边假设检验不能拒绝的取值 集合。 ? 二是以 95%的概率包含β1 真值的区间。即抽取的可能样 本中,有 95%的样本构造的置信区间包含了β1 的真值。 由于在 95%的所有样本置信区间中包含了真值,故称为 95%的置信水平。 β1 的 95%置信区间为: ? ? ? ? β1 的 95%置信区间= [ β -1.96×SE( β ), β +1.96×SE( β )]
1 1 1 1
13
测试成绩与师生比置信区间举例
TestScore = 698.9 – 2.28×STR
? SE( β 0 ) = 10.4
? SE( β1 ) = 0.52
β1 的 95% 置信区间为:
? ? { β1 ± 1.96×SE( β1 )} = {–2.28 ± 1.96×0.52}
= (–3.30, –1.26)
以下两种说法是等价的:
? β1=0 没有落在 β1 的 95% 置信区间内。 ? 在 5%显著水平下,拒绝原假设 β1 = 0。
14
举例
regress testscr str, robust Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------| Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------str | -2.279808 .5194892 -4.38 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 -------------------------------------------------------------------------
X为二元变量时的回归
回归变量为二元情况: ? X = 1 班级规模小, = 0 班级规模大 ? X = 1 女性, = 0 男性 ? X = 1 处理, = 0 未处理 二元变量又称为指示变量(indicator variable)或虚拟变量 (dummy variable). 如果回归变量为二元变量,则β1 的含义不同。
so:
TestScore = 698.9 – 2.28×STR, , R2 = .05, SER = 18.6
(10.4) (0.52) t (β1 = 0) = –4.38, p-value = 0.000 (双边)
β1 的 95% 双边置信区间为 (–3.30, –1.26)
15 16
二元回归变量系数的解释
Yi = β0 + β1Xi + ui, 其中 X 是二元变量 (Xi = 0 或 1): 当 Xi = 0, Yi = β0 + ui ? Yi 的均值为 β0 ? 即 E(Yi|Xi=0) = β0 当 Xi = 1, Yi = β0 + β1 + ui ? Yi 的均值为 β0 + β1 ? 即 E(Yi|Xi=1) = β0 + β1
例:
?1 如果 STRi ≤ 20 令 Di = ? ?0 如果 STRi > 20
测试成绩对上面定义的 D 的 OLS 回归为:
TestScore = 650.0 + 7.4×D (1.3) (1.8)
lass Size mall (STR > 20) rge (STR ≥ 20) 均值差: 标准误差:
17
Average score (Y ) 657.4 650.0
Std. dev. (sY) 19.4 17.9
N 238 182
Ysmall ? Ylarge = 657.4 – 650.0 = 7.4
SE =
因此: β1 = E(Yi|Xi=1) – E(Yi|Xi=0)
=总体均值之差
ss2 sl2 19.4 2 17.9 2 + = = 1.8 + 238 182 ns nl
18
3

二元回归变量举例
? ? ? ? ? ? ? ? ? ? ? ? ?
异方差和同方差
? 什么是异方差和同方差? ? 在实践中的意义?
Number of obs F( 1, 418) Prob > F R-squared Root MSE = 420 = 16.34 = 0.0001 = 0.0369 = 18.721
. gen d = (str<20) . reg testscr d, r Linear regression
异方差和同方差定义: 对于任意 i = 1, 2, n ,给定 X i 时 μi 的条件分布的方差
var(ui | X i = x ) 为常数,且不依赖于 x 时,误差项 μi 是同方
-----------------------------------------------------------------------------| Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------d | 7.37241 1.823578 4.04 0.000 3.787884 10.95694 _cons | 649.9788 1.322892 491.33 0.000 647.3785 652.5792
差的,否则,误差项是异方差的。
19
20
实例:在二元回归变量例子中
? 异方差情况下标准误差为: SE =
同方差举例
s s + ns nl
1 1 + ns nl
2 s
2 l
? 同方差情况下标准误差为: SE = s p 其中 s 2 = p
( ns ? 1) ss2 + ( nl ? 1) sl2 (SW, Sect 3.6) ns + nl ? 2
? E(u|X=x) = 0 (u satisfies Least Squares Assumption #1) ? u 的方差大小与 x 无关 ,u 的方差为常数。
21 22
sp = “σ2 的联合估计” when σ l2 = σ s2 ? Equal group variances = homoskedasticity ? Unequal group variances = heteroskedasticity
异方差举例
一年教育的经济价值:同方差还是异方差?
? E(u|X=x) = 0 (u satisfies Least Squares Assumption #1) ? u 的方差大小与 x 有关.班级规模变大时 u 的方差越大。
23 24
4

回顾:OLS的三个基本假设中有关于异方差 还是同方差的信息么?
OLS 的三个基本假设: 1. E(u|X = x) = 0 2. (Xi,Yi), i =1,…,n, are i.i.d. 3. Large outliers are rare
并没有限制是异方差还是同方差。 不管误差同方差还是异方差,OLS估计量都是无偏、 一致和近似正态分布的。
Heteroskedastic or homoskedastic?
25 26
如果满足三个假设,且误差是同方差会如何?
? 在满足三个 OLS 假设且误差同方差,则在 X 1 , X 2 ,
, X n 条件
同方差适用标准误差:
1 n 2 ? ∑ ui n ? 2 i =1
? ? 下,OLS 估计量 β 和 β1 在 Y1 , Y2 , , Yn 的所有线性类估计量中是最
有效的并且是无偏的。这一结论称为 Gauss-Markov 定理。
? ? 同方差情况下, β1 的方差和 OLS 标准差可以简化。
2 ? 如果 var(ui|Xi=x) = σ u , 则
? SE( β1 ) =
1 . × n 1 n ∑ ( X i ? X )2 n i =1
5.22
var[( X i ? μ x )ui ] E [( X i ? μ x ) 2 ui2 ] ? var( β1 ) = = 2 2 n (σ X ) 2 n (σ X ) 2
=
? 许多统计软件把同方差适用标准误差作为默认设置,必 须由使用者指定异方差稳健标准误差选项。
σ u2 2 nσ X
? 上式表明:var( β1 )与 var(X)是相反关系:即 X 变化范围越大,可 ? 的信息 提供更多关于 β
1
27
28
用STATA计算异方差稳健标准误差
regress testscr str, robust
Regression with robust standard errors Number of obs = 420 F( 1, 418) = 19.26 Prob > F = 0.0000 R-squared = 0.0512 Root MSE = 18.581 ------------------------------------------------------------------------| Robust testscr | Coef. Std. Err. t P>|t| [95% Conf. Interval] --------+---------------------------------------------------------------str | -2.279808 .5194892 -4.39 0.000 -3.300945 -1.258671 _cons | 698.933 10.36436 67.44 0.000 678.5602 719.3057 -------------------------------------------------------------------------
同方差-异方差几种情况
? 如果误差可能为同方差也可能为异方差,那么,使用异 方差稳健标准误差稳妥。 ? 如果误差为异方差,而使用了同方差适用公式计算标准 误差,其结果将是错误的,这样计算的结果不具有一致 性。 ? 当 n 足够大的时候,二者计算出的结果差别不大。
?
?
如果使用 “ robust” 命令, STATA 程序将计算出异方差稳 健标准误差。否则,STATA 程序将按同方差计算出标准 准误差。
29
因此,优先考虑使用异方差稳健标准误差。
30
5

普通最小二乘的理论基础
OLS 估计量是无偏的、一致的、具有与 n 成反比的方 差,且当样本容量较大时服从正态分布。 使用 OLS 的一个明显的好处是,它是一个被广泛使用的 回归分析工具,易于理解和进行交流。
OLS估计量是否是最好的选择呢?
思考以下问题: ? 上述说法是否是使用 OLS 的很好理由?是否存在其他估 计量有可能得到更小的方差呢? ? 此外,对于 t 分布将会意味着什么呢? 为回答上述问题,需要在已有的三个假设的基础上,增添更 强的假设。
31
32
对最小二乘假设的扩展
在原有的三个假设的基础上,增加两个新的假设: 1. E(u|X = x) = 0. 2. (Xi,Yi), i =1,…,n, are i.i.d. 3. Large outliers are rare (E(Y4) < ∞, E(X4) < ∞). 4. u is homoskedastic 5. u is distributed N(0,σ2) ? 假设 4 和 5 更加严格,在应用时需要更加谨慎。
The Gauss-Markov 定理
? 若 3 个 OLS 假设成立,且误差同方差,则 OLS 估计量 β1 是
最佳(最有效的)线性无偏估计量(BLUE).
若满足Gauss ? Markov条件,则给定X 1,X 2, ,X n , ? OLS 估计量β 在β 的所有线性条件无偏估计量中的条件方差最小。
1 1
33
34
The Gauss-Markov 定理(见附录,p137)
? ? β1 是线性估计量,即它是 Y1,…, Yn 的线性函数, ? ? β1 – β1 =
Gauss-Markov 定理的局限性
1. 其条件在实际应用中可能不成立。尤其是同方差条件未 必能满足。 2. 即使定理条件成立,但也存在着其他非线性的条件无偏 估计量,在某些条件下,这些估计量比 OLS 估计量更有 效。存在几个异常值情况可以考虑使用最小绝对变差估计 量(least absolute deviations estimator, LAD)。
min b0 ,b1 ∑ Yi ? (b0 + b1 X i )
i =1 n
∑ ( X i ? X )ui
i =1 n
n
∑( X
i =1
=
i
? X )2
1 n ∑ wi ui , n i =1
其中 wi =
(Xi ? X ) 1 n ∑ ( X i ? X )2 n i =1
35
36
6

样本容量较小时t统计量在回归中的应用
1. 2. 3. 4. 5. E(u|X = x) = 0. (Xi,Yi), i =1,…,n, are i.i.d. Large outliers are rare (E(Y4) < ∞, E(X4) < ∞). u is homoskedastic u is distributed N(0,σ2)
? 在假设 1-5 成立情况下, β1 抽样分布:
? β1 – β1 =
∑( X
i =1 n i =1
n
i
? X )ui
i
∑( X
? X )2
=
(X ? X ) 1 n . ∑ wi ui , 其中 wi = 1 n i n i =1 ( X i ? X )2 ∑ n i =1
? ? 1 ? n 2? 2? ∑ wi ? σ u ? n 2 ? i =1 ? ? ?
(*)
? β1 – β1 ~ N ? 0,
若以上五个假设均满足,则
? ? ? β 0 和 β1 都是服从正态分布。
? t 统计量服从自由度为 n-2 的学生 t 分布。
37 38
在假设 1-5 成立情况下,t 统计量服从自由度为 n-2 的学生分 布 ? 为何自由度为 n – 2? 因为估计了 2 个参数, β0 和 β1 ? 对于 n < 30, t 统计量临界值超过 N(0,1)的临界值 ? 对于 n > 50 the difference in tn–2 和 N(0,1)分布的临界值之 间的区别可以忽略。
degrees of freedom 10 20 30 60 ∞ 5% t-distribution critical value 2.23 2.09 2.04 2.00 1.96
实践中的应用
? If n < 50 and you really believe that, for your application, u is homoskedastic and normally distributed, then use the tn–2 instead of the N(0,1) critical values for hypothesis tests and confidence intervals. ? In most econometric applications, there is no reason to believe that u is homoskedastic and normal – usually, there is good reason to believe that neither assumption holds. ? Fortunately, in modern applications, n > 50, so we can rely on the large-n results presented earlier, based on the CLT, to perform hypothesis tests and construct confidence intervals using the large-n normal approximation.
39
40
Exercises 5.1
(a)The 95% confidence interval for β1 is {?5.82 ± 1.96 × 2.21}, that is ?10.152 ≤ β ≤ ?1.4884.
1
(b) Calculate the t-statistic:
t act = ? SE( β 1) ? β1? 0 = ?5.82 = ?2.6335. 2.21
The p-value for the test H1 : β1 ≠ 0 is
H0 : β1 = 0
vs.
p-value = 2Φ(?|t act |) = 2Φ (?2.6335) = 2 × 0.0042 = 0.0084
The p-value is less than 0.01, so we can reject the null hypothesis at the 5% significance level, and also at the 1% significance level.
41 42
7

(c)The t-statistic is
t act = ? β 1 ? (?5.6) 0.22 = = 0.10 ? SE( β 1) 2.21
H0 : β1 = ?5.6
The p-value for the test H : β ≠ ?5.6 is
1 1
vs.
(d) The 99% confidence interval for β0 is
{520.4 ± 2.58 × 20.4}, that is,
467.7 ≤ β 0 ≤ 573.0.
p-value = 2Φ (?|t |) = 2Φ (?0.10) = 0.92
act
The p-value is larger than 0.10, so we cannot reject the null hypothesis at the 10%, 5% or 1% significance level. Because β = ?5.6 is not rejected at the 5% level, this value is contained in the 95% confidence interval.
1
43
44
实证练习1
? ? ? ? ? ? ? ? ? ? ? ? ?
reg ahe age, r Linear regression
Number of obs = 7986 F( 1, 7984) = 187.92 Prob > F = 0.0000 R-squared = 0.0223 Root MSE = 8.6612 -----------------------------------------------------------------------------| Robust ahe | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------age | .4519313 .0329673 13.71 0.000 .3873067 .5165559 _cons | 3.324185 .9656963 3.44 0.001 1.431168 5.217201 ------------------------------------------------------------------------------
45
8

计量经济学·多元线性回归模型

计量经济学·多元线性回归模型

2006年 217656.6 77597.2 63376.86 2007年 268019.4 93563.6 73300.1 2008年 316751.7 100394.94 79526.53 2009年 345629.2 82029.69 68618.37 2010年 408903 107022.84 94699.3 2011年 484123.5 123240.56 113161.39 2012年 534123 129359.3 114801 2013年 588018.8 137131.4 121037.5 2014年 636138.7 143911.66 120422.84 数据来源:国家统计局 三、模型的检验及结果的解释、评价 (一)OLS 法的检验 相关系数: Y X1 X2 Y 1 0.9799919175967026 0.98352422945 0628 X1 0.97999191759 67026 1 0.99756527944 46187 X2 0.983524229450628 0.99756527944 46187 1 线性图: 100,000 200,000300,000400,000500,000600,000700,000Y X1 X2 估计参数: Dependent Variable: Y

Method: Least Squares Date: 12/14/15 Time: 14:47 Sample: 1985 2014 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. C 3775.319359 326024 8769.9280467 183 0.4304846447 102545 0.67026006 64360232 X1 -0.91272630 85551189 1.9385186318 83585 -0.470837005 9194414 0.64153894 75333828 X2 5.522785592 51161 2.2548570541 42605 2.4492841275 08302 0.02108703 0146243 R-squared 0.967586049 4429319 Mean dependent var 173871.823 3333334 Adjusted R-squared 0.965185016 0683343 S.D. dependent var 187698.441 4104575 S.E. of regression 35022.22758 863741 Akaike info criterion 23.8599929 764685 Sum squared resid 3311702348 2.29852 Schwarz criterion 24.0001127 1463471 Log likelihood -354.899894 6470274 Hannan-Quinn criter. 23.9048184 8460881 F-statistic 402.9873385 683694 Durbin-Watson stat 0.54328498 36158895 Prob(F-statistic) 7.850214650 723685e-21 统计检验: (1)拟合优度:从上表可以得到R2=0.9675860494429319,修正后的可决系数R2=0.9651850160683343,这说明模型对样本的拟合很好。 (2)F检验:针对H0: (二)多重共线性的检验及修正 相关系数矩阵: X1 X2

计量经济学课后习题

计量经济学课后习题 1.什么是计量经济学?计量经济学方法与一般经济数学方法有什么区别? 答:计量经济学是经济学的一个分支学科,是以揭示经济活动中客观存在的数量关系为内容的分支学科,是由经济学、统计学和数学三者结合而成的交叉学科。 计量经济学方法揭示经济活动中各个因素之间的定量关系,用随机性的数学方程加以描述;一般经济数学方法揭示经济活动中各个因素之间的理论关系,用确定性的数学方程加以描述。 4.建立与应用计量经济学模型的主要步骤有哪些? 答:建立与应用计量经济学模型的主要步骤如下:(1)设定理论模型,包括选择模型所包含的变量,确定变量之间的数学关系和拟定模型中待估参数的数值范围;(2)收集样本数据,要考虑样本数据的完整性、准确性、可比性和—致性;(3)估计模型参数;(4)检验模型,包括经济意义检验、统计检验、计量经济学检验和模型预测检验。 5.模型的检验包括几个方面?其具体含义是什么? 答:模型的检验主要包括:经济意义检验、统计检验、计量经济学检验、模型的预测检验。在经济意义检验中,需要检验模型是否符合经济意义,检验求得的参数估计值的符号与大小是否与根据人们的经验和经济理论所拟订的期望值相符合;在统计检验中,需要检验模型参数估计值的可靠性,即检验模型的统计学性质;在计量经济学检验中,需要检验模型的计量经济学性质,包括随机扰动项的序列相关检验、异方差性检验、解释变量的多重共线性检验等;模型的预测检验主要检验模型参数估计量的稳定性以及对样本容量变化时的灵敏度,以确定所建立的模型是否可以用于样本观测值以外的范围。 4.如何缩小置信区间?(P46) 由上式可以看出(1).增大样本容量。样本容量变大,可使样本参数估计量的标准差减小;同时,在同样置信水平下,n越大,t分布表中的临界值越小。(2)提高模型的拟合优度。因为样本参数估计量的标准差和残差平方和呈正比,模型的拟合优度越高,残差平方和应越小。 1.为什么计量经济学模型的理论方程中必须包含随机干扰项? (经典模型中产生随机误差的原因) 答:计量经济学模型考察的是具有因果关系的随机变量间的具体联系方式。由于是随机变量,意味着影响被解释变量的因素是复杂的,除了解释变量的影响外,还有其他无法在模型中独立列出的各种因素的影响。这样,理论模型中就必须使用一个称为随机干扰项的变量宋代表所有这些无法在模型中独立表示出来的影响因素,以保证模型在理论上的科学性。 3.一元线性回归模型的基本假设主要有哪些? 违背基本假设的模型是否不可以估计? 答:线性回归模型的基本假设有两大类:一类是关于随机干扰项的,包括零均值,同方差,不序列相关,满足正态分布等假设;另一类是关于解释变量的,主要有:解释变量是非随机的,若是

计量经济学习题及答案

第一章绪论 一、填空题: 1.计量经济学是以揭示经济活动中客观存在的__________为内容的分支学科,挪威经济学家弗里希,将计量经济学定义为__________、__________、__________三者的结合。 2.数理经济模型揭示经济活动中各个因素之间的__________关系,用__________性的数学方程加以描述,计量经济模型揭示经济活动中各因素之间__________的关系,用__________性的数学方程加以描述。 3.经济数学模型是用__________描述经济活动。 4.计量经济学根据研究对象和内容侧重面不同,可以分为__________计量经济学和__________计量经济学。 5.计量经济学模型包括__________和__________两大类。 6.建模过程中理论模型的设计主要包括三部分工作,即__________、____________________、____________________。 7.确定理论模型中所包含的变量,主要指确定__________。 8.可以作为解释变量的几类变量有__________变量、__________变量、__________变量和__________变量。 9.选择模型数学形式的主要依据是__________。 10.研究经济问题时,一般要处理三种类型的数据:__________数据、__________数据和__________数据。 11.样本数据的质量包括四个方面__________、__________、__________、__________。 12.模型参数的估计包括__________、__________和软件的应用等内容。 13.计量经济学模型用于预测前必须通过的检验分别是__________检验、__________检验、__________检验和__________检验。

计量经济学简单线性回归实验报告精编

实验报告 1. 实验目的随着中国经济的发展,居民的常住收入水平不断提高,粮食销售量也不断增长。研究粮食年销售量与人均收入之间的关系,对于探讨粮食年销售量的增长的规律性有重要的意义。 2. 模型设定 为了分析粮食年销售量与人均收入之间的关系,选择“粮食年销售量” 为被解释变量(用Y 表示),选择“人均收入”为解释变量(用X 表 示)。本次实验报告数据取自某市从1974 年到1987 年的数据(教材书上101页表3.11),数据如下图所示:

1粮食年销售量Y/万吨人均收入X/ rF1974[ 9& 45153.2 1975100.7190 pl1976102.8240.3 1977133. 95301.12 [61978140.13361 71979143.11420 8—1980146.15491.76「91981144.6501 101982148. 94529.2 1 11-1983158.55552. 72匸1984169. 68771.16 131985P 162.1481L8 14二1986170. 09988.43 1519871F& 691094.65为分析粮食年销售量与人均收入的关系,做下图所谓的散点图 从散点图可以看出粮食年销售量与人均收入大体呈现为线性关 系,可以建立如下简单现行回归模型: 3?估计参数

Y t = ■? 1 2 X t ——I t 假定所建模型及其中的随机扰动项叫满足各项古典假定,可以 用OLS法估计其参数。 通过利用EViews对以上数据作简单线性回归分析,得出回归结果如下表所示: Dependent Variable Y Method: Least Squares Date 10/15/11 Time 14 49 Sample- 1 14 Included observations: 14 Variable Coefficient Std Error t-Statistic Prob C99 61349 6 431242 15 489000 0000 X0.0814700.010738 7.5071190.0000 R-squared0 827493Mean dependent var142 7129 Adjusted R-squared0 813123S.D. dependent var26.09805 S E of regression11 28200Akaike info criterion7 915858 Sum squared resid1527 403Schwarz criterion7 907152 Log likelihood-52.71101F-statisti c5756437 Durbin-V/atson stat0 638969Prob(尸-statistic)0 000006 可用规范的形式将参数估计和检验的结果写为: A Y t =99.61349+0.08147 X t (6.431242)(0.10738) t= (15.48900) (7.587119) R2=0.827498 F=57.56437 n=14 4?模型检验 (1).经济意义检验 A A 所估计的参数1=99.61349, 1 2=0.08147,说明人均收入每增加 1元,平均说来可导致粮食年销售量提高0.08147元。这与经济学中

所有计量经济学检验方法(全)

计量经济学所有检验方法 一、拟合优度检验 可决系数 TSS RSS TSS ESS R - ==12 TSS 为总离差平方和,ESS 为回归平方和,RSS 为残差平方和 该统计量用来测量样本回归线对样本观测值的拟合优度。 该统计量越接近于1,模型的拟合优度越高。 调整的可决系数)1/() 1/(12---- =n TSS k n RSS R 其中:n-k-1为残差平方和的自由度,n-1为总体平方 和的自由度。将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响。 二、方程的显著性检验(F 检验) 方程的显著性检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出推断。 原假设与备择假设:H 0:β1=β2=β3=…βk =0 H 1: βj 不全为0 统计量 )1/(/--= k n RSS k ESS F 服从自由度为(k , n-k-1)的F 分布,给定显著性水平α,可得到临 界值F α(k,n-k-1),由样本求出统计量F 的数值,通过F>F α(k,n-k-1)或F ≤F α(k,n-k-1)来拒绝或接受原假设H 0,以判定原方程总体上的线性关系是否显著成立。 三、变量的显著性检验(t 检验) 对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。 原假设与备择假设:H0:βi =0 (i=1,2…k );H1:βi ≠0 给定显著性水平α,可得到临界值t α/2(n-k-1),由样本求出统计量t 的数值,通过 |t|> t α/2(n-k-1) 或 |t|≤t α/2(n-k-1) 来拒绝或接受原假设H0,从而判定对应的解释变量是否应包括在模型中。 四、参数的置信区间 参数的置信区间用来考察:在一次抽样中所估计的参数值离参数的真实值有多“近”。 统计量 )1(~1??? ----'--= k n t k n c S t ii i i i i i e e βββββ 在(1-α)的置信水平下βi 的置信区间是 ( , ) ββααββ i i t s t s i i -?+?2 2 ,其中,t α/2为显著性 水平为α、自由度为n-k-1的临界值。 五、异方差检验 1. 帕克(Park)检验与戈里瑟(Gleiser)检验 试建立方程: i ji i X f e ε+=)(~2 或 i ji i X f e ε+=)(|~|

Eviews计量经济学三大检验(精品文档)_共14页

作业1 我们有1978-2007年我国财政收入,国内生产总值,财政支出和商品零售价格指数的年度数据。请用Eview 进行回归分析。 (1(根据回归结果分析模型的经济意义(包含模型的显著性,拟合优度,系数 的显著性,系数的经济意义) 建立模型,做OLS 估计,得结果图一,列表如下: 4 3283175.57898859.0003271.0558.6399X X X Y ++--=∧ ) 0636.20)(065848.0)(012559.0)(836.2132(SE ) 882456.2)(65061.13)(260476.0-)(000492.3-(t = 997046.02=R 996705.02=R 845 .2924=F 模型整体显著性较高(F 检验十分显著),可决系数2 R 和调整的可决系数较大,即样本回归方程对样本观测值拟合较好。t 检验显示2X 的系数不显著(p 值>0.05,不能拒绝β=0的原假设),3X 和4X 的系数显著(p 值<0.05,拒绝β=0的原假设)。 从模型的经济意义来看,财政支出、商品零售价格指数与财政收入成正相关,国内生产总值与财政收入成负相关,不符合客观经济规律,可能与模型变量的选取有关。考虑对模型进行对数变换,结果为图二。 4 32ln 128427.1ln 631090.0ln 448496.0946444.6ln X X X Y +++-=∧ ) 610249.0)(160929.0)(141418.0)(853146.2(SE

) 849127.1)(921549.3)(171412.3)(434662.2(t -= 987673.02=R 986251.02=R 3969 .694=F 对数变换后模型整体显著性较高(F 检验十分显著,p 值=0.00<<0.05), 可决系数2 R 和调整的可决系数略有下降,模型可解释98.63%的因变量变化。t 检验显示4ln X 的系数不显著(p 值=0.0758>0.05,不能拒绝β=0的原假设),2ln X 和3ln X 的系数显著(p 值<0.05,拒绝β=0的原假设)。 从模型的经济意义来看,国内生产总值、财政支出、商品零售价格指数与财政收入均成正相关,符合客观经济规律。在其他条件不变的情况下,国内生产总值每增加1%,财政收入平均增加0.448496%;在其他条件不变的情况下,财政支出每增加1%,财政收入平均增加0.631090%。 (2(分别用F 检验,Wald, LR, LM 检验检验: “财政收入和商品零售价格指数 的边际效应之合为1”是否成立。 (要求:清将必要的Eviews 输出结果放在作业中,并做必要的解释)Wald 检验: 在限制条件中输入c(3)+c(4)=1,得出的结果图三,t 检验F 检验卡方检验p 值均小于0.05,拒绝原假设,即认为财政支出与商品零售价格指数之和为一不成立。 F 检验: 受限条件为,回归模型为143=+ββ4433221X X X y ββββ+++=∧ 可得受限模型为) (4332214--X X X X y βββ++=∧ 对受限模型进行OLS 估计,结果见表4.可得,而无约束14599615=R RSS 模型的,又,代入F 检验统计量: 11076606=U RSS 4,30,1===k n q

计量经济学分析计算题Word版

计量经济学分析计算题(每小题10分) 1.下表为日本的汇率与汽车出口数量数据, X:年均汇率(日元/美元) Y:汽车出口数量(万辆) 问题:(1)画出X 与Y 关系的散点图。 (2)计算X 与Y 的相关系数。其中X 129.3= ,Y 554.2=,2 X X 4432.1∑ (-)=,2 Y Y 68113.6∑(-)=,()()X X Y Y ∑--=16195.4 (3)采用直线回归方程拟和出的模型为 ?81.72 3.65Y X =+ t 值 1.2427 7.2797 R 2=0.8688 F=52.99 解释参数的经济意义。 2.已知一模型的最小二乘的回归结果如下: i i ?Y =101.4-4.78X 标准差 (45.2) (1.53) n=30 R 2=0.31 其中,Y :政府债券价格(百美元),X :利率(%)。 回答以下问题:(1)系数的符号是否正确,并说明理由;(2)为什么左边是i ?Y 而不是i Y ; (3)在此模型中是否漏了误差项i u ;(4)该模型参数的经济意义 是什么。 3.估计消费函数模型i i i C =Y u αβ++得 i i ?C =150.81Y + t 值 (13.1)(18.7) n=19 R 2=0.81 其中,C :消费(元) Y :收入(元) 已知0.025(19) 2.0930t =,0.05(19) 1.729t =,0.025(17) 2.1098t =,0.05(17) 1.7396t =。

问:(1)利用t 值检验参数β的显著性(α=0.05);(2)确定参数β的标准差;(3)判断一下该模型的拟合情况。 4.已知估计回归模型得 i i ?Y =81.7230 3.6541X + 且2X X 4432.1∑ (-)=,2 Y Y 68113.6∑ (-)=, 求判定系数和相关系数。 5.有如下表数据 日本物价上涨率与失业率的关系 (1)设横轴是U ,纵轴是P ,画出散点图。根据图形判断,物价上涨率与失业率之间是什么样的关系?拟合什么样的模型比较合适? (2)根据以上数据,分别拟合了以下两个模型: 模型一:1 6.3219.14 P U =-+ 模型二:8.64 2.87P U =- 分别求两个模型的样本决定系数。 7.根据容量n=30的样本观测值数据计算得到下列数据:XY 146.5= ,X 12.6=,Y 11.3=,2X 164.2=,2Y =134.6,试估计Y 对X 的回归直线。 8.下表中的数据是从某个行业5个不同的工厂收集的,请回答以下问题:

计量经济学·多元线性回归模型

计量经济学·多元线性回归模型应用作业 1985~2014年中国GDP与进口、出口贸易总额的关系 一、概述 在当今市场上,一国的GDP与多个因素存在着紧密的联系,例如进口总额和出口总额等都是影响一国GDP 的重要因素。本次将以中国1985-2014年GDP和进口总额、出口总额两个因素因素的数据,通过建立计量经济模型来分析上述变量之间的关系,强调贸易对GDP 的重要性,从而促进国内生产总值的发展。 二、模型构建过程 ⒈变量的定义 解释变量:X1进口贸易总额,X2出口贸易总额被解释变量:Y国内生产总值 建立计量经济模型:解释原油产量与进口贸易总额、出口贸易总额之间的关系。 ⒉模型的数学形式 设定GDP与两个解释变量相关关系模型,样本回归模型为: ⒊数据的收集 该模型的构建过程中共有两个变量,分别是中国从1990-2006年民用汽车拥有量、电力产量、国内生产总值以及能源消费总量,因此为时间序列数据,最后一个即2006年的数据作为预测对比数据,收集的数据如下所示 时间国内生产总值(亿元) 出口总额(人民币亿 元) 进口总额(人民币亿 元) 1985年9039.9 808.9 1257.8 1986年10308.8 1082.1 1498.3 1987年12102.2 1470 1614.2 1988年15101.1 1766.7 2055.1 1989年17090.3 1956 2199.9 1990年18774.3 2985.8 2574.3 1991年21895.5 3827.1 3398.7 1992年27068.3 4676.3 4443.3 1993年35524.3 5284.8 5986.2 1994年48459.6 10421.8 9960.1 1995年61129.8 12451.8 11048.1 1996年71572.3 12576.4 11557.4 1997年79429.5 15160.7 11806.5 1998年84883.7 15223.6 11626.1 1999年90187.7 16159.8 13736.5 2000年99776.3 20634.4 18638.8 2001年110270.4 22024.4 20159.2 2002年121002 26947.9 24430.3 2003年136564.6 36287.9 34195.6 2004年160714.4 49103.3 46435.8 2005年185895.8 62648.1 54273.7

计量经济学考试重点整理

计量经济学考试重点整理 第一章: P1:什么是计量经济学?由哪三组组成? 定义:“用数学方法探讨经济学可以从好几个方面着手,但任何一个方面都不能和计量经济学混为一谈。计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分具有一定的数量特征;计量经济学也不应视为数学应用于经济学的同义语。经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。三者结合起来,就是力量,这种结合便构成了计量经济学。” P9:理论模型的设计主要包含三部分工作,即选择变量,确定变量之间的数学关系,拟定模型中待估计参数的数值范围。 P12:常用的样本数据:时间序列,截面,虚变量数据 P13:样本数据的质量(4点) 完整性;准确性;可比性;一致性 P15-16:模型的检验(4个检验) 1、经济意义检验 2、统计检验 拟合优度检验 总体显著性检验 变量显著性检验 3、计量经济学检验 异方差性检验 序列相关性检验 共线性检验 4、模型预测检验 稳定性检验:扩大样本重新估计 预测性能检验:对样本外一点进行实际预测 P16计量经济学模型成功的三要素:理论、方法和数据。 P18-20:计量经济学模型的应用 1、结构分析 经济学中的结构分析是对经济现象中变量之间相互关系的研究。 结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。 计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。 2、经济预测 计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。 计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。 对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。 模型理论方法的发展以适应预测的需要。

计量经济学(第四版)习题及参考答案解析详细版

计量经济学(第四版)习题参考答案 潘省初

第一章 绪论 1.1 试列出计量经济分析的主要步骤。 一般说来,计量经济分析按照以下步骤进行: (1)陈述理论(或假说) (2)建立计量经济模型 (3)收集数据 (4)估计参数 (5)假设检验 (6)预测和政策分析 1.2 计量经济模型中为何要包括扰动项? 为了使模型更现实,我们有必要在模型中引进扰动项u 来代表所有影响因变量的其它因素,这些因素包括相对而言不重要因而未被引入模型的变量,以及纯粹的随机因素。 1.3什么是时间序列和横截面数据? 试举例说明二者的区别。 时间序列数据是按时间周期(即按固定的时间间隔)收集的数据,如年度或季度的国民生产总值、就业、货币供给、财政赤字或某人一生中每年的收入都是时间序列的例子。 横截面数据是在同一时点收集的不同个体(如个人、公司、国家等)的数据。如人口普查数据、世界各国2000年国民生产总值、全班学生计量经济学成绩等都是横截面数据的例子。 1.4估计量和估计值有何区别? 估计量是指一个公式或方法,它告诉人们怎样用手中样本所提供的信息去估计总体参数。在一项应用中,依据估计量算出的一个具体的数值,称为估计值。如Y 就是一个估计量,1 n i i Y Y n == ∑。现有一样本,共4个数,100,104,96,130,则 根据这个样本的数据运用均值估计量得出的均值估计值为 5.1074 130 96104100=+++。 第二章 计量经济分析的统计学基础 2.1 略,参考教材。

2.2请用例2.2中的数据求北京男生平均身高的99%置信区间 N S S x = = 4 5 =1.25 用 =0.05,N-1=15个自由度查表得005.0t =2.947,故99%置信限为 x S t X 005.0± =174±2.947×1.25=174±3.684 也就是说,根据样本,我们有99%的把握说,北京男高中生的平均身高在170.316至177.684厘米之间。 2.3 25个雇员的随机样本的平均周薪为130元,试问此样本是否取自一个均值为120元、标准差为10元的正态总体? 原假设 120:0=μH 备择假设 120:1≠μH 检验统计量 () 10/2510/25 X X μσ-Z == == 查表96.1025.0=Z 因为Z= 5 >96.1025.0=Z ,故拒绝原假设, 即 此样本不是取自一个均值为120元、标准差为10元的正态总体。 2.4 某月对零售商店的调查结果表明,市郊食品店的月平均销售额为2500元,在下一个月份中,取出16个这种食品店的一个样本,其月平均销售额为2600元,销售额的标准差为480元。试问能否得出结论,从上次调查以来,平均月销售额已经发生了变化? 原假设 : 2500:0=μH 备择假设 : 2500:1≠μH ()100/1200.83?480/16 X X t μσ-= === 查表得 131.2)116(025.0=-t 因为t = 0.83 < 131.2=c t , 故接受原假 设,即从上次调查以来,平均月销售额没有发生变化。

计量经济学名词解释

1、计量经济学 计量经济学是一门从数量上研究物质资料的生产、交换、分配、消费等经济关系和经济活动规律及其应用的科学。 2、数据质量 数据满足明确或隐含需求程度的指标 3、相关分析 主要研究变量之间的相互关联程度,用相关系数表示。包括简单相关和多重相关(复相关)。 4、回归分析(Regression Analysis) 研究一个变量(因变量)对于一个或多个其他变量(解释变量)的数量依存关系。其目的在于根据已知的解释变量的数值来估计或预测因变量的总体平均值。 5.内生变量 指由模型系统内决定的变量,取值在系统内决定 6、面板数据 时间序列数据和截面数据的混合 7.异方差: 总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,则称线性回归模型存在异方差性。 8.自相关 自相关是在时间序列资料中按时间顺序排列的观测值之间的相关或在横截面资料中按空间顺序排列的观测值之间的相关 9.多重共线性 解释变量之间存在完全的线性关系或近似的线性关系。解释变量存在完全的线性关系叫完全多重共线;解释变量之间存在近似的线性关系叫不完全多重共线。 10.虚拟变量 虚拟变量:在建立模型时,有一些影响经济变量的因素无法定量描述 构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D 11.平稳序列 是指时间序列的统计规律不会随着时间的推移而发生变化。

12.伪回归 所谓“伪回归”,是指变量间本来不存在相依关系,但回归结果却得出存在相依关系的错误结论。 13.协整 所谓协整,是指多个非平稳变量的某种线性组合是平稳的 14.前定变量 所有的外生变量和滞后的内生变量。前定变量=外生变量+滞后内生变量+滞后外生变量 15.恰好识别 恰好识别:能够唯一地估计出结构参数值。 16.结构式模型 体现经济理论中经济变量之间的关系结构的联立方程模型,称为结构式模型17.过度识别 过度识别:结构参数的估计值具有多个确定值 18.自回归模型 自回归模型:指模型中的解释变量仅是X 的当期值与被解释变量Y 的若干期滞后值,它由于被解释变量的滞后期值对被解释变量现期做了回归,故叫做自回归模型。 利用前期若干时刻的随机变量的线性组合来描述以后某时刻随机变量的线性回归模型。 19.拟合优度2R:拟合优度检验:指检验模型对样本观测值的拟合程度 20.修正的拟合优度2R 二、.

假设检验与置信区间

假设检验与置信区间

一、假设检验 ?什么是假设检验呢(hypothesis testing) (1)先是总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程。 (2)逻辑上运用反证法,先认为假设成立,然后判断样板信息与假设是否矛盾,如果矛盾,就推翻原假设,否则不能拒绝原假设。 (3)统计上依据小概率原理。 1.原假设(null hypothesis) (1)研究者想要收集证据予以反对的假设 (2)又称“0假设” (3)总是有符号=、≤或≥ (4)表示为H0

假设检验 H0:μ=某一数值 指定为符号=、≤或≥ 例如H0=10cm 2.备择假设(alternative hypothesis)(1)研究者想要收集证据予以支持的假设(2)也称“对立假设” (3)总是有符号≠、≤或≥ (4)表示为HA HA:μ<某一数值,或>某一数值 例如:HA:μ<10cm,或μ>10cm

假设检验 ?3.假设检验 (1)原假设和备择假设是一个完备事件组,而且相互对立。 (2)先确定备择假设,再确定原假设 (3)等号总是放在原假设上 (4)我们是对总体做检验 (5)因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论)

假设检验 ?4.假设检验中的风险 ?α=拒绝原假设,而实际上它为真的概率?Α,第一类错误概率,也叫生产者的风险? β=无法拒绝原假设,而实际上它为假的概率 Β,第二类错误概率,也叫使用者的风险 被告的真正情况无辜 有罪无辜(H 0)正确判定错误(β)有罪(H A ) 错误(α) 正确判定 判决 真实 统计学假设检验与美国司法体系的关系

计量经济学答案(部分)

第一章导论 一、单项选择题 1-6: CCCBCAC 二、多项选择题 ABCD;ACD;ABCD 三.问答题 什么是计量经济学? 答案见教材第3页 四、案例分析题 假定让你对中国家庭用汽车市场发展情况进行研究,应该分哪些步骤,分别如何分析?(参考计量经济学研究的步骤) 第一步:选取被研究对象的变量:汽车销售量 第二步:根据理论及经验分析,寻找影响汽车销售量的因素,如汽车价格,汽油价格,收入水平等 第三步:建立反映汽车销售量及其影响因素的计量经济学模型 第四步:估计模型中的参数; 第五步:对模型进行计量经济学检验、统计检验以及经济意义检验; 第六步:进行结构分析及在给定解释变量的情况下预测中国汽车销售量的未来值为汽车业的发展提供政策实施依据。 第二章简单线性回归模型 一、填空题 1、线性、无偏、最小方差性(有效性),BLUE。 2、解释变量;参数;参数。 3、随机误差项;随机误差项。 二、单项选择题 1-4:BBDA;6-11:CDCBCA 三、多项选择题 1.ABC; 2.ABC; 3.BC; 4.ABE; 5.AD; 6.BC 四、判断正误: 1. 错; 2. 错; 3. 对; 4.错; 5. 错; 6. 对; 7. 对; 8.错 五、简答题: 1.为什么模型中要引入随机扰动项? 答:模型是对经济问题的一种数学模型,在模型中,被解释变量是研究的对象,解释变量是其确定的解释因素,但由于实际问题的错综复杂,影响被解释变量的因素中,除了包括在模型中的解释变量以外,还有其他一些因素未能包括在模型中,但却影响被解释变量,我们把这类变量统一用随机误差项表示。随机误差项包含的因素有:

计量经济学检验汇总

最全计量经济学检验汇总 现代计量经济学的检验包括以下三个大类: §1.1 系数检验 一、Wald 检验——系数约束条件检验 Wald 检验没有把原假设定义的系数限制加入回归,通过估计这一无限制回归来计算检验统计量。Wald 统计量计算无约束估计量如何满足原假设下的约束。如果约束为真,无约束估计量应接近于满足约束条件。 考虑一个线性回归模型:εβ+=X y 和一个线性约束:0:0=-r R H β,R 是一个已知的k q ?阶矩阵,r 是q 维向量。Wald 统计量在0H 下服从渐近分布)(2q χ,可简写为: )())(()(112r Rb R X X R s r Rb W -'''-=-- 进一步假设误差ε独立同时服从正态分布,我们就有一确定的、有限的样本F-统计量 q W k T u u q u u u u F /) /(/)~~(=-''-'= u ~是约束回归的残差向量。F 统计量比较有约束和没有约束计算出的残差平方和。如果约束有效,这两个残差平方和差异很小,F 统计量值也应很小。EViews 显示2χ和F 统计量以及相应的p 值。 假设Cobb-Douglas 生产函数估计形式如下: εβα+++=K L A Q log log log (1) Q 为产出增加量,K 为资本投入,L 为劳动力投入。系数假设检验时,加入约束1=+βα。 为进行Wald 检验,选择View/Coefficient Tests/Wald-Coefficient Restrictions ,在编辑对话框中输入约束条件,多个系数约束条件用逗号隔开。约束条件应表示为含有估计参数和常数(不可以含有序列名)的方程,系数应表示为c(1),c(2)等等,除非在估计中已使用过一个不同的系数向量。 为检验规模报酬不变1=+βα的假设,在对话框中输入下列约束:c(2)+c(3)=1 二、遗漏变量检验 这一检验能给现有方程添加变量,而且询问添加的变量对解释因变量变动是否有显著作用。原假设 0H 是添加变量不显著。 选择View/Coefficient Tests/Omitted Variables —Likehood Ration ,在打开的对话框中,列出检验统计量名,用至少一个空格相互隔开。例如:原始回归为 LS log(q) c log(L) log(k) ,输入:K L ,EViews 将显示含有这两个附加解释变量的无约束回归结果,而且显示假定新变量系数为0的检验统计量。 三、冗余变量 冗余变量检验可以检验方程中一部分变量的统计显著性。更正式,可以确定方程中一部分变量系数是否为0,从而可以从方程中剔出去。只有以列出回归因子形式,而不是公式定义方程,检验才可以进行。 选择View/Coefficient Tests/Redundant Variable —likelihood Ratio ,在对话框中,输入每一检验的变量名,相互间至少用一空格隔开。例如:原始回归为: Ls log(Q) c log(L) log(K) K L ,如果输入K L ,EViews 显示去掉这两个回归因子的约束回归结果,以及检验原假设(这两个变量系数为0)的统计量。 §1.2 残差检验 一、相关图和Q —统计量 在方程对象菜单中,选择View/Residual Tests/Correlogram-Q-Statistics ,将显示直到定义滞后阶数的残差自相关性和偏自相关图和Q-统计量。在滞后定义对话框中,定义计算相关图时所使用的滞后数。如果残差不存在序列相关,在各阶滞后的自相关和偏自相关值都接近于零。所有的Q -统计量不显著,并且有大

计量经济学分析模型

计量经济学分析模型

摘要 改革开放以来,我国经济呈迅速而稳定的增长趋势,由于分配机制和收入水平的变化,城镇居民生活水平在达到稳定小康之后,消费结构和消费水平都出现了一些新的特点。本文旨在对近几年,我国城镇年人均收入变动对年人均各种消费变动的影响进行实证分析。首先,我们综合了几种关于收入和消费的主要理论观点;本文根据相关的数据统计数据,运用一定的计量经济学的研究方法,进而我们建立了理论模型。然后,收集了相关的数据,利用EVIEWS软件对计量模型进行了参数估计和检验,并加以修正。最后,我们对所得的分析结果和影响消费的一些因素作了经济意义的分析,并相应提出一些政策建议。并找到影响居民消费的主要因素。 关键词:居民消费;城镇居民;回归;Eviews

目录 摘要.................................................................. II 前言. (1) 1 问题的提出 (2) 2 经济理论陈述 (3) 2.1西方经济学中有关理论假说 (3) 2.2有关消费结构对居民消费影响的理论 (4) 3 相关数据收集 (6) 4 计量经济模型的建立 (9) 5 模型的求解和检验 (10) 5.1计量经济的检验 (10) 5.1.1模型的回归分析 (10) 5.1.2拟合优度检验: (11) 5.1.3 F检验 (11) 5.1.4 T检验 (12) 5.2 计量修正模型检验: (12) 5.2.1 Y与的一元回归 (13) 5.2.2拟合优度的检验 (13) 5.2.3 F检验 (14) 5.2.4 T检验: (15) 5.3经济意义的分析: (15) 6 政策建议 (16) 结论 (17) 参考文献 (19)

计量经济学多元线性回归

低碳农业发展影响因素分析——以新疆南疆五地州为例 学生姓名方芳 学号1075717008 所属学院经济与管理学院 专业农村与区域发展 塔里木大学教务处制

目录 1 引言 (1) 2 数据来源和研究方法 (1) 2.1数据来源 (1) 2.2研究方法 (2) 3 模型检验与结果 (3) 3.1初始模型计量 (3) 3.2检验 (3) 4 结论与建议 (4) 5 参考文献 (4)

低碳农业发展影响因素分析 --以新疆南疆五地州为例 方芳 摘要:全球变暖问题引起世界各国的广泛关注,这一变化使得自然灾害频发,甚至危及人类安全,因此解决这一问题迫在眉睫。通过对新疆南疆五地州的农业总产值与化肥施用量、农用机械总动力及农作物总播种面积进行回归分析后,发现化肥施用量对农作物的总产值影响极大,是其主要的制约因素。要发展低碳农业应转变农业生产方式,实施保护性耕作;应推广施肥新技术,提高化肥利用率;应改进装置,利用新技术生产化肥;发展生态农业,实现经济循环发展。 关键字:低碳农业影响因素回归分析 1 引言 近年来气候变化所导致的高温热潮、暴雨连连、旱灾、沙尘暴频发事件的概率持续增加,CO2是造成该现象的源头之一,因此,发展低碳经济、发展节能减排成为全球关注的热点。2014 年《中美气候变化联合声明》提出我国将于2030 年左右达到碳排放峰值的庄严承诺,2015 年12 月12 日,195个缔约方在巴黎达成了新的全球气候协议———《巴黎协议》,提出努力将气温升幅限制在1.5℃内的目标。农业碳排放量介于电热生产和尾气之间,成为第二大排放源,占我国碳排放总量的17%。新疆位于亚欧大陆腹地,地处中国西北边陲,是中国面最大、交界邻国最多、陆地边境线最长的省区,肩负着与重要世界经济资源大国沿边开放的重任。同时,新疆作为我国重要的种植业和畜牧业基地,以8%的绿洲面积承载了90%以上的人口、耕地和生产总值,绿色生态压力相当严峻。新疆南疆位于天山以南的塔里木盆地 ,四周高山环抱。在行政区划上包括巴音郭楞、阿克苏、喀什、克孜勒苏、和田等五地州及生产建设兵团的四个农业师。塔里木河是我国最大的内陆河,它由西向东1321km,流域覆盖新疆南部地区,面积102万km2,人口825.7万 ,分别占新疆自治区的61%和 47%,是我国重要的棉花基地。冉锦成、苏洋等人研究表明,南疆各地 (州,市) 区域差异明显,喀什地区属碳排放量、碳排放强度“双高”型地区,因此,通过对农业产值与化肥施用量、机械总动力以及农作物播种面积的回归分析,试图找到影响低碳农业发展的主要因素,并提出相关的建议,促进农业实现低碳生产。 2 数据来源和研究方法 2.1数据来源 本文选取的是新疆2006--2016年的农业生产数据,其中包括:农业总产值(亿)Y,化肥施用量(万吨)(X1)、农用机械总动力(万千瓦)(X2)、农作物总播种面积(万公顷)(X3),数据来源于《中国统计年鉴》和《新疆统计年鉴》(2006--2016),数据见表1。 表1 新疆统计年鉴2006-2016样本数据

计量经济学-案例分析-第八章

第八章案例分析 改革开放以来,随着经济的发展中国城乡居民的收入快速增长,同时城乡居民的储蓄存 款也迅速增长。经济学界的一种观点认为,20世纪90年代以后由于经济体制、住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。为了考察改革开放以来中 国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表 居民储蓄(Y),以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系。 表8.1为1978-2003年中国的国民总收入和城乡居民人民币储蓄存款年底余额及增加额的数据。 单位:亿元 2004 鉴数值,与用年底余额计算的数值有差异。 为了研究1978—2003年期间城乡居民储蓄存款随收入的变化规律是否有变化,考证城

乡居民储蓄存款、国民总收入随时间的变化情况,如下图所示: 图8.5 从图8.5中,尚无法得到居民的储蓄行为发生明显改变的详尽信息。若取居民储蓄的增量 (YY ),并作时序图(见图 8.6) 从居民储蓄增量图可以看出,城乡居民的储蓄行为表现出了明显的阶段特征: 2000年有两个明显的转折点。再从城乡居民储蓄存款增量与国民总收入之间关系的散布图 看(见图8.7),也呈现出了相同的阶段性特征。 为了分析居民储蓄行为在 1996年前后和2000年前后三个阶段的数量关系,引入虚拟变 量D 和D2°D 和D 2的选择,是以1996>2000年两个转折点作为依据,1996年的GNI 为66850.50 亿元,2000年的GNI 为国为民8254.00亿元,并设定了如下以加法和乘法两种方式同时引入 虚拟变量的的模型: YY = 1+ 2GNI t 3 GNI t 66850.50 D 1t + 4 GNh 88254.00 D 2t i D 1 t 1996年以后 D 1 t 2000年以后 其中: D 1t _ t 1996年及以前 2t 0 t 2000年及以前 对上式进行回归后,有: Dependent Variable: YY Method: Least Squares Date: 06/16/05 Time: 23:27 120000 8.7 1996年和 100000- 40000 2WM GNi o eOB2&ISEea9a9l2949698[Ma2 20CUC ir-“- 1CC0C 图 8.6 *OOCO mnoot , RtKXD Tconr GF*

相关文档
相关文档 最新文档