********* 计量分析与STA TA应用*********
* 主讲人:连玉君博士
* 单位:中山大学岭南学院金融系
* 电邮: arlionn@https://www.wendangku.net/doc/0710087588.html,
* 主页: https://www.wendangku.net/doc/0710087588.html,/arlion
* ::高级部分::
* 计量分析与Stata应用
第七讲面板数据模型
* ==========================
* 7.8 动态面板模型
* Part I
cd D:\stata10\ado\personal\Net_course\B7_Panel
*-------------------------------
* 动态面板模型
*-------------------------------
* 7.8.1 简介
* 7.8.2 一阶差分IV估计量(Anderson and Hisao, 1982)
* 7.8.3 一阶差分GMM估计量(Arellano and Bond, 1991)
* 7.8.4 系统GMM估计量(AB,1995; BB,1998)
* 7.8.5 纠偏LSDV估计
* 7.8.6 各种估计方法的对比分析——一个模拟
* == 简介==
*
* 模型:y[it] = a0*y[it-1] + a1*x[it] + a2*w[it] + u_i + e[it]
*
* 特征:解释变量中包含了被解释变量的一阶滞后项
* 可以是非平行面板,但要保证时间连续
* x[it] ——严格外生变量E[x_it,e_is] =0 for all t and s
* 即,所有干扰项与x都不相关
* w[it] ——先决变量E[w_it,e_is]!=0 for s
* 即,前期和当期,尤其是当期干扰项与x相关
* u_i 随机效应,在截面间是iid 的。u_i 与e[it] 独立。
*
* 内生性问题:
* (1) 若假设u_i 为随机效应,则Corr(y[i,t-1], u_i) !=0
* (2) 若假设u_i 为个体效应,需要想办法去除之,因为数据为"大N小T" * 一阶差分:D.y[i,t-1] = y[i,t-1] - y[i,t-2]
* D.e[i,t] = e[i,t] - e[i,t-1]
* 显然:Corr(D.y[i,t-1], D.e[i,t]) !=0, 差分方程存在内生问题;
* 组内去心:ym[i,t-1] = y[i,t-1] - 1/(T-1)*(y[i,t-1]+...+y[i,T])
* em[i,t] = e[i,t] - 1/T*(e[i,t]+e[i,t-1]+...+e[i,T])
* 显然:Corr(ym[i,t-1], em[i,t]) !=0, 仍然存在内生性问题
*
* 处理办法:IV估计或GMM估计,选择合适的工具变量
*
* 矩条件:E[e_it,z_it] = 0
*========================================
*========= 一阶差分IV 估计量============
*========Anderson and Hisao(1982)========
*========================================
*
* 基本思想:采用一阶差分去除个体效应u_i,
* y 的三阶及三阶以上滞后项都可以作为D.y[it-1] 的工具变量* 同时,D.y[it-2] 也可以作为D.y[it-1] 的工具变量
use abdata.dta, clear
des /*变量的定义*/
tsset id year
* 模型: n_it = b1*n_it-1 + b2*n_it-2
* + b3*w_it + b4*w_it-1
* + b5*k_it + b6*k_it-1 + b7*k_it-2
* + b8*ys_it + b9*ys_it-1 + b10*ys_it-2
*
xtivreg n L2.n w L1.w k L1.k L2.k ys L1.ys L2.ys yr1981-yr1984 /// (L.n = L3.n), fd
*
* 等价于
*
xtivreg n L2.n L(0/1).w L(0/2).(k ys) yr1981-yr1984 (L.n = L3.n), fd
*====================================
*========= 一阶差分GMM估计量=========
*==============AB91==================
*
* L.Hansen (1982) 提出GMM
*
* Arellano and Bond (1991)
*
* 模型:
*
* y[it] = a0*y[it-1] + a1*x[it] + a2*w[it] + u_i + v[it]
*
* 假设条件:
* 干扰项v[it] 不存在序列相关;
*
* 适用范围:
* 大N,小T
* 随后,我们会介绍“小N大T”型动态面板的估计方法
*
* 基本思想:
*
* 在Anderson and Hisao(1982) 基础上增加了更多可用的工具变量
*
* 在t=3 处,y_i1 可以作为所有滞后项的工具变量
* 在t=4 处, y_i1, y_i2 可以作为所有滞后项的工具变量
*
* D.y[it] = a1*D.y[it-1] + a2*D.X[it] + D.v[it] X_it = [x_it, w_it]
*
* 因此,所有工具变量构成的矩阵如下:
*
* |y_i1 0 0 0 0 0 ... 0 ... 0 D.x_i3 |
* | 0 y_i1 y_i2 0 0 0 ... 0 ... 0 D.x_i4 |
* | 0 0 0 y_i1 y_i2 y_i3 ... 0 ... 0 D.x_i5 |
* Z_i = | . . . . . . . . . . . |
* | . . . . . . . . . . . |
* | 0 0 0 0 0 0 ... y_i1 ... yiT-2 D.x_iT |
*
* Z_i 的行数为T-2
* Z_i 的列数为sum_(m=1)^(T-2){m} + K, K 为X 的列数
*
* 以T =7,K=3 为例,则Z_i 的列数为(1+2+3+4+5+6+7)+3 = 31
*
* 设定工具变量的基本原则:
*
* 对-内生-变量的处理:与上述方法类似,
* 即滞后两阶以上的水平变量均可作为差分方程的工具变量(GMM type) * 对-先决-变量的处理:滞后一阶以上的水平变量均可作为工具变量(GMM type)
* 对-外生-变量的处理:自己作为自己的工具变量(Standard IV)
*== 例1:一阶差分估计量的基本设定
* 解释变量仅包含y_it 的一阶滞后项,默认设定
* 干扰项同方差,一阶段估计
use abdata.dta, clear
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984
est store ab_0
*- 结果释疑
*
* -1- 工具变量的个数是如何确定的?(xtdpd, p.74)
*
* 外生变量的工具变量等于外生变量的个数
* L(0/1).w L(0/2).(k ys) yr1980-yr1984 共13个
* 内生变量的工具变量:共27个
*
list id year n L2.n DL2.n if id == 140
*
* 差分方程的可用工具变量
*--------------------------------------------------------
* year of Years of Number of
* difference equation instruments instruments
* 1979 1976-1977 2
* 1980 1976-1978 3
* 1981 1976-1979 4
* 1982 1976-1980 5
* 1983 1976-1981 6
* 1984 1976-1982 7
*--------------------------------------------------------
* 27个
* 练习:如果进一步设定y[i,t-2] 和y[i,t-3] 为解释变量,
* 那么工具变量共有多少个?
*
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984,lag(3)
* -2- GMM-type 和Standard 两种类型的工具变量有何差异?(xtabond,p.27) *
* GMM-type 是针对内生变量或先决变量而言的工具变量,有多列
* Standard 是针对外生变量而言的工具变量,只有一列
*- 过度识别检验(工具变量的使用是否合理)
estat sargan
*
* 说明:
* H0: overidentifying restrictions are valid
* 这里,我们拒绝了原假设,但AB91指出,当干扰项存在异方差时,
* Sargan检验倾向于过度拒绝原假设,因此此处得到的结论并不可信。
* 采用两阶段估计,然后再执行Sargan检验较为稳妥:
*
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984,twostep
estat sargan
*
* 说明:不过,AB91发现,
* 若存在异方差,在两阶段估计后执行Sargan检验往往倾向于
* Underreject问题,即过度接受原假设。
* 通常而言,这很可能是我们的模型设定不当,或是工具变量的选择不合理。* 随后,我们会采用-xtdpd-命令,将干扰项设定为MA(1) 过程,
* 此时,执行Sargan检验不再拒绝原假设。
* - 干扰项序列相关检验
*
* AB91 一阶差分估计量要求原始模型的干扰项不存在序列相关,
* 显然,差分后的干扰项必然存在一阶序列相关,
* 因此,我们需要检验差分方程的残差是否存在二阶(或更高阶)序列相关即可*
* 默认,二阶序列相关检验
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984,vce(robust)
estat abond
* 说明:若存在二阶相关,则意味着选取的工具变量不合理
* 高阶序列相关检验
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984,vce(robust) artest(3)
estat abond
*== 稳健型估计
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984, lags(2) robust
est store ab4_one_rb
* 此时,无法Sargan 统计量
estat sargan
*== 联合检验:检验除常数项和时间虚拟变量外,其它变量整体上是否显著xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984, lags(2) robust
test L.n L2.n w L.w k L.k L2.k ys L.ys L2.ys
*== 两阶段估计AB91(Tab4(a2)) 考虑异方差问题
* 利用第一阶段估计得到的残差构造方差-协方差矩阵,进而重新估计模型
*
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984, lags(2) twostep
est store ab4_twostep
* 此时,Sargan 检验无法拒绝原假设
*
estat sargan
* AB91重要建议:
* (1) 采用一阶段估计结果进行系数显著性的统计推断;
* (2) 采用两阶段估计给出的Sargan统计量进行模型筛选
*
* 进一步的讨论:
* 虽然AB91建议不要采用两阶段(非稳健)估计进行统计推断,
* 但Windmeijer(2005,Journal of Econometrics)通过模拟分析表明,
* 采用纠偏(bias-corrected,WC)后的稳健性VCE,可以更好地进行统计推断xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984, lags(2) twostep vce(robust)
est store ab_wc_rb
* 结果对比
local mm "ab4_one_rb ab4_twostep ab_wc_rb"
esttab `mm',mtitle(`mm')
*
* 结论:
* AB91_onestep_rb 的结果与AB91_WC_rb 的参数估计相同,后者标准误较大* 建议采用Windmeijer(2005) 两阶段-纠偏-稳健型估计量。
*== 先决变量的设定
* 由于当期干扰项显然会影响后续w 和k,所以把它们设定为先决变量更为合理* 注意: 此时逗号前就不能再出现这两个变量了
xtabond n L(0/1).ys yr1980-yr1984, lags(2) twostep ///
pre(w k)
est store ab4_pre
estat sargan
* 从Sargan p值来看,将w 和k 设为先决变量似乎更为合理
* pre() 选项的设定
xtabond n L(0/1).ys yr1980-yr1984, lags(2) twostep ///
pre(w,lag(1,3)) pre(k,lag(2,.))
*
* 解释:
* pre(w,lag(1,3))
* lag(1,3) 中的1 表示L.w 也会作为解释变量,
* lag(1,3) 中的3 表示L2.w 和L3.w 可以作为L.w 的工具变量,但L4.w 不可以;
* pre(k,lag(2,.))
* lag(2,.) 中的2 表示L1.k, L2.k 都会作为解释变量;
* lag(2,.) 中的. 表示L3.k, L4.k ... 都可以作为L2.k 的工具变量
*== 内生变量的设定
* 假设w 和k 都与当期干扰项相关,即二者均为内生变量,则:
xtabond n L(0/1).ys yr1980-yr1984, lags(2) twostep ///
endog(w,lag(1,.)) endog(k,lag(2,.))
est store ab4_endog
*== 部分先决,部分内生
xtabond n L(0/1).ys yr1980-yr1984, lags(2) twostep ///
pre(w,lag(1,.)) endog(k,lag(2,.))
est store ab4_predog
* 说明:上述设定都可附加-vce(robust)- 选项以便获得稳健型标准误。
*== 工具变量过多导致的问题
* 过多的工具变量往往导致过度约束假设无法满足
* 估计结果的有效性降低,因为部分工具变量与内生或先决变量的相关性很弱
* 对矩阵尺寸的要求增加
* 解决办法:限制最大的滞后阶数
xtabond n L(0/1).ys yr1980-yr1984, lags(2) twostep ///
pre(w,lag(1,3)) pre(k,lag(2,3))
*== 系数估计的上下限
* 虽然Pooled OLS 和Fixed Effects 估计都是有偏的,
* 但是二者却决定了y_it-1 真是估计值的上界和下界
* 换言之,Pooled OLS 估计高估了真实值
* 而Fixed effects 估计则低估了真实值
use abdata.dta, clear
reg n L.n L(0/1).w L(0/2).(k ys) yr1980-yr1984, robust
est store OLS
xtreg n L.n L(0/1).w L(0/2).(k ys) yr1980-yr1984, fe
est store FE
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984
est store DAbond
esttab OLS DAbond FE, b(%6.3f) t(%6.2f) mtitle(OLS DAbond FE)
*== 结果输出到Word
local model "OLS DAbond FE ab4_pre ab4_endog"
esttab `model', b(%6.3f) t(%6.2f) mtitle(`model') ///
star(* 0.1 ** 0.05 *** 0.01) ///
scalar(arm2 sargan sar_df N N_g) ///
compress
*== 使用xtabond4 命令可进一步输出自相关和Sargan检验的P 值use abdata,clear
xtabond4 n L(0/1).w L(0/2).(k ys) yr1980-yr1984 /*modified by Arlion*/ est store m_1
xtabond4 n L(0/1).ys yr1980-yr1984, lags(2) twostep ///
pre(w,lag(1,.)) pre(k,lag(2,.))
est store m_2
local model "m_1 m_2"
esttab `model', b(%6.3f) t(%6.2f) mtitle(`model') ///
star(* 0.1 ** 0.05 *** 0.01) ///
scalar(arm1 p_arm1 arm2 p_arm2 sargan sar_p sar_df N N_g) * 或
local model "m_1 m_2"
esttab `model', b(%6.3f) t(%6.2f) mtitle(`model') ///
star(* 0.1 ** 0.05 *** 0.01) ///
scalar(p_arm2 sargan sar_df sar_p N N_g)
* 第七讲面板数据模型
* ==========================
* 7.8 动态面板模型
* Part II
cd D:\stata10\ado\personal\Net_course\B7_Panel
*=======================================
*============= 系统GMM估计量===========
*==============AB95,BB98===============
*=======================================
* Arellano and Bover (1995),
* Blundell and Bond(1998)
* Haha(1999), Judson and Owen(1999)
*
* 适用范围:
* 大N,小T
*
* AB91 的局限
* (1) 当y[i,t-1] 的系数较大,即y[i,t] 表现出强烈的序列相关时;
* (2) 当Var[u_i]/Var[e_it] 较大时,即个体效应的波动远大于常规干扰项的波动;* AB91 的表现欠佳。
* 原因在于,水平滞后项是差分方程中内生变量的-弱工具变量-;
* 因此,需要寻求更佳的工具变量
*
*== 基本思想:
*
* --- 几个概念---
*
* 水平值——y x
* 差分值——D.y D.x
* 水平方程:y_it = b1*y_it-1 + b2*x_it + u_i + v_it
* 可用工具变量:D.y[i,t-2] 可以作为y[i,t-1] 的工具变量
* 差分方程:D.y_it = b1*D.y_it-1 + b2*D.x_it + D.v_it
* 可用工具变量:y[i,t-3],y[i,t-4]...都可以作为D.y[i,t-1]的工具变量
*
* --- 差分GMM估计量与系统GMM估计量的区别---
*
* (1) 差分GMM估计量采用水平值的滞后项作为差分变量的工具变量;
* 如y_it-3 是D.y_it-1 的工具变量
* (2) 系统GMM估计量进一步采用差分变量的滞后项作为水平值的工具变量;
* 相当于进一步增加了可用的工具变量,
* 且估计过程中同时使用水平方程和差分方程
* (3) 主要原因在于差分GMM的工具变量往往是弱工具变量,即corr(X,Z) 过低*
* --- xtabond2 命令---Roodman(2005)
*
* 既可以估计差分GMM 估计量,也可以估计系统GMM 估计量;
* 同时可以估计一般化的回归模型
* 提供两阶自相关检验,Sargan检验,Hansen检验,以及工具变量外生性检验*
* --- xtdpdsys 命令--- Stata官方命令,以xtabond2命令为基础
*------------------------------------
*---------- xtabond2 命令------------
*------------------------------------
* 适用于Stata8-10 各个版本
* 既可以完成-一阶差分GMM估计-
* 也可以完成-系统GMM估计-
* 详细参考资料:
* Roodman, D. 2006. How to Do xtabond2:
* An Introduction to "Difference" and "System" GMM in Stata.
* Working Paper 103. Center for Global Development, Washington.
*== 使用xtabond2 命令得到-一阶差分估计量-
*- 附加-noleveleq- 选项即可
* 采用xtabond2 估计AB91 文中表4 的结果
* Arellano and Bond (1991), Table 4
* Column (a1)
use abdata, clear
xtabond2 n L(1/2).n L(0/1).w L(0/2).(k ys) yr1980-yr1984, ///
gmm(L.n) iv(L(0/1).w l(0/2).(k ys) yr1980-yr1984) ///
nomata noleveleq small
* gmm(*) 填写内生变量的名称
* iv(*) 填写所有外生变量以及自己设定的工具变量的名称
* noleveleq 表示估计过程中不使用水平方程,即为差分GMM估计量est store aba1_ab2
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984, lags(2)
est store aba1_ab
esttab aba1_ab2 aba1_ab, mtitle(aba1_ab2 aba1_ab)
* Column (a2)
* 两阶段估计
xtabond2 n L(0/1).w L(0/2).(k ys) L(1/2).n yr1980-yr1984, ///
gmm(L.n) iv(L(0/1).w l(0/2).(k ys) yr1980-yr1984) ///
noleveleq small twostep
est store aba2_ab2
xtabond n L(0/1).w L(0/2).(k ys) yr1980-yr1984, lags(2) twostep
est store aba2_ab
esttab aba2_ab2 aba2_ab, mtitle(aba2_ab2 aba2_ab)
*=== 一阶差分估计量部分解释变量内生
* 一阶段估计
xtabond2 n L.n L(0/1).(w k) yr1980-yr1984, ///
gmm(L.(w k n)) iv(yr1980-yr1984) ///
noleveleq noconstant small robust
est store fd_1s
* 两阶段估计
xtabond2 n L.n L(0/1).(w k) yr1980-yr1984, ///
gmm(L.(w k n)) iv(yr1980-yr1984) ///
noleveleq robust small twostep
est store fd_2s
esttab fd_1s fd_2s, mtitle(fd_1s fd_2s)
*== 系统GMM 估计量
xtabond2 n L.n L(0/1).(w k) yr1978-yr1984, ///
gmm(L.n) iv(L(0/1).(w k) yr1978-yr1984) ///
robust small
*
* 解释:
*
*-- gmm() 选项
* 设定内生变量和先决变量,它们的工具变量将有多列,GMM
*
*-- iv() 选项
* 设定严格外生变量,作为自己的工具变量,在工具变量矩阵中仅占一列
*
*-- 差分方程和水平方程
* 默认情况下,差分方程和水平方程都参与估计
*
*-- robust 选项
* (1) 对于一阶段估计(不附加twostep选项),
* 采用传统异方差-序列相关稳健型估计量计算标准误;
* (2) 对于两阶段估计(附加twostep选项),
* 采用Windmeijer(2005)纠偏估计量计算标准误;
*-- Sargan检验
* Sargan test of overid. restrictions: chi2(34)
* 34 = 47 - 13 (13是外生变量的个数,包含常数项)
* 可见,无论采用Sargan检验还是Hansen J检验,都拒绝了工具变量合理的原假设* 指定工具变量应用于水平方程还是差分方程
* 例如,假设w, k, 以及年度虚拟变量都是外生的(当然,这一假设可能并不合理) *
xtabond2 n L.n L(0/1).(w k) yr1978-yr1984, gmm(L.n) ///
iv(L(0/1).(w k) yr1978-yr1984, eq(level)) ///
robust small twostep
est store sys_wkexg
* 将w 和k 都设定为内生变量
* yr dummies 仅出现在水平方程中
xtabond2 n L.n L(0/1).(w k) yr1978-yr1984, ///
gmm(L.(w k n)) iv(yr1978-yr1984, eq(level)) ///
robust small twostep
est store sys_wkendog_lev
* yr dummies 同时出现在水平方程和差分方程中
xtabond2 n L.n L(0/1).(w k) yr1978-yr1984, ///
gmm(L.(w k n)) iv(yr1978-yr1984, eq(both)) ///
robust small twostep
est store sys_wkendog_both
* 结果对比
local mm "fd_1s fd_2s sys_wkexg sys_wkendog_lev sys_wkendog_both"
esttab `mm', mtitle(`mm') compress
*-------------------------------------
*== 实例:中国上市公司资本结构动态调整
*-------------------------------------
*
* y_it - y_it-1 = b*(yA_it - y_it-1)
* y_it = (1-b)*y_it-1 + b*yA_it
*
* 目标资本结构的设定I :采用年度虚拟变量的线性组合
* let yA_it = a1*dyr2001 + a2*dyr2002 + ...
use xtcs.dta, clear
* 一阶差分GMM估计量
xi: xtabond2 tl L.tl i.year, gmm(L.tl) iv(i.year) robust noleveleq
dis ln(2) / (1 - _b[L1.tl])
est store dycs_01DIFF
* 系统GMM估计量
xi: xtabond2 tl L.tl i.year, gmm(L.tl) iv(i.year) robust
dis ln(2) / (1 - _b[L1.tl])
est store dycs_01SYS
* OLS 估计(调整系数的上限)
xi: reg tl L.tl i.year, robust
est store dycs_01OLS
* FE 估计(调整系数的下限)
xi: xtreg tl L.tl i.year, fe robust
est store dycs_01FE
* 结果对比
local mm "dycs_01DIFF dycs_01SYS dycs_01OLS dycs_01FE"
local ss "ar2 ar2p sargan sar_df sarganp"
esttab `mm',mtitle(`mm') scalar(`ss')
* 目标资本结构的设定II :采用公司特征变量的线性组合
* let y*_it = a1*size + a2*tang + a3*ndts + ...
* 假设其它变量都是外生变量
use xtcs.dta, clear
qui tab year, gen(yr)
drop yr1
local xx "size tang ndts L(0/1).tobin L(0/1).npr yr*"
xtabond2 tl L.tl `xx', gmm(L.tl) iv(`xx') robust two
dis ln(2) / (1 - _b[L1.tl]) /*调整半周期*/
* 检验年度虚拟变量是否显著
test yr2 = yr3 = yr4 = yr5 = yr6 = 0
test yr2 = yr3 = yr4 = yr5 = yr6
* 假设tobin 和npr 是内生的
local xx "size tang ndts L(0/1).(tobin npr) yr*"
local gmm " L.tl L(0/1).(tobin npr) "
local iv "size tang ndts yr*"
xtabond2 tl L.tl `xx', gmm(`gmm') iv(`iv') robust two
dis ln(2) / (1 - _b[L1.tl])
* 工具变量的选择并不合理,因为Hansen J 统计量显著
* 假设tobin 和npr 为先决变量
local xx "size tang ndts L(0/1).(tobin npr) yr*"
local gmm " L.tl L.tobin L.npr "
local iv "size tang ndts tobin npr yr*"
xtabond2 tl L.tl `xx', gmm(`gmm') iv(`iv') robust two
dis ln(2) / (1 - _b[L1.tl])
* 练习:
* (1) 请对比上述估计结果,并与OLS和FE的结果进行对比;
* (2) 请根据Sargan统计量和AR(2)检验结果确定一个最佳的模型;
*== xtabond2 命令的其他用途
* 由于OLS 是GMM 的特例,所以采用xtabond2 命令同样可以执行OLS 估计
*
use abdata.dta, clear
regress n w k
abar /*检验自相关*/
xtabond2 n w k, iv(w k, eq(level))
* 评论:OLS可以视为GMM的一个特例
*---------------------------
*------ xtdpdsys 命令------
*---------------------------
* 仅适用于Stata10 版本
* 中国上市公司资本结构动态调整
use xtcs.dta, clear
qui tab year, gen(yr)
drop yr1
* Case I:假设所有解释变量均为外生变量(L.tl除外)
*
local xx "size tang ndts L(0/1).tobin L(0/1).npr yr*"
xtdpdsys tl `xx', vce(robust) twostep
dis ln(2) / (1 - _b[L1.tl]) /*调整半周期*/
est store dycs_2sys
* 设定说明:
* (1) 无需设定L.tl, 因为xtdpdsys 默认设定被解释变量的滞后一期为解释变量,* 而且该变量被自动设定为内生变量;
* (2) 稳健型估计采用vce(robust) 选项加以设定;
* (3) 该命令不会自动进行AR(2)序列相关检验和Sargan过度识别检验
* 序列相关检验
estat abond
* 过度识别检验
estat sargan /*稳健型估计下无法获得Sargan统计量*/
* 正确方法
local xx "size tang ndts L(0/1).tobin L(0/1).npr yr*"
xtdpdsys tl `xx', twostep
estat sargan
* Case II:假设Tobin和npr为先决变量
local xx "size tang ndts yr*" /*此处不应再包含tobin和npr*/
xtdpdsys tl `xx', pre(tobin npr,lag(1,.)) twostep
est store dycs_2pre
estat abond
estat sargan
* Case III:假设Tobin和npr为内生变量
local xx "size tang ndts yr*" /*此处不应再包含tobin和npr*/
xtdpdsys tl `xx', endog(tobin npr,lag(1,.)) twostep
est store dycs_2endog
estat abond
estat sargan
* Case IV: 假设除了年度虚拟变量和公司规模外,所有解释变量均为先决变量local xx "size yr*"
xtdpdsys tl `xx', pre(tobin npr,lag(1,.)) ///
pre(tang ndts) twostep
est store dycs_2preAll
estat abond
estat sargan
* 假设除L.tl 外的所有解释变量外生最为合适。
* OLS 估计(调整系数的上限)
local xx "size tang ndts L(0/1).tobin L(0/1).npr yr*"
reg tl L.tl `xx', robust
est store dycs_2OLS
* FE 估计(调整系数的下限)
local xx "size tang ndts L(0/1).tobin L(0/1).npr yr*"
xtreg tl L.tl `xx', robust fe
est store dycs_2FE
* 结果对比
local mm "dycs_2sys dycs_2pre dycs_2endog dycs_2preAll dycs_2OLS dycs_2FE"
local ss "ar2 ar2p sargan sar_df sarganp"
esttab `mm',mtitle(`mm') scalar(`ss') compress
* 结论:
* (1) 估计出的调整系数介于合理的范围内,即OLS和FE之间;
* (2) 就模型设定而言,dycs_2sys 最为合理,即把所有解释变量均设定为外生变量。
*
* 调整半周期为:
local xx "size tang ndts L(0/1).tobin L(0/1).npr yr*"
xtdpdsys tl `xx', vce(robust) twostep
dis ln(2) / (1 - _b[L1.tl]) /*调整半周期*/
* ==========================
* 7.8 动态面板模型
* Part III
cd D:\stata10\ado\personal\Net_course\B7_Panel
*-----------------------
*------ xtdpd 命令------
*-----------------------
* 仅适用于Stata10 版本;
* 该命令由xtabond2 命令修改而来,是xtabond 和xtdpdsys 命令的综合;
* 因此,即可估计-一阶差分GMM-,又可估计-系统GMM-
* 只是选项的设定相对复杂一些;
* 尚可对干扰项v[i,t] 的结构做更加复杂的设定,如v[i,t]--MA(1),
* 这是该命令的主要有点所在;
* 选项释义:
help xtdpd
* 一阶差分估计量,所有解释变量外生
use abdata, clear
xtdpd n L(1/2).n L(0/1).(w ys) k, dgmmiv(n) div(L(0/1).(w ys) k)
est store r1
xtabond n L(0/1).(w ys) k, lag(2)
est store r2
esttab r1 r2
* 语法对比:
* (1) xtdpd 需要设定L(1/2) 来标明解释变量中包含y[i,t-1] 和y[i,t-2]
* 而xtabond 则通过选项lag(2) 来进行这一设定;
* (2) xtdpd 需要明确指定内生变量:选项dgmmiv()
* 以及外生变量:选项div(),
* 而xtabond 命令则无需这些设定,在不附加endog()选项的情况下,
* 只把y[i,t-1] 和y[i,t-2] 视为内生变量;
* 一阶差分估计量,所有解释变量-外生-,稳健型标准误
use abdata, clear
xtdpd n L(1/2).n L(0/1).(w ys) k, dgmmiv(n) div(L(0/1).(w ys) k) vce(robust)
est store r1
xtabond n L(0/1).(w ys) k, lag(2) vce(robust)
est store r2
esttab r1 r2
* 一阶差分估计量,所有解释变量-内生-,稳健型标准误
use abdata, clear
xtdpd L(0/1).(n w k) year yr1979-yr1984, ///
dgmmiv(n w k) div(year yr1979-yr1984) ///
vce(robust)
* 评论:
* (1) 对于dgmmiv(x) 选项中的变量,L(2/.).x 均作为差分方程的工具变量;
* (2) 对于div(x) 选项中的变量,D.x 均作为差分方程的工具变量;
* 练习:
* 如何采用-xtabond- 命令得到上述结果?
* 系统GMM估计量,所有解释变量外生
use abdata, clear
xtdpd n L(1/2).n L(0/1).(w ys) k, dgmmiv(n) lgmmiv(n) div(L(0/1).(w ys) k)
est store r1
xtdpdsys n L(0/1).(w ys) k, lag(2)
est store r2
esttab r1 r2
* 语法对比:
* (1) xtdpd 需要设定L(1/2) 来标明解释变量中包含y[i,t-1] 和y[i,t-2]
* 而xtabond 则通过选项lag(2) 来进行这一设定;
* (2) xtdpd 需要明确指定-差分方程-的内生变量:选项dgmmiv()
* -水平方程-的内生变量:选项lgmmiv()
* 以及-外生变量-:选项div(),
* 而-xtdpdsys- 命令则无需这些设定,在不附加endog()选项的情况下,
* 只把y[i,t-1] 和y[i,t-2] 视为内生变量;
* 系统GMM估计量,所有解释变量-内生-,两阶段估计
use abdata, clear
xtdpd L(0/1).(n w k) yr1979-yr1984, ///
dgmmiv(n w k) lgmmiv(n w k) ///
div(yr1979-yr1984) twostep
est store r1
estat abond
estat sargan
* 关于Sargan 检验和干扰项的设定
* 有些情况下,Sargan检验拒绝原假设有可能是干扰项e[i,t] 不满足i.i.d 假设;
xtdpd n L.n L(0/2).(w k) yr1980-yr1984 year, ///
div(L(0/1).(w k) yr1980-yr1984 year) ///
dgmmiv(n) hascons
estat sargan
* 假设e[i,t]--MA(1),即
*
* y[i,t] = a0*y[i,t-1] + a1*x[i,t] + u_i + e[i,t] + b*e[i,t-1]
*
* 一阶差分可得:
*
* D.y[i,t] = a0*D.y[i,t-1] + a1*D.x[i,t] + D.e[i,t] + b*D.e[i,t-1]
*
* 由于D.e[i,t-1] = e[i,t-1] - e[i,t-2]
* 所以滞后三阶的变量是合理的工具变量
*
xtdpd n L.n L(0/2).(w k) yr1980-yr1984 year, ///
div(L(0/1).(w k) yr1980-yr1984 year) ///
dgmmiv(n,lag(3 .)) hascons /*注意此处的变化*/
estat sargan
*--------------------------
*------ xtlsdvc 命令------
*--------------------------
*- 纠偏LSDV估计(SJ 5-4)
*- 适用范围:大T 小N
*-- 简介
*
* y[i,t] = y[i,t-1]a + x[i,t]b + u[i] + e[i,t] i={1,...,N};t={1,...,T_i},
*
* x[i,t] 是严格外生变量(这是该方法的一个重要假设,也是一个主要的限制)
* u[i] 是个体效应
* e[i,t] i.i.d 干扰项
* 假设u[i] 和e[i,t] 相互独立
*
* 当N 较小时,采用GMM 往往效果欠佳,因为GMM 是基于大样本的;
*
* 此时,bias-corrected LSDV estimator (LSDVC) 是个不错的选择:
* (1) Kiviet (1999) 通过MC 模拟分析表明,
* 在N较小的情况下,采用纠偏LSDV可以纠正90%以上的偏误;
* (2) Bruno (2005,EL) 进一步给出了非平行面板的纠偏方法;
* (3) Bruno(2005,SJ-5-4)的模拟分析标明,只有在所有解释变量严格外生的情况下,* 纠偏LSDV才有较好的表现,否则还是要采用GMM。
*-- 选项
*
*- initial(estimator)
*
* estimator description
* ---------------------------------------------------------------------------------------
* ah Anderson and Hsiao (1982)
* -AH82- estimator, with the dependent variable lagged two times, used as an * instrument for the first-differenced model with no intercept (ivreg)
* ab Arellano and Bond (1991)
* -AB91- estimator with no intercept (xtabond)
* bb Blundell and Bond (1998)
* -BB98- estimator with no intercept, as implemented by the user-written
* Stata routine xtabond2 by Roodman (2003)
* my a row vector of initial values supplied directly by the user
* ---------------------------------------------------------------------------------------
*- bias(#)
*
* determines the accuracy of the approximation:
* #=1 (default) forces an approximation up to O(1/T);
* #=2 forces an approximation up to O(1/NT);
* #=3 forces an approximation up to O(N^{-1}T^{-2}).
* vcov(#)
*
* 采用Bootstrap 获得标准误,# 表示BS的次数。
use abdata, clear
xtlsdvc n w k ys yr1980-yr1984, initial(ah)
est store r_AH82
xtlsdvc n w k ys yr1980-yr1984, initial(ah) first lsdv
* 选项first 呈现IV 估计的结果
* 选项lsdv 呈现FE 的估计结果
* 若想呈现标准误,需附加vcov() 选项,以便获得BS 标准误:xtlsdvc n w k ys yr1980-yr1984, initial(ah) vcov(10)
xtlsdvc n w k ys yr1980-yr1984, initial(ab)
est store r_AB91
xtlsdvc n w k ys yr1980-yr1984, initial(bb)
est store r_BB98
xtreg n L.n w k ys yr1980-yr1984, fe
est store r_FE
xtlsdvc n w k ys yr1980-yr1984, initial(ab) bias(3) vcov(10) est store r_AB_bs
* 对比结果
local mm "r_AH82 r_AB91 r_BB98 r_FE r_AB_bs"
esttab `mm', mtitle(`mm')
* ==========================
* 第七讲面板数据模型
* ==========================
* 7.8 动态面板模型
* Part IV
cd D:\stata10\ado\personal\Net_course\B7_Panel
*-----------------------------
* 模拟分析
*-----------------------------
*
* 主要目的:
* (1) 采用模拟的方法比较不同估计方法的小样本性质;
* (2) 对比不同样本设定下,各种方法的优劣;
*
* 命令:
* -xtarsim-
*
* 参考文献:
* Bruno, G.S.F. 2005.
* Approximating the bias of the LSDV estimator
* for dynamic unbalanced panel data models.
* Economics Letters, 87, 361-366:
对外经济贸易大学金融学院张海洋 然而,该统计量有时候是不一致的,如果在命令中要求报告稳健的Sargan统计量,软件? ;再根会做两阶段GMM估计(先找任意合理的H,令 A=( Z'HZ ,估计出第一步参数,令,估计出第二部参数β ? ,计算出残差项的方差-协方差矩阵)据β 1 2 , 1 根据第二步的参数结果,默默报告出Hansen统计量。整体上说,Hansen统计量好像更靠谱一点,所以报告的时候,更多关注Hansen统计量。(三)动态面板数据现在回到我们的动态面板数据,对数据和模型有如下假定: 1 2 3 4 动态。模型中包含了因变量的滞后项;有个体的固定效应;可以有一些自变量是内生的;除了固定效应之外的误差项可以异方差,可以序列相关; 5 不同个体之间的误差项和不会相关。 6 7 可以有前定的(Predetermined)但不是完全外生的变量。“大N,小T” ,即个体数量要足够多,但时间不用太长。如果时间足够长的话,动态面板误差不会太大,用固定效应即可。从上述要求可以看出,GMM方法特别适合宏观的面板数据分析,因为宏观变量中,很难找出绝对外生的变量,变量之间多少会互相影响。而GMM方法可以“有一些自变量是内生的” ,这可能也是GMM
方法在文献中这么常用的原因。此前已经说过,不能用传统的OLS方法或者固定效应模型进行动态面板数据的分析,那样会得到有偏的估计量。先要对数据进行一定的变换,然后根据不同的矩条件设定开展矩估计。其中数据变换有两种方法,矩条件的设定也有两种方法。 6 对外经济贸易大学金融学院张海洋 1、数据的变换方法:一阶差分还是垂直离差为了消除动态面板数据中的固定效应,通常用的有两种方法:一阶差分 (first difference和垂直离差(orthogonal deviations。一阶差分之前已经介绍过了,这种方法是difference GMM 中默认的方法。缺点是如果数据中有缺失值,那么最终的估计会缺失很多样本,原始数据缺一行往往会导致差分后的数据缺两行。一种替代的方案是用垂直离差(xtabond2 命令中用 orthogonal 选项实现),每个变量减去该变量未来所有观测值的平均值,即: 式子中,为调整权重变量, Tit 是从t 期开始以后观测值的数量。对于非平衡面板,和数据有缺失的面板,这种方法避免了因缺失数据带来的样本损失,因为调整的时候只是把未来的平均值减去,样本数不会因缺失未来个别观测值而受损。然而,对于平衡面板数据,一阶差分和垂直离差估计出来的结果会完全一样。 2、 Different GMM 还是 System GMM 令数据变换之后的回归方程变为(5)这种变换可以是一阶差分,也可以是垂直离差。Different GMM的逻辑是,如果是垂直离差变换,用作为的工具变量;如果是一阶差分变换,用 作为的工具变量,此时。 X it * 对应的工具变量也类似,如果是垂直离差,就用滞后一阶的,如果是差分就用滞后一阶的差分作为工具变量。在实现的时候,为了提高估计的有效性,通常还会加入更高阶的滞后项(滞后差分)作为工具变量。这些变量的加入利用了更多的信息,然而也会带来麻烦,让工具变量的数量随T平方成比例增加。为了控制工具变量的数量,一个选择就是采用collapse选项把这些工具变量变成一列。如果因变量的变化过程接近随机游走,那么Difference GMM的估计量会有较大偏差。 7
STATA 面板数据模型估计命令一览表 一、静态面板数据的STATA 处理命令 εαβit ++=x y it i it 固定效应模型 μβit +=x y it it ε αμit +=it it 随机效应模型 (一)数据处理 输入数据 ●tsset code year 该命令是将数据定义为“面板”形式 ●xtdes 该命令是了解面板数据结构 ●summarize sq cpi unem g se5 ln 各变量的描述性统计(统计分析) ●gen lag_y=L.y /////// 产生一个滞后一期的新变量
gen F_y=F.y /////// 产生一个超前项的新变量 gen D_y=D.y /////// 产生一个一阶差分的新变量 gen D2_y=D2.y /////// 产生一个二阶差分的新变量 (二)模型的筛选和检验 ●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtreg sq cpi unem g se5 ln,fe 对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。 ●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量) (原假设:使用OLS混合模型) ●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0
可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。可见,随机效应模型也优于混合OLS模型。 ●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验) 原假设:使用随机效应模型(个体效应与解释变量无关) 通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣,这需要进行接下来的检验,如下: Step1:估计固定效应模型,存储估计结果 Step2:估计随机效应模型,存储估计结果 Step3:进行Hausman检验 ●qui xtreg sq cpi unem g se5 ln,fe est store fe qui xtreg sq cpi unem g se5 ln,re est store re hausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。此时,需要采用工具变量法和是使用固定效应模型。
第17章 动态面板数据模型 动态面板数据模型 前一章讨论具有固定效应和随机效应的线性静态面板数据模型,但由于经济个体行为的连续性、惯性和偏好等影响,经济行为是一个动态变化过程,这时需要用动态模型来研究经济关系。本章主要讨论动态面板数据模型的一般原理和估计方法,然后介绍了面板数据的单位根检验、协整分析和格朗杰因果检验的相关原理及操作。 17.1.1动态面板模型原理 考虑线性动态面板数据模型为 ' 1p it j it j it i it j Y Y X ρβδε-==+++∑ (17.1.1) 首先进行差分,消去个体效应得到方程为: '1p it j it j it it j Y Y X ρβε-=?=?+?+?∑ (17.1.2) 可以用GMM 对该方程进行估计。方程的有效的GMM 估计是为每个时期设定不同数目的工具,这些时期设定的工具相当于一个给定时期不同数目的滞后因变量和预先决定的变量。这样,除了任何严格外生的变量,可以使用相当于滞后因变量和其他预先决定的变量作为时期设定的工具。例如,方程(17.1.2)中使用因变量的滞后值作为工具变量,假如在原方程中这个变化是独立同分布的,然后在t=3时,第一个时期观察值可作为该设定分析,很显然1i Y 是很有效的工具,因为它与2i Y ?相关的,但与3i ε?不相关。类似地,在t=4时,2i Y 和1i Y 是潜在的工具变量。以此类推,对所以个体i 用因变量的滞后变量,我们可以形成预先的工具变量: 112 12 200000000 i i i i i i i iT Y Y Y W Y Y Y -????? ?=???????? L L L L L L L L L L L L L L L L L L (17.1.3) 每一个预先决定的变量的相似的工具变量便可以形成了。 假设it ε不存在自回归,不同设定的最优的GMM 加权矩阵为: 1 1'1M d i i i H M Z Z --=?? =Ξ ??? ∑ (17.1.4)
工作总结动态ppt 篇一:工作总结PPT范例 篇一:如何写好年终总结ppt 年终 总结报告ppt如何制作 浏览:2313|更新: XX-01-17 15:51 一眨眼就到年底了, 真的时间好快啊,年初的很多情景还历历在目,如今已经到了年关了。有人说:年纪越大, 越会感慨时间快。如果这样判定,必须承认我真的老了。呵呵,年终什么事情一般公司都会 有?那就是铺天盖地的总结报告啊,述职报告啊??搞得职场同志们“哭天喊地、哭声震天”! 我观察过很多朋友写年终总结,最近还有好几个朋友让我给他们的年终总结出出主意,我觉 得大家对年终总结报告ppt认识上可能还是不是非常清晰,感觉这个事情是个累赘:一是没 思路,不知道写什么,尤其对刚刚进入职场的菜鸟来说,这绝对是个大问题;二是不想做, 但是逃又逃不掉,这是很令人崩溃的事情。这就好比
你很烦新闻联播,但是每到7点,看的 很多台都是新闻联播??. 撰写年终总结ppt大致分三个步骤(tdr三部曲): 第一步:确定大纲(think) 第二步:优化ppt(design) 第三步:练习演讲(rehearse)下面我就简要说一下这三个步骤。 方法/步骤 1 第一步:确定大纲(think). 要点一:先写word,在写ppt. 很多朋友来email问我:“写总结时候,究竟写word 好呢?还是写ppt好呢?”说实话,我 觉得这个问题有点萌。为什么呢?因为这个问题不应该问我,应该问你老板! 目前大多数公司都是用ppt做年终总结报告的,所以在此我讨论如何用ppt写总结报告。 对大多数人来说,我觉得直接写ppt的年终报告是有困难的。为什么呢?因为ppt上面不仅 仅体现你的文字功底(word的水平),而且体现你设计的水平。很多哥们写着写着就开始“堆
动态规划的特点及其应用 摘要:本文的主要内容就是分析它的特点。第一部分首先探究了动态规划的本质,因为动态规划的特点是由它的本质所决定的。第二部分从动态规划的设计和实现这两个角度分析了动态规划的多样性、模式性、技巧性这三个特点。第三部分将动态规划和递推、搜索、网络流这三个相关算法作了比较,从中探寻动态规划的一些更深层次的特点。文章在分析动态规划的特点的同时,还根据这些特点分析了我们在解题中应该怎样利用这些特点,怎样运用动态规划。这对我们的解题实践有一定的指导意义。本文介绍了动态规划的基本思想和基本步骤,通过实例研究了利用动态规划设计算法的具体途径,讨论了动态规划的一些实现技巧,并将动态规划和其他一些算法作了比较,最后还简单介绍了动态规划的数学理论基础和当前最新的研究成果。 关键词: 动态规划,阶段 1 引言 动态规划是运筹学的一个分支,是求解决策过程最优化的数学方法。20世纪50年代初美国数学家R.E.Bellman 等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优化原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法——动态规划。1957年出版了他的名著Dynamic Programming,这是该领域的第一本著作。 动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。 虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。 2 动态规划的基本思想 一般来说,只要问题可以划分成规模更小的子问题,并且原问题的最优解中包含了子问题的最优解(即满足最优子化原理),则可以考虑用动态规划解决。动态规划的实质是分治思想和解决冗余,因此,动态规划是一种将问题实例分解
********* 计量分析与STA TA应用********* * 主讲人:连玉君博士 * 单位:中山大学岭南学院金融系 * 电邮: arlionn@https://www.wendangku.net/doc/0710087588.html, * 主页: https://www.wendangku.net/doc/0710087588.html,/arlion * ::高级部分:: * 计量分析与Stata应用 第七讲面板数据模型 * ========================== * 7.8 动态面板模型 * Part I cd D:\stata10\ado\personal\Net_course\B7_Panel *------------------------------- * 动态面板模型 *------------------------------- * 7.8.1 简介 * 7.8.2 一阶差分IV估计量(Anderson and Hisao, 1982) * 7.8.3 一阶差分GMM估计量(Arellano and Bond, 1991) * 7.8.4 系统GMM估计量(AB,1995; BB,1998) * 7.8.5 纠偏LSDV估计 * 7.8.6 各种估计方法的对比分析——一个模拟 * == 简介== * * 模型:y[it] = a0*y[it-1] + a1*x[it] + a2*w[it] + u_i + e[it] * * 特征:解释变量中包含了被解释变量的一阶滞后项 * 可以是非平行面板,但要保证时间连续 * x[it] ——严格外生变量E[x_it,e_is] =0 for all t and s * 即,所有干扰项与x都不相关 * w[it] ——先决变量E[w_it,e_is]!=0 for s
动态规划经典教程 引言:本人在做过一些题目后对DP有些感想,就写了这个总结: 第一节动态规划基本概念 一,动态规划三要素:阶段,状态,决策。 他们的概念到处都是,我就不多说了,我只说说我对他们的理解: 如果把动态规划的求解过程看成一个工厂的生产线,阶段就是生产某个商品的不同的环节,状态就是工件当前的形态,决策就是对工件的操作。显然不同阶段是对产品的一个前面各个状态的小结,有一个个的小结构成了最终的整个生产线。每个状态间又有关联(下一个状态是由上一个状态做了某个决策后产生的)。 下面举个例子: 要生产一批雪糕,在这个过程中要分好多环节:购买牛奶,对牛奶提纯处理,放入工厂加工,加工后的商品要包装,包装后就去销售……,这样没个环节就可以看做是一个阶段;产品在不同的时候有不同的状态,刚开始时只是白白的牛奶,进入生产后做成了各种造型,从冷冻库拿出来后就变成雪糕(由液态变成固态=_=||)。每个形态就是一个状态,那从液态变成固态经过了冰冻这一操作,这个操作就是一个决策。 一个状态经过一个决策变成了另外一个状态,这个过程就是状态转移,用来描述状态转移的方程就是状态转移方程。 经过这个例子相信大家对动态规划有所了解了吧。 下面在说说我对动态规划的另外一个理解: 用图论知识理解动态规划:把动态规划中的状态抽象成一个点,在有直接关联的状态间连一条有向边,状态转移的代价就是边上的权。这样就形成了一个有向无环图AOE网(为什么无环呢?往下看)。对这个图进行拓扑排序,删除一个边后同时出现入度为0的状态在同一阶段。这样对图求最优路径就是动态规划问题的求解。 二,动态规划的适用范围 动态规划用于解决多阶段决策最优化问题,但是不是所有的最优化问题都可以用动态规划解答呢? 一般在题目中出现求最优解的问题就要考虑动态规划了,但是否可以用还要满足两个条件: 最优子结构(最优化原理) 无后效性 最优化原理在下面的最短路径问题中有详细的解答; 什么是无后效性呢? 就是说在状态i求解时用到状态j而状态j就解有用到状态k…..状态N。 而求状态N时有用到了状态i这样求解状态的过程形成了环就没法用动态规划解答了,这也是上面用图论理解动态规划中形成的图无环的原因。 也就是说当前状态是前面状态的完美总结,现在与过去无关。。。 当然,有是换一个划分状态或阶段的方法就满足无后效性了,这样的问题仍然可以用动态规划解。 三,动态规划解决问题的一般思路。 拿到多阶段决策最优化问题后,第一步要判断这个问题是否可以用动态规划解决,如果不能就要考虑搜索或贪心了。当却定问题可以用动态规划后,就要用下面介绍的方法解决问题了:(1)模型匹配法: 最先考虑的就是这个方法了。挖掘问题的本质,如果发现问题是自己熟悉的某个基本的模型,就直接套用,但要小心其中的一些小的变动,现在考题办都是基本模型的变形套用时要小心条件,三思而后行。这些基本模型在先面的分类中将一一介绍。 (2)三要素法 仔细分析问题尝试着确定动态规划的三要素,不同问题的却定方向不同: 先确定阶段的问题:数塔问题,和走路问题(详见解题报告) 先确定状态的问题:大多数都是先确定状态的。 先确定决策的问题:背包问题。(详见解题报告) 一般都是先从比较明显的地方入手,至于怎么知道哪个明显就是经验问题了,多做题就会发现。 (3)寻找规律法: 这个方法很简单,耐心推几组数据后,看他们的规律,总结规律间的共性,有点贪心的意思。 (4)边界条件法 找到问题的边界条件,然后考虑边界条件与它的领接状态之间的关系。这个方法也很起效。 (5)放宽约束和增加约束 这个思想是在陈启锋的论文里看到的,具体内容就是给问题增加一些条件或删除一些条件使问题变的清晰。 第二节动态规划分类讨论
最短路径问题 下图给出了一个地图,地图中每个顶点代表一个城市,两个城市间的连线代表道路,连线上的数值代表道路长度。 现在,我们想从城市a到达城市E。怎样走才能使得路径最短,最短路径的长度是多少?设DiS[x]为城市x到城市E的最短路径长度(x表示任意一个城市); map[i,j]表示i,j两个城市间的距离,若map[i,j]=0,则两个城市不通; 我们可以使用回溯法来计算DiS[x]: var S:未访问的城市集合; function search(who{x}):integer; {求城市who与城市E的最短距离} begin if Who=E Then Search←0 {找到目标城市} Else begin min←maxint;{初始化最短路径为最大} for i 取遍所有城市 Do if(map[Who,i]>0{有路})and(i S{未访问}) then begin S←S-[i];{置访问标志} j←map[Who,i]+ search(i); {累加城市E至城市Who的路径长度} S←S+[i]; {回溯后,恢复城市i未访问状态} if j<min Then min←j; {如果最短则记下} end;{then} search←min;{返回最短路径长度} End;{else} End;{search} begin S←除E外的所有城市; Dis[a]←search(a);{计算最短路径长度} 输出Dis[a]; end.{main} 这个程序的效率如何呢?我们可以看到,每次除了已经访问过的城市外,其他城市都要访问,所以时间复杂度为O(n!),这是一个“指数级”的算法。那么,还有没有效率更高的解题方法呢?
第17章 动态面板数据模型 17.1 动态面板数据模型 前一章讨论具有固定效应和随机效应的线性静态面板数据模型,但由于经济个体行为的连续性、惯性和偏好等影响,经济行为是一个动态变化过程,这时需要用动态模型来研究经济关系。本章主要讨论动态面板数据模型的一般原理和估计方法,然后介绍了面板数据的单位根检验、协整分析和格朗杰因果检验的相关原理及操作。 17.1.1动态面板模型原理 考虑线性动态面板数据模型为 '1p it j it j it i it j Y Y X ρβδε-==+++∑ (17.1.1) 首先进行差分,消去个体效应得到方程为: '1p it j it j it it j Y Y X ρβε-=?=?+?+?∑ (17.1.2) 可以用GMM 对该方程进行估计。方程的有效的GMM 估计是为每个时期设定不同数目的工具,这些时期设定的工具相当于一个给定时期不同数目的滞后因变量和预先决定的变量。这样,除了任何严格外生的变量,可以使用相当于滞后因变量和其他预先决定的变量作为时期设定的工具。例如,方程(17.1.2)中使用因变量的滞后值作为工具变量,假如在原方程中这个变化是独立同分布的,然后在t=3时,第一个时期观察值可作为该设定分析,很显然1i Y 是很有效的工具,因为它与2i Y ?相关的,但与3i ε?不相关。类似地,在t=4时,2i Y 和1i Y 是潜在的工具变量。以此类推,对所以个体i 用因变量的滞后变量,我们可以形成预先的工具变量: 11212200000000i i i i i i i iT Y Y Y W Y Y Y -??????=???????? (17.1.3) 每一个预先决定的变量的相似的工具变量便可以形成了。 假设it ε不存在自回归,不同设定的最优的GMM 加权矩阵为: 1 1'1M d i i i H M Z Z --=??=Ξ ???∑ (17.1.4)
引言——由一个问题引出的算法 考虑以下问题 [例1] 最短路径问题 现有一张地图,各结点代表城市,两结点间连线代表道路,线上数字表示城市间的距离。如图1所示,试找出从结点A到结点E的最短距离。 图 1 我们可以用深度优先搜索法来解决此问题,该问题的递归式为 其中是与v相邻的节点的集合,w(v,u表示从v到u的边的长度。 具体算法如下: 开始时标记所有的顶点未访问过,MinDistance(A就是从A到E的最短距离。 这个程序的效率如何呢?我们可以看到,每次除了已经访问过的城市外,其他城市都要访问,所以时间复杂度为O(n!,这是一个“指数级”的算法,那么,还有没有更好的算法呢? 首先,我们来观察一下这个算法。在求从B1到E的最短距离的时候,先求出从C2到E的最短距离;而在求从B2到E的最短距离的时候,又求了一遍从C2到E的最短距离。也就是说,从C2到E的最短距离我们求了两遍。同样可以发现,在求从C1、C2到E的最短距离的过程中,从D1到E的最短距离也被求了两遍。而在整个程序中,从D1到E的最短距离被求了四遍。如果在求解的过程中,同时将求得的最短距离"记录在案",随时调用,就可以避免这种情况。于是,可以改进该算法,将每次求出的从v到E的最短距离记录下来,在算法中递归地求MinDistance(v时先检查以前是否已经求过了MinDistance(v,如果求过了则不用重新求一遍,只要查找以前的记录就可以了。这样,由于所有的点有n个,因此不同的状态数目有n 个,该算法的数量级为O(n。 更进一步,可以将这种递归改为递推,这样可以减少递归调用的开销。 请看图1,可以发现,A只和Bi相邻,Bi只和Ci相邻,...,依此类推。这样,我们可以将原问题的解决过程划分为4个阶段,设
第七章动态规划 规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所谓多阶段决策问题是指这样一类活动过程:它可以分解为若干个互相联系的阶段,在每一阶段分别对应着一组可供选取的决策集合;即构成过程的每个阶段都需要进行一次决策的决策问题。将各个阶段的决策综合起来构成一个决策序列,称为一个策略。显然,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略。当过程采取某个具体策略时,相应可以得到一个确定的效果,采取不同的策略,就会得到不同的效果。多阶段的决策问题,就是要在所有可能采取的策略中选取一个最优的策略,以便得到最佳的效果。动态规划(dynamic programming)同前面介绍过的各种优化方法不同,它不是一种算法,而是考察问题的一种途径。动态规划是一种求解多阶段决策问题的系统技术,可以说它横跨整个规划领域(线性规划和非线性规划)。当然,由于动态规划不是一种特定的算法,因而它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,动态规划必须对具体问题进行具体的分析处理。在多阶段决策问题中,有些问题对阶段的划分具有明显的时序性,动态规划的“动态”二字也由此而得名。动态规划的主要创始人是美国数学家贝尔曼(Bellman)。20世纪40年代末50年代初,当时在兰德公司(Rand Corporation)从事研究工作的贝尔曼首先提出了动态规划的概念。1957年贝尔曼发表了数篇研究论文,并出版了他的第一部著作《动态规划》。该著作成为了当时唯一的进一步研究和应用动态规划的理论源泉。1961年贝尔曼出版了他的第二部著作,并于1962年同杜瑞佛思(Dreyfus)合作出版了第三部著作。在贝尔曼及其助手们致力于发展和推广这一技术的同时,其他一些学者也对动态规划的发展做出了重大的贡献,其中最值得一提的是爱尔思(Aris)和梅特顿(Mitten)。爱尔思先后于1961年和1964年出版了两部关于动态规划的著作,并于1964年同尼母霍思尔(Nemhauser)、威尔德(Wild)一道创建了处理分枝、循环性多阶段决策系统的一般性理论。梅特顿提出了许多对动态规划后来发展有着重要意义的基础性观点,并且对明晰动态规划路径的数学性质做出了巨大的贡献。 动态规划在工程技术、经济管理等社会各个领域都有着广泛的应用,并且获得了显著的效果。在经济管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存管理问题、排序问题、设备更新问题以及生产过程最优控制问题等,是经济管理中一种重要的决策技术。许多规划问题用动态规划的方法来处理,常比线性规划或非线性规划更有效。特别是对于离散的问题,由于解析数学无法发挥作用,动态规划便成为了一种非常有用的工具。 动态规划可以按照决策过程的演变是否确定分为确定性动态规划和随机性动态规划;也可以按照决策变量的取值是否连续分为连续性动态规划和离散性动态规划。本教材主要介绍动态规划的基本概念、理论和方法,并通过典型的案例说明这些理论和方法的应用。 §7.1 动态规划的基本理论 1.1多阶段决策过程的数学描述 有这样一类活动过程,其整个过程可分为若干相互联系的阶段,每一阶段都要作出相应的决策,以使整个过程达到最佳的活动效果。任何一个阶段(stage,即决策点)都是由输入(input)、决策(decision)、状态转移律(transformation function)和输出(output)构成的,如图7-1(a)所示。其中输入和输出也称为状态(state),输入称为输入状态,输出称为输出状态。
面板数据与Eviews操作指南 https://www.wendangku.net/doc/0710087588.html, 新浪微博:数说工作室 一、面板数据简介 二、静态面板数据及Eviews实现 (1) 静态面板数据简介 (2) EVIEWS操作 三、动态面板数据及Eviews实现 (1)动态面板数据简介 (2)Eviews操作
一、面板数据简介 信息技术的发展使得数据越来越膨胀,传统的截面数据和时间序列已经不能全面刻画经济的演变,在大数据背景下,同时分析比较横截面观察值和时间序列观察值的需求越来越大。面板数据就是指既含有截面又含有时间序列的数据,分析比较这种数据的模型就是面板数据模型。 相对于一般的回归模型,面板数据模型不仅能够更好的识别和度量单纯时间序列模型和单纯横截面数据模型所不能发现的影响因素,而且可以克服多重共线性的困扰,能够提供更多的信息、更多的变化、更高的自由度和更高的估计效率,减少共线性。因此,面板数据可以更准确地刻画更为复杂的经济行为,具有更好的理论价值和应用价值。 按照模型中是否含有滞后项,又分为静态面板数据和动态面板数据,本指南将分别简介原理和Eviews操作方法。 二、静态面板数据及Eviews实现 (1) 静态面板数据简介 一般的静态面板数据模型的一般形式如下: yy ii ii=CC+bbxx ii ii+vv ii ii,ii=11,…NN,ii=11,…,TT (1)其中C为截距,v it为误差项,i为截面下标,N表示截面的个数,t为时间下标,T表示时间序列的长度。面板数据由于同时含有了多个横截面数据,有时需要考虑不同横截面个体存在的特殊效应,其误差项被设定为: vv ii ii=ααii+ee ii ii(2)其中αi代表个体效应,反映了不同个体之间的差别。 当个体效应为固定常数时,式(1)为固定效应模型,此时每个个体截面都有不同的截距项α1、α2...αn,即其分布式与X it是有关的,反映了该个体的固定效应,因此固定效应模型又称为相关效应模型,严格说来,这个名字更加准确。固定效应模型的形式为: yy ii ii=CC+bbxx ii ii+ααii+vv ii ii,ii=11,…NN,ii=11,…,TT (3) 用矩阵表示为:
动态面板数据编程的主要步骤: 首先导入处理模块 ssc install xtabond2 然后导入并定义面板数据 use “1.dta” xtset id t,yearly 现在进入xtabond2命令介绍: [by id]:xtabond2 y x [if] [in],[,options] 其中options可以包括: noconstant 方程中没有常数项 diffvars(varlist),已差分的外生变量 inst(varlist)其他工具变量 lags(#),滞后阶数,系统默认1,例如gmm(x y,laglimits(2 2))即定义最大滞后为2阶。maxlags(#),工具变量最大滞后阶数 maxldep(#),工具变量的别解释变量的最大滞后阶数 twostep,两步估计 endogenous(varlist[...]),内生变量 vce, gmm robust,注:这两个可以同时使用,但是robust和by id(或t)不可以同时使用level(#),显著水平,系统默认为95 artests,AR检验滞后阶数,默认为2,其实这个不必注明,gmm会检验 有时候分析必须有nomata 不然无法分析 还可以有 small 小样本t、F统计量 我常使用的编程: [by id]:xtabond2 y x L.y L.x L2.x,gmm(x y,laglimits(2 2))iv(varlist) nolevel small nomata 系统GMM是对差分GMM的扩展。差分GMM是对原方程作差分,使用变量滞后阶作为工具变量。差分GMM的缺陷有:差分时消除了非观测截面个体效应及不随时间变化的其他变量,且有时变量滞后阶并非理想工具变量。系统GMM相当于联立了差分方程和原水平方程,使用变量滞后阶作为差分方程的工具变量,同时使用差分变量的滞后项作为水平方程的工具变量。
动态面板数据分析算法 1. 面板数据简介 面板数据(Panel Data, Longitudinal Data ),也称为时间序列截面数据、混合数据,是指同一截面单元数据集上以不同时间段的重复观测值,是同时具有时间和截面空间两个维度的数据集合,它可以被看作是横截面数据按时间维度堆积而成。自20世纪60年代以来,计量经济学家开始关注面板数据以来,特别是近20年,随着计量经济学理论,统计方法及计量分析软件的发展,面板数据计量经济分析已经成为计量经济学研究最重要的分支之一。 面板数据越来越多地被应用到计量模型的研究中,其在实证分析中的优点是明显的:相对于只具有一个时点的横截面数据模型,面板数据包含了更多时间维度的数据,从而可以利用更多的信息来分析所研究问题的动态关系;而时间序列模型,其数据往往是由个体数据加总产生的,在实际计量分析中,在研究其动态调整行为时,由于个体差异被忽略,其估计结果有可能是有偏的,而面板数据模型能够通过截距项,捕捉到数据的动态调整过程中的个体差异,有效地减少了由于数据加总所产生的偏误;同时,面板数据同时具有时间和截面空间的两个维度,从而分享了横截面数据和时间序列数据的优点,另外,由于具有更多的观察值,其推断的可靠性也有所增加。 2. 面板数据的建模与检验 设 3. 动态面板数据的建模与检验 所谓动态面板数据模型,是指通过在静态面板数据模型中引入滞后被解释变量以反映动态滞后效应的模型。这种模型的特殊性在于被解释变量的动态滞后项与随机误差组成部分中的个体效应相关,从而造成估计的内生性。 4、步骤详解 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义
例1:求一维数组中连续数之和的最大值。 代码: #include
实验标题 1、矩阵连乘 2、最长公共子序列 3、最大子段和 4、凸多边形最优三角剖分 5、流水作业调度 6、0-1背包问题 7、最优二叉搜索树 实验目的掌握动态规划法的基本思想和算法设计的基本步骤。 实验内容与源码1、矩阵连乘 #include 第17章 动态面板数据模型 17.1 动态面板数据模型 前一章讨论具有固定效应和随机效应的线性静态面板数据模型,但由于经济个体行为的连续性、惯性和偏好等影响,经济行为是一个动态变化过程,这时需要用动态模型来研究经济关系。本章主要讨论动态面板数据模型的一般原理和估计方法,然后介绍了面板数据的单位根检验、协整分析和格朗杰因果检验的相关原理及操作。 17.1.1动态面板模型原理 考虑线性动态面板数据模型为 ' 1p it j it j it i it j Y Y X ρβδε-==+++∑ (17.1.1) 首先进行差分,消去个体效应得到方程为: '1p it j it j it it j Y Y X ρβε-=?=?+?+?∑ (17.1.2) 可以用GMM 对该方程进行估计。方程的有效的GMM 估计是为每个时期设定不同数目的工具,这些时期设定的工具相当于一个给定时期不同数目的滞后因变量和预先决定的变量。这样,除了任何严格外生的变量,可以使用相当于滞后因变量和其他预先决定的变量作为时期设定的工具。例如,方程(17.1.2)中使用因变量的滞后值作为工具变量,假如在原方程中这个变化是独立同分布的,然后在t=3时,第一个时期观察值可作为该设定分析,很显然1i Y 是很有效的工具,因为它与2i Y ?相关的,但与3i ε?不相关。类似地,在t=4时,2i Y 和1i Y 是潜在的工具变量。以此类推,对所以个体i 用因变量的滞后变量,我们可以形成预先的工具变量: 112 12 200000000 i i i i i i i iT Y Y Y W Y Y Y -????? ?=???????? L L L L L L L L L L L L L L L L L L (17.1.3) 每一个预先决定的变量的相似的工具变量便可以形成了。 假设it ε不存在自回归,不同设定的最优的GMM 加权矩阵为: 1 1'1M d i i i H M Z Z --=?? =Ξ ??? ∑ (17.1.4) 动态规划的发展及研究内容 动态规划(dynamic programming)是运筹学的一个分支,是求解决策过程(decision process)最优化的数学方法。20世纪50年代初美国数学家R.E.Bellman等人在研究多阶段决策过程(multistep decision process)的优化问题时,提出了著名的最优化原理(principle of optimality),把多阶段过程转化为一系列单阶段问题,逐个求解,创立了解决这类过程优化问题的新方法——动态规划。1957年出版了他的名著Dynamic Programming,这是该领域的第一本著作。 动态规划问世以来,在经济管理、生产调度、工程技术和最优控制等方面得到了广泛的应用。例如最短路线、库存管理、资源分配、设备更新、排序、装载等问题,用动态规划方法比用其它方法求解更为方便。 虽然动态规划主要用于求解以时间划分阶段的动态过程的优化问题,但是一些与时间无关的静态规划(如线性规划、非线性规划),只要人为地引进时间因素,把它视为多阶段决策过程,也可以用动态规划方法方便地求解。 多阶段决策问题 多阶段决策过程,是指这样的一类特殊的活动过程,问题可以按时间顺序分解成若干相互联系的阶段,在每一个阶段都要做出决策,全部过程的决策是一个决策序列。要使整个活动的总体效果达到最优的问题,称为多阶段决策问题。 引言——由一个问题引出的算法 [例1] 最短路径问题 现有一张地图,各结点代表城市,两结点间连线代表道路,线上数字表示城市间的距离。如图1所示,试找出从结点A到结点E的最短距离。 图1 我们可以用深度优先搜索法来解决此问题,该问题的递归式为 其中是与v相邻的节点的集合,w(v,u)表示从v到u的边的长度。 具体算法如下: function MinDistance(v):integer; begin if v=E then return 0 else begin min:=maxint; for 所有没有访问过的节点i do if v和i相邻then begin 标记i访问过了; t:=v到i的距离+MinDistance(i); 标记i未访问过; if t 竭诚为您提供优质文档/双击可除动态规划法实验心得 篇一:动态规划法实验报告 数学与计算机学院实验报告 一、实验项目信息 项目名称:动态规划法实验实验时间:20XX/04/27实验学时:03学时 实验地点:工科楼二、实验目的及要求 理解动态规划法的设计思想、掌握动态规划法的求解步骤、掌握用动态规划法解题的算法框架。 三、实验环境 计算机windows7 myeclipseprofessional20XXJAVA8 四、实验内容及实验步骤 动态规划法求解最大子段和问题: 划分:先对规模k的问题求解然后再求k+1问题(既k=1然后k=2......)代码: #Adder.java packagecom.chanheng; publicclassAdder{ int[]b=newint[100];//定义辅助数组intmax;//从辅 助数组里面找出最大的值的变量 publicintadd(int[]a){b[0]=a[0];max=b[0];for(inti=1; i if(b[i-1]>0) b[i]=b[i-1]+a[i];elseb[i]=a[i];if(b[i]>max)max=b[i]; } returnmax;}/** *找出组成最大字段和的段*@parama*/ publicvoidgetArray(int[]a){inti,j,k,sum=0;int[]c=ne wint[100];for(i=0;i while(j>=0){sum+=a[j]; if(sum==max)break;j--;} k=i-j; for(intx=0;x } for(intx=0;x system.out.print(c[x]+""); }} } #Tester.java重要动态面板数据模型完全
动态规划的发展及研究内容
动态规划法实验心得