文档库 最新最全的文档下载
当前位置:文档库 › 分位数回归模型及其应用研究

分位数回归模型及其应用研究

分位数回归模型及其应用研究
分位数回归模型及其应用研究

第一组计量经济学理论与方法

分位数回归模型及其应用研究

王桂胜1

(首都经济贸易大学,北京,100026)

摘要:本文在对分位数回归方法的含义和基本原理进行全面分析说明的基础上,对分位数回归方法在PANEL DATA模型中的应用作了深入分析,并对不同回归估计方法在PANEL DATA模型中的估计效果进行了比较分析。在此基础上,通过分别采取一般最小平方法和分位数回归法对中国15省区的人均消费和人均收入的回归方程估计的统计结果比较,发现分位数回归方法在进行某些特殊的PANEL DATA模型估计时具有一定的优势。

关键词:分位数回归、面板数据模型、惩罚分位数回归估计

一、分位数回归研究介绍

自Koenker 和 Bassett (1978)提出线性分位数回归理论以来,分位数回归(QR)即成为近几十年来发展较快、应用广泛的回归模型方法,它不仅深化了对传统回归模型的理解,而且也推广了回归模型的类型和应用,使得回归模型拟合有关统计数据更加准确细致。分位数回归模型是在稳健估计模型基础上发展形成。稳健估计(Robust Estimation)理论包括基于一般凸损失函数的M 估计理论、基于样本秩统计量的R估计理论和基于样本次序统计量的L估计理论等。分位数回归强调以解释变量的分位数来估计推断因变量的分位数,通过建立分位数估计方程,并运用线性规划方法或非参数估计等方法来估计相应于不同分位数的解释变量系数或未知参数。分位数回归是中位数回归和均值回归的推广。分位数回归模型具体又分为四分位数回归、十分位数回归、百分位数回归、LOGIT分位数回归、审查分位数回归等模型。

关于分位数回归研究的最近发展,主要表现在分位数回归技术方法和方法应用等两方面的研究上。具体包括Koenker和Zhijie Xiao (2000) 解决分位数回归过程中存在的特定推断问题; Kim 和Muller (2000) 关于双步分位数回归的渐进特性的研究; Tasche (2001) 对最小分位数回归的无偏性研究; Chernozhukov 和Han Hong (2002) 提出对审查分位数回归的三步评估法;吴建南、Bret- schneider 等(2002) 用蒙特卡罗(Monte Carlo) 方法产生100 个随机数据集合来比较显著权重分析方法与分位数回归的优劣; Kottas 和Krnjaji′c 提出分位数回归中的贝叶斯非参数模型;Koenker(2004)将分位数回归方法运用于PANEL DATA模型估计中,并提出了PQR估计技术及相关理论证明,在此基础上CARLOS LAMARCHE(2006)对PQR估计方法进一步深入探讨并结合实际数据进行实证分析等等。此外是对分位数回归方法的应用研究。在这一方面,Barnes 和W. Hughes (2002) 利用分位数回归对跨部门公债市场的回收进行了分析;Buhai (2004) 在

1王桂胜:男,1970年生,首都经济贸易大学劳动经济学院副教授,清华大学经管学院博士生。

分析介绍了分位数回归方法的基础上,研究了它在持续时期模型和循环结构等式模型中的应用;Leggett 和Craighead 利用分位数回归确定了时间分布和特定风险驱动的影响。国内也有很多学者将分位数回归估计方法运用于医学卫生事业研究、公共管理事业等具有极值分布特点的统计数据研究中。具体如教育收益率估计分析、劳工歧视因素分析等等。

本文将在系统介绍分位数回归模型的含义和基本原理的基础上,重点分析将分位数回归方法与PANEL DATA 模型结合分析的主要形式和估计原理以及相关结果。第二节讨论分位数回归方法的一般原理以及PQR 估计原理,在此基础上提出关于PANEL DATA 的分位数回归模型的PQR 估计方法;第三节分析分位数回归方法在PANEL DATA 模型中的应用以及数据模拟;第四节对本文的分析结果进行总结。

二、分位数回归模型原理

(一)分位数回归的基本原理

一般线性回归模型可设定如下:

01122,k k y a a x a x a x u u =+++++ 为随机扰动项.

在满足高斯-马尔可夫假设前提下,可表示如下:

()01122k k E y x a a x a x a x =++++

其中,01,,,k a a a 为待估解释变量系数。

上述模型即均值回归模型表达式,是对等式两边取数学期望的结果。类似于均值回归模型,也可设定中位数回归模型如下:

()()01122k k M y x a a x a x a x M u =+++++ 其中,()M y x 为关于x 的条件中位数,()M u 为随机扰动项的中位数。以及分位数回归模型如下:

()()01122y k k u Q x a a x a x a x Q ττ=+++++

对于均值回归模型,可采取最小平方法(OLS )估计未知参数;对于中位数回归模型,可采取最小一乘法(或称最小绝对偏差法LAD );而对于分位数回归模型,则可采取线性规划法(LP )估计其最小加权绝对偏差,从而得到解释变量的回归系数。分别可表示如下:

OLS 法:()2

01122min k k E y a a x a x a x -----

求解得:()01122?????k k E y x a a x a x a x =++++ LAD 法:01122min k k E y a a x a x a x -----

求解得:()01122?????k k M

y x a a x a x a x =++++

QR 法:()01122min k k E y a a x a x a x τρ-----

求解得:()01122?????y

k k Q x a a x a x a x τ=++++ 其中,()()()()0,0,1.t t I t τρττ=-<∈。

(二)PANEL DATA 模型与分位数回归方法

考虑一般PANEL DATA 模型,表达式如下:

',1,2,,.1,2,,.it it i it y x u i N t T βα=++==

其中,i 代表不同的样本个体,t 代表不同的样本观察时点,u 表示随机误差项,β表示解释变量的系数向量,αi 表示第i 个样本的不可观察随机效应。

()'

121,,,,it it it itp x x x x = 关于β的估计有两种情形,即固定效应情形和随机效应情形,相应的有两种估计方法。将上述PANEL DATA 模型写成如下矩阵形式:

y X Z u βα=++

固定效应情形下,β的估计量为 ()()2,11min ?,,.y X Z X MX X My M I P P Z Z Z Z αβ

βαβ----''''==-=

随机效应情形下,β的估计量为

假设u ~ N(0,R), α ~ N(0,W),v=Z α+u 。

则有 ()()E vv ZWZ R V ''=+=。可以对此情形PANEL DATA 模型采取GLS 估计法、也可采取反映个体影响的惩罚最小二乘法(PLS )估计回归系数β,分别表述如下:

GLS 法: 1

2min V y X ββ-- PLS 法:112

2,min R W y X αββα---+

二者的共同解为:()111?X V X X V y β---''=。

对于上述PANEL DATA 模型也可采取分位数回归法进行参数估计。为此。建立以下条件分位数方程:

()

()',it y j it i it j i Q x x ταβτα=+ 上述分位数方程假设个体效应是固定的。对此方程,KOENKER (2004)提出了惩罚分位数回归(PQR )方法进行估计。具体如下:

(){}(){}{}()()'1,11111

??,,arg min j J T N N J N j i j it it j i i i j j t i i w y x ταββτλαλρβταλα=======--+∑∑∑∑

其中,w j 为相应于各分位数的权数,λ为调节系数。如果λ=0,则为固定效

应分位数回归估计量(FEQR );如果λ>0,则为惩罚分位数回归估计量(PQR )。此外,KOENKER 还对分位数回归和惩罚分位数回归估计量的渐进特性进行了详细的考察。在此基础上,运用蒙特卡罗模拟法在小样本设定下比较分析了不同回归估计方法的效果,如下表所示: 表 1 最小平方法与分位数回归法的估计效果比较

误差项分布 LS PLS LSFE QR PQR QRFE

正态分布

偏差 0.0031 0.0048 0.0056 0.0048 0.0067 0.0047

均方误差平方根 0.0847 0.0604 0.0668 0.0977 0.0781 0.0815

T 分布

偏差 -0.0062 -0.0054 -0.0051 -0.0063 -0.0101 -0.0082

均方误差平方根 0.1377 0.1031 0.1143 0.1274 0.0881 0.0921

卡方分布

偏差 -0.0068 0.0002 0.0032 -0.0052 0.0063 0.0072

均方误差平方根 0.2155 0.1503 0.1650 0.2362 0.1506 0.1513

由上表可见,对于某些非正态分布,分位数回归估计效果相对较好一些(如表1中的T 分布)。

三、分位数回归方法的应用

分位数回归方法对于具有某些非高斯分布的随机误差项和随机效应的回归方程的系数估计具有较好的效果,这已在理论上得到了论证。本文将运用实际经济数据对比最小平方法与分位数回归方法在PANEL DATA 模型中的估计效果。所用数据来自中国1996-2002年东北、华北和华东15个省、市、自治区的居民人均消费(CP ,不变价格)和人均收入(IP ,不变价格)2。建立关于人均消费与人均收入关系的PANEL DATA 模型,分别采取最小平方法和分位数回归法进行估计,由于样本资料原因,本文仅考虑合并数据下和固定效应下的两种估计方法的估计结果,并进行比较分析。

1、合并数据下最小平方法估计

运用EVIEWS 软件对样本数据进行处理,结果如下:

129.630.76it it CP IP ∧

=+ 其中,判定系数为0.98,常数项T 统计量值为2.0,回归系数T 统计量值为

79.7。

2、固定效应下最小平方法估计

对15个省区设计15个虚拟变量D1,D2,…,D15。其定义为:

1,,1,2,...,15.0,.

i i D =?=??当属于第i 个个体其他

运用EVIEWS 软件,对样本数据进行处理,得到如下结果:

2 注:本数据资料来自张晓峒著《EVIEWS 使用指南与案例》,机械工业出版社,2007年,第261页。

215479.31053.714.20.70it it CP D D IP ∧

=++++

其中,判定系数为0.99,常数项T 统计量值为1.6,回归系数T 统计量值为55。

3、合并数据下分位数回归法估计

将15个省区的数据当作一个个体的数据进行分位数回归估计,运用STATA 软件运行后,得到如下结果:

4、固定效应下分位数回归法估计

与2中固定效应回归一样,可设计15个虚拟变量D1,D2,…,D15,并运用STATA 软件进行分析可得如下结果:

比较分析上述两种回归方法的统计结果,发现在固定效应情形下两种方法回归效果均比合并数据情形下更好;在同一情形下做回归分析,显然分位数回归分析结果更加稳定,各系数估计显著程度更高。因而,分位数回归估计在PANEL DATA 模型中可以发挥重要作用。

四、结论

本文在对分位数回归方法的含义和基本原理进行全面分析说明的基础上,对分位数回归方法在PANEL DATA 模型中的应用作了深入分析,并对不同回归估计方法在PANEL DATA 模型中的估计效果进行了比较分析。一般而言,分位数估计方法在估计具有非正态分布的误差项或不可观察的随机效应时具有一定优势。本文在理论分析之后,提供了一个应用案例分析,通过对我国人均收入和人均消费的各种回归分析,充分证明了分位数回归的较好效果。当然,由于样本数据的不足,缺乏对在随机效应情形下两种回归方法估计的效果比较,以及在不同调节系数下对惩罚分位数回归估计效果的考察。这将在分位数回归方法的应用分析中进一步开展深入探讨。

参考文献

1.Emanuel Parzen, Quantile Probability and Statistical Data Modeling, [J].Statistical Science, Vol. 19, No. 4, (Nov., 2004), pp. 652-662.

2.Roger Koenker and Zhijie Xiao, Inference on the Quantile Regression Process, [J].Econometrica, Vol. 70, No. 4, (Jul., 2002), pp. 1583-1612.

3.Keming Yu, Zudi Lu, Julian Stander, Quantile Regression: Applications and Current Research Areas,[J]. The Statistician, Vol. 52, No. 3, (2003), pp. 331-350.

4. Roger Koenker and Jose A. F. Machado, Goodness of Fit and Related Inference Processes for Quantile Regression,[J].Journal of the American Statistical Association, Vol. 94, No. 448, (Dec., 1999), pp. 1296 –1310.

5. Keming Yu and M. C. Jones, Local Linear Quantile Regression, [J].Journal of the American Statistical Association, Vol. 93, No. 441, (Mar., 1998), pp. 228 –237.

6. James W. Taylor and Derek W. Bunn, A Quantile Regression Approach to Generating Prediction Intervals,[J] .Management Science, Vol. 45, No. 2, (Feb., 1999), pp. 225-23

7.

7. Rene Gelinas, Alain Martel, Pierre Lefrancois, SOS: A Quantile Estimation Procedure for Dynamic Lot-Sizing Problems,[J]. The Journal of the Operational Research Society, Vol. 46, No. 11, (Nov., 1995), pp. 1337-1351.

8. P. K. Bhattacharya and Ashis K. Gangopadhyay, Kernel and Nearest-Neighbor Estimation of a Conditional Quantile,[J]. The Annals of Statistics, Vol. 18, No. 3, (Sep., 1990), pp. 1400-1415.

9. PORTNOY S. KOENKER R., The Gaussian Hare and the Laplacian

Tortoise :Computability of Squared - error Versus Absolute- error Estimators[J ] . Statistical Science ,1997(12) :279 - 300.

10. Koenker , R. and Bassett , G. 1978.“Regression Quantiles. ”[J ] . Econometrica. Vol. 46 , pp. 33 - 50.

11.Koenker, R. (2004): “Quantile Regression for Longitudinal Data,” [J],Journal of Multivariate Analysis, 91,74–89.

12.吴建南、马伟,估计极端行为模型:分位数回归方法及其实现与应用,[J]数理统计

与管理,2006、9月,第25卷第5期,536-543。

Research on Quantile Regression Modeling and Its Application

Wang guisheng

(capital university of economics and business,Beijing,100026)

Abstract: This article principally introduces some basic principles of all kinds of quantile regressions and their application. After stating the concepts and estimation equations of general least square method and quantile regression, we especially analyze the principle of penalized quantile regression and its application in Panel data modeling. We contrast the estimation efficiency of two kinds of methods by theoretical and empirical analyses: LS,PLS and QR,PQR. We find that PQR or QR has certain relative advantages over LS or PLS on some estimation of models in which there are non-Gauss distributional stochastic error terms or stochastic effects.

Keywords: quantile regression, Panel data model, penalized quantile regression estimation

面板数据分析简要步骤与注意事项(面板单位根—面板协整—回归分析)

面板数据分析简要步骤与注意事项(面板单位根检验—面板协整—回归分析) 面板数据分析方法: 面板单位根检验—若为同阶—面板协整—回归分析 —若为不同阶—序列变化—同阶建模随机效应模型与固定效应模型的区别不体现为R2的大小,固定效应模型为误差项和解释变量是相关,而随机效应模型表现为误差项和解释变量不相关。先用hausman检验是fixed 还是random,面板数据R-squared值对于一般标准而言,超过0.3为非常优秀的模型。不是时间序列那种接近0.8为优秀。另外,建议回归前先做stationary。很想知道随机效应应该看哪个R方?很多资料说固定看within,随机看overall,我得出的overall非常小0.03,然后within是53%。fe和re输出差不多,不过hausman检验不能拒绝,所以只能是re。该如何选择呢? 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993)很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al.(2002)的改进,提出了检验面板单位根的LLC法。Levin et al.(2002)指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250之间,截面数介于10~250之间)的面板单位根检验。Im et al.(1997)还提出了检验面板单位根的IPS法,但Breitung(2000)发现IPS法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T、BR-T、IPS-W、ADF-FCS、PP-FCS、H-Z分别指Levin,Lin&Chu t*

最新张晓峒分位数回归讲义

第15章分位数回归模型 15.1 总体分位数和总体中位数 15.2 总体中位数的估计 15.3 分位数回归 15.4 分位数回归模型的估计 15.5 分位数回归模型的检验 15.6 分位数的计算与分位数回归的EViews操作 15.7 分位数回归的案例分析 以往介绍的回归模型实际上是研究被解释变量的条件期望。人们当然也关心解释变量与被解释变量分布的中位数,分位数呈何种关系。这就是分位数回归,它最早由Koenker和Bassett(1978)提出,是估计一组回归变量X与被解释变量Y的分位数之间线性关系的建模方法。 正如普通最小二乘OLS回归估计量的计算是基于最小化残差平方和一样,分位数回归估计量的计算也是基于一种非对称形式的绝对值残差最小化,其中,中位数回归运用的是最小绝对值离差估计(LAD,least absolute deviations estimator)。它和OLS主要区别在于回归系数的估计方法和其渐近分布的估计。在残差检验、回归系数检验、模型设定、预测等方面则基本相同。 分位数回归的优点是,(1)能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望(均值),也可以分析解释变量如何影响被解释变量的中位数、分位数等。不同分位数下的回归系数估计量常常不同,即解释变量对不同水平被解释变量的影响不同。 另外,中位数回归的估计方法与最小二乘法相比,估计结果对离群值则表现的更加稳健,而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数回归系数估计量则更加稳健。 15.1 总体分位数和总体中位数 在介绍分位数回归之前先介绍分位数和中位数概念。 对于一个连续随机变量y,其总体第τ分位数是y(τ)的定义是:y小于等于y(τ)的概率是τ,即τ = P( y≤y(τ)) = F(y(τ)) 其中P(?)表示概率,F(y(τ)) 表示y的累积(概率)分布函数(cdf)。 比如y(0.25) = 3,则意味着y≤ 3的概率是0.25。且有 y(τ) = F-1(y(τ)) 即F(y(τ))的反函数是y(τ)。当τ=0.5时,y(τ)是y的中位数。τ= 0.75时,y(τ)是y的第3/4分位数,τ= 0.25时,y(τ) 是y的第1/4分位数。若y服从标准正态分布,y(0.5) = 0,y(0.95) =1.645,y(0.975) =1.960。 另外,如果随机变量y的分布是对称的,那么其均值与中位数是相同的。当其中位数小于均值时,分布是右偏的。反之,分布是左偏的。 对于回归模型,被解释变量y t对以X为条件的第τ分位数用函数y(τ)t|X表示,其含义是:以X为条件的y t小于等于y(τ)t|X的概率是τ。这里的概率是用y t对X的条件分布计算的。且有 y(τ)t|X= F-1(y(τ)t|X) 其中F(y(τ)t|X) 是y t在给定X条件下的累积概率分布函数(cdf)。则y(τ)t|X称作被解释变量y t对X 的条件分位数函数。而F '(y(τ)t|X)= f (y(τ)t|X)则称作分位数概率密度函数。其中F'(y(τ)t|X)表示F(y(τ)t|X)

门限分位数自回归模型及在股市收益自相关分析中的应用

门限分位数自回归模型及在股市收益自相关分析中的应用 摘要:门限分位数自然回归模型是一种非限行分位数回归模型,其可以应用讨论系统之中的门限效应。并且在该模型之中,自然回归阶数以及门限值的确定等都将会为模型的分析效果带来直接的影响。本文主要对门限分位数自然回归模型以及其在股市收益中的相关应用做出分析,希望能够给予同行业的工作人员提供一定参考价值。 关键词:门限分位数;回归模型;股市收益;分析 股市收益的自相关性是金融市场研究中的一个重要问题,研究人员针对于理性预定理论提出了有效的市场假说,奠定了传统的金融学基础。有效的市场假说理论认为在一个有效的市场之中,股市的价格或者收益直接地反映了所有可能会获得的信息,过去的收益以及未来的收益并不相关,股市的收益则是不可以预测的,反而言之如果股市的收益在时间上是自相关的,那么历史收益是可以影响当前的收益的,这也直接表明了有效市场假说是难以成立的,可以采取序列自相关分析的方法,对其有效市场假说做出相应验证。 一、门限分位数自然回归模型的分析 1. 模型的表示分析 主要是记{ yt }作为其1 维响应的变量,然而x =(1,yt -1,yy

-2,…,yt -p)T 主要是为p+1为向量组成的解释变量,然而{ yt }则是为1维门限的白能量,其自然回归模型之中的门限变量通常情况下是需要相应变量{ yt }的滞后项,而γ则表示为门限,其模型如下所示: 和均值自激励门限自然回归的模型进行对比,门限分位数自回归模型存在着下述的优点:一是信息刻画更加全面,回归系数估计在不同的分位点可能存在着不同的表型,同时不同阶段的变量之间关系更加细致。二是具有比较强的稳健性,和均值自激励门限自回归模型要求误差项服从特定分布的不同,其允许误差项服从一般的非对称的分布。 2. 模型的定阶 在门限分位数自然回归之中,最优滞后阶数p的选择是十分重要的,可以通过AIC的准确去进行实现,然而定义AIC的准则则是如下所示: 可以看出,AIC主要由两个部分所组成,一是可以反映出模型的拟合程度,主要是为前半段进行表示。二是反映出模型的复杂城市,则是经过后半段进行表示。 3. 门限效应的诊断检验分析 针对于门限效应而言,其诊断检验主要是包括了以下方面的内容:第一,门限效应存在性检验,主要检验两个阶段的门限效应

Stata门限模型的操作和结果详细解读(完整资料).doc

【最新整理,下载后即可编辑】 一、门限面板模型概览 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗?在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面的例子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站:

分位数回归及其实例

分位数回归及其实例 一、分位数回归的概念 分位数回归(Quantile Regression):是计量经济学的研究前沿方向之一,它利用解释变量的多个分位数(例如四分位、十分位、百分位等)来得到被解释变量的条件分布的相应的分位数方程。与传统的OLS 只得到均值方程相比,它可以更详细地描述变量的统计分布。 传统的线性回归模型描述了因变量的条件分布受到自变量X 的影响过程。普通最dx--乘法是估计回归系数的最基本的方法,它描述了自变量X 对于因变量y 的均值影响。如果模型中的随机扰动项来自均值为零而且同方差的分布,那么回归系数的最dx--乘估计为最佳线性无偏估计(BLUE);如果近一步随机扰动项服从正态分布,那么回归系数的最dx--乘法或极大似然估计为最小方差无偏估计(M Ⅵ甩)。但是在实际的经济生活中,这种假设常常不被满足,饲如数据出现尖峰或厚尾的分布、存在显著的异方差等情况,这时的最小二乘法估计将不再具有上述优良性且稳健性非常差。最小二乘回归假定自变量X 只能影响因变量的条件分布的位置,但不能影响其分布的刻度或形状的任何其他方面。 为了弥补普通最dx--乘法(0Ls)在回归分析中的缺陷,Koenkel"和Pxassett 于1978年提出了分位数回归(Quantile Regression)的思想。它依据因变量的条件分位数对自变量X 进行回归,这样得到了所有分位数下的回归模型。因此分位数回归相比普通最小二乘回归只能描述自变量X 对于因变量y 局部变化的影响而言,更能精确地描述自变量X 对于因变量y 的变化范围以及条件分布形状的影响。 分位数回归是对以古典条件均值模型为基础的最小二乘法的延伸,用多个分位函数来估计整体模型。中位数回归是分位数回归的特殊情况,用对称权重解决残差最小化问题,而其他的条件分位数回归则用非对称权重解决残差最小化。 一般线性回归模型可设定如下: ()((0)),(0,1).x t t I t ρττ=-<∈ 在满足高斯-马尔可夫假设前提下,可表示如下: 01122(|)...k k E y x x x x αααα=++++ 其中u 为随机扰动项k αααα,...,,,210为待估解释变量系数。这是均值回归(OLS )模型表达式,类似于均值回归模型,也可以定义分位数回归模型如下: 01122(|)...()y k k u Q x x x x Q ταααατ=+++++ 对于分位数回归模型,则可采取线性规划法(LP )估计其最小加权绝对偏差,从而得到解释变量的回归系数,可表示如下: 01122min (...)x k k E y x x x ραααα----- 求解得:01122?????(|)y k k Q x a a x a x a x τ=++++

S门限模型的操作和结果详细解读

一、门限面板模型概览? 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗?在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面

的例子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站: 。 Hansen于1996年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门限自回归模型(TAR)的估计和检验。之后,他在门限模型上连续追踪,发表了几篇经典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》,2000年的《Sample splitting and threshold estimation》和2004年与他人合作的《Instrumental Variable Estimation of a Threshold Model》。 在这些文章中,Hansen介绍了包含个体固定效应的静态平衡面板数据门限回归模型,阐述了计量分析方法。方法方面,首先要通过减去时间均值方程,消除个体固定效应,然后再利用OLS(最小二乘法)进行系数估计。如果样本数量有限,那么可以使用自举法(Bootstrap)重复抽取样本,提高门限效应的显著性检验效率。 在Hansen(1999)的模型中,解释变量中不能包含内生解释变量,无法扩展

R软件Logic回归介绍

Package‘LogicReg’ January12,2010 Version1.4.9 Date2010-01-11 Title Logic Regression Author Charles Kooperbergand Ingo Ruczinski Maintainer Charles Kooperberg Depends survival Description Routines for Logic Regression License GPL(>=2) Repository CRAN Date/Publication2010-01-1211:17:05 R topics documented: cumhaz (2) eval.logreg (3) frame.logreg (4) logreg (6) logreg.anneal.control (15) logreg.mc.control (19) logreg.myown (20) logreg.save?t1 (23) logreg.testdat (24) logreg.tree.control (25) logregmodel (26) logregtree (27) plot.logreg (29) plot.logregmodel (31) plot.logregtree (33) predict.logreg (34) 1

2cumhaz print.logreg (36) print.logregmodel (37) print.logregtree (39) Index41 cumhaz Cumulative hazard transformation Description Transforms survival times using the cumulative hazard function. Usage cumhaz(y,d) Arguments y vector of nonnegative survival times d vector of censoring indicators,should b e the same length as y.I f d is missing the data is assumed to be uncensored. Value A vector of transformed survival times. Note The primary use of doing a cumulative hazard transformation is that after such a transformation, exponential survival models yield results that are often very much comparable to proportional haz-ards models.In our implementation of Logic Regression,however,exponential survival models run much faster than proportional hazards models when there are no continuous separate covariates. Author(s) Ingo Ruczinskiand Charles Kooperberg. References Ruczinski I,Kooperberg C,LeBlanc ML(2003).Logic Regression,Journal of Computational and Graphical Statistics,12,475-511. See Also logreg

(完整版)Stata门限模型的操作和结果详细解读

一、门限面板模型概览 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗?在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面的例子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站: https://www.wendangku.net/doc/e917174493.html,/~bhansen/progs/progs_subject.htm。 Hansen于1996年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门限自回归模型(TAR)的估计和检验。之后,他在门限模型上连续追踪,发表了几篇经典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》,2000年的《Sample splitting and threshold estimation》和2004年与他人合作的《Instrumental Variable Estimation of a Threshold Model》。 在这些文章中,Hansen介绍了包含个体固定效应的静态平衡面板数据门限回归模型,阐述了计量分析方法。方法方面,首先要通过减去时间均值方程,消除个体固定效应,然后再利用OLS(最小二乘法)进行系数估计。如果样本数量有限,那么可以使用自举法(Bootstrap)重复抽取样本,提高门限效应的显著性检验效率。 在Hansen(1999)的模型中,解释变量中不能包含内生解释变量,无法扩展应用领域。Caner和Hansen在2004年解决了这个问题。他们研究了带有内生变量和一个外生门限变量的面板门限模型。与静态面板数据门限回归模型有所不同,在含有内生解释变量的面板数据门限回归模型中,需要利用简化型对内生变量进行一定的处理,然后用2SLS(两阶段最小二乘法)或者GMM(广义矩估计)对参数进行估计。 当然,有关门限回归模型的最新研究,还可以参考《Inflation and Growth: New Evidence From a Dynamic Panel Threshold Analysis》(Stephanie Kremer,Alexander Bick,Dieter Nautz,2009)。 二、计量模型的假设、估计和检验 略

江苏县域经济要素关系及演化过程的分位数回归_柯文前

第29卷 第5期2013年9月 地理与地理信息科学 Geography and Geo-Information ScienceVol.29 N o.5Sep tember 2013 收稿日期:2013-02-06; 修回日期: 2013-04-23 基金项目: 国家自然科学基金项目(41071084);江苏省研究生科研创新计划项目(CXZZ13_0398) 作者简介:柯文前(1988-),男,博士研究生,研究方向为区域空间结构与区域发展。*通讯作者E-mail:yuzhaoyuan@nj nu.edu.cndoi:10.7702/dly dlxxkx20130516江苏县域经济要素关系及演化过程的分位数回归 柯文前1,陆玉麒1,俞肇元1*,陈 伟2,王 晗1 (1.南京师范大学地理科学学院,江苏南京210023;2.东北师范大学地理科学学院,吉林长春130024 )摘要:针对经典回归模型的“两难问题”,引入非参数的分位数回归构建了要素关系模型,并以江苏县域经济为案例分析。结果表明:1)相比OLS回归,分位数回归对县域经济总体模拟效果和刻画演化特征能力更优;2)根据变量关系结构,将县域经济发展驱动机制划分为产业结构占优型、一般均衡驱动型和高效均衡驱动型;3)苏锡常各县市受因子波动影响而使得驱动机制发生改变导致演化过程的分位点跃迁,表现出发展路径选择具有多样化的特点。 关键词:分位数回归;经济要素关系;演化过程;区域经济;苏锡常 中图分类号:F127 文献标识码:A 文章编号:1672-0504(2013)05-0072-06 0 引言 区域经济增长与差异演化特征的影响机理分析是区域经济学与经济地理学研究的核心,区域经济系统是多要素(多变量)影响下具有复杂的开放系统, 不同要素组合将形成不同驱动作用。从影响因素出发,利用多指标建立不同地区经济发展的要素关系模型是进行影响机理及时空过程分析的主流手 段[1-5 ]。传统以OLS为代表的经典回归模型在参数 估计方面面临强条件假设和序列检验的“两难问题”,很难全面揭示具有时空多尺度与动态性特征的各类分布信息,尤其体现在极端地区的拟合效果上,导致其分析适用性减弱。分位数回归可通过多个不同分位函数来估计整体模型,相比OLS均值回归模型,该方法放松了正态假设,可从数据的不同分布位置与形状入手,在全面刻画因变量分布特征基础上,对自变量与因变量的条件分布进行统计性描述,不仅在处理非正态、非平稳经济数据方面有更好的解 释,更可最大限度挖掘已有数据中的相关信息[ 6-8 ],从而准确捕捉具有尖峰、厚尾等极端样本的分布特 征。由于该模型估计具有稳健性与鲁棒性[9,10] ,在 有效揭示变量分布与时空过程的内在关系方面显示出独特的优势。 江苏省自改革开放以来,人均GDP由430元升至1990年的2 103元再到2010年的52 448元,区域经济实现了快速增长,成为中国沿海地区发展最快与最具活力的省份之一。然而,区域经济的快速 发展导致区域内部的差异也逐渐扩大,1990年苏南地区发展最快的无锡市区人均GDP达6 433元,而苏北的铜山县人均GDP仅为499元,相差13倍;到了2010年发展水平最高与最低的县市差距更加悬殊, 丰县仅为昆山市的4%,相差高达23倍。在此差异基础上形成了以苏北、 苏中和苏南不同发展水平主导的极端不平衡的区域经济格局。鉴于江苏区域经济差异的典型性与代表性,本文拟以江苏省2000-2010年13个地级市市区和50个县域(包括县级市)共63个县级尺度的空间单元作为实证研究对象,从区域经济发展影响因素的作用过程出发,以分位数回归建立人均GDP为代表的区域经济发展要素关系模型,在较为全面刻画所有样本的分异特征基础上, 深入挖掘不同时期苏锡常等地区要素作用与经济发展的时空分异特征,一方面拓展分位数回归在区域经济发展领域的应用;另一方面,为本区及其他地区经济发展提供决策参考。 1 基本模型与影响因素 1.1 分位数回归模型 若一组独立变量X与响应变量Y满足高斯-马尔可夫假设,两者间OLS均值回归表达式的条件概率表达为:E(y|x)=Xβ, 即因变量相对自变量条件概率的数学期望。考虑Y的条件分布函数为Fy( y|x),则τ分位数为:Q(τ|x)=inf{y:Fy(y|x)≥τ},τ∈(0,1),从而可得线性条件分位数的一般表达式为:Q(τ|x)=X′β( τ)。与一般均值线性回归参数估计普遍采用

Eview面板数据之固定效应模型

Eviews 面板数据之固定效应模型 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== () 1(1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+: RRSS 是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANCOV A 估计的残差平方和或者LSDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data )工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(income )数据以及消费者价格指数(p )分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据

S门限模型的操作和结果详细解读

S门限模型的操作和结果详细解读 文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

一、门限面板模型概览? 如果你不愿意看下面一堆堆的文字,更不想看计量模型的估计和检验原理,那就去《数量经济技术经济研究》上,找一篇标题带有“双门槛(或者双门限)”的文章,浏览一遍,看看文章计量部分列示的统计量和检验结果。这样,在软件操作时,你就知道每一步得到的结果有什么意义,怎么解释了,起码心里会有点印象。? 一般情况下,一个研究生花费在研究上的时间越多,他的成果越丰富,也就是说,研究成果和研究时间存在某种正向关联。但是,这种关联是线性的吗在最初阶段,他可能看了两三年的文献,也没有写出一篇优秀的文章,但是一旦过了这个基础期,他的能量和成果将如火山爆发一样喷涌出来,此时,他投入少量的时间,就能产出大量优质文章。再过几年,他可能会进入另外一种境界,虽然比以前有了极大提高,但是研究进入新的瓶颈期,文章发表的数量减少。由此可以看出,研究成果与研究年限存在一种阶段性的线性关系。这个基础期的结点、瓶颈期的起点就像“门槛”一样把研究阶段分成三个部分,在不同部分,成果和时间的线性关系都不同。这个效应被称为门槛效应或门限效应。? 门限效应,是指当一个经济参数达到特定的数值后,引起另外一个经济参数发生突然转向其它发展形式的现象。作为原因现象的临界值称为门限值。在上面的例

子中,成果和时间存在非线性关系,但是在每个阶段是线性关系。有些人将这样的模型称为门槛模型,或者门限模型。如果模型的研究对象包含多个个体多个年度,那么就是门限面板模型。? 汉森(Bruce E. Hansen)在门限回归模型上做出了很多贡献。了解门限模型最好的办法,首先就要阅读他的文章。他的文章很有特点:条理很清晰,推导过程详细,语言简练,语法不复杂。有关他的论文、程序、数据可以参考Hansen的个人网站:。? Hansen于1996年在《Econometrica》上发表文章《Inference when a nuisance parameter is not identified under the null hypothesis》,提出了时间序列门限自回归模型(TAR)的估计和检验。之后,他在门限模型上连续追踪,发表了几篇经典文章,尤其是1999年的《Threshold effects in non-dynamic panels: Estimation, testing and inference》,2000年的《Sample splitting and threshold estimation》和2004年与他人合作的《Instrumental Variable E s t i m a t i o n o f a T h r e s h o l d M o d e l》。? 在这些文章中,Hansen介绍了包含个体固定效应的静态平衡面板数据门限回归模型,阐述了计量分析方法。方法方面,首先要通过减去时间均值方程,消除个体固定效应,然后再利用OLS(最小二乘法)进行系数估计。如果样本数量有限,那么可以使用自举法(Bootstrap)重复抽取样本,提高门限效应的显着性检验效率。?

无条件分位数回归文献综述与应用实例上

无条件分位数回归:文献综述与应用实例(上) 朱平芳张征宇 2013-1-7 11:17:39 来源:《统计研究》(京)2012年3期第88~96页 内容提要:条件分位数回归(conditional quantile regression,CQR)方法已成为经济学实证研究的常用方法之一。由于CQR 结果的经济学阐释基于过多甚至是不必要的控制变量,这与人们所关心的问题有可能并不一致。例如,在劳动经济学对教育回报的研究中,无论个体的年龄,性别与家庭特征如何,教育程度对于个人收入的异质性影响是人们关注的重点,即人们想了解收入关于教育程度的无条件分位数估计。本文旨在介绍近年来发展起来的无条件分位数回归(unconditional quantile regression,UQR)技术并梳理相关文献。特别地,本文介绍三种重要的无条件分位数回归模型:Firpo,Fortin和Lemieux(2009)提出的再中心化影响函数(recentered influence function,RIF)回归,Frolich和Melly(2010)提出的无条件分位数处理效应模型与Powell(2010)提出的一般无条件分位数回归。另外,论文还运用一个研究居民收入分配格局变化对其医疗支出影响的实例详细说明了新方法的应用。 关键词:条件分位数回归无条件分位数回归 RIF回归处理效应模型 作者简介:朱平芳(1961-),男,浙江兰溪人,1987年毕业于上海财经大学应用统计专业,获经济学硕士学位,2005年毕业于上海社会科学院经济研究所,获经济学博士学位,现为上海社会科学院数量经济研究中心主任,研究员,博士生导师,兼任中国数量

面板数据模型的稳健分析方法研究

面板数据模型的稳健分析方法研究 在计量经济学领域,面板数据是极其重要的一类数据类型。在宏观经济的研究中,面板数据模型被广泛地应用于汇率决定理论、跨国经济增长收敛理论的检验、产业结构的分析、技术创新的研究等领域;在微观经济的研究中,面板数据模型被大量地应用于企业成本分析、就业、家庭消费等领域。 随着面板数据模型在经济领域的广泛应用,传统面板数据分析方法的某些局限性也逐渐凸显出来。首先,面板数据模型通常假定误差项服从正态分布,而实际数据很难满足这种假定,利用传统方法得到的估计可能是有偏的甚至是无效的。 其次,在数据的收集过程中,常常会由于人为因素或其他因素导致数据受到污染,即出现不合理的异常值,这样利用传统方法得到的估计与真实值可能存在较大的偏差,用这种有偏的估计结果分析经济问题会得出不合理的结论。针对这些局限性,中外学者们做了大量的工作,如构造面板数据模型的稳健估计以及研究面板数据的分位数回归模型,然而,这些方法仍存在一些不足。 首先,针对面板数据模型的稳健估计通常是利用Huber损失函数降低异常值影响,这样有两个缺点:一是稳健性不高,二是有效性较低,即估计的方差较大;其次,若面板数据的分位数回归模型中存在内生性,现有的工具变量方法计算复杂且需要估计大量的冗余参数。论文基于面板数据均值回归模型提出了一种更加稳健有效的估计方法(ELS-EL),并将此方法推广到复杂的面板数据模型如广义线性模型、部分线性模型中;此外,本文基于面板数据的分位数回归模型提出了一种两阶段的工具变量方法(2S-IVFEQR),降低了计算复杂度,并将新方法推广到动态面板数据的分位数回归模型中。 论文的主体框架分为七个章节。第一章,介绍了论文的研究背景、研究意义,

第二讲 面板数据线性回归模型

第二讲 面板数据线性回归模型估计、检验和应用 第一节 单因素误差面板数据线性回归模型 对于面板数据y i 和X i ,称 it it it y αε′=++X βit i it u εξ=+ 1,,; 1,,i N t T =="" 为单因素误差面板数据线性回归模型,其中,i ξ表示不可观测的个体特殊效应,it u 表示剩余的随机扰动。 案例:Grunfeld(1958)建立了下面的投资方程: 12it it it it I F C αββε=+++ 这里,I it 表示对第i 个企业在t 年的实际总投资,F it 表示企业的实际价值(即公开出售的股份),C it 表示资本存量的实际价值。案例中的数据是来源于10个大型的美国制造业公司1935-1954共20年的面板数据。 在EViews6中设定面板数据(GRUNFELD.wf1) Eviews6 中建立面板数据 EViews 中建立单因素固定效应模型

1.1 混合回归模型 1 面板数据混合回归模型 假设1 ε ~ N (0, σ2I NT ) 对于面板数据y i 和X i ,无约束的线性回归模型是 y i = Z i δi + εi i =1, 2, … , N (4.1) 其中' i y = ( y i 1, … , y iT ),Z i = [ ιT , X i ]并且X i 是T×K 的,' i δ是1×(K +1)的,εi 是T×1的。 注意:各个体的回归系数δi 是不同的。 如果面板数据可混合,则得到有约束模型 y = Z δ + ε (4.2) 其中Z ′ = (' 1Z ,' 2Z , … ,'N Z ),u ′ = ('1ε,'2ε, … ,' N ε)。 2 混合回归模型的估计 当满足可混合回归假设时, ()1''?Z Z Z Y ?=δ 在假设1下,对于Grunfeld 数据,基于EViews6建立的混合回归模型 3 面板数据的可混合性检验 假设检验原理:基于OLS/ML 估计,对约束条件的检验。 (1) 面板数据可混合的检验 推断面板数据可混合的零假设是: 1 H :对于所有的i 都有δi = δ. 检验约束条件的统计量是Chow 检验的F 统计量

定量研究案例

一篇转帖的文章,作者真的很强大! 本文的缘起: 当初一个舍友来自西部地区,从没学过计量(OLS都没学过)。但毕业论文老板要求用数据说话,发愁。我于心不忍,告诉她:我每天晚上自习回来,睡觉前花10分钟给你讲解一下STATA的操作和出来的各项结果意义。第一天,我讲了OLS。画了一张散点图和一根直线,用了1分钟就让她完全理解了OLS的精髓,这是用来干啥的。后面9分钟讲解了STATA的操作和OLS的各种变种。结果只一个星期,讲完五种方法(下面会介绍),她信心大增。后来一下子发了好几篇CSSCI,计量做的天花乱坠,让人误以为是一个大师。毕业论文也顺利通过。她说我的方法是当今世界上最快的计量速成法。她说,以后有时间要好好看看计量书,打打基础。我推荐她读伍德里奇的那本现代观点。但她论文发表了好多篇,至今还没看那本书。问其原因:“看了一下OLS,跟你讲的没啥区别,就是多了些推导。那些推导看不看都不影响我用软件。现在没空看,先发论文再说。” 我笑其太浮躁。但后来想想,这种学习方法不一定适合所有人,但或许适合一部分人群。因此有必要写出来让这部分人群都有所收获,不会因为发不了CSSCI而担忧,不会因为毕业论文不会做计量而担忧。因此有了本文。你是不是属于这样的人群?请看下面: 本文的目标人群: 1、不懂计量的人; 2、想学计量却苦于缺乏时间的人; 3、想学计量却看不懂、推导不了那些恐怖矩阵的人,也就是不想看推导过程,也想发论文的人。 4、不想看计量书,却想写计量论文,发几篇CSSCI,尽快毕业的人。 5、所有想速成的人。 但是目标人群一定要能看懂STATA软件操作手册的人(或者其他软件操作手册)。如果你不认得手册上的字,不要来告诉我。我也不认得。如果你能找到一个懂STATA、EVIEWS的人给你讲解一下,那么你看不懂手册也无所谓。 本文的目标:不看计量推导、不看计量书籍就能发计量论文,而且是大规模批量生产计量论文,甚至是发经济研究和管理世界。 目标能否实现:取决于你能否掌握本黑客教程的内容,能否阅读软件手册。 申明:不是教你如何抄袭作弊,而是教你写计量论文的方法和捷径。

第三讲 面板数据线性回归模型_n

第三讲 面板数据线性回归模型估计、检验和应用 单因素误差面板数据线性回归模型 对于面板数据y i 和X i ,称 it it it y u α′=++X βit i it u v μ=+ 1,,;1,,i N t T =="" 为单因素误差面板数据线性回归模型,其中,i μ表示不可观测的个体特殊效应,it v 表示剩余的随机扰动。 案例:Grunfeld(1958)建立了下面的投资方程: 12it it it it I F C u αββ=+++ 这里,I it 表示对第i 个企业在t 年的实际总投资,F it 表示企业的实际价值(即公开出售的股份),C it 表示资本存量的实际价值。案例中的数据是来源于10个大型的美国制造业公司1935-1954共20年的面板数据。 在Stata 中设定面板数据(GRUNFELD.dta ) . xtset FN YR panel variable: FN (strongly balanced) time variable: YR, 1935 to 1954 delta: 1 unit 混合回归模型 假设1 u ~ N (0, σ2I NT ) 对于面板数据y i 和X i ,无约束的线性回归模型是 y i = Z i δi + u i i =1, 2, … , N (4.1) 其中'i y = ( y i 1, … , y iT ),Z i = [ ιT , X i ]并且X i 是T×K 的,'i δ是1×(K +1)的,u i 是T×1的。 注意:各个体的回归系数δi 是不同的。 如果面板数据可混合,则得到有约束模型 y = Z δ + u (4.2) 其中Z ′ = ('1Z ,'2Z , … ,'N Z ),u ′ = ('1u ,'2u , … ,' N u )。 在假设1下,对于Grunfeld 数据,建立的混合回归模型 Stata 命令:. regress I F C

相关文档