文档库 最新最全的文档下载
当前位置:文档库 › 09_模型设定偏差、随机解释变量和工具变量

09_模型设定偏差、随机解释变量和工具变量

09_模型设定偏差、随机解释变量和工具变量
09_模型设定偏差、随机解释变量和工具变量

计量经济学简答

简答题:1.选择工具变量的原则是什么:(1)工具变量必须与所替代的随机解释变量高度相关;(2)工具变量与随机误差项不相关(3)工具变量与其它解释变量不相关,避免出现多重共线性。 2.实际经济问题中的多重共线性 (1)经济变量的趋同性(2)滞后变量的引入(3)样本资料的限制 3.序列相关性产生的原因: (1)惯性;(2)模型设定误差;(3)蛛网现象;(4)数据加工。 4、随机解释变量问题及其解决方法。如果存在一个或多个随机变量作为解释变量,则称原模型出现随机解释变量问题。第一、随机解释变量与误差项相互独立;第二、随机解释变量与误差项同期无关,而异期相关;第三、随机解释变量与误差项同期相关;第四、解决方法为工具变量法。 5.随机解释变量产生的后果 1.若相互独立,则参数估计量仍然无偏一致。2 若同期相关,异期不相关,得到的参数估计有偏,但却是一致的3 若同期相关,则估计量有偏且非一致。 6.简述最小二乘估计量的性质:(1)线性性,即它是否是另一随机变量的线性函数;(2)无偏性,即它的均值或期望值是否等于总体的真实值;(3)有效性,即它是否在所有线性无偏估计量中具有最小方差。(4)渐近无偏性,即样本容量趋于无穷大时,是否它的均值序列趋于总体真值;(5)一致性,即样本容量趋于无穷大时,它是否依概率收敛于总体的真值;(6)渐近有效性,即样本容量趋于无穷大时,是否它在所有的一致估计量中具有最小的渐近方差。 7、虚拟变量的作用:(1)表现定性因素对被解释变量的影响(2)提高模型的说明能力与水平(3)季节变动分析。(4)方程差异性检验。 8、虚拟变量设置的原则:如果有定性因素共有个结果需要区别,那么至多引入m-1 个虚拟变量 9、实际经济问题中的多重共线性:(1)经济变量的趋同性(2)滞后变量的引入(3)样本资料的限制 10.引入随机误差形式为了:(1)代表未知的影响因素(2)代表残缺数据(3)代表众多细小的影响因素(4)代表数据观测误差(5)代表模型设定误差(6)变量的随机存在性 11. 12.回归分析的主要内容有:(1)根据样本观测值对经济计量模型参数进行估计,求得回归方程(2)对回归方程、参数估计值进行显著性检验(3)利用回归方程进行分析、评价及预测。 13.叙述原理:最小二乘法:当从模型总体随机抽取n组样本观测值后,最合理的参数估计量应该使得模型能最好的的拟合样本数据:最大似然法:当从模型的总体随机抽取n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该n组样本观测值的概率最大。在满足一系列基本假设的情况下,模型结构参数的最大或然估计量与普通最小二乘估计量是相同的。

Chapter9-受限因变量模型

第1章 受限因变量模型 这一章讨论响应变量仅仅被部分观测到的情况。引入被部分观测到的潜在随机变量y *,y *的实际观测变量为y i 。引入二元指示变量D i ,如果a i < y *? 如果如果如果。 (1) 如果只有当D i = 1时实际观测变量y i 才有观测数据,即:当D i = 1时,潜在变量与实际观测变量相等,而当D i = 0时,y i 没有观测值,这时称数据被截断(truncated ),即小于a i 的数据和大于a i 的数据被截断了。因此截断数据与归并数据的区别在于,对于观测区间外的数据,归并数据将将其都归并为一点,而截断数据没有观测值。 将潜在随机变量y *的基本模型设定为: *i i i y v μσ=+。 (2) 其中μi 为位置参数,σ为刻度参数;v i 为独立于x i 的连续随机扰动项,均值为0,方差为1,其分布函数、密度函数分别为F 、f 。在这些假定条件下,y i *的均值为μi ,方差为σ2,分布函数为*()i i y F μσ -, 概率密度函数为*( )/i i y f μσσ-(证明请参见附录1) 。a i < y i * < b i 等价于i i i i i i i a b c v d μμσ σ --=<< =, 那么y i *被观测到的概率为: *Pr()Pr(1)()()i i i i i i a y b D F d F c <<===- (3) 下面对截断数据模型和归并数据模型分别进行介绍 1.1 截断数据模型 如果样本数据是从总体的一部分抽取得到,我们把这类数据称为截断数据。比如,研究高收入阶层(月收入x ≥ 10000)的消费与收入的关系,所采集的数据只是位于收入总体分布的一个区间里。假设所有居民的收入服从正态分布,那么高收入阶层的收入只是在x ≥ 10000的区间里观测得到的。下面介绍截断数据的分布特征和模型估计。

随机解释变量问题

第四章 随机解释变量问题 1. 随机解释变量的来源有哪些? 答:随机解释变量的来源有:经济变量的不可控,使得解释变量观测值具有随机性;由于随机干扰项中包括了模型略去的解释变量,而略去的解释变量与模型中的解释变量往往是相关的;模型中含有被解释变量的滞后项,而被解释变量本身就是随机的。 2.随机解释变量有几种情形? 分情形说明随机解释变量对最小二乘估计的影响与后果? 答:随机解释变量有三种情形,不同情形下最小二乘估计的影响和后果也不同。(1)解释变量是随机的,但与随机干扰项不相关;这时采用OLS 估计得到的参数估计量仍为无偏估计量;(2)解释变量与随机干扰项同期无关、不同期相关;这时OLS 估计得到的参数估计量是有偏但一致的估计量;(3)解释变量与随机干扰项同期相关;这时OLS 估计得到的参数估计量是有偏且非一致的估计量。 3. 选择作为工具变量的变量必须满足那些条件? 答:选择作为工具变量的变量需满足以下三个条件:(1)与所替代的随机解释变量高度相关;(2)与随机干扰项不相关;(3)与模型中其他解释变量不相关,以避免出现多重共线性。 4.对模型 Y t =β0+β1X 1t +β2 X 2t +β3 Y t-1+μt 假设Y t-1与μt 相关。为了消除该相关性,采用工具变量法:先求Y t 关于X 1t 与 X 2t 回归,得到Y t ?,再做如下回归: Y t =β0+β1X 1t +β2 X 2t +β3Y t ?1 -+μt 试问:这一方法能否消除原模型中Y t-1与μt 的相关性? 为什么? 解答:能消除。在基本假设下,X 1t ,X 2t 与μt 应是不相关的,由此知,由X 1t 与X 2t 估计出的Y t ?应与μt 不相关。 5.对于一元回归模型 Y t =β0+β1X t *+μt 假设解释变量X t *的实测值X t 与之有偏误:X t = X t *+e t , 其中e t 是具有零均值、无序列相关,且与X t *及μt 不相关的随机变量。试问: (1) 能否将X t = X t *+e t 代入原模型,使之变换成Y t =β0+β1X t +νt 后进行估计? 其中,νt 为变换后模型的随机干扰项。 (2) 进一步假设μt 与e t 之间,以及它们与X t *之间无异期相关,那么E(X t-1νt )=0成立 吗?X t 与X t-1相关吗? (3) 由(2)的结论,你能寻找什么样的工具变量对变换后的模型进行估计? 解答:(1)不能。因为变换后的模型为 Y t =β0+β1X t +(μt -β 1e t ) 显然,由于 e t 与X t 同期相关,则说明变换后的模型中的随机干扰项νt =μt -β1e t 与X t 同 期相关。 (2) E(X t-1νt )=E[(X t-1* +e t-1)( μt -β1e t )]

计量经济学经典eviews 离散和受限因变量模型

离散和受限因变量模型 前面所描述的回归方法要求能在连续和无限制的规模上观察到因变量。然而,也经常出现违背上述条件的情形,即产生非连续或受限因变量。我们将会识别三种类型的变量: 1.定性(在离散或排序的规模上); 2.审查或截断; 3.整数估值(计数数据)。 在这章里我们讨论这几种定性和受限因变量模型的估计方法。EViews 提供了二元或排序(普罗比特probit 、逻辑logit 、威布尔gompit ),审查或截断(托比特tobit 等),和计数数据模型的估计程序。 §17.1 二元因变量模型 二元因变量模型(Binary Dependent V ariable Models )估计方法主要发展与20世纪80年代初期。普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策领域的研究。例如,公共交通工具和私人交通工具的选择问题。选择利用公共交通工具还是私人交通工具,取决于两类因素:一类是诸如速度、耗费时间、成本等两种交通工具所具有的属性;一类是决策个体所具有的属性,诸如职业、年龄、收入水平、健康状况等。从大量的统计中,可以发现选择结果与影响因素之间具有一定的因果关系。研究这一关系对制定交通工具发展规划无疑是十分重要的。 在本节介绍的模型中,因变量y 只具有两个值:1或者0。y 可能是代表某一事件出现的虚拟变量,或者是两种选择中的一种。例如,y 可能是每个人(被雇佣或不被雇佣)雇用状况的模型,每一人在年龄、教育程度、种族、婚姻状况和其它可观测的特征方面存在差异,我们将其设为x 。目标是将个体特征和被雇用的概率之间的关系量化。 假定一个二元因变量y ,具有0和1两个值。y 对x 简单的线性回归是不合适的。而且从简单的线性回归中得到y 的的拟合值也不局限于0和1之间。替代地,我们采用一种设定用于处理二元因变量的特殊需要。假定我们用以下模型刻画观察值为1的概率为: Pr )(1),1(ββi i i x F x y '--== 这里F 是一个连续、严格单调递增的函数,它采用实际值并返回一个介于0和1之间的数。F 函数的选择决定了二元模型的类型。可以得到 Pr )(),0(ββi i i x F x y '-== 给出了这样的设定以后,我们能用极大似然估计方法估计模型的参数。极大似然函数为 ∑=--+'--==n i i i i i x F y x F y L 0))(log )1())(1log(()(log )(ββββ 极大似然函数的一阶条件是非线性的,所以得到参数估计需要一种迭代的解决方法。缺省地,EViews 使用二阶导数用于参数估计的协方差矩阵的迭代和计算。 有两种对这种设定的重要的可选择的解释。首先,二元变量经常作为一种潜在的变量规定被生成。假定有一个未被观察到的潜在变量*i y ,它与x 是线性相关的: i i i u x y +'=β* 这里i u 是随机扰动。然后被观察的因变量由*i y 是否超过临界值来决定

计量经济学题库第8章模型中的特殊解释变量

第8章模型中的特殊解释变量 习题 一、单项选择题 1.对于一个含有截距项的计量经济模型,若某定性因素有m个互斥的类型,为将其引入模型中,则需要引入虚拟变量个数为() A. m B. m-1 C. m+1 D. m-k 2.在经济发展发生转折时期,可以通过引入虚拟变量方法来表示这种变化。例如,研究中国城镇居民消费函数时。1991年前后,城镇居民商品性实际支出Y 对实际可支配收入X的回归关系明显不同。现以1991年为转折时期,设虚拟变 量,数据散点图显示消费函数发生了结构性变化:基本消费部分下降了,边际消费倾向变大了。则城镇居民线性消费函数的理论方程可以写作() A. B. C. D. 3.对于有限分布滞后模型 在一定条件下,参数可近似用一个关于的阿尔蒙多项式表示(),其中多项式的阶数m必须满足() A. B. C. D. 4.对于有限分布滞后模型,解释变量的滞后长度每增加一期,可利用的样本数据就会( ) A. 增加1个 B. 减少1个 C. 增加2个 D. 减少2个 5.经济变量的时间序列数据大多存在序列相关性,在分布滞后模型中,这种序列相关性就转化为() A.异方差问题 B. 多重共线性问题 C.序列相关性问题 D. 设定误差问题 6.将一年四个季度对因变量的影响引入到模型中(含截距项),则需要引入虚 拟变量的个数为() A. 4 B. 3 C. 2 D. 1 7.若想考察某两个地区的平均消费水平是否存在显著差异,则下列那个模型比

较适合(Y代表消费支出;X代表可支配收入;D 2、D 3 表示虚拟变量)() A. B. C. D. 二、多项选择题 1.以下变量中可以作为解释变量的有() A. 外生变量 B. 滞后内生变量 C. 虚拟变量 D. 前定变量 E. 内生变量 2.关于衣着消费支出模型为:,其中 Y i 为衣着方面的年度支出;X i 为收入, 则关于模型中的参数下列说法正确的是() A.表示在保持其他条件不变时,女性比男性在衣着消费支出方面多支出(或少支出)差额 B.表示在保持其他条件不变时,大学毕业及以上比其他学历者在衣着消费支出方面多支出(或少支出)差额 C.表示在保持其他条件不变时,女性大学及以上文凭者比男性大学以下文凭者在衣着消费支出方面多支出(或少支出)差额 D. 表示在保持其他条件不变时,女性比男性大学以下文凭者在衣着消费支出方面多支出(或少支出)差额 E. 表示性别和学历两种属性变量对衣着消费支出的交互影响 三、判断题 1.通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与样本容量大小有关。 2.虚拟变量的取值只能取0或1。 3.通过虚拟变量将属性因素引入计量经济模型,引入虚拟变量的个数与模型有无截距项无关。 四、问答题 1.Sen和Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用101个国家的数据,建立了如下的回归模型(括号内的数值为对应参数估计值t值):

第八章__虚拟解释变量回归.doc

第八章虚拟变量回归 第一节虚拟变量 一、虚拟变量的基本概念 在前面的分析中,被解释变量主要受到一些可以直接度量的变量影响,如收入、产出、 商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属 性因素)的影响,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等因素。在实际经济分析中,这些定性变量有时具有不可忽视的重要影响。

例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者素质的高低等是值得经常考虑的影响因素,这些因素有共同的特征,即都是表示某种属性的,不能直接用数据精确描述的因素。因此,被解释变量的变动经常是定量因素和属性因素共同作用的结果。在计量经济模型中,应当同时包含定量和属性两种因素对被解释变量的影响作用。 定量因素是指那些可直接测度的数值型因素,如GDP、M2 等。定性因素,或称为属性 因素,是不能直接测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、城市居民或非城市居民、气候条件正常或异常、政府经济政策不变与改革等。在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。 为了在模型中反映定性因素,可以将定性因素转化为虚拟变量去表现。虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0 和1 的作为属性变量代表的变量,一般用字母 D (或DUM ,英文dummy 的缩写)表示。属性 因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0 时,表示某种属性或状态不出现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1 时,表示某种属性或状态出现或存在,即是某种类型。例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。这种做法 实际上是一种变换或映射,将不能精确计量的定性因素的水平或状态变换为用0 和1 来定量描述。 二、虚拟变量的设置规则 在计量经济学模型中引入虚拟变量,可以使我们同时兼顾定量因素和定性因素的影响和作用。但是,在设置虚拟变量时应遵循一定的规则。 1、虚拟变量数量的设置规则 虚拟变量个数的设置规则是:若定性因素有m 个相互排斥的类型(或属性、水平),在有截距项的模型中只能引入m-1 个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完 全的多重共线性。在无截距项的模型中,定性因素有m个相互排斥的类型时,引入m个虚 拟变量不会导致完全多重共线性,不过这时虚拟变量参数的估计结果,实际上是D=1 时的 样本均值。 例如,城镇居民和农村居民住房消费支出的模型可设定为:

计量经济学期末试卷

第一学期期末考试试卷 《计量经济学》试卷 一、单项选择题(1分×20题=20分) 1.在回归分析中下列有关解释变量和被解释变量的说法中正确的是(c ) A. 被解释变量和解释变量均为随机变量 B. 被解释变量和解释变量均为非随机变量 C. 被解释变量为随机变量,解释变量为非随机变量 D. 被解释变量为非随机变量,解释变量为随机变量 2. 下面哪一个必定是错误的(a )。 A. 8.02.030^ =+=XY i r X Y B. 91.05.175^ =+=XY i r X Y C. 78.01.25^=-=XY i r X Y D. 96.05.312^ -=--=XY i r X Y 3.判断模型参数估计量的符号、大小、相互之间关系的合理性属于(b )准则。 A.计量经济 B.经济理论 C.统计 D.统计和经济理论 4. 判定系数r 2 =0.8,说明回归直线能解释被解释变量总变差的:( a ) A. 80% B. 64% C. 20% D. 89% 5.下图中“{”所指的距离是(b ) A. 随机误差项 B. 残差 C. i Y 的离差 D. i Y ?的离差 X 1?β+ i Y

6. 已知DW 统计量的值接近于2,则样本回归模型残差的一阶自相关系数ρ? 近似等于(a )。 A.0 B. -1 C.1 D. 0.5 7.已知含有截距项的三元线性回归模型估计的残差平方和为800e 2t =∑,估计用 样本容量为n=24,则随机误差项t ε的方差估计量为(b )。 A.33.3 B.40 C.38.09 D.36.36 8.反映由模型中解释变量所解释的那部分离差大小的是(b )。 A.总体平方和 B.回归平方和 C.残差平方和 D.离差和 9. 某企业的生产决策是由模型t t t u P S ++=10ββ描述(其中t S 为产量,t P 为价格),又知:如果该企业在1-t 期生产过剩,决策者会削减t 期的产量。由此判断上述模型存在(b )。 A. 异方差问题 B. 序列相关问题 C. 多重共线性问题 D. 随机解释变量问题 10.产量(X ,台)与单位产品成本(Y ,元/台)之间的回归方程为5X .1356Y ?-=,这说明(d )。 A.产量每增加一台,单位产品成本增加356元 B.产量每增加一台,单位产品成本减少1.5元 C.产量每增加一台,单位产品成本平均增加356元 D.产量每增加一台,单位产品成本平均减少1.5元 11.回归模型25,1i ,X Y i i 10i Λ=++=εββ,中,总体方差未知,检验0 :H 10=β时,所用的检验统计量) ?(S ?111βββ-服从(d )。 A.)2n (2 -χ B. )1n (t - C. )1n (2-χ D. )2n (t - 12.线性回归模型的参数估计量β?是随机变量i Y 的函数,即Y X )X X (?1''=-β。所以β?是(a )。

计量经济学简答

简答1、简述经济计量分析工作的程序设定模型、估计参数、检验模型、应用模型 2、简述回归分析与相关分析区别与联系两者都是研究相关关系的方法。但二者也有区别。相关分析关心的是变量之间的相关程度,但并不能反映变量之间的因果关系;而回归分析则要通过建立回归方程来估计解释变量与被解释变量之间的因果关系。此外,在回归分析中,定义被解释变量为随机变量,解释变量为非随机变量;而在相关分析中,把所考察的变量都看作是随机变量。 3、简述普通最小二乘法估计原理普通最小二乘法简称OLS,是应用最多的参数估计方法,也是从最小二乘原理出发的其他估计方法的基础。具有以下优良特性:残差平方和最小,无偏性和线性特征。 4、简述方差非齐性的后果参数的普通最小二乘估计虽然是无偏的,但却是非有效的。参数估计量的方差是有偏的,这将导致参数的假设检验失效,模型预测失效,是非有效的。 5、简述序列相关的后果当一个线性回归模型的随机误差项存在自相关时,就违背了线性回归方程的古典假定,如果仍然用普通最小二乘法估计参数,将 会产生严重后果。自相关产生的后果与异方差情形 类似。自相关影响OLS估计量的有效性,有效性不 再成立,存在比OLS模型更为有效的估计方法。存 在序列相关时,OLS方法下的各种检验失效,模型 预测失效。因为βi估计的方差不等于OLS方法下 计算的方差。 6、简述多重共线处理方法追加样本信息,使用非样 本先验信息,进行变量形式的转换,使用有偏估计 7、简述DW的局限性DW检验只适合一阶自回归形 式,而并不适用于检验高阶自回归形式或其它形式 的序列相关;模型中不含有滞后因变量。若届时变 量中有滞后变量,则DW检验将会失效;模型中含有 截距项;存在不能判定的区域。 8、简述方差非齐性的检验方法样本分段比较法; 残差回归检验法 9、简述发达市场经济国家模型特点建模依据各 流派经济理论;模型全面反映西方核算体系 10、简述经济计量模型评价的准则经济理论准 则;统计准则;经济计量准则 11、简述需求函数的特性非负性,可加性,零阶齐 次性,对称性,单调性 12、什么是内生变量是指模型要解释的变量。外 生变量决定内生变量,外生变量的变化回应其内生 变量的变化。具有一定概率分布的随机变量,它们 的数值是由模型自身决定的。 13、简述联立方程偏倚在结构式模型中,一些变 量可能在一个方程中作为解释变量,而在另一个方 程中又作为被解释变量,这就使得解释变量与随机 误差项之间存在相关关系,从而违背了最小二乘法 的一个重要假定,估计量因此是有偏的和非一致的。 14、简要说明格兰杰——恩格尔方法考察每个变 量的单整阶数;变量之间的长期均衡关系;误差修 正模型 15、什么是经济计量学它是在定性分析基础上, 专门探讨如何用经济数学模型方法定量描述具有随 机性特征的经济变量关系的边缘科学,或者说,它 是数理经济学和数理统计学的交叉科学。 16、什么是回归分析回归分析研究一个变量对于 一个或多个其它变量的依存关系,其目的在于根据

第七章 虚拟变量和随机解释变量 (2)

第七章 虚拟变量和随机解释变量 本章将讨论两种不同的模型:虚拟变量模型和随机解释变量模型,以及模型设定的其它问题。 第一节 虚拟变量模型 在我们以前考虑的模型中,解释变量都是定量变量(如成本、价格、收入、产出等),但在经济研究中,因变量经常受到一些定性变量的影响(如性别、种族、季节、不同历史时期等),我们把这类定性变量称为虚拟变量。习惯上用D表示虚拟变量,虚拟变量的取值通常为0和1。0表示变量具备某种属性,1表示变量不具备某种属性。 一、包含一个虚拟变量的模型 如果我们要研究的问题中解释变量只分为两类。则需引入一个模拟变量。 例9.1建立模型研究中国妇女在工作中是否受到歧视。 令Y=年薪,X=工作年限 ? ? ?=,女性,男性 101D 可以建立如下模型: i i i i u D B X B B Y +++=210 )1.9( 与一般的回归模型一样,假定0)(=i u E 男性就业者的平均年薪: i i i i X B B D X Y E 10)0,(+== )2.9( 女性就业者的平均年薪: 210)1,(B X B B D X Y E i i i i ++== )3.9( 如果B 2=0则说明不存在性别歧视,如果02

如果随着工龄增加,男性与女性的年薪差距也发生变化,则模型(9.1)就变为 i i i i i u X D B X B B Y +++=210 )4.9( 图9.2描绘了男性年薪增加较快的情况。 我们称虚拟变量只影响斜率而不影响截距的模型为乘法模型如(9.4) 如果男性与女性的初始年薪和年薪增加速度都有差异,我们可以将加法模型和乘法模型 结合起来,得到如下模型 i i i i i i u D B X D B X B B Y ++++=3210 )5.9( 模型(9.5)可以用来表示截距和斜率都发生变化的模型。其图形如图9.3所示。 我们还可以用加法模型与乘法模型相结合的方式建立模型来拟合经济发展出现转折的 情况。例如,进口商品消费支出Y主要取决于国民生产总值X(作为收入的替代变量)的多少。我们改革开放前后,由于国家政策的变化,及改革开放后外资的大量引入等因素的影响,1978年前后,Y 对X 的回归关系明显不同。以t *=1978年为转折点,1978年的国民生产总值X *t 为临界值。设虚拟变量

第7章 随机解释变量

第7章 随机解释变量 单方程线性计量经济学模型假定解释变量是确定性变量,并且与随机误差项不相关,违背这一基本假设的问题被称为随机解释变量问题。本章介绍了随机解释变量问题的概念、产生的原因和后果、检验方法以及解决方法。 随机解释变量问题的概念 对于计量经济模型 n 21i i k i k i 22i 110 ,,, ββββ=+++++=u X X X Y i (7.1.1) 其中一个基本假设是解释变量k 21,,X X X 是确定性变量,即解释变量与随机扰动项不相关。但是在现实经济生活中,这个假定不一定成立,这一方面是因为用于建模的经济变量的观测值一般会存在观测误差,另一方面是经济变量之间联系的普遍性使得解释变量可能在一定程度上依赖于应变量,即解释变量X 影响应变量Y ,而应变量Y 也会反过来影响解释变量X 。 模型中如果存在一个或多个随机变量作为解释变量,就称为模型出现了随机解释变量问题。其中k x 可能与随机误差项u 不相关,就是说,解释变量121,,-k x x x 都是外生的,但k x 有可能在方程(4.4.1)中是内生的,则称原模型存在随机解释变量问题。内生性可能源自于省略误差、测量误差,联立性等①。为讨论方便,我们假设中2X 为随机解释变量。 在模型()中,根据解释变量2X 与随机误差项的关系,可以分为三种类型: 1)随机解释变量与随机干扰项独立 )()(),(),(222===u E x E u x E u X Cov (7.1.2) 2)随机解释变量与随机干扰项同期无关但异期相关 n 21i 0),(),(i 2i 2 ,,, ===u x E u X Cov i i ① 具体详见《Econometric analysis of cross section and panal data 》(Jeffrey Wooldrige,2007 )。

虚拟解释变量回归

虚拟变量回归 第一节虚拟变量 一、虚拟变量的基本概念 在前面的分析中,被解释变量主要受到一些可以直接度量的变量影响,如收入、产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了这些可以直接获得实际观测数据的定量变量外,还包括一些本质上为定性因素(或称属性因素)的影响,例如性别、种族、肤色、职业、季节、文化程度、战争、自然灾害、政府

经济政策的变动等因素。在实际经济分析中,这些定性变量有时具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业部门(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者素质的高低等是值得经常考虑的影响因素,这些因素有共同的特征,即都是表示某种属性的,不能直接用数据精确描述的因素。因此,被解释变量的变动经常是定量因素和属性因素共同作用的结果。在计量经济模型中,应当同时包含定量和属性两种因素对被解释变量的影响作用。 定量因素是指那些可直接测度的数值型因素,如GDP、M2等。定性因素,或称为属性因素,是不能直接测度的、说明某种属性或状态存在与否的非数值型因素,如男性或女性、城市居民或非城市居民、气候条件正常或异常、政府经济政策不变与改革等。在计量经济学的建模中应当将定量因素和定性因素同时纳入模型之内。 为了在模型中反映定性因素,可以将定性因素转化为虚拟变量去表现。虚拟变量(或称为属性变量、双值变量、类型变量、定性变量、二元型变量等),是人工构造的取值为0和1的作为属性变量代表的变量,一般用字母D(或DUM,英文dummy的缩写)表示。属性因素通常具有若干类型或水平,通常虚拟变量的取值为0和1,当虚拟变量取值为0,即D=0时,表示某种属性或状态不出现或不存在,即不是某种类型;当虚拟变量取值为1,即D=1时,表示某种属性或状态出现或存在,即是某种类型。例如,构造政府经济政策人工变量,当经济政策不变时,虚拟变量取值为0,当经济政策改变时,虚拟变量取值为1。这种做法实际上是一种变换或映射,将不能精确计量的定性因素的水平或状态变换为用0 和 1 来定量描述。 二、虚拟变量的设置规则 在计量经济学模型中引入虚拟变量,可以使我们同时兼顾定量因素和定性因素的影响和作用。但是,在设置虚拟变量时应遵循一定的规则。 1、虚拟变量数量的设置规则 虚拟变量个数的设置规则是:若定性因素有m个相互排斥的类型(或属性、水平),在有截距项的模型中只能引入m-1个虚拟变量,否则会陷入所谓“虚拟变量陷阱”,产生完全的多重共线性。在无截距项的模型中,定性因素有m个相互排斥的类型时,引入m个虚拟变量不会导致完全多重共线性,不过这时虚拟变量参数的估计结果,实际上是D=1时的样本均值。 例如,城镇居民和农村居民住房消费支出的模型可设定为:

第14章-受限被解释变量

? 陈强,《高级计量经济学及Stata 应用》课件,第二版,2014 年,高等教育出版社。 第 14 章受限被解释变量 被解释变量的取值范围有时受限制,称为“受限被解释变量”(Limited Dependent Variable)。 14.1 断尾回归 对线性模型y i =x i 'β +ε i ,假设只有满足y i ≥c 的数据才能观测到。 例:y i 为所有企业的销售收入,而统计局只收集规模以上企业 数据,比如y i ≥100,000。被解释变量在100,000 处存在“左边断尾”。

2 ? 断尾随机变量的概率分布 随机变量 y 断尾后,其概率密度随之变化。 记 y 的概率密度为 f ( y ) ,在 c 处左边断尾后的条件密度函数为 ? f ( y ) 若 y > c f ( y | y > c ) = ? ?? P( y 0, > c ) , 若 y ≤ c 由于概率密度曲线下面积为 1,故断尾变量的密度函数乘以因子 1 。 P( y > c )

图14.1 断尾的效果 3

断尾分布的期望也发生变化。以左边断尾为例。对于最简单情形,y ~ N (0, 1),可证明(参见附录) E( y |y >c) = φ(c) 1 -Φ(c) 对于任意实数c,定义“反米尔斯比率”(Inverse Mill’s Ratio,简记IMR)为 则E( y | y >c) =λ(c)。λ(c) ≡ φ(c) 1 -Φ(c) 4

图14.2 反米尔斯比率 5

6 对 于 正 态 分 布 y ~ N (μ, σ 2 ) , 定 义 y - μ z ≡ σ ~ N (0, 1) , 则 y = μ + σ z 。故 E( y | y > c ) = E(μ + σ z | μ + σ z > c ) = E ??μ + σ z z > (c - μ) ?? = μ + σ E ?? z z > (c - μ) σ ?? = μ + σ ? λ [(c - μ) σ ] 对于模型y = x 'β + ε ,ε | x ~ N (0, σ 2 ),则y | x ~ N ( x 'β , σ 2 ),故 i i i i i i i i E( y i | y i > c ) = x i 'β + σ ? λ [(c - x i 'β ) σ ] 如 果 用 OLS 估 计 y i = x i 'β + εi , 则 遗 漏 了 非 线 性 项 σ ? λ [(c - x i 'β ) σ ],与x i 相关,导致 OLS 不一致。

计量经济学名词解释与简答

相关分析:主要研究随机变量间的相关形式及相关程度。 回归分析:研究一个变量关于另一个变量的依赖关系的计算方法和理论。 高斯马尔科夫定理:普通最小二乘估计量具有线性性、无偏性和有效性等优良性质,是最佳线性无偏估计量。 高斯马尔科夫假定:(1)模型设立正确 (2)无完全共线性 (3)可识别性 (4) 零均值、同方差。无序列相关假定(5) 解释变量与随机项不相关 计量经济学模型:揭示经济活动中各种因素之间的定量关系,用随机性的数学方程加以描述。广义计量经济学:利用经济理论、统计学和数学定量研究经济现象的经济计量方法的统称,包括回归分析方法、投入产出分析方法、时间序列分析方法等。 狭义计量经济学:以揭示经济现象中的因果关系为目的,在数学上主要应用回归分析方法。计量经济学: 是经济学的一个分支学科,是以揭示经济活动中的客观存在的数量关系为内容的分支学科。 计量经济学模型成功的三要素:理论、方法和数据。 滞后变量模型:把过去时期的,具有滞后作用的变量叫做滞后变量,含有滞后变量的模型称为滞后变量模型。 多重共线性:如果某两个或多个解释变量之间出现了相关性,则称为存在多重共线性。 多重共线性的后果:(1)完全共线性下参数估计量不存在(2)近似共线性下普通最小二乘法参数估计量的方差变大(3)参数估计量经济含义不合理(4)变量的显著性检验和模型的预测功能失去意义。 多重共线性的检验:(1)检验多重共线性是否存在(2)判明存在多重共线性的范围。 克服多重共线性的方法:(1)排出引起共线性的变量(2)差分法(3)减小参数估计量的方差。完全共线性:对于多元线性回归模型,其基本假设之一是解释变量,,…,是相互独立的,如果存在,i=1,2,…,n,其中c不全为0,即某一个解释变量可以用其他解释变量的线性组合表示,则称为完全共线性。 异方差性:对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。 异方差性的后果:(1)参数估计量非有效(2)变量的显著性检验失去意义(3)模型的预测失效异方差性的检验方法:(1)图示检验法(2)帕克检验和戈里瑟检验(3)G-Q检验(4)怀特检验。异方差性的修正:最常用的方法是加权最小二乘法,即对原模型加权,使之变成一个新的不存在异方差的模型,然后采用OLS法估计其参数。 序列相关性:多元线形回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。 序列相关性的后果:(1)参数估计量非有效(2)变量的显著性检验失去意义(3)模型的预测失败。 序列相关性的检验方法:(1)图示法(2)回归检验法(3)杜宾—瓦森检验法(4)拉格朗日乘法检验。 序列相关性的补救:(1)广义最小二乘法(2)广义差分法(3)随机干扰项相关系数的估计(4)广义差分法在计量经济学软件中的实现。 最小二乘估计量的性质:(1)线形性(2)无偏性(3)有效性(4)渐近无偏性(5)一致性(6)渐进有效性。 最小样本容量:即从最小二乘原理和最大似然原理出发,欲得到参数估计量,不管其质量如何,所要求的样本容量的下限。 随机干扰项:即随机误差项,是一个随机变量,是针对总体回归函数而言的。 无偏性:是指参数估计量的均值(期望)等于模型的参数值。 需求函数的零阶齐次性:消费者收入、商品价格和相关商品价格均增长 倍时,商品的需

第4章(3)受限数据模型

§4.6受限被解释变量数据模型 ——选择性样本 Model with Limited Dependent Variable ——Selective Samples Model 一、经济生活中的受限被解释变量问题 二、“截断”问题的计量经济学模型 三、“归并”问题的计量经济学模型

The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000 "for his development of theory and methods for analyzing selective samples” James J Heckman USA

?“Shadow Prices, Market Wages and Labour Supply”,Econometrica42 (4), 1974, P679-694发现并提出“选择性样本”问题。 ?“Sample Selection Bias as a Specification Error”,Econometrica47(1), 1979, P153-161 证明了偏误的存在并提出了Heckman两步修正法。

一、经济生活中的受限被解释变量问题

2、“归并”(censoring)问题 ?将被解释变量的处于某一范围的样本观测值都用一个相同的值代替。 ?经常出现在“检查”、“调查”活动中,因此也称为“检查”(censoring) 问题。 ?需求函数模型中用实际消费量作为需求量的观测值,如果存在供给限制,就出现“归并”问题。?被解释变量观测值存在最高和最低的限制。例如考试成绩,最高100,最低0,出现“归并”问题。

第五讲-虚拟变量模型

第七讲 经典单方程计量经济学模型:专门问题 虚拟变量模型 学习目标: 1. 了解什么是虚拟变量以及什么是虚拟变量模型; 2. 理解虚拟变量的设置原则; 3. 掌握虚拟变量模型的两种基本引入方式(加法方式和乘法方式); 4. 能够自行设计虚拟变量模型,并能够解释其中蕴含的经济意义; 教学基本内容 一、 虚拟变量 许多经济变量是可以定量度量,例如:商品需求量、价格、收入、产量等;但有一些影响经济变量的因素是无法定量度量。例如:职业、性别对收入的影响,战争、自然灾害对GDP 的影响,季节对某些产品(如冷饮)销售的影响等。 定性变量:把职业、性别这样无法定量度量的变量称为定性变量。 定量变量:把价格、收入、销售额这样可以可以定量度量的变量称为定量变量。 为了能够在模型中能够反映这些因素的影响,提高模型的精度,拓展回归模型的功能,需要将它们“量化”。 这种“量化”通常是通过引入“虚拟变量”来完成的。根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量(dummy variables ) ,记为D 。 虚拟变量只作为解释变量。 例如:反映性别的虚拟变量? ??=女男;0;1D 反映文化程度的虚拟变量???=非本科学历 本科学历;0;1D 一般地,基础类型和肯定类型取值为1;比较类型和否定类型取值为0。 二、 虚拟变量的设置原则 设置原则: 每一定性变量(qualitative variable)所需的虚拟变量个数要比该定性变量的状态类别数(categories)少1。即如果有m 种状态,只在模型中引入m-1个虚拟变量。 例如,冷饮的销售量会受到季节变化的影响。季节定性变量有春、夏、秋、冬4种状态,只需要设置3个虚拟变量:

计量经济学,多重共线性异方差虚拟变量随机解释变量大作业

影响我国居民消费因素分析 班级: 组员: 一、提出问题: 1、原因: 居民消费水平是按国民收入或国内生产总值的使用总量中用于居民消费的总额除以年平均人口计算的,它反映一个国家或一个地区居民的一般消费水平。居民消费水平是GDP中一个重要组成部分,是拉动经济增长的三驾马车之一,在拉动经济增长的三架马车中,最终消费对经济影响的最大,是拉动经济增长最重要最稳定的因素。我国经济正逐渐由投资拉动型增长向消费拉动型增长转变,居民消费一直是经济学家关注的焦点和研究的热门领域。居民消费对经济的发展和社会的进歩有着重要的引导作用,居民消费的结构、质量和增长趋势如何,在很大程度上决定着经济、社会的发展情况。 要充分发挥消费对经济的拉动作用,关键问题是如何保证居民的消费水平。在人均国民生产总值为一千美元时,世界各国的居民消费率一般为60%左右。而我国的人均国民生产总值早已超过了一千美元,但2013年全国居民的消费率仅36%,严重低于正常水平。消费需求的偏低导致消费对经济增长的拉动作用也偏弱,因此提高居民消费率,增加居民消费对经济增长的贡献

度,是一项重要工作。 通过对历年我国居民消费水平的分析,我们可以对消费水平发展有一个清晰的画面,并且能透过数据的表象来分析更深层次的国家调控手段和战略使用。 2、研究立场:政策制定者 二、文献综述: 根据国外相关研究成果,主要有恩格尔的理论、绝对收入、相对收入、持久收入和生命周期消费理论等。Caballero (1990)指出,当期劳动收入发生变化表明未来的收入发生变化的可能性比较大,为维持未来消费的稳定性,需要进行预防性储蓄,从而会降低当期消费,使得长期的消费得到"平滑"。 国内研究得出的消费率的影响因素主要包括:居民收入占比,收入分配差距,不确定性,流动性约束和房价。齐吴珍认为居民消费的主要影响因素有:居民收入的增长率、收入分配差距、不确定性、流动性约束和房价等。 目前,多数学者通过建立消费与收入的模型或者消费分别与城乡居民收入建立模型进行分析,结果显示:1、收入是决定居民消费水平的主要因素,收入增加的快慢是影响居民消费需求变化的重要原因。 2、农村居民收入、财政支出水平、城市化水平、农村社会保障制度均对农村居民消费需求起正向作用,城乡居民收入差距起负向作用,农村内部收入分配差距与消费需求不存在显著相关关系。 3、收入的不确定性、以及出于预防动机,我国居民储蓄率高,在一定程度上影响

第14 章 受限被解释变量

教学用PPT ,《高级计量经济学及Stata 应用》,陈强编著,高等教育出版社,? 2010年 第14章 受限被解释变量 14.1断尾回归(Truncated Regression ) 对于线性模型(1,2,,)i i i y i n ε′=+=x β",假设只有满足 i y c ≥(c 常数)的数据才能观测到。

断尾随机变量的概率分布 记y 原来的概率密度为()f y ,则断尾后的条件密度函数为, ()P() (|)0f y if y c y c f y y c if y c ???>?>>=???≤??? (14.1)

图14.1、断尾的效果 首先,对于最简单的情形,~(0,1)y N ,可以证明

() E(|)1()c y y c c φ>=?Φ (14.2) 对于一个任意实数c ,定义“反米尔斯比率”(Inverse Mill’s Ratio ,IMR )为() ()1() c c c φλ≡?Φ,则E(|)()y y c c λ>=。

图14.2、反米尔斯比率 其次,对于2~(,)y N μσ,定义~(0,1)y z N μσ ?≡,则

y z μσ=+, []E(|)E(|)E ()E ()()y y c z z c z z c z z c c μσμσμσμσμσμσμσλμσ??>=++>=+>??? ??=+>?=+???? (14.3) 对于回归模型i i i y ε′=+x β,假设2 |~(0,)i i N εσx 。因此, 2 |~(,)i i i y N σ′x x β。套用方程(14.3)可得, E(|)()i i i i y y c c σλ??′′>=+????x βx β (14.4)

相关文档 最新文档