文档库 最新最全的文档下载
当前位置:文档库 › 面板数据模型入门讲解

面板数据模型入门讲解

面板数据模型入门讲解
面板数据模型入门讲解

第十四章 面板数据模型

在第五章,当我们分析城镇居民的消费特征时,我们使用的是城镇居民的时间序列数据;而当分析农村居民的消费特征时,我们使用农村居民的时间序列数据。如果我们想要分析全体中国居民的消费特征呢?我们有两种选择:一是使用中国居民的时间序列数据进行分析,二是把城镇居民和农村居民的样本合并,实际上就是两个时间序列的样本合并为一个样本。 多个观测对象的时间序列数据所组成的样本数据,被称为面板数据(Panel Data )。通常也被称为综列数据,意即综合了多个时间序列的数据。当然,面板数据也可以看成多个横截面数据的综合。在面板数据中,每一个观测对象,我们称之为一个个体(Individual )。例如城镇居民是一个观测个体,农村居民是另一个观测个体。

如果面板数据中各观测个体的观测区间是相同的,我们称其为平衡的面板数据,反之,则为非平衡的面板数据。基于面板数据所建立的计量经济学模型则被称为面板数据模型。例如,表5.3.1中城镇居民和农村居民的样本数据具有相同的采样区间,所以,它是一个平衡的面板数据。

§14.1 面板数据模型

一、两个例子

1. 居民消费行为的面板数据分析

让我们重新回到居民消费的例子。在表5.1.1中,如果我们将城镇居民和农村居民的时间序列数据作为一个样本,以分析中国居民的消费特征。那么,此时模型(5.1.1)的凯恩斯消费函数就可以表述为:

it it it Y C εββ++=10 (14.1.1) it t i it u ++=λμε (14.1.2) 其中:it C 和it Y 分别表示第i 个观测个体在第t 期的消费和收入。i =1、2分别表示城镇居民和农村居民两个观测个体,t =1980、…、2008表示不同年度。it u 为经典误差项。 在(14.1.2)中,i μ随观测个体的变化,而不随时间变化,它反映个体之间不随时间变化的差异性,被称为个体效应。t λ反映不随个体变化的时间上的差异性,被称为时间效应。在本例中,城镇居民和农村居民的消费差异一部分来自收入差异和随机扰动,还有一部分差

异是由城镇居民和农村居民的身份或地域差异决定的,它不随时间变化,这种差异性就由1μ和2μ来反映。同时,对同一种居民,在收入不变的情况下,消费支出还可能随时间的变化而变化,这种变化的来源在于除随机扰动以外经济环境的一些系统性变化,如经济体制的变迁,这种变化是所有居民共同面对的,所导致的居民消费在时间上的差异性就由时间效应1980λ、1981λ、…、2008λ来反映。

实际上,模型(14.1.1)还隐含了一个假定,既假定城乡居民的边际消费倾向相同并且不随时间变化。尽管这一假定不一定成立,但作为熟悉面板数据模型基础知识的例子,我们还是暂且保留这一假定。

2. 农村居民收入分析

为了考察中国农民收入与农村要素投入结构之间的关系,同样地,我们既可以采用全国的时间序列总量数据进行分析,也可以采用各省市自治区的横截面数据进行分析。但是,如果能够综合各省市自治区的时间序列数据,从而基于面板数据进行分析,一个显而易见的好处就是,我们将会有更多更具体的信息,估计和检验统计量都会有更大的自由度,从而获得更可靠的分析结论。

简单而言,由于农村剩余劳动力的存在,影响农村居民收入的要素配置因素可以分为以下几个方面:资本拥有量、投资主体结构、劳动的配置状态等。所以,基于省际面板数据,有研究者建立了如下的面板数据模型:

it it it it it RCI RLT CSC PIC εββββ+++=3210)(ln )ln +( (14.1.3)

it t i it u ++=λμε。

N i ,2,1=,T t ,2,1=

其中:PIC it 为地区i 在第t 期的农村人均纯收入,各年份的现值均按本地区农村消费者价格指数折算为1995年不变价。RLT it 为地区i 在第t 期乡村劳动力中非农产业从业人数与农林牧渔等传统产业从业人数之比。RCI it 为地区i 在第t 期农村集体投资与个人投资的比率。CSC it 为估算的地区i 在第t 期农村人均资本存量。i μ和t λ分别为个体效应和时间效应。i μ反映除劳动力分配比例、投资比例、资本存量的影响以外,各省人均纯收入受本省内在因素(如地理位置,经济发展基础等)所导致的不随时间变化的差异性。而时间效应反映除解释变量的影响以外,所有省份农村人均纯收入面对共同的经济环境的变化而形成的时间上的差

异性。

显然,面板模型与我们以前所学的模型之间的区别,就在于存在个体效应和时间效应。简而言之,剔除了解释变量的影响以后,由个体内部不变的因素所导致的个体之间的差异性,就是个体效应;由所有个体所面对的共同因素所导致的时间上的变化,就是时间效应。

二、面板数据的特征及优势

基于前面两个例子,我们发现,面板数据既可以看作多个个体时间序列数据的合并,也可以看作多个时点横截面数据的合并。所以,面板数据的基本特征就是其数据结构的二维性(图14.1.1)。或者说,面板数据是一个数据平面,这也正是其被以“面板”命名的原因。

图14.1.1 变量X的面板数据结构

那么,有读者会说,我们可以基于全国的总量数据(城镇居民和农村居民数据加总)来分析中国居民的消费行为,为什么要使用面板数据呢?实际上,使用面板数据会为我们的计量经济学分析带来很多的好处。

(1)扩大信息量,增加估计和检验统计量的自由度。

显然,与时间序列数据和横截面数据不同,面板数据是二维数据。它既包含观测同一个体随时间的变化,也包含同一时间不同个体之间的差异。这显著扩大了样本的信息量和样本容量,有助于提高参数估计的精度和检验结论的可靠性。

对模型(14.1.1)而言,如果我们基于居民的时间序列数据进行分析,样本容量为29。而基于城镇和农村的面板数据,样本容量则为58,如果基于省市区的面板数据,样本容量将更大,模型估计量和检验统计量的自由度显著增加。更重要的是,基于总量数据进行分析,无法反映两种居民之间的差异性,其数据信息对于两种居民都有显著的偏差。

(2)有助于提供动态分析的可靠性。

基于单个个体的时间序列数据进行动态分析,一方面会受到采样区间的限制,另一方面

其研究结论也缺乏普适性。而基于面板数据,则可以在较短的采样区间内反映多个个体共同的动态变化特征,从而弱化样本区间的制约得到更为可靠的分析结论。

当我们在模型(14.1.1)中引入预期因素时,其回归模型被表述为:

it t i it it C Y C εβββ+++=-1,210。 (14.1.4)

如果使用总量数据,我们只能根据不同年度消费额的变化信息来估计消费的动态性质,而使用面板数据,我们有两种居民消费的变化信息可供利用。

(3)有助于反映经济结构、经济制度的渐进性变化。

对于所考察的经济体系而言,经济结构和经济制度的变化通常是渐进性的,我们很难找到一个量化的指标来反映这种渐进性变化。幸运的是,使用面板数据时,时间效应是被解释变量中不随个体变化而只随时间变化的部分,它反映了所有个体所面对的共同因素的影响。所以,时间效应是对经济结构和经济制度渐变效应的一个很好的度量指标。

(4)面板数据有助于反映经济体的结构性特征。

与总量数据相比,面板数据提供了更具微观层次的信息。对很多经济问题的分析而言,某些变量涉及不同观测个体之间的相互关系,例如资本和劳动在区域和产业之间的流动,技术的溢出,通胀的相互影响等。使用面板数据使得这些结构性变化信息的分析成为可能。

三、面板数据模型的混合估计

既然面板数据有诸多优势,那么,面板数据模型的分析与时间序列或横截面数据模型有什么不同呢?

在(14.1.1)和(14.1.3)中,如果假定个体效应和时间效应为0,那么,这些模型与我们前面所熟悉的单方程模型没有任何本质上的差异。所以,我们可以直接基于OLS 对其进行估计。也就是说,我们没有考虑面板数据的结构特殊性,而直接把各时间序列或各横截面数据混合起来进行估计,这种估计方法我们称之为面板混合OLS 估计。

对于模型(14.1.3),如果假定个体效应和时间效应为0,则模型可以表述为:

u RCI RLT CSC PIC +++=3210)(ln )ln ββββ+( (14.1.5)

其中:'1111)(NT N it T PIC PIC PIC PIC PIC PIC =,PIC it 为地区i 在第t 期的农村人均纯收入。也就是说,我们将各个地区的数据堆积起来,看成是对同一个对象的观测数据。其他变量的向量表述也是类似的。如果u 为经典误差项,这一模型与

第五章所讲的多元线性回归模型没有任何本质区别,其OLS 估计量是线性无偏最优估计量。

基于中国28个省市自治区(不包括重庆、海南、西藏)1995~2005年的面板数据,其面板混合OLS 估计的结果为:

it it it it RCI RLT CSC PIC 0104.02523.0)(ln 35911.08158.7)n l -+(+=∧

(14.1.6)

t 统计值 202.2730 17.2520 5.7464 -3.1736

p 值 0.0000 0.0000 0.0000 0.0017

2R =0.8409 2R =0.8393。 但是,对面板数据而言,把个体效应和时间效应假定为0一般是不符合经济现实的,尤其是个体效应。我们很难想象各地区农村居民的消费特征不存在差异性。当我们考虑个体效应与时间效应时,我们会发现,面板数据在为我们带来更多信息和便利的同时,也带来了一些新的问题。

§14.2 固定效应与随机效应

面板数据模型的一般形式可以表述为:

it Kit K it it X X Y εβββ++++= 110 (14.2.1) it t i it u ++=λμε。 N i ,,2,1 = T t ,,2,1 =。

其中:it u 为经典误差项。0)(=i E μ,0)(=t E λ,0)(=it i u E μ,0)(=it t u E λ。

我们已经知道,与时间序列数据或横截面数据的单方程模型相比,面板数据模型唯一的不同之处就是存在个体效应i μ和时间效应t λ。根据i μ和t λ与模型解释变量是否相关,面板数据的个体效应和时间效应又分为两种情形:固定效应和随机效应。

如果个体效应i μ与模型中的解释变量是相关的,我们就称这种个体效应是固定效应(Fixed Effect )。反之,如果个体效应i μ与模型中的解释变量不相关,我们称之为随机效应(Random Effect )。

同样地,如果时间效应t λ与模型中的解释变量是相关的,我们就称这种时间效应是固定效应。反之,则为随机效应。

例如:在模型(14.1.1)中,如果个体效应i μ与收入it Y 相关,时间效应t λ与收入it Y 不相关,那么,该模型的个体效应是固定效应,时间效应是随机效应。

如何理解固定效应和随机效应的含义呢?

当个体效应与解释变量相关时,因为解释变量反映观测个体的个性化特征,所以,此时的个体效应反映了观测个体的个性化特征。或者说,此时个体效应的差异与观测个体的特征有内在的联系,所以,我们可以称这种效应是“固定”的。相反,如果个体效应与解释变量不相关,则说明个体效应的差异与观测个体的特征没有显著的内在联系,在某种程度上,这种个体差异有可能是“随机”产生的。

同样,时间效应的固定效应是指时间效应在时间上的差异是与特定观测时间的经济背景有内在联系,而其随机效应则是指时间效应在时间上的差异是“随机”产生的。

§14.3 静态面板数据模型的估计

对于面板数据模型(14.2.1),我们首先考虑解释变量中不含被解释变量滞后项的情形,这样的模型我们称之为静态面板数据模型。

当个体效应i μ和时间效应t λ是固定效应和随机效应时,模型所面对的计量经济学问题是不同的,其估计方法也不同。

一、静态面板数据模型的固定效应估计

如果个体效应i μ和时间效应t λ满足固定效应假定,显然此时模型的随机误差项it ε与解释变量相关,它违背了高斯-马尔可夫定理对“解释变量与误差项不相关”的假定,根据我们在模型设定和联立方程中所学的知识,此时模型中参数的OLS 估计量是有偏的。

显然,固定效应面板数据模型的本质问题是解释变量的内生性问题,其后果是OLS 估计量不再是无偏的估计量。

既然OLS 估计量是有偏的,我们就需要新的无偏估计量。对于固定效应的静态面板数据模型,其线性最优无偏的估计方法是最小二乘虚拟变量法(LSDV 方法)。

1. LSDV 估计方法

为了表述简便,我们以后不考虑时间效应,而只考虑个体效应。我们基于如下的一元静态面板数据模型来说明LSDV 估计的基本思路:

it it it X Y εββ++=10 (14.3.1)

it i it u +=με。

N i ,,2,1 = T t ,,2,1 =。

(1)为每一个个体设定一个虚拟变量i D ,N i ,,2,1 =。其中:i D =1表示第i 个观

测个体,i D =0表示不是第i 个观测个体。

(2)在模型中引入虚拟变量,通过虚拟变量使个体效应显性化(参数化),则模型(14.3.1)可表述为:

it it N N it u X D D Y +++++=1110βμμβ (14.3.2)

为了解决虚拟变量的完全多重多重共线性,我们可以直接估计模型:

it it N N it u X D D Y ++++=1*1*1βμμ (14.3.3)

或 it it N N it u X D D Y +++++=1220βμμβ (14.3.4) 此时,模型的误差项是经典误差项it u ,所以,我们可以直接对(14.3.3)或(14.3.4)进行OLS 估计。读者应该可以理解,(14.3.3)和(14.3.4)是等价的,尽管个体效应的估计值不相等。实际上,鉴于个体效应只是反映个体之间的差异性,其数值本身的大小是没有经济意义的,我们所关心的只是数值的差异。

最后,让我们总结一下LSDV 估计的基本思想:通过虚拟变量把误差项中与解释变量相关的个体效应和时间效应参数化,把个体效应和时间效应从误差项中分离出来,使误差项与解释变量不相关,以便进行OLS 估计。这正是其被称为最小二乘虚拟变量法的原因。

回到中国农民纯收入的例子。基于中国的省际面板数据,对模型(14.1.3)进行LSDV 估计,为简便起见,我们在此仅考虑个体效应,其具体估计结果为:

it it it it RCI RLT CSC PIC 0009.00681.0)(ln 11784.04889.7)n l ++(+=∧

(14.3.5) t 统计值 310.5582 35.0807 2.1178 0.6352

p 值 0.0000 0.0000 0.0351 0.5258

显然。LSDV 估计结果(14.3.5)不同于混合OLS 估计结果(14.1.6),尤其是it RCI 系数的估计结果由显著的负值变为不显著的正值。估计结果的显著不同本在我们的意料之中,因为混合OLS 估计的实际上是受约束模型,即0==t i λμ约束下模型。

细心的读者可能已经注意到,在(14.3.5)的估计结果中,我们没有报告模型的判定系数2R 。原因在于,对于考虑了个体效应或时间效应的面板数据模型而言,2

R 不能反映解释变量对被解释变量变化的解释能力。因为,此时的模型包含了个体效应和时间效应对被解释变量变化的解释,其判定系数也包含了个体效应和时间效应的贡献,而不只是解释变量的贡献。

2. LSDV 估计方法的直观含义

根据我们在第五章中对多元回归方程估计思想的解释,对模型(14.3.3)我们还有一种等价的估计方法。这种等价方法的步骤是:

(1)分别估计方程:

it N N it D D Y ξλλ+++= 11 (14.3.6)

it N N it D D X ζγγ+++= 11 (14.3.7)

得到残差it

ξ?和it ζ?。 (2)估计方程:

it it it u +=ζβξ??1 (14.3.8)

此时,(14.3.8)对1β的估计与(14.3.3)的LSDV 估计是等价的。

我们注意到,在步骤(1)中,对每一个个体i 而言,只有1=i D ,其他虚拟变量都等于0,既0=≠i s D 。以i =1为例,回归方程(14.3.6)可以写成:

t t Y 111ξλ+= 该方程的残差就是被解释变量的离差。所以,∑=-=T t t t t Y T Y 1

1111?ξ,它是在第1个个体内部求变量Y 的离差。同样的,it ζ?是在第1个个体内部求变量X 的离差。

由此,我们发现,(14.3.8)实际上是变量Y 的个体内离差对变量X 的个体内离差进行回归。

所以,LSDV 估计方法的直观含义是,将被解释变量和解释变量在个体内取离差,以被解释变量的个体内离差对解释变量的个体内离差进行回归,并进行OLS 估计。

在分析农民纯收入的例子,如果我们将所有变量)ln it PIC (、)(ln it CSC 、it RLT 、it RCI 的样本数据都转换为省内离差的形式,那么,我们对模型直接进行OLS 估计,其斜率系数的估计结果与(14.3.5)的结果是相同的。

二、静态面板数据模型的随机效应估计

如果个体效应i μ和时间效应t λ满足随机效应假定,显然此时模型的随机误差项it ε与解释变量不相关,此时模型中参数的OLS 估计量仍是无偏的。

但是,由于个体效应i μ的存在,同一观测个体的误差项都包含不随挤时间变化的i μ,

从而导致同一时间序列样本数据存在自相关。同样地,由于时间效应t λ的存在,同一横截面的误差项都包含不随个体变化的t λ,从而导致同一横截面样本数据存在自相关。我们知道,此时尽管OLS 估计量是无偏的,但却不是最优的,OLS 估计量有较大的方差。

显然,随机效应面板数据模型的本质问题是误差项的自相关问题,其后果是OLS 估计量有较大的方差。

既然随即效应问题的本质是自相关,在自相关一章中,我们已经知道,修正自相关的影响需要采用GLS 估计。所以,对于随机效应的静态面板数据模型,其线性无偏最优的估计方法是广义最小二乘估计法(GLS )。

再次回到中国农民纯收入的例子。基于中国的省际面板数据,在仅考虑个体效应的情况下,我们对模型(14.1.3)进行GLS 估计,其具体估计结果为:

it it it it RCI RLT CSC PIC 0007.00750.0)(ln 11604.04369.7)n l ++(+=∧

(14.3.9) t 统计值 202.1297 35.3193 2.4289 0.4921

p 值 0.0000 0.0000 0.0157 0.6230

就本例而言,(14.3.9)和(14.3.5)的估计结果比较接近,但还是有些许差异。

既然固定效应模型应该使用LSDV 估计,而随机效应模型应该采取GLS 估计,那么,当我们面对一个面板数据模型时,到底是用LSDV 方法呢?还是选用GLS 方法呢?一方面,我们可以基于固定效应和随机效应的含义,结合回归模型所要研究的经济问题,从问题的经济背景来进行判定。另一方面,我们可以根据样本数据,通过具体的检验统计量来进行检验。

三、豪斯曼检验

要想固定效应和随机效应作出判定,我们首先要明确两种估计量在不同情形下的性质。 如果模型中的个体效应或时间效应是固定效应,那么,LSDV 估计量是无偏的估计量,而GLS 估计量则是有偏的。

反之,如果模型中是随机效应,那么,LSDV 估计量和GLS 估计量都是无偏的,但LSDV 估计量有较大的方差。

鉴于两种估计量的上述特征,我们发现,如果是随机效应模型,LSDV 估计量和GLS 估计量的估计结果就比较接近,反之,如果是固定效应模型,两种估计量的结果就有较大的差异。豪斯曼检验正是基于这种思想来检验随机效应和固定效应的。

豪斯曼检验的待检验假设为:

原假设(H 0): 随机效应

备选假设(H A ): 固定效应

其检验统计量为:

)??()??()??(1'R

F RE F R F H ββ∑∑ββ---=- (14.3.10) 其中:F β?为回归系数的LSDV 估计向量,R

β?为回归系数GLS 估计向量,F ∑?为LSDV 估计系数的协方差矩阵估计量,R

∑?为GLS 估计系数的协方差矩阵估计量。 在原假设(随机效应)为真时,豪斯曼检验统计量服从2χ分布。即:

)(~2K H χ (14.3.11) 自由度K 为模型中解释变量(不包括截距项)的个数。

还是回到中国农民纯收入的例子。在仅考虑个体效应的情况下,我们对模型(14.1.3)进行豪斯曼检验,检验结果为:

H =4.1777 p 值=0.2429。

显然,根据检验结果,我们无法拒绝随机效应的原假设。所以,从豪斯曼检验结果来看,中国农村居民收入模型中的个体效应很可能是随机效应。

§14.4 动态面板数据模型简介

如果面板数据模型的解释变量中包含被解释变量的滞后项,我们则称其为动态面板模型。仅包含被解释变量一阶滞后时,动态面板模型的一般表述形式为:

it t i Kit K it it Y X X Y ερβββ+++++=-1,110 。 (14.4.1)

随着滞后被解释变量作为解释变量出现在模型中,由于个体效应的存在,模型解释变量无法满足严格外生性的条件,从而导致LSDV 估计和GLS 估计都是有偏的。在§14.1的消费函数例子中,考虑了预期因素的模型(14.1.4)就是一个典型的动态面板数据模型。

首先,我们暂不考虑外生的解释变量和截距项,鉴于动态面板数据模型特有的估计问题仅与个体效应有关,为了使表述简化清晰,在后面的分析中,我们将仅考虑个体效应,而不再考虑时间效应。即模型(14.4.1)的误差项被设定为:

it t i it y y ερ+=-1, (14.4.2)

it i it u +=με

其中:it u 为经典误差项。0)(=i E μ,0)(=it i u E μ。

一、动态面板数据模型的内生性问题

在动态面板数据模型中,无论个体效应是固定效应还是随机效应,固定效应的LSDV 和随机效应的GLS 估计都是有偏的并且非一致的①。其原因在于,动态面板数据模型存在固有的内生性问题。

1. GLS 估计的有偏和非一致性

对于GLS 估计,模型(14.4.2)的内生性问题是显而易见的。因为解释变量1,-t i Y 与误差项it ε都包含个体效应i μ。即使进行差分变换,2,1,1,----=t i t i t i Y Y Y ?与1,--=t i it it u u ε?,都包含共同因素1,-t i u ,我们也还是无法消除解释变量的内生性问题。理解这一问题,需要注意1,-t i u 是1,-t i Y 的构成部分。

2. LSDV 估计的有偏和非一致性

对于LSDV 估计,模型(14.4.2)可以表示为:

it t i N N it u Y DI DI Y ++++=-1,11ρμμ (14.4.3)

它等价于模型:

*

*1,*it t i it Y Y ερ+=- (14.4.4) 其中,符号“*”表示变量的样本数据相对于对本观测个体时间序列均值的离差。即:∑=---=T t t i t i t i Y T Y Y 1,1,*1

,1,∑=-=T t it it it T 1*1εεε。 显然,*1,-t i Y 和*it ε是相关的,二者都包含误差1,-t i ε,1,-t i ε在*1,-t i Y 中的权重是(1-1/T ),

在*

it ε中的权重是1/T 。所以,LSDV 估计方法也无法消除动态面板模型的内生性问题。

由于动态面板模型固有的内生性问题,一般而言,我们通常有三种方法估计动态面板数据模型:GMM 方法、偏误直接修正方法、变换的似然方法。目前应用最多的估计方法则是GMM 方法。

二、动态面板模型的广义矩估计方法(GMM )

对于一阶自回归的动态面板数据模型(14.4.2):

it t i it y y ερ+=-1, (14.4.2)

① Cheng Hsiao, Analysis of Panel Data, 北京大学出版社,2005,pp70-85.

it i it u +=με

其中:it u 为经典误差项。0)(=i E μ,0)(=it i u E μ。我们已经知道,动态面板模型的1,-t i y 和it ε是相关的,而且LS 估计(无论是LSDV 还是GLS )都是有偏并且非一致的。如果要想得到ρ的一致估计量,我们需要为1,-t i y 寻找适当的工具变量。

根据工具变量的选择的两个条件,我们要找的工具变量必须与it ε不相关,而与1,-t i y 相关。基于给定的样本信息,我们所能够找到的与1,-t i y 高度相关的变量只有1,-t i y 的滞后项。但是,由于个体效应的存在,1,-t i y 的滞后项即1i y 、2i y 、…、2,-t i y 也与it ε相关,它们不能作为工具变量使用。

为了能够找到适当的工具变量,我们对模型(14.4.2)取一阶差分:

it t i it y y ε??ρ?+=-1,。

(14.4.5) 显然,1i y 、2i y 、…、2,-t i y 与it ε?不相关。因为1,--=t i it it u u ε?已经剔除了个体效应i μ,同时,对于it u 和1,-t i u ,1i y 、2i y 、…、2,-t i y 都是前定变量。所以,1i y 、2i y 、…、2,-t i y 都与it ε?不相关,都可以作为模型(14.4.5)中1,-t i y ?的工具变量。

如果我们只选择2,-t i y 作为1,-t i y ?的工具变量,由2,-t i y 与it ε?之间正交的约束条件: 0)(2,=-it t i y E ε?, (14.4.6) 基于一个给定的样本,我们通过求解

0?1

2,=?-∑∑it t i i t y NT ε (14.4.7)

就可以得到ρ的估计量ρ?。这就是我们前面所学过的工具变量估计量(IV 估计量)。

我们知道,工具变量不但要求与模型的误差项不相关,而且,要尽可能地反映原内生解释变量的信息。显然,2,-t i y 很难反映1,-t i y ?太多的信息,IV 估计量会有较大的估计方差。所以,我们通常会选择1i y 、2i y 、…、2,-t i y 作为模型(14.4.5)中1,-t i y ?的工具变量。

我们把1,-t i y ?的工具变量集定义为'2,212),,,(--=t i i i t y y y y

,则其满足如下的正交

条件:

0)(2=-it t y E ε?。 (14.4.8) 基于上述正交条件,我们就可以建立ρ的广义矩(GMM )估计量②。因为我们首先对模型进行了一阶差分变换,所以,该估计量有时也被称为差分GMM 估计量。

在此,我们简要地介绍GMM 估计的基本思想。

先回头看一下工具变量估计量,我们基于(14.4.7)这一个约束方程估计一个参数ρ,

所以,我们可以通过(14.4.7)的求解计算出ρ

?。 当我们为解释变量1,-t i y ?选取了多个工具变量时,(14.4.8)所表示的是多个约束方程,在此,我们并不具体地讨论(14.4.8)的约束形式,但至少我们已经注意到2-t y 是一个向量。所以说,基于(14.4.8)的估计,我们实际上就等于是基于多个方程估计一个参数ρ。这样的情况被称为过度识别。对总体而言,(14.4.8)的所有约束方程都是成立的。it

t y g ερ?≡-2)(被称为总体矩,我们称(14.4.8)为总体矩条件。 针对一个给定的样本,因为存在多个约束方程,我们通常不可能用一个估计值ρ

?保证所有的约束方程都成立。也就是说,)(2it t y E ε?-所对应的样本矩通常不为0。我们只能选

择一个ρ

?, 使所有样本矩尽可能地接近0。 对每一个工具变量,或者说每一个总体矩条件,我们都可以计算出对应的样本矩的值。

所有样本矩的值可以表示为一个向量)?(ρ

g 。那么,我们的估计思想就很明确了,我们要基于一个样本,寻找一个估计值ρ

?,使所有样本矩尽可能接近0,以满足总体矩的约束条件。对应于所有的矩约束条件而言,我们的目标就是:最小化所有样本矩的平方和。即:

[])?()'?(min ?ρρρ

Wg g G = (14.4.9) 其中:函数G 被称为GMM 目标函数。W 是一个对称、正定的加权矩阵。所以,GMM 目标函数实际上是所有样本矩的加权平方和。

是否引入加权矩阵W 并不影响GMM 估计量的一致性。但会影响到有限样本下的估计精度。其最优的选择是使用总体矩协方差逆矩阵()[]1

1)()'(--=Ωρρg g E 的一致估计量。显然,引入这样的加权矩阵是为了修正样本矩之间相关性和异方差的影响。

Arellano, M. and Bond,S.R., 1991, Some Tests of Specification for Panel Data: Monte Carlo Evidence and an application to employment equations , Review of Economic Studies, 58,277-297.

简而言之,GMM 估计的基本思想就是:加权以后样本矩的平方和最小化,即GMM 目标函数G 最小化。

三、工具变量的选择及其有效性的检验

1. 关于GMM 工具变量选择的两点说明

(1)在为动态面板模型的GMM 估计选择工具变量时,我们需要在估计量的偏误和方差之间进行权衡。随着矩条件或者说工具变量个数的增多,估计量的方差减小而偏误增大,反之,方差增大而偏误减小,二者之间存在此消彼涨的权衡关系。所以,在GMM 估计的实际应用中,我们通常会选择s i y ,、…、2,-t i y 作为1,-t i y ?的工具变量,21-<

(2)另一个需要说明的问题是,如果模型中包含了外生解释变量,例如it X ,那么我们所要分析的模型为:

it it t i it X y y εαρ++=-1, (14.4.10)

it i it u +=με

其差分形式为:

it it t i it X y y ε??α?ρ?++=-1, (14.4.11) 此时,GMM 工具变量如何选择呢?1,-t i y ?的工具变量选择如前所述,外生变量it X ?、it X 显然都可以作为it X ?的工具变量。

2. 工具变量有效性检验

当我们为一个解释变量选择了多个工具变量时,那么工具变量的个数就会超过待估参数的个数,也就是说矩约束条件的个数超过了待估参数的个数,导致模型的过度识别。那么,过度识别的矩约束条件是否是有效的呢?也就是说,这些工具变量是否与误差项不相关,从而是否保证矩约束条件(14.4.8)成立呢?对此,我们可以用J 检验进行判定。实际上,J 检验统计量就是根据参数估计值得到的GMM 目标函数值。

在原假设——“过度识别的矩条件是有效的”成立的情况下,J 检验统计量的极限分布是2

χ分布。即: )(~)?()'?(2k m W g mg J a

-=χββ, (14.4.12)

其中:m 为工具变量或者矩条件个数,k 为待估计参数的个数。W 为m m ?的加权矩阵,)?(β

g 为根据参数向量估计值β?得到的样本矩的均值。对模型(14.4.11)而言,)'??(?α

ρβ=。 当J 统计值大于给定显著性水平下的临界值时,我们就倾向于拒绝过度识别的矩条件有效的原假设。

回到农村居民收入的例子,考虑到一个地区农村居民收入会表现出一定的动态惯性特征,我们有必要在模型(14.1.2)中引入被解释变量的滞后项,即:

it

it it it l t i p l l it RCI RLT CSC PIC PIC εββββγ+++++=-=∑0321,1)log()

log()log( (14.4.13)

其差分GMM 估计的具体结果为: 0

,?0015.01674.0)log(1472.0)log(4865.0)(β+++=-∧

it it it l t i it RCI RLT CSC PIC PIC og l + (14.4.14) t 值 24.6656 13.9010 12.2935 2.0219

p 值 0.0000 0.00000 0.0000 0.0443 就这一估计结果来看,在中国农村居民的收入分析中,动态影响是显著的。显然,无论在理论上还是就统计推断而言,在模型(14.1.2)中引入动态效应的分析都是恰当的。而且,考虑到动态效应的估计结果与静态模型有显著差异,尤其是投资主体结构变量it RCI 的系数估计值变为了显著的正值。

那么,本模型过度识别的矩约束条件是否是有效的呢?在本例中,解释变量的工具变量集为()log(1i PIC 、)log(2i PIC 、…、)log(2,-t i PIC ,)log(it CSC ,it RLT ,it RCI ),工具变量矩阵的秩(全部工具变量个数)为28。因为基于一阶差分进行估计,没有估计截距项和个体效应的值,所以待估计参数个数为4。如果过度识别的矩约束条件是有效的,那么,模型的J 检验统计量应该服从自由度为28-4=24的2

χ分布。

根据式(14.4.14)计算的J 检验统计值为:J =25.2211,根据)24(2χ分布计算的p 值为0.3938。显然,我们不能拒绝“过度识别的据约束条件有效”的原假设。也就是说,基于统计推断,我们可以认为工具变量与误差项不相关,或者说所选择的工具变量是有效的。

四、例子:新凯恩斯混合Phillips 曲线的估计

让我们重新回到第四章一开始所介绍的新凯恩斯混合Phillips 曲线的例子。基于面板数

据,新凯恩斯混合Phillips 曲线的回归方程可以表述为:

it it y t i t f t i b it mc E εγπγπγαπ++++=+-1,1,0 (14.4.15)

其中:对第i 个经济个体,it π表示第t 期的通货膨胀率,1+it t E π是第t 期对1+t 期的通胀率预期。t mc 是厂商真实边际成本相对于其最优状态的偏离程度,目前文献通常选取劳动份额指标作为真实边际成本的替代变量。

在此,我们使用1992~2007年中国大陆29个省市区(不包括海南、重庆)的统计数据对模型(14.4.15)进行估计。其中:基于CPI 计算通货膨胀率,并使用第1+t 的实际通胀率作为第t 期的通胀率理性预期1+t t E π。由于中国经济具有非常明显的二元经济结构特征,在模型中可以同时选择了第一产业和第二、三产业的劳动份额指标的自然对数(1LLS 和23LLS )作为真实边际成本的反映指标。

基于差分GMM 方法对模型(14.4.15)进行估计,具体估计结果为:

211,1,09418.23529.25626.05562.0??it it t i t t i it LLS LLS

E ++++=+-ππαπ (14.4.16)

t 值= 186.8387 109.6812 19.7960 12.8279

p 值= 0.0000 0.0000 0.0000 0.0000

仅就这一估计结果而言,在中国通货膨胀的动态变化中,适应性预期和理性预期共存,二者的影响大致相当。经济的短期波动对通胀具有显著影响。

可能有的读者会问,为什么没有it π的更高阶滞后项出现在方程中呢?事实上,我们确实可以将2,-t i π乃至更高的滞后项引入回归方程,不过,对本样本而言,当在模型中引入2,-t i π时,其系数估计值为负,所以,我们所需估计的模型应该只包含1,-t i π。

根据估计结果,1,-t i π和1,+t i t E π的系数估计值分别为0.5562和0.5626,

二者之和为1.1188。可能读者会认为:中国的新凯恩斯混合Phillips 曲线可能满足凸组合假设,即1,-t i π和1,+t i t E π之和为1。但是,F 检验统计量的值为322.0894,相对于分布F (1,373),其p 值为0.0000,所以,F 检验的结果是:拒绝其满足凸组合的原假设。

在本例中,解释变量的工具变量集为(1i π、2i π、…、2,-t i π,1+it t E π,it LLS 1,it LLS 23),

工具变量矩阵的秩(全部工具变量个数)为29。因为基于一阶差分进行估计,没有估计截距项和个体效应的值,所以待估计参数个数为4。显然,模型存在过多的矩约束条件,即存在过度识别的问题。如果过度识别的约束是有效的,那么,模型的J 检验统计量应该服从自由度为29-4=25的2χ分布。

根据参数估计结果得到的J 检验统计值为:28.7345,对于)25(2χ分布,其p 值为0.2752,所以,我们不能拒绝“过度识别的据约束条件有效”的原假设。也就是说,基于统计推断,我们可以认为工具变量与误差项不相关,或者说所选择的工具变量是有效的。

本例对于中国新凯恩斯混合Phillips 曲线的估计结果与相关文献的估计结果有显著差异,其原因在于,本例使用的是一个简化的基本模型。在实证分析中,我们还需要考虑流动性因素对通货膨胀的影响以及通货膨胀率对不同区域间的相互推动作用。

本章小结

1. 面板数据提供更多的信息,有助于增大估计和检验的自由度,有助于增强动态分析的可靠性,有助于反映经济体的结构性特征和经济制度的渐进性变化。

2. 面板模型的混合OLS 估计,假定不存在个体效应和时间效应,是一种较为粗略的估计方法。

3. 如果个体效应i μ、时间效应t λ与模型中的解释变量是相关的,我们就称这种个体效应或时间效应是固定效应。反之,则为随机效应。

4. 固定效应静态面板数据模型的本质问题是解释变量的内生性问题,其后果是OLS 估计量不再是无偏的估计量,其最优无偏估计量是LSDV 估计量。

5. 随机效应面板数据模型的本质问题是误差项的自相关问题,其后果是OLS 估计量虽是无偏的,但有较大的方差。其最优无偏估计量是GLS 估计量。

6. 豪斯曼检验以随机效应为原假设,基于LSDV 估计量和GLS 估计量是否存在显著差异,检验模型是固定效应还是随机效应。

7. 动态面板数据模型具有固有的内生性问题,固定效应的LSDV 和随机效应的GLS 估计都是有偏的并且非一致的

8. GMM 估计的基本思想就是:使加权以后的样本矩的平方和最小化。GMM 工具变量的有效性可以基于J 检验来判定。

思考题

14.1. 固定效应为什么会导致模型存在内生性问题?LSDV 估计量是如何消除内生性的? 14.2. 随机效应为什么会导致自相关的问题?随机效应所导致的自相关与第九章所讲的AR(1)形式的自相关有什么样的区别?

14.3. 进行固定效应/随机效应检验的豪斯曼检验统计量服从2χ分布,所以,豪斯曼检验值应该只取正值。但是,在现实应用中,通常会出现豪斯曼检验值为负的情形。

(1)请基于豪斯曼检验统计量的公式(14.3.7),思考豪斯曼检验值为负值的原因。

(2)当豪斯曼检验值为负值时,豪斯曼检验是否有效,解释你的理由。

14.4. 如果所估计的动态面板模型为

it t i t i it y y y ερρ++=--2,21,1。

请思考:在进行差分GMM 估计时,2,-t i y 是否仍然可以作为工具变量?(提示:矩条件0)(2=-it t i y E ε?是否仍然成立?)

练习题

14.1.基于表5.1.1的数据,将城镇居民和农村居民的时间序列数据合并为面板数据,并根据静态模型(14.1.1)和动态模型(14.1.4)分析中国居民消费行为的特征。

(1)用混合OLS 对模型(14.1.1)进行估计,解释估计结果的经济含义。

(2)用固定效应估计模型(14.1.1),解释估计结果的经济含义。

(3)用随机效应估计模型(14.1.1),解释估计结果的经济含义。

(4)在(1)~(3)三个估计结果中,你选择哪一个,说明你的理由。

(5)用差分GMM 估计模型(14.1.4),解释估计结果的经济含义。

14.2. 至此,我们分别通过第四章习题4.6、第五章习题5.5、本章方程(14.4.15),基于不同的模型或样本数据估计了中国的新凯恩斯Phillips 曲线。

(1)比较三个部分的估计结果,说明估计结果的差异以及差异产生的原因。

(2)在三部分的估计结果中,你倾向于哪一个估计结果,说明你的理由。

(3)基于本章方程(14.4.16)的估计结果,说明中国通货膨胀的动态特征。

数据模型与决策试题

山东大学管理学院秋季MBA2011级(石家庄班) 数据、模型与决策试题2012年6月 1.(10分)线性回归模型是否满足假设要通过哪几个方面来检验?每个方面的含义是什么?根据什么指标或图形来检验好坏? 2.(15分)以下结果是应用什么软件的什么方法计算输出的,简述软件操作过程。并从结果中分析计算过程、各部分数据的意义及最后的方程(T值除外)。 --------------------------------------------------------------- XXXX: EARN 与 SIZE, EMPL, ... 入选用 Alpha: 0.05 删除用 Alpha: 0.1,响应为 14 个自变量上的 EARN,N = 50 步骤 1 2 3 4 5 常量 11.85 -348.99 -413.26 -403.41 -368.55 P45 0.0351 0.0321 0.0304 0.0321 0.0319 T 值 5.94 6.65 7.43 9.46 10.00 P 值 0.000 0.000 0.000 0.000 0.000 INC 11.9 12.9 10.3 10.3 T 值 5.11 6.55 5.98 6.34 P 值 0.000 0.000 0.000 0.000 NREST 1.29 1.43 1.40 T 值 4.49 5.96 6.22 P 值 0.000 0.000 0.000 SIZE 0.54 0.56 T 值 4.76 5.27 P 值 0.000 0.000 PRICE -2.13 T 值 -2.61 P 值 0.012 S 67.4 54.6 46.0 37.9 35.7 R-Sq 42.33 62.90 74.21 82.85 85.15 R-Sq(调整) 41.13 61.32 72.53 81.32 83.47 Mallows Cp 120.5 63.1 32.5 9.5 4.9 ------------------------------------------------------------------------------- 3.(20分)桑杰伊·托马斯(Sanjay Thomas)是斯隆管理学院的二年级MBA学生。作为上学期有关企业家课程设计的一部分,桑杰伊实际上已经对东海岸城市具有印度烹调风格的饭店的样本进行了概率分析,并首先对他婶婶的饭店进行了分析。在调整了有关波士顿地区的标准生活费用的数据以后,桑杰伊利用这些资料制定了温馨小扁豆饭店的成本和收入的标准。这些数据是基于饭店位于哈佛广场,拥有50个座位,并贷款进行了饭店的内部结构装修,以及租赁了饭店的所有资本性设备。桑杰伊估计经营温馨小扁豆饭店每月的非劳动固定成本是3995美元。他还估计了食品的可变成本是每餐为11美元。在饭店事务的许多不确定因素中,有三种不确定变量在概率等式中趋向于起主导作用:每月销售膳食的数量,每餐饭的收入,以及饭店的(固定)劳动力成本。根据他与许多饭店业主的交流,桑杰伊能够估计这三个关键性的不确定变量的实际分布,这些变量如下: ----销售膳食的数量。像温馨小扁豆饭店这样坐落于哈佛广场,并拥有50个座位容量的饭店,每月销售的膳食数量将服从一个均值为μ=3 000和标准离差为σ=1 000 的正态分布。

数据模型与决策课程总结

学习总结 (期中论文) 我们所用的教材叫做《数据、模型与决策》,我记得老师第一天给我们上课就提到过一些基本的概念以及思想,例如“什么是管理”;“什么是模型”;“如何对实际问题简化”等等。在这其中我认为非常重要的有以下几点:首先,管理的最初根源是因为资源是有限的。如何将有限的资源进行合理配制、优化从而达到最大的效益是我们应该要去注意的问题。其次,数学问题是有最优解的,当我们给定了一个确定的数学问题我们能够得到一个确定的解,但当我们在研究一个给定的现实管理问题的时候,我们是很难去找到一个最优解的,甚至可以说,管理问题是没有最优解的。(这不同于我们平时所做的运筹学等问题,因为我们平时所做的问题都已经经过了很多的化简,已经把现实管理问题进行了抽象,与其说那些问题是一个管理问题不如说它们是数学问题)这是因为现实中的管理问题比较复杂,具有很强的不确定性,我们只能是抓住主要矛盾,暂且不考虑次要矛盾。(当然了,当我们已经解决了主要矛盾之后我们可以开始考虑次要矛盾,因为这个时候次要矛盾已经上升为主要矛盾了。)所以我们去寻找的是管理问题的满意解而不是最优解。这两点在后面的学习建模中得到了很好的验证。 我们之前的学习大多是倾向于解决一个数学问题而不是一个管理问题。这一门课之所以在大三才开设我认为有其道理,在没有掌握基本的数学基本知识之前,我们是不可能很好地解决管理问题的,因为我们解决一个管理问题是先将其转化为一个可以解决的数学问题。但是并不是说我们掌握了高数、运筹学等知识就能顾很好的解决管理问题,因为如何把现实存在复杂的管理问题转化成为我们可以解决的数学问题正是这门课的核心内容之一。 以企业的生产计划安排作为例子,总结一下应用现行规划建模的步骤: ●我们的问题是什么?(如何安排生产) 如何组合不同产品的生产、生产的种类。 ●我们能做什么?(不同产品的生产数量) 明确决策变量,也就是管理中可以人为设定的要素。

武汉大学MBA《数据模型与决策》往年试题

经济与管理学院 Economics and Management School of Wuhan University ×××级×××班《数据、模型与决策》试题 出题人:刘 伟 考试形式:闭卷 考试时间:2007年7月×日 120分钟 姓名_______ 学号_______ 记分_______ 一、名词解释及简答题(各题5分) 1、众数 2、直方图 3、变异系数 4、相关系数 5、虚拟变量 6、置信区间 7、最小二乘(平方)法 8、线性回归模型 9、多重共线性 10、完全多重共线性 11、不完全多重共线性 12、虚拟变量模型 13、总体回归函数 14、何为虚变量回归模型?为什么将虚变量值设为取 0、1 ? 15、回归方程的显著性检验与回归系数的显著性检验什么区别与联系? 16、在回归方程的最小二乘法估计中,对回归模型有哪些基本假设? 17、回归方程的显著性检验与回归系数的显著性检验什么区别与联系? 18、为什么从计量经济学模型得到的预测值不是一个确定的值?预测值的置信区间和置 信度的含义是什么?在相同的置信度下如何才能缩小置信区间? 19、影子价格 20、对偶规划 21、模型 22、约束条件 23、目标函数 24、决策变量 25、协方差 26、拟合优度检验 二、计算题(各题10分) 1、500家美国公司1993年底的平均资产为11270(单位:百万美元),标准差为2780(百万美元)。这些公司的平均价格收益比为31,标准差为8。请问哪一个指标的差异大? 2、有一种电子元件,要求其使用寿命不得低于1000小时,现抽25件,测 得其均值950小时,方差为900小时。已知该种元件寿命服从正态分布, (1)写出该种电子元件使用寿命的置信区间,取α=005.; (2)若已知使用寿命的标准差σ=100,写出该种电子元件使用寿命的 置信区间,取α=005.;在 α=005.下,且已知σ=100这批元件合格否? 3、某商店的日销售额服从正态分布,据统计去年的日均销售额是2.74万元, MBA

第9章-面板数据模型理论

5.2 面板数据模型理论 5.2.1 面板数据模型及类型。 面板数据(panel data )也称时间序列截面数据(time series and cross section data )或混合数据(pool data )。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section )上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。 面板数据用双下标变量表示。例如: it y , N i ,,2,1 ;T t ,,2,1 其中,N 表示面板数据中含有的个体数。T 表示时间序列的时期数。若固定t 不变,?i y ),,2,1(N i 是横截面上的N 个随机变量;若固定i 不变,t y ?,),,2,1(T t 是纵剖面 上的一个时间序列。对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data )。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data )。 面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。面板数据模型的解析表达式为: it it it it it x y T j N i ,2,1;,2,1 其中,it y 为被解释变量;it 表示截距项,),,,(21k it it it it x x x x 为k 1维解释变量向量;' 21),,,(k it it it it 为1 k 维参数向量;i 表示不同的个体;t 表示不同的时间;it 为 随机扰动项,满足经典计量经济模型的基本假设),0(~2 IIDN it 。 面板数据模型通常分为三类。即混合模型、固定效应模型和随机效应模型。 ⑴ 混合模型。 如果一个面板数据模型定义为: it it it x y T j N i ,2,1;,2,1 则称此模型为混合模型。混合模型的特点是无论对任何个体和截面,回归系数 和 都是相同的 ⑵ 固定效应模型。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model )、时间固定效应模型(time fixed effects regression model )和时间个体固定效应模型(time and entity fixed effects regression model )。 ① 个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序

数据-模型与决策练习题含答案

1、某企业目前的损益状况如在下: 销售收入(1000件×10元/件) 10 000 销售成本: 变动成本(1000件×6元/件) 6 000 固定成本 2 000 销售和管理费(全部固定) 1 000 利润 1 000 (1)假设企业按国家规定普调工资,使单位变动成本增加4%,固定成本增加1%,结果将会导致利润下降。为了抵销这种影响企业有两个应对措施:一是提高价格5%,而提价会使销量减少10%;二是增加产量20%,为使这些产品能销售出去,要追加500元广告费。请做出选择,哪一个方案更有利? (2)假设企业欲使利润增加50%,即达到1 500元,可以从哪几个方面着手,采取相应的措施。 2、某企业每月固定制造成本1 000元,固定销售费100元,固定管理费150元;单位变动制造成本6元,单位变动销售费0.70元,单位变动管理费0.30元;该企业生产一种产品,单价10元,所得税税率50%;本月计划产销600件产品,问预期利润是多少?如拟实现净利500元,应产销多少件产品? 3、某企业生产甲、乙、丙三种产品,固定成本500000元,有关资料见下表(单位:元): 要求: (1)计算各产品的边际贡献; (2)计算加权平均边际贡献率; (3)根据加权平均边际贡献率计算预期税前利润。 4、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少? 5.有10个同类企业的生产性固定资产年平均价值和工业总产值资料如下:

(1)说明两变量之间的相关方向; (2)建立直线回归方程; (3)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。 6、某商店的成本费用本期发生额如表所示,采用账户分析法进行成本估计。 首先,对每个项目进行研究,根据固定成本和变动成本的定义及特点结合企业具体情况来判断,确定它们属于哪一类成本。例如,商品成本和利息与商店业务量关系密切,基本上属于变动成本;福利费、租金、保险、修理费、水电费、折旧等基本上与业务量无关,视为固定成本。 其次,剩下的工资、广告和易耗品等与典型的两种成本性态差别较大,不便归入固定成本或变动成本。对于这些混合成本,要使用工业工程法、契约检查法或历史成本分析法,寻找一个比例,将其分为固定和变动成本两部分。 7、某企业每年耗用某种材料3 600千克,单位存储成本为2元,一次订货成本25元。 则经济订货批量、每年最佳订货次数、最佳订货周期、与批量有关的存货总成本是多少? 8、某生产企业使用A零件,可以外购,也可以自制。如果外购,单价4元,一次订

数据,模型,和决策

第一章(管理科学简介) P5(1)管理科学介绍 管理科学本质:是对与定量因素有关的管理问题通过应用科学的方法进行辅助管理决策制定的一门学科. 管理科学发展过程:快速发展开始于20世纪四五十年代 起初的动力来自于第二次世界大战 另一个里程碑是1947年丹捷格发明单纯形罚 更大的推动作用的是计算机革命的爆发 管理决策:管理者考虑管理科学对定量因素进行分析得出的结果后,再考虑管理科学以外的众多无形因素,然后根据其最佳判断做出决策 管理科学小组系统和考察时步骤:定义问题与收集数据——构件数学模型——从模型中形成对于一个问题进行求解的基于计算机的程序——测试模型并在必要时进行修正——应用模型分析问题以及提出管理建议——帮助实施被管理者采纳的小组建议 课后问题: 1.管理科学什么时候有了快速发展?快速发展开始于20世纪四五十年代 2.商学院以外还广泛使用的对管理科学学科的叫法:运筹学 3.管理科学研究提供给管理者什么? 对问题涉及的定量因素进行分析并向开明的管理者提出建议 4.管理科学以哪些领域作为基础?科学领域:数学,计算机社会领域:经济学 5.什么是决策支持系统?辅助管理决策制定的交互式基于计算机的系统 6.与管理问题有关的一般定量因素有哪些?生产数量,收入,成本,资源 P11(2)一个例子:盈亏平衡分析 步骤:分析问题——建立模型——敏感性分析,电子表格模型提供上述三者了方便的途径如果预测销售数量<盈亏平衡点,Q=0 预测销售数量>盈亏平衡点,Q=预测销售数量 敏感性分析目的:研究如果一个估计值发生了变化,将会给模型带来什么样的变化 Min(a,b):取a,b中的最小值 If(A,b,c):如果表达式A为真,则值为b,否则为c 第二章(线性规划:基本概念) P31(3)在电子表格上建立恩德公司问题的模型 1.开始在电子表格上建立线性规划模型时需要回答的三个问题: 要做出的决策是什么? 在做出这些决策上有哪些约束条件? 这些决策的全部绩效测度是什么? 2.以下各个单元格的作用 数据单元格:显示数据的单元格 可变单元格:需要做出决策的单元格 输出单元格:依赖于可变单元格的输出结果的单元格 目标单元格:在生产率做出决策时目标值定为尽可能大的特殊单元格 3.该案例中每个输出单元格(包括目标单元格)的Excel等式的形式:可以表达为一个SUMPRODUCT函数,这里的每一项是一个数据单元格和可变单元格的乘积 P33(4)电子表格的数学模型 1.电子表格模型与代数模型相同的初始步骤: 收集相关数据

历届诺贝尔经济学奖得主及其主要贡献

历届诺贝尔经济学奖得主及其主要贡献(1969—2015) 诺贝尔经济学奖的由来 诺贝尔经济学奖(The Prize in Economic Sciences),是由瑞典银行在1968年,为纪念诺贝尔而增设的并非诺贝尔遗嘱中提到的五大奖励领域之一,全称为“纪念阿尔弗雷德-诺贝尔瑞典银行经济学奖(The Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel)”,通常称为诺贝尔经济学奖(Nobel economics prize),也称瑞典银行经济学奖。 1969年(瑞典银行的300周年庆典)第一次颁奖,由挪威人弗里希和荷兰人扬-廷贝亨共同获得,美国经济学家萨缪尔森、弗里德曼等人均获得过此奖。 2015年诺贝尔经济学奖将于斯德哥尔摩时间10月12日13时(北京时间12日19时)举行。 经济学奖并非根据阿尔弗雷德-诺贝尔的遗嘱所设立的,但在评选步骤、授奖仪式方面,与诺贝尔奖相似。奖项由瑞典皇家科学院每年颁发一次,遵循对人类利益做出最大贡献的原则给奖。 诺贝尔经济学奖可以颁发给单个人,也可以最多由三人分享,其主要目的是表彰获奖者在宏观经济学、微观经济学、新的经济分析方法等领域所作的贡献。今年的诺贝尔经济学奖奖金仍为1000万瑞典克朗(约合140万美元)。 “诺贝尔经济学奖”历届获奖者名单 从1969年至2015年诺贝尔经济学奖已经颁发了47次,获奖者人数达76人,其中包括美国著名的经济学家萨缪尔森、弗里德曼。 1969年 拉格纳·弗里希(RAGNAR FRISCH)挪威人 简·丁伯根(JAN TINBERGEN)荷兰人 主要贡献:他们发展了动态模型来分析经济进程。前者是经济计量学的奠基人,后者经济计量学模式建造者之父。 1970年 保罗·安·萨默尔森(PAUL A SAMUELSON )美国人 主要贡献:他发展了数理和动态经济理论,将经济科学提高到新的水平。他的研究涉及经济学的全部领域。 1971年 西蒙·库兹列茨(SIMON KUZNETS )美国人 主要贡献:在研究人口发展趋势及人口结构对经济增长和收入分配关系方面做出了巨大贡献。 1972年 约翰·希克斯(JOHN R. HICKS)英国人 肯尼斯·约瑟夫·阿罗(KENNETH J. ARROW)美国人 主要贡献:他们深入研究了经济均衡理论和福利理论。 1973年 华西里·列昂惕夫(W ASSIL Y LEONTIEF)苏联人 主要贡献:发展了投入产出方法,该方法在许多重要的经济问题中得到运用。 1974年 弗·冯·哈耶克(FRIEDRICH AUGUST VON HAYEK)澳大利亚人

《数据模型与决策》试题答案

2008—2009第二学期《数据模型与决策》课 考试题 姓名:学号:成绩: 【说明:共5题,答题时间共计120分钟】 一、试述你对以下概念的理解:(32分) (1)企业内部数据,即通常从企业会计、营销、生产运行中收集的数据。 (2)样本,即总体的一个子集。 (3)回归模型,即刻画因变量与一个或多个自变量之间相互关系的模型。 (4)德尔斐法,是判断预测的普遍方法,通过让许多专家匿名回答一系列调查问卷来实现。在每一轮回答后,答案将匿名共享,让专家知道其他专家的意见。通过了解其他专家的意见,将增加看法的统一性并促使意见不一致的人去考虑其他因素。 (5)正态分布,其形态就是钟形曲线。正态分布是对称的且中位数等于平均数,即有一半的面积在平均数以上,另一半的面积在平均数以下。正态分布可以用两个参数来描述;均值(位置参数)、方差(刻度参数)。当均值变化时,分布在x轴上的位置也会变化;而当方差增加或减少时,分布相应地会变宽或窄。 (6)变异系数,是一种间接测度数据离散程度的方法,它一般由平均数求得:变异系数(CV)=标准方差/平均数 (7)标准差,是测度离散程度的一种方法。它是方差的开平方求得的。总体和样本标准差分别为:

(8)显著性水平,即发生第一类错误(即原假设事实上是正确的,但是假设检验错误的拒绝了它)的概率a。 二、对于下表这样一组给定的数据,我们可以用表格、图形、回归模型3种方式来表达10个公司销售收入与营销费用之间的关系。试问:这3种方式的表达思路有什么异同?(15分) 公司编号12345678910销售收入(Y)5000 3000 1200 2000 10000 4000 800 7000 9000 12000 营销费用(X)675 550 275 325 1375 525 193 950 975 1650 答: 表格:我们仅从数据中可以看到营销费用与销售收入大约成正向关系,即营销费用增加,销售收入增加。 图形:我们可以从图形中更加直观的揭示数据中包含的特征与规律,即能够大体的看清营销费用变动导致销售收入变动的程度。 回归:通过回归分析可以确定自变量变化时对因变量产生影响的大小,即能够确认营销费用的变化时销售费用能够变化的大小。 三、在“数据模型与决策”课程中,有许多定量分析的模型与方法。请回答下面的问题:(18分) (1)归纳总结各种模型方法的共同点; (2)根据你的喜好选择一种方法,举例说明其解决问题的思路。 答:在课程中,我们主要应用图表、假设检验、回归分析的定量分析模型与方法,这些模型与方法共同组成一整套决策模型体系,都是对量化的数据进行分析,得出可以量化的模型来揭示数据内在联系。 个人而言,回归分析的是比较好的方法,因为它包含图表、假设检验的方法,

最新数据模型与决策课程大作业打印版.doc

数据模型与决策课程大作业 以我国汽油消费量为因变量,乘用车销量、城镇化率和90#汽油吨价与城镇居民人均可支配收入的比值为自变量时行回归(数据为年度时间序列数据)。试根据得到部分输出结果,回答下列问题:1)“模型汇总表”中的R方和标准估计的误差是多少? 2)写出此回归分析所对应的方程; 3)将三个自变量对汽油消费量的影响程度进行说明; 4)对回归分析结果进行分析和评价,指出其中存在的问题。 1)“模型汇总表”中的R方和标准估计的误差是多少? 答案:R方为0.993^2=0.986 ;标准估计的误差为120910.147^(0.5)=347.72 2)写出此回归分析所对应的方程; 答案:假设汽油消费量为Y,乘用车销量为a,城镇化率为b,90#汽油吨价/城镇居民人均可支配收入为c,则回归方程为: Y=240.534+0.00s027a+8649.895b-198.692c 3)将三个自变量对汽油消费量的影响程度进行说明; 乘用车销量对汽油消费量相关系数只有0.00027,数值太小,几乎没有影响,但是城镇化率对汽油消费量相关系数是8649.895,具有明显正相关,当城镇化率每提高1,汽油消费量增加8649.895。乘用90#汽油吨价/城镇居民人均可支配收入相关系数为-198.692,呈

明显负相关,即乘用90#汽油吨价/城镇居民人均可支配收入每增加1个单位,汽油消费量降低198.692个单位。a, b, c三个自变量的sig 值为0.000、0.000、0.009,在显著性水平0.01情形下,乘用车消费量对汽油消费量的影响显著为正。 (4)对回归分析结果进行分析和评价,指出其中存在的问题。 在学习完本课程之后,我们可以统计方法为特征的不确定性决策、以运筹方法为特征的策略的基本原理和一般方法为基础,结合抽样、参数估计、假设分析、回归分析等知识对我国汽油消费量影响因素进行了模拟回归,并运用软件计算出回归结果,故根据回归结果,对具体回归方程,回归准确性,自变量影响展开分析。 Anova表中,sig值是t统计量对应的概率值,所以t和sig两者是等效的,sig要小于给定的显著性水平,越接近于0越好。F是检验方程显著性的统计量,是平均的回归平方和平均剩余平方和之比,越大越好。在图表中,回归模型统计值F=804.627,p值为0.000,因此证明回归模型有统计学意义,表现回归极显著。即因变量与三个自变量之间存在线性关系。 系数表中,除了常数项系数显著性水平大于0.05,不影响,其它项系数都是0.000,小于0.005,即每个回归系数均具有意义。

EViews面板数据模型估计教程

EViews 6.0 beta在面板数据模型估计中的应用 来自免费的minixi 1、进入工作目录cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件workfile (1)最好不要选择EViews默认的blanaced panel 类型 Moren_panel (2)按照要求建立简单的满足时期周期和长度要求的时期型工作文件

3、建立pool对象 (1)新建对象 (2)选择新建对象类型并命名 (3)为新建pool对象设置截面单元的表示名称,在此提示下(Cross Section Identifiers: (Enter identifiers below this line )输入截面单元名称。,建议采用汉语拼音,例如29个省市区的汉语拼音,建议在拼音名前加一个下划线“_”,如图

关闭建立的pool对象,它就出现在当前工作文件中。 4、在pool对象中建立面板数据序列 双击pool对象,打开pool对象窗口,在菜单view的下拉项中选择spreedsheet (展开表) 在打开的序列列表窗口中输入你要建立的序列名称,如果是面板数据序列必须在序列名后添加“?”。例如,输入GDP?,在GDP后的?的作用是各个截面单元的占位符,生成了29个省市区的GDP的序列名,即GDP后接截面单元名,再在接时期,就表示出面板数据的3维数据结构(1变量2截面单元3时期)了。

请看工作文件窗口中的序列名。展开表(类似excel)中等待你输入、贴入数据。 (1)打开编辑(edit)窗口

(2)贴入数据 (3)关闭pool窗口,赶快存盘见好就收6、在pool窗口对各个序列进行单位根检验 选择单位根检验 设置单位根检验

数据模型与决策

数据模型与决策 数据模型与决策第一周课后试题- 7道选择题 1. (单选题) 位于亚特兰大的Brandon广告公司,为Boston Market快餐厅新推出的鸡肉餐品进行消费者调研。Brandon共调查了1960位消费者,其中1176人声称,如果该鸡肉餐品推向市场,他们将会购买。Brandon广告公司应如何向Boston Market快餐厅报告,鸡肉餐品的总体市场接受度是多少? A. 40% B. 50% C. 60% D. 70% 2. (单选题) 一项关于在美国收听谈话类广播电台的成年听众的年龄情况调查。其中50位受访者的年龄如下表所示: 以上数据是什么类型的测度数据?

A. 定名数据 B. 定序数据 C. 定距数据 D. 定比数据 3. (单选题) 在一项针对200位豪车车主的调研中,有100位来自California,50位来自New York,30位来自Illinois,20位来自Ohio。车主所在的地区,是什么类型的测度数据? A. 定名数据 B. 定序数据 C. 定距数据 D. 定比数据 4. (单选题) Struthers Wells公司的销售及生产部门,有超过10000名的白领员工,这些雇员分布在美国、欧洲、亚洲等地。一份针对300名员工的调查显示,其中120人愿意接受岗位调动前往美国以外地区工作。依据此次调查,公司全体白领雇员中可接受岗位调动的比例是多少?

A. 30% B. 40% C. 50% D. 60% 5. (单选题) 以下是美国八大汽车制造厂商,2010年的前两个月的汽车销售量与2009年的前两个月的汽车销售量数据: 比较八大汽车厂商的总体销量,相较2009年,2010年同期的汽车总体销量是上升还是下降?百分比是多少? A. 上升,8.7% B. 下降,9.5% C. 上升,9.2% D. 下降,7.8%

数据模型与决策复习题及参考答案

《数据模型与决策》复习题及参考答案 第一章绪言 一、填空题 1.运筹学的主要研究对象是各种有组织系统的管理问题,经营活动。 2.运筹学的核心是运用数学方法研究各种系统的优化途径及方案,为决策者提供科学决策的依据。 3.模型是一件实际事物或现实情况的代表或抽象。 4、通常对问题中变量值的限制称为约束条件,它可以表示成一个等式或不等式 的集合。 5.运筹学研究和解决问题的基础是最优化技术,并强调系统整体优化功能。运筹学研究和解决问题的效果具有连续性。 6.运筹学用系统的观点研究功能之间的关系。 7.运筹学研究和解决问题的优势是应用各学科交叉的方法,具有典型综合应用特性。 8.运筹学的发展趋势是进一步依赖于_计算机的应用和发展。 9.运筹学解决问题时首先要观察待决策问题所处的环境。 10.用运筹学分析与解决问题,是一个科学决策的过程。 11.运筹学的主要目的在于求得一个合理运用人力、物力和财力的最佳方案。12.运筹学中所使用的模型是数学模型。用运筹学解决问题的核心是建立数学模型,并对模型求解。 13用运筹学解决问题时,要分析,定议待决策的问题。 14.运筹学的系统特征之一是用系统的观点研究功能关系。 15.数学模型中,“s·t”表示约束。 16.建立数学模型时,需要回答的问题有性能的客观量度,可控制因素,不可控因素。 17.运筹学的主要研究对象是各种有组织系统的管理问题及经营活动。 二、单选题 1.建立数学模型时,考虑可以由决策者控制的因素是(A )

A.销售数量B.销售价格C.顾客的需求D.竞争价格2.我们可以通过(C )来验证模型最优解。 A.观察B.应用C.实验D.调查 3.建立运筹学模型的过程不包括(A )阶段。 A.观察环境B.数据分析C.模型设计D.模型实施4.建立模型的一个基本理由是去揭晓那些重要的或有关的( B ) A数量B变量 C 约束条件 D 目标函数 5.模型中要求变量取值( D ) A可正B可负C非正D非负 6.运筹学研究和解决问题的效果具有( A ) A 连续性 B 整体性 C 阶段性 D 再生性 7.运筹学运用数学方法分析与解决问题,以达到系统的最优目标。可以说这个过 程是一个(C) A解决问题过程B分析问题过程C科学决策过程D前期预策过程 8.从趋势上看,运筹学的进一步发展依赖于一些外部条件及手段,其中最主要的 是( C ) A数理统计B概率论C计算机D管理科学 9.用运筹学解决问题时,要对问题进行( B ) A 分析与考察 B 分析和定义 C 分析和判断 D 分 析和实验 三、多选 1模型中目标可能为(ABCDE ) A输入最少B输出最大 C 成本最小D收益最大E时间最短 2运筹学的主要分支包括(ABDE ) A图论B线性规划 C 非线性规划 D 整数规划 E目标规划 四、简答 1.运筹学的计划法包括的步骤。 答:观察、建立可选择的解、用实验选择最优解、确定实际问题。

《数据模型与决策》学习心得

《数据模型与决策》学习心得 ——运用运筹学的理念定会取得“运筹帷幄,决胜千里” 运筹学问题和运筹思想可以追溯到古代,它和人类实践活动的各种决策并存。现在普遍认为,运筹学是近代应用数学的一个分支,主要是将生产、管理等事件中出现的一些带有普遍性的运筹问题加以提炼,然后利用数学方法进行解决。界定运筹学作为在科学界的一门独立学科的出现,应当说是在1951年,即P. M. Morse和G. E. Kimball 的专着“运筹学方法”出版的那一年。运筹学的思想贯穿了企业管理的始终,运筹学对各种决策方案进行科学评估,为管理决策服务,使得企业管理者更有效合理地利用有限资源。优胜劣汰,适者生存,这是自然界的生存法则,也是企业的生存法则。只有那些能够成功地应付环境挑战的企业,才是得以继续生存和发展的企业。作为企业的管理者,把握并运用好运筹学的理念定会取得“运筹帷幄之中,决胜千里之外”之功效。 一、企业发展原则与战略管理 企业战略管理是企业在宏观层次通过分析、预测、规划、控制等手段,充分利用本企业的人、财、物等资源,以达到优化管理,提高经济效益的目的。随着我国经济市场化的日益加深,市场竞争日趋激烈,我国企业面临着更多的环境因素的影响与冲击。企业要求得生存与发展,必须运筹帷幄,长远谋划,根据自身的资源来制定最优的经营战略,以战略统揽全局。企业战略过程包括,明确企业战略目标,制定战略规划,作出和执行战略决策,并最后对战略作出评价。企业战略管理作为企业管理形态的一种创新,应是以市场为导向的管理、

是有关企业发展方向的管理、是面向未来的管理、是寻求内资源与外资源相协调的管理、是寻找企业的长期发展为目的。也就是将企业看作一个系统,来寻求系统内外的资源合理分配与优化,这正体现了运筹学的思想。我国企业战略管理的内容应根据自己的国情,制定对应的战略。主要侧重规定企业使命、分析战略环境、制定战略目标。中国现在绝大部分商品已由卖方市场转为买方市场,知识经济正向我们走来,全球经济一体化的程度在加深,我国企业不仅直接参与国内市场,还将更直接面临与世界跨国公司之间的角逐,企业间竞争的档次和水平日益提高,因而企业将面临更加复杂的竞争环境。只有确定了宏伟的奋斗目标,才能使企业凝集全部的力量,众志成城,向一个共同方向努力,争取实现有限资源的最有效的利用。显然,运筹学理念的作用举足轻重。 二、企业生产计划与市场营销 1、生产计划。使用运筹学方法从总体上确定适应需求的生产、贮存和劳动力安排等计划,以谋求最大的利润或最小的成本,运筹学主要用线性规划、整数规划以及模拟方法来解决此类问题。线性规划问题的数学模型是指求一组满足一个线性方程组(或线性不等式组,或线性方程与线性不等式混合组)的非负变量,使这组变量的一个线性函数达到最大值或最小值的数学表达式. 建立数学模型的一般步骤: (1)确定决策变量(有非负约束);对于一个企业来说,一般是直生产某产品的计划数量。 (2)写出目标函数(求最大值或最小值)确定一个目标函数;

数据模型与决策试卷2018

2018级硕士研究生课程考试试题 课程名称:数据、模型与决策 适用专业:2018级MBA 一、名词解释(每题5,共20分) 1.灵敏度分析 2.最大流问题 3.决策树 4.仿真 1.灵敏度分析 在根据一定数据求得最优解后,当这些数据中某一个或某几个发生变化 时,对最优解会产生什么影响。或者说,要使最优解保持不变,各个数据可以有多大的幅度的变动。这种研究线性规划模型的原始数据变化对最优解产生的影响就叫做线性规划的灵敏度分析。 2. 最大流问题 给一个有向图D=(V ,A),在V 中指定了一点,称为发点(记为v s ),和另一点,称为收点(记为v t ),其余的点叫中间点。对于每一个弧(v i ,v j )∈A,对应有一个c(v i ,v j )≥0(或简写为c ij ),称为弧的容量。通常把这样的D 叫作一个网络。记作D=(V ,A ,C)。对D 中的任一弧(v i ,v j )有流量f(v i ,v j ) (有时也简记作f ij ),称集合f={f ij }为网络D 上的一个流。满足1)容量限制条件:对每一弧(v i ,v j )∈A ,0≤f ij ≤c ij ;2)平衡条件:流出量=流入量,即对每个i(i ≠s, t)有 (,)(,)0i j j i ij ji v v A v v A f f ∈∈- =∑ ∑ 的流 f 称为可行流。最大流问题就是在网络中,寻 找流量最大的可行流,即求一个流{f ij },使其流量v(f)达到最大,且满足:0≤f ij ≤c ij (v i ,v j )∈A , ()()()()() ,ij ji v f i s f f i s t v f i t ?=?-=≠??-=? ∑∑ 。 3.决策树 决策树又称为判定树,是数据挖掘技术中的一种重要的分类方法,它是一种 以树结构(包括二叉树和多叉树)形式来表达的预测分析模型。具体方法是:通过把实例从根节点排列到某个叶子节点来分类实例;叶子节点即为实例所属的分类;树上每个节点说明了对实例的某个属性的测试,节点的每个后继分支对应于该属性的一个可能值。决策树起源于Marin 和Stone 为了研究人类概念模型而得来,于1966年提出。主要算法有:CART 算法,ID3算法,C4.5算法,SLIQ 分类方法,SPRINT 法,PUBLIC 法等等。 4.仿真 科学研究通常有三种途径;理认推导、科学实验和仿真模拟。人们在认识自然、利用自然过程中,为了更好地完成这一能动过程,需要对物质世界及非物质世界进行实验研究。然而试验分析对某些真实系统可能是不允许的。因此,在实践中出现了用模型来代替真实系统做试验的方法,以解决上述无法直接对真实系统进行试验分析的问题。仿真是通过对系统模型的试验去研究一个存在的或设计中的系统。仿真是一门建立在相似理论,控制理论,系统科学和计算机基础上的综合性和试验性学科。 二、简答题(每题10分,共30分) 1.线性规划模型由哪些部分组成?线性规划模型有哪些性质? 答:线性规划模型由决策变量、目标函数、约束条件等组成构成。线性规划模型的具体性 质包括:1)目标函数是决策变量的线性函数;2)约束条件是决策变量的线性等式或不等式。 2.什么是概率决策的期望值方法?决策树方法与期望值法有何关系? 答:决策的前提条件存在确定、不确定及风险三种情况,在不确定及存在风险情况下进行 决策,可以依据不确定事件及风险发生的概率计算相应的期望值,通过期望收益最大化或期望损失最小化进行决策,即为概率决策的期望值方法。决策树法是指借助树状图,按照客观概率的大小,计算出各个方案的期望值,并对各个方案期望值进行比较,从中选择一个最为满意方案的方法。因此,决策树法属于概率决策期望值方法的一种。 3.有些什么类型的仿真?什么是仿真的Monte Carlo 进程? 答:仿真是通过对系统模型的试验去研究一个存在的或设计中的系统。大致可分成:计算 机仿真、半物理仿真及全物理仿真。计算机仿真也被称为纯数学仿真,它是一种通过建立与

MATLAB空间面板数据模型操作介绍

MATLAB 空间面板数据模型操作简介 MATLAB 安装: 在民主湖资源站上下载 MA TLAB 2009a ,或者 2010a ,按照其中的安装说明 安装 MATLAB 。( MATLAB 较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局 首先我们说一下 MA TLAB 处理空间面板数据时,数据文件是怎么布局的,熟悉 eviews 的同学 可能知道, eviews 中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间 序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中 “1-94”“1-95” “1-96” “ 1-97”中, 1是省份的代号, 94,95,96,97 表示年份, eviews 是将每个省 份的数据放在一起,再将所有省份堆放在一起。 与 eviews 不同, MATLAB 处理空间面板数据时,面板数据的布局是(在 excel 中说明): 先排 放一个横截面上的数据(即某年所有省份的数据) ,再将不同年份的横截面按时间顺序堆放在一起。 如图:

这里需要说明的是, MA TLAB 中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。二、数据的输入: MATLAB 与 excel链接:在 excel中点击“工具→加载宏→浏览” ,找到 MA TLAB 的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为: C:\Programfiles\MATLAB\R2009a\toolbox\exlink ,点击 excllink.xla 即可完成 excel 与 MATLAB 的链接。这样的话 excel 中的数据就可以直接导入 MATLAB 中形成 MATLAB 的数据文件。操作完成后 excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB ”即表示我们希望 excel 与

(完整word版)数据模型与决策课程案例分析

数据模型与决策课程案例一生产战略 一、问题提出 好身体公司(BFI)在长岛自由港工厂生产健身练习器械。最近他们设计了两种针对家庭锻炼所广泛使用的举重机。两种机器都是用了BFI专利技术,这种技术提供给使用者除了机器本身运动功能之外的一些其他额外的运动功能。直到现在,这种功能也只有在很昂贵的、应用于理疗的举重机上才可以获得。 在最近的交易展销会上,举重机的现场演示引起了交易者浓厚的兴趣,实际上,BFI现在收到的订单数量已经超过了这个时期BFI的生产能力。管理部门决定开始这两种器械的生产。这两种器械分别被BFI 公司命名为BodyPlus100和BodyPlus200,由不同的原材料生产而成。 BodyPlus100由一个框架、一个压力装置、一个提升一下拉装置组成。生产一个框架需要4小时机器制造和焊接时间,2小时喷涂和完工时间;每个压力装置需要2小时机器制造和焊接时间,1小时喷涂和完工时间,每个提升一下拉装置需要2小时机器制造和焊接时间,2小时喷涂和完工时间。另外,每个BodyPlus100还需要2小时用来组装、测试和包装。每个框架的原材料成本是450美元,每个压力装置的成本是300美元,每个提升一下拉装置是250美元。包装成本大约是每单位50美元。 BodyPlus200包括一个框架、一个压力装置、一个提升一下拉装置和一个腿部拉伸装置。生产一个框架需要5小时机器制造和焊接时间,4小时喷涂和完工时间;生产一个压力装置需要3小时机器制造和焊接时间,2小时喷涂和完工时间;生产每个提升一下拉装置需要2小时机器制造和焊接时间,2小时喷涂和完工时间,另外,每个BodyPlus200还需要2小时用来组装、测试和包装。每个框架的原材料成本是650美元,每个压力装置的成本是400美元,每个提升一下拉装置是250美元,每个腿部拉伸装置的成本是200美元。包装成本大约是每单位75美元。 在下一个生产周期,管理部门估计有600小时机器和焊接时间,450小时喷涂和完工时间,140小时组装、测试和包装时间是可用的。现在的每小时劳动力成本是机器制造和焊接时间20美元,喷涂和完工时间15美元,组装、测试和包装12美元。虽然对于BFI来说由于新机器的独特功能可能还会获得一些价格的灵活性,但BodyPlus100的市场建议价格是2400美元,BodyPlus200是3500美元。授权的BFI销售商可以以市场价格的70%来购买产品。 BFI的总裁相信BodyPlus200 的独特功能可以帮助BFI 成为高端锻炼器械的领导者。所以,他认为BodyPlus200的数量至少会占到整个生产数量的25%。 管理报告 分析BFI的生产问题,为公司的总裁准备一份报告,告诉他们你的发现和建议。报告包括以下几个方面(不仅于此): (1)BodyPlus100和BodyPlus200的建议生产数量是多少? (2)BodyPlus200的数量占生产数量至少25%的要求会怎样影响利润? (3)为了增加利润应扩展哪方面的努力? 把你的线性规划模型和图形解作为你报告的附录部分。 二、问题分析与模型建立 根据案例对好身体公司(BFI)两种器械产品BodyPlus100和BodyPlus200的描述,用

《计量经济学》谢识予分章练习题

计量经济学分章练习题 第一章习题 一、判断题 1. 投入产出模型和数学规划模型都是计量经济模型。(X ) 2. 弗里希因创立了计量经济学从而获得了诺贝尔经济学奖。(V ) 3. 丁伯根因创立了建立了第1个计量经济学应用模型从而获得了诺贝尔经济学奖。(V ) 4. 格兰杰因在协整理论上的贡献而获得了诺贝尔经济学奖。(V ) 5. 赫克曼因在选择性样本理论上的贡献而获得了诺贝尔经济学奖。(V ) 二、名词解释 1 ?计量经济学,经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关 理论。 2. 计量经济学模型,是一个或一组方程表示的经济变量关系以及相关条件或假设,是经济问题 相关方面之间数量联系和制约关系的基本描述。 3?计量经济检验,由计量经济学理论决定的,目的在于检验模型的计量经济学性质。通常最主 要的检验准则有随机误差项的序列相关检验和异方差性检验,解释变量的多重共线性检验等。 4?截面数据,指在同一个时点上,对不同观测单位观测得到的多个数据构成的数据集。 5?面板数据,是由对许多个体组成的同一个横截面,在不同时点的观测数据构成的数据。 三、单项选择题 1. 把反映某一单位特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数 据称为(B ) A.横截面数据C.面板数据 B.时间序列数据D.原始数据 2.同一时间、不同单位按同一统计指标排列的观测数据称为( C ) A.原始数据 B .时间序列数据 C?截面数据 D .面板数据 3.不同时间、不同单位按同一统计指标排列的观测数据称为( D A.原始数据 B .时间序列数据 C?截面数据 D .面板数据 4.对计量经济模型进行的结构分析不包括(D ) A.乘数分析 B .弹性分析 C.比较静态分析 D .随机分析 5.一个普通家庭的每月所消费的水费和电费是( B ) A.因果关系 B .相关关系 C?恒等关系 D .不相关关系 6.中国的居民消费和GDP^( C )

相关文档