文档库 最新最全的文档下载
当前位置:文档库 › 二元选择(Probit&Logit)模型

二元选择(Probit&Logit)模型

二元选择(Probit&Logit)模型
二元选择(Probit&Logit)模型

硕士研究生课程作业作业题目: 二元选择模型分析

作业类型:模型分析

课程名称: 中级计量经济学

授课老师: 崔百胜

专业班级: 15级应用统计5班

研究生姓名: 谢亚利

研究生学号: 152502732

完成时间2015 年11 月二元选择(Probit及logit)模型

通常,经济计量模型都是假定隐变量是连续的,但是在现实经济决策中经常面临许多选择问题,即为离散选择模型。最为基础的便是二元选择模型其研究目的是研究具有给定特征得个体做某种而不做另一种选择的概率。

如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。

以下是常用得Probit 及logit 模型、实例分析并进行Eviews 实现。 一、二元选择模型原理: 为了深刻地理解二元选择模型,首先从最简单的线性概率模型开始讨论。线性概率模型的回归形式为:

i ki k i i i u x x x y ++++=βββ 2211 (1)

其中:N 是样本容量;k 是解释变量个数;xj 为第j 个个体特征的取值。例如,x1表示收入;x2表示汽车的价格;x3表示消费者的偏好等。设 yi 表示取值为0和1的离散型随机变量:

??

???=择(如不买车)如果作出的是第二种选

择(如买车)如果作出的是第一种选

01i y

式(1)中ui 为相互独立且均值为0的随机扰动项。

i i i i p y P y P y E ==?+=?=)0(0)1(1)( (2)

令pi = P ( yi =1) ,那么 1 - pi = P ( yi =0) ,于是

又因为E(ui ) = 0 ,所以 E(yi ) = xi xi =(x1i , x2i ,…, xki ), ( i=1 ,2 ,…, k ),从而有下面的等式:

βx i i i i p y P y E ====)1()( (3)

式(3)只有当xi 的取值在(0,1)之间时才成立,否则就会产生矛盾,而在实际应用时很可能超出这个范围。因此,线性概率模型常常写成下面的形式:

??

???≤≥<<=0

,01,

110,βx βx βx βx i i i i i p

(4)

此时就可以把因变量看成是一个概率。 那么扰动项的方差为:

)](1)[()(22i i i i y E y E u E -==σ (5)

或)1()1()()1()(2

22i i i i i i i p p p p u E -=--+-=βx βx (6)

由此可以看出,误差项具有异方差性。异方差性使得参数估计不再是有效的,修正异方差的一个方法就是使用加权最小二乘估计。但是加权最小二乘法无法保证预测值?在(0,1)之内,这是线性概率模型一个严重的弱点。由于上述问题,我们考虑对线性概率模型进行一些变换,由此得到下面要讨论的模型。

假设有一个未被观察到的潜在变量yi*,它与xi 之间具有线性关系,即

**i i i u y +=βx (7)

其中: ui*是扰动项。yi 和yi*的关系如下:

????

?≤>=0

01*

*i

i i y y y (8)

yi*大于临界值0时,yi =1;小于等于0时,yi =0。这里把临界值选为0,但事实上只要xi 包含有常数项,临界值的选择就是无关的,所以不妨设为0。这样

)

()()0(),|0()(1)()0(),|1(****βx βx βx βx βx βx i i i

i

i i i i i i i i F u P y P y P F u P y P y P -=-≤=≤==--=->=>== (9)

其中:F 是ui*的分布函数,要求它是一个连续函数,并且是单调递增的。因此,原始的回归模型可以看成如下的一个回归模型:

()i i i u F y +--=βx 1 (10) 即yi 关于它的条件均值的一个回归。

根据分布函数F 的不同,即可确定不同的类型。 二、研究模型分析:

1.Probit 模型:

如果将F 定义为标准正态分布函数,

dz X X Y P i X i

i i )2z (-ex p 21)()|1(2

''?∞

-=Φ==β

π

β (11)

)

('βi X Φ会把概率取值限定在0、1之间,此时的概率模型为Probit 模型。

2.Logit 模型:

如果把F 定义为Logistic 分布函数,则产生的概率模型为Logit 模型:

)

(exp 1)

(exp )()|1('''βββi i i

i i X X X X Y P +=Λ== (12)

二、实例分析: 例如书中7.1: Eviews 实现:

第一步,导入表7.2数据;

第二步,选择模型;

(1)Probit模型

图1 (2)Logit模型:

图2 第三步,分析结果:

(1)Probit模型

图3 Probit 模型参数分析表

参数估计结果的上半部分包含与一般的回归结果类似的基本信息,标题包含关于估计方法(ML 表示极大似然估计)和估计中所使用的样本的基本信息,也包括达到收敛要求的迭代次数(4次)。和计算系数协方差矩阵所使用方法的信息。在其下面显示的是系数的估计、渐近的标准误差、z-统计量、P 值及各种有关统计量。

当分布函数采用标准正态分布,即得到解释变量GPA (X1)、TUCE (X2)、PSI (X3)对因变量GRADE 的Probit 模型:

3

21*426332.1051729.0625810.1452320.7?X X X Y +++-= (13) (2)Logit 模型:

图4 Probit 模型参数分析表

分布函数采用逻辑分布,即Logit 模型为:

3

21*379.2095.0826.2021.13?X X X Y +++-= 注:

其他的数据说明如下:

① log likelihood 是对数似然函数的最大值L(b),b 是未知参数的估计值。

② Avg. log likelihood 是用观察值的个数N 去除以对数似然函数L(b) ,即对数似然函数的平均值。

③ Restr. Log likelihood 是除了常数以外所有系数被限制为0时的极大似然函数L(b) 。 ④ LR 统计量检验除了常数以外所有系数都是0的假设,这类似于线性回归模型中的统计量,测试模型整体的显著性。圆括号中的数字表示自由度,它是该测试下约束变量的个数。 ⑤ Probability (LR stat )是LR 检验统计量的P 值。在零假设下,LR 检验统计量近似服从于自由度等于检验下约束变量的个数的2

χ分布。

此题中P<0.01,则得到:此模型整体比较显著。

⑥ McFadden R-squared 是计算似然比率指标,正像它的名字所表示的,它同线性回归模型中的R2是类似的。它具有总是介于0和1之间的性质。

可用标准化残差序列图来检验模型的充分性(程序2见附件): 以Logit 模型为例:

首先,用Eviews 计算出标准化残差:

其次利用SAS 做出标准化残差序列图如下:

图5 标准化残差序列图

从而可以看出,标准化残差介于-3~3之间,此模型较为充分。

以Probit 模型为例,对假设进行检验:

对于Probit 模型:利用其系数,本例按如下公式给出新教学法对学习成绩影响的概率, 当PSI = 0时:(938.212=X )

)938.210517.06258.14523.7()1P(1*?++-Φ==X Y (14 ) 当PSI = 1时:

)4263.1938.210517.06258.14523.7()1P(1*+?++-Φ==X Y

(15)

可用SAS做出新教学法对学习成绩的影响概率图:(程序1见附件)

图6 新教学法对学习成绩的影响概率

由图6得,PSI对学习成绩影响的概率重大,接受新教学法成绩改善的概率明显高于不接受的概率。

四、检验与预测:

以Logit模型为例:

1、进行拟合优度检验:

首先,进行Eviews操作:

其次,结果分析:

图7 Logit模型拟合优度检验分析表

最下方给出了H-L和Andrews检验的x2统计量。由相伴概率的P值可以看出,在5%的显著性水平下,不能拒绝原假设,因而认为模型的拟合优度很高,拟合效果很好。

2、预测:

由此图,可进行其他新的数学方法对成绩的有效性预测。

程序1

data a;

input GPA @@;

P0=probnorm(-7.4523+1.6258*GPA+0.0517*21.938);

P1=probnorm(-7.4523+1.6258*GPA+0.0517*21.938+1.42); cards;

2.06

2.39

2.63

2.66

2.67

2.74

2.75

2.76

2.83

2.83

2.86

2.87

2.89

2.89

2.92

3.03

3.1

3.12

3.16

3.26

3.28

3.32

3.39

3.51

3.53

3.54

3.57

3.62

3.65

3.92

4

4

;

proc sgplot;

series x=GPA y=P0;

series x=GPA y=P1;

inset'PSI=0'/position=bottom;

程序2:

data b;

input i r; cards;

1 -0.165238224

2 -0.251526619

3 -0.480005922

4 -0.16306554

5 0.868743639

6 -0.190045398

7 -0.16500196

8 -0.233156259

9 -0.353581213

10 0.664783839

11 -0.158379892

12 -0.484318071

13 -0.689527056

14 2.043449136

15 -0.751611958

16 -0.176417596

17 -0.238044453

18 -0.200342611

19 -1.199277332

20 0.716484213

21 -0.255713052

22 0.324282103

23 -0.564681585

24 -2.400189277

25 0.43920824

26 1.038473506

27 0.757469984

28 -0.665925583

29 0.433665696

30 0.240458276

31 -1.060033344

32 2.829577106 ;

proc sgplot; series x=i y=r; run;

二元选择模型

二元选择摸型 如果回归模型的解释变量中含有定性变量,则可以用虚拟变量处理之。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议的态度,某件事情的成功和失败等。当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型,统称离散选择模型。这里主要介绍Tobit (线性概率)模型,Probit (概率单位)模型和Logit 模型。 1.Tobit (线性概率)模型 Tobit 模型的形式如下, y i = α + β x i + u i (1) 其中u i 为随机误差项,x i 为定量解释变量。y i 为二元选择变量。此模型由James Tobin 1958年提出,因此得名。如利息税、机动车的费改税问题等。设 1 (若是第一种选择) y i = 0 (若是第二种选择) -0.2 0.0 0.20.40.60.81.01.2 330 340 350 360 370 380 X Y 对y i 取期望, E(y i ) = α + β x i (2) 下面研究y i 的分布。因为y i 只能取两个值,0和1,所以y i 服从两点分布。把y i 的分布记为, P ( y i = 1) = p i P ( y i = 0) = 1 - p i 则 E(y i ) = 1 (p i ) + 0 (1 - p i ) = p i (3) 由(2)和(3)式有 p i = α + β x i (y i 的样本值是0或1,而预测值是概率。) (4) 以p i = - 0.2 + 0.05 x i 为例,说明x i 每增加一个单位,则采用第一种选择的概率增加0.05。 现在分析Tobit 模型误差的分布。由Tobit 模型(1)有, u i = y i - α - β x i =?? ?=--=--0 ,1 ,1i i i i y x y x βαβα E(u i ) = (1- α - β x i ) p i + (- α - β x i ) (1 - p i ) = p i - α - β x i 由(4)式,有

二元离散选择模型案例

第七章 二元离散选择模型案例 1、在一次选举中,由于候选人对高收入者有利,所以收入成为每个投票者表示同意或者反对的最主要影响因素。以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。原始模型为:i i i y x αβμ=++。利用Probit 二元离散选择模型估计参数。 表7.1 样本观测值 输入变量名,选择Probit 参数估计。

得到如下输出结果: 但是作为估计对象的不是原始模型,而是如下结果: =---+ 1@[( 4.75390.003067*)] YF CONRM X 可以得到不同X值下的Y选择1的概率。例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。

2、某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。样本观测值见表8.2。目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。 估计过程如下:

输入变量名,选择Logit参数估计。 得到如下输出结果:

用回归方程表示如下: JGF CONRM XY SC =---+ 1@[(16.110.465035*9.379903*)] 该方程表示,当XY和SC已知时,带入方程,可以计算贷款成功的概率JGF。 3、某研究所1999年50名硕士考生的入学考试总分数(SCORE)及录取情况见表5。考生考试总分数用SCORE表示,Y为录取状态,D1为表示应届生与往届生的虚拟变量。 表7.3 50名硕士考生的入学考试总分数(SCORE)及录取状况数据表

第五章离散选择模型

第五章离散选择模型 在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外,在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为虚拟变量的情况。我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型,本章主要介绍这一类模型的估计与应用。 本章主要介绍以下内容: 1、为什么会有离散选择模型。 2、二元离散选择模型的表示。 3、线性概率模型估计的缺陷。 4、Logit模型和Probit模型的建立与应用。 第一节模型的基础与对应的现象 一、问题的提出 在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策问题,是定性的,没有观测数据所对应;或者其观测到的是受某种限制的数据。 1、被解释变量是定性的选择与决策问题,可以用离散数据表示,即取值是不连续的。例如,某一事件发生与否,分别用1和0表示;对某一建议持反对、中立和赞成5种观点,分别用0、1、2表示。由离散数据建立的模型称为离散选择模型。 2、被解释变量取值是连续的,但取值的范围受到限制,或者将连续数据转化为类型数据。例如,消费者购买某种商品,当消费者愿意支付的货币数量超过该商品的最低价值时,则表示为购买价格;当消费者愿意支付的货币数量低于该商品的最低价值时,则购买价格为0。这种类型的数据成为审查数据。再例如,在研究居民储蓄时,调查数据只有存款一万元以上的帐户,这时就不能以此代表所有居民储蓄的情况,这种数据称为截断数据。这两种数据所建立的模型称为受限被解释变量模型。有的时候,人们甚至更愿意将连续数据转化为上述类型数据来度量,例如,高考分数线的设置,

就把高出分数线和低于分数线划分为了两类。 下面是几个离散数据的例子。 例5.1 研究家庭是否购买住房。由于,购买住房行为要受到许多因素的影响,不仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买住房的心理价位很难观测到,但我们可以观察到是否购买了住房,即 我们希望研究买房的可能性,即概率(1) P Y=的大小。 例5.2 分析公司员工的跳槽行为。员工是否愿意跳槽到另一家公司,取决于薪资、发展潜力等诸多因素的权衡。员工跳槽的成本与收益是多少,我们无法知道,但我们可以观察到员工是否跳槽,即 例5.3 对某项建议进行投票。建议对投票者的利益影响是无法知道的,但可以观察到投票者的行为只有三种,即 研究投票者投什么票的可能性,即(),1,2,3 ==。 P Y j j 从上述被解释变量所取的离散数据看,如果变量只有两个选择,则建立的模型为二元离散选择模型,又称二元型响应模型;如果变量有多于二个的选择,则为多元选择模型。本章主要介绍二元离散选择模型。 离散选择模型起源于Fechner于1860年进行的动物条件二元反射研究。1962年,Warner首次将它应用于经济研究领域,用于研究公共交通工具和私人交通工具的选择问题。70-80年代,离散选择模型被普遍应用于经济布局、企业选点、交通问题、就业问题、购买行为等经济决策领域的研究。模型的估计方法主要发展于20世纪80年代初期。(参见李子奈,高等计量经济学,清华大学出版社,2000年,第155页-第156页) 二、线性概率模型 对于二元选择问题,可以建立如下计量经济模型。

离散选择模型

离散选择模型 集团标准化工作小组 [Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]

第五章离散选择模型 在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外,在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为虚拟变量的情况。我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型,本章主要介绍这一类模型的估计与应用。 本章主要介绍以下内容: 1、为什么会有离散选择模型。 2、二元离散选择模型的表示。 3、线性概率模型估计的缺陷。 4、Logit模型和Probit模型的建立与应用。 第一节模型的基础与对应的现象 一、问题的提出 在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策问题,是定性的,没有观测数据所对应;或者其观测到的是受某种限制的数据。 1、被解释变量是定性的选择与决策问题,可以用离散数据表示,即取值是不连续的。例如,某一事件发生与否,分别用1和0表示;对某一建议持反对、中立和赞成5种观点,分别用0、1、2表示。由离散数据建立的模型称为离散选择模型。 2、被解释变量取值是连续的,但取值的范围受到限制,或者将连续数据转化为类型数据。例如,消费者购买某种商品,当消费者愿意支付的货币数量超过该商品的最低价值时,则表示为购买价格;当消费者愿意支付的货币数量低于该商品的最低价值时,则购买价格为0。这种类型的数据成为审查数据。再例如,在研究居民储蓄时,调查数据只有存款一万元以上的帐户,这时就不能以此代表所有居民储蓄的情况,这种数据称为截断数据。这两种数据所建立的模型称为受限被解释变量模型。有的时候,人们甚至更愿意将连续数据转化为上述类型数据来度量,例如,高考分数线的设置,就把高出分数线和低于分数线划分为了两类。 下面是几个离散数据的例子。 例研究家庭是否购买住房。由于,购买住房行为要受到许多因素的影响,不仅

计量经济学第八讲

三、多重共线性的检验 (一) 相关系数检验 利用相关系数可以分析解释变量之间的两两相关情况。在EViews 软件中可以直接计算(解释)变量的相关系数矩阵: [命令方式]COR 解释变量名 [菜单方式]将所有解释变量设置成一个数组,并在数组窗口中点击View\Correlations. (二) 辅助回归模型检验 相关系数只能判断解释变量之间的两两相关情况,当模型的解释变量个数多于两下、并且呈现出较为复杂的相关关系时,可以通过每个解释变量对其他解释变量的辅助回归模型来检验多重共线性,即依次建立k 个辅助回归模型: k i x a x a x a x a a x k k i i i i i ,,11 1 1 1 1 1 =++++++=++--ε 如果,其中某些方程显著,则表明存在多重共线性,所对应的变量可以近似地用其他解释变量线性表示。 辅助回归模型检验不仅能检验多元回归模型的多重共线性,而且可以得到多重共线性的具体形式;如果再结合偏相关关系检验,还能进一步判定是哪些解释变量引起了多重共线性,这有助于分析如何消除多重共线性的影响。 (三) 方差膨胀因子检验 对于多元线性回归模型,i b ?的方差可以表示成:

i ij i i ij i VIF x x R x x b D ?∑-=-∑-=2 2 2 2 2 ) (11)()?(σσ 其中,i i x R 为2 关于其他解释变量辅助回归模型的判定系数,i VIF 为方差膨胀因子。随着多重共线性程度的增强,VIF 以及系数估计误差都在增大。因此,可以用VIF 作为衡量多重共线性的一个指标;一般当10>VIF 时,(此时9.02>i R ),认为模型存在较严重的多重共线 性。 另一个与VIF 等价的指标是“容许度”(Tolerance ),其定义为: i i i VIF R TOL /1)1(2 =-= 显然,10≤≤TOL ,当i x 与其他解释变量高度相关时,0→TOL 。因此,一般当1.0

第七章 二元离散选择模型

第七章 二元离散选择模型 1.在一次选举中,由于候选人对高收入者有力,所以收入成为每个投票者表示同意或者反对的最主要影响因素。以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。原始模型为:i i i y x αβμ=++。利用Probit 二元离散选择模型估计参数。 表8.1 样本观测值 序号 X Y 序号 X Y 序号 X Y 1 100 0 11 1100 0 21 2100 1 2 200 0 12 1200 0 22 2200 1 3 300 0 13 1300 1 23 2300 1 4 400 0 14 1400 0 24 2400 1 5 500 0 15 1500 1 25 2500 1 6 600 0 16 1600 0 26 2600 1 7 700 0 17 1700 1 27 2700 1 8 800 0 18 1800 0 28 2800 1 9 900 0 19 1900 1 29 2900 1 10 1000 20 2000 1 30 3000 1 估计过程如下: 输入变量名,选择Probit 参数估计。

得到如下输出结果: 但是作为估计对象的不是原是模型,而是如下结果: =---+ YF CONRM X 1@[( 4.75390.003067*)] 可以得到不通X值下的Y选择1的概率。例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。 1.某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们

离散选择模型完整版

离散选择模型 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】

第五章离散选择模型 在初级计量经济学里,我们已经学习了解释变量是虚拟变量的情况,除此之外,在实际问题中,存在需要人们对决策与选择行为的分析与研究,这就是被解释变量为虚拟变量的情况。我们把被解释变量是虚拟变量的线性回归模型称为离散选择模型,本章主要介绍这一类模型的估计与应用。 本章主要介绍以下内容: 1、为什么会有离散选择模型。 2、二元离散选择模型的表示。 3、线性概率模型估计的缺陷。 4、Logit模型和Probit模型的建立与应用。 第一节模型的基础与对应的现象 一、问题的提出 在研究社会经济现象时,常常遇见一些特殊的被解释变量,其表现是选择与决策问题,是定性的,没有观测数据所对应;或者其观测到的是受某种限制的数据。 1、被解释变量是定性的选择与决策问题,可以用离散数据表示,即取值是不连续的。例如,某一事件发生与否,分别用1和0表示;对某一建议持反对、中立和赞成5种观点,分别用0、1、2表示。由离散数据建立的模型称为离散选择模型。 2、被解释变量取值是连续的,但取值的范围受到限制,或者将连续数据转化为类型数据。例如,消费者购买某种商品,当消费者愿意支付的货币数量超过该商品的最低价值时,则表示为购买价格;当消费者愿意支付的货币数量低于该商品的最低价值时,则购买价格为0。这种类型的数据成为审查数据。再例如,在研究居民储蓄时,调查数据只有存款一万元以上的帐户,这时就不能以此代表所有居民储蓄的情况,这种数据称为截断数据。这两种数据所建立的模型称为受限被解释变量模型。有的时候,人们甚至更愿意将连续数据转化为上述类型数据来度量,例如,高考分数线的设置,就把高出分数线和低于分数线划分为了两类。 下面是几个离散数据的例子。 例研究家庭是否购买住房。由于,购买住房行为要受到许多因素的影响,不仅有家庭收入、房屋价格,还有房屋的所在环境、人们的购买心理等,所以人们购买住

二元离散选择模型

二元离散选择模型 1.在一次选举中,由于候选人对高收入者有力,所以收入成为每个投票者表示同意或者反对的最主要影响因素。以投票者的态度(y )作为被解释变量,以投票者的月收入(x )作为解释变量建立模型,同意者其观测值为1,反对者其观测值为0,样本数据见表7.1。原始模型为:i i i y x αβμ=++。利用Probit 二元离散选择模型估计参数。表8.1样本观测值序号X Y 序号X Y 序号 X Y 11000111100021210012200012120002222001330001313001232300144000141400024240015500015150012525001660001616000262600177000171700127270018800018180002828001990001919001292900110 1000 20 20001 30 3000 1 估计过程如下: 输入变量名,选择Probit 参数估计。

得到如下输出结果: 但是作为估计对象的不是原是模型,而是如下结果: 1@[( 4.75390.003067*)] YF CONRM X =???+可以得到不通X 值下的Y 选择1的概率。例如,当X=600时,查标准正态分布表,对应于2.9137的累积正态分布为0.9982;于是,Y 的预测值YF=1-0.9982=0.0018,即对应于该个人,投赞成票的概率为0.0018。 1.某商业银行从历史贷款客户中随机抽取78个样本,根据涉及的指标体系分别计算它们

的“商业信用支持度”(XY)和“市场竞争地位等级”(SC),对它们贷款的结果(JG)采用二元离散变量,1表示贷款成功,0表示贷款失败。样本观测值见表8.2。目的是研究JG与XY、SC之间的关系,并为正确贷款决策提供支持。 表8.2样本观测值 JG XY SC JGF JG XY SC JGF JG XY SC JGF 0125-2001500-20054-10 0599-200960014221 0100-201-80104200.0209 0160-200375-2011821 046-20042-1 6.50E-130801 6.40E-12 080-2015211-501 0133-200172-20032620 0350-101-801026110 12300.9979089-201-2-10.9999 060-200128-20014-2 3.90E-07 070-10160112200.9991 1-8010150-10011310 0400-201542114210.9987 07200028-2015720.9999 0120-1012500.9906014600 14010.999812300.997911501 13510.999911401026-2 4.40E-16 12611049-10089-20 115-10.4472014-10.54981511 069-100610 2.10E-121-9-11 010710140211411 12911030-20054-20 12110112-1013211 13710.9999078-200540 1.40E-07 053-1010010131-20 0194000131-2011501 估计过程如下:

相关文档