文档库 最新最全的文档下载
当前位置:文档库 › 应用回归分析,第2章课后习题参考答案汇总

应用回归分析,第2章课后习题参考答案汇总

应用回归分析,第2章课后习题参考答案汇总
应用回归分析,第2章课后习题参考答案汇总

第二章 一元线性回归分析

思考与练习参考答案

2.1 一元线性回归有哪些基本假定?

答: 假设1、解释变量X 是确定性变量,Y 是随机变量;

假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=σ2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n

假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, σ2 ) i=1,2, …,n 2.2 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n

误差εi (i=1,2, …,n )仍满足基本假定。求β1的最小二乘估计 解: 得:

2.3 证明(2.27式),∑e i =0 ,∑e i X i =0 。

证明:

其中:

即: ∑e i =0 ,∑e i X i =0

∑∑+-=-=n

i

i i n

i X Y Y Y Q 1

2102

1

))??(()?(ββ211

1

2)?()?(i

n

i i n

i i i e X Y Y Y Q β∑∑==-=-=

01????i i

i i i

Y X e Y Y ββ=+=-0

1

00??Q

Q

β

β

??==??

2.4回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什

么条件下等价?给出证明。

答:由于εi ~N(0, σ2 ) i=1,2, …,n

所以Y i =β0 + β1X i + εi ~N (β0+β1X i , σ2 ) 最大似然函数:

使得Ln (L )最大的0

?β,1?β就是β0,β1的最大似然估计值。 同时发现使得Ln (L )最大就是使得下式最小,

上式恰好就是最小二乘估计的目标函数相同。值得注意的是:最大似然估计是在εi ~N (0, σ2 )的假设下求得,最小二乘估计则不要求分布假设。

所以在εi ~N(0, σ2 ) 的条件下, 参数β0,β1的最小二乘估计与最大似然估计等价。

2.5 证明0

?β是β0的无偏估计。 证明:)1[)?()?(1

110∑∑==--=-=n

i i xx i n i i

Y L X X X Y n E X Y E E ββ )] )(1

([])1([1011i i xx i n i i xx i n

i X L X X X n E Y L X X X n E εββ++--=--=∑∑==

1010)()1

(])1([βεβεβ=--+=--+=∑∑==i xx i n

i i xx i n

i E L X X X n

L X X X n E 2.6 证明 证明:

)] ()1([])1([)?(102110i i xx i n

i i xx i n

i X Var L X X X n

Y L X X X n Var Var εβββ++--=--=∑∑== ∑∑+-=-=n

i

i i n i X Y Y Y Q 1

21021

))??(()?(ββ()

)

1()1()?(2

2

2

1

2

2

xx n

i i

L X n X X

X n

Var +=-+=∑=σσβ

2

2221

2]1[])(2)1[(σσxx xx i xx i n

i L X n L X X X nL X X X n +=-+--=∑=

2.7 证明平方和分解公式:SST=SSE+SSR

证明:

2.8 验证三种检验的关系,即验证: (1)2

1)2(r r n t --=

;(2)22

2

1

??)2/(1/t L n SSE SSR F xx ==-=σ

β 证明:(1)

?t ===

=

=

=

(2)

2

2

2

22011111

1

1

1

??????()()(())(())n

n

n

n

i i i

i xx i i i i SSR y y x y y x x y x x L βββββ=====-=+-=+--=-=∑∑∑∑2212?/1

?/(2)xx L SSR F t SSE n βσ

∴===-

2.9 验证(2.63)式:2

211σ)L )x x (n ()e (Var xx i i ---=

证明:

11

222

2

222

???var()var()var()var()2cov(,)???var()var()2cov(,())()()11[]2[]()1[1]i i i i i i i i

i

i

i

i i xx xx

i xx

e y y

y y y y y x y y x x x x x x n L n L x x n L β

ββσσσσ

=-=+-=++-+---=++-+-=--

()()

∑∑==-+-=-=n i i

i i n i i Y Y Y Y Y Y SST 1212

]?()?[()

()

()

∑∑∑===-+--+-=n

i i

i n

i i i i n

i i

Y Y Y Y Y Y Y Y 1

2

1

12

)??)(?2?(

)()

SSE

SSR )Y ?Y Y Y ?n

1

i 2

i

i n

1

i 2i +=-+-=∑∑

==

其中:2

22221

111))(1()(1))(,()()1,())(?,(),())(?,(σσσββxx

i xx i n

i i xx i

i i n

i i i i

i i i i L x x n L x x n y L x x y Cov x x y n y Cov x x y Cov y y Cov x x y y Cov -+=-+=--+=-+=-+∑∑==

2.10 用第9题证明是σ2的无偏估计量

证明:

2

2

211

221122

11??()()()22()111var()[1]221

(2)2

n n i i i i n n i i i i xx E E y y E e n n x x e n n n L n n σσσσ=====-=---==----=

-=-∑∑∑∑ 2.11 验证决定系数与F 值之间的关系式

2

2-+=

n F F

r

证明:

21

1/1

2

1/(/(2))1221SSR SSR r SST SSR SSE SSE SSR

n SSR SSE n F n F n F =

==

++=-+

-==

-+-+

2.14 为了调查某广告对销售收入的影响,某商店记录了5个月的销售收入y (万元)和广告费用x (万元),数据见表2.6,要求用手工计算: 表2.6

(1) 画散点图(略)

(2) X 与Y 是否大致呈线性关系? 答:从散点图看,X 与Y 大致呈线性关系。

2?22-=

∑n e

i

σ

(3) 用最小二乘法估计求出回归方程。

计算表

(4) 求回归标准误差

先求SSR (Q e )见计算表。 所以

(5) 给出 的置信度为95%的区间估计; 由于(1-α)的置信度下, 的置信区间是 查表可得 915.110

667

.36?2?1

==

=

xx

L S σβ 所以 的95%的区间估计为:(7—3.182*1.915,7+3.182*1.915),即(0.906,13.094)。

351.6)10

25

51(667.36)1(?22

?

=+=+=xx L X n S σβ 所以 的95%的区间估计为:(-1-3.182*6.351,-1+3.182*6.351),

即(-21.211, 19.211)。^0β的置信区间包含0,表示^

0β不显著。

(6) 计算x 和y 的决定系数

10?,?ββ2

2

????(,)i

i

i i t s t s ααββ

ββ-?+?i

β?182

.3)3()2(025.02/==-t n t α1?

β0?

β

说明回归方程的拟合优度高。 (7) 对回归方程作方差分析

方差分析表

F 值=13.364>F 0.05(1,3)=10.13(当n 1=1,n 2=8时,α=0.05查表得对应的值为10.13),所以拒绝原假设,说明回归方程显著。

(8)做回归系数β1的显著性检验H0: β1=0

656.3915.1/7/?1

?1=

==β

βS t t 值=3.656>t 0.05/2(3)=3.182,所以拒绝原假设,说明x 对Y 有显著的影响。

(8) 做相关系数R 的显著性检验

R 值=0.904>R 0.05(3)=0.878,所以接受原假设,说明x 和Y 有显著的线性关系。

(9) 对回归方程作残差图并作相应的分析

残差图(略) .从残差图上看出,残差是围绕e=0在一个固定的带子里随

机波动,基本满足模型的假设e i ~N(0, σ2 ), 但由于样本量太少, 所以误差

较大.

(10) 求广告费用为4.2万元时,销售收入将达到多少?并给出置信度为95%的置信区间.

解: 当X 0=4.2时,

4.282.471???0

100=?+-=+=X Y ββ

所以广告费用为4.2万元时, 销售收入将达到28.4万元. 由于置信度为1-α时,Y 0估计值的置信区间为:

)10

44

.1511(667.36)(11(?202

?0

++=-++=-xx Y

Y L X X n S σ

所以求得Y 0的95%的置信区间为: [6.05932 ,50.74068] 预测误差较大.

2.15 一家保险公司十分关心其总公司营业部加班的制度,决定认真调查一下现状。经过十周时间,收集了每周加班工作时间的数据和签发的新保单数目,x 为每周新签发的保单数目,y 为每周加班工作时间(小时)。见表2.7。

表2..7

2、由散点图可以看出, x 与y 之间大致呈线性关系。

02

2

?000

?0??Y

Y Y Y S t Y Y S t Y --?+<

3、用最小二乘法求出回归系数

由表可知:118.0β

= 00359.0β1

= 回归方程为:

x 00359.0118.0y ?+=

4、求回归标准误差σ

?

由方差分析表可以得到:SSE=1.843

故回归标准误差2

^2

SSE

n σ=-,^σ=0.48。

5、给出回归系数的置信度为95%的区间估计

由回归系数显著性检验表可以看出,当置信度为95%时:

^

0β的预测区间为[-0.701,0.937], ^

1β的预测区间为[0.003,0.005].

^0β的置信区间包含0,表示^

0β不拒绝为零的假设。

6、决定系数

由模型概要表得到决定系数为0.9接近于1,说明模型的拟合优度高。

7. 对回归方程作方差分析 由方差分析表可知:

F 值=72.396>5.32(当n 1=1,n 2=8时,查表得对应的值为5.32) P 值≈0,所以拒绝原假设,说明回归方程显著。 8、对^

1β的显著性检验

从上面回归系数显著性检验表可以得到^

1β的t 统计量为t=8.509,所对应的p 值近似为0,通过t 检验。说明每周签发的新保单数目x 对每周加班工作时间y 有显著的影响。

9.做相关系数显著性检验

相关系数达到0.949,说明x 与y 显著线性相关。 10、对回归方程作残差图并作相应分析

从残差图上看出,残差是围绕e=0随即波动,满足模型的基本假设。

11、该公司预计下一周签发新保单X0=1000张,需要的加班时间是多少?

当x 0=1000张时,7032.31000*00359.0118.0y =+=小时 12、给出Y 0的置信水平为95%的预测区间

通过SPSS 运算得到Y 0的置信水平为95%的预测区间为: (2.5195,4.8870)。

13 给出E (Y 0)的置信水平为95%的预测区间

通过SPSS 运算得到Y 0的置信水平为95%的预测区间为:(3.284,

4.123)。

2.16 表是1985年美国50个州和哥伦比亚特区公立学校中教师的人均年工资y(美元)和学生的人均经费投入x(美元).

解答:(

由上图可以看出y 与x 的散点分布大致呈直线趋势。 (2)建立y 对x 的线性回归。

利用SPSS 进行y 和x 的线性回归,输出结果如下:

表1 模型概要

1) 由表1可知,x 与y 决定系数为697.0=r ,说明模型的拟合效果一般。x

与y 线性相关系数R=0.835,说明x 与y 有较显著的线性关系。 2) 由表2(方差分析表中)看到,F=112.811,显著性Sig.p 000.0≈,说明回

归方程显著。

3) 由表3 可见对1β的显著性t 检验P 值近似为零,故1β显著不为0,说明

x 对y 有显著的线性影响。

4) 综上,模型通过检验,可以用于预测和控制。

x 与y 的线性回归方程为:

x y

*314.3629.12112?+=

(3)绘制标准残差的直方图和正态概率图

图1 标准残差的直方图

图2 标准残差的正态概率P-P 图

由图1可见标准化后残差近似服从正态分布,由图2可见正态概率图中的各个散点都分布在45°线附近,所以没有证据证明误差项服从同方差的正态分布的假定是不真实的,即残差通过正态性检验,满足模型基本假设。

观测值概率

理论正

态概率

应用回归分析课后习题

y1 1 x11 x12 x1p 0 1 3.1 y2 1 x21 x22 x2p 1 + 2 即y=x + yn 1 xn1 xn2 xnp p n 基本假定 (1)解释变量x1,x2…,xp 是确定性变量,不是随机变量,且要求 rank(X)=p+1

n 注 tr(H) h 1 3.4不能断定这个方程一定很理想,因为样本决定系数与回归方程中 自变量的数目以及样本量n 有关,当样本量个数n 太小,而自变量又较 多,使样本量与自变量的个数接近时, R 2易接近1,其中隐藏一些虚 假成分。 3.5当接受H o 时,认定在给定的显着性水平 下,自变量x1,x2, xp 对因变量y 无显着影响,于是通过x1,x2, xp 去推断y 也就无多大意 义,在这种情况下,一方面可能这个问题本来应该用非线性模型去描 述,而误用了线性模型,使得自变量对因变量无显着影响;另一方面 可能是在考虑自变量时,把影响因变量y 的自变量漏掉了,可以重新 考虑建模问题。 当拒绝H o 时,我们也不能过于相信这个检验,认为这个回归模型 已经完美了,当拒绝H o 时,我们只能认为这个模型在一定程度上说明 了自变量x1,x2, xp 与自变量y 的线性关系,这时仍不能排除排除我 们漏掉了一些重要的自变量。 3.6中心化经验回归方程的常数项为0,回归方程只包含p 个参数估计 值1, 2, p 比一般的经验回归方程减少了一个未知参数,在变量较 SSE (y y)2 e12 e22 1 2 1 E( ) E( - SSE* n p 1 n p n 2 [D(e) (E(e))2] 1 n (1 1 n 2 en n E( e 1 1 n p 1 1 n p 1 1 "1 1 n p 1 J (n D(e) 1 (p 1)) 1_ p 1 1 1 n p 1 2 2 n E(e 2) (1 h ) 2 1

26、回归分析测试题及答案

中级经济师基础知识 第 1题:单选题(本题1分) 某公司产品当产量为1000单位时,其总成本为4000元;当产量为2000单位时,其总成本为5000,则设产量为x,总成本为y,正确的一元回归方程表达式应该是( )。 A、y = 3000 + x B、y = 4000 + 4x C、y = 4000 + x D、y = 3000 + 4x 【正确答案】:A 【答案解析】: 本题可列方程组:设该方程为y = a + bx,则由题意可得:4000 = a + 1000b5000 = a + 2000b 解该方程,得b=1,a=3000,所以方程为y = 3000 + x 第 2题:单选题(本题1分) 在回归分析中,估计回归系数的最小二乘法的原理是( )。 A、使得因变量观测值与均值之间的离差平方和最小 B、使得因变量估计值与均值之间的离差平方和最小 C、使得观测值与估计值之间的乘积和最小 D、使得因变量观测值与估计值之间的离差平方和最小 【正确答案】:D 【答案解析】: 较偏较难的一道题目。最小二乘法就是使得因变量的观测值与估计值之间的离差平方和最小来估计参数的一种方法 第 3题:多选题(本题2分) 关于相关分析和回归分析的说法,正确的的有() A、相关分析可以从一个变量的变化来推测另一个变量的变化 B、相关分析研究变量间相关的方向和相关的程度 C、相关分析中需要明确自变量和因变量 D、回归分析研究变量间相互关系的具体形式 E、相关分析和回归分析在研究方法和研究目的有明显区别 【正确答案】:BDE 【答案解析】: 相关分析与回归分析在研究目的和方法上具有明显的区别。 (1)、相关分析研究变量之间相关的方向和相关的程度,无法从一个变量的变化来推测另一变量的变化情况。 (2)、回归分析是研究变量之间相关关系的具体形式

泛函分析答案

泛函分析答案: 1、 所有元素均为0的n ×n 矩阵 2、 设E 为一线性空间,L 是E 中的一个子集,若对任意的x,y ∈L ,以及变数λ和μ均有λx +μy ∈L ,则L 称为线性空间E 的一个子空间。子空间心室包含零元素,因为当λ和μ均为0时,λx +μy =0∈L ,则L 必定含零元素。 3、 设L 是线性空间E 的子空间,x 0∈E\L,则集合x 0+L={x 0+l,l ∈L}称为E 中一个线性流形。 4、 设M 是线性空间E 中一个集合,如果对任何x,y ∈M ,以及λ+μ=1,λ≥0,μ≥0的 λ和μ,都有λx +μy ∈M ,则称M 为E 中的凸集。 5、 设x,y 是线性空间E 中的两个元素,d(x,y)为其之间的距离,它必须满足以下条件: (1) 非负性:d(x,y)>0,且d(x,y)=0<―――>x=y (2) d(x,y)=d(y,x) (3) 三角不等式:d(x,y)≤d(x,z)+d(y,z) for every x,y,z ∈E n 维欧几里德空间常用距离定义: 】 设x={x 1,x 2,…x n }T ,y={y 1y 2,…y n }T d 2(x,y)=( 21 ||n i i i x y =-∑)1/2 d 1(x,y)=1 ||n i i i x y =-∑ d p (x,y) = ( 1 ||n p i i i x y =-∑ )1/p d ∞(x,y)=1max ||i i i n x y ≤≤- 6、距离空间(x,d)中的点列{x n }收敛到x 0是指d(x n ,x 0)0(n ∞),这时记作 0lim n n x x -->∞ =,或 简单地记作x n x 0 7、设||x||是线性空间E 中的任何一个元素x 的范数,其须满足以下条件: (1)||x||≥0,且||x||=0 iff x=0 (2)||λx||=λ||x||,λ为常数 (3)||x+y||≤||x||+||y||,for every x,y ∈E 8、设E 为线性赋范空间,{x n }∞ n=1是其中的一个无穷列,如果对于任何ε>0,总存在自然数N ,使得当n>N,m>N 时,均有|x m -x n |<ε,则称序列{x n }是E 中的基本列。若E 的基本列的收敛元仍属于E ,则称E 为完备的线性赋范空间,即为Banach 空间。线性赋范空间中的基本列不一定收敛。 9、有限维的线性赋范空间必然完备,所以它必定是Banach 空间。 $ 10、如果内积空间能在由内积诱导的赋范空间完备,则此内积空间称为Hilbert 空间。 11、L 2(a,b )为定义在(a,b)上平方可积函数空间,即设f(t)∈L 2(a,b ), 2|()|b a f t dt ? <∞。 当 L 2(a,b )中内积的定义为(f,g )= _____ ()()b a f t g t dt ? (其中f(t),g(t)∈L 2(a,b ))时其为Hilbert 空间。 ★ 12、算子表示一种作用,一种映射。设X 和Y 是给定的两个线性赋范空间,集合D ?X , 若对D 中的每一个x ,均有Y 中的一个确定的变量y 与其对应,则说这种对应关系确定

应用回归分析课后答案

应用回归分析课后答案 第二章一元线性回归 解答:EXCEL结果: SUMMARY OUTPUT 回归统计 Multiple R R Square Adjusted R Square 标准误差 观测值5 方差分析 df SS MS F Significance F 回归分析125 残差3 总计410 Coefficients标准误差t Stat P-value Lower 95%Upper 95%下限%上限% Intercept X Variable 15 RESIDUAL OUTPUT 观测值预测Y残差 1 2 3 4 5 SPSS结果:(1)散点图为:

(2)x 与y 之间大致呈线性关系。 (3)设回归方程为01y x ββ∧ ∧ ∧ =+ 1β∧ = 12 2 1 7()n i i i n i i x y n x y x n x -- =- =-=-∑∑ 0120731y x ββ-∧- =-=-?=- 17y x ∧ ∴=-+可得回归方程为 (4)22 n i=1 1()n-2i i y y σ∧∧=-∑ 2 n 01i=1 1(())n-2i y x ββ∧∧=-+∑ =222 22 13???+?+???+?+??? (10-(-1+71))(10-(-1+72))(20-(-1+73))(20-(-1+74))(40-(-1+75)) []1 169049363 110/3= ++++= 1 330 6.13 σ∧=≈ (5)由于2 11(, )xx N L σββ∧ :

t σ ∧ == 服从自由度为n-2的t分布。因而 /2 |(2)1 P t n α α σ ?? ?? <-=- ?? ?? 也即: 1/211/2 (p t t αα βββ ∧∧ ∧∧ -<<+=1α - 可得 1 95% β∧的置信度为的置信区间为(7-2.3537+2.353即为:(,) 2 2 00 1() (,()) xx x N n L ββσ - ∧ + : t ∧∧ == 服从自由度为n-2的t分布。因而 /2 (2)1 P t n α α ∧ ?? ?? ?? <-=- ?? ?? ?? ?? ?? 即 0/200/2 ()1 pβσββσα ∧∧∧∧ -<<+=- 可得 1 95%7.77,5.77 β∧- 的置信度为的置信区间为() (6)x与y的决定系数 2 21 2 1 () 490/6000.817 () n i i n i i y y r y y ∧- = - = - ==≈ - ∑ ∑ (7)

应用回归分析,第8章课后习题参考答案

第8章 非线性回归 思考与练习参考答案 8.1 在非线性回归线性化时,对因变量作变换应注意什么问题? 答:在对非线性回归模型线性化时,对因变量作变换时不仅要注意回归函数的形式, 还要注意误差项的形式。如: (1) 乘性误差项,模型形式为 e y AK L αβε =, (2) 加性误差项,模型形式为y AK L αβ ε = + 对乘法误差项模型(1)可通过两边取对数转化成线性模型,(2)不能线性化。 一般总是假定非线性模型误差项的形式就是能够使回归模型线性化的形式,为了方便通常省去误差项,仅考虑回归函数的形式。 8.2为了研究生产率与废料率之间的关系,记录了如表8.15所示的数据,请画出散点图,根据散点图的趋势拟合适当的回归模型。 表8.15 生产率x (单位/周) 1000 2000 3000 3500 4000 4500 5000 废品率y (%) 5.2 6.5 6.8 8.1 10.2 10.3 13.0 解:先画出散点图如下图: 5000.00 4000.003000.002000.001000.00x 12.00 10.00 8.006.00 y

从散点图大致可以判断出x 和y 之间呈抛物线或指数曲线,由此采用二次方程式和指数函数进行曲线回归。 (1)二次曲线 SPSS 输出结果如下: Model Summ ary .981 .962 .942 .651 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x. ANOVA 42.571221.28650.160.001 1.6974.424 44.269 6 Regression Residual Total Sum of Squares df Mean Square F Sig.The independent variable is x. Coe fficients -.001.001-.449-.891.4234.47E -007.000 1.417 2.812.0485.843 1.324 4.414.012 x x ** 2 (Constant) B Std. E rror Unstandardized Coefficients Beta Standardized Coefficients t Sig. 从上表可以得到回归方程为:72? 5.8430.087 4.4710y x x -=-+? 由x 的系数检验P 值大于0.05,得到x 的系数未通过显著性检验。 由x 2的系数检验P 值小于0.05,得到x 2的系数通过了显著性检验。 (2)指数曲线 Model Summ ary .970 .941 .929 .085 R R Square Adjusted R Square Std. E rror of the Estimate The independent variable is x.

泛函分析答案

泛函分析答案: 1、所有元素均为0的n ×n 矩阵 2、设E 为一线性空间,L 是E 中的一个子集,若对任意的x,y ∈L ,以及变数λ和μ均有λx +μy ∈L ,则L 称为线性空间E 的一个子空间。子空间心室包含零元素,因为当λ和μ均为0时,λx +μy =0∈L ,则L 必定含零元素。 3、设L 是线性空间E 的子空间,x 0∈E\L,则集合x 0+L={x 0+l,l ∈L}称为E 中一个线性流形。 4、设M 是线性空间E 中一个集合,如果对任何x,y ∈M ,以及λ+μ=1,λ≥0,μ≥0的λ和μ,都有λx +μy ∈M ,则称M 为E 中的凸集。 5、设x,y 是线性空间E 中的两个元素,d(x,y)为其之间的距离,它必须满足以下条件: (1) 非负性:d(x,y)>0,且d(x,y)=0<―――>x=y (2) d(x,y)=d(y,x) (3) 三角不等式:d(x,y)≤d(x,z)+d(y,z)foreveryx,y,z ∈E n 维欧几里德空间常用距离定义: 设x={x 1,x 2,…x n }T ,y={y 1y 2,…y n }T d 2(x,y)=(21 ||n i i i x y =-∑)1/2 d 1(x,y)=1 ||n i i i x y =-∑ d p (x,y)=(1 ||n p i i i x y =-∑)1/p d ∞(x,y)=1max ||i i i n x y ≤≤- 6、距离空间(x,d)中的点列{x n }收敛到x 0是指d(x n ,x 0)?0(n ?∞),这时记作 0lim n n x x -->∞ =,或简单地记作x n ?x 0 7、设||x||是线性空间E 中的任何一个元素x 的范数,其须满足以下条件: (1)||x||≥0,且||x||=0 iffx=0 (2)||λx||=λ||x||,λ为常数 (3)||x+y||≤||x||+||y||,foreveryx,y ∈E 8、设E 为线性赋范空间,{x n }∞n=1是其中的一个无穷列,如果对于任何ε>0,总存在自然数N ,使得当n>N,m>N 时,均有|x m -x n |<ε,则称序列{x n }是E 中的基本列。若E 的基本列的收敛元仍属于E ,则称E 为完备的线性赋范空间,即为Banach 空间。线性赋范空间中的基本列不一定收敛。 9、有限维的线性赋范空间必然完备,所以它必定是Banach 空间。 10、如果内积空间能在由内积诱导的赋范空间完备,则此内积空间称为Hilbert 空间。 11、L 2 (a,b )为定义在(a,b)上平方可积函数空间,即设f(t)∈L 2 (a,b ),2|()|b a f t dt ?<∞。

应用回归分析第2章课后习题参考答案

2.1 一元线性回归模型有哪些基本假定? 答:1. 解释变量 1x ,Λ,2x ,p x 是非随机变量,观测值,1i x ,,2Λi x ip x 是常数。 2. 等方差及不相关的假定条件为 ? ? ? ? ? ? ??????≠=====j i n j i j i n i E j i i ,0),,2,1,(,),cov(,,2,1, 0)(2ΛΛσεεε 这个条件称为高斯-马尔柯夫(Gauss-Markov)条件,简称G-M 条件。在此条件下,便可以得到关于回归系数的最小二乘估计及误差项方差2σ估计的一些重要性质,如回归系数的最小二乘估计是回归系数的最小方差线性无偏估计等。 3. 正态分布的假定条件为 ???=相互独立 n i n i N εεεσε,,,,,2,1),,0(~212ΛΛ 在此条件下便可得到关于回归系数的最小二乘估计及2σ估计的进一步结果,如它们分别是回归系数的最及2σ的最小方差无偏估计等,并且可以作回归的显著性检验及区间估计。 4. 通常为了便于数学上的处理,还要求,p n >及样本容量的个数要多于解释变量的个数。 在整个回归分析中,线性回归的统计模型最为重要。一方面是因为线性回归的应用最广泛;另一方面是只有在回归模型为线性的假设下,才能的到比较深入和一般的结果;再就是有许多非线性的回归模型可以通过适当的转化变为线性回归问题进行处理。因此,线性回归模型的理论和应用是本书研究的重点。 1. 如何根据样本),,2,1)(;,,,(21n i y x x x i ip i i ΛΛ=求出p ββββ,,,,210Λ及方差2σ的估计; 2. 对回归方程及回归系数的种种假设进行检验; 3. 如何根据回归方程进行预测和控制,以及如何进行实际问题的结构分析。 2.2 考虑过原点的线性回归模型 n i x y i i i ,,2,1,1Λ=+=εβ误差n εεε,,,21Λ仍满足基本假定。求1β的最小二 乘估计。 答:∑∑==-=-=n i n i i i i x y y E y Q 1 1 2112 1)())(()(ββ

(完整word版)泛函分析习题标准答案

第二章 度量空间 作业题答案提示 1、 试问在R 上,()()2,x y x y ρ=- 能定义度量吗? 答:不能,因为三角不等式不成立。如取 则有(),4x y ρ=,而(),1x z ρ=,(),1z x ρ= 2、 试证明:(1)()1 2 ,x y x y ρ= -;(2)(),1x y x y x y ρ-= +-在R 上都定 义了度量。 证:(1)仅证明三角不等式。注意到 2 11 22x y x z z y x z z y ?? -≤-+-≤-+- ? ?? 故有1 112 22 x y x z z y -≤-+- (2)仅证明三角不等式 易证函数()1x x x ?=+在R +上是单调增加的, 所 以 有 ()() a b a b ??+≤+,从而有 1111a b a b a b a b a b a b ++≤≤+ ++++++ 令,,x y z R ?∈,令,a z x b y z =-=- 即111y x z x y z y x z x y z ---≤+ +-+-+-

4.试证明在[]b a C ,1 上,)12.3.2()()(),(?-=b a dt t y t x y x ρ 定义了度量。 证:(1)0)()(0),(≡-?=t y t x y x ρ(因为x,y 是连续函数) 0),(≥y x ρ及),(),(x y y x ρρ=显然成立。 []) ,(),()()()()()()()()()()(),()2(y z z x dt t y t z dt t z t x dt t y t z dt t z t x dt t y t x y x b a b a b a b a ρρρ+≤-+-≤-+-≤-=???? 5.试由Cauchy-Schwarz 不等式证明 ∑∑==≤?? ? ??n i i n i i x n x 12 2 1 证:∑∑∑∑=====?≤?? ? ??n i i n i n i i n i i x n x x 12 12 122 11 8.试证明下列各式都在度量空间()11,ρR 和()21,R R 的Descartes 积 21R R R ?=上定义了度量 {}2 12/1222121,max ~~)3(;)(~)2(;)1(ρρρρρρρρρ=+=+= 证:仅证三角不等式。(1)略。 (2) 设12(,)x x x =,12(,)y y y =12R R ∈?,则

回归分析练习试题和参考答案解析

1 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 α=)。 (5)检验回归方程线性关系的显著性(0.05 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1)

可能存在线性关系。 (2)相关系数: 系数a 模型非标准化系数标准系数 t Sig. 相关性 B标准误差试用版零阶偏部分 1(常量).003 人均GDP.309.008.998.000.998.998.998 a. 因变量: 人均消费水平 有很强的线性关系。 (3)回归方程:734.6930.309 y x =+ 系数a 模型非标准化系数标准系数t Sig.相关性

回归系数的含义:人均GDP没增加1元,人均消费增加元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 系数(a) 模型非标准化系数标准化系数 t显著性B标准误Beta 1(常量) 人均GDP(元) %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%(4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1.998a.996.996 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规范排版。 模型摘要 模型R R 方调整的 R 方估计的标准差

泛函分析习题解答

第七章 习题解答 1.设(X ,d )为一度量空间,令 }),(,|{),(},),(,|{),(0000εεεε≤∈=<∈=x x d X x x x S x x d X x x x U 问),(0εx U 的闭包是否等于),(0εx S ? 解 不一定。例如离散空间(X ,d )。)1,(0x U ={0x },而)1,(0x S =X 。 因此当X 多于两点时,)1,(0x U 的闭包不等于)1,(0x S 。 2. 设 ],[b a C ∞是区间],[b a 上无限次可微函数的全体,定义 证明],[b a C ∞按),(g f d 成度量空间。 证明 (1)若),(g f d =0,则) ()(1)()(max ) () ()()(t g t f t g t f r r r r b t a -+-≤≤=0,即f=g (2))()(1)()(max 2 1 ),()()()()(0t g t f t g t f g f d r r r r b t a r r -+-=≤≤∞ =∑ =d (f ,g )+d (g ,h ) 因此],[b a C ∞按),(g f d 成度量空间。 3. 设B 是度量空间X 中的闭集,证明必有一列开集ΛΛn o o o 21,包含B ,而且B o n n =?∞ =1 。 证明 令n n n o n n B x d Bo o .2,1},1 ),({K =<==是开集:设n o x ∈0,则存在B x ∈1,使 n x x d 1),(10<。设,0),(1 10>-=x x d n δ则易验证n o x U ?),(0δ,这就证明了n o 是 开集 显然B o n n ??∞=1 。若n n o x ∞ =?∈1 则对每一个n ,有B x n ∈使n x x d 1 ),(1< ,因此

简单线性回归分析思考与练习参考答案

第10章 简单线性回归分析 思考与练习参考答案 一、最佳选择题 1.如果两样本的相关系数21r r =,样本量21n n =,那么( D )。 A. 回归系数21b b = B .回归系数12b b < C. 回归系数21b b > D .t 统计量11r b t t = E. 以上均错 2.如果相关系数r =1,则一定有( C )。 A .总SS =残差SS B .残差SS =回归 SS C .总SS =回归SS D .总SS >回归SS E. 回归MS =残差MS 3.记ρ为总体相关系数,r 为样本相关系数,b 为样本回归系数,下列( D )正确。 A .ρ=0时,r =0 B .|r |>0时,b >0 C .r >0时,b <0 D .r <0时,b <0 E. |r |=1时,b =1 4.如果相关系数r =0,则一定有( D )。 A .简单线性回归的截距等于0 B .简单线性回归的截距等于Y 或X C .简单线性回归的残差SS 等于0 D .简单线性回归的残差SS 等于SS 总 E .简单线性回归的总SS 等于0 5.用最小二乘法确定直线回归方程的含义是( B )。 A .各观测点距直线的纵向距离相等 B .各观测点距直线的纵向距离平方和最小 C .各观测点距直线的垂直距离相等 D .各观测点距直线的垂直距离平方和最小 E .各观测点距直线的纵向距离等于零 二、思考题 1.简述简单线性回归分析的基本步骤。 答:① 绘制散点图,考察是否有线性趋势及可疑的异常点;② 估计回归系数;③ 对总体回归系数或回归方程进行假设检验;④ 列出回归方程,绘制回归直线;⑤ 统计应用。 2.简述线性回归分析与线性相关的区别与联系。

多元线性回归模型习题及答案

多元线性回归模型 一、单项选择题 1.在由30n =的一组样本估计的、包含3个解释变量的线性回归模型中,计算得多重决定 系数为,则调整后的多重决定系数为( D ) A. B. C. 下列样本模型中,哪一个模型通常是无效 的(B ) A. i C (消费)=500+i I (收入) B. d i Q (商品需求)=10+i I (收入)+i P (价格) C. s i Q (商品供给)=20+i P (价格) D. i Y (产出量)=0.6i L (劳动)0.4i K (资本) 3.用一组有30个观测值的样本估计模型01122t t t t y b b x b x u =+++后,在的显著性水平上对 1b 的显著性作t 检验,则1b 显著地不等于零的条件是其统计量t 大于等于( C ) A. )30(05.0t B. )28(025.0t C. )27(025.0t D. )28,1(025.0F 4.模型 t t t u x b b y ++=ln ln ln 10中,1b 的实际含义是( B ) A.x 关于y 的弹性 B. y 关于x 的弹性 C. x 关于y 的边际倾向 D. y 关于x 的边际倾向 5、在多元线性回归模型中,若某个解释变量对其余解释变量的判定系数接近于1,则表明 模型中存在( C ) A.异方差性 B.序列相关 C.多重共线性 D.高拟合优度 6.线性回归模型01122......t t t k kt t y b b x b x b x u =+++++ 中,检验0:0(0,1,2,...) t H b i k ==时,所用的统计量 服从( C ) (n-k+1) (n-k-2) (n-k-1) (n-k+2) 7. 调整的判定系数 与多重判定系数 之间有如下关系( D ) A.2 211n R R n k -=-- B. 22111 n R R n k -=--- C. 2211(1)1n R R n k -=-+-- D. 2211(1)1n R R n k -=---- 8.关于经济计量模型进行预测出现误差的原因,正确的说法是( C )。 A.只有随机因素 B.只有系统因素 C.既有随机因素,又有系统因素 、B 、C 都不对 9.在多元线性回归模型中对样本容量的基本要求是(k 为解释变量个数):( C ) A n ≥k+1 B n

应用回归分析,第4章课后习题参考答案

第4章违背基本假设的情况 思考与练习参考答案 4.1 试举例说明产生异方差的原因。 答:例4.1:截面资料下研究居民家庭的储蓄行为 Y i=β0+β1X i+εi 其中:Y i表示第i个家庭的储蓄额,X i表示第i个家庭的可支配收入。 由于高收入家庭储蓄额的差异较大,低收入家庭的储蓄额则更有规律性,差异较小,所以εi的方差呈现单调递增型变化。 例4.2:以某一行业的企业为样本建立企业生产函数模型 Y i=A iβ1K iβ2L iβ3eεi 被解释变量:产出量Y,解释变量:资本K、劳动L、技术A,那么每个企业所处的外部环境对产出量的影响被包含在随机误差项中。由于每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项ε的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。 4.2 异方差带来的后果有哪些? 答:回归模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果: 1、参数估计量非有效 2、变量的显著性检验失去意义 3、回归方程的应用效果极不理想 总的来说,当模型出现异方差性时,参数OLS估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。 4.3 简述用加权最小二乘法消除一元线性回归中异方差性的思想与方法。 答:普通最小二乘估计就是寻找参数的估计值使离差平方和达极小。其中每个平方项的权数相同,是普通最小二乘回归参数估计方法。在误差项等方差不相关的条件下,普通最小二乘估计是回归参数的最小方差线性无偏估计。然而在异方差

的条件下,平方和中的每一项的地位是不相同的,误差项的方差大的项,在残差平方和中的取值就偏大,作用就大,因而普通最小二乘估计的回归线就被拉向方差大的项,方差大的项的拟合程度就好,而方差小的项的拟合程度就差。由OLS 求出的仍然是的无偏估计,但不再是最小方差线性无偏估计。所以就是:对较大的残差平方赋予较小的权数,对较小的残差平方赋予较大的权数。这样对残差所提供信息的重要程度作一番校正,以提高参数估计的精度。 加权最小二乘法的方法: 4.4简述用加权最小二乘法消除多元线性回归中异方差性的思想与方法。 答:运用加权最小二乘法消除多元线性回归中异方差性的思想与一元线性回归的类似。多元线性回归加权最小二乘法是在平方和中加入一个适当的权数i w ,以调整各项在平方和中的作用,加权最小二乘的离差平方和为: ∑=----=n i ip p i i i p w x x y w Q 1211010)( ),,,(ββββββ (2) 加权最小二乘估计就是寻找参数p βββ,,,10 的估计值pw w w βββ?,,?,?10 使式(2)的离差平方和w Q 达极小。所得加权最小二乘经验回归方程记做 22011 1 ???()()N N w i i i i i i i i Q w y y w y x ββ===-=--∑∑22 __ 1 _ 2 _ _ 02 222 ()() ?()?1 11 1 ,i i N w i i i w i w i w w w w w kx i i i i m i i i m i w x x y y x x y x w kx x kx w x σβββσσ==---=-= = ===∑∑1N i =1 1表示=或

回归分析练习题(有答案)

1.1回归分析的基本思想及其初步应用 一、选择题 1. 某同学由x 与y 之间的一组数据求得两个变量间的线性回归方程为y bx a =+,已知:数据x 的平 均值为2,数据 y 的平均值为3,则 ( ) A .回归直线必过点(2,3) B .回归直线一定不过点(2,3) C .点(2,3)在回归直线上方 D .点(2,3)在回归直线下方 2. 在一次试验中,测得(x,y)的四组值分别是A(1,2),B(2,3),C(3,4),D(4,5),则Y 与X 之间的回归直线方程为( )A . y x 1=+ B . y x 2=+ C . y 2x 1=+ D. y x 1=-3. 在对两个变量x ,y 进行线性回归分析时,有下列步骤: ①对所求出的回归直线方程作出解释; ②收集数据(i x 、i y ) ,1,2i =,…,n ; ③求线性回归方程; ④求未知参数; ⑤根据所搜集的数据绘制散点图 如果根据可行性要求能够作出变量,x y 具有线性相关结论,则在下列操作中正确的是( ) A .①②⑤③④ B .③②④⑤① C .②④③①⑤ D .②⑤④③① 4. 下列说法中正确的是( ) A .任何两个变量都具有相关关系 B .人的知识与其年龄具有相关关系 C .散点图中的各点是分散的没有规律 D .根据散点图求得的回归直线方程都是有意义的 5. 给出下列结论: (1)在回归分析中,可用指数系数2 R 的值判断模型的拟合效果,2 R 越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模型的拟合效果越好; (3)在回归分析中,可用相关系数r 的值判断模型的拟合效果,r 越小,模型的拟合效果越好; (4)在回归分析中,可用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中,说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 以上结论中,正确的有( )个. A .1 B .2 C .3 D .4 6. 已知直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A.y 平均增加1.5个单位 B.y 平均增加2个单位 C.y 平均减少1.5个单位 D. y 平均减少2个单位 7. 下面的各图中,散点图与相关系数r 不符合的是( )

最新泛函分析考试题集与答案

泛函分析复习题2012 1.在实数轴R 上,令p y x y x d ||),(-=,当p 为何值时,R 是度量 空间,p 为何值时,R 是赋范空间。 解:若R 是度量空间,所以R z y x ∈?,,,必须有: ),(),(),(z y d y x d z x d +≤成立 即p p p z y y x z x ||||||-+-≤-,取1,0,1-===z y x , 有2112=+≤p p p ,所以,1≤p 若R 是赋范空间,p x x x d ||||||)0,(==,所以R k x ∈?,, 必须有:||||||||||x k kx ?=成立,即p p x k kx ||||||=,1=p , 当1≤p 时,若R 是度量空间,1=p 时,若R 是赋范空间。 2.若),(d X 是度量空间,则)1,m in(1d d =,d d d +=12也是使X 成为度量空间。 解:由于),(d X 是度量空间,所以X z y x ∈?,,有: 1)0),(≥y x d ,因此0)1),,(m in(),(1≥=y x d y x d 和0) ,(1) ,(),(2≥+= y x d y x d y x d 且当y x =时0),(=y x d , 于是0)1),,(m in(),(1==y x d y x d 和0) ,(1) ,(),(2=+=y x d y x d y x d 以及若

0)1),,(m in(),(1==y x d y x d 或0) ,(1) ,(),(2=+= y x d y x d y x d 均有0),(=y x d 成立,于是y x =成立 2)),(),(y x d x y d =, 因此),()1),,(m in()1),,(m in(),(11y x d y x d x y d x y d === 和),() ,(1) ,(),(1),(),(22y x d y x d y x d x y d x y d x y d =+=+= 3)),(),(),(z y d y x d z x d +≤,因此 }1),,(),(m in{)1),,(m in(),(1z y d y x d z x d z x d +≤= ),(),()1),,(m in()1),,(m in(11z y d y x d z y d y x d +=+≤ 以及设x x x f += 1)(,0)1(1)(2 >+='x x f ,所以)(x f 单增, 所以) ,(),(1),(),(),(1),(),(2z y d y x d z y d y x d z x d z x d z x d +++≤+= ),(),(1) ,(),(),(1),(z y d y x d z y d z y d y x d y x d +++++= ),(),() ,(1) ,(),(1),(22z y d y x d z y d z y d y x d y x d +=+++≤ 综上所述)1,m in(1d d =和d d d += 12均满足度量空间的三条件, 故),(1y x d 和),(2y x d 均使X 成为度量空间。

应用回归分析-第9章课后习题答案

第9章 含定性变量的回归模型 思考与练习参考答案 9.1 一个学生使用含有季节定性自变量的回归模型,对春夏秋冬四个季节引入4个0-1型自变量,用SPSS 软件计算的结果中总是自动删除了其中的一个自变量,他为此感到困惑不解。出现这种情况的原因是什么? 答:假如这个含有季节定性自变量的回归模型为: t t t t kt k t t D D D X X Y μαααβββ++++++=332211110 其中含有k 个定量变量,记为x i 。对春夏秋冬四个季节引入4个0-1型自变量,记为D i ,只取了6个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则样本设计矩阵为: ????? ? ?? ?? ? ?=00011001011000101001 0010100011 )(6 165154143 132121 11k k k k k k X X X X X X X X X X X X D X, 显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井”,应避免。 当某自变量x j 对其余p-1个自变量的复判定系数2j R 超过一定界限时,SPSS 软件将拒绝这个自变量x j 进入回归模型。称Tol j =1-2 j R 为自变量x j 的容忍度(Tolerance ),SPSS 软件的默认容忍度为0.0001。也就是说,当2j R >0.9999时,自变量x j 将被自动拒绝在回归方程之外,除非我们修改容忍度的默认值。 ??? ??? ? ??=k βββ 10β??? ??? ? ??=4321ααααα

回归分析练习题及参考答案

1 下面是7个地区2000年的人均国生产总值(GDP)和人均消费水平的统计数据:地区人均GDP/元人均消费水平/元 北京上海 22460 11226 34547 4851 5444 2662 4549 7326 4490 11546 2396 2208 1608 2035 求:(1)人均GDP作自变量,人均消费水平作因变量,绘制散点图,并说明二者之间的关系形态。 (2)计算两个变量之间的线性相关系数,说明两个变量之间的关系强度。 (3)求出估计的回归方程,并解释回归系数的实际意义。 (4)计算判定系数,并解释其意义。 (5)检验回归方程线性关系的显著性(0.05 α=)。 (6)如果某地区的人均GDP为5000元,预测其人均消费水平。 (7)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 解:(1) 可能存在线性关系。 (2)相关系数:

(3)回归方程:734.6930.309 y x =+ 回归系数的含义:人均GDP没增加1元,人均消费增加0.309元。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 系数(a) 模型非标准化系数标准化系数 t 显著性B 标准误Beta 1 (常量)734.693 .540 5.265 0.003 人均GDP(元)0.309 0.008 0.998 36.492 0.000 a. 因变量: 人均消费水平(元)%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% (4) 模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .998a.996 .996 247.303 a. 预测变量: (常量), 人均GDP。 人均GDP对人均消费的影响达到99.6%。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% 注意:图标不要原封不动的完全复制软件中的图标,要按规排版。 模型摘要 模型R R 方调整的 R 方估计的标准差 1 .998(a) 0.996 0.996 247.303 a. 预测变量:(常量), 人均GDP(元)。%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%

应用回归分析 课后习题参考答案

第二章 一元线性回归分析 思考与练习参考答案 一元线性回归有哪些基本假定? 答: 假设1、解释变量X 是确定性变量,Y 是随机变量; 假设2、随机误差项ε具有零均值、同方差和不序列相关性: E(εi )=0 i=1,2, …,n Var (εi )=?2 i=1,2, …,n Cov(εi, εj )=0 i≠j i,j= 1,2, …,n 假设3、随机误差项ε与解释变量X 之间不相关: Cov(X i , εi )=0 i=1,2, …,n 假设4、ε服从零均值、同方差、零协方差的正态分布 εi ~N(0, ?2 ) i=1,2, …,n 考虑过原点的线性回归模型 Y i =β1X i +εi i=1,2, …,n 误差εi (i=1,2, …,n )仍满足基本假定。求 β1的最小二乘估计 解: 得: 证明(式),?e i =0 ,?e i X i =0 。 证明:∑∑+-=-=n i i i n i X Y Y Y Q 1 2102 1 ))??(()?(ββ 其中: 即: ?e i =0 ,?e i X i =0 211 1 2)?()?(i n i i n i i i e X Y Y Y Q β∑∑==-=-=0)?(2?11 1 =--=??∑=i i n i i e X X Y Q ββ) () (?1 2 1 1 ∑∑===n i i n i i i X Y X β01????i i i i i Y X e Y Y ββ=+=-0 1 00??Q Q β β ??==??

回归方程E (Y )=β0+β1X 的参数β0,β1的最小二乘估计与最大似然估计在什么条件下等价?给出证明。 答:由于εi ~N(0, ?2 ) i=1,2, …,n 所以Y i =β0 + β1X i + εi ~N (β0+β1X i , ?2 ) 最大似然函数: 使得Ln (L )最大的0 ?β,1?β就是β0,β1的最大似然估计值。 同时发现使得Ln (L )最大就是使得下式最小, ∑∑+-=-=n i i i n i X Y Y Y Q 1 21021 ))??(()?(ββ 上式恰好就是最小二乘估计的目标函数相同。值得注意的是:最大似然估计是在εi ~N (0, ?2 )的假设下求得,最小二乘估计则不要求分布假设。 所以在εi ~N(0, ?2 ) 的条件下, 参数β0,β1的最小二乘估计与最大似然估计等价。 证明0 ?β是β0的无偏估计。 证明:)1[)?()?(1 110∑∑==--=-=n i i xx i n i i Y L X X X Y n E X Y E E ββ )] )(1 ([])1([1011i i xx i n i i xx i n i X L X X X n E Y L X X X n E εββ++--=--=∑∑== 1010)()1 (])1([βεβεβ=--+=--+=∑∑==i xx i n i i xx i n i E L X X X n L X X X n E 证明 证明: )] ()1([])1([)?(102110i i xx i n i i xx i n i X Var L X X X n Y L X X X n Var Var εβββ++--=--=∑∑== () ) 1()1()?(2 2 2 1 2 2 xx n i i L X n X X X n Var +=-+=∑=σσβ

相关文档
相关文档 最新文档