文档库 最新最全的文档下载
当前位置:文档库 › 第五章 时间序列的模型识别汇总

第五章 时间序列的模型识别汇总

第五章 时间序列的模型识别汇总
第五章 时间序列的模型识别汇总

第五章时间序列的模型识别

前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下:

图5.1 建立时间序列模型流程图

在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。

对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。如果ACF和PACF 都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关

的准则函数,既考虑模型对原始观测值的接近程度,又考虑模型中所含待定参数的个数,最终选取使该函数达到最小值的阶数,常用的该类准则有AIC 、BIC 、FPE 等。实际应用中,往往是几种方法交叉使用,然后选择最为合适的阶数(p,q )作为待建模型的阶数。

§5.1 自相关和偏自相关系数法

在平稳时间序列分析中,最关键的过程就是利用数据去识别和建模,根据第三章讨论的内容,一个比较直观的方法,就是通过观察自相关系数(ACF )和偏自相关系数(PACF )可以对拟合模型有一个初步的识别,这是因为从理论上说,平稳AR 、MA 和ARMA 模型的ACF 和PACF 有如下特性:

模型(序列)

AR(p ) MA(q ) ARMA(p,q ) 自相关系数(ACF ) 拖尾 q 阶截尾 拖尾 偏自相关系数(PACF ) p 阶截尾 拖尾 拖尾 但是,在实际中ACF 和PACF 是未知的,对于给定的时间序列观测值12,,

,T x x x ,我们

需要使用样本的自相关系数{}?k ρ和偏自相关系数{}

?kk

φ对其进行估计。然而由于{}?k ρ和{}?kk

φ均是随机变量,对于相应的模型不可能具有严格的“截尾性”,只能呈现出在某步之后

围绕零值上、下波动,因此,我们需要借助{}?k ρ

和{}?kk

φ的“截尾性”来判断{}k ρ和{}kk

φ的截尾性,进而由此可以给出模型的初步识别。首先,我们需要给出样本的自相关系数{}?k ρ和偏自相关系数{}

?kk

φ的定义。 设平稳时间序列{}t X 的一个样本1,

,T x x 。则样本自协方差系数定义为

()()11?,11

??,11

T k

k j j k j k k x x x x k T T k T γγγ-+=-=--≤≤-=≤≤-∑ (5.1)

其中1

1T

j j x x T ==∑为样本均值,则样本自协方差系数{}?k γ

是{}t X 的自协方差系数{}k γ的估计。样本自相关系数定义为

0???,1k k k T ρ

γ=≤- (5.2)

是{}t X 的自相关系数{}k ρ的估计。

作为{}t X 的自协方差系数{}k γ的估计,根据数理统计知识,样本自协方差系数还可以写为

()()1

1?,11??,11

T k

k j j k j k k x x x x k T T k k T γγγ-+=-=--≤≤--=≤≤-∑

(5.3)

在上述两种估计中,当样本容量T 很大,而k 的绝对值较小时,上述两种估计值相差不大,其中由(5.1)定义的第一种估计值的绝对值较小。根据前面章节的讨论,因为AR(p ),MA(q )或者ARMA(,p q )模型的自协方差系数{}k γ都是以负指数阶收敛到零,所以在对平稳时间序列的数据拟合AR(p ),MA(q )或者ARMA(,p q )模型时,希望实际计算的样本自

协方差系数{}?k γ

能以很快的速度收敛。因此,我们一般选择由(5.1)定义的第一种估计值作为{}k γ的点估计。

根据第三章偏自相关系数的计算,利用样本自相关系数{}?k ρ的值,定义样本偏自相关系数{}

?kk

φ如下: ??,1,2,

,?k kk D k T

D

φ==

(5.4)

其中

111112121212????1

1

????1

1

??,?????1

k k k

k k k k k D

D ρρ

ρρ

ρ

ρρ

ρρρρ

ρρ

------=

=

关于样本的自相关系数{}?k ρ

的统计性质,我们将在下一章给予讨论。 Quenouille 证明,{}

?kk

φ也满足Bartlett 公式,即当样本容量T 充分大时, ()?~0,1kk

N T φ (5.5)

这样根据正态分布的性质,我们有

?

68.3%kk

P φ?≤=?? (5.6) ?

95.5%kk

P φ?≤=??

(5.7) 这样,关于偏自相关系数{}kk φ的截尾性的判断,转化为利用上述性质(5.6)或者(5.7),

可以判断{}

?kk

φ的截尾性。具体方法为对于每一个p >0,考查1,1p p φ++,2,2p p φ++,…,,p M p M φ++

中落入?kk

φ≤

?kk

φ≤M 的68.3%或95.5%。

一般地,我们取M =0p p =之前?kk φ都明显地不为零,而当0p p >时,0

1,1p p φ++,002,2p p φ++,…,00

,p M p M φ++中满足不等式

?kk

φ≤

?kk

φ≤的个数占总数M 的68.3%或95.5%,则可以认定{}kk φ在0p 处截尾,由此可以初步判定序列}{t X 为AR(0p )模型。

对于样本的自相关系数{}?k ρ

,由第二章的Bartlett 公式,对于0>q ,{}?k ρ满足 ~?k ρ

211?0,12q j j N T =????+ρ ??? ????

?∑ (5.8)

进一步地,当样本容量T 充分大时,{}?k ρ

也满足 ()?~0,1k N T ρ

(5.9)

类似于(5.6)或者(5.7)式,对于每一个0>q ,检查1?q ρ

+,2?q ρ+,…,?q M ρ+

中落入?k ρ

或者?k ρ≤中的比例是否占总数M 的68.3%或95.5%左右。如果在0q 之前,

?k ρ

都明显不为零,而当0q q =时,0

1?q ρ+,0

2?q ρ+,…,0

?q M ρ+中满足上述不等式的个数达到比例,则判断{}k ρ在0q 处截尾。初步认为序列}{t X 为MA(0q )模型。

至此,我们可以利用样本的自相关系数{}?k ρ和偏自相关系数{}

?kk

φ,得到ARMA 模型阶数的初步判定方法。具体做法如下:

(1) 如果样本自相关系数{}?k ρ

在最初的q 阶明显的大于2倍标准差范围,

即(

2,而

后几乎95%的样本自相关系数?k ρ

都落在2倍标准差范围之内,并且由非零样本自相关系数衰减为在零附近小值波动的过程非常突然,这时通常视为自相关系数{}k ρ截尾,既可以初步判定相应的时间序列为MA(q )模型

(2) 同样,样本偏自相关系数{}

?kk

φ如果满足上述性质,则可以初步判定相应的时间序列为

AR(p )模型。

(3) 对于样本自相关系数{}?k ρ和样本偏自相关系数{}

?kk

φ,如果均有超过5%的值落入2倍标准差范围之外,或者由非零样本自相关系数和样本偏自相关系数衰减为在零附近小值

波动的过程非常缓慢,这时都视为不戴尾的,我们将初步判定时间序列为ARMA 模型,那么这样的判断往往会失效,因为这时ARMA(p,q )模型的阶数p 和q 很难确定。 总之,基于样本自相关和偏自相关系数的定阶法只是一种初步定阶方法,可在建模开始时加以粗略地估计。

例5.1绿头苍蝇数据的时间序列。具有均衡性别比例数目固定的成年绿头苍蝇保存在一个盒子中,每天给一定数量的食物,每天对绿头苍蝇的总体计数,共得到T=82个观测值。经过平稳性处理后计算其基于样本自相关和偏自相关系数,见表5.1

表5.1 绿头苍蝇的样本ACF 和PACF

图5.2绿头苍蝇的样本ACF 和PACF

由表5.1和图5.2知,样本自相关函数}?{k ρ

呈拖尾状,而从10个偏自相关系数的绝对值来

看,除11

?φ显著地异于零之外,其余9

0.11==的有8个,8

0.8968.3%9

≈>,故该时间序列初步判定为AR(1)模型。 例5.2某时间序列数据(T=273)的样本自相关系数和偏自相关系数计算数据如下:

表5.2 某时间序列数据的样本自/偏自相关系数

由上表知,样本自相关函数}?{k ρ

呈拖尾状,而从15个偏自相关系数的绝对值来看,除11?φ,22

?φ显著地异于零之外,其余13个中绝对值不大于0.0605==的有9个,%3.68692.013

9

≈=,故该时间序列初步判定为AR(2)模型。 例5.3 某车站1993-1997年个月的列车运行数量数据共60个,见表5.3,试对该序列给出初步的模型识别。

表5.3 某车站1993-1997年个月的列车运行数量数据(单位:千列·千米)

图5.3,5.4分别为原始数据和平稳化以后(第8章将给出具体平稳化方法)数据的散点图。

图5.3 列车运行数量数据图5.4 平稳化列车运行数量数据

经过计算,其前20个样本自相关系数和偏自相关系数如下

表5.4 平稳化列车运行数量数据样本自/偏自相关系数

§5.2 F检验法

利用F分布进行假设检验是实践中经常使用的统计检验方法,在回归分析中,往往用F 检验来考察两个回归模型是否有显著差异,因此常被用来判定ARMA模型的阶数。考虑如

下线性回归模型

εααα++++=n n X X X y 2211 (5.10)

T N y y y Y ),,,(21 =为N 个独立的随机观察值,T iN i i i X X X X ),,,(21 =,r i ,,2,1 =为

r 个回归因子,T N ),,,(21εεεε =为模型残差。设α

?是模型(5.7)中参数T r ),,,(21αααα =的最小二乘估计,为了检验其中后面s 个元素对因变量的影响是否显

著,设去掉此s 个因素的线性回归模型为

''2'

21'1εααα++++=--s r s r X X X y (5.11)

其中模型(5.11)的参数'

α的最小二乘估计为'

。因此,检验模型(5.10)与(5.11)是否有显著差异等价于检验原假设,即

0:210====+-+-r s r s r H ααα (5.12)

是否成立。为此,考虑上述两个模型的残差平方和Q 0与Q 1,于是有

2

1

22110)???(∑----==N

t rt r t t t X X X y Q ααα (5.13)

2

1

,'2'21'

11)???(∑----==--N

t t s r s

r t t t X X X y Q ααα

(5.14)

借助回归分析中残差平方和的分布结论:

)(~220r N Q -χσ,0Q 与01Q Q -相互独立,且当原假设0H 为真时,)(~2

201s Q Q χσ-,因此有:

),(~/0

01r N s F r

N Q s Q Q --- (5.15) 据此构造统计量

r

N Q s Q Q F --=

01/

(5.16) 对于预先给定的显著性水平α,由附录F 分布表查出满足

αα=≥)(F F P (5.17) 若),(r N s F F ->α,则拒绝原假设H 0,即后面s 个因素对因变量的影响是显著的;若

),(r N s F F -≤α,则接受原假设H 0,即这s 个因素对因变量的影响是不显著的,表明模型

(5.11)是合适的。

5.2.1 AR(p)模型定阶的F 准则

1967年,瑞典控制论专家K.J.Astr?m 教授将F 检验准则用于对时间序列模型的定阶。设t X (1≤t≤N )是零均值平稳序列的一段样本。并用模型AR(p)

1122t t t p t p t X X X X φφφε---=++++ (5.18)

进行拟合。根据模型阶数节省原则(parsimony principle),采取由低阶逐步升高的“过拟合”办法。先对观测数据拟合模型AR(p)(p=1,2,…),用递推最小二乘估计其参数(1)j j n φ≤≤并分别计算对应模型的残差平方和。根据适用的模型应具有较小的残差平方和的特点,用F 准则判定模型的阶数改变后相应的残差平方和变化是否显著。

检验假设0p φ=即表示模型AR(p-1)是合适的。由于模型AR(p)残差平方和为

2

011221

()N

t t t p t p t p Q X X X X φφφ---=+=---

-∑ (5.19)

而模型AR(p-1)的残差平方和为

211122111

()N

t t t p t p t p Q X X X X φφφ----+=+=---

-∑ (5.20)

统计量F 服从自由度为1和p N -的F 分布。即

),1(~/10

01p N F p

N Q Q Q F ---=

(5.21) 对照式(5.16),这里n=p 是模型阶数总数,s=1是被检验的阶数差数。对给定的显著性=α0.05或0.01,查附录F 分布表得),1(p N F -α,并计算p

N Q Q Q F --=

01/1。若αF F >就拒绝假设H 0,即AR(p-1)是不适合模型;若αF F ≤,则接受H 0,即AR(p-1)是适

合模型。

例5.4

根据某实测数据序列拟合的时间序列模型为AR(p),其中N=80。当阶数p=0,

1,2,3时,参数估计及F 检验结果分别如表5.5、表5.6所示

表5.5 AR(p)模型的参数估计结果

表5.6 各模型的F 检验结果

由表5.5和表5.6可知,当模型阶次从1增加到2时,残差平方和Q 值急剧减少。根据F 检验定价方法,当05.0=α和N=80时,查附录F 分布表得αF =3.96。当p=l1时求得F=55.7>αF ,这表明F 检验显著,表明AR(1)模型是不适用的,应改用AR(2)模型。计算得F=3.86<αF ,这表明F 检验不显著,因此AR(2)模型是适用的。

5.2.2 ARMA(p ,q )模型定阶的F 准则

仿照AR(p)模型定阶F 检验准则,可以将F 检验应用于ARMA(p, q)模型的定阶。采用过拟合方法,首先对观测数据用ARMA(p, q)模型进行拟台,再假定,p q φθ高阶系数中某些取值为零,用F 检验准则来判定阶数降低之后的模型与ARMA(p, q)模型之间是否存在显著性差异。如果差异显著,则说明模型阶数仍存在着升高的可能性;若差异不显著,则说明模型阶数可以降低,低阶模型与高阶模型之间的差异用残差平方和来衡量。

假定原假设为H 0:0,0p q φθ==,记Q 0为ARMA(p, q)模型的残差平方和,Q 1为ARMA(p-1,q-1)模型的残差平方和,则可以计算统计量

),2(~/20

01q p N F q

p N Q Q Q F -----=

(5.22) 对照式(5.16)这里n=p+q 是模型阶数的总数,s=2是被检验阶散的差数。如果αF F >,则H 0不成立,模型阶数仍有上升的可能;否则H 0成立,即ARMA(p-1,q-1)是合适的模型。

§5.3 信息准则法 5.3.1 FPE 准则法

前面两节中模型的定阶都采用统计检验手段,在给定显著性水平α下作假设检验,带有一定的人为性和主观性。而FPE 、AIC 和BIC 准则都避免上述的缺陷。1969年,日本统计学家赤池(Akaike)提出了一种识别AR 模型阶数的最终预报误差准则(Finial Prediction Error),简称FPE 准则。其基本思想是用模型一步预报误差的方差来判定自回归模型的阶数是否适用,一步预报误差的方差愈小,就认为模型拟合愈好。

设随机序列}{t X 所适合的真实模型为AR(p),即

1122t t t p t p t X X X X φφφε---=++

++

其中()0t E ε=,22()t E εσ=。设i φ的估计值为?(1)i

i p φ≤≤ 。用)1(?t X 表示t 时刻的一步预报值,则有

1122

????(1)t t t p t p

X X X X φφφ---=+++ (5.23)

可以证明一步预报误差的方差为

221)1()]1(?[σn

p X X E t

t +≈-+ (5.24)

可以证明,当样本总量n 充分大时有

2

2

)1(]?[σσn

p E -≈ (5.25) 上式表明)1/(?2

n

p

是2σ的无偏估计。在式(5.21)中用无偏估计来代替2σ便可得到 2121?)1)(1()]1(?[σ-+-+≈-n

p n

p X X E t

t (5.26) 因而将FPE 准则定义为

p

n p

n FPE p -+=2?σ

(5.27) 其中可以看出,系数

p

n p

n -+随着p 的增大而增大,而当阶数由低阶至高阶增加时,AR(p)模型残差方差2?σ

开始是随着p 的增大而减小,但当p 超过序列t X 的真正模型阶数0p 之后,2

就不会再减少了,这时p

n p

n -+将起主导作用。最终,使p FPE 取最小值的那个p 就可以判定为模型的最佳阶数。

根据经验,当样本点数n=100~200时取预先设定的样本上限n

n

L 2ln 2=;当n=50~100时,取2

~3n n L =

。 如果p FPE 的数值从p=1就开始上升,则可以判定模型阶数p=1。若p FPE 的值随p 增加而一直下降,则很可能是由于实际数据序列不宜采用AR 序列来描述。如果在某一p 的

p FPE 值下降很快,以后又有缓慢地下降,则可以将这个p 值作为模型的阶。如果随p 的增

加p FPE 的值上、下剧烈跳动,取不出最小值,这很可能是由于样本数据长度n 太小引起的,可增大样本长度后再进行定阶。

例5.5 根据某实测数据序列拟合的AR(p)(p=1,2,…,10)模型的2

?p σ

和p FPE 结果如下表所示:

表5.4 拟合各阶AR(p)模型的2

?p σ

和p FPE

由表中可以看出,p 随着p 的增加持续下降,但是p 在p =2时取得最小值,这提

示着模型取为AR(2)较合适。

5.3.2 AIC 准则法

AIC 准则(An information criterion )是由日本统计学家赤池弘次(Akaika )在1973年提出

的。该准则既考虑拟合模型对数据的接近程度,也考虑模型中所含待定参数的个数,适用于ARMA(包括AR 和MA)模型的检验,下面我们对AIC 准则理论给出一般性的介绍。

设n 维随机向量X 的概率密度属于函数族}),;({ψ∈?ψψf ,);(ψ?f 与);(θ?f 之间的Kullback-Leibler 指标定义为

)()()(θθθψθψ?-?=d (5.28)

其中

dX X f X f X f E n

R );());(ln(2));(ln 2()(θψψθψθ?-=-=? (5.29)

是);(ψ?f 相对于);(θ?f 的Kullback-Leibler 指标,根据Jensen 不等式有:

dX X f X f X f d n

R );())

;()

;(ln(

2)(θθψθψ?-=

dX X f X f X f n

R );())

;()

;((

ln 2θθψ?-≥

dX X f n

R );(ln 2ψ?-≥

= 0 (5.30)

其中的等号当且仅当);(ψX f =);(θX f 时成立。

假设所有观测n X X X ,,,21 来自一参数向量为),(2

σβθ=的ARMA 过程,真实的阶

数为),(q p ,令)?,?(?2σβθ

=为θ基于n X X X ,,,21 的极大似然估计,n Y Y Y ,,21为该过程的样本实现,则

n S L L Y X Y -+-=--)?(?)?,?(ln 2)?,?(ln 2222βσσβσβ

(5.31)

其中:

})?(21ex p{)2(1),,(1

1

22

1

022∑

--

=

=--n

j j j

j n n

r X X r r L σπσσθφ

)?,?(?12θφσ

s n -= 1

1

2/)?()?,?(-=∑-=j n

j j j r X X s θφ 221

1/)?(σ++-=n n n X X E r 这样,

))?,?(ln 2())?((2,2σβθθσ

βθY L E E -=? n S E L E Y X -?

??

? ??+-=2,2,?)?())?,?(ln 2(22σβσβσβσβ (5.32) 在大样本逼近的情形下,

2)1(2?)?(2,2---++≈???? ??q p n n q p S E Y σβσβ (5.30) 从而,

)2/()1(2)?,?(ln 22---+++-q p n n q p L X σβ是Kullback-Leibler 指标))?((θθθ?E 的渐进无偏估计。前面的推导是建立在真实阶数为),(q p 的基础上的,因而可以选择能够极

小化如下)?(β

AICC 函数的),(q p ,或者极小化等价)?(βAIC 统计量的),(q p : )2/()1(2)/)(,(ln 2:)(---+++-=q p n n q p n S L AICC X X βββ (5.31) )1(2)/)(,(ln 2:)(+++-=q p n S L AIC X X βββ (5.32) )?(βAICC 和)?(βAIC 也可以定义为以2σ的估计值代替公式中的n S X /)(β的形式,因为当设定n S X /)(2

βσ=时,)?(β

AICC 和)?(βAIC 同时极小化。 对于自回归模型来说,AIC 存在着过拟合p 的倾向,惩罚因子

)2/()1(2---++q p n n q p 和)1(2++q p 在∞→n 时是渐进等价的,但AICC 统计量对

高阶模型会有更极端的惩罚效果,这将抵消AIC 的过拟合倾向。

从上述可以看出,AIC 准则的一般形式可表为:

AIC=-2ln (模型最大似然度)+2(模型独立参数个数) (5.33) 将其具体运用到AR(p)模型的定阶时,设观测数据序列}{t X 为零均值平稳序列,其中

的一组样本数据为12,,,T x x x ,设定一个拟合模型的最高阶数L ,则AR(k)模型AIC 定阶

步骤如下:

(1)计算样本自协方差系数?k γ(0≤k≤L)和样本自相关系数k ρ

?(0≤k≤L); (2)利用递推算法计算偏相关函数?kj

φ(1≤j≤k;1≤k≤L); (3)令

2

01

????k

k

kj j

j σγφγ==-∑ (5.34)

其中2

?k σ

是AR(k)模型残差方差,记 22?()ln k k

AIC k T

σ

=+ )0(L k ≤≤ (5.35) (4)在1≤k≤L 范围内,如果当k=p 时,AIC(k)取得最小值,则适用的模型为AR(p)。

5.3.3 AIC 准则用于ARMA(p ,q)模型的定阶

根据取得的观测数据样本N X X X ,,,21 ,计算出拟合残差方差2

σ的估计值2

,设定拟合模型的最高阶数L ,在0≤p≤L ,0≤q≤L 范围内,计算

N

q p q p AIC k )

1(2?ln ),(2

+++=σ

(5.36)

如果当p=p 0,q=q 0时,AIC(p ,q)取到最小值,则表明适用的拟合模型为ARMA(p ,q)。如果时间序列均值不为零(0≠μ),则均值应作为一个独立参数进行估计,此时有

N

q p q p A I C k )

2(2?ln ),(2

+++=σ

(5.37)

由此可见,AIC 准则函数通常由两项构成。第一项体现了模型拟合的好坏,它随阶数的增大而至小;第二项体现了模型参数的多少,它随阶数的增大而变大。取二者的最大值意味着上述两个量的一种平衡。从k=0开始逐新增加模型阶数AIC(k)的值是下降的,因为此时起决定性怍用的是第一项,即模型残差方差。当阶数k 达到某一值k 0时,AIC(0k )达到最小,然后,随着阶数k 继续上升,残差方差下降甚微。起决定性作用的是第二项,从而AIC(k)的值随k 而增长。此外,使用AIC 准则需要注意以下几个问题:

(1)AIC 准则要求预先设定模型阶数的最大范围L 。根据经验可知,阶数上限取

N N N log ,10/,均可。在比较AIC 大小的过程中,如果已接近阶数上限仍不能确定AIC

的极小点,则应加大上限,继续进行比较。

(2)AIC 准则要求参数由最大似然无法解释,但当序列不服从正态分布时.计算表明该准则对于最小二乘法估计也仍然适用

(3)AIC 准则是模型优化的一种宏观度量,但不宜机械地以绝对最小值来选择模型阶数,而是要在所对应的模型进行多次比较后,确定合理的模型阶数以及相应参数。

例5.6

根据某观测数据序列(T=176)拟合出若干个AR(p)模型,其模型参数估计值、

残差方差值以及AIC 值如下表所示。

表5.7 某序列模型的AIC 定阶结果

根据模型定阶的AIC 准则,由上表中AIC 的数值可以看出,最合适上述观测数据序列的模型结构应是二阶自回归模型,即AR(2):

t t t t X X X ε=----216455.03306.1

5.3.4 BIC 准则法

理论上已经证明,AIC 方法不能给出相容估计。也即当样本容量T →∞时,采用AIC 方法定出的模型阶数估计值,并不能依概率收敛到真值。对此,Akaike(1976年)和E .J.Haman(1979年)等学者又提出了BIC 准则

BIC 准则函数的定义如下

2

?()log log p

BIC p T T

σ

=+ (5.38)

若某一阶数0p 满足

)(min )(10p BIC p BIC L

p ≤≤= (5.39)

其中L 是预先设定的模型阶数上限,则取0p 为模型的最佳阶数。

与AIC 准则函数相比,(5.38)式右边第二项用log T 代替了系数2。一般地说,ln 2T >>,

因此AIC 达到极小时所对应的阶数(0p )往往比BIC 准则相应定出的阶数(0

p ')高,即 0

0p p '≤ 这说明对同一数据序列进行拟合,用AIC 准则往往比用BIC 准则确定的阶数高。此外,还可以定义其他类型的准则函数,如

2?()log log cp

BIC p T T

σ

=+ (5.40) 其中c 为给定常数。

必须指出,定义不同的准则函数,其目的是为了对拟合残差与参数个数之间进行不同的权衡,以体现研究者对残差与阶数两者重要性的不同侧重。当然,用不同准则挑选出的最优模型,其渐进性质是不同的。例如.当样本数据N 充分大时,用AIC 准则挑选的最佳模型的阶数往往是过相容的,也就是说,选定的阶数往往比真实模型的阶数高。而用BIC 准则确定的最佳模型往往是相容的,也就是说,选定的阶数往往比较接近真实模型的阶数。

在实际问题中,对不同阶数模型得到的准则函数值,往往不是理想的下凸函数,而是总的趋势符台下凸函数变化规律,同时具有随机起伏,有时可能出现准则函数值达到某值后,没有明显的增长趋势,而是随机地起伏摆动。遇到这种情况,如果适当地增加式(5.40)中常致c ,可使准则函数值在后一段有较明显的增长趋势。

习题五

5.1 设{}t X 为零均值平稳序列,给定长度100T =的样本,计算得样本自协方差系数如下,

试求样本偏自相关系数的估计,并对序列服从哪种模型进行识别。 (1)0?γ=1.4,1?γ=0.77,2?γ=0.41,3?γ=0.2,4?γ=0.06,5?γ=-0.05,6?γ=-0.14 (2)0?γ=1.98,1?γ=0.41,2?γ=-1.25,3?γ=-0.71,4?γ=0.61,5?γ=0.65,6?γ=-0.27

5.2 已知某序列{}t X ()96T =的样本自相关系数和偏自相关系数如下,试对序列{}t X 给出

初步的模型识别。

多元时间序列建模分析

应用时间序列分析实验报告

单位根检验输出结果如下:序列x的单位根检验结果:

1967 58.8 53.4 1968 57.6 50.9 1969 59.8 47.2 1970 56.8 56.1 1971 68.5 52.4 1972 82.9 64.0 1973 116.9 103.6 1974 139.4 152.8 1975 143.0 147.4 1976 134.8 129.3 1977 139.7 132.8 1978 167.6 187.4 1979 211.7 242.9 1980 271.2 298.8 1981 367.6 367.7 1982 413.8 357.5 1983 438.3 421.8 1984 580.5 620.5 1985 808.9 1257.8 1986 1082.1 1498.3 1987 1470.0 1614.2 1988 1766.7 2055.1 1989 1956.0 2199.9 1990 2985.8 2574.3 1991 3827.1 3398.7 1992 4676.3 4443.3 1993 5284.8 5986.2 1994 10421.8 9960.1 1995 12451.8 11048.1 1996 12576.4 11557.4 1997 15160.7 11806.5 1998 15223.6 11626.1 1999 16159.8 13736.5 2000 20634.4 18638.8 2001 22024.4 20159.2 2002 26947.9 24430.3 2003 36287.9 34195.6 2004 49103.3 46435.8 2005 62648.1 54273.7 2006 77594.6 63376.9 2007 93455.6 73284.6 2008 100394.9 79526.5 run; proc gplot; plot x*t=1 y*t=2/overlay; symbol1c=black i=join v=none; symbol2c=red i=join v=none w=2l=2; run; proc arima data=example6_4; identify var=x stationarity=(adf=1); identify var=y stationarity=(adf=1); run; proc arima; identify var=y crrosscorr=x; estimate methed=ml input=x plot; forecast lead=0id=t out=out; proc aima data=out; identify varresidual stationarity=(adf=2); run;

时间序列预测模型

时间序列预测模型时间序列是指把某一变量在不同时间上的数值按时间先后顺序排列起来所形成的序列,它的时间单位可以是分、时、日、周、旬、月、季、年等。时间序列模型就是利用时间序列建立的数学模型,它主要被用来对未来进行短期预测,属于趋势预测法。一、简单一次移动平均预测法例1.某企业1月~11月的销售收入时间序列如下表所示.取n 4,试用简单一次移动平均法预测第12月的销售收入,并计算预测的标准误差. 二、加权一次移动平均预测法简单一次移动平均预测法,是把参与平均的数据在预测中所起的作用同等对待,但参与平均的各期数据所起的作用往往是不同的。为此,需要采用加权移动平均法进行预测,加权一次移动平均预测法是其中比较简单的一种。三、指数平滑预测法 1、一次指数平滑预测法一元线性回归模型 * 项数n的数值,要根据时间序列的特点而定,不宜过大或过小.n过大会降低移动平均数的敏感性,影响预测的准确性;n过小,移动平均数易受随机变动的影响,难以反映实际趋势.一般取n的大小能包含季节变动和周期变动的时期为好,这样可消除它们的影响.对于没有季节变动和周期变动的时间序列,项数n的取值可取较大的数;如果历史数据的类型呈上升或下降型的发展趋势,则项数n的数值应取较小的数,这样能取得较好的预测效果. 1102.7 1015.1 963.9 892.7 816.4 772.0 705.1 649.8 606.9 574.6 533.8 销售收入 11 10 9 8 7 6 5 4 3 2 1 月份 t 158542.7 993.6 12 12950.4 19016.4 17662.4 24617.6 27989.3

第五章-时间序列的模型识别

第五章时间序列的模型识别 前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下: 图5.1 建立时间序列模型流程图 在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。 对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。如果ACF和PACF 都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来

平稳时间序列模型的建立

-0.8 -0.6-0.4-0.20.00.20.40.60.82 4 6 8 10 12 14 -0.8 -0.6-0.4-0.20.0 0.20.40.60.82 4 6 8 10 12 14 第四章 平稳时间序列模型的建立 本章讨论平稳时间序列的建模问题,也就是从观测到的有限样本数据出发,通过模型的识别、模型的定阶、参数估计和诊断校验等步骤,建立起适合的序列模型。学习重点为模型的识别和模型的检验。 第一节 模型识别 一、 识别依据 模型识别主要是依据SACF 和SPACF 的拖尾性与截尾性来完成。常见的一些ARMA 类型的SACF 和SPACF 的统计特征在下表中列出,可供建模时,进行对照选择。 表 ARIMA 过程与其自相关函数偏自相关函数特征 模 型 自相关函数特征 偏自相关函数特征 ARIMA(1,1,1) ? x t = ?1? x t -1 + u t + θ1u t -1 缓慢地线性衰减 AR (1) x t = ?1 x t -1 + u t 若?1 > 0,平滑地指数衰减 若?1 < 0,正负交替地指数衰减 -0.8 -0.6-0.4-0.20.00.20.40.60.82 4 6 8 10 12 14 若?11 > 0,k =1时有正峰值然后截尾 若?11 < 0,k =1时有负峰值然后截尾 -0.8 -0.6-0.4-0.20.00.20.40.60.82 4 6 8 10 12 14 MA (1) x t = u t + θ1 u t -1 若θ1 > 0,k =1时有正峰值然后截尾 若θ1 > 0,交替式指数衰减 -1.0 -0.5 0.0 0.5 1.02 4 6 8 10 12 14 -1.0 -0.5 0.0 0.5 1.0 2 4 6 8 10 12 14

第七章时间序列分析答案

第七章时间数列分析 一、填空题 1、时间指标数值 2、逐期增长量累计增长量 3、增长水平(或增长量)发展速度 4、本期水平去年同期水平 5、年距发展速度 1(或100%) 6、几何平均法方程法 7、同季(月)平均法趋势与季节模型法 8、平均季节比重法平均季节比率法 9、报告期水平基期水平 10、序时平均数(或动态平均数)平均数 11、和差 12、季节变动长期趋势 13、逐期增长量环比增长速度 14、长明显 1-5 A C C A D 6-10 A B A D B 三、多选题 1、CDE 2、ABDE 3、ABCE 4、ACDE 5、BDE 6、BD 7、ABCD 8、ACE 9、AE 10、ACE 四、简答题 1、序时平均数与一般平均数的异同。 答:(1)相同之处。二者都是将具体数值抽象化,用一个代表性的数指来代表总体的一般水平。 (2)不同之处。①计算的依据不同。一般平均数是根据变量数列计算的,而序时平均数则是 根据时间数列计算的;②对比的指标不同。一般平均数是总体标志总量与总体单位总量对比的结果, 而序时平均数则是时间数列各期发展水平的总和与时期项数对比的结果;③说明的问题不同。一般 平均数说明现象在同一时间、不同空间上所达到的一般水平,而序时平均数则说明现象在同一空间、 不同时间上所达到的一般水平。 2、时期数列与时点数列的区别。 答:①时期数列中的指标值为时期数,时点数列中的指标值为时点数;②时期数列中的指标值 具有可加性,而时点数列中的指标值则不具有可加性;③时期数列中指标值的大小与时间间隔的长 短有直接关系,而时点数列中指标值的大小与时间间隔的长短则没有直接关系;④时期数列中的指

时间序列模型的构建和预测

时间序列模型的构建和预测 Box Jenkins Methodology) 步骤1:识别。观察相关图和偏相关图 步骤2:估计。估计模型中所包含的自回归系数和移动平均系数,可以用OLS 来估计 步骤3:诊断检验。选一个最适合数据的模型,检查从这模型中估计到的残差是否白噪声,如果不是的话,我们必须从头来过 步骤 4 :预测。在很多情况下,这种方法得到的预测结果要比其它计量模型得到的要准确 识别 检查时间序列是否平稳 - 如果自相关函数衰退的很慢,则序列可能是非平稳 - 如果时间序列为一非平稳过程,应该运用差分的形式使它变为平稳过程 - 在检验了一个时间序列的平稳性之后,我们应该用相

关图和偏相关图检验ARMA模型中的阶数p和q 模型 ARIMA(1,1,1) .■: x t = ■ 1. x t-1 + u t + ru t-1 自相关函数特征 缓慢地线性衰减 1.0 偏自相关函数特征 AR( 1) x t = -1 X t-1 + u t 右;1 > 0,平滑地指数衰减若-11 > 0,k=1时有正峰值然后截尾 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 2 - 4 6 - 8 10 12 ?14 MA ( 1) X t = U t + 71 U t- 1 AR( 2) x t = ;1 x t-1 + 2 X t-2 + u t 若;i < 0,正负交替地指数衰减 0.8 若71 > 0,k=1时有正峰值然后截尾 若71 < 0,k=1时有负峰值然后截尾 指数或正弦衰减 若-11 < 0,k=1时有负峰值然后截尾 0.8 0.6 0.4 0.2 0.0 -0.2 -0.4 -0.6 -0.8 若?冷> 0,交替式指数衰减 0.8 若3<0,负的平滑式指数衰减 k=1,2时有两个峰值然后截尾

第七章时间序列分析

第七章 时间序列分析 一、单项选择题 1.某地区1990—1996年排列的每年年终人口数动态数列是( )。 A 、绝对数动态数列 B 、绝对数时点数列 C 、相对数动态数列 D 、平均数动态数列 2.某工业企业产品年生产量为20万件,期末库存5.3万件,它们( )。 A 、是时期指标 B 、是时点指标 C 、前者是时期指标,后者是时点指标 D 、前者是时点指标,后者是时期指标 3.间隔相等的不连续时点数列计算序时平均数的公式为( )。 A 、n a a ∑= B 、∑ ∑=f af a C 、n a a a a a n 2 /2/210++++= L D 、∑ ×+++×++×+=?f f a a f a a f a a a n n n 2221221110L 4.修正的指数曲线模型可以表示为( )。 A 、t b b y t 10+= B 、bt t ae y = C 、t b a y t ln += D 、t t bc a y += 5.某地区连续4年的经济增长率分别为8.5%,9%,8%,9.4%,则该地区经济的年平均增 长率为( )。 A 、1094.108.109.1085.14?××× B 、4094.008.009.0085.0××× C 、 4 094.108.109.1085.1××× D 、(8.5%+9%+8%+9.4%)÷5 6.某工业企业生产的产品单位成本从2005年到2007年的平均发展速度为98%,说明该产品单位成本( )。 A 、平均每年降低2% B 、平均每年降低1% C 、2007年是2005年的98% D 、2007年比2005年降低98% 7.根据近几年数据计算所的,某种商品第二季度销售量季节比率为1.7,表明该商品第二季度销售( )。 A 、处于旺季 B 、处于淡季 C 、增长了70% D 、增长了170% 8.对于包含四个构成因素(T ,S ,C ,I )的时间序列,以原数列各项数值除以移动平均值(其平均项数与季节周期长度相等)后所得比率( )。 A 、只包含趋势因素 B 、只包含不规则因素

实验十时间序列模型

实验十时间序列模型 10.1 实验目的 掌握时间序列的基本理论,时间序列模型种类的识别、估计、诊断和预测方法,以及相应的EViews软件操作方法。 10.2 实验原理 时间序列分析方法由Box-Jenkins (1976) 年提出。它适用于各种领域的时间序列分析。 时间序列模型不同于经济计量模型的两个特点是: (1)这种建模方法不以经济理论为依据,而是依据变量自身的变化规律,利用外推机制描述时间序列的变化。 (2)明确考虑时间序列的非平稳性。如果时间序列非平稳,建立模型之前应先通过差分把它变换成平稳的时间序列,再考虑建模问题。 时间序列模型的应用: (1)研究时间序列本身的变化规律(建立何种结构模型,有无确定性趋势,有无单位根,有无季节性成分,估计参数)。 (2)在回归模型中的应用(预测回归模型中解释变量的值)。 (3)时间序列模型是非经典计量经济学的基础之一(不懂时间序列模型学不好非经典计量经济学)。 10.3 实验内容 建立中国人口时间序列模型。 表10.1给出了中国人口数据y t(1952-2004,单位万人),试建立y t的时间序列模型,并预测2005年中国人口总数。 表10.2

10.4 建模步骤 10.4.1 识别模型 利用表10.2数据建立y t序列图,如图10.20。 图10.20 中国人口序列(1952-2004) 从人口序列图可以看出我国人口总水平除在1960和1961两年出现回落外,其余年份基本上保持线性增长趋势。 察看序列的相关图,在序列窗口选择View/Correlogram,便会弹出如下窗口,见图10.21,选择滞后阶数(本例输入滞后期10),点击ok,得到如图10.22所示的序列y t的相关图和偏相关图。 图10.21 图10.22 y t的相关图,偏相关图 由y t的相关图,偏相关图判断y t为非平稳性序列。进一步考察其差分序列Dy t,序列图见图10.23,其相关图,偏相关图见图10.24。 图10.23 图10.24 Dy t的相关图,偏相关图 人口差分序列Dy t是平稳序列。应该用Dy t建立模型。因为Dy t均值非零,结合图2.14拟建立带有漂移项的AR(1)模型。 10.4.2 估计模型 采用AR(1)模型对Dy t进行估计,从EViews主菜单中点击Quick键,选择Estimate Equation功能。随即会弹出Equation specification对话框。输入漂移项非零的AR(1)模型估计命令(C表示漂移项)如下: D(Y) C AR(1) 结果如图10.25所示,整理如下: Dy t = 1374.097 + 0.6681 (Dy t-1– 1374.097) + v t

人大版统计学 习题加答案第七章 时间序列分析

第七章时间序列分析 一、填空 1、下表为两个地区的财政收入数据: 则A地区财政收入的增长速度是,B地区财政收入的增长速度是,A 地区财政收入的增长1%的绝对值为,B地区财政收入的增长1%的绝对值为。 2、已知环比增长速度为7.1%、3.4%、3.6%、5.3%,则定基增长速度是。 3、年劳动生产率r(千元和职工工资y (元之间的回归方程为110x =,这意味着 120 y+ 年劳动生产率每提高1千元时,职工工资平均。 4、拉氏价格或销售量指数的同度量因素都是选期,而派许指数的同度量因素则选期。 5、动态数列的变动一般可以分解为四部分,即趋势变动、变动、变动和不规则变动。 二、选择题

1.反映了经济现象在一个较长时间内的发展方向,它可以在一个相当长的时间内表现为一种近似直线的持续向上或持续向下或平稳的趋势。 A长期趋势因素B季节变动因素C周期变动因素D不规则变动因素 2.是经济现象受季节变动影响所形成的一种长度和幅度固定的周期波动。 A长期趋势因素B季节变动因素C周期变动因素D不规则变动因素 3、时间序列在一年内重复出现的周期性波动称为( A、趋势 B、季节性 C、周期性 D、随机性 4、在使用指数平滑法进行预测时,如果时间序列比较平稳,则平滑系数α的取值( A、应该小些 B、应该大些 C、等于0 D、等于1 5、某银行投资额2004年比2003年增长了10%,2005年比2003年增长了15%,2005年比2004年增长了( A、15%÷10% B、115%÷110%

C、(110%×115%+1 D、(115%÷110%-1 三、判断 1、若1998年的产值比1997年上涨10%,1999年比1998年下降10%,则1999年的产值比1997年的产值低。( 2、若三期的环比增长速度分别为9%、8%、10%,则三期的平均增长速度为9% (。 3、去年物价下降10%,今年物价上涨10%,今年的1元钱比前年更值钱。(。 4、若平均发展速度大于100%,则环比发展速度也大于100%。( 5、定基发展速度和环比发展速度之间的关系是两个相邻时期的定基发展速度之积等于相应的环比发展速度。(四、计算题 要求:用一次线性模型预测该学校2006年报考人数。 2、已知某化肥厂近年生产情况,请填入表中空缺的指标值并计算年平均增长量、年平均发展速度

时间序列分析实验2 时间序列模型的识别、参数估计

实验2:时间序列模型的识别、参数估计 实验目的: 1. 掌握时间序列的平稳性检验、纯随机性检验。 2. 能够利用自相关系数和偏自相关系数对时间序列模型进行识别。 3. 掌握参数估计的方法。 实验内容: 利用教材P151习题7.6所给的样本数据,在Eviews中实现下列内容:(1)画出时序图; (2)给出直至滞后48期的所有样本自相关系数和样本偏自相关系数;

(3)利用(2)的结果判断该序列的平稳性和纯随机性; 解:由(2)的序列分析结果:a、可以看出自相关系数(AC)始终在零周围波动,判定该序列为平稳时间序列;b、看Q统计量的P值:该统计量的原假设为X的1期,2期……k期的自相关系数均等于0,备择假设为自相关系数中至少有一个不等于0,因此如图知,该P值几乎都<5%的显著性水平,所以拒绝原假设,即序列不是纯随机序列(白噪声序列)。 (4)对该序列建立不同的模型,并进行比较,最后选择一个最优的模型; 解:观察(2)的图形,我们可以假设模型为MA(q)、AR(p)或ARMA(p,q)模型。 下面对每一个模型进行检验。 对MA(1):

如图所示:c对应的prob<0.05,故拒绝原假设,不能省去c。MA(1)对应的prob<0.05,故此模型有意义。AIC为0.3354.

对MA(2): MA(2)(p>0.05故此模型没有意义)。 如图所示:c对应的prob<0.05,故拒绝原假设,不能省去c;AR(1)对应的prob<0.05,故此模型有意义。AIC值为0.3092.

对AR(2): AR(2)对应的p>0.05故此模型没有意义。

时间序列分析法原理及步骤

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

时间序列模型的建立与预测

第六节时间序列模型的建立与预测 ARIMA过程y t用 Φ (L) (Δd y t)= α+Θ(L) u t 表示,其中Φ (L)和Θ (L)分别是p, q阶的以L为变数的多项式,它们的根都在单位圆之外。α为Δd y t过程的漂移项,Δd y t表示对y t 进行d次差分之后可以表达为一个平稳的可逆的ARMA 过程。这是随机过程的一般表达式。它既包括了AR,MA 和ARMA过程,也包括了单整的AR,MA和ARMA过程。 可取 图建立时间序列模型程序图 建立时间序列模型通常包括三个步骤。(1)模型的识别,(2)模型参数的估计,(3)诊断与检验。

模型的识别就是通过对相关图的分析,初步确定适合于给定样本的ARIMA模型形式,即确定d, p, q的取值。 模型参数估计就是待初步确定模型形式后对模型参数进行估计。样本容量应该50以上。 诊断与检验就是以样本为基础检验拟合的模型,以求发现某些不妥之处。如果模型的某些参数估计值不能通过显著性检验,或者残差序列不能近似为一个白噪声过程,应返回第一步再次对模型进行识别。如果上述两个问题都不存在,就可接受所建立的模型。建摸过程用上图表示。下面对建摸过程做详细论述。 1、模型的识别 模型的识别主要依赖于对相关图与偏相关图的分析。在对经济时间序列进行分析之前,首先应对样本数据取对数,目的是消除数据中可能存在的异方差,然后分析其相关图。 识别的第1步是判断随机过程是否平稳。由前面知识可知,如果一个随机过程是平稳的,其特征方程的根都应在单位圆之外;如果 (L) = 0的根接近单位圆,自相关函数将衰减的很慢。所以在分析相关图时,如果发现其衰减很慢,即可认为该时间序列是非平稳的。这时应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳的序列。对于经济时间序列,差分次数d通常只取0,1或2。 实际中也要防止过度差分。一般来说平稳序列差分得到的仍然是平稳序列,但当差分次数过多时存在两个缺点,(1)序列的样本容量减小;(2)方差变大;所以建模过程中要防止差分过度。对于一个序列,差分后若数据的极差变大,说明差分过度。 第2步是在平稳时间序列基础上识别ARMA模型阶数p, q。表1给出了不同ARMA模型的自相关函数和偏自相关函数。当然一个过程的自相关函数和偏自相关函数通常是未知的。用样本得到的只是估计的自相关函数和偏自相关函数,即相关图和偏相关图。建立ARMA模型,时间序列的相关图与偏相关图可为识别模型参数p, q提供信息。相关图和偏相关图(估计的自相关系数和偏自相关系数)通常比真实的自相关系数和偏自相关系数的方差要大,并表现为更高的自相关。实际中相关图,偏相关图的特征不会像自相关函数与偏自相关函数那样“规范”,所以应该善于从相关图,偏相关图中识别出模型的真实参数p, q。另外,估计的模型形式不是唯一的,所以在模型识别阶段应多选择几种模型形式,以供进一步选择。

数学建模时间序列分析

基于Excel的时间序列预测与分析 1 时序分析方法简介 1.1时间序列相关概念 1.1.1 时间序列的内涵以及组成因素 所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。 时间序列的变化受许多因素的影响 ,有些起着长期的、决定性的作用 ,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。影响时间序列的构成因素可归纳为以下四种: (1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。这一变化通常是许多长期因素的结果。 (2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。这种因素是因经济多年的周期性变动产生的。比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增 地趋势线上下方。 (3)季节性变化(Seasonal variation),指现象受季节性影响 ,按一固定周期呈现出的周期波动变化。尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。

第七讲 时间序列分析

第七讲 时间序列分析 时间序列模型包含丰富的内容,在经济预测中得到广泛的应用。这里我们仅对几类常用的、采用回归分析方法估计参数的线性时间序列模型作一个介绍,为进一步专门学习与应用时间序列分析模型建立一个基础。时间序列分析模型分确定模型和随机模型两大类。 1、 确定性时间序列分析模型 对于一个时间序列 T y y y ,...,21 确定性模型主要有以下几种: (1) 滑动(移动)平均模型 y ^t = (y t +y t-1+……+y t-s+1)/S 其中S 为某个确定的数。滑动(移动)平均模型能在一定程度上削弱干扰,从而更好地显示序列的趋势性变化。还可以类似构建二次滑动平均模型。 (2) 加权滑动平均模型 y ^tw = (α0y t +α1y t-1+……+αs-1y t-s+1)/S 其中为加权因子,满足(Σαi )/S=1。加权滑动平均模型除了能削弱干扰,显示序列的趋势性变化以外,通过加权因子的选取,使趋势预测更加准确。 (3) 指数平滑模型 y ^t = αy t-1+(1-α)y ^t-1 其中α称为平滑常数,0<α<1,预测值为前期实际值和预测值的加权和。通常以预测的残差平方和最小为选择α的准则。可以类似构建二次或三次指数滑动模型。 2、随机时间序列分析模型 时间序列是基于假定需要观测的序列T y y y ,...,21是由某个随机过程生成的,即假定序列的每一个数值都是从一个概率分布中随机得到的。完全确定时间序列的概率分布函数一般是不可能的。通常情况下可以构造一个简单的时间序列模型,以便解释它的随机性。模型的实用性依赖于模型贴切地体现真实的概率分布以及反映序列的真实随机行为的程度。模型不必与序列的过去实际行为完全一致,因为序列和模型都是随机的,只要模型能够刻划序列的随机特征。 随机时间序列分析模型主要分为三种,自回归模型(AR )、滑动平均模型(MA )和自 回归滑动平均模型(ARMA )。自回归模型(AR )和滑动平均模型(MA )是自回归滑动平均模型(ARMA )的特款。 (1) 自回归模型 若时间序列y t 为它的前期值和随机项的线性函数,即可以表为 y t =φ1y t-1+φ2y t-2+……+φp y t-p +μt 则称该时间序列y t 为p 阶自回归模型。

ARMA模型的eviews的建立--时间序列分析实验指导

时间序列分析 实验指导 4 2 -2 -4 50100150200250

统计与应用数学学院

前言 随着计算机技术的飞跃发展以及应用软件的普及,对高等院校的实验教学提出了越来越高的要求。为实现教育思想与教学理念的不断更新,在教学中必须注重对大学生动手能力的培训和创新思维的培养,注重学生知识、能力、素质的综合协调发展。为此,我们组织统计与应用数学学院的部分教师编写了系列实验教学指导书。 这套实验教学指导书具有以下特点: ①理论与实践相结合,书中的大量经济案例紧密联系我国的经济发展实际,有利于提高学生分析问题解决问题的能力。 ②理论教学与应用软件相结合,我们根据不同的课程分别介绍了SPSS、SAS、MATLAB、EVIEWS等软件的使用方法,有利于提高学生建立数学模型并能正确求解的能力。 这套实验教学指导书在编写的过程中始终得到安徽财经大学教务处、实验室管理处以及统计与应用数学学院的关心、帮助和大力支持,对此我们表示衷心的感谢! 限于我们的水平,欢迎各方面对教材存在的错误和不当之处予以批评指正。 统计与数学模型分析实验中心 2007年2月

目录 实验一 EVIEWS中时间序列相关函数操作···························- 1 - 实验二确定性时间序列建模方法 ····································- 8 - 实验三时间序列随机性和平稳性检验 ···························· - 18 - 实验四时间序列季节性、可逆性检验 ···························· - 21 - 实验五 ARMA模型的建立、识别、检验···························· - 27 - 实验六 ARMA模型的诊断性检验····································· - 30 - 实验七 ARMA模型的预测·············································· - 31 - 实验八复习ARMA建模过程·········································· - 33 - 实验九时间序列非平稳性检验 ····································· - 35 -

时间序列模型stata 基本命令汇总

时间序列模型 结构模型虽然有助于人们理解变量之间的影响关系,但模型的预测精度比较低。在一些大规模的联立方程中,情况更是如此。而早期的单变量时间序列模型有较少的参数却可以得到非常精确的预测,因此随着Box and Jenkins(1984)等奠基性的研究,时间序列方法得到迅速发展。从单变量时间序列到多元时间序列模型,从平稳过程到非平稳过程,时间序列分析方法被广泛应用于经济、气象和过程控制等领域。本章将介绍如下时间序列分析方法,ARIMA模型、ARCH族模型、VAR模型、VEC模型、单位根检验及协整检验等。 一、基本命令 1.1时间序列数据的处理 1)声明时间序列:tsset 命令 use gnp96.dta, clear list in 1/20 gen Lgnp = L.gnp tsset date list in 1/20 gen Lgnp = L.gnp 2)检查是否有断点:tsreport, report use gnp96.dta, clear tsset date tsreport, report drop in 10/10 list in 1/12 tsreport, report tsreport, report list /*列出存在断点的样本信息*/ 3)填充缺漏值:tsfill tsfill tsreport, report list list in 1/12 4)追加样本:tsappend use gnp96.dta, clear tsset date list in -10/-1 sum tsappend , add(5) /*追加5个观察值*/ list in -10/-1 sum

某种股票价格的数据的时间序列模型的建立及分析

教育部直属国家“211工程”重点建设高校 股票价格模型 ——应用时间序列分析期末论文 2013年11月一、实验目的: 掌握用Box-Jeakins方法及Paudit-Wu方法建模及预测 二、实验内容: 应用数据1前28个数据建模,后8个数据供预测检验。 数据1 : 某种股票价格的数据(单位:元)

表1 三、数据检验 1、检验并消除数据长期趋势 法一:图形检验 (1)根据表中数据我们先画出序列图并对序列图进行平稳性分析。 (2)Matlab程序代码 x=[10.5,10.44,9.94,10.25,11,9.88,10.5,12,13.94,12.25,12.61,13.5,13.44,12.44, 13.5,15.39,15.75,13.88,14.5,15.5,16.13,14.75,11.75,15.25,17.13,20.5,19,21.5;] plot(x) xlabel('时间t'); ylabel('观测值x'); title('某种股票价格序列图'); (3)得到图(1) 图(1) (4)观察图形,发现数据存在长期向上的趋势。表示序列是不平稳的。 (5)我们再进一步对数据进行一阶差分,利用Matlab画图。

(6)Matlab程序代码 y=diff(x,1) plot(y) xlabel('时间t'); ylabel('一阶差分之后的观测值y'); title('某种股票价格差分之后序列图'); (7)得到图(2) 图(2) (8)根据图(2)初步判定一阶差分后的序列稳定 法二:用自相关函数检验 (1)用matlab做出原数据自相关函数的图 (2)Matlab程序代码 x=[10.5,10.44,9.94,10.25,11,9.88,10.5,12,13.94,12.25,12.61,13.5,13.44,12.44, 13.5,15.39,15.75,13.88,14.5,15.5,16.13,14.75,11.75,15.25, 17.13,20.5,19,21.5;]; acf1=autocorr(x,[],2); %计算自相关函数并作图 autocorr(x,[],2) acf1 (3)得到图(3)

多因素时间序列的灰色预测模型

第 39卷 第 2期 2007年 4月 西 安 建 筑 科 技 大 学 ( 学 报 ( 自然科学版) ) V ol.39 No.2 Apr . 2007 J 1Xi ’an Univ . of Arch . & Tech . Natural Scie nce Editio n 多因素时间序列的灰色预测模型 苏变萍 ,曹艳平 ,王 婷 (西安建筑科技大学理学院 ,陕西 西安 710055) 摘 要:对于传统的单因素时间序列预测法在实际应用中的不足之处 ,提出采用灰色 DGM (1 ,1) 模型和多元 线性回归原理相结合的方法 ,综合各种因素建立多因素时间序列的灰色预测模型。它首先利用 DGM (1 ,1) 模 型对影响事物发展趋势的各项因素进行预测 ;然后利用多元线性回归法将各种因素综合起来 ,以预测事物的 发展趋势。最后将该模型应用于预测分析陕西省的就业状况 ,取得了较好的预测效果 ,同时也验证了此模型 的可行性。 关键词: 时间序列 ;单因素 ;多因素 ;预测模型 中图分类号:TB114 文献标识码:A 文章编号 :100627930 2007 022******* ( ) 多年以来 ,对时间序列的预测研究 ,大多是停留在对单因素时间序列上 ,对其预测通常采用的是趋 势外推法 ,而且该方法适合于原始时间序列规律性较好的情况 ,若时间序列中包含了随机因素的影 响 ,再采用这种方法得出的预测结果可能会失真. 同时 ,客观世界又是复杂多变的 ,事物的发展通常不 是由某个单个因素决定 ,往往是许多错综复杂的因素综合作用的结果 ,为了对某项事物的发展做出更加 符合实际的预测 ,这就需要来探讨多因素时间序列的预测问题 ,正是基于这些 ,本文在应用灰色 D GM (1 ,1)模型对单因素时间序列预测的基础上 ,结合多元回归原理 ,提出建立多因素时间序列的灰色预测 模型 ,这样就充分发挥了二者的优点 ,既克服了时间序列的随机因素影响 ,又综合考虑了影响事物发展 的多种因素 ,从而达到提高预测精度和增加预测结果可靠性的效果. 1 模型的建立 设 Y = (y (1) , y (2) , …, y( n)) 表示事物发展的特征因素时间序列, X i = (x i (1) , x i (2) , …, x i ( n)) (i = 1 ,2 , …, p) 表示影响事物发展的单因素时间序列. 1.1 单因素时间序列的 DGM(1 ,1) 模型 对于单因素原始时间序列{ X i } (i = 1 ,2 , …, p) ,根据灰色系统理论建模方法 ,得 D GM (1 ,1) 模 型 : x i (1) a (1 - a) + a b ,t > 1 1.2 多因素时间序列的预测模型 为了能将影响事物发展的众多因素结合起来进行综合预测和相关因素的预测分析 ,在经过多次研 究与比较后,采用多元回归的原理建立多因素时间序列的灰色预测模型: y t = a 0 + a 1 x 1 t + a 2 x 2 t + …+ a p x p t 2 式中 y t 为该事物在 t 时刻的预测值;x i t i = 1 ,2 , …, p 为第 i 个单因素 ,通过应用上述的灰色 3收稿日期 :2005201209 修改稿日期:2006204212 基金项目 :陕西省教育厅专项基金项目 01J K133( ) 作者简介 :苏变萍 19632( ) ,女 ,山西忻州人 ,副教授 ,博士研究生 ,研究方向为计量经济学. [122] (0) (0) (0) ( ) ( ) [4] (0) x (1) = x (1) ^ x (t) = (1) ( ) ^ ^ ^ ^ ^ ^

3时间序列模型识别

时间序列模型识别 1采用ACF、PACF识别 1.1MA(1)模型 根据其自相关系数是否落在2倍标准误差(方差约等于1/n)里面,判断是否接受原假设为ma(q)模型,如下ma(1)模型 > data(ma1.1.s) > acf(ma1.1.s) 采用公式计算出的可变临界限,画出来的标准差范围是乎更加精确 公式为

> acf(ma1.1.s,ci.type='ma') > acf(ma1.1.s,ci.type='ma',xaxp=c(0,20,10)) Xaxp(0,20,10)表示滞后从0到20,中间画出10个标度 若ACF中有明显衰减的正弦波趋势也应该考虑下AR模型,用PACF做进一步的检验。 1.2AR(1)模型 > data(ar1.s) > acf(ar1.s,xaxp=c(0,20,10))

其自相关系数趋近于线性递减,一般对于AR模型应采用计算pacf 若ACF中有明显衰减的正弦波趋势也应该考虑下AR模型,用PACF做进一步的检验。 > pacf(ar1.s,xaxp=c(0,20,10)) 由图可知其偏相关系数在一阶时非常的明显,也再一次验证了其是一阶自相关过程。 1.3ARMA(1,1) > plot(arma11.s)

> acf(arma11.s,xaxp=c(0,20,10)) > pacf(arma11.s,xaxp=c(0,20,10)) 从acf和pacf可以看出模型建议为arma(1,1)

1.4非平稳模型ARIMA > data(oil.price) > acf(as.vector(oil.price)) > pacf(as.vector(oil.price)) 一阶差分后的相关系数 > acf(diff(as.vector(log(oil.price))))

ARMA模型的eviews的建立时间序列分析实验指导

时间序列分析实验指导 统计与应用数学学院

前言 随着计算机技术的飞跃发展以及应用软件的普及,对高等院校的实验教学提出了越来越高的要求。为实现教育思想与教学理念的不断更新,在教学中必须注重对大学生动手能力的培训和创新思维的培养,注重学生知识、能力、素质的综合协调发展。为此,我们组织统计与应用数学学院的部分教师编写了系列实验教学指导书。 这套实验教学指导书具有以下特点: ①理论与实践相结合,书中的大量经济案例紧密联系我国的经济发展实际,有利于提高学生分析问题解决问题的能力。 ②理论教学与应用软件相结合,我们根据不同的课程分别介绍了SPSS、SAS、MATLAB、EVIEWS等软件的使用方法,有利于提高学生建立数学模型并能正确求解的能力。 这套实验教学指导书在编写的过程中始终得到安徽财经大学教务处、实验室管理处以及统计与应用数学学院的关心、帮助和大力支持,对此我们表示衷心的感谢! 限于我们的水平,欢迎各方面对教材存在的错误和不当之处予以批评指正。 统计与数学模型分析实验中心 2007年2月

目录

实验一 EVIEWS中时间序列相关函数操作 【实验目的】熟悉Eviews的操作:菜单方式,命令方式; 练习并掌握与时间序列分析相关的函数操作。 【实验内容】 一、EViews软件的常用菜单方式和命令方式; 二、各种常用差分函数表达式; 三、时间序列的自相关和偏自相关图与函数; 【实验步骤】 一、EViews软件的常用菜单方式和命令方式; ㈠创建工作文件 ⒈菜单方式 启动EViews软件之后,进入EViews主窗口 在主菜单上依次点击File/New/Workfile,即选择新建对象的类型为工作文件,将弹出一个对话框,由用户选择数据的时间频率(frequency)、起始期和终止期。选择时间频率为Annual(年度),再分别点击起始期栏(Start date)和终止期栏(End date),输入相应的日期,然后点击OK按钮,将在EViews 软件的主显示窗口显示相应的工作文件窗口。 工作文件窗口是EViews的子窗口,工作文件一开始其中就包含了两个对象,一个是系数向量C(保存估计系数用),另一个是残差序列RESID(实际值与拟合值之差)。 ⒉命令方式 在EViews软件的命令窗口中直接键入CREATE命令,也可以建立工作文件。命令格式为:CREATE 时间频率类型起始期终止期 则菜单方式过程可写为:CREATE A 1985 1998 ㈡输入Y、X的数据 ⒈DATA命令方式 在EViews软件的命令窗口键入DATA命令,命令格式为: DATA <序列名1> <序列名2>…<序列名n> 本例中可在命令窗口键入如下命令: DATA Y X

相关文档
相关文档 最新文档