文档库 最新最全的文档下载
当前位置:文档库 › 非线性时间序列

非线性时间序列

非线性时间序列
非线性时间序列

近代时间序列分析选讲:

一. 非线性时间序列

二. GARCH模型

三. 多元时间序列

四. 协整模型

第一部分非线性时间序列

第一章.非线性时间序列浅释

1.从线性到非线性自回归模型

2.线性时间序列定义的多样性

第二章. 非线性时间序列模型

1. 概述

2. 非线性自回归模型

3.带条件异方差的自回归模型

4.两种可逆性

5.时间序列与伪随机数

第三章.马尔可夫链与AR模型

1. 马尔可夫链

2. AR模型所确定的马尔可夫链

3. 若干例子

第四章. 统计建模方法

1. 概论

2. 线性性检验

3.AR模型参数估计

4.AR模型阶数估计

第五章. 实例和展望

1. 实例

2.展望

第一章.非线性时间序列浅释

1. 从线性到非线性自回归模型

时间序列{x t}是一串随机变量序列,

它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明.

考查一阶线性自回归模型---LAR(1):

x t=αx t-1+e t, t=1,2,…(1.1)

其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到

x t=αx t-1+e t

= e t + αx t-1

= e t + α{ e t-1 + αx t-2}

= e t + αe t-1 + α2 x t-2

=…

= e t + αe t-1 + α2e t-2

+…+ αn-1e t-n+1 +αn x t-n. (1.2)

如果当n→∞时,

{e t +αe t-1+α2e t-2+…+αn-1e t-n+1}

→ ∑j=0∞ αj e t-j . (1.4)

虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为

x t =∑j=0∞ αj e t-j . (1.5)

通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p 阶线性自回归模型LAR(p):

x t =α1x t-1+α2x t-2+...+αp x t-p +e t ,

t=1,2,… (1.6)

其中{e t }为i.i.d.序列,且Ee t =0, Ee t =σ2<∞, 而且e t 与{x t-1, x t-1,…}独立.虽然反复使用(1.6)式的递推式, 仍然可得到(1.2)式的类似结果, 但是,用扩张后的一阶多元AR 模型求解时, 可显示出与LAR(1)模型求解的神奇的相似. 为此记

X t

=

?

?????

? ?

?+--1

1

p t t t

x x x , U=??????? ??001 , A=

????

??

?

?

?0000012

1 p

αα

α, (1.7)

于是(1.6)式可写成如下的等价形式:

X t =A X t-1+ e t U. (1.8)

反复使用此式的递推关系, 形式上仿照(1.2)式可得

X t =AX t-1+e t U

=?

=e t U+e t-1AU+e t-2A2U+…

+e t-n+1A n-1U+A n x t-n.

如果矩阵A的谱半径(A的特征值的最大模)λ(A), 满足如下条件

λ(A)<1, (1.10)

由上式可猜想到(1.8)式有如下的解:

X t=∑k=0∞A k Ue t-k. (1.11)

其中向量X t的第一分量x t形成的序列{x t}, 就是模型(1.6)式的解. 由此不难看出, 它有以下表达方式

x t=∑k=0∞?k e t-k. (1.11)

其中系数?k由(1.6)式中的α1,α2, ... ,αp确定, 细节从略. 不过, (1.11)式给了我们重要启发, 即考虑形如

x t=∑k=0∞ψk e t-k, ∑k=0∞ψk2<∞, (1.12)

的时间序列类(其中系数ψk能保证(1.12)式中的x t有定义). 在文献中, 这样的序列{x t}就被称为线性时间序列.

虽然以上给出了线性时间序列的定义, 以下暂时不讨论什么是非线性时间序列, 代之先讨论一阶非线性自回归模型---NLAR(1), 以便与LAR(1)模型进行比较分析. 首先写出NLAR(1)模型如下

x t=?(x t-1)+e t,t=1,2,…(1.13)

其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-2,…}独立, 这些假定与LAR(1)模型相同, 但是, ?(x t-1)不再是x t-1的线性函数, 代之为非线性函数, 比如

?(x t-1)=x t-1/{a+bx t-12}.

此时虽然仍可反复使用(1.13)式进行迭代, 但是所得结果是

x t=? (x t-1) +e t

= e t+ ? (x t-1)

= e t+ ? ( e t-1+ ? (x t-2))

= e t+ ? ( e t-1+ ? ( e t-2+ ? (x t-3)))

=…

=e t+? ( e t-1+ ? ( e t-2+ …+? (x t-n))…).

(1.14)

根据此式, 我们既不能轻易判断?(x t-1)函数满足怎样的条件时, 上式会有极限, 也不能

对于p 阶非线性自回归模型

x t =?(x t-1,x t-2,…,x t-p )+e t ,

t=1,2,… (1.15)

仿照(1.6)至(1.9)式的扩张的方法, 我们引入如下记号

Φ( x t-1,x t-2,…,x t-p

)≡??????

?

?

?+-----1

121

,...,,(p t t p

t t t x x x x x ?, (1.16)

我们得到与(1.15)式等价的模型

X t =Φ(X t-1) +e t U, t=1,2,… (1.17)

但是, 我们再也得不出(1.9)至(1.14)式的结果,

至此我们已将看出, 从线性到非线性自回归模型有实质性差异, 要说清楚它

们, 并不是很简单的事情. 从数学角度而言, 讨论线性自回归模型可借用泛函分析方法, 然而, 讨论非线性自回归模型, 则要借用马尔可夫链的理论和方法. 这也正是本讲座要介绍的主要内容.

2. 线性时间序列定义的多样性

现在简单叙述一下非线性时间序列定义的复杂性, 它与线性时间序列的定义有关. 前一小节中(1.12)式所显示的线性时间序列, 只是一种定义方式. 如果改变对系数ψk 的限制条件, 就会给出不同的定义. 更为重要的是, 在近代研究中, 将(1.12)式中的i.i.d.序列{e t }放宽为平稳鞅差序列, 这在预报理论中很有意义.

无论引用哪一种线性时间序列定义, 都对相应的序列的性质有所研究, 因为其

研究成果可用于有关的线性时间序列模型解的特性研究. 事实上, 已经有丰富的成果被载入文献史册.

依上所述可知, 由于线性时间序列定义的多样性, 必然带来非线性时间序列定义的复杂性. 这里需要强调指的是, 对于非线性时间序列, 几乎没有文章研究它们的一般性质, 这与线性时间序列情况不同. 于是人们要问, 我们用哪些工具来研究非线性时间序列模型解的特性呢? 这正是本次演讲要回答的问题. 确切地说, 我们将介绍马尔可夫链, 并借助于此来讨论非线性自回归模型解的问题.

第二章. 非线性时间序列模型 1. 概论

有无穷多个自由参数,这对统计不方便,因此人们更关心只依赖有限个自由参数的线性时间序列,这就是线性时间序列的参数模型. 其中最常用的如ARMA模型. 对于非线性时间序列而言, 使用参数模型方法几乎是唯一的选择. 由于非线性函数的多样性, 带来了非线性时间序列模型的多样性. 但是, 迄今为止被研究得较多, 又有应用价值的非线性时序模型, 为数极少, 而且主要是针对非线性自回归模型. 在介绍此类模型之前, 我们先对非线性时序模型的分类作一概述.

通用假定: {εt}为i.i.d.序列,且Eεt=0, 而且εt与{x t-1, x t-2,…}独立.

可加噪声模型:

x t=?(x t-1,x t-2,…)+εt,

t=1,2,…(2.1)

其中?(…)是自回归函数. 当它仅依赖于有限个未知参数时, 记此参数向量为α, 其相应的(2.1)模型常写成

x t=?(x t-1,x t-2,…;α)+εt,

t=1,2,…(2.2)

否则, 称(2.1)式称为非参数模型.

关于(2.1)(2.2)的模型的平稳性, 要在下一章讨论, 但是, 它有类似于线性AR模型的几个简单性质, 是重要的而且容易获得的, 它们是:

E(x t|x t-1,x t-2,…)

=E{?(x t-1,x t-2,…)+εt|x t-1,x t-2,…}

=?(x t-1,x t-2,…)+E(εt|x t-1,x t-2,…)

=?(x t-1,x t-2,…) (2.3)

var{x t|x t-1, x t-2 , …}

≡E{[x t-?(x t-1,…)]2|x t-1, x t-2 , …}

= E{εt2|x t-1, x t-2 , …}

= Eεt2

=σ2. (2.4)

P{x t

= P{?(x t-1,…)+εt

= P{εt

=Fε(x-?(x t-1,…)). (2.5)

其中Fε是εt的分布函数.

带条件异方差的模型:

x t=?(x t-1,x t-2,…)

+S(x t-1,x t-2,…)εt,

其中?(…)和S(…)也有限参数与非参数型之分, 这都是不言自明的. 另外, (2.6)式显然不属于可加噪声模型. 但是, 它比下面的更一般的非可加噪声模型要简单得多. 这可通过推广(2.3)(2.4)(2.5)式看出, 即有,

E(x t|x t-1,x t-2,…)

=E{?(x t-1,x t-2,…)

+S(x t-1,x t-2,…)εt|x t-1,x t-2,…}

=?(x t-1,x t-2,…)

+S(x t-1,x t-2,…)E{εt|x t-1,x t-2,…}

=?(x t-1,x t-2,…) . (2.3)’

var{x t|x t-1, x t-2 , …}

≡E{[x t-?(x t-1,…)]2|x t-1, x t-2 , …}

=E{S2(x t-1,x t-2,…)εt2|x t-1, x t-2 , …}

=S2(x t-1,x t-2,…)E{εt2|x t-1, x t-2 , …}

=S2(x t-1,x t-2,…)σ2. (2.4)’

P{x t

=P{?(x t-1,…)

+S(x t-1,…)εt

= P{εt<[x-?(x t-1,…)]/S(x t-1,…)}

=Fε([x-?(x t-1,…)]/S(x t-1,…)). (2.5)’

一般非线性时序模型:

x t=ψ(x t-1,x t-2,…; εt, εt-1,…)

t=1,2,…(2.7)

其中ψ(…)也有参数与非参数型之区别, 这也是不言自明的. 显然, (2.7)式既不是可加噪声模型, 也不属于(2.6)式的带条件异方差的模型. 虽然, 它可能具有条件异方差性质. 相反, 后两者都是(2.7)式的特殊类型. 虽说(2.7)式是更广的模型形式, 在文献中却很少被研究. 只有双线性模型作为它的一种特殊情况, 在文献中有些应用和研究结果出现. 现写出其模型于后, 可供理解其双线性模型的含义

x t=∑j=1pαj x t-j+∑j=1qβjεt-j

+∑i=1P∑j=1Qθijεt-i x t-j.

2. 非线性自回归模型

在前一小节中的(2.1)和(2.2)式就是非线性自回归模型, 而且属于可加噪声模型类. 在这一小节里, 我们将介绍几种(2.2)式的常见的模型.

函数后的线性自回归模型:

f(x t)=α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p)+εt,

t=1,2,…(2.8)

其中f(.)是一元函数, 它有已知和未知的不同情况, 不过总考虑单调增函数的情况, α=(α1,α2,…,αp )τ是未知参数. 在实际应用中, {x t }是可获得量测的序列.

当f(.)是已知函数时, {f(x t )}也是可获得量测的序列, 于是只需考虑y t =f(x t )所满足的线性AR 模型

y t =α1y t-1+α2y t-2+...+αp y t-p +εt ,

t=1,2,… (2.9)

此时可不涉及非线性自回归模型概念. 在宏观计量经济分析中, 常常对原始数据先取对数后, 再作线性自回归模型统计分析, 就属于此种情况. 这种先取对数的方法, 不仅简单, 而且有经济背景的合理解释,它反应了经济增长幅度的量化规律. 虽然在统计学中还有更多的变换可使用, 比如Box-Cox 变换, 但是, 由于缺少经济背景的合理解释, 很少被使用. 由此看来, 当f(.)有实际背景依据时, 可以考虑使用(2.7)式的模型.

当f(.)是未知函数时, {f(x t )}不是可量测的序列, 于是只能考虑(2.8)模型. 注意f(.)是单调函数, 可记它的逆变换函数为f -1(.), 于是由(2.8)模型可得

x t = f -1(α1f(x t-1)+α2f(x t-2)+...

+αp f(x t-p )+εt ),

t=1,2,… (2.9)’

此式属于(2.7)式的特殊情况, 此类模型很少被使用. 取而代之是考虑如下的模型

x t =α1f(x t-1)+α2f(x t-2)+...+αp f(x t-p )+εt ,

t=1,2,… (2.10)

其中f(.)是一元函数, 也有已知和未知之分, 可不限于单调增函数. 此式属于(2.1)式的特殊情况, 有一定的使用价值.

当(2.10)式中的f(.)函数是已知时, 此式还有更进一步的推广模型,

x t =α1f 1(x t-1,…,x t-s )+α2f 2(x t-1,…,x t-s )

+...+αp f p (x t-1,…,x t-s )+εt ,

t=1,2,… (2.11)

其中f k (…)(k=1,2,…,p)是已知的s 元函数. 例如, 以后将要多次提到的如下的模型:

x t =α1I(x t-1<0)x t-1+α2I(x t-1≥0)x t-1+εt ,

t=1,2,… (2.12)

其中I(.)是示性函数. 此模型是分段线性的, 是著名的TAR 模型的特殊情况. 为了有助于理解它, 我们写出它的分段形式:

x t

=.

0,

0,,1

1

1

?++t

x x x x ε

αεα t=1,2,…

请注意, (2.8)(2.10)和(2.11)式具有一个共同的特征, 就是未知参数都以线性形式出现在模型中. 这一特点在统计建模时带来极大的方便. 此类模型便于实际应用. 但是, 对于{x t }而言不具有线性特性, 所以, 讨论它们的平稳解的问题, 讨论它们的建模理论依据问题,都需要借助于马尔可夫链的工具.

已知非线性自回归函数的模型: x t =?(x t-1,x t-2,…,x t-p ;α)+εt ,

t=1,2,… (2.13)

其中?(…)是p 元已知函数, 但是其中含有未知参数α=(α1,α2,…,αp )τ.一般说来, α在一定范围内取值.

例如,

x t

=t

t t x

x εαα++--2

1

21

1

1,

t=1,2,…

其中α=(α1,α2)τ是未知参数, 它们的取值范围是: -∞<α<∞, 0≤α<∞.

这里需要指出, 使用上式的模型, 不仅要借助于马尔可夫链的工具, 而且在统计建模时遇到两种麻烦, 其一是参数估计的计算麻烦, 二是确定?(…)函数的麻烦. 一般来说, 只有根据应用背景能确定?(…)函数时, 才会考虑使用此类模型.

广义线性模型(神经网络模型): x t =?(α1x t-1+α2x t-2+…+αp x t-p )+εt ,

t=1,2,… (2.14)

其中?(.)是一元已知或未知函数, 参数α=(α1,α2,…,αp )τ总是未知的. 为保证模型的唯一确定性, 或者说是可识别性, 要对α作些约定, 其一, ||α||=1, 其二, α=(α1,α2,…,αp )τ中第一个非零分量为正的. 不难理解, 若不加这两条约定, 模型(2.14)不能被唯一确定.

当?(.)是一元已知函数时, 与神经网络模型相通.

当?(.)是一元未知函数时, 与回归模型中的PP 方法相通.

除了以上两类模型外, 还有(2.1)式的非参数自回归模型, 以及从统计学中引入

的半参数自回归模型. 对它们的统计建模更困难. 本讲座主旨在于介绍如何用马尔可夫链的工具, 描述非线性自回归模型的基本特性问题, 对这类模型不再仔细讨论.

3. 带条件异方差的自回归模型

在第一小节中的(2.6)式就是带条件异方差的自回归模型. 在这一小节里, 我们将介绍几种(2.2)式的常见参数模型.

参数型条件异方差的自回归模型:

x t =?(x t-1,x t-2,…,x t-p )

t=1,2,… (2.15)

其中?(…)是p 元函数, S(…)是q 元函数. 它们也有限参数型和非参数型之分别, 这里不在赘述. 有两点必须指出: 为了保证(2.15)式中的?(…)和S(…)被唯一确定, 还要限定E εt 2=1; 另外, 在根据数据为(2.15)式建模时, 需要对?(…)和S(…)都作估计.

x t =?(x t-1,x t-2,…,x t-p )

+{α0+α1x t-12+…+αp x t-p 2}1/2εt , =?(x t-1,x t-2,…,x t-p )

+S(x t-1,x t-2,…,x t-q )εt ,

t=1,2,… (2.16) 其中

S 2(x t-1,x t-2,…,x t-q )=

{α0+α1x t-12+…+αp x t-p 2}. (2.17)

我们将看到, 带异方差ARCH 模型的自回归模型. 它们都可以借助于马尔可夫链的工具加以研究, 但是, 对于推广后的GARCH 模型, 还会遇到某些麻烦.此为后话.

现在, 让我们再回顾一下(2.12)式的原始的一般形式:

x t

=???≥++++<++++------,

,...,, (2212120111)

11

1c x x x c x x x d

t t p t p t d

t t

p

t p

t εαααεααα t=1,2,… (2.18)

其中{ε1t }和{ε2t }为相互独立的i.i.d.序列, 且ε1t ~N(0,σ12), ε2t ~N(0,σ22),此外, 在(2.18)式中, d ≥1可能是未知的, c 被称为门限值, 一般也是未知的, 这些未知信息都会带来统计的麻烦. 现在我们关心它的类型问题. 为此先改写它的形式如下: x t =

{α10+α11x t-1+…+α1p x t-p +ε1t }I(x t-d

={α10+α11x t-1+…+α1p x t-p }I(x t-d

+{α20+α21x t-1+…+α2q x t-q }{I(x t-d ≥c) +{ε1t I(x t-d

(2.19)

对此模型计算x t 的条件均值和方差,即(2.1)(2.2)式, 并不难, 其条件均值是:

E{x t |x t-1,x t-2,…}

={α10+α11x t-1+…+α1p x t-p }I(x t-d

但是, 条件方差有异样, 我们只给出它的计算过程如下:

var{x t|x t-1,x t-2,…} (用前一式)

=E{[ε1t I(x t-d

=E{ε1t2I(x t-d

+E{ε2t2I(x t-d≥c)|x t-1,x t-2,…}

+2E{[ε1tε2t I(x t-d

= I(x t-d

+I(x t-d≥c)E{ε2t2|x t-1,x t-2,…}

+2I(x t-d

=σ12I(x t-d

+2I(x t-d

≡S(x t-d).

据此可见, (2.19)式不能写成(2.6)式的条件异方差模型, 虽然它的条件方差不是常数!进而, x t的条件分布要比(2.3)式更复杂, 不仿一试.

由此可见, 当{ε1t}={ε2t}={εt}时, 上式变成

x t={α10+α11x t-1+…+α1p x t-p}I(x t-d

+{α20+α21x t-1+…+α2q x t-q}I(x t-d≥c)

+εt ,

={α10+α11x t-1+…+α1p x t-p}+

{(α20+α21x t-1+…+α2q x t-q)-

(α10+α11x t-1+…+α1p x t-p)}I(x t-d≥c)

+εt , (2.20)

此式表明, 它属于函数后的线性自回归模型. 由(2.20)式不难写出(2.11)式中的f k(.)函数(k=1,2,…,p), 注意它们都不是连续函数. 但是, 在实际应用中发现, (2.19)式中的两个残差项很少相同. 在此情况下, (2.19)式属于上述提到的哪一类呢? 易见, 它有条件异方差特性, 但是, 它又不像(2.15)或(2.16)式的任何一类. 事实上它属于下面的多噪声驱动的性自回归模型.

多噪声驱动的自回归模型:

x t=?(x t-1,x t-2,…,x t-p)

+S1(x t-1,x t-2,…,x t-q)ε1t

+ S2(x t-1,x t-2,…,x t-q)ε2t,

t=1,2,…(2.21)

其中{ε1t}和{ε2t}为相互独立的i.i.d.序列, Eε1t=Eε1t=0, Eε1t2=σ12, Eε2t2=σ22. 为了统计建模方便, 常假定它们有正态分布. 读者不难看出(2.19)式中的?(x t-1,x t-2,…,x t-p), S1(x t-1,x t-2,…,x t-q)和S2(x t-1,x t-2,…,x t-q)的具体表达式.

仿照对(2.19)式的条件均值和方差的讨论, 不难讨论(2.21)式的条件均值和方差, 不仿一试.

虽然还可写出比(2.21)式更广的形式, 那不是我们所关心的内容. 这里顺便指出,称{ε1t}和{ε2t}为驱动噪声, 它们都是白噪声序列, 而且是不可观测的. 因此, 这样的模型可称为自激系统. 此类模型亦可借助于马尔可夫链的工具加以研究.

(总结两要点: 非线性的复杂性与实用性)

4. 两种可逆性

(1). 对严平稳序列{x t }而言, 称它对新息序列{e t } (e t 定义见(2.2)式)是可逆的,

如果

F t x =F t e , 对每个t 成立, (2.22)

其中F t x 和F t e 的定义:

F t x =σ{x s ; s ≤t}, F t e =σ{e s ; s ≤t},

显然, x t ∈F t e .

(2). 平稳序列{x t }对时间是可逆的, 如果{x t }与{x -t }有相同概率分布结构。例如, (x 3, x 5, x 9) 和 (x -3, x -5, x -9) 的分布相同。

(3). 以上两种可逆性概念, 有着本质区别, 现在先指出:

若{e t }为i.i.d.序列, 则它具有以上两种可逆性。

如果{x t }为正态平稳序列, 它具有两种可逆性, 但不是显而易见的. (4). 正反向模型的差异

具有第二种是时间倒向可逆性时, 此平稳序列的正向与倒向的概率结构是一样的。不言而喻,具有这种可逆性的平稳序列不是普遍存在的。人们自然要问, 不具有这种可逆性的平稳序列,其正向与倒向的概率结构是怎样的呢?它们有什么联系呢?这些内容可有使用价值吗?这些也正是我们所共同面对的问题。目前尚无答案, 甚至于还未被较多的人所意识到。从宏观上看,自然界的现象都不是严格可逆的, 所以, 对它们的观测数据序列也不会具有倒向的可逆性。严格地说,也很难具有平稳性。从统计学观点看,对以上问题都有兴趣, 所取得的有价值的结论, 都有可能为统计学提供新的理论和方法, 用于对观测数据序列的分析,以揭示自然界现象所具有的更深奥的属性。在此,我们仅考查几个简单例子,或许能给我们某些启示。

例1. 考查如下的模型:

x t =0.5x t-1+e t , (2.23)

其中{e t }为i.i.d. 的二项分布序列,并且P(e t =0) =P(e t =0.5)=1/2. 这几乎是不能再简单的线性自回归模型了。按照(1.10)式可知它有平稳解, 而且被表达为

x t =∑k=0∞0.5k e t-k . (2.24)

注意, 在上式中的e t , 并不是零均值的, 这并非本质, 我们只是提醒一下。

你能想象到此平稳序列{x t }的倒向概率结构是怎样的吗?很容易验证,它们是: x -t =f (x -t+1), (2.25) 其中

f (x )=???≤≤-<≤,

12/1,12,2/10,

2x if x x if x

注意, {x t }的倒向结构是纯确定性的! 全无随机性! 易见f (x )可写作

f (x )=2x mod(1). (2.26)

再记y t =x -t , 依(5.22)式知: y t =f (y t-1). 由此 看来我们可以考虑如下的迭代系统:

??

?∈==-],

1,0[,...

2,1),1mod(20

1y t y y t t

(2.27)

由此式和任给的初始y 0, 就唯一确定了全序列{y k : k=0,1,2,…}. 如前一样, 我们也问它的倒向结构是怎样的呢?此时回答这一问题,不如前面那样简单。因为, 当已知y t 时, 并不能知道y t-1取何值。 由(2.26)式知, f (x )不是一对一的变换。 又易见, 此时y t-1有两个可能的取值都对应着同一y t . 如果我们考虑一个二项分布的随机变量e t , 并用它的试验结果来决定y t-1取哪个值, 我们岂不是得到了与(2.23)式相似的模型吗? 即

y t-1=0.5y t +εt , (2.28)

其中{εt }为i.i.d.的二项分布序列,并且P(e t =0) =p, P(e t =0.5)=1-p.只有当p=1/2时, 模型(2.28)式才与(2.24)式相一致。于是人们会发问: 序列{ y k : k=0,1,2,…}的反向结构能唯一确定吗?回答是肯定的, 至少对上述情况是如此。 回答这一问题, 要涉及非线性变换的不变测度(或分布)。 考虑

??

?=(.),

~),

(x

F x x f y (2.29)

其中F x (.)是[0,1]上的概率分布(也是测度)。 对每个分布F x (.), 由(2.28)式都确定一个y =f (x )的分布F y (.)。 当F y (.)=F x (.)时, 称这样的分布为不变分布。 这样的分布不一定是唯一的。 关于此类分布的存在性, 唯一性等问题, 是泛函分析讨论的内容。 这里只提一个与本文有关的结果,即y =f (x )的不变分布中, 与勒贝格测度绝对连续的只有一个。 对(2.28)式而言, 这样的不变分布恰是[0,1]上的均匀分布。不难看出, 只有在(2.28)式中取p=1/2时, 其不变分布才是[0,1]上的均匀分布。这样就可以在多个反向模型中, 确定唯一的特殊者, 它在理论和应用中都具有特殊地位。

y n+1=f(y n ) , n=1, 2, ... (2.29)’

y 0€D=(0, 1)

f(y) = 2y, 当0

y

y n

最后, 我们总结以上结果如下:

满足(2.23)式的{x t }序列是:

向前看(正向) 向后看(倒向)

随机的数序列 ---- 确定性的数序列

线性随机模型 ---- 非线性确定差分方程 不可确切预报 ---- 可确切预报

以上的例子并不少见,再看一个。

以上考虑的模型, 都是取值有界的, 下面考虑一个无界的例子。为了叙述方便, 我们仅限于离散取值的情况。 相应的连续的例子可在安和陈的书(1998)中找到。

例2. (3X+1问题)。 考虑如下迭代系统:

x t

=,

,

,

2,131

11

1

是奇数是偶数----??

?÷+t t t t x x x x

x 0∈{1,2,…}, t=1,2,… (2.30)

注意, 上式中的{x t : t=0,1,2,…}是只取正整数的序列。显然, 这样的序列被x 0的取值唯一确定。当然, 我们还是要问它的反向结构是什么? 在讨论此问题之前, 先看一看它的正向序列的结构是什么, 这可能更有意思。大约在七十多年前, 多位学者猜想: 无论x 0取何正整数值, 由(2.30)式迭代得到的序列{x t : t=0,1,2,…},其中总包含1, 从而也包含4和2. 换句话说, (2.30)式迭代系统只有一个极限环{1,4,2}, 而且无发散现象。 迄今为止, 对此猜想无任何实质性的研究成果。 或许人们更想知道它的反向序列的结构是什么。 事实上, 容易验明其反向序列满足以下非可加噪声的非线性自回归模型: 记y t =x -t , 则有

y t =ψ(y t-1, εt ), (2.31)

其中{εt }为i.i.d.序列, 分布为:P(εt =0)=p, P(εt =1)=1-p, (0

ψ(y , ε)={ε(y -1)/3+2(1-ε)y }I(y mod(6)=4)

+2y I(y mod(6)≠4).

容易验证, 由(2.31)式迭代得到的序列{y t : t=0,1,2,…}, 是一个发散的马氏链, 或者说,

(展望: 正反向统计分析的理论方法)

5. 时间序列与伪随机数

(1). 三种序列类型

据以上论述, 有分布规律的数据序列, 可有下面三种情类型:

(i)双向随机;

(ii)双向确定;

(iii)单双随机且向确定.

(2). 乘同余法的美中不足以(2.26)为例, 由它生成的数据序列

X0, X1, X2, …, X n

此序列实际上被X0€D=(0, 1)唯一确定. 它的统计特征被它的经验分布所描述,即

F n(x)=(1/n) ∑k=1n I(X k

人们关心F n(x)的极限性质. 希望它收敛到(2.26)式的不变分布----(0,1)上的均匀分布---U(x). 很遗憾, 此要求并不是总能被满足. 具体情况如下:

当X0€N0, F n(x)不收敛;

当X0€N1, F n(x)收敛, 但是, 极限并非U(x);

当X0€N2, F n(x) 收敛于U(x);

不过, N0, N1, N2的Lebesgue测度分别为

μ( N0)=μ( N1)=0, μ( N2)=1.

但是, 所有的有理数都在N1中! 此外还有几个有趣的事实:

(i). 在N0, N1中举例,十分容易;

(ii). 在N2中举例,十分困难,类似寻于找一个哈密尔顿图;

(iii). 根据以上结果:μ( N2)=1,易见,如果x €N2则x的尾部中的各数码出现的概率相等;

(iv). 举一x €N1,且尾部中的各数码出现的概率相等,十分容易;

(v). 若问任何0

(vi). 在模拟应用中, 有不足之时.

(3). 一种新的伪随机数生成法

在(2.29)式中, 取

f(X n+1)=(3/2)X n+(1/4), 当0≤X n<1/2;

=(1/2)X n–(1/4), 当1/2

(2.32)

用(2.32)式生成的伪随机数列: X0, X1,…, X n, 对每个X0€D=(0, 1), 都有

lim n→∞F n(x)=F(x),

其中F(x)是不变分布:

换句话说, 此时的N0=N1=空集! (证明可见书P272)

(展望新方法)

第三章.马尔可夫链

---描述AR模型的特性

1.马尔可夫链

时间序列{x t; t=1,2,…}, 其实就是一个随机变量序列, 也简称随机序列. 与随机过程{x(t); t=∈(0,∞)}相比, 它只在离散时间处取随机变量值的过程, 故此得名. 随机过程的类型很多, 研究的方法很多, 取得的成果也很多. 其中最重要的是马尔可夫过程, 当它是随机序列时, 就称为马尔可夫链. 初次接触此类过程时, 为了便于理解其本质特征, 先了解马尔可夫链为宜, 即{x t; t=1,2,…}为一马尔可夫链. 为了更易于理解实质性概念, 又不妨考虑x t只取两个可能值的最简单情况. 以下就从一个示意性的例子说起.

一个例子: 甲乙二人进行赌博, 每局分主(庄家)客方, 第一局的主客方由二人协商确定, 以后个局, 由前一局的取胜者担任(每局必分胜负)主方. 记x t=1表示在第t局时由甲任主方; x t=2表示在第t局时由乙任主方. 于是{x1, x2, …}就是一个时间序列. 虽然它们只取1和2两个可能值, 但是不能预先知道它们的确切取值, 所以这是一个随机序列.

我们先用直观分析方法考查此例的特征. 如果此赌博含有技巧因素, 那么他们坐庄的多少与他们的水平有关. 以t表示当前局, 那末, x t的取值已定. 比如x t=1时, 意味着甲坐庄, 此时不能预知x t+1=1还是2. 如果x t+1=1意味着甲继续坐庄, 如果x t+1=2意味着甲丢掉庄家. 虽然我们不能预知x t+1的取值, 但是我们关心甲有多大把握继续坐庄. 重复上面的叙述, 当x t=2时, 我们关心甲有多大把握上庄.在以上分析中, 我们忽略了x1, x2, …, x t-1的已知取值信息, 在已知x1,

x2, …, x t-1 , x t时, 回答前面所关心的两个问题, 只与x t的取值有关. 这一特征是被马尔可夫首先注意到, 并将此类随机过程定名为马尔可夫过程. 当此过程为序列时, 称为马尔可夫链.

现在将以上的问题和马尔可夫特性给出概率论描述如下:

P(x t+1=1?x t=1)=? P(x t+1=1?x t=2)=?

P(x t+1=1?x t, x t-1, …, x1)=P(x t+1=1?x t),

基于这几个启发性的记号, 我们给出此例子全部概率论描述如下:

P(x t+1=k?x t=j, x t-1=j t-1, …, x1=j1)

=P(x t+1=k?x t=j), (3.1)

如果在上式中的P(x t+1=k?x t=j)与t无关(详见后文), 可记

P(x t+1=k?x t=j)=p jk, j, k=1,2. (3.2)

称p jk为从状态j向状态k的转移概率. 注意, 此时只有两个可能状态(对应于x t=1或2), 于是易见

p j1+ p j2=1, 即p j2=1- p j1,

对于j=1和2成立. (3.3)

再将这些记号概括到如下的矩阵中, 即

P=,1122

21

1211

??

? ??--=??? ??q q p p p p

p p (3.4)

称P 称为马尔可夫链{x t }的一步转移概率矩阵, 也简称为转移矩阵. 又因(3.3)式成立, 故可简化记为p 11=p, p 22=q, 这非关紧要, 不过, p 11恰好表示甲继续坐庄的概率(相当于把握的大小), p 22恰好表示甲继续不坐庄的概率. 经马尔可夫和后来人的不断研究表明, 在以上例子中, 转移矩阵P 能刻画出马尔可夫链{x t }的全部概率特征. 这一断言不仅对此例成立, 对更广泛的马尔可夫过程也适用. 回顾前文曾言道, 在随机过程中最重要的一类是马尔可夫过程. 其内容丰富可想而知. 在本讲义中, 我们只想利用马尔可夫链的概率工具, 希望尽可能少地涉及马尔可夫过程的深层理论知识. 为此, 我们将马尔可夫过程理论分为的四大类, 概括在如下的一拦表中, 据此可明确我们将关心哪一类. 当然, 我们也只关心此类中的局部内容(见后文便知). 为列此表, 只须知道, 在马尔可夫过程{x t }, 时间t 有连续和离散之区分; x t 的取值(又称为状态)也有连续和离散之区分. 在上述例子中, 就是离散型, 而且是两状态的, 这是有限状态马尔可夫链的最简单的情况. 有了这点预备知识就可列出下表:

马尔可夫过程分类表

有趣的是, 此表中的四部分的研究历程不同, 其先后次序是

离散状态马尔可夫链

→马尔可夫过程

→马尔可夫跳过程

→连续状态马尔可夫链(1975年)

我们关心的连续状态马尔可夫链, 是较近代的内容. 此内容恰好是近代非时间序列分析盼望已久的理论基础. 在以下的各节中, 我们将只介绍连续状态马尔可夫链的定义和特性, 对其它部分将不涉及.

连续状态马尔可夫链的定义: 若随机

序列{x t; t=1,2,…}具有以下性质, 则称它为连续状态马尔可夫链,

P(x t+1

=P(x t+1

上式表明: 在给定x t, x t-1, …, x1时, x t+1的条件分布, 与给定x t时x t+1的条件分布相等. 此条件分布可记为F t+1(x|x t), 在给定x t时, F t+1(x|x t)是一个分布函数; 不过, 它会随着x t的取值不同而不同.

注意, 若序列{x t}是满足(3.5)式的马尔可夫链, 而且E|x t|存在, 那么,

E{x t+1?x t, x t-1, …, x1}

=?x d P(x t+1

=?x d P(x t+1

= ?x d F t+1(x?x t)

= E{x t+1?x t }.

此式很像AR(1)模型的性质, 但是, (3.5)式与上式并无次序关系, 而且, 也不能简单地推广到AR(P)的情况.

在非线性时间序列模型讨论中, 还须要用到多元马尔可夫链, 即{X t}中的X t=( X t1, X t2,…, X tm)τ是随机向量. 以上定义不难推广到向量的情况.

向量马尔可夫链的定义: 若随机序列

{X t; t=1,2,…}具有以下性质, X t=( X t1, X t2,…, X tm)τ是随机向量, 而且

P(X t+1∈A ?X t, X t-1, …, X1)

=P(X t+1∈A ?X t). (3.6)

在(3.6)式中的A, 是m维欧氏空间的可测集合.

其实, 向量马尔可夫链的定义蕴涵了马尔可夫链的定义, 我们分先后介绍, 只是为了便于理解. 在后文中不再区分向量与非向量,一律用马尔可夫链称之, 它们的维数会不言自明的. 有了上述定义, 我们的目的是介绍马尔可夫链的平稳性条件的定理, 为达到此目标, 还有几个概念不可缺少. 这里还要指出, 在上面的定义和即将叙述的概念中, 严格地说,都要用到测度论的术语, 而我们回避了它们, 因为我们只是为了使用这

回归模型的平稳性等问题.

齐时马尔可夫链: 如果马尔可夫链{x t}(一元的或多元的)满足

P(x, A)=P(x t+1∈A?x t=x),

k=1,2,…(3.7)

与时刻t无关, 称{x t}为齐时马尔可夫链.

再记

P k(x, A)=P(x t+k∈A?x t=x),

k=1,2,…(3.8)

表示在当前时刻t处在x t=x, 经过k步后的x t+k落入A的概率, 简称为k步转移概率. 显然, 依(3.7)式知

P1(x, A)=P(x t+1∈A?x t=x)= P(x, A).

又易见

P2(x, A)=P(x2∈A?x0=x)

=?P(y, A)P(x, dy). (3.9)

此式表明, 两步转移概率P2(x, A), 可写成从x0=x先用一步转移到y, 再从x1=y转移到A 的概率的平均. 其平均是指按一步转移概率分布完成, 以一元为例,

P1(x, (-∞,y))= P(x, (-∞,y)),

P(x, dy)=dP(x, (-∞,y)).

重复上面的推理可得

P k(x, A)=P(x k∈A?x0=x)

=?P k-1(y, A)P(x, dy),

k=2,3,…(3.10)

马尔可夫链的不可约性: 如果马尔可夫链{x t}满足

∑k=1∞P k(x, A)>0, (3.11)

其中x是m(≥1)维欧氏空间R m的任意一点, A是m(≥1)维欧氏空间的任意一个有正测度的可测集合, 这里的测度不妨用Lebesgue测度, 在本讲义中已是够用了.

现在对不可约概念作些直观解释. 先从(3.11)式的定义可看出, 从R m中的任何一点出发, 对任何指定的正测度集合A, 在有限步转移到A的概率是正的. 换句话说, 不存在那样的点x和正测度集合A, 从x出发永远不能达到A. 更直观解释可借助前边的例子, 考虑甲对乙, 丙对丁同来赌博, 但是只有一个台面可用, 于是, 他们先要用抽签决定哪一对先赌. 我们记x t=1表示在第t局时由甲坐庄; x t=2表示在第t局时由乙坐庄.

时间序列. 不难验证这是一个马尔可夫链. 但是, 如果x1=1或2时, 此后也只能x t=1或2, 不可能取3或4; 反之, 如果x1=3或4时, 此后也只能x t=3或4, 不可能取1或2. 这就是说, 在(3.11)式中取x=1, A={3,4}时, (3.11)式等于0值. 所以此马尔可夫链不是不可约的. 此例显然是编撰的, 通过它可说明, 对可约的马尔可夫链, 可以分解成子序列分别去研究. 也就是说, 我们应当对甲--乙和丙--丁的博弈分别进行考查, 没有必要放在一个马尔可夫链中来讨论.(书中P99.例4.1.2也是一个可约马链的例子.)

马尔可夫链的周期性: 如果存在互不相交的正测度可测集合A1,A2,…,A d, 使得如果马尔可夫链{x t}满足

P(x, A k)=1, 当x∈A k-1, k=2,3,…,d,

P(x, A1)=1, 当x∈A d.

则称{x t}为具有周期长度为d的周期马尔可夫链.

此定义表明, 周期马尔可夫链, 必然从A1转移到A2, 再从A2转移到A3, …, 最后, 又从A d转移到A1, 形成周期性的转移规律. 须注意, 从A k-1转移到A k时, 具体转移到A k中哪一点, 仍然是随机的,否则不是随机序列了. 虽然如此, 对周期马尔可夫链, 只需研究其等间隔的子链{x td}即可, 因为其它子链{x td+k}(k=1,2,…,d-1)与{x td}的概率结构相同. 所以, 我们也只需考查非周期马尔可夫链, 即d=1的情况. 对此概念不在作直观解释了. (还可参看书中P90的例4.1.5)

马尔可夫链的小集合: 对于马尔可夫链{x t}, 如果存在非空的可测集合C∈R m, 一个正整数q, 一个正常数b, 和一个概率测度ν, 使得

P q(x, A) ≥ bν(A),

对于任何x∈C, A∈R m, (3.12)

则称C是马尔可夫链{x t}的小集合.

以上小集合是一个重要的概念, 它是从一般离散状态马尔可夫链中的相应概念演化而来的. 对它要作直观解释比较困难, 也将涉及太多的其它相关知识, 这里只得放弃了. 好在, 在下一节的应用时只用此定义而已, 在很宽松的条件下, 又是通过很容易的论证, 即可得知怎样的马尔可夫链会有怎样的小集合.

马尔可夫链的平稳性: 考查齐时马尔可夫链{x t; t=0,1,2,…}. 以上叙述了它的转移概率的一些概念. 现在考虑它的分布. 首先考查x0的分布, 它是初始的随机变量, 可以有其自己的分布, 也称为此马尔可夫链的初始分布, 不妨记为F0. 欲考查x1的分布F1, 根据齐时马尔可夫链的性质和F0, 利用条件分布的公式可得

F1(x)=P(x1

=?P(y,(-∞,x))dF0(y), 当m=1时.

[其中P(x, (-∞,x))

=P(x1∈(-∞,x)?x0=y)

=F(x1

≡ F(x1

这里的y是自由变量, 此事表明, 转移概率函数F(x1

统计基础知识第五章时间序列分析习题及答案

第五章时间序列分析 一、单项选择题 1.构成时间数列的两个基本要素是( C )(2012年1月) A.主词和宾词 B.变量和次数 C.现象所属的时间及其统计指标数值 D.时间和次数 2.某地区历年出生人口数是一个( B )(2011年10月) A.时期数列 B.时点数列 C.分配数列 D.平均数数列 3.某商场销售洗衣机,2008年共销售6000台,年底库存50台,这两个指标是( C ) (2010年10) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 4.累计增长量( A ) (2010年10) A.等于逐期增长量之和 B.等于逐期增长量之积 C.等于逐期增长量之差 D.与逐期增长量没有关系 5.某企业银行存款余额4月初为80万元,5月初为150万元,6月初为210万元,7月初为160万元,则该企业第二季度的平均存款余额为( C )(2009年10) 万元万元万元万元 6.下列指标中属于时点指标的是( A ) (2009年10) A.商品库存量 B.商品销售量 C.平均每人销售额 D.商品销售额 7.时间数列中,各项指标数值可以相加的是( A ) (2009年10) A.时期数列 B.相对数时间数列 C.平均数时间数列 D.时点数列 8.时期数列中各项指标数值( A )(2009年1月) A.可以相加 B.不可以相加 C.绝大部分可以相加 D.绝大部分不可以相加 10.某校学生人数2005年比2004年增长了8%,2006年比2005年增长了15%,2007年比2006年增长了18%,则2004-2007年学生人数共增长了( D )(2008年10月) %+15%+18%%×15%×18% C.(108%+115%+118%)-1 %×115%×118%-1 二、多项选择题 1.将不同时期的发展水平加以平均而得到的平均数称为( ABD )(2012年1月) A.序时平均数 B.动态平均数 C.静态平均数 D.平均发展水平 E.一般平均数2.定基发展速度和环比发展速度的关系是( BD )(2011年10月) A.相邻两个环比发展速度之商等于相应的定基发展速度 B.环比发展速度的连乘积等于定基发展速度

非线性时间序列

近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH模型 三. 多元时间序列 四. 协整模型

非线性时间序列 第一章.非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章. 非线性时间序列模型 1. 概述 2. 非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章.马尔可夫链与AR模型 1. 马尔可夫链 2. AR模型所确定的马尔可夫链 3. 若干例子 第四章. 统计建模方法 1. 概论 2. 线性性检验 3.AR模型参数估计 4.AR模型阶数估计 第五章. 实例和展望 1. 实例 2.展望

第一章.非线性时间序列浅释 1. 从线性到非线性自回归模型 时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明. 考查一阶线性自回归模型---LAR(1): x t=αx t-1+e t, t=1,2,…(1.1) 其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到 x t=αx t-1+e t = e t + αx t-1 = e t + α{ e t-1 + αx t-2} = e t + αe t-1 + α2 x t-2 =… = e t + αe t-1 + α2e t-2

+…+ αn-1e t-n+1 +αn x t-n. (1.2) 如果当n→∞时, αn x t-n→0, (1.3) {e t+αe t-1+α2e t-2+…+αn-1e t-n+1} →∑j=0∞αj e t-j . (1.4) 虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为 x t=∑j=0∞αj e t-j . (1.5) 通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):

高边坡开挖变形的非线性时间序列预测分析

第25卷 增1 岩石力学与工程学报 V ol.25 Supp.1 2006年2月 Chinese Journal of Rock Mechanics and Engineering Feb.,2006 收稿日期:2005–11–05;修回日期:2005–12–02 基金项目:国家重点基础研究发展规划(973)项目(2002CB412707);国家自然科学基金重点项目(50539110) 作者简介:周家文(1982–),男,2003年毕业于华东交通大学建筑工程系,现为博士研究生,主要从事岩石力学方面的研究工作。E-mail :hhzjw@https://www.wendangku.net/doc/a314726227.html, 高边坡开挖变形的非线性时间序列预测分析 周家文,徐卫亚,石安池 (河海大学 岩土工程研究所,江苏 南京 210098) 摘要:在岩体高边坡开挖过程中,可以得到现场的位移监测数据,如何利用现场监测数据来预测高边坡的开挖变形是一件很有实用价值的工作。根据高边坡开挖变形时间序列的非线性特征,应用局域法对三峡高边坡的位移进行了预测分析。把局域法的思想引入到神经网络中去,按照寻找邻近点的原理构造出训练样本,通过神经网络得到的预测值与局域法得到的预测值很接近,并且可以大大地节约计算时间。计算结果表明,对于岩土体工程中的一维监测数据,通过非线性时间序列分析方法可以对其进行预测分析,该方法具有较高的实用价值。 关键词:岩石力学;开挖变形;非线性时间序列;局域法;混沌;神经网络 中图分类号:TU 457 文献标识码:A 文章编号:1000–6915(2006)增1–2795–06 APPLICATION OF NONLINEAR TIME SERIES ANALYSIS TO EXCAVATION DEFORMATION PREDICATION OF HIGH SLOPE ZHOU Jiawen ,XU Weiya ,SHI Anchi (Institute of Geotechnical Engineering ,Hohai University ,Nanjing ,Jiangsu 210098,China ) Abstract :In the course of high rock slope excavation ,the deformation data in the locale can be monitored ,and it ′s useful to predicate the excavation deformation of high slope with the monitor data. According to the nonlinear characteristics of the excavation deformation of high slope ,the displacements of the high slope of the Three Gorges are predicted by local-region method. The idea of the local-region method is introduced to the neural network ,and the training samples are formed according to the theory of finding near points. The predicated displacements by the trained neural network are very close to those by the local-region method ,and computational time is saving. The result shows that ,based on the one-dimensional monitoring data ,the displacement can be predicted by the method of nonlinear time series ,and the method has practical value. Key words :rock mechanics ;excavation deformation ;nonlinear time series ;local-region method ;chaos ;neural network 1 引 言 在岩体开挖过程中,通过对高边坡的长期监测,可以得到现场的位移监测数据,如何利用现场监测来预测高边坡的开挖变形是一件很有实用价值的工作[1]。岩石的开挖位移是一个受到多种因素影响的 复杂的非线性动力系统,如果直接通过建立开挖过程中的非线性动力学方程来进行相关分析或者是预测分析是一件很困难的事情,寻找一种可以避开上述难题来解决开挖过程中的反分析问题成了很有实际意义的研究工作。近年来,鉴于边坡变形的非线性特征和影响因素的模糊不确定性,黄志全等[2]提出了基于神经网络的边坡位移预测方法;李邵军

非线性时间序列模型的波动性建模(中)

非线性时间序列模型的波动性建模 Song-Yon Kim and Mun-Chol Kim 朝鲜平壤金日成综合大学数学学院 本文出自于2011年5日朝鲜平壤举行的第一届PUST国际会议 本版修订于2013年11月3日 摘要:在本文中的非线性时间序列模型被用来描述金融时间序列数据的波动。描述两种由波动的非线性时间序列组合成TAR(阈值自回归模型)与AARCH(非对称自回归条件异方差 模型)的误差项和参数估计的研究。 关键词:非线性时间序列模型;波动;ARCH(自回归条件异方差模型);AARCH;TAR;QMLE(拟极大似然估计) 一介绍 在金融市场中,资产价格的波动是一个极其重要的变量,其建模在投资,货币政策,金融风险管理等方面中有重要意义 在投资持有期的资产价格波动的一个很好的预测是评价投资风险的一个很好的起点。资产价格波动是金融衍生证券定价的最重要的变量。对于定价我们需要知道的波动性范围是从现在相关资产,直至期权到期。事实上,市场惯例是根据波动单位列出价格期权。如今,波动性的定义和测量可能在衍生工具合约明确规定。在这些新的合同,波动成为潜在的“资产”。波动率模型已成为一个在金融时间序列模型分析的主要对象并且使许多科学家沉浸其中。

其中σ称为波动,在上面的公式中所示,σ准确估计成为期权定价和估计的一个非常重要的问题。此外,如对关联时间t 的波动σt 的估计等问题开始提出。 1982,罗伯特恩格尔提出了一个新的模型来用一个更准确的方法[ 7 ]对波动作出估计。他重视ARCH 模型中的误差项,这是大多线性时间序列模型如AR 、ARMA 、ARIMA 等所忽略的。同时他提出一种新的非线性模型,通过相加取代简单的白噪声,误差项的条件异方差性偏差的变化自动回归。误差项的条件异方差性偏差的 自动回归 1986年,Bollerslev 将Engle 的 ARCH (q)模型修改变为GARCH (p, q) model [8]. ???? ???++==∑∑==--q i p i i t i i t i t t t t t h h d i i z h z 112021..:,βεααε 在他的论文中,他提出了GARCH (1,1)过程中的存在,静止状态和MLE (最大似然估计)。 此后,大量ARCH 模型相继被开发出来,例如ARCH-M ,IGARCH 和LogGARCH 等。 在整个研究中,波动性已被证明是更受“坏消息”,而不是“好消息”的影响,也就是说,是不对称的,这导致对非对称模型的研究。 1991年,Nelson 提出了指数GARCH 模型(EGARCH )描述了不对称冲击。[ 6 ] () ()()x E x x x g g h t t t -+=-+-+=λωεγγ11h 10 但在许多研究论文,有效的参数估计和固定的条件是没有明确解释的,而且这种困难难以克服[ 9 ]。 但在1993,Glosten 开始使用阈值自回归条件异方差(TARCH )模型和其后提出的许多非对称模型[ 2 ],试图对不对称的波动进行建模。 特别是在2003年,Wai Mi Bei 开发了非对称ARCH (q )模型[ 10 ]。 ()∑∑==---+++=q i p j j t j i t i i t i t h 1120H γεβεαα 直到现在,持续的研究正在努力拟出更好的波动模型以显示各种ARCH 模型的影响。 在本文中,利用非线性时间序列模型的波动性建模是基于对前人研究成果分析的观察而得出。

单变量非线性时间序列模型

第5章 单变量非线性时间序列模型 §1 随机波动率模型 一. 乘积过程 t t t x U m s =+ 其中t U 一个标准化过程,即()()0,1t t E U V U ==。t s 是一个正随机变量的序列。这种类型的过程称之为乘积过程。 因为()2t t t V x s s =,因此t s 是随机过程t x 的标准差。 现在看偏微分方程 ()()log dP d P dt dW P m s ==+ 其中()log t t x P =D ,()W t 为标准布朗运动。它是通常的金融资产定价的扩散过程。离散情况1dt =,所以它是一个乘积过程。 假设()t t t U x m s =-服从正态分布,且独立于t s ,则 ()()()()()2 2 2 2 2 2 t t t t t t E x E U E E U E m s s s -=== ()()()()()0 t t k t t k t t k t t k t t k E x x E U U E U E U m m s s s s -------== = 但平方误差()2 t t S x m =-却自相关: ()()()()()cov ,t t k t t t k t S S E S E S S E S --=-- ()()() ()()()()()()() 2 2 222222 22t t k t t t k t t k t t t k t E S S E S E E U U E E E s s s s s s ----=-=-=- 此时 ()()() ()()() 2 22,42 t t k t k S t t E E E E s s s r s s --= -

非线性时间序列.doc

-------------精选文档 ----------------- 近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH 模型 三. 多元时间序列 四. 协整模型

-------------精选文档 ----------------- 非线性时间序列 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章 . 非线性时间序列模型 1.概述 2.非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章 . 马尔可夫链与 AR 模型 1.马尔可夫链 2.AR 模型所确定的马尔可夫链

-------------精选文档 ----------------- 3.若干例子 第四章 . 统计建模方法 1.概论 2.线性性检验 3.AR 模型参数估计 4.AR 模型阶数估计 第五章 . 实例和展望 1.实例 2.展望 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 时间序列 {x t } 是一串随机变量序列 , 它有广泛的实际背景 , 特别是在经济与金融

-------------精选文档 ----------------- 领域中尤其显著. 关于它们的从线性与非线 性概念 , 可从以下的例子入手作一浅释的说 明. 考查一阶线性自回归模型---LAR(1): x t = x t-1 +e t ,t=1,2, (1.1) 其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-1 ,} 独立 . 反复使用 (1.1) 式的递推关系 , 就可得到 x t =x t-1 +e t =e =e =e t t t +x t-1 +{ e t-1 +x t-2 } +e t-1 + 2 x t-2

第五章 时间序列的模型识别

第五章时间序列的模型识别 前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下: 图5.1 建立时间序列模型流程图 在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。 对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。如果ACF和PACF 都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关

应用时间序列分析 第5章

佛山科学技术学院 应用时间序列分析实验报告 实验名称第五章非平稳序列的随机分析 一、上机练习 通过第4章我们学习了非平稳序列的确定性因素分解方法,但随着研究方法的深入和研究领域的拓宽,我们发现确定性因素分解方法不能很充分的提取确定性信息以及无法提供明确有效的方法判断各因素之间确切的作用关系。第5章所介绍的随机性分析方法弥补了确定性因素分解方法的不足,为我们提供了更加丰富、更加精确的时序分析工具。 5.8.1 拟合ARIMA模型 【程序】 data example5_1; input x@@; difx=dif(x); t=_n_; cards; 1.05 -0.84 -1.42 0.20 2.81 6.72 5.40 4.38 5.52 4.46 2.89 -0.43 -4.86 -8.54 -11.54 -1 6.22 -19.41 -21.61 -22.51 -23.51 -24.49 -25.54 -24.06 -23.44 -23.41 -24.17 -21.58 -19.00 -14.14 -12.69 -9.48 -10.29 -9.88 -8.33 -4.67 -2.97 -2.91 -1.86 -1.91 -0.80 ; proc gplot; plot x*t difx*t; symbol v=star c=black i=join; proc arima; identify var=x(1); estimate p=1; estimate p=1 noint; forecast lead=5id=t out=out; proc gplot data=out; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay; symbol1c=black i=none v=star; symbol2c=red i=join v=none; symbol3c=green I=join v=none;

非线性时间序列

第六章 时间序列的平滑 引论 上一章我们引进非参数函数估计的基本概念,现在将它应用到时间序列别的重要平滑问题上. 对估计慢变化时间趋势,平滑技术是有用的图示工具,它产生了时域平滑(§). 对将来事件和与之相联系的现在与过去变量之间的关系的非参数统计推断导致了§的状态域平滑. § 引入的样条方法是对§引入的局部多项式方法的有用替代. 这此方法能够容易地推广到时间序列的条件方差(波动性)的估计,甚至整个条件分布的估计,参阅§. 时域平滑 6.2.1 趋势和季节分量 分析时间序列的第一步是画数据图. 这种方法使得人们可以从视觉上检查一个时间序列是否像一个平稳随机过程. 如果观察到趋势或季节分量,在分析时间序列之前通常要将它们分离开来. 假定时间序列{}t Y 能够分解成 t t t t Y f s X =++, () 其中t f 表示慢变函数,称为“趋势分量”,t s 是周期函数,称为“季节分量”,t X 是随机分量,它被假定是零均值的平稳序列. 在使用这种分解之前,可以先用方差稳定变换或Box-Cox 变换. 这类幂变换有如下以参数λ为指标的形式 ,0,()log(),0, u g x u λλλ?≠=?=? () 或具有在0λ=点处连续的变换形式 ()(1)/g u u λλ=-. 这类变换由Box 和Cox (1964)给出. 注意,由在幂变换中数据必须是非负的,因此,在使用幂变换之前,可能必须先实施平移变换. 我们的目的是估计和提取确定性分量t f 和t s . 我们希望残差分量t X 是平稳的, 且能够用线性和非线性技术做进一步的分析. 通过推广Box 和Jenkins (1970)而发展的一个替代方法是对时间序列{}t Y 重复应用差分算子,直到被差分的序列表现为平稳为止. 这时,被差分的序列可以进一步平衡时间序列技术来处理. 作为说明Box 和Jenkins 方法的一个例子,我们先取S&P500指数的对数变换,然后计算一阶差分. 图给出了这个预处理序列. 所得序列基本上是该指数中变化的每日价格的百分比. 除了几个异常值(即1987年10月19日%的市场崩盘,金融市场称之为“黑色星期一”)外,这个序列显示出平稳性. 这个变换与金融工程中常用资产定价的几何布朗运动模型的离散化有关. 图 1972年1月3日至1999年12月31日(上图)和1999年1月4日至 1999年12月31日(下图)S&P500指数对数变换的差分

第八章 时间序列分析 思考题及练习题

第八章思考题及练习题 (一) 填空题 1、时间数列又称数列,一般由和两个基本要素构成。 2、动态数列按统计指标的表现形式可分为、和三 大类,其中最基本的时间数列是。 3、编制动态数列最基本的原则是。 4、时间数列中的四种变动(构成因素)分别是:、、、和 5、时间数列中的各项指标数值,就叫,通常用a表示。 6、平均发展水平是对时间数列的各指标求平均,反映经济现象在不同时间的平均水平或代表性水平,又称:平均数,或平均数。 7、增长量由于采用的基期不同,分为增长量和增长量,各增长量之和等于相应的增长量。 8、把报告期的发展水平除以基期的发展水平得到的相对数叫,亦称动态系数。根据采用的基期不同,它又可分为发展速度和发展速度两种。 9、平均发展速度的计算方法有法和法两种。 10、某企业2000年的粮食产量比90年增长了2倍,比95年增长了0.8倍,则95年粮食产量比90年增长了倍。 11、把增长速度和增长量结合起来而计算出来的相对指标是:。 12、由一个时期数列各逐期增长量构成的动态数列,仍属时期数列;由一个时点数列各逐期增长量构成的动态数列,属数列。 13、在时间数列的变动影响因素中,最基本、最常见的因素是,举出三种常用的测定方法、、。 14、若原动态数列为月份资料,而且现象有季节变动,使用移动平均法对之修匀时,时距宜确定为项,但所得各项移动平均数,尚需,以扶正其位置。 15、使用最小平方法配合趋势直线时,求解 a、b参数值的那两个标准方程式为。16、通常情况下,当时间数列的一级增长量大致相等时,可拟合趋势方程,而当时间数列中各二级增长量大致相等时,宜配合趋势方程。 17、用半数平均法求解直线趋势方程的参数时,先将时间数列分成的两部分,再分别计算出各部分指标平均数和的平均数,代入相应的联立方程求解即得。 18、分析和测定季节变动最常用、最简便的方法是。这种方法是通过对若干年资料的数据,求出与全数列总平均水平,然后对比得出各月份的。 19、如果时间数列中既有长期趋势又有季节变动,则应用法来计算季节比率。 20、商业周期往往经历了从萧条、复苏、繁荣再萧条、复苏、繁荣……的过程,这种变动称为变动。 (二) 单项选择题 1、组成动态数列的两个基本要素是( )。 A、时间和指标数值 B、变量和次数(频数)

第八章时间序列分析

第八章 时间序列分析 、填空题: 1. 由于决定时间数列变化的因数是多方面的,因此通常把时间数列上各期发展水平按其影 响因素的不同分解成几个不同的组成部分, 即长期趋势、 _______ 、循环波动和不规则变 动。 2?时间序列按照数列中排列指标的性质不同,可分为 __________ 、 ___ 和 _____ 。 3. “增长1%绝对值”指标其实质是 _________ 水平的1%。 4. ___ 是把原动态数列的时距扩大,再采用逐项移动的方法计算扩大了时距的序时平均数。 5. ______ 就是研究某种现象在一个相当长的时期内持续向上或向下发展变动的趋势。 6. ___ 就是指某些社会现象由于受生产条件或自然条件因素的影响, 在一年内随着季节的 更换而呈现出比较有规律的变动。 二、单项选择题: 某银行投资额 2004年比2003年增长了 10%, 2005年比2003年增长了 15% , 2005年比 2004年增长了( 销售额为( 6.时间数列的构成要素是( B 、时间和指标数值 C 、时间和次数 1. 时间序列在一年内重复出现的周期性波动称为( A 、趋势 B 、季节性 C 、周期性 D 、随机性 2. 增长一个百分点而增加的绝对数量称为( A 、环比增长率 B 、平均增长率 C 、年度化增长率 D 、增长1%绝对值 3. A 、15% - 10% B 、115% - 110% C 、(110% X 115%) +1 D 、(115%- 110%) -1 4?某种股票的价格周二上涨了 10%,周三上涨了 5%,两天累计张幅达( A 、15% B 、15.5% 4.8% 5% 5?如果某月份的商品销售额为 84万元, 该月的季节指数为 1.2,在消除季节因素后该月的 A 、60万元 B 、70万元 C 、90.8 万元 D 、100.8 万元 A 、变量和次数 D 、主词和宾词

时间序列分析第五章作业

时间序列分析第五章作业 班级:09数学与应用数学 学号: 姓名: 习题5.7 1、 根据数据,做出它的时序图及一阶差分后图形,再用ARIMA 模型模拟该序列的发展,得出 预测。根据输出的结果,我们知道此为白噪声,为非平稳序列,同时可以得出序列t x 模型 应该用随机游走模型(0,1,0)模型来模拟,模型为:,并可以预测到下一天 的收盘价为296.0898。 各代码: data example5_1; input x@@; difx=dif(x); t=_n_; cards ; 304 303 307 299 296 293 301 293 301 295 284 286 286 287 284 282 278 281 278 277 279 278 270 268 272 273 279 279 280 275 271 277 278 279 283 284 282 283 279 280 280 279 278 283 278 270 275 273 273 272 275 273 273 272 273 272 273 271 272 271 273 277 274 274 272 280 282 292 295 295 294 290 291 288 288 290 293 288 289 291 293 293 290 288 287 289 292 288 288 285 282 286 286 287 284 283 286 282 287 286 287 292 292 294 291 288 289 ; proc gplot ; plot x*t difx*t; symbol v =star c =black i =join; proc arima data =example5_1; identify Var =x(1) nlag =8 minic p = (0:5) q = (0:5); estimate p =0 q =0 noint; forecast lead =1 id =t out =results; run ; proc gplot data =results; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay ; symbol1 c =black i =none v =star; symbol2 c =red i =join v =none; symbol3 c =green i =join v =none l =32; run ; 时序图:

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 - -c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2λ=3λ=

8章 时间序列分析练习题参考答案

第八章 时间数列分析 一、单项选择题 1.时间序列与变量数列( ) A 都是根据时间顺序排列的 B 都是根据变量值大小排列的 C 前者是根据时间顺序排列的,后者是根据变量值大小排列的 D 前者是根据变量值大小排列的,后者是根据时间顺序排列的 C 2.时间序列中,数值大小与时间长短有直接关系的是( ) A 平均数时间序列 B 时期序列 C 时点序列 D 相对数时间序列 B 3.发展速度属于( ) A 比例相对数 B 比较相对数 C 动态相对数 D 强度相对数 C 4.计算发展速度的分母是( ) A 报告期水平 B 基期水平 C 实际水平 D 计划水平 B 5.某车间月初工人人数资料如下: 则该车间上半年的平均人数约为( ) A 296人 B 292人 C 295 人 D 300人 C 6.某地区某年9月末的人口数为150万人,10月末的人口数为150.2万人,该地区10月的人口平均数为( ) A 150万人 B 150.2万人 C 150.1万人 D 无法确定 C 7.由一个9项的时间序列可以计算的环比发展速度( ) A 有8个 B 有9个 C 有10个 D 有7个 A 8.采用几何平均法计算平均发展速度的依据是( ) A 各年环比发展速度之积等于总速度 B 各年环比发展速度之和等于总速度 C 各年环比增长速度之积等于总速度 D 各年环比增长速度之和等于总速度 A 9.某企业的科技投入,2010年比2005年增长了58.6%,则该企业2006—2010年间科技投入的平均发展速度为( ) A 5 %6.58 B 5%6.158 C 6 %6.58 D 6%6.158 B 10.根据牧区每个月初的牲畜存栏数计算全牧区半年的牲畜平均存栏数,采用的公式是( ) A 简单平均法 B 几何平均法 C 加权序时平均法 D 首末折半法 D 11.在测定长期趋势的方法中,可以形成数学模型的是( ) A 时距扩大法 B 移动平均法 C 最小平方法 D 季节指数法

非线性动力学——时间序列分析读书报告

非线性动力学时间序列分析读书报告 Email:dragon_hm@https://www.wendangku.net/doc/a314726227.html,

1.时间序列分析简介 用随机过程理论和数理统计学方法研究随机数据序列所遵从的统计规律,以用于解决实际问题。由于在大多数问题中,随机数据是依时间先后排成序列的,称为时间序列。它包括一般统计分析(如自相关分析、谱分析等),统计模型的建立与推断,以及关于随机序列的最优预测、控制和滤波等内容。 经典的统计分析都假定数据序列具有独立性,而时间序列分析则着重研究数据序列的相互依赖关系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程统计的一个组成部分。例如,用 x(t)表示某地区第 t月的降雨量,*x(t),t=1,2,…+是一时间序列。对t=1,2,…,T记录到逐月的降雨量数据x(1),x(2),…,x(T)称为长度为T的样本序列。依此,即可使用时间序列分析方法,对未来各月的雨量x(T+i) i=1,2,…进行预报。 时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界之目的,而且运用时间序列模型还可以预测和控制现象的未来行为。时间序列分析在第二次世界大战前就已应用于经济预测。二次大战中和战后,在军事科学、空间科学和工业自动化等部门的应用更加广泛。 2.时间序列概述 时间序列包含一系列数据,这些数据是随时间或者其他变量的增加而得到的,并随着时间的改变,变量值的序列组成了一个时间序列。例如,股票每天的收盘价格就是一个时间序列,每年客运流量是一个时间序列,某种商品的销售数量也是一个时间序列,时间序列存在于日常生活之中。 2.1 时间序列的定义 时间序列是指按照时间顺序获得的一系列观测值。从数学意义上讲,如果对某一过程中的某一变量或一组变量 X(t)进行观察测量,在一系列时刻t1,t2,…,t n (t 为自变量,且t1

第八章--时间序列分析

第八章时间序列分析与预测 【课时】 6学时 【本章内容】 §8.1 时间序列的描述性分析 时间序列的含义、时间序列的图形描述、时间序列的速度分析 §8.2 时间序列及其构成分析 时间序列的构成因素、时间序列构成因素的组合模型 § 8.3 时间序列趋势变动分析 移动平均法、指数平滑法、模型法 §8.4 时间序列季节变动分析 原始资料平均法、趋势-循环剔除法、季节变动的调整 §8.5 时间序列循环变动分析 循环变动及其测定目的、测定方法 本章小结 【教学目标与要求】 1.掌握时间序列的四种速度分析 2.掌握时间序列的四种构成因素 3.掌握时间序列构成因素的两种常用模型 4.掌握测定长期趋势的移动平均法 5.了解测定长期趋势的指数平滑法 6.掌握测定长期趋势的线性趋势模型法 7.了解测定长期趋势的非线性趋势模型法 8.掌握分析季节变动的原始资料平均法 9.掌握分析季节变动的循环剔出法 10.掌握测定循环变动的直接法和剩余法 【教学重点与难点】 1.对统计数据进行趋势变动分析,利用移动平均法、指数平滑法、线性模型法求得 数据的长期趋势; 2.对统计数据进行季节变动分析,利用原始资料平均法、趋势-循环剔除法求得数 据的季节变动; 3.对统计数据进行循环变动分析,利用直接法、剩余法求得循环变动。 【导入】 很多社会经济现象总是随着时间的推移不断发展变化,为了探索现象随时间而发展变化的规律,不仅要从静态上分析现象的特征、内部结构以及相互关联的数量关系,而且应着眼于现象随时间演变的过程,从动态上去研究其发展变动的过程和规律。这时需要一些专门研究按照时间顺序观测的序列数据的统计分析方法,这就是统计学中的时间序列分析。 通过介绍一些时间序列分析的例子,让同学们了解时间序列的应用,并激发学生学习本章知识的兴趣。 1.为了表现中国经济的发展状况,把中国经济发展的数据按年度顺序排列起来, 据此来研究。 2.公司对未来的销售量作出预测。这种预测对公司的生产进度安排、原材料采购、 存货策略、资金计划等都至关重要。

时间序列分析第五章上机指导

上机指导 第五章 拟合ARIMA模型 由于ARMA模型是ARIMA模型的一种特例,所以在SAS系统中这两种模型的拟合都放在了ARIMA过程中。我们已经在第3章进行了ARMA模型拟合时介绍了ARIMA过程的基本命令格式。再次以临时数据集example5_1的数据为例介绍ARIMA模型拟合与ARMA模型拟合的不同之处。 data example5_1; input x@@; difx=dif(x); t=_n_; cards; proc gplot; plot x*t difx*t; symbol v=star c=black i=join; run; 输出时序图显示这是一个典型的非平稳序列。如图5-49所示

图5-49 序列x时序图 考虑对该序列进行1阶差分运算,同时考察查分后序列的平稳性,在原程序基础上添加相关命令,程序修改如下: data example5_1; input x@@; difx=dif(x); t=_n_; cards; proc gplot; plot x*t difx*t; symbol v=star c=black i=join; proc arima; identify var=x(1);

estimate p=1; forecast lead=5 id=t ; run; 语句说明: (1)DATA步中的命令“difx=dif(x);”,这是指令系统对变量x进行1阶差分,差分后的序列值赋值给变量difx。其中dif()是差分函数,假如要差分的变量名为x,常见的几种差分表示为: 1阶差分:dif(x) 2阶差分:dif(dif(x)) k步差分:difk(x) (2)我们在GPLOT过程中添加绘制了一个时序图“difx*t”,这是为了直观考察1阶差分后序列的平稳性。所得时序图如图5-50所示。 图5-50 序列difx时序图 时序图显示差分后序列difx没有明显的非平稳特征。 (3)“identify var=x(1);”,使用该命令可以识别查分后序列的平稳性、纯随机性和适当的拟合模型阶数。其中x(1)表示识别变量x的1阶差分后序列。SAS支持多种形式的差分序列识别: var=x(1),表示识别变量x的1阶查分后序列Δxt;

非线性时间序列分析及其应用

抄完温师兄的笔记,觉得蛮过瘾;于是继续抄抄抄...这两天终于抄累了,决定不再抄了.已经整理成电子版的,尽量发文发上来,就此作罢;天知道怎么会抄e版笔记也会抄上瘾?看来真有点控制不住自己,就跟小时候逃课去打街机一个德性... 再不抄了,就此作罢. 非线性时间序列的例子 1.Logistic模型x n+1=Rx n(1-x n) R=1.5时,不管初始状态x0在何处,随时间的演化,系统都将单调地趋向于1/3, R=2.9时,不管初始状态x0在何处,随时间的演化,系统都将交替地趋向于19/29, Logistic模型R=3.3时, 不管初始状态x0在何处,随时间的演化,系统都将在0.48和0.82两个状态之间周期性地变化, R=4时,随时间的演化,系统将出现不规则的振荡,看起来好像是随机的-- ->表明系统对初值具有非常敏感的依赖性,也说明这样的系统只能进行短期预测,要进行较长时间的预测会变得不正确. 2.弹簧振子受迫振动 3.Lorenz系统 dx/dt=sigma (y-z) dy/dt=x(r-z)-y dz/dt=xy-bz 取sigma=10,r=28,b=8/3时,系统是混沌的. 4.实际问题中的实测时间序列 股票指数时间序列 太阳黑子数时间序列 Chapter 2:单变量非线性时间序列分析 例2.1 Henon映射: x n+1=1-1.4x n2+y n y n+1=0.3x n 该系统实际上只与状态变量x n的前两个时刻的状态有关. 相空间重构的基本原理是F.Takens和R.Mane的延迟嵌入定量,它建立了观测信号系统时间波动和动力系统特征之间的桥梁. 基本思想: 通过观测或实验获得单变量时间序列{x n},做以下相空间重构: x n=(x n,x n-tao,…,x n-(m-1)*tao) 从而形成m维状态空间,在重构的m维状态空间中可以建立数学模型: x n+1=G(x n) F.Takens和R.Mane证明了只要适当选取m和tao,原未知数学模型的混沌动力系统的几何特征与重构的m维状态空间的几何特征是等价的,它们具有相同的拓扑结构,这意味着原未知数学模型的混沌动力系统中的任何微分或拓扑不变量可以在重构的状态空间中计算,并且可以通过在重构的m维状态空间中建立数学模型对原未知数学模型的动力系统进行预测,进一步解释/分析/指导原未知数学模型的动力系统. 相空间重构

相关文档
相关文档 最新文档