文档库 最新最全的文档下载
当前位置:文档库 › 非线性时间序列的相空间重构技术研究_秦奕青

非线性时间序列的相空间重构技术研究_秦奕青

非线性时间序列的相空间重构技术研究_秦奕青
非线性时间序列的相空间重构技术研究_秦奕青

第20卷第11期

系统仿真学报?V ol. 20 No. 11 2008年6月Journal of System Simulation Jun.,2008 非线性时间序列的相空间重构技术研究

秦奕青1,3,蔡卫东2,3,杨炳儒3

(1.北京信息科技大学计算机学院, 北京 100192; 2.济南大学信息科学与工程学院, 济南 250022;

3.北京科技大学信息工程学院, 北京 100083)

摘要:分析了混沌时间序列相空间重构中常用的C-C方法所存在的四点不足,提出了改进的

C-C-2方法。该方法改进了时间序列关联积分的计算方法和参数,利用混沌序列周期N的概念,

提出了通过寻找S cor(t)的第一个属于混沌序列周期N的局部极小峰值,来确定最优延迟时间窗口

的判断方式;并只寻找平均?S2(t)的第一个极小值来确定最优时间延迟,所得结果更合适、稳定,

而且将原算法的抗噪能力由30%提高到80%。

关键词:相空间重构;关联积分;延迟时间窗口;非线性时间序列

中图分类号:TP18; O415.5 文献标识码:A 文章编号:1004-731X (2008) 11-2969-05 Research on Phase Space Reconstruction of Nonlinear Time Series

QIN Yi-qing1,3, CAI Wei-dong2,3, YANG Bing-ru3

(1. Computer School, Beijing Information Science & Technology University, Beijing 100192, China;

2. School of Information Science and Engineering, University of Ji’nan, Ji’nan 250022, China;

3. School of Information Engineering, University of Science and Technology Beijing, Beijing 100083, China)

Abstract: A new method called C-C-2 is presented based on the analysis for the C-C method which is usually used to reconstruct the phase space of chaotic time series. First, the C-C-2 method improves the correlation integral algorithm of time series on the computing way and the parameters. Moreover, the method proposes a new way to determine the optimal delay time window by finding the first local minimum peak value of S cor(t) belonging to the period N of the chaotic time series based on the theory of the chaotic system period N. Finally, the method estimates the optimal delay time only by finding the first local minimum of the average ?S2(t). The experimental results shows that the C-C-2 method are more stable and more appropriate and also improves the robustness of C-C method from 30% to 80%.

Key words: phase space reconstruction; correlation integral; delay time window; nonlinear time series

引言

混沌时间序列分析与预测的基础是Takens、Packard等提出的状态空间的重构理论[1,2],即把具有混沌特性的时间序列重建为一种低阶非线性动力学系统。通过相空间重构,可以找出混沌吸引子在隐藏区的演化规律,使现有的数据纳入某种可描述的框架之下,从而为时间序列的研究提供了一种崭新的方法和思路。相空间重构是非线性时间序列分析的重要步骤,重构的质量直接影响到模型的建立和预测。

相空间重构的具体方法是用原始系统中某个变量的延迟坐标来重构相空间,Takens[1]从数学上为其奠定了可靠的

基础。他的基本观点是:相空间重构法虽然是用一个变量在不同时刻的值构成相空间,但动力系统的一个变量的变化自然跟此变量与系统的其他变量的相互作用有关,即此变量随时间的变化隐含着整个系统的动力学规律。因此,重构的相空间的轨迹也反映系统状态的演化规律。

相空间重构的原理如下:

收稿日期:2007-03-02 修回日期:2007-09-15

基金项目:国家自然科学基金 (60675030);山东省教育厅科技计划项目(J06G01);济南大学科研基金项目(Y0614)。

作者简介:秦奕青(1969-), 女, 北京人, 博士生, 副教授, 研究方向为数据挖掘、建模与仿真;蔡卫东(1968-), 男, 山东济南人, 博士生, 副教授, 研究方向为混沌理论及应用、数据挖掘;杨炳儒(1943-), 男, 天津人, 教授, 博导, 研究方向为人工智能、数据挖掘和柔性建模。

设单变量的时间序列为{(),1,2,...,}

i

x t i N

=,其采样时间

间隔△t。通过时间延迟构成m维向量:()((),

i i

X t x t

=

(),...,((1))),1,2,...,

i i

x tτx t mτi M

++?=,其中m为嵌入维

数,τ为时间延迟,()

i

X t为m维相空间中的相点,M为相点个数,且(1)

M N mτ

=??,集合{(),1,2,...,}

i

X t i M

=描述了系统在相空间中演化轨迹,这时可以在重构的m维空间中研究系统的混沌行为。研究表明,只要m, τ选择合适,重构的相空间与原系统具有相同的拓扑性质。

在相空间重构中,嵌入维数m和时间延迟τ的选取具有十分重要的意义,同时这种选取也是很困难的[3]。关于嵌入维数m和时间延迟τ的选取,现在主要有以下两种观点[4-6]:第一种观点认为两者互不相关,即m和τ的选取是独立进行的。一般情况下,持这种观点的学者,对于最佳嵌入维数m的选取采用:首先计算出系统的分形维数d,m取大于或等于2d+1的整数,目前主要有以下几种方法:G-P算法、特征值分解方法、替代邻点法等。最佳延迟时间τ的选取比较复杂,方法也比较多,包括自相关函数法、互信息法等。

以上各种方法,或者是在预先假定一个合适的τ值的情况下求m;或者是在假定一个合适的m值的情况下求τ。当我们研究现实经济数据的时候,我们无法事先预知经济系统的有关非线性特征,无从对m或τ做出合适的假定,因此上述方法都不适用。

第二种观点则认为m和τ是相互关联的。因为现实中的

2008年6月 系 统 仿 真 学 报 Jun., 2008

时间序列都是有限长且不可避免地受到各种噪声的影响。大量实验表明,m 和τ的关系与重构相空间的时间窗τW 密切相关((1)W τm τ=?),对于特定的时间序列,其τW 相对固定,

m 和τ的不恰当配对将直接影响重构后的相空间结构与原空间的等价关系,因此相应地产生了m 和τ的联合算法,如

C-C 法、时间窗口法嵌入维、时间延迟自动算法等。

从操作的难易程度、计算量的大小方面来看,尤其是对小数据组而言,1999年由Kim H. S.等[7]提出应用关联积分同时估计出时间延迟τ和延迟时间窗口τW 的C-C 方法更为有效。C-C 方法虽然没有坚实的理论基础,但是在实际应用中有很好的效果,并且该方法相对简单,易于在计算机上实现,能够同时得到τd 和τW ,众多的实验证明该方法还有较好的抗噪声能力[8]。

本文针对C-C 方法在相空间重构中的不足,提出了一种基于C-C 方法的改进算法,来确定最优时间延迟τd 与最优延迟时间窗口τW 。该算法对关联积分的计算、最优延迟时间窗口、最优时间延迟的判断规则都进行了改进,使得最优延迟时间窗口τW 选取更可靠、准确,最优时间延迟τd 的选择更准确,而且还大大提高了原算法的鲁棒性。

1 C-C 方法分析

1.1 C-C 方法原理

考虑混沌时间序列{,1,2,...,}i x x i N ==,其采样时间间隔△t 。以m 为嵌入维数,τ为时间延迟,重构相空间{}i X X =,i X 为m 维相空间中的相点

(,,...,(1)),1,2,...,T

i i i i X x x τx m τi M =++?= (1) 则嵌入时间序列的关联积分为[9] 12

(,,,)(),0(1)ij i j M

C m N r t θr d r M M ≤<<=?>?∑ (2) 其中m 为嵌入维,N 是时间序列的数据个数,r 为计算中所

取的搜索半径,t 为时间延迟,(1)M N m t =??表示m 维

相空间中嵌入点数目,θ为Heaviside 函数:()0,if 0θx x =< ;()1,if 0θx x =≥ ,()||||ij i j d x x ∞=?表示∞-范数。

关联积分是个累积分布函数,表示相空间中任意两点之间距离小于r 的概率。

这里点与点之间的距离用矢量之差的∞-范数表示。定义序列{}i x x =的检验统计量

(,,,)(,,,)(1,,,)m

S m N r t C m N r t C N r t =? (3) 式(3)式的计算过程为:将时间序列x 平均分解成t 个互不相交的子序列,t 为重构时间延迟,即

111222(1){,,...,}(2){,,...,}.........(){,,...,}

t N t t t N t t t t t N t x x x x x x x x x t x x x ??+?+????+?+????+???=????=????????=?? (4) 计算式(3)式定义的统计量采用分块平均的策略,即

11

1(,,,)[(,,,)(1,,,)]t

m s s s S m N r t C m N r t C N r t t ==?∑ (5)

令N →∞有

11

1(,,)[(,,)(1,,)]t

m s s s S m r t C m r t C r t t ==

?∑ (6) 如果时间序列{}i x x =独立同分布,那么对固定的m , t ,当N →∞时,对于所有的r ,均有1(,,)S m r t 恒等于零。但实际时间序列是有限长且元素间存在相关性,实际得到的结果一般不等于零。1(,,)S m r t t ~反映了时间序列的自相关特性,仿照求时间延迟的自相关法原理,最优时间延迟τd 可取

1(,,)S m r t t ~的第一个零点。或者取1(,,)S m r t t ~对所有半径r 相互差别最小的时间点,此时表示重构相空间中的点最接近均匀分布,重构吸引子轨道在相空间完全展开。

选择最大和最小的两个半径r ,定义差量

111?(,)max{(,,)}min{(,,)}i i S m t S m r t S m r t =? (7)

1?(,)S m t 度量了1(,,)S m r t t ~对所有半径r 的最大偏差。 综上所述,最优时间延迟τd 可取1(,,)S m r t t ~的第一个零点或1?(,)S m t t ~的第一个局部极小点。

根据BDS 统计结论可以得到和N , m , r 的合理估计,一

般情况下取3000N =, 2,3,4,5

m =, 2r k σ=×, 1,2,3,4k =, std()σx =, (σ为时间序列{}i x x =的标准差), 1,2,...,200t =,计算式(8)、式(9)

44

1111

1()(,,)16i m i t S m r t ===

∑∑ (8) 4

111

1?()?(,)4m S t S m t ==

∑ (9) 寻找1()S t 的第一个零点或1?()S t 的第一个局部极小点即

为最优时间延迟τd 。另外,由于统计量式(6)采用分块平均的策

略,对于周期为T 的时间序列,

当t kT =时(k 为大于零的整数),1()S t 与1?()S t 均为零。综合考虑1()S t 与1?()S t ,定义指标

111_()?()()cor S t S t S t =+ (10)

寻找1_()cor S t 的全局最小点即可获得最优延迟时间窗口

τW ,即平均轨道周期的最优估计。

1.2 C-C 方法仿真试验

仿真实验采用MATLAB 平台,考察了Lorenz 混沌系统

(式(11))的x 分量,用四阶Runge-Kutta 法积分方程组,选择

初始值为[,,][1,0,1]x y z =?,参数值为[,,][16.0,4.0,σr b =

45.92],积分步长0.01h =,积分区间为[0, 1000]。

dx dt σx σy dy dt xz rx y dz dt xy bz

?=?+????=?+?????=??? (11)

试验过程中,我们选取了[53001, 56000]的3000个点,用C-C 方法对混沌系统x 分量的重构结果和Kim 在文[7]中的一样,如图1所示。 1.3 C-C 方法的不足 在进行系统仿真的同时,我们分别在不同的区间选取了3000个点,进行τd

和τW

的计算,结果见表1。

2008年6月 秦奕青,等:非线性时间序列的相空间重构技术研究 Jun., 2008

图1 C-C 方法分析Lorenz 混沌系统的x 分量 表1 C-C 方法重构Lorenz 系统x 分量的计算结果 样本区间

嵌入维数m

时间延迟τd

嵌入窗口τW

10001--13000 21 10 191 20001--23000 15 10 132 30001--33000 20 10 184 40001--43000 11 11 104 50001--53000 14 11 137 60001--63000 14 11 137 70001--73000 9 11 84 80001--83000 17 10 152 90001--93000 11

11

101

通过深入分析,C-C 方法存在以下不足:

(1) 严格来讲混沌系统不存在周期,对于存在周期N 的低维混沌系统来讲,混沌时间序列在周期N 的点的数值均是存在着振荡的。式(2)定义的关联积分表示相空间中任意两点之间距离小于r 的概率,

对通常的周期函数统计的结果很明显,但对于混沌周期N 点的数值振荡,固定的r 值并不能有效体现出这种混沌的特性。

(2) 动力系统的一个变量的演化自然跟此变量与系统的其他变量的相互作用有关,作为重构的相空间{}i X X =序列中各点的相关性质度量值,式(2)定义的关联积分采用∞-范数进行计算,只考虑了m 维向量中度量最大的一维,显然是欠妥当的。

(3) 理想情况下1_()cor S t 的全局最小点即是最优延迟时间窗口τW ,

实际中存在若干个局部极小点与全局最小点在数值上相当接近,干扰了全局最小点的判读;甚至最优延迟时间窗口τW 所对应的不是全局最小点,最终导致最优延迟时间窗口τW 的错误估计。如图2所示,所标记的几个点在不同的区域计算中都有可能是最优延迟时间窗口τW 。

(4) 实际计算中1()S t 的第一个零点并不等于1?()S t 的第一个局部极小点。混沌系统虽然不存在周期,然而对于存在周期N 的低维混沌系统来讲,平均轨道周期T 是指混沌吸引子在永不重合而又彼此相似的相空间轨道上振荡的平均周期。对于平均轨道周期为T 的时间序列,当t kT =,1,2,...k =时,该零点很有可能既是1()

S t 的第一个零点,也

是1?()S t 的零点,因是1_()cor S t 的全局最小点,从而得到相

图2 C-C 方法分析的局部极小点与全局最小点

互矛盾的结论。因此本文认为,将1()S t 的第一个零点视为最优时间延迟τd 是不合适的,只需考虑1?()S t 的第一个局部极小点作为最优时间延迟τd 。

针对以上C-C 方法的不足,本文提出了基于C-C 方法的改进的相空间重构方法。

2 改进的方法C-C-2

2.1 C-C-2方法计算原理

改进后的C-C-2方法的策略仍然根据原C-C 方法的基本策略:先定义关联积分,再构造统计量(,,,)S m N r t ,依据

BDS 统计结论确定参数的合适取值范围。实际计算中利用1(,,,)S m N r t t ~的统计结论,实现最优时延τd 与最优延迟时间窗口τW 的估计。

因为非线性动力系统的一个变量的变化跟此变量与系统的其他变量的相互作用密切有关,改进后的C-C-2方法采用以下方法来改进关联积分:根据范数的等价性,利用2-范数代替原算法的∞-范数,其度量体现了各维的共同作用结果,而不是仅以其中绝对值最大的某一维作为标准,以更好的体现重构的相空间X 序列中各点的相关性质。

而且考虑到混沌时间序列在周期N 点的振荡,为了能寻找出更准确的混沌序列的固有属性,采取以下两个措施改进关联积分的参数r :

(1) 把搜索半径r 所依据的度量σ根据时间序列的变异程度进行适当扩大,目的是减少数值振荡所带来的干扰性,令std()*(1/3)σx cv =+,其中cv 是时间序列的离散变异系数(coefficient of variation),std()mean()cv x x =;

(2) 将式(2)中的固定值r 改为和嵌入维数m 相关的

()*log(1)r m r m =+,随着重构的维数增加适当地扩大搜索半径,目的也是为了减少振荡,特别是高维数据振荡产生的干扰。

其余的统计量均参照原算法定义进行计算。

通过大量的实验研究,发现在计算(,,,)S m N r t 的结果分析图中,

2_()cor S t 存在着明显的具有周期N 的局部极小峰值,而且这些时间点均为可能成为1_()cor S t 最小值的局部极小值,因此我们给出了新的最优延迟时间窗口τW 的判断规则:在最优延迟时间窗口τW 的选择上,

原C-C 方法选择1_()cor S t 的全局最小点,改进后的C-C-2方法主要考虑2_()cor S t 的在计算结果图上明显的具有周期N 的第一个局部极小峰值,来确定最优延迟时间窗口τW ;在没有明显的具有周期N 的

2008年6月 系 统 仿 真 学 报 Jun., 2008

结果中,选择2_()cor S t 的全局最小点来确定最优延迟时间窗口τW 。

另外,C-C 方法寻找1()t 的第一个零点或1?()S t 的第一个局部极小点作为最优时间延迟τd ,

改进后的C-C-2方法只用2?()S t 的第一个局部极小点作为最优时间延迟τd 。

C-C-2方法的具体计算过程如下。 改进的嵌入时间序列的关联积分为

212

(,,(),)(())(1)ij i j M

C m N r m t θr m d M M ≤<<=

??∑ (12)

其中m 为嵌入维,N 是时间序列的数据个数,r (m )为计算中所取的搜索半径,()0r m >,(),if

1r m r m ==;()r m = *log(1),if 1r m m +>,t 为时间延迟,(1)M N m t =??表

示m 维相空间中嵌入点数目,θ为Heaviside 函数:()0,if 0;()1,if 0θx x θx x =<=≥ ,(2)||||ij i j d x x =?表示

2-范数。

2(,,(),)S m N r m t , 2(,(),)S m r m t , 2?(,)S m t , 2()S t , 2?()t 和2_()cor S t 的定义均参照式(5)、式(6)、式(7)、式(8)、式(9)和式(10),将r 改为r (m )。

分析计算结果时,寻找2_()cor S t 的具有周期N 性质的第一个局部极小峰值即可获得最优延迟时间窗口τW ,即平均轨道周期的最优估计;在没有明显的具有周期N 的结果中,选择2_()cor S t 的全局最小点来确定最优延迟时间窗口τW ;同时用2?()t 的第一个局部极小点作为最优时间延迟τd 。

2.2 C-C-2方法的仿真试验

为了验证算法的有效性和通用性,我们进行了大量的仿真试验,实验证明了我们改进的C-C-2方法具有很高的应用价值。

实验中,我们同时考察了Lorenz 混沌系统、Duffing 混

沌系统(式(13))、Rossler 混沌系统(式(14))的x 分量。 2

(1)cos dx dt y dy dt δy ax x f z dz dt ω?=????=??++????=??

(13) ()*()dx dt y z dy dt x d y dz dt e z x f ?=?+????=+????=+??? (14) Lorenz 系统测试条件同前,Duffing 系统的参数值[,,,][0.05,0.5,7.5,1]δa f ω=、Rossler 系统的参数值[,,][0.2,0.4,5.7]d e f =,分别用四阶Runge-Kutta 法积分方程组,选择初始值[,,][1,0,1]x y z =?,积分步长0.05h =,积分区间为[0, 5000],测试区间均选择[50001, 53000]的3000个点。

为了体现出周期N 的性质,Duffing 系统、Rossler 系统的仿真试验中,令1,2,...,300t =。

通过对C-C-2方法得出的计算结果图进行分析,我们发现相空间重构图中普遍存在着具有周期N 规律的局部极小峰值,具体如图3, 4所示(测试样本区间选取[60001, 63000]

的3000个点)。

图4 C-C-2方法分析Lorenz 系统x 分量的结果图

据图4,我们可以看到当46,92,138,183t =时,2_()cor S t 均出现了明显的极小峰值,与图3相比较,这几个t 点1_()cor S t 也均为局部极小值,因此我们可以得出一个非常重

要的结论:C-C-2方法可以通过2_()cor S t 的明显的具有周期

N 的第一个局部极小峰值来确定最优延迟时间窗口τW 。

表2说明了改进后的C-C-2算法的计算结果。我们同样采取了与原C-C 方法相同的测试范围。 表格2 C-C-2方法重构Lorenz 系统x 分量

样本区间 嵌入维数m 时间延迟τd 嵌入窗口τW 10001--13000 6 10 46 20001--23000 6 10 46

30001--33000 6 10 46 40001--43000 6 10 46 50001--53000 6 10 45 60001--63000 6 10 46 70001--73000 6 10 46 80001--83000 6 10 46 90001--93000

6

10 46

通过对表2分析,我们可以看到,C-C-2方法计算得出

的τd 与原C-C 方法得出的结果一样,

C-C-2方法计算得出的τW 却与原C-C 方法得出的结果不同,而是一个稳定的数值,因此通过计算得出的最佳嵌入维数也相应稳定和减小,而且与公认的Lorenz 关联维数的理论值(2.06)[10]所计算出的最佳

图3 原C-C 方法分析Lorenz 系统x 分量的结果图

2008年6月 秦奕青,等:非线性时间序列的相空间重构技术研究 Jun., 2008

嵌入维数相同,为混沌序列的预测、分析等后续工作降低了难度。

用C-C 方法和改进的C-C-2方法对Duffing 系统、Rossler 系统x 分量的重构结果分别见图5~8。结果同样表明C-C-2方法可以确定更准确、稳定的最优延迟时间窗口和最优时间延迟,说明了该方法具有较强的通用性。

图6 C-C-2方法分析Duffing 系统x 分量的结果图

3 噪声效应

为了检验新算法的抗噪性能,我们在原Lorenz 时间序列上加上了Gaussian 白噪声进行测试。令i i i y x ησε=+,其中i x 是原Lorenz 序列,σ为其标准差,i ε是均值为0、标准差为1的独立同分布的Gaussian 白噪声序列,η为噪声强度。选择0.1,0.2,...,0.9,1.0η=进行仿真试验,采取Kim 在文[7]中使用的误差标准,发现新的C-C-2方法的抗噪性能由原C-C 方法的30%提高到80%。

4 结论

本文通过深入研究相空间重构的C-C 方法,针对该方法所存在的4点不足,提出了一种改进的C-C-2方法。新方法主要通过计算改进的关联积分,提出了新的最优延迟时间窗口的判断方式,并修改了原算法最优时间延迟的判断方式。仿真实验表明,该方法能明显体现出混沌序列周期N 的特性,对最优延迟时间窗口的选取更准确、稳定,对最优时间

延迟的选择更准确,而且大大增强了原算法的鲁棒性;利用

C-C-2方法分析的结果,为下一步混沌序列的预测、分析等工作奠定了更好的基础。

图8 C-C-2方法分析Rossler 系统x 分量的结果图

参考文献:

[1]

Takens F. Detecting Strange Attractors in Turbulence [C]// Dynamical

Systems and Turbulence, Lecture Notes in Mathematics. Berlin: Springer-Verlag, 1981, 898: 366-381.

[2]

Packard N H, Crutchfield J P, Farmer J D, et al . Geometry From a Time Series [J]. Physical Review Letters (S0031-9007), 1980, 45(9): 712-716.

[3]

Small M, Tse C K. Optimal Embedding Parameters: A Modeling Paradigm [J]. Physica D: Nonlinear Phenomena (S0167-2789), 2004, 194(3-4): 283-296.

[4] 李夕海, 刘代志, 张斌, 等. 基于重采样的混沌时间序列相空间重构研究[J]. 信号处理, 2006, 22(2): 248-251.

[5] 张雨, 任成龙. 确定重构相空间维数的方法[J]. 国防科技大学学报, 2005, 27(6): 101-105.

[6] 吕小青, 曹彪, 曾敏, 等. 确定延迟时间互信息法的一种算法[J]. 计算物理, 2006, 23(2): 184-188.

[7]

Kim H S, Eykholt R, Salas J D. Nonlinear Dynamics, Delay Times, and Embedding Windows [J]. Physica D (S0167-2789), 1999, 127(1-2): 48-60.

[8] 吕金虎, 陆君安, 陈士华. 混沌时间序列分析及其应用[M]. 武汉: 武汉大学出版社, 2002.

[9]

Grassberger P, Procaccia I. Measure the Strangeness of Strange Attractors [J]. Physica D (S0167-2789), 1983, 9(1-2): 189-208. [10] 马红光, 李夕海, 王国华. 相空间重构中嵌入维和时间延迟的选

择[J]. 西安交通大学学报, 2004, 38(4): 335-338.

统计基础知识第五章时间序列分析习题及答案

第五章时间序列分析 一、单项选择题 1.构成时间数列的两个基本要素是( C )(2012年1月) A.主词和宾词 B.变量和次数 C.现象所属的时间及其统计指标数值 D.时间和次数 2.某地区历年出生人口数是一个( B )(2011年10月) A.时期数列 B.时点数列 C.分配数列 D.平均数数列 3.某商场销售洗衣机,2008年共销售6000台,年底库存50台,这两个指标是( C ) (2010年10) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 4.累计增长量( A ) (2010年10) A.等于逐期增长量之和 B.等于逐期增长量之积 C.等于逐期增长量之差 D.与逐期增长量没有关系 5.某企业银行存款余额4月初为80万元,5月初为150万元,6月初为210万元,7月初为160万元,则该企业第二季度的平均存款余额为( C )(2009年10) 万元万元万元万元 6.下列指标中属于时点指标的是( A ) (2009年10) A.商品库存量 B.商品销售量 C.平均每人销售额 D.商品销售额 7.时间数列中,各项指标数值可以相加的是( A ) (2009年10) A.时期数列 B.相对数时间数列 C.平均数时间数列 D.时点数列 8.时期数列中各项指标数值( A )(2009年1月) A.可以相加 B.不可以相加 C.绝大部分可以相加 D.绝大部分不可以相加 10.某校学生人数2005年比2004年增长了8%,2006年比2005年增长了15%,2007年比2006年增长了18%,则2004-2007年学生人数共增长了( D )(2008年10月) %+15%+18%%×15%×18% C.(108%+115%+118%)-1 %×115%×118%-1 二、多项选择题 1.将不同时期的发展水平加以平均而得到的平均数称为( ABD )(2012年1月) A.序时平均数 B.动态平均数 C.静态平均数 D.平均发展水平 E.一般平均数2.定基发展速度和环比发展速度的关系是( BD )(2011年10月) A.相邻两个环比发展速度之商等于相应的定基发展速度 B.环比发展速度的连乘积等于定基发展速度

时间序列相空间重构及其应用研究(精)

时间序列相空间重构及其应用研究 摘要时间序列的重构分析是从产生该序列的系统特性的角度提取该时间序列的特征量,在这种分析方法的应用过程中,关联积分和关联维的正确、快速计算是重要的第一步.本文对混沌时间序列相空间重构中最佳延迟时间间隔和嵌入维数的选取方法作了综述, 基于时间序列分析的方法,提出了一种神经网络时间序列预测及建模方法. 关键词时间序列 ,相空间重构,延迟时间间隔, 关联维,神经网络 1 引言 混沌是一种低阶确定性的非线性动力系统所表现出来的非常复杂的行为,它对现代科学具有广泛而深远的影响,几乎覆盖了一切学科领域,尤其是在物理学、天体力学、数学、生物学、经济学等方面得到了广泛的应用.在对混沌时间序列的各种分析中,如混沌预测(prediction of chaos)。动力学不变量(dynamical invariants)的估计。混沌信号的诊断(detection of chaos)等,所要进行的第一步工作是要对混沌信号进行相空间重构.1981年Takens提出了相空间重构的延时坐标法,奠定了相空间重构技术的基础,这种方法用单一的标量时间序列来重构相空间,包括吸引子、动态特性和相空间的拓扑结构.现已成为最主要、最基本的相空间重构方法[1]. 分形维是用来描述混沌信号的一个重要参数,目前主要流行是基于GP算法的关联维提取算法。 2 G.P算法的描述 自从人们发现延迟时间对重构相空间的重要之后,便开始了探索确定延迟时间的方法,并取了显著的成效,相空间重构理论认为,要保证相空间重构的正确性,所选用的延迟时间必须使重构相空间的各个分量保持相互独立,选择的延迟时间如果太大, 就混沌吸引子而言,由于蝴蝶效应的影响,时间序列的任意两个相邻延迟坐标点将毫不相关,不能反映整个系统的特性;而延迟时间选择过小的话,时间序列的任意两个相邻延迟坐标点又非常接近,不能相互独立,将会导致数据的冗余。.因此我们需要一种方法来选择恰当的 ,于是围绕这一条件便先后出现了用自相关函数和互信息来确定延迟时间的方法[3]。自相关函数能够提供信号自身与它的时延之间由冗余到不相关比较这种的度量,一般取自相关函数值首次出现零点时的时延为所要确定的时间延迟。现描述如下: 对于单变量时间序列x 1, x 2 , x 3 ,…, x n 取延迟时间为 ,则其自相关函数为: (9) 其中,n为时间序列点数, 为时间序列的平均值.延迟时间的选取原则是让时间序列内元素之间的相关性减弱,同时又要保证时间序列包含的原系统的信息不会丢失.研究表明,当关联函数C的值第一次为0(或近似为0)对应的延迟时间比较合适[4]. 4 关联维m的选取

非线性时间序列

近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH模型 三. 多元时间序列 四. 协整模型

非线性时间序列 第一章.非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章. 非线性时间序列模型 1. 概述 2. 非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章.马尔可夫链与AR模型 1. 马尔可夫链 2. AR模型所确定的马尔可夫链 3. 若干例子 第四章. 统计建模方法 1. 概论 2. 线性性检验 3.AR模型参数估计 4.AR模型阶数估计 第五章. 实例和展望 1. 实例 2.展望

第一章.非线性时间序列浅释 1. 从线性到非线性自回归模型 时间序列{x t}是一串随机变量序列, 它有广泛的实际背景, 特别是在经济与金融领域中尤其显著. 关于它们的从线性与非线性概念, 可从以下的例子入手作一浅释的说明. 考查一阶线性自回归模型---LAR(1): x t=αx t-1+e t, t=1,2,…(1.1) 其中{e t}为i.i.d.序列,且Ee t=0, Ee t=σ2<∞, 而且e t与{x t-1,x t-1,…}独立. 反复使用(1.1)式的递推关系, 就可得到 x t=αx t-1+e t = e t + αx t-1 = e t + α{ e t-1 + αx t-2} = e t + αe t-1 + α2 x t-2 =… = e t + αe t-1 + α2e t-2

+…+ αn-1e t-n+1 +αn x t-n. (1.2) 如果当n→∞时, αn x t-n→0, (1.3) {e t+αe t-1+α2e t-2+…+αn-1e t-n+1} →∑j=0∞αj e t-j . (1.4) 虽然保证以上的收敛是有条件的, 而且要涉及到具体收敛的含义, 但是, 对以上的简单模型, 不难相信, 当|α|<1时, (1.3)(1.4)式成立. 于是, 当|α|<1时, 模型LAR(1)有平稳解, 且可表达为 x t=∑j=0∞αj e t-j . (1.5) 通过上面叙述可见求LAR(1)模型的解有简便之优点, 此其一. 还有第二点, 容易推广到LAR(p)模型. 为此考查如下的p阶线性自回归模型LAR(p):

相空间重构参数选择方法的研究

1 前言 混沌时间序列分析与预测的基础是Takens,Packard等提出的状态空间的重构 理论[1,2] ,即把具有混沌特性的时间序列重建为一种低阶非线性动力学系统。通过相空间重构,可以找出混沌吸引子在隐藏区的演化规律,使现有的数据纳入某种叫描述的框架之下,从而为时间序列的研究提供了种崭新的方法和思路[3]。相空间重构 相空间重构参数选择方法的研究 谢忠玉1,2 张 立2 1.哈尔滨工程大学自动化学院 150001; 2.黑龙江工程学院电子工程系 150050 是非线性时间序列分析的重要步骤,重构的质量将直接影响到模型的建立和预测。而重构相空间或者说构造一个非线性时间序列的嵌入,需要选择两个重要参数——嵌入维数m和延迟时间τ。对于无限长、无噪声数据序列,延迟时间τ的选取理论上没有限制,而嵌入维数m可以选择充分的大。实际中,由于数据长度有限并可能带噪,τ和m的选择对相空间的重构质量就尤其重要。关于嵌入维数m和延迟时间τ的选取,现在主要有两种观点。一种观点认为两者是互不相关的,如求时延的自相关法、互信息法,求嵌入维的G-P算法、FNN(flase nearest neighbors) 法等。另一种观点认为两者是相关的,如时间窗口法、C-C法和嵌入维、时间延迟自动算法等[4] 。多数研究人员认为,第2种观点在工程实践中更为实用、合理。有关嵌入维和延迟时间联合算法的研究是混沌时间序列分析的热点之一。 本文在国内外学者工作的基础上,结合时间窗法[5]和互信息法[6],提出一种新的确定嵌入维数和时间延迟的联合算法。在 仿真试验中用本方法确定的嵌入参数计算 Lorenz系统的混沌不变量(关联维数D), 算例表明本文提出的方法是有效的。 2时间窗口法及互信息法 提出联合算法以时间窗口法及互信息法为基础计算嵌入维和延迟时间,时间窗口法及互信息法的基本原理和存在的问题如下: 2.1 时间窗口法 1996年Kugiumtzis提出延迟时间τ的选取不应该独立于嵌入维数m,而应该依赖延迟时间窗口 τw=(m-1)τ (1) 具体算法为:首先根据原时间序列的波动求出平均轨道周期τp,在保证嵌入维数m大于序列本身关联维D的前提下,均匀τw值后依据式(1)变换m和τ的值,使用关联维作为验证指标,逐渐改变 τw的大小来确定最优的时间窗长度。经过多次试验发现,在一定时间窗长度下,大 致为τw≥τp,只要m和τ的值满足式(1),最后求出的关联维就保持不变。时间窗口法的优势是:能够同时确定m和τ,但时间窗口在确定m和τ的值时经过大量的试验,因此计算量较大。2.2 互信息法互信息法是估计重构相空间延迟时间的一种有效方法,它在相空间重构中有着 广泛的应用。考虑两个离散信息系统{s1,s2,…sn}和{q1,q2,…qn}构成的系统S和Q。根据信息论的知识,从两个系统测量中所获得的平均信息量,即信息熵分别为:在给定S的情况下,我们得到的关于 系统Q的信息,称为S和Q的互信息,用下 式表示: 其中Psq(si,qj)为事件si和事件qj的联合

相空间重构python

from operator import sub import numpy as np from sklearn import metrics from sklearn.neighbors import NearestNeighbors from toolz import curry def global_false_nearest_neighbors(x, lag, min_dims=1, max_dims=10, **cutoffs): """ Across a range of embedding dimensions $d$, embeds $x(t)$ with lag $\tau$, finds all nearest neighbors, and computes the percentage of neighbors that that remain neighbors when an additional dimension is unfolded. See [1] for more information. Parameters ---------- x : array-like Original signal $x(t). lag : int Time lag $\tau$ in units of the sampling time $h$ of $x(t)$. min_dims : int, optional The smallest embedding dimension $d$ to test. max_dims : int, optional The largest embedding dimension $d$ to test. relative_distance_cutoff : float, optional The cutoff for determining neighborliness, in distance increase relative to the original distance between neighboring points. The default, 15, is suggested in [1] (p. 41). relative_radius_cutoff : float, optional The cutoff for determining neighborliness, in distance increase relative to the radius of the attractor. The default, 2, is suggested in [1] (p. 42). Returns ------- dims : ndarray The tested dimensions $d$. gfnn : ndarray The percentage of nearest neighbors that are false neighbors at each dimension. See Also -------- reconstruct References ----------

非线性时间序列模型的波动性建模(中)

非线性时间序列模型的波动性建模 Song-Yon Kim and Mun-Chol Kim 朝鲜平壤金日成综合大学数学学院 本文出自于2011年5日朝鲜平壤举行的第一届PUST国际会议 本版修订于2013年11月3日 摘要:在本文中的非线性时间序列模型被用来描述金融时间序列数据的波动。描述两种由波动的非线性时间序列组合成TAR(阈值自回归模型)与AARCH(非对称自回归条件异方差 模型)的误差项和参数估计的研究。 关键词:非线性时间序列模型;波动;ARCH(自回归条件异方差模型);AARCH;TAR;QMLE(拟极大似然估计) 一介绍 在金融市场中,资产价格的波动是一个极其重要的变量,其建模在投资,货币政策,金融风险管理等方面中有重要意义 在投资持有期的资产价格波动的一个很好的预测是评价投资风险的一个很好的起点。资产价格波动是金融衍生证券定价的最重要的变量。对于定价我们需要知道的波动性范围是从现在相关资产,直至期权到期。事实上,市场惯例是根据波动单位列出价格期权。如今,波动性的定义和测量可能在衍生工具合约明确规定。在这些新的合同,波动成为潜在的“资产”。波动率模型已成为一个在金融时间序列模型分析的主要对象并且使许多科学家沉浸其中。

其中σ称为波动,在上面的公式中所示,σ准确估计成为期权定价和估计的一个非常重要的问题。此外,如对关联时间t 的波动σt 的估计等问题开始提出。 1982,罗伯特恩格尔提出了一个新的模型来用一个更准确的方法[ 7 ]对波动作出估计。他重视ARCH 模型中的误差项,这是大多线性时间序列模型如AR 、ARMA 、ARIMA 等所忽略的。同时他提出一种新的非线性模型,通过相加取代简单的白噪声,误差项的条件异方差性偏差的变化自动回归。误差项的条件异方差性偏差的 自动回归 1986年,Bollerslev 将Engle 的 ARCH (q)模型修改变为GARCH (p, q) model [8]. ???? ???++==∑∑==--q i p i i t i i t i t t t t t h h d i i z h z 112021..:,βεααε 在他的论文中,他提出了GARCH (1,1)过程中的存在,静止状态和MLE (最大似然估计)。 此后,大量ARCH 模型相继被开发出来,例如ARCH-M ,IGARCH 和LogGARCH 等。 在整个研究中,波动性已被证明是更受“坏消息”,而不是“好消息”的影响,也就是说,是不对称的,这导致对非对称模型的研究。 1991年,Nelson 提出了指数GARCH 模型(EGARCH )描述了不对称冲击。[ 6 ] () ()()x E x x x g g h t t t -+=-+-+=λωεγγ11h 10 但在许多研究论文,有效的参数估计和固定的条件是没有明确解释的,而且这种困难难以克服[ 9 ]。 但在1993,Glosten 开始使用阈值自回归条件异方差(TARCH )模型和其后提出的许多非对称模型[ 2 ],试图对不对称的波动进行建模。 特别是在2003年,Wai Mi Bei 开发了非对称ARCH (q )模型[ 10 ]。 ()∑∑==---+++=q i p j j t j i t i i t i t h 1120H γεβεαα 直到现在,持续的研究正在努力拟出更好的波动模型以显示各种ARCH 模型的影响。 在本文中,利用非线性时间序列模型的波动性建模是基于对前人研究成果分析的观察而得出。

单变量非线性时间序列模型

第5章 单变量非线性时间序列模型 §1 随机波动率模型 一. 乘积过程 t t t x U m s =+ 其中t U 一个标准化过程,即()()0,1t t E U V U ==。t s 是一个正随机变量的序列。这种类型的过程称之为乘积过程。 因为()2t t t V x s s =,因此t s 是随机过程t x 的标准差。 现在看偏微分方程 ()()log dP d P dt dW P m s ==+ 其中()log t t x P =D ,()W t 为标准布朗运动。它是通常的金融资产定价的扩散过程。离散情况1dt =,所以它是一个乘积过程。 假设()t t t U x m s =-服从正态分布,且独立于t s ,则 ()()()()()2 2 2 2 2 2 t t t t t t E x E U E E U E m s s s -=== ()()()()()0 t t k t t k t t k t t k t t k E x x E U U E U E U m m s s s s -------== = 但平方误差()2 t t S x m =-却自相关: ()()()()()cov ,t t k t t t k t S S E S E S S E S --=-- ()()() ()()()()()()() 2 2 222222 22t t k t t t k t t k t t t k t E S S E S E E U U E E E s s s s s s ----=-=-=- 此时 ()()() ()()() 2 22,42 t t k t k S t t E E E E s s s r s s --= -

基于改进的C-C方法的相空间重构参数选择

基于改进的C-C 方法的相空间重构参数选择* 陆振波 蔡志明 姜可宇 (海军工程大学电子工程学院, 武汉430033) 摘 要:针对混沌时间序列相空间重构C-C 方法的三点不足,提出了一种基于改进的C-C 方法的确定最优时延与嵌入窗的新算法。在关联积分计算过程中引入了权衡计算精度与速度的可调参数,合理选择该参数,能在不严重损失估计精度的前提下,大大加快计算速度。在理论分析的基础上,用所提出的算法对三种混沌序列进行相空间重构,仿真结果表明该算法对最优时延的选择更准确,对最优嵌入窗的选取更可靠。 关键词:混沌,时间序列分析,相空间重构,关联积分 Determination of embedding parameters for phase space reconstruction based on improved C-C method Lu Zhen-bo Cai Zhi-ming Jiang Ke-yu (Electronic Engineering College, Navy Engineering University, WuHan 430033, China) Abstract : A new algorithm to determine delay time and embedding window was presented based on the improved C-C method modified the classical C-C method in three aspects. Considering precision and rapidity of computation, an optimal parameter was introduced into the computation of correlation integral. On the foundation of theory study, phase space reconstruction of three kinds of chaotic time series is carried out, and the result of simulations verify that the algorithm is more applicable for determining appropriate delay time and embedding window. Key Words : chaos, time series analysis, phase space reconstruction, correlation integral 1 引言 近年来,混沌时间序列分析方法在很多科研和工程领域中得到广泛应用。相空间重构是混沌时间序列分析的基础,Takens [1]等人提出了用延迟坐标法对混沌时间序列},,2,1|{N i x x i ???==进行相空间重构 },,2,1,],,,,[|{)1(M i x x x X X X T t m i t i i i i ???=???==?++ (1) 其中m 为嵌入维,t 为时延,t m N M )1(??=为相空间中的点数。 Takens 定理证明了如果嵌入维m ≥12+d ,d 为系统动力学维数,则重构的动力系统与原动力系统在拓扑意义上等价。Takens 定理 *国家重点实验基金(批准号:514450801JB1101)和 国家重点实验基金(批准号:51444030105JB1101)资助的课题 联系人:E-mail: luzhenbo@https://www.wendangku.net/doc/b91726701.html,

非线性时间序列.doc

-------------精选文档 ----------------- 近代时间序列分析选讲: 一. 非线性时间序列 二. GARCH 模型 三. 多元时间序列 四. 协整模型

-------------精选文档 ----------------- 非线性时间序列 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 2.线性时间序列定义的多样性第二章 . 非线性时间序列模型 1.概述 2.非线性自回归模型 3.带条件异方差的自回归模型 4.两种可逆性 5.时间序列与伪随机数 第三章 . 马尔可夫链与 AR 模型 1.马尔可夫链 2.AR 模型所确定的马尔可夫链

-------------精选文档 ----------------- 3.若干例子 第四章 . 统计建模方法 1.概论 2.线性性检验 3.AR 模型参数估计 4.AR 模型阶数估计 第五章 . 实例和展望 1.实例 2.展望 第一章 .非线性时间序列浅释 1.从线性到非线性自回归模型 时间序列 {x t } 是一串随机变量序列 , 它有广泛的实际背景 , 特别是在经济与金融

-------------精选文档 ----------------- 领域中尤其显著. 关于它们的从线性与非线 性概念 , 可从以下的例子入手作一浅释的说 明. 考查一阶线性自回归模型---LAR(1): x t = x t-1 +e t ,t=1,2, (1.1) 其中 {e t } 为i.i.d.序列,且Ee t =0, Ee t = 2 <, 而且e t与 {x t-1 ,x t-1 ,} 独立 . 反复使用 (1.1) 式的递推关系 , 就可得到 x t =x t-1 +e t =e =e =e t t t +x t-1 +{ e t-1 +x t-2 } +e t-1 + 2 x t-2

第五章 时间序列的模型识别

第五章时间序列的模型识别 前面四章我们讨论了时间序列的平稳性问题、可逆性问题,关于线性平稳时间序列模型,引入了自相关系数和偏自相关系数,由此得到ARMA(p, q)统计特性。从本章开始,我们将运用数据开始进行时间序列的建模工作,其工作流程如下: 图5.1 建立时间序列模型流程图 在ARMA(p,q)的建模过程中,对于阶数(p,q)的确定,是建模中比较重要的步骤,也是比较困难的。需要说明的是,模型的识别和估计过程必然会交叉,所以,我们可以先估计一个比我们希望找到的阶数更高的模型,然后决定哪些方面可能被简化。在这里我们使用估计过程去完成一部分模型识别,但是这样得到的模型识别必然是不精确的,而且在模型识别阶段对于有关问题没有精确的公式可以利用,初步识别可以我们提供有关模型类型的试探性的考虑。 对于线性平稳时间序列模型来说,模型的识别问题就是确定ARMA(p,q)过程的阶数,从而判定模型的具体类别,为我们下一步进行模型的参数估计做准备。所采用的基本方法主要是依据样本的自相关系数(ACF)和偏自相关系数(PACF)初步判定其阶数,如果利用这种方法无法明确判定模型的类别,就需要借助诸如AIC、BIC 等信息准则。我们分别给出几种定阶方法,它们分别是(1)利用时间序列的相关特性,这是识别模型的基本理论依据。如果样本的自相关系数(ACF)在滞后q+1阶时突然截断,即在q处截尾,那么我们可以判定该序列为MA(q)序列。同样的道理,如果样本的偏自相关系数(PACF)在p处截尾,那么我们可以判定该序列为AR(p)序列。如果ACF和PACF 都不截尾,只是按指数衰减为零,则应判定该序列为ARMA(p,q)序列,此时阶次尚需作进一步的判断;(2)利用数理统计方法检验高阶模型新增加的参数是否近似为零,根据模型参数的置信区间是否含零来确定模型阶次,检验模型残差的相关特性等;(3)利用信息准则,确定一个与模型阶数有关

应用时间序列分析 第5章

佛山科学技术学院 应用时间序列分析实验报告 实验名称第五章非平稳序列的随机分析 一、上机练习 通过第4章我们学习了非平稳序列的确定性因素分解方法,但随着研究方法的深入和研究领域的拓宽,我们发现确定性因素分解方法不能很充分的提取确定性信息以及无法提供明确有效的方法判断各因素之间确切的作用关系。第5章所介绍的随机性分析方法弥补了确定性因素分解方法的不足,为我们提供了更加丰富、更加精确的时序分析工具。 5.8.1 拟合ARIMA模型 【程序】 data example5_1; input x@@; difx=dif(x); t=_n_; cards; 1.05 -0.84 -1.42 0.20 2.81 6.72 5.40 4.38 5.52 4.46 2.89 -0.43 -4.86 -8.54 -11.54 -1 6.22 -19.41 -21.61 -22.51 -23.51 -24.49 -25.54 -24.06 -23.44 -23.41 -24.17 -21.58 -19.00 -14.14 -12.69 -9.48 -10.29 -9.88 -8.33 -4.67 -2.97 -2.91 -1.86 -1.91 -0.80 ; proc gplot; plot x*t difx*t; symbol v=star c=black i=join; proc arima; identify var=x(1); estimate p=1; estimate p=1 noint; forecast lead=5id=t out=out; proc gplot data=out; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay; symbol1c=black i=none v=star; symbol2c=red i=join v=none; symbol3c=green I=join v=none;

非线性时间序列

第六章 时间序列的平滑 引论 上一章我们引进非参数函数估计的基本概念,现在将它应用到时间序列别的重要平滑问题上. 对估计慢变化时间趋势,平滑技术是有用的图示工具,它产生了时域平滑(§). 对将来事件和与之相联系的现在与过去变量之间的关系的非参数统计推断导致了§的状态域平滑. § 引入的样条方法是对§引入的局部多项式方法的有用替代. 这此方法能够容易地推广到时间序列的条件方差(波动性)的估计,甚至整个条件分布的估计,参阅§. 时域平滑 6.2.1 趋势和季节分量 分析时间序列的第一步是画数据图. 这种方法使得人们可以从视觉上检查一个时间序列是否像一个平稳随机过程. 如果观察到趋势或季节分量,在分析时间序列之前通常要将它们分离开来. 假定时间序列{}t Y 能够分解成 t t t t Y f s X =++, () 其中t f 表示慢变函数,称为“趋势分量”,t s 是周期函数,称为“季节分量”,t X 是随机分量,它被假定是零均值的平稳序列. 在使用这种分解之前,可以先用方差稳定变换或Box-Cox 变换. 这类幂变换有如下以参数λ为指标的形式 ,0,()log(),0, u g x u λλλ?≠=?=? () 或具有在0λ=点处连续的变换形式 ()(1)/g u u λλ=-. 这类变换由Box 和Cox (1964)给出. 注意,由在幂变换中数据必须是非负的,因此,在使用幂变换之前,可能必须先实施平移变换. 我们的目的是估计和提取确定性分量t f 和t s . 我们希望残差分量t X 是平稳的, 且能够用线性和非线性技术做进一步的分析. 通过推广Box 和Jenkins (1970)而发展的一个替代方法是对时间序列{}t Y 重复应用差分算子,直到被差分的序列表现为平稳为止. 这时,被差分的序列可以进一步平衡时间序列技术来处理. 作为说明Box 和Jenkins 方法的一个例子,我们先取S&P500指数的对数变换,然后计算一阶差分. 图给出了这个预处理序列. 所得序列基本上是该指数中变化的每日价格的百分比. 除了几个异常值(即1987年10月19日%的市场崩盘,金融市场称之为“黑色星期一”)外,这个序列显示出平稳性. 这个变换与金融工程中常用资产定价的几何布朗运动模型的离散化有关. 图 1972年1月3日至1999年12月31日(上图)和1999年1月4日至 1999年12月31日(下图)S&P500指数对数变换的差分

第八章 时间序列分析 思考题及练习题

第八章思考题及练习题 (一) 填空题 1、时间数列又称数列,一般由和两个基本要素构成。 2、动态数列按统计指标的表现形式可分为、和三 大类,其中最基本的时间数列是。 3、编制动态数列最基本的原则是。 4、时间数列中的四种变动(构成因素)分别是:、、、和 5、时间数列中的各项指标数值,就叫,通常用a表示。 6、平均发展水平是对时间数列的各指标求平均,反映经济现象在不同时间的平均水平或代表性水平,又称:平均数,或平均数。 7、增长量由于采用的基期不同,分为增长量和增长量,各增长量之和等于相应的增长量。 8、把报告期的发展水平除以基期的发展水平得到的相对数叫,亦称动态系数。根据采用的基期不同,它又可分为发展速度和发展速度两种。 9、平均发展速度的计算方法有法和法两种。 10、某企业2000年的粮食产量比90年增长了2倍,比95年增长了0.8倍,则95年粮食产量比90年增长了倍。 11、把增长速度和增长量结合起来而计算出来的相对指标是:。 12、由一个时期数列各逐期增长量构成的动态数列,仍属时期数列;由一个时点数列各逐期增长量构成的动态数列,属数列。 13、在时间数列的变动影响因素中,最基本、最常见的因素是,举出三种常用的测定方法、、。 14、若原动态数列为月份资料,而且现象有季节变动,使用移动平均法对之修匀时,时距宜确定为项,但所得各项移动平均数,尚需,以扶正其位置。 15、使用最小平方法配合趋势直线时,求解 a、b参数值的那两个标准方程式为。16、通常情况下,当时间数列的一级增长量大致相等时,可拟合趋势方程,而当时间数列中各二级增长量大致相等时,宜配合趋势方程。 17、用半数平均法求解直线趋势方程的参数时,先将时间数列分成的两部分,再分别计算出各部分指标平均数和的平均数,代入相应的联立方程求解即得。 18、分析和测定季节变动最常用、最简便的方法是。这种方法是通过对若干年资料的数据,求出与全数列总平均水平,然后对比得出各月份的。 19、如果时间数列中既有长期趋势又有季节变动,则应用法来计算季节比率。 20、商业周期往往经历了从萧条、复苏、繁荣再萧条、复苏、繁荣……的过程,这种变动称为变动。 (二) 单项选择题 1、组成动态数列的两个基本要素是( )。 A、时间和指标数值 B、变量和次数(频数)

第八章时间序列分析

第八章 时间序列分析 、填空题: 1. 由于决定时间数列变化的因数是多方面的,因此通常把时间数列上各期发展水平按其影 响因素的不同分解成几个不同的组成部分, 即长期趋势、 _______ 、循环波动和不规则变 动。 2?时间序列按照数列中排列指标的性质不同,可分为 __________ 、 ___ 和 _____ 。 3. “增长1%绝对值”指标其实质是 _________ 水平的1%。 4. ___ 是把原动态数列的时距扩大,再采用逐项移动的方法计算扩大了时距的序时平均数。 5. ______ 就是研究某种现象在一个相当长的时期内持续向上或向下发展变动的趋势。 6. ___ 就是指某些社会现象由于受生产条件或自然条件因素的影响, 在一年内随着季节的 更换而呈现出比较有规律的变动。 二、单项选择题: 某银行投资额 2004年比2003年增长了 10%, 2005年比2003年增长了 15% , 2005年比 2004年增长了( 销售额为( 6.时间数列的构成要素是( B 、时间和指标数值 C 、时间和次数 1. 时间序列在一年内重复出现的周期性波动称为( A 、趋势 B 、季节性 C 、周期性 D 、随机性 2. 增长一个百分点而增加的绝对数量称为( A 、环比增长率 B 、平均增长率 C 、年度化增长率 D 、增长1%绝对值 3. A 、15% - 10% B 、115% - 110% C 、(110% X 115%) +1 D 、(115%- 110%) -1 4?某种股票的价格周二上涨了 10%,周三上涨了 5%,两天累计张幅达( A 、15% B 、15.5% 4.8% 5% 5?如果某月份的商品销售额为 84万元, 该月的季节指数为 1.2,在消除季节因素后该月的 A 、60万元 B 、70万元 C 、90.8 万元 D 、100.8 万元 A 、变量和次数 D 、主词和宾词

时间序列分析第五章作业

时间序列分析第五章作业 班级:09数学与应用数学 学号: 姓名: 习题5.7 1、 根据数据,做出它的时序图及一阶差分后图形,再用ARIMA 模型模拟该序列的发展,得出 预测。根据输出的结果,我们知道此为白噪声,为非平稳序列,同时可以得出序列t x 模型 应该用随机游走模型(0,1,0)模型来模拟,模型为:,并可以预测到下一天 的收盘价为296.0898。 各代码: data example5_1; input x@@; difx=dif(x); t=_n_; cards ; 304 303 307 299 296 293 301 293 301 295 284 286 286 287 284 282 278 281 278 277 279 278 270 268 272 273 279 279 280 275 271 277 278 279 283 284 282 283 279 280 280 279 278 283 278 270 275 273 273 272 275 273 273 272 273 272 273 271 272 271 273 277 274 274 272 280 282 292 295 295 294 290 291 288 288 290 293 288 289 291 293 293 290 288 287 289 292 288 288 285 282 286 286 287 284 283 286 282 287 286 287 292 292 294 291 288 289 ; proc gplot ; plot x*t difx*t; symbol v =star c =black i =join; proc arima data =example5_1; identify Var =x(1) nlag =8 minic p = (0:5) q = (0:5); estimate p =0 q =0 noint; forecast lead =1 id =t out =results; run ; proc gplot data =results; plot x*t=1 forecast*t=2 l95*t=3 u95*t=3/overlay ; symbol1 c =black i =none v =star; symbol2 c =red i =join v =none; symbol3 c =green i =join v =none l =32; run ; 时序图:

时间序列分析基于R——习题答案

第一章习题答案 略 第二章习题答案 2.1 (1)非平稳 (2)0.0173 0.700 0.412 0.148 -0.079 -0.258 -0.376 (3)典型的具有单调趋势的时间序列样本自相关图 2.2 (1)非平稳,时序图如下 (2)-(3)样本自相关系数及自相关图如下:典型的同时具有周期和趋势序列的样本自相关图

2.3 (1)自相关系数为:0.2023 0.013 0.042 -0.043 -0.179 -0.251 -0.094 0.0248 -0.068 -0.072 0.014 0.109 0.217 0.316 0.0070 -0.025 0.075 -0.141 -0.204 -0.245 0.066 0.0062 -0.139 -0.034 0.206 -0.010 0.080 0.118 (2)平稳序列 (3)白噪声序列 2.4 ,序列LB=4.83,LB统计量对应的分位点为0.9634,P值为0.0363。显著性水平=0.05 不能视为纯随机序列。 2.5 (1)时序图与样本自相关图如下

(2) 非平稳 (3)非纯随机 2.6 (1)平稳,非纯随机序列(拟合模型参考:ARMA(1,2)) (2)差分序列平稳,非纯随机 第三章习题答案 3.1 ()0t E x =,2 1 () 1.9610.7 t Var x ==-,220.70.49ρ==,220φ= 3.2 1715φ=,2115 φ= 3.3 ()0t E x =,10.15 () 1.98(10.15)(10.80.15)(10.80.15) t Var x += =--+++ 10.8 0.7010.15 ρ= =+,210.80.150.41ρρ=-=,3210.80.150.22ρρρ=-= 1110.70φρ==,2220.15φφ==-,330φ= 3.4 10c -<<, 1121,1,2 k k k c c k ρρρρ--?=? -??=+≥? 3.5 证明: 该序列的特征方程为:32 - -c 0c λλλ+=,解该特征方程得三个特征根: 11λ=,2λ=3λ=

8章 时间序列分析练习题参考答案

第八章 时间数列分析 一、单项选择题 1.时间序列与变量数列( ) A 都是根据时间顺序排列的 B 都是根据变量值大小排列的 C 前者是根据时间顺序排列的,后者是根据变量值大小排列的 D 前者是根据变量值大小排列的,后者是根据时间顺序排列的 C 2.时间序列中,数值大小与时间长短有直接关系的是( ) A 平均数时间序列 B 时期序列 C 时点序列 D 相对数时间序列 B 3.发展速度属于( ) A 比例相对数 B 比较相对数 C 动态相对数 D 强度相对数 C 4.计算发展速度的分母是( ) A 报告期水平 B 基期水平 C 实际水平 D 计划水平 B 5.某车间月初工人人数资料如下: 则该车间上半年的平均人数约为( ) A 296人 B 292人 C 295 人 D 300人 C 6.某地区某年9月末的人口数为150万人,10月末的人口数为150.2万人,该地区10月的人口平均数为( ) A 150万人 B 150.2万人 C 150.1万人 D 无法确定 C 7.由一个9项的时间序列可以计算的环比发展速度( ) A 有8个 B 有9个 C 有10个 D 有7个 A 8.采用几何平均法计算平均发展速度的依据是( ) A 各年环比发展速度之积等于总速度 B 各年环比发展速度之和等于总速度 C 各年环比增长速度之积等于总速度 D 各年环比增长速度之和等于总速度 A 9.某企业的科技投入,2010年比2005年增长了58.6%,则该企业2006—2010年间科技投入的平均发展速度为( ) A 5 %6.58 B 5%6.158 C 6 %6.58 D 6%6.158 B 10.根据牧区每个月初的牲畜存栏数计算全牧区半年的牲畜平均存栏数,采用的公式是( ) A 简单平均法 B 几何平均法 C 加权序时平均法 D 首末折半法 D 11.在测定长期趋势的方法中,可以形成数学模型的是( ) A 时距扩大法 B 移动平均法 C 最小平方法 D 季节指数法

非线性动力学——时间序列分析读书报告

非线性动力学时间序列分析读书报告 Email:dragon_hm@https://www.wendangku.net/doc/b91726701.html,

1.时间序列分析简介 用随机过程理论和数理统计学方法研究随机数据序列所遵从的统计规律,以用于解决实际问题。由于在大多数问题中,随机数据是依时间先后排成序列的,称为时间序列。它包括一般统计分析(如自相关分析、谱分析等),统计模型的建立与推断,以及关于随机序列的最优预测、控制和滤波等内容。 经典的统计分析都假定数据序列具有独立性,而时间序列分析则着重研究数据序列的相互依赖关系。后者实际上是对离散指标的随机过程的统计分析,所以又可看作是随机过程统计的一个组成部分。例如,用 x(t)表示某地区第 t月的降雨量,*x(t),t=1,2,…+是一时间序列。对t=1,2,…,T记录到逐月的降雨量数据x(1),x(2),…,x(T)称为长度为T的样本序列。依此,即可使用时间序列分析方法,对未来各月的雨量x(T+i) i=1,2,…进行预报。 时间序列分析不仅可以从数量上揭示某一现象的发展变化规律或从动态的角度刻画某一现象与其他现象之间的内在数量关系及其变化规律性,达到认识客观世界之目的,而且运用时间序列模型还可以预测和控制现象的未来行为。时间序列分析在第二次世界大战前就已应用于经济预测。二次大战中和战后,在军事科学、空间科学和工业自动化等部门的应用更加广泛。 2.时间序列概述 时间序列包含一系列数据,这些数据是随时间或者其他变量的增加而得到的,并随着时间的改变,变量值的序列组成了一个时间序列。例如,股票每天的收盘价格就是一个时间序列,每年客运流量是一个时间序列,某种商品的销售数量也是一个时间序列,时间序列存在于日常生活之中。 2.1 时间序列的定义 时间序列是指按照时间顺序获得的一系列观测值。从数学意义上讲,如果对某一过程中的某一变量或一组变量 X(t)进行观察测量,在一系列时刻t1,t2,…,t n (t 为自变量,且t1

相关文档
相关文档 最新文档