文档库 最新最全的文档下载
当前位置:文档库 › 股票价格分析时间序列分析的分析与预测

股票价格分析时间序列分析的分析与预测

股票价格分析时间序列分析的分析与预测
股票价格分析时间序列分析的分析与预测

股票价格分析时间序列分析的分析与预测

1、相关定义

1.1、趋势和季节调整的概念和作用

以季度或月份作为时间观测单位的经济时间序列一定程度上具有一年一度的周期性变化的特点,不难发现这种周期变化是由于季节因素(气候、风俗习惯和社会制度等等)的影响造成的,在经济分析中称为季节性波动〔8]。然而季度和月度的经济时间序列山东大学硕士学位论文的季节性波动是非常明显的,它往往会给经济增长速度以及宏观经济形势的分析造成一定的困难和麻烦。由于季节因素的存在,同一年中不同季度或月份的数据通常没有任何可比性,而在消除了季节性的影响之后,自然就能够反映真正的客观规律和趋势。为了更好的应用季节调整我在原数据的基础上增加一年的数据,见表3一5一1。月月月20044420044420044420044420044420044420044420044420044420044 4200444200444 份份份年1 11年2 22年3 33年4 44年5 55年6 66年7 77年8 88年9 99年年年年年年月月月月月月月月月月月月月月月月月月月月lO OO11 1112 22 月月月月月月月月月月月月月月月月月戈戈戈421 11427 77440 00446 66496 66501 11516 66539 99546 66569 99564 44550 00 表3一5一1

1.2、时间序列分析的几个基本概念

2.1.1 随机过程与时间序列2.1.1 随机过程与时间序列所谓随机过

程,是指现象的变化没有确定形式,没有必然的变化规律。用数学的语言来讲,就是事物变化过程不能用一个(或几个)时间t的确定函数来描述。也就是说,如果对事物变化的全过程进行观测得到的结果是一个时间t的函数;但是对同一事物的变化过程独立的重复进行多次观测所得到的结果是不相同的[17]。(从时间变化角度来考察) 若对于每一个特定的t∈T (T 是一个无穷集合,称为参数集),X ( t ) 是一个随机变量,则称这一族无穷多个随机变量{X ( t), t∈T } 是一个随机过程。可见, 随机过程X ( t ) 是一族随机变量。定义如下: 当t ={0, ±1, ± 2, } 时, 即时刻t 只取整数时, 随机过程{z, t∈T} 可写成{z, t= 0, ± 1, ±2, } ,此类随机过程称为随机序列,也称时间序列。由此可见: (1) 时间序列是随机过程的一种,是将连续时间的随机过程等间隔采样后得到的序列;换句话说,时间序列是指以时间顺序形态出现的一连串观测值集合[18]。(2) 时间序列也是随机变量的集合,只是与这些随机变量联系的时间不是连续的,而是离散的。从统计意义上讲,时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。这种数列由于受到各种偶然因素的影响, 往往表现出某种随机性,彼此之间存在统计上的依赖关系[19]。时间序列分析是一种根据动态数据揭示系统动态结构和规律的统计方法。其基本思想是:根据系统的有限长度的运行记录(观察数据),建立能够比较精确地反映序列中所包含的动态依存关系的数学模型,并借以对系统的未来进行预报的方法。6 对于时间序列{Xt , t∈T } ,任取t , s∈T ,定义序列

{Xt } 的自协方差函数为: γ(t , s )= E ( Xt ? μt )( X s ? μs ) (2-1) 其中,μ t =EX T ,自协方差函数γ (t , s ) 表示了时间序列{Xt } 在不同时刻t 和s 时的统计关系。定义时间序列{Xt } 的自相关函数(ACF)为: ( , )( , ) t s t st s DX DX ρ =γ ? (2-2) 其中DXt= E[ X t ? EX T ]2 ,自相关函数刻画了时间序列{Xt } 在不同时刻t 和s 时的线性相关程度。

1.3、平稳时间序列的定义

设必(t=l,2. )表示一个随机时间序列,即是对任意一个固定的t,戈都表示一个随机变量。如果戈满足下列条件: (1)Ey,=mt取一切整数,m为常数(2)E(戈+*一m)(共一m)=乓k=o,士1,士2 . 称另为宽平稳随机序列,。称为自协方差函数,p*一丘称为自相关函数。

1.4、时间序列定义

对于一组按照时间顺序排列的随机变量: ,X 1 ,X2, ,Xt, (2-1) 称为一个随机事件的时间序列[42]。如果用x1 ,x2,x3 ,xn(2-2) 来表示随机变量x1 ,x2,x3 ,xn的n 个有序观测值,其中n 为观测样本的个数,有时也称式(2-2)是式(2-1)的一个实现。

1.5、时间序列的概念及性质

2.3.1 平稳性2.3.1 平稳性定义2.3.1[3] 设{X (t ),t ∈T } ,对任给的t1,t 2, L,t n ∈Z , n 维随机变量( ) Xt1,Xt2, , Xtn K 的联合分布

函数: F(tttnxxxn ) P{XtxXtxXt xn } n = 0} 称为时间序列的有限维分布函数族。下面简单介绍一下几个常用的特征统计量: (1) 均值函数: ∫ +∞ m(t)?=E(X t)=?∞xdF(t,x ),t ∈Z ; (2) 方差函数:D(t)?=D[X t]=E[X(t)?m(t) ]2 ,t ∈Z ; (3) 自协方差函数:γ(t,s)=E(Xt?μt)( Xs ? μ s ) ; (4) 自相关系数: DXt DXs ρ(t,s)= γ(t ,?s ) 。

1.6、相关概念

⑴白噪声定义2.6:如果序列{εt,t=0,±1, ±2, } 满足下列条件: ①均值为零:E( εt) = 0 ②互相独立:自协方差函数满足: rK= E(εt,εt +k) = σ 2 K= 0 (2.9) rK= E(εt, εt +k) = 0 K≠ 0 (2.10) ③服从正态分布:ε t ~N(0,ε 2 ) ④ε t 与前一时刻的序列值xt? K( K > 0) 互不相关,即: E (εtxt?K) = 0 (K> 0 ) (2.11) 则我们通常称ε t 为白噪声。⑵后移算子、趋势差分算子、季节差分算子①后移算子(滞后算子) {xt,t=0,±1, ±2, } 为时间序列,引用符号B ,定义: Bkxt= x t? k (k=0,1, 2, ) (2.12) 且当k > t 时,Bkx t =0,B 通常被称为后移算子。②趋势差分算子{xt,t=0,±1 ,±2, } 为时间序列,引用符号? d ,定义: 武汉科技大学硕士学位论文第9 页??? ???? ?=? ?=? ?=? t d t d tt tt xBx xBx xBx (1) (1) (1) 22 (2.13) ? d 通常被称为趋势差分算子。③季节差分算子{xt,t=0,±1 ,±2, } 为时间序列,引用符号? s ,定义: ?sxt=xt? xt ?s (2.14) 其中s称为周期长度,? s 通常被称为季节差分算子。⑶自相关函数与偏自相关函数①MA( q) 序列的自相关与偏自相关函数MA(q) 序列的自相关函数为: ??? =?????+++++ + + ? 0 1 1 22 1 11 q KKqKq

kθ θ ρθθθθθ Kq Kq K > ≤≤ = 1 0 (2.15) 这表明MA(q ) 序列的自相关函数ρ K ,当K > q 时是”截尾”的,即ρK≡0(K > q ) 。通常利用这一特点识别滑动平均模型以及确定模型的阶数q。MA(q) 序列的偏自相关函数随着滞后期K 的增加,按负指数规律衰减收敛于零,表现出”拖尾”的特性。②AR( p) 序列的自相关与偏自相关函数AR(p) 序列的偏自相关函数满足: ?Kj= ????0 j 1p≤+ j1 ≤≤ jp ≤ k (2.16) 这表明AR( p) 序列的偏自相关函数? KK 在K > p 以后是”截尾”的,即?KK≡0(K > p ) 。通常利用这一特点识别自回归模型以及确定模型的阶数p 。与MA( q) 序列相反,AR(p ) 序列的自相关函数随着滞后期K 的增加,按负指数规律衰第10 页武汉科技大学硕士学位论文减收敛于零,表现出”拖尾”的特性。③ARMA(p, q ) 序列的自相关与偏自相关函数ARMA(p, q) 序列的自相关与偏自相关函数均随着滞后期K 的增加,按负指数规律衰减收敛于零,表现出”拖尾”的特性。⑷样本数字特征设x i(i =1,2,3,, N ) 是平稳、零均值时序xt 的一段样本,以上介绍了序列的理论数字特征,在具体建模中则需要使用下列样本数字特征: 样本自协方差函数: ∑ ? rK=1NiN = 1Kxi xi +K (2.17) 样本自相关函数: ρK =rK/ r0 (2.18) 样本偏自相关函数:1(1,2,, ) 1,1,1,1 1 1 11 1,1j K KjKjKKKKj K j Kjj K j KKjKj KK = ???? ????? =? ? ? = ++++? = +=+ ? ++ ∑ ∑ ???? ?ρ ρ?ρ ? (2.19)

1.7、跳频序列基本概念

跳频序列是一个用于频移键控调制的扩频码序列,使载波频率不断

跳变,具有周期性. 跳频序列周期越长,跳频序列被破译的可能性就越低,进而抗截获能力就越强[3]. 跳频序列的性能直接决定跳频通信的抗干扰性能的优劣,对跳频通信系统有着非常重要影响. 跳频序列不仅可以用来控制频率跳变,实现频谱扩展,而且可作为跳频通信组网时的地址码,区分不同的通信用户. 常用的跳频序列有m 序列、混沌映射序列、R-S(Reed-Solomon)码序列、Gold 码序列等,简要介绍如下: 1、基于m 序列构造跳频序列由移位寄存器加反馈后形成,并且可以通过调节反馈系数进而产生不同的m 序列. 其中,m 序列是最长的线性移位寄存器序列, 具有良好的自相关性. 2、基于混沌映射构造的跳频序列由混沌系统产生的混沌序列转换为符号序列而形成. 该跳频序列具有混沌的高线性复杂度、伪随机等特点,且频率码分布均匀, 具有较好的实际应用前景. 3、R-S 码是一种特殊的BCH 循环码,与相同长度的m 序列相比较,它的可供选取码数更多. 4、Gold 码是在两个长度、速率相同而码字不同的m 序列基础上,把优选对进行模2 后相加得到,即Gold 码是两个m 序列的组合码. Gold 码不仅继承了m 序列相关性良好的优点,而且码序列的条数多. 除了上述常用的跳频序列之外,还有多种构造跳频序列的方法. 根据实际应用,可以通过选择合适的构造跳频序列的方式来提高跳频系统的性能. 同时,在跳频通信过程中,通信双方必须在跳频频率表、跳频起止时刻以及跳频序列这三方面保持一致,而跳频同步能通过搜索并消除跳频通信中时钟和频率漂移带来的误差来保障正常通信. 因此,跳频同步是跳频通信的核心,只有跳频通信的双方实现了精确的同步,

第一章绪论3 才能在恶劣的通信环境下进行可靠的通信. 常见的同步方法有以下3 种[4]: 1、独立信道同步法. 该方法需要把通信信道分为两个专用信道,进而分别传送同步信息和实现跳频通信. 传送同步信息的专用信道可以传送大量的同步信息, 并且同步建立时间较短,保持通信系统的长时间同步. 但是,专用信道的设置对发送设备有较高的要求,并且传送同步信息的专用信道频率为固定频率,易于被敌方单位发现并实施精准的干扰. 2、参考时钟法. 该方法利用固网原理,可以通过某种算法向所有的通信网设置一个公共的时基,该时基对所有的使用者是透明的,不需准备和申请就能入网, 可以在网内快速传递时基,且能够提高跳速,缩短同步时间,但对时基的精度和稳定性要求很高. 3、自同步法. 该方法将同步信息隐藏到跳频信号的一个或多个频率中,通信接收方需要从接收到的数据中将同步信息提取出来,进而实现跳频同步. 因此,自同步法不需专用信道,能够节省功率,并且拥有较强的抗干扰能力等优势,但是同步时间较长,跳频频道数目较少,不能实现高速跳变.

1.8、行程时间及行程时间预测的定义

路段行程时间是指一辆车在某个时间段通过某路段需要花费的期望时间。对于某辆车来说,影响其通过某个路段所需时间的因素有很多,包括天气、交通流量、交通事故、司机的驾驶习惯以及车辆的性能等,路段行程时间是一个随机过程,它不可能被精确地估计或预测。因此,我们用期望时间来定义行程时间。大多数关于路段行程时间的研

究都是着眼于如何更准确地估计或预测路段的期望监测数据历史数据交通预测模型实时仿真事故侦测数据融合先进旅行者信息系统先进交通管理系统数据层分析层预测层信息层决策层9 行程时间。为了更直观地理解如何计算路段行程时间,我们可以看图1- 2。L 表示路段,Tr 表示某辆车的轨迹,Δ表示一个时间段, s1 和s 2 分别表示路段L 的起点和终点,t1 和t 2 分别表示轨迹Tr 经过s1 和s2 的时间点。假如我们记录了轨迹的时间点t 1 和t 2 ,则这辆车通过路段L 所需的行程时间tt 可表示为: ttΔ = t1 ? t 2 (1-1) 路段L 在时间段Δ的行程时间可理解为在时间段Δ进入路段L,走完全程需要花费的期望时间,通过计算所有在时间段Δ进入此路段的车辆的平均行程时间得到。假设tt iΔ 表示车辆i 在时间段Δ进入路段L 所需的行程时间,n表示在时间段Δ进入路段L 的车辆数。则路段L 在时间段Δ的行程时间l _ ttΔ 表示为: 1 _n i / i l ttΔ tt Δ n = = ∑ (1-2) 图1- 2 路段行程时间的直观表示路段行程时间预测是利用历史数据和当前交通状况数据预先计算某路段后一个时间段或后几个时间段的行程时间。它不同于路段行程时间估计,路段行程时间估计是在某个时间段内,当所有车辆经过某路段后,利用得到的交通状况信息估算出此路段在此时间段内的行程时间。换句话说,路段行程时间预测是在车辆进入某路段前,提前告诉出行者经过此路段要花费的期望时间。路段行程时间t s t1t2 L Tr s1 s2 10 预测的一般化表示为: ttt?= M (c t? k ,..., c t?1 ) (1-3) 其中,M 表示预测模型,c i 表示时间段i的路段交通状态。从式(1-3)可看出,行程

时间预测问题可描述为一个时间序列的预测问题。要对某一变量进行预测,首先需要选择一个预测模型并确定其输入变量,然后利用训练数据训练预测模型, 直至其预测精度达到某个阈值。根据模型输入变量类型的多少,行程时间预测可分为单因素行程时间预测和多因素行程时间预测。单因素行程时间预测的输入变量只包含当前路段前k 个时间段的行程时间。多因素行程时间预测的输入变量除了涉及当前路段的行程时间外,还包括其它交通状况数据,如当前路段的车流量、上下游路段的车流量及行程时间等。按理说,加入更多的因素有利于提高预测模型的准确度和健壮性,但这同样会增加预测模型的复杂性和计算负担,所以本文只研究单因素的行程时间预测,即在已知某路段过去k 个时间段的行程时间的前提下,预测其下一个或下几个时间段的行程时间,如图1- 3 所示。图1- 3 行程时间预测示意图

1.9、平稳时间序列的定义

定义2.1 满足如下条件的序列称为严平稳序列[41] ?正整数m ,? t1, t 2 ,L , t m ∈T ,?正整数τ ,有( ) ( ) Ft1, t2 Ltm x1, x2 ,L , xm= F t1+τ ,t 2 +τ L t m +τ x1 , x2 , L , xm 定义2.2 如果{X t } 满足如下三个条件: (1) 任取t∈T ,有EX t2 1.10、时间序列的定义

对生产和科学研究等过程中某一变量或一组变量x (t ) 进行观察测量,在一系列时刻t1, t2 ,.. .tN ( t为自变量且t11.11、时间序列相似的定义

判断两个时间序列是否相似,可以采用不同的判别标准,但是在实践中,大都采用比较两个时间序列之间的欧氏距离来进行判断,本文所采用的也是这种方法,下面给出定义。定义5-1(两个时间序列相似):存在两个时间序列x→ 和y→ ,如果它们之间的欧氏距离D(x→ ,y→ )

2、相关背景

2.1、研究背景

,特别是改革开放之后,我国的国民经济有了长足的发展[3]。传统的银行信贷已经无法充分满足各方对资金的需求,一些新的融资手段和工具迅速发展壮大和完善,尤以证券为甚。股票市场是证券市场中重要的组成部分,堪称一个国家经济发展的晴雨表,其上涨或下跌从宏观角度来看可以快速的反映出国家的经济运转状况,从小的方面讲它直接关系投资者的收益[3]。对股票价格进行有效的预测可以帮助股票市场监管者更为有效地管理市场,也能帮助投资者进行合理的投资选择,为正确决策提供有力的支撑。因此挖掘股票市场的运行规律进而预测股票价格具有重大意义,无论是对股民还是市场监管者。股票价格序列是一种特殊的时间序列[1,3]。正如美国加州大学University of California-Santa Cruz 的Norman Packard 对于金融时间序列的描述中所提及的, 金融时间序列与其它时间序列的唯一区别在于它展示了人们对于金钱的兴趣。正是这一不同,使得股票价格序列相比普通时间序列掺杂了许多人为因素(如新的政策颁布、重大事

件的发生以及各种人类活动、节日等)的扰动和影响。从大的范围来看,我们可以认为股票市场是有效的[1,3],但是正是因为上述人为因素影 1 响使得股票价格在局部短时间内呈现一定的规律性,这样就使得对其进行中短期预测变得可行。我们常采用时间序列的方法分析和处理股票价格序列,同时也要考虑股票价格序列与一般时间序列的不同之处,充分利用其特有属性更为准确地对其进行分析和预测。资本是逐利的[4]!自股票出现那天起,人们对其的投资就是希望获得利益的。在利益的驱动下,人们对其进行的研究和预测的热情一直在延续。随着股市发展, 也逐步形成了一些分析方法,这些分析方法在实践中也逐步得以完善。Sam Nelson 收集了Charles Dow 于1990-1902 年间发表的对市场的评述并应用到股市,是股市技术分析方法的雏形;图表形态分类由技术分析科学之父的Richard Schabacker 最早引入,进而提出了”缺口”理论;瑞夫N 艾略特提出了”波浪理论”,该理论着重研究市场的波动规律;W.D. Galm 通过研究时间要素的重要性提出了”价格时间等价”的概念[3];随后趋势分析法、移动平均法、柱状图分析法以及K 线图分析法等一系列专业分析方法涌现[3]。这些方法不宜推广,因为它要求使用者对股市有很深入的了解,这适合于专业股市从业人员,极大地限制了其使用范围。它极大地依赖人的主观判断,同时随着股市的发展,数据规模越来越大,使得单靠人力去挖掘数据内在关联变得不像之前那样容易。

2.2、课题研究背景

发展现状1.1.1 家纺行业发展现状新中国成立以后,直到上世纪80年代,经过三十多年的计划经济时代,我国纺织工业薄弱环节和结构性的矛盾逐渐显露出来,产品总量过大,风格单一,富有创新的产品不多,激发不起消费者的购买欲望[1]。我国家用纺织品行业是一个新兴行业,起步晚但是发展较为迅速的行业。从2000年进入快速发展时期,全社会家纺行业产值年增长率在20%以上,2003年产值为3630亿元,2006 年产值达到6540亿元,2008 年产值已达8,800 亿元,比2007年增长11.40%,比2004 年的4,500亿元增长95.55%[2,3]。2010 年,全行业工业总产值达到1.15万亿元,教2005年增长了111.01%,5年内实现16.11% 的年均增长率[4]。2011年家纺行业1548家规模以上企业累计完成工业总产值2097.65 亿元,出口交货值539.11亿元,实现利润总额122.40亿元,产销率达97.97%[5]。2012 年受国际经济形势、国内宏观调控及原材料等多种因素影响,家纺行业持续疲软,波折不断,价格平台整体下移,生存压力明显增大[6]。据国家统计局统计1831家规模以上企业工业总产值同比增长14.1%;家纺协会统计的16个产业集群工业总产值同比增长7.8%;家纺协会重点跟踪统计的200家企业工业总产值同比增长7.3%。在出口方面, 据中国海关统计,2012年,我国出口家用纺织品共计366亿美元,同比增长6%,出口量和出口单价分别增长了1.7%和4.3%,按家用纺织品具体行业来分,布艺企业出口占比最高,达到了41.67%,但利润最低,为3.63%,明显低于床品和毛巾企业,其中床品企业利润最高为5.29%[7]。虽然这些数据显示,家纺行业在稳步上升,但是结合近几年的全球经济行情,我国

纺织业还是存在一些问题。中国企业的研发投入逐年有所上升,但与发达国家相比差距明显,研发能力不足与研发意愿不强的问题依然突出; 中国是发达国家外包生产的首先地之一,特别在中国的一些纺织大省,为发达国家代加工生产非常普遍,相比之下,尽管自主品牌数量也在增加,但为数不多,而且为数 1 第 1 章绪论家纺价格指数的时间序列建模及预测分析不多的自主品牌其影响力也很有限,距离世界级品牌还有较大差距;中国纺织品的营销方式仍相当传统,即基于专业市场的订单式销售;在政府调控中,仍大量采用行政方式介入[8]。中国的纺织业也是出口大产业,如今发达国家对于我国的产品不仅设置传统贸易壁垒,还利用其自身先进技术设置了新型贸易壁垒。据不完全统计,仅2009 年就有34.3%的出口企业受到国外技术性贸易措施不同程度的影响,造成我国出口贸易直接损失574.32亿美元[9]。国际家纺行业的发展现状有以下特点:首先,家纺产品多样化和高档化是西方发达国家增强其家纺产业竞争力的重要手段。其次,发展中国家,特别是印度、巴基斯坦等占有原材料和劳动力成本低的优势,国际竞争力逐渐增强。家纺业国际竞争的形势是十分严峻的,仅仅依靠低成本取得竞争优势的时代已经过去了。现在的顾客更为关注的是产品的质量、性能、外观及产品的多样性[3]。面对如今的国际形势,我国的家纺产业面临新的挑战,一个非常重要的转型期。虽然今年来家纺行业发展态势良好, 但也存在诸多不足。一技术含量不高,我国81%的家纺产品在国内市场销售,基本上是中低层次产品,高档产品以进口为主;二对客户需求的反应速度不高,丧失最佳供货时机;三资金投

入不足,目前我国家纺产业在新产品开发、品牌塑造、信息服务以及人才培养等方面资金投入严重不足;四国内市场开拓不够,实际上家用纺织品作为室内软装潢是一个整体[10]。面对日趋成熟的全球家纺市场,我国的家纺市场面临强大的挑战与机遇,不断提升改变自身战略,家纺行业具有强大的发展空间。

2.3、选题的研究背景

26 日,中国资本市场迎来一个新的里程碑,静安证券业务部挂牌代表着中国第一个证券交易柜台成立,标志着新中国正式进入股票交易的时代。经过二十几年的发展,我国的股票交易已经成为一个既庞大又活跃的市场,股票市场已在证券业乃至整个金融业占有举足轻重的地位,显示出其强大的生命力。与此同时,股票逐渐成为人们生活中投资的一个重要渠道。据中国证监会统计,从2009 年至2013 年 6 月止,我国境内上市公司数、股票总发行股本、股票成交金额、日均股票成交金额、股票有效账户数的基本情况如表所示: 表1-1 我国2009 年至2013 年 6 月的股市基本情况2009 年2010 年2011 年2012 年2013年6月境内上市公司数(A、B股) (家) 1718 2063 2342 2494 2491 股票总发行股本(A、B、H股亿股) 243939 265423 214758 38395 39762 股票成交金额(亿元) 535987 49582 421647 31723 28543 日均股票成交金额(亿元) 2197 2156 1728 1511 1679 股票有效帐户数(万户) 12038 13391 14050 14046 13677 资料来源:中国证券会统计年鉴,2009-2013 年. 而放眼全球,按可比口径粗略计算统

计各国股票总市值,截止至2013 年 4 月末, 按国家股票市值排名,我国以 3.71 万亿美元排名第 4 位,其中排名前三的国家分部为美国(20.68 万亿美元)、日本(4.49 万亿美元)、英国(3.82 万亿美元)。按交易所股票市值排名,上海证券交易所以 2.49 万亿美元股票市值,在全球交易所中排第7 位; 1 广东财经大学硕士学位论文基于时间价值的神经网络的股票价格预测深圳证券交易所以 1.22 万亿美元股票市值,在全球交易所中排第14 位。随着股票市场的发展,人们的生活也越来越多涉及股票投资。目前,许多家庭及个人理财选择股票投资方式,股票价格的涨停、跌停及每刻的价格变化趋势,无时无刻不牵动着投资者的心,也倍受政府的普遍关注。但从表面上看,股票市场是缺乏秩序、发展不完善,尤其是我国的股票市场,受政策影响极大,存在严重的炒作现象, 导致股票的价格不能合理的反映其内在价值,而传统的预测方法大都基于统计学,在预测过程中受到诸多因素的影响,导致效果较差。虽然传统分析方法有很强的理论依据,却缺乏指导股票投资现实意义[1]。因此,对于股票价格的预测是大多数股民的迫切需求,很多经济学家用其毕生精力,对股票市场的各种模型及其规律性进行研究。近十几年来,随着科学技术的不断发展,在各种理论的紧密结合与创新下,使股票分析向数量化、多层次的方向发展,其中人工神经网络作为一个具备自学习能力和自适应性的非线性系统,受到众多学者的青睐,神经网络通过学习和分析,不断地修正相应的权值、阀值,构建一个相对优化的模型[2]。因此,利用神经网络在建立合理性和实用性的预测模型中具有独特的优势,克服传统预测方法

的局限性,为股票价格预测提供一种可操作的有效方法。

2.4、课题背景

始,《Nature》以及《Science》等一流国际期刊上出现了多期与复杂性和网络科学相关的专辑。2012 年,Nature Physics 再一次重点提及复杂性。文献[1]提到一条题为The network takes over 的评论指出:”还原论作为一种范式已是寿终正寝,而复杂性作为一个领域也已疲惫不堪。基于数据的复杂系统的数学模型正以一种全新的视角快速发展成为一个新的学科:网络科学。” 复杂网络在近十年的发展中掀起了网络时代科学研究的热潮,受到了来自科学与工程等各个领域的强烈关注,为人们理解真实世界提供了新的研究思路和研究方法。我们可以利用网络刻画上至工程技术下至生物科学不同领域的复杂系统概况;同样,系统内部拓扑结构和动力学特性也依靠复杂网络理论支撑[2]。长此以往,该理论通过讨论互不相同的复杂系统间的公共特点和处理方法逐步扩展到其他领域,如,社会科学、能源科学等。如果说以前复杂网络的研究重点在于讨论节点之间的小世界性[3]和无标度性[4]等统计特性,那么如今复杂网络更多偏向于系统的物理规律。工程应用如何通过复杂网络理论实现,网络结构和系统功能有怎样的影响,逐步成为该理论研究的总体方向。对于各类复杂网络的研究均始于实证,凭借构建模型和动力学行为分析等手段,最终使二者结合并指导工程应用。着眼当代经济系统,不同商品市场联系紧密,证券市场、期货市场以及其他衍生品市场逐步形成网络;同种商品在

世界不同交易市场也表现高度的相关性质[5]。基于这种高度交叉集中的现象,使我们对经济系统同内部,商品收益和投资组合的研究提供了新的思路。在这方面研究中,人们大量选取金融时间序列,将其映射到复杂网络进一步研究。这种通过随机数据序列判断系统统计规律的方法称为时间序列分析,该方法结合随机过程和数理统计理论,对于解决实际问题有很大帮助。早在第二次世界大战时候,就有相关时间序列分析方法对经济进行预测[6]。一些深入的研究,例如:多维时间序列分析方法,也被广泛应用[7]。其理论依据主要是通过分析时间序列所反映的研究对象历史行为, 总结系统的结构特征,进一步预测运行规律[8,9]。也就是说,我们可以根据时间序列分析的方法对系统结构特征进行考察;通过研究结果对系统的行为加以预测和控制;修正和重新设计系统,使其按照新的结构运行。因此通过复杂网络的角度,对金融时间序列进行表征,制定金融市场证券-1- 哈尔滨工业大学理学硕士学位论文投资组合,研究不同行业之间的关联以及不同市场之间的联动,都具有丰富的理论价值和实际价值。

2.5、研究背景

科学得以存在的前提是宇宙在时间上的相关性,此时此刻的世界与它的历史之间存在着复杂而奇妙的联系。探究这种联系、有效地预见未来是科学理论的中心任务。无论是在自然科学,还是在社会科学领域的实际工作者和研究人员都要和一系列的观测数据打交道,这些观测数据随时间变化而相互关联,其排列顺序与大小体现了不同

时刻的观测值之间的相互联系,观测值之间的这种依赖关系或相关性,表征了产生这些数据的现象、过程或系统的某些时间变化特征和规律。我们把这些按照时间顺序产生和排列的观测数据序列称为时间序列。从系统意义上看,时间序列就是某一系统在不同时间(地点、条件等)的响应。这个定义从系统运行的观点出发,指出时间序列是按一定顺序排列而成的。这里的”一定顺序”既可以是时间顺序,也可以是具有各种不同意义的物理量,如代表温度,速度或其它单调递增的取值的物理量。时间序列按其性态可分为:(1)有确定性规律,即可用某个函数或方程描述的; (2)完全随机的;(3)具有一种分数维的无穷嵌套自相似结构的,即混沌的。混沌动力系统理论及基于实验的非线性时间序列分析的发展至少在一定程度上以深刻而简明的方式调和了唯象学和本体论之间的矛盾[1] 。非线性理论认为,一个系统即使有完全确定的模型,其精确解也会随着时间的推移出现不确定性。这种随机性变化具有某种不可预测性——混沌系统的”蝴蝶”效应。混沌时间序列就是由确定的非线性系统产生的某一时刻后的离散状态值。由于这种序- 1 - 中北大学学位论文列非常复杂,看上去似乎是一种毫无规则的”随机序列”。然而,从根本上讲,混沌时间序列是确定的非线性映射,它并不是随机时间序列。因此,混沌时间序列是可以预测的[2] 。混沌时间序列是由一个低维的具有非线性和确定性的动态系统产生的外表象随机信号但并非是随机信号的时间序列,这些序列中存在着一些与产生该序列的非线性动力学系统相关的固有的确定性和一些几何拓扑不变性。对于混沌的时间序列,由于其时延状态空

间中的相关性使得系统似乎有着某种记忆能力,因而具有一定的可预测性,其可预测时间尺度的长短与系统的复杂性有关。分析观测时间序列的演变规律是掌握系统动力学特性的重要手段。自从20世纪60 年代以来,来自天文、水文、气象等领域如气温的变化、径流量、降雨量等时间序列都被发现含有混沌特性。事实上,自然界中开放的、远离平衡的系统,非线性相互作用的系统都可能出现混沌现象。混沌时间序列的普遍存在性决定了对其研究的必要, 而混沌时间序列的自身特点又限制了传统方法的应用,需要研究新的方法。神经网络具有优良的非线性特性,非常适合于混沌序列预测的研究。人工神经网络技术在混沌时间序列预测中的应用研究具有非常广阔的发展前景。

2.6、时间序列的理论背景

3.2.1 时间序列和平稳过程首先,我们想知道时间序列的统计定义。这要从建模的本质谈起,数据的模型化实质上就是使建模对象成为一个随机过程{Xt , t∈T } 的现实(或者称样本轨道),而时间序列就是随机过程的一个现实,当然时间序列这一术语也可以表示随机过程本身。因此,处理一组数据的时候,我们就可以把这个序列看成一个时间序列,然后去努力寻求一个随机过程来拟合这个时间序列。有了这个启发,开始逐步发展出一套时间序列分析的理论。而在时间序列分析理论中,平稳过程起着决定性的作用。因为,许多样本序列表面看起来是非平稳的,但是可以对这些数据进行一些下面章节讨论的预

处理,预处理后的序列可以被看做某个平稳过程(例如本论文主要使用ARMA 过程) 的现实而被合理建模。平稳过程的理论就可以用来对预处理后的时间序列进行分析、拟合和预报。我们不在本论文中重复随机过程和平稳过程的定义,但是有一个概念非常重要,那就是自协方差函数,它是上述理论的基本工具。 3.2.2 自协方差函数和ACF 与PACF 函数18 对于随机过程{Xt , t∈T } ,满足?t ∈T , 有Var ( Xt ) p ,则偏自相关函数的估计量是渐近于均值为0,方差为1/n 的正态分布,也就是说大约有95%的偏样本自相关函数值落于了区间1 ±1.96n?2 之内; 2) 当时滞大于滑动平均阶数时,MA(q)过程的自相关函数与0 无显著差异; 而当时滞大于自回归阶数时,AR(p)过程的偏自相关函数与0 无显著差异。1 ρm q (3.7) lim ( ) 0 h→∞γ h = (3.8) 3.2.4 ARMA(p,q)过程和白噪声在时间序列分析中,ARMA 过程族在对预处理后的数据建模时起着关键性的作用。而本论文就是利用的ARMA(p,q)过程来拟合变换后序列的,所以在此介绍一些ARMA(p,q)过程的定义。称{Xt , t = 0, ±1, } 是ARMA(p,q)过程,如果{Xt}是平稳过程,且对任意t, 有式3.9 成立。称{Xt , t = 0, ±1, } 是均值为μ 的ARMA(p,q)过程,如果{Xt? μ } 是ARMA(p,q)过程。Xt?φ1 X t ?1 ? ? φ p X t? p = Z t + θ 1Z t ?1 + + θ q Z t ?q (3.9) ARMA(p,q)过程定义中的{Zt}是均值为0,方差为σ 2 的白噪声,也就是说{Zt} 满足{Zt }~ WN (0, σ 2 ) 。这句话其实就是白噪声的定义,白噪声是很重要的概念, 20 模型拟合的最后结果就是要用白噪声来表达原时间序列,否则就要利用对残差的进一步拟合结果来

时间序列分析_最经典的

【时间简“识”】 说明:本文摘自于经管之家(原人大经济论坛) 作者:胖胖小龟宝。原版请到经管之家(原人大经济论坛) 查看。 1.带你看看时间序列的简史 现在前面的话—— 时间序列作为一门统计学,经济学相结合的学科,在我们论坛,特别是五区计量经济学中是热门讨论话题。本月楼主推出新的系列专题——时间简“识”,旨在对时间序列方面进行知识扫盲(扫盲,仅仅扫盲而已……),同时也想借此吸引一些专业人士能够协助讨论和帮助大家解疑答惑。 在统计学的必修课里,时间序列估计是遭吐槽的重点科目了,其理论性强,虽然应用领域十分广泛,但往往在实际操作中会遇到很多“令人发指”的问题。所以本帖就从基础开始,为大家絮叨絮叨那些关于“时间”的故事!

Long long ago,有多long?估计大概7000年前吧,古埃及人把尼罗河涨落的情况逐天记录下来,这一记录也就被我们称作所谓的时间序列。记录这个河流涨落有什么意义?当时的人们并不是随手一记,而是对这个时间序列进行了长期的观察。结果,他们发现尼罗河的涨落非常有规律。掌握了尼罗河泛滥的规律,这帮助了古埃及对农耕和居所有了规划,使农业迅速发展,从而创建了埃及灿烂的史前文明。 好~~从上面那个故事我们看到了 1、时间序列的定义——按照时间的顺序把随机事件变化发展的过程记录下来就构成了一个时间序列。 2、时间序列分析的定义——对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的走势就是时间序列分析。 既然有了序列,那怎么拿来分析呢? 时间序列分析方法分为描述性时序分析和统计时序分析。 1、描述性时序分析——通过直观的数据比较或绘图观测,寻找序列中蕴含的发展规律,这种分析方法就称为描述性时序分析 ?描述性时序分析方法具有操作简单、直观有效的特点,它通常是人们进行统计时序分析的第一步。

平稳时间序列预测法

第七章 平稳时间序列预测法 基本内容 一、概述 1、 时间序列{}t y 取自某一个随机过程,如果此随机过程的随机特征不随时间变化,则我们称 过程是平稳的;假如该随机过程的随机特征随时间变化,则称过程是非平稳的。 2、 宽平稳时间序列的定义:设时间序列{}t y ,对于任意的t ,k 和m ,满足: ()()m t t y E y E += ()()k m t m t k t t y y y y ++++=,cov ,cov 则称{}t y 宽平稳。 3、Box-Jenkins 方法是一种理论较为完善的统计预测方法。他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARMA 模型识别、估计和诊断的系统方法。使ARMA 模型的建立有了一套完整、正规、结构化的建模方法,并且具有统计上的完善性和牢固的理论基础。 4、ARMA 模型三种基本形式:自回归模型(AR :Auto-regressive ),移动平均模型(MA : Moving-Average )和混合模型(ARMA :Auto-regressive Moving-Average )。 (1) 自回归模型AR(p):如果时间序列{}t y 满足t p t p t t y y y εφφ+++=-- (11) 其中{}t ε是独立同分布的随机变量序列,且满足: ()0=t E ε,()02>=εσεt Var 则称时间序列{}t y 服从p 阶自回归模型。或者记为()k t t y y B -=φ。 平稳条件:滞后算子多项式()p p B B B φφφ++-=...11的根均在单位圆外,即 ()0=B φ的根大于1。 (2) 移动平均模型MA(q):如果时间序列{}t y 满足q t q t t t y -----=εθεθε...11 则称时间序列{}t y 服从q 阶移动平均模型。或者记为()t t B y εθ=。 平稳条件:任何条件下都平稳。 (3) ARMA(p,q)模型:如果时间序列{}t y 满足 q t q t t p t p t t y y y -------+++=εθεθεφφ (1111) 则称时间序列{}t y 服从(p,q)阶自回归移动平均模型。或者记为()()t t B y B εθφ=。

【经济预测与决策】时间序列分析预测法

经济预测与决策第四章时间序列分析预测法时间序列分析预测法时间序列分析预测法是将预测目标的历史数据按照时间的顺序排列成为时间序列,然后分析它随时间的变化趋势, 外推预测目标的未来值。本章学习目的与要求通过本章的学习,了解时间序列的概念;掌握移动平均法和指数平滑法。本章学习重点和难点重点是移动平均法;难点是指数平滑法。本章内容提示第一节时间序列第二节移动平均法第三节指数平滑法第一节时间序列一、时间序列二、时间序列的影响因素三、时间序列因素的组合形式四、时间序列预测的步骤一、时间序列时间序列是指某种经济统计指标的数值,按时间先后顺序排列起来的数列。时间序列是时间t 的函数,若用Y 表示,则有:Y=Y(t )。时间序列时间序列按其指标不同,可分为绝对数时间序列、相对数时间序列和平均数时间序列三种。 绝对数时间序列是基本序列。可分为时期序列和时点序列两种。时期序列是指由反映某种社会经济现象在一段时期内发展过程的总量指标所构成的序列。如各个年度的国民生产总值。时点序列是指由反映某种社会经济现象在一定时点上的发展状况的指标所构成的序列。如各个年末的人口总数。 二、时间序列的影响因素一个时间序列是多种因素综合作用的结果。这些因素可以分为四种:1. 长期趋势变动2. 季节变动3. 循环变动4. 不规则变动1. 长期趋势变动长期趋势变动又称倾向变动,它是指伴随着经济的发展,在相当长的持续时间内,单方向的上升、下降或水平变动的因素。它反映了经济现象的主要 变动趋势。长期趋势变动是时间t 的函数,它反映了不可逆转的倾向的变动。长期趋势变动通常用T表示,T=T( t )。2.循环变动循环变动是围绕于

平稳时间序列预测法

7 平稳时间序列预测法 7.1 概述 7.2 时间序列的自相关分析 7.3 单位根检验和协整检验 7.4 ARMA模型的建模 回总目录 7.1 概述 时间序列取自某一个随机过程,则称: 一、平稳时间序列 过程是平稳的――随机过程的随机特征不随时间变化而变化过程是非平稳的――随机过程的随机特征随时间变化而变化回总目录 回本章目录 宽平稳时间序列的定义: 设时间序列 ,对于任意的t,k和m,满足: 则称宽平稳。 回总目录

回本章目录 Box-Jenkins方法是一种理论较为完善的统计预测方法。 他们的工作为实际工作者提供了对时间序列进行分析、预测,以及对ARMA模型识别、估计和诊断的系统方 法。使ARMA模型的建立有了一套完整、正规、结构 化的建模方法,并且具有统计上的完善性和牢固的理 论基础。 ARMA模型是描述平稳随机序列的最常用的一种模型; 回总目录 回本章目录 ARMA模型三种基本形式: 自回归模型(AR:Auto-regressive); 移动平均模型(MA:Moving-Average); 混合模型(ARMA:Auto-regressive Moving-Average)。回总目录 回本章目录 如果时间序列满足 其中是独立同分布的随机变量序列,且满足:

则称时间序列服从p阶自回归模型。 二、自回归模型 回总目录 回本章目录 自回归模型的平稳条件: 滞后算子多项式 的根均在单位圆外,即 的根大于1。 回总目录 回本章目录 如果时间序列满足 则称时间序列服从q阶移动平均模型。或者记为。 平稳条件:任何条件下都平稳。

三、移动平均模型MA(q) 回总目录 回本章目录 四、ARMA(p,q)模型 如果时间序列 满足: 则称时间序列服从(p,q)阶自回归移动平均模型。 或者记为: 回总目录 回本章目录 q=0,模型即为AR(p); p=0,模型即为MA(q)。 ARMA(p,q)模型特殊情况: 回总目录 回本章目录 例题分析 设 ,其中A与B 为两个独立的零均值随机变量,方差为1;

基于时间序列分析的股票价格短期预测与分析

基于时间序列分析的股票价格短期预测与 分析 姓名:王红芳数学与应用数学一班指导老师:魏友华 摘要 时间序列分析是经济领域研究的重要工具之一,它描述历史数据随时间变化的规律,并用于预测经济变量值。在股票市场上,时间序列预测法常用于对股票价格趋势进行预测,为投资者和股票市场管理方提供决策依据。本文通过各种预测方法的对比,突出时间序列分析的优势,从时间序列的概念出发介绍了时间序列分析预测法的基础以及其简单的应用模型。文中使用中石化股票的历史收盘价数据,运用时间序列预测法预测出中石化股票的后五个交易日的收盘价,通过对预测价格和实际价格做出对比,表明时间序列预测法的效果比较好。 关键词:时间序列;股票价格;预测

The short-term stock price prediction based on time series analysis Abstract: The analysis of time series is one of the important tools for researching in the field of economy, it describes the law of historic data with the time passing by and it is also used to predict the value of economic variables. In the stock market, the forecasting method of time series is commonly used to forecast the trend of stock price, and provide evidence of decision making for investors and managements. In the thesis, through the comparison of various forecasting methods to highlight the advantages of the analysis of time series, beginning with the concept of time series, I introduce the basic of forecasting method of the analysis of time series as well as its simple application model. in the paper, I use the historic closing price data of Sinopec shares and the forecasting method of time series to predict the Sinopec shares' closing price of the last five days, and by comparison between predicting price and actual price to show the good effect of the forecasting method of time series. Keywords: Time series; Stock price; Forecast

时间序列分析方法第章预测

第四章 预 测 在本章当中我们讨论预测的一般概念和方法,然后分析利用),(q p ARMA 模型进行预测的问题。 §4.1 预期原理 利用各种条件对某个变量下一个时点或者时间阶段内取值的判断是预测的重要情形。为此,需要了解如何确定预测值和度量预测的精度。 4.1.1 基于条件预期的预测 假设我们可以观察到一组随机变量t X 的样本值,然后利用这些数据预测随机变量1+t Y 的值。特别地,一个最为简单的情形就是利用t Y 的前m 个样本值预测1+t Y ,此时t X 可以描述为: 假设*|1t t Y +表示根据t X 对于1+t Y 做出的预测。那么如何度量预测效果呢?通常情况下,我们利用损失函数来度量预测效果的优劣。假设预测值与真实值之间的偏离作为损失,则简单的二次损失函数可以表示为(该度量也称为预测的均方误差): 定理4.1 使得预测均方误差达到最小的预测是给定t X 时,对1 +t Y 的条件数学期望,即: 证明:假设基于t X 对1+t Y 的任意预测值为: 则此预测的均方误差为: 对上式均方误差进行分解,可以得到: 其中交叉项的数学期望为(利用数学期望的叠代法则): 因此均方误差为: 为了使得均方误差达到最小,则有: 此时最优预测的均方误差为: 211*|1)]|([)(t t t t t X Y E Y E Y MSE +++-= End 我们以后经常使用条件数学期望作为随机变量的预测值。 4.1.2 基于线性投影的预测 由于上述条件数学期望比较难以确定,因此将预测函数的范围限制在线性函数当中,我们考虑下述线性预测: 如此预测的选取是所有预测变量的线性组合,预测的优劣则体现在系数向量的选择上。 定义4.1 如果我们可以求出一个系数向量值α,使得预测误差)(1t t X Y α'-+与t X 不相关: 则称预测t X α'为1+t Y 基于t X 的线性投影。 定理4.2 在所有线性预测当中,线性投影预测具有最小的均方误差。

时间序列分析法原理及步骤(精)

时间序列分析法原理及步骤 ----目标变量随决策变量随时间序列变化系统 一、认识时间序列变动特征 认识时间序列所具有的变动特征, 以便在系统预测时选择采用不同的方法 1》随机性:均匀分布、无规则分布,可能符合某统计分布(用因变量的散点图和直方图及其包含的正态分布检验随机性, 大多服从正态分布 2》平稳性:样本序列的自相关函数在某一固定水平线附近摆动, 即方差和数学期望稳定为常数 识别序列特征可利用函数 ACF :其中是的 k 阶自 协方差,且 平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋于 0, 前者测度当前序列与先前序列之间简单和常规的相关程度, 后者是在控制其它先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。实际上, 预测模型大都难以满足这些条件, 现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。 二、选择模型形式和参数检验 1》自回归 AR(p模型

模型意义仅通过时间序列变量的自身历史观测值来反映有关因素对预测目标的影响和作用,不受模型变量互相独立的假设条件约束,所构成的模型可以消除普通回归预测方法中由于自变量选择、多重共线性的比你更造成的困难用 PACF 函数判别 (从 p 阶开始的所有偏自相关系数均为 0 2》移动平均 MA(q模型 识别条件

平稳时间序列的偏相关系数和自相关系数均不截尾,但较快收敛到 0, 则该时间序列可能是 ARMA(p,q模型。实际问题中,多数要用此模型。因此建模解模的主要工作时求解 p,q 和φ、θ的值,检验和的值。 模型阶数 实际应用中 p,q 一般不超过 2. 3》自回归综合移动平均 ARIMA(p,d,q模型 模型含义 模型形式类似 ARMA(p,q模型, 但数据必须经过特殊处理。特别当线性时间序列非平稳时,不能直接利用 ARMA(p,q模型,但可以利用有限阶差分使非平稳时间序列平稳化,实际应用中 d (差分次数一般不超过 2. 模型识别 平稳时间序列的偏相关系数和自相关系数均不截尾,且缓慢衰减收敛,则该时间序列可能是 ARIMA(p,d,q模型。若时间序列存在周期性波动, 则可按时间周期进

时间序列分析方法第资料章范文预测

第四章 预 测 在本章当中我们讨论预测的一般概念和方法,然后分析利用),(q p ARMA 模型进行预测的问题。 § 预期原理 利用各种条件对某个变量下一个时点或者时间阶段内取值的判断是预测的重要情形。为此,需要了解如何确定预测值和度量预测的精度。 4.1.1 基于条件预期的预测 假设我们可以观察到一组随机变量t X 的样本值,然后利用这些数据预测随机变量1+t Y 的值。特别地,一个最为简单的情形就是利用t Y 的前m 个样本值预测1+t Y ,此时t X 可以描述为: 假设*|1t t Y +表示根据t X 对于1+t Y 做出的预测。那么如何度量预测效果呢?通常情况下,我们利用损失函数来度量预测效果的优劣。假设预测值与真实值之间的偏离作为损失,则简单的二次损失函数可以表示为(该度量也称为预测的均方误差): 定理 使得预测均方误差达到最小的预测是给定t X 时,对1+t Y 的条件数学期望,即: 证明:假设基于t X 对1+t Y 的任意预测值为: 则此预测的均方误差为: 对上式均方误差进行分解,可以得到: 其中交叉项的数学期望为(利用数学期望的叠代法则): 因此均方误差为: 为了使得均方误差达到最小,则有: 此时最优预测的均方误差为: 211*|1)]|([)(t t t t t X Y E Y E Y MSE +++-= End 我们以后经常使用条件数学期望作为随机变量的预测值。 4.1.2 基于线性投影的预测 由于上述条件数学期望比较难以确定,因此将预测函数的范围限制在线性函数当中,我们考虑下述线性预测: 如此预测的选取是所有预测变量的线性组合,预测的优劣则体现在系数向量的选择上。 定义 如果我们可以求出一个系数向量值α,使得预测误差)(1t t X Y α'-+与t X 不相关: 则称预测t X α'为1+t Y 基于t X 的线性投影。 定理 在所有线性预测当中,线性投影预测具有最小的均方误差。 证明:假设t X g '是任意一个线性预测,则对应的均方误差可以分解为: 由于t X α'是线性投影,则有:

第13章时间序列分析和预测

第13章时间序列分析和预测 三、选择题 1.不存在趋势的序列称为()。 A. 平稳序列B. 周期性序列 C. 季节性序列D. 非平稳序列 2.包含趋势性、季节性或周期性的序列称为()。 A. 平稳序列B. 周期性序列 C. 季节性序列D. 非平稳序列 3.时间序列在长时期内呈现出来的某种持续向上或持续下降的变动称为()。A. 趋势B. 季节性C. 周期性D. 随机性 < 4.时间序列在一年内重复出现的周期性波动称为()。 A. 趋势B. 季节性C. 周期性D. 随机性 5.时间序列中呈现出来的围绕长期趋势的一种波浪形或振荡式变动称为()。A. 趋势B. 季节性C. 周期性D. 随机性 6.时间序列中除去趋势、周期性和季节性之后的偶然性波动称为()。A. 趋势B. 季节性C. 周期性D. 随机性 7.从下面的图形可以判断该时间序列中存在()。 A. 趋势B. 季节性C. 周期性D. 趋势和随机性 8.增长率是时间序列中()。 … A. 报告期观察值与基期观察值之比 B. 报告期观察值与基期观察值之比减1后的结果 C. 报告期观察值与基期观察值之比加1后的结果 D. 基期观察值与报告期观察值之比减1后的结果 9.环比增长率是()。 A. 报告期观察值与前一时期观察值之比减1 B. 报告期观察值与前一时期观察值之比加1 C. 报告期观察值与某一固定时期观察值之比减1 D. 报告期观察值与某一固定时期观察值之比加1 10.定基增长率是()。 , A. 报告期观察值与前一时期观察值之比减1

B. 报告期观察值与前一时期观察值之比加1 C. 报告期观察值与某一固定时期观察值之比减1 D. 报告期观察值与某一固定时期观察值之比加1 11.时间序列中各逐期环比值的几何平均数减1后的结果称为 ( )。 A. 环比增长率 B. 定基增长率 C. 平均增长率 D. 年度化增长率 12.增长1个百分点而增加的绝对数量称为 ( )。 A. 环比增长率 B. 平均增长率 C. 年度化增长率 D. 增长1%绝对值 * 13.判断时间序列是否存在趋势成分的一种方法是 ( )。 A. 计算环比增长率 B. 利用回归分析拟合一条趋势线 C. 计算平均增长率 D. 计算季节指数 14.指数平滑法适合于预测 ( )。 A. 平稳序列 B. 非平稳序列 C. 有趋势成分的序列 D. 有季节成分的序列 15.移动平均法适合于预测 ( )。 A. 平稳序列 B. 非平稳序列 C. 有趋势成分的序列 D. 有季节成分的序列 16.下面的哪种方法不适合于对平稳序列的预测 ( )。 # A. 移动平均法 B. 简单平均法 C. 指数平滑法 D. 线性模型法 17.下面的公式哪一个是均方误差 ( )。 A.n Y E Y i i i ∑???? ???-100 B. n E Y i i ∑- C. () n E Y n i i i ∑=-12 D. ()n E Y n i i i ∑=-1 18.通过对时间序列逐期递移求得平均数作为预测值的一种预测方法称为 ( )。 A. 简单平均法 B. 加权平均法 C. 移动平均法 D. 指数平滑法 19.指数平滑法得到t+1期的预测值等于 ( )。 A. t 期的实际观察值与第t+1期指数平滑值的加权平均值 @ B. t 期的实际观察值与第t 期指数平滑值的加权平均值 C. t 期的实际观察值与第t+1期实际观察值的加权平均值 D. t+1期的实际观察值与第t 期指数平滑值的加权平均值 20.在使用指数平滑法进行预测时,如果时间序列有较大的随机波动,则平滑系数α的取值 ( )。 A. 应该小些 B. 应该大些

时间序列分析-降水量预测模型

课程名称: 时间序列分析 题目: 降水量预测 院系:理学院 专业班级:数学与应用数学10-1 学号: 87 学生姓名:戴永红 指导教师:__潘洁_ 2013年 12 月 13日

1.问题提出 能不能通过以前的降水序列为样本预测出2002的降水量? 2.选题 以国家黄河水利委员会建站的山西省河曲水文站1952年至2002年51年的资料为例,以1952年至2001年50年的降水序列作为样本,建立线性时间序列模型并预测2002年的降水状态与降水量,并与2002年的实际数据比较说明本模型的具体应用及预测效果。资料数据见表1。 表1 山西省河曲水文站55年降水量时间序列

3.原理 模型表示 均值为0,具有有理谱密度的平稳时间序列的线性随机模型的三种形式,描述如下: 1、()AR p 自回归模型:1122t t t p t p t ωφωφωφωα-------=L 由2p +个参数刻画; 2、()MA q 滑动平均模型:1122t t t t q t q ωαθαθαθα---=----L 由2q +个参数刻画; 3、(,)ARMA p q 混和模型: 11221122t t t p t p t t t q t q ωφωφωφωαθαθαθα----------=----L L (,)ARMA p q 混和模型由3p q ++个参数刻画; 自相关函数k ρ和偏相关函数kk φ 1、自相关函数k ρ刻画了任意两个时刻之间的关系,0/k k ργγ= 2、偏相关函数kk φ刻画了平稳序列任意一个长1k +的片段在中间值11,t t k ωω++-L 固定的条件下,两端t ω,t k ω+的线性联系密切程度。 3、线性模型k ρ、kk φ的性质 表2 三种线性模型下相关函数性质 模型识别

实验四平稳时间序列模型预测

实验四平稳时间序列模型预测 一、实验目的 1、掌握平稳时间序列分析模型的分析方法和步骤 2、会求平稳时间序列的自相关函数和偏相关函数 3、掌握模型类别和阶数的确定 二、实验设备 计算机、Matlab软件 三、实验内容与步骤 已知平稳时间序列{}一个长为50的样本数据如下表:number Zi 1-10289 285 289 286 288 287 288 292 291 291 11-20292 296 297 301 304 304 303 307 299 296 21-30293 301 293 301 295 284 286 286 287 284 31-40282 278 281 278 277 279 278 270 268 272 41-50273 279 279 280 275 271 277 278 279 285 51-60301 295 281 278 278 270 286 288 279 279

每个同学以自己的学号为起点,循环计数50重新排序,如:学号为3的学生样本数据为:Z3,Z4……Z50,Z1,Z2,编程计算,并打印下列: 1、 2、 3、利用递推公式计算样本的偏相关系数 4、 5、确定模型的类别和阶数 四、实验原理 平稳时间序列的模型估计与预测原理 样本自协方差函数: 样本自相关函数: 样本偏相关函数 3、利用与的拖尾和截尾性质判定类型和阶数 五、实验报告要求 1、写出详细的计算步骤及设计原理; 2、按实验内容的要求打印图形; 3、附上程序和必要的注解。 六.实验过程 function y = experiment4 close all;clc; % r = [];p1 = [];p = []; % Fai = [];FAI = []; %学号21

时间序列分析实验平稳性

时间序列数据平稳性检验实验指导 一、实验目的: 理解经济时间序列存在的不平稳性,掌握对时间序列平稳性检验的步骤和各种方法,认识利用不平稳的序列进行建模所造成的影响。 二、基本概念: 如果一个随机过程的均值和方差在时间过程上都是常数,并且在任何两时期的协方差值仅依赖于该两个时期间的间隔,而不依赖于计算这个协方差的实际时间,就称它是宽平稳的。 时序图 ADF检验 PP检验 三、实验内容及要求: 1、实验内容: 用Eviews5.1来分析1964年到1999年中国纱产量的时间序列,主要内容: (1)、通过时序图看时间序列的平稳性,这个方法很直观,但比较粗糙; (2)、通过计算序列的自相关和偏自相关系数,根据平稳时间序列的性质观察其平稳性;(3)、进行纯随机性检验; (4)、平稳性的ADF检验; (5)、平稳性的pp检验。 2、实验要求: (1)理解不平稳的含义和影响; (2)熟悉对序列平稳化处理的各种方法; (2)对相应过程会熟练软件操作,对软件分析结果进行分析。 四、实验指导 (1)、绘制时间序列图 时序图可以大致看出序列的平稳性,平稳序列的时序图应该显示出序列始终围绕一个常数值波动,且波动的范围不大。如果观察序列的时序图显示出该序列有明显的趋势或周期,那它通常不是平稳序列,现以1964-1999年中国纱年产量序列(单位:万吨)来说明。 在EVIEWS中建立工作文件,在“Workfile structure type”栏中选择“Dated-regular frequency”,在右边的“Date specification”中输入起始年1964,终止年1999,点击ok则建立了工作文件。找到中国纱年产量序列的excel文件并导入命名该序列为sha,见图1-2。 图1-1 建立工作文件

统计学之时间序列分析在经济预测中的应用

《时间序列分析》案例

案例名称:时间序列分析在经济预测中的应用内容要求:确定性与随机性时间序列之比较设计作者:许启发,王艳明 设计时间:2003年8月

案例四:时间序列分析在经济预测中的应用 一、案例简介 为了配合《统计学》课程时间序列分析部分的课堂教学,提高学生运用统计分析方法解决实际问题的能力,我们组织了一次案例教学,其内容是:对烟台市的未来经济发展状况作一预测分析,数据取烟台市1949—1998年国内生产总值(GDP)的年度数据,并以此为依据建立预测模型,对1999年和2000年的国内生产总值作出预测并检验其预测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终成果,是反映国民经济活动最重要的经济指标之一,科学地预测该指标,对制定经济发展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时,我们首先将数据资料印发给学生,并讲清本案例的教学目的与要求,明确案例所涉及的教学内容;然后给学生一段时间,由学生根据资料,运用不同的方法进行预测分析,并确定具体的讨论日期;在课堂讨论时让学生自由发言,阐述自己的观点;最后,由主持教师作点评发言,取得了良好的教学效果。 经济预测是研究客观经济过程未来一定时期的发展变化趋势,其目的在于通过对客观经济现象历史规律的探讨和现状的研究,求得对未来经济活动的了解,以确定社会经济活动的发展水平,为决策提供依据。 时间序列分析预测法,首先将预测目标的历史数据按照时间的先后顺序排列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动进行预测,无须添加任何的辅助信息。 本案例的最大特色在于:它汇集了统计学原理中的时间序列分析这一章节的所有知识点,通过本案例的教学,可以把不同的时间序列分析方法进行综合的比较,便于学生更好地掌握本章的内容。 二、案例的目的与要求 (一)教学目的 1.通过本案例的教学,使学生认识到时间序列分析方法在实际工作中应用的必要性和可能性; 2.本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机的结合在一起,以巩固学生所学的课本知识,深化学生对课本知识的理解; 3.本案例是对烟台市的国内生产总值数据进行预测,通过对实证结果的比较和分析,使学生认识到对同一问题的解决,可以采取不同的方法,根据约束条件,从中选择一种合适的预测方法; 4.通过本案例的教学,让学生掌握EXCEL软件在时间序列分析中的应用,对统计、计量分析软件SPSS或Eviews等有一个初步的了解; 5.通过本案例的教学,有助于提高学生运用所学知识和方法分析解决问题的能力、合作共事的能力和沟通交流的能力。 (二)教学要求 1.学生必须具备相应的时间序列分析的基本理论知识; 2.学生必须熟悉相应的预测方法和具备一定的数据处理能力; 3.学生以主角身份积极地参与到案例分析中来,主动地分析和解决案例中的问题; 4.在提出解决问题的方案之前,学生可以根据提供的样本数据,自己选择不同的统计分析方法,对这一案例进行预测,比较不同预测方法的异同,提出若干可供选择的方案;

平稳时间序列分析

第3章平稳时刻序列分析 本章教学内容与要求:了解时刻序列分析的方法性工具;理解并掌握ARMA模型的性质;掌握时刻序列建模的方法步骤及预测;能够利用软件进行模型的识不、参数的可能以及序列的建模与预测。 本章教学重点与难点:利用软件进行模型的识不、参数的可能以及序列的建模与预测。 打算课时:21(讲授16课时,上机3课时、习题3课时)教学方法与手段:课堂讲授与上机操作 §3.1 方法性工具 一个序列通过预处理被识不为平稳非白噪声序列,那就讲明该序列是一个蕴含着相关信息的平稳序列。在统计上,我么通常是建立一个线性模型来拟合该序列的进展,借此提取该序列中的

有用信息。ARMA(auto regression moving average)模型是目前最常用的一个平稳序列拟合模型。 时刻序列分析中一些常用的方法性工具能够使我们的模型表达和序列分析更加简洁、方便。 一、差分运算 (一)p 阶差分 相距一期的两个序列值之间的减法运算称为1阶差分运算。记▽t x 为t x 的1阶差分: ▽1t t t x x x --= 对1阶差分后的序列再进行一次1阶差分运算称为2阶差分,记▽ 2 t x 为t x 的 2阶差分: ▽ 2 t x =▽t x -▽1-t x 以此类推,对p-1阶差分厚序列再进行一次1阶差分运算称为p 阶差分。记▽ p t x 为t x 的 p 阶差分: ▽ p t x =▽ p-1 t x -▽p-1 1-t x (二)k 步差分 相距k 期的两个序列值之间的减法运算称为k 步差分运算。记▽k t x 为t x 的k 步差分: ▽k =k t t x x --

(优质)(时间管理)第三章平稳时间序列分析

(时间管理)第三章平稳时 间序列分析

t P p t t t t t x B x x B x Bx x ===--- 221第3章 平稳时间序列分析 一个序列经过预处理被识别为平稳非白噪声序列,那就说明该序列是一个蕴含着相关信息的平稳序列。 3.1方法性工具 3.1.1差分运算 一、p 阶差分 记为的1阶差分: 记为的2阶差分: 以此类推:记为的p 阶差分: 二、k 步差分 记为的k 步差分: 3.1.2延迟算子 一、定义 延迟算子相当与一个时间指针,当前序列值乘以一个延迟算子,就相当于把当前序列值的时间向过去拨了一个时刻。记B 为延迟算子,有 延迟算子的性质: 1. 2.若c 为任一常数,有 3.对任意俩个序列 {}和{},有 4. 5. 二、用延迟算子表示差分运算

1、p阶差分 2、k步差分 3.2ARMA模型的性质 3.2.1AR模型 定义具有如下结构的模型称为p阶自回归模型,简记为AR(p): (3.4) AR(p)模型有三个限制条件: 条件一:。这个限制条件保证了模型的最高阶数为p。 条件二:。这个限制条件实际上是要求随机干扰序列为零均值白噪声序列。 条件三:。这个限制条件说明当期的随机干扰与过去的序列值无关。 通常把AR(p)模型简记为: (3.5) 当时,自回归模型式(3.4)又称为中心化AR(p)模型。非中心化AR(p)序列可以通过下面变化中心化AR(p)系列。 令 则{}为{}的中心化序列。 AR(p)模型又可以记为: ,其中称为p阶自回归系数多项式 二、AR模型平稳性判断 P45【例3.1】考察如下四个AR模型的平稳性: 拟合这四个序列的序列值,并会绘制时序图,发现(1)(3)模型平稳,(2)(4)模型非平稳 1、特征根判别

时间序列分析与预测论文

对1950-2009年的新疆社会消费品零售总额的时间序列分析与预测 利用1950-2009年的新疆社会消费品零售总额(记为:save,单位:万元)的时间序列数据进行分析,建立时间序列ARIMA模型,并预测未来10年的社会消费品零售总额。 表1 1950-2009年的新疆社会消费品零售总额 数据来源:《新疆统计年鉴2010》,《新疆五十年》 模型应用 dataa; input date cost; cards; 1950 21920 195129023 1952 36646 195343198 195452216 1955 61379 1956 71464 1957 85578

1958 924901959 110526 1960 119059 1961 106780 1962 105454 1963 100837 1964105406 19651129701966121349 1967 129530 19681229711969 131318 1970 132306 1971 137958 1972 143416 1973 154676 1974158035 1975 168486 1976 181377 1977193457 1978 2188651979 247796 1980 293590 1981340739 1982 364133 1983413324 1984 461439 1985 573842 1986638981 19877239131988 8869861989 981497 1990 1043041 19911215180 199213824521993 1683737 19941971086 1995 2536475 1996 2953597 1997 3104197199832752101999 3473958 2000 3744999 2001 4063487

相关文档