文档库 最新最全的文档下载
当前位置:文档库 › 数学建模时间序列分析

数学建模时间序列分析

数学建模时间序列分析
数学建模时间序列分析

基于Excel的时间序列预测与分析

1 时序分析方法简介

1.1时间序列相关概念

1.1.1 时间序列的内涵以及组成因素

所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。

时间序列的变化受许多因素的影响 ,有些起着长期的、决定性的作用 ,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。影响时间序列的构成因素可归纳为以下四种:

(1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。这一变化通常是许多长期因素的结果。

(2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。这种因素是因经济多年的周期性变动产生的。比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增

地趋势线上下方。

(3)季节性变化(Seasonal variation),指现象受季节性影响 ,按一固定周期呈现出的周期波动变化。尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。

(4)不规则变化(Irregular movement),指现象受偶然因素的影响而呈现出的不规则波动。这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。不规则因素是由短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。

时间序列一般是以上几种变化形式的叠加或组合出现的(如图1.4)。

图1.1 平稳序列图1.2 趋势序列

图1.3 季节型序列图1.4 含有季节与趋势因素的序列

1.1.2 时间序列的分类

根据其所研究的依据不同,可有不同的分类:

(1)按所研究的对象的多少来分,有一元时间序列和多元时间序列。如某种商品的销售量数列,即为一元时间序列;如果所研究对象不仅仅是这一数列,而是多个变量,如按年、月顺序排序的气温、气压、雨量数据等,每个时刻对应着多个变量,则这种序列为多元时间序列。

(2)按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列;如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。

(3)按序列的统计特性分,有平稳时间序列和非平稳时间序列两类。所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。平稳序列的时序图直

观上应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征;从理论上讲,分为严平稳与宽平稳两种。相对的,时间序列的非平稳性,是指时间序列的统计规律随着时间的推移而发生变化。

(4)按序列的分布规律来分,有高斯型(Guassian) 和非高斯型时间序列(non-Guassian)

1.2 时间序列分析概述

时间序列分析是一种广泛应用的数据分析方法,它研究的是代表某一现象的一串随时间变化而又相关联的数字系列(动态数据),从而描述和探索该现象随时间发展变化的规律性。时间序列的分析利用的手段可以通过直观简便的数据图法、指标法、模型法等来分析,而模型法应用更确切和适用也比较前两种方法复杂,能更本质地了解数据的内在结构和复杂特征,以达到控制与预测的目的。时间序列分析方法包括:

(1)确定性时序分析:它是暂时过滤掉随机性因素(如季节因素、趋势变动)进行确定性分析方法,其基本思想是用一个确定的时间函数()t f y =来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述。具体可分为趋势预测法(最小二乘)、平滑预测法、分解分析法等;

(2)随机性时序分析:其基本思想是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构建立自回归、滑动平均、自回归滑动平均混合模型来来对时间序列进行预测。

为了对时间序列分析方法有一个比较全面的了解,现将时间序列分析方法归纳如下:

????

??

????

??????

?

??????

??

?

????

?

??????

??

?

?平均模型等

采用自回归模型、滑动贝叶斯分析马尔可夫分析不可控时序分析可控多元时序分析一元随机性时序分析平滑法等

采用移动平均法、指数趋势加周期波动分析周期波动分析

趋势变动分析发展水平分析确定性时序分析时间序列分析

//

1.3 确定性时间序列分析

由1.1的介绍,我们知道时间序列的变动是长期趋势变动、季节变动、循环变动、不规则变动的耦合或叠加。在确定性时间序列分析中通过移动平均、指数平滑、最小二乘法

等方法来体现出社会经济现象的长期趋势及带季节因子的长期趋势,预测未来的发展趋势。

1.3.1 移动平均法

通过对时间序列逐期递移求得平均数作为预测值的一种方法叫移动平均法,它是对时间序列进行修匀,边移动边平均以排除偶然因素对原序列的影响,进而测定长期趋势的方法。其简单的计算公式为:

预测值=最后n 个值的平均

其中: n =被认为是与预测下一个时期相关的最近的时期数

采用Excel 进行移动平均时,在【数据分析】选项中选择【移动平均】,并在对话框中输入数据区域和移动间隔即可。

说明:n 的选择:

采用移动平均法进行预测 ,用来求平均数的时期数n 的选择非常重要,这也是移动平均的难点。因为n 取值的大小对对所计算的平均数的影响较大。当1=n 时,移动平均预测值为原数据的序列值。当n =全部数据的个数时,移动平均值等于且为全部数据的算术平均值。显然,n 值越小,表明对近期观测值预测的作用越重视 ,预测值对数据变化的反应速度也越快,但预测的修匀程度较低,估计值的精度也可能降低。反之,n 值越大,预测值的修匀程度越高,但对数据变化的反映程度较慢。

不存在一个确定时期n 值的规则。一般n 在3~200之间,视序列长度和预测目标情况而定。一般对水平型数据,n 值的选取较为随意;一般情况下,如果考虑到历史上序列 中含有大量随机成分,或者序列的基本发展趋势变化不大,则n 应取大一点。对于具有趋 势性或阶跃性特点的数据,为提高预测值对数据变化的反应速度,减少预测误差,n 值取 较小一些,以使移动平均值更能反映目前的发展变化趋势。

一般n 的取值为3~15。具体取值要看实际情况,可由均方差MSE 来评价(MSE 的概念在第3节“预测方法的评估”中介绍)。

1.3.2 指数平滑法

指数平滑法是对过去的观测值加权平均进行预测,使第1+t 期的预测值等于t 期的实际观测值与第t 期指数平滑值的加权平均值,即

预测值=α(上期值)+)1(α-(上次预测值)

一次指数平滑法预测模型为:()t t t M y M αα-+=+11 (1-1)

其中:t M ——第t 期预测值;

t y ——第t 期的实际观测值;

α——平滑系数,且10<<α。

将 ()2211----+=t t t M y M αα

()3

22

1----+=t t t M

y M

αα

代入(1-1)式中,可得:()

∑=--=

t

i i

t i

t y M 0

1αα (1-2)

公式(1-2)中各项系数和为:

()()

()

()()()t t t

t α

ααααααααα-+??

????----=-+-++-+-111111111

当∞→t 时, ()01→-t

α, 系数和1→。

所以,可以说t M 是t 期以及以前各期观察值的指数加权平均值,观察值的权数按递推周期以几何级数递减,各期的数据离第t 期越远,它的系数愈小,因此它对预测值的影响也越小。

公式(1-1)稍作变换可得:)-(+=+t t t t M y M M α1 (1-3) 可见,1+t M 是t 期的预测值t M 加上用α调整的t 期的预测误差)-(t t M y 。因此,简单指数平滑法用于预测实际上是根据本期预测误差对本期预测值作出一定的调整后得到的下一个预测值,即:

新的预测值=老的预测值+α?老预测值的误差

对老预测值所作的调整的幅度视α的大小而定。 说明: 平滑系数α的选择:

α的取值对平滑效果影响很大, α越小平滑效果越显著. α取值的大小决定了在平

滑值中起作用的的观察值的项数的多少,当α取值较大时,各观察值权数的递减速度快,因此在平滑值中起作用的观察值的项数就较少;而当α取值较小时,各观察值权数的递减速度很慢,因此在平滑值中起作用的观察值的项数就较多。

如果用移动平均数与指数平滑法相比,要使两者具有相同的灵敏程度,移动平均数n 的取值与指数平滑法中α的取值有如下关系:

α

α

-=-12

1n

当α取值0.05~0.3之间时,如果要使移动平均具有相应的灵敏程度,则N 的取值为:

当α取值较小时,指数平滑法的平滑能力较强,而α取值较大时,模型对现象变化的反应速度较快。一般来说α取值的大小应当视所预测对象的特点及预测期的长短而定。一般情况下,观测值呈较稳定的水平发展,α值取0.1~0.3之间;观测值波动较大时α,值取0.3~0.5之间;观测值呈波动很大时,α值取0.5~0.8之间。

采用Excel 进行指数平滑预测步骤如下: 1、选择在【数据分析】选项中选择【指数平滑】; 2、在【输入区域】中输入数据区域;

3、在【阻尼系数】输入α-1的值(注:阻尼系数=α-1);

4、在【输出区域】中选择预测结果输出位置;单击【确定】即可。

1.3.3 趋势预测

(1)线性趋势预测模型:bt a y t +=

用最小二乘法求待定参数a 、b 决定于标准方程组:

??

?+=

+=∑∑∑∑∑∑2

t

b t ty t b a y ?()

??

??

?-=-

-=∑∑∑∑∑t

b y a t t n y t ty n b ]

[)(2

2

趋势预测的误差可用线性回归中的估计标准误差来衡量。

公式为:()2

?1

2

--=

∑=n y

y s n

i i i

y

(2) 二次曲线趋势预测模型:2?ct bt a y

t ++= 根据最小二乘法推导待定参数a 、b 、c 的标准方程组:

?

????++=++=++=∑∑∑∑∑∑∑∑∑∑∑.

,,43223

22

t c t b t a y t t c t b t a ty t c t b na y

(3)指数曲线趋势预测模型:

t t ab y

=?,其中a 、b 为未知数。

在这里必须要把指数先通过变量代换转化为直线趋势才能用最小二乘法来求参数,

即:两边取对数b t a y

t ln ln ?ln +=,再根据直线形式的常数确定方法,可求得a ln 、b ln ,

最后取反对数得到a 、b 的值。

从总体上来说,确定性时序分析刻画了序列的主要趋势是直观简单、便于计算,但是比较粗略的,不能严格反映实际的变化规律,为了严格反映时序的变化必须结合随机时序分析法进一步完善对社会经济现象的分析以便进行决策。

1.4 随机性时间序列分析 1.4.1 平稳随机时间序列分析

在随机性时间序列分析中,分为(宽)平稳时序分析和非平稳时序分析。平稳随机过程其统计特性(均值、方差)不随时间的平移而变化,在实际中若前后的环境和主要条件都不随时间变化就可以认为是平稳过程(宽平稳过程),具有(宽)平稳特性的时序称平稳时序。

平稳时序分析主要通过建立自回归模型(AR ,Autoregressive Models )、滑动平均模型(MA ,Moving Average Models )和自回归滑动平均模型(ARMA ,Autoregressive Moving Average Models)分析平稳的时间序列的规律,一般的分析程序可用下面框图表示:

(1)自回归模型()p AR

如果时间序列() ,2,1=t X t 是平稳的且数据之间前后有一定的依存关系,即t X 与前面

p

t t t X X X --- ,,21有关与其以前时刻进入系统的扰动(白噪声)无关,具有p 阶的记忆,描述

这种关系的数学模型就是p 阶自回归模型可用来预测:

t

p t p t t t a X X X X ++++=---??? 2211 (1-4)

P ??? ,,21是自回归系数或称为权系数;t a 为白噪声,它对t X 产生的响应,它本身就是前

后不相关的序列,类似于相关回归分析中的随机误差干扰项,其均值为零,方差为2

a σ的白噪声序列。

上面模型中若引入后移算子B ,则可改为:

()

t t p p

a X B B B =----???

221

1 (1-5)

记()()p p B B B B ????----= 2211 则(1-4)可写成

()t t a X B =? (1-6)

称()0=B ?为()p AR 模型的特征方程。特征方程的p 个根()p i i ,,2,1 =λ被称为的特征根。如果p 个特征根全在单位圆外,即

则称()p AR 模型为平稳模型,(1-7)被称为平稳条件。由于是关于后移算子B 的多项式,因此()p AR 模型是否平稳取决于参数P ??? ,,21。 (2)滑动平均模型()q MA

如果时间序列() ,2,1=t X t 是平稳的与前面p t t t X X X --- ,,21无关与其以前时刻进入系统的扰动(白噪声)有关,具有q 阶的记忆,描述这种关系的数学模型就是q 阶滑动平均模型可用来预测:

q

t q t t t t a a a a X ---+++-=θθθ 2211 (1-8)

上面模型中若引入后移算子B ,则可改为:

(

)t

q

q t a

B

B B X θθθ----= 2211

(3)自回归滑动平均模型()q p ARMA ,

如果时间序列() ,2,1=t X t 是平稳的与前面p t t t X X X --- ,,21有关且与其以前时刻进入系统的扰动(白噪声)也有关,则此系统为自回归移动平均系统,预测模型为:

=+++----p t p t t t X X X X ??? 2211q

t q t t t a a a a ---+++-θθθ 2211 (1-9)

即()=----t p p X B B B ??? 2211()t q q a B B B θθθ---- 2211

1.4.2 非平稳时间序列分析

在实际的社会经济现象中我们收集到的时序大多数是呈现出明显的趋势性或周期性,这样我们就不能认为它是均值不变的平稳过程,要用模型来预测应是要把趋势和波动综合考虑进来,是它们的叠加。用模型来描述:

t t t Y X +=μ (1-10)

t μ表示t X 中随时间变化的均值(往往是趋势值),t Y 是t X 中剔除t μ后的剩余部分,表

示零均值平稳过程,就可用自回归模型、滑动平均模型或自回归滑动平均模型来拟合。

要解模型t t t Y X +=μ,分以下两步:

(1)具体求出t μ的拟合形式,可以用上面介绍的确定性时序分析方法建模,求出t μ,得

到拟合值,记为t μ

?。 (2)对残差序列{}t t X μ

?-进行分析处理,使之成为均值为零的随机平稳过程,再用平稳随机时序分析方法建模求出t Y ,通过反运算,最后可得t t t Y X +=μ。

2 2007年国内生产总值的预测

根据上面讨论的时序分析的方法,本文将之综合应用到对实际数据的分析预测中。本文选取1978-2006历年国内生产总值作为时序数据,进行建模并预测。

我们从画出的走势图(如图2.1)知道这一时间序列是具有明显趋势且不含有周期性变化经济波动序列,即为非平稳的时间序列,对此序列进行建模预测需要用上面介绍的非平稳时间序列分析方法。采用模型:

t t t Y X +=μ

(2-1)

图2.1 历年国内生产总值时间序列图

从图形(图2.1)中我们可以判断出国内生产总值的确定趋势是按指数趋势发展的,因此t μ可以用趋势方程表示:

t

t ab =μ,其中b a ,为待定参数。

利用1978~2006年数据及利用对国内生产总值的趋势进行拟合,对指数曲线线性化,即两边取对数b t a t lg lg lg +=μ,在Excel 中进行对其进行回归分析,结果见表2.1-2.2。 于是,可得如下估计模型与拟合图,如图2.2所示。

t t 0656.04499.3?lg +=μ

9878.02=R (2-2)

表2.1

SUMMARY OUTPUT

回归统计

方差分析

表2.2

图2.2 指数曲线线性化拟合图

从统计量9878.02=R 来看,模型通过了检验,且拟合图2.2中可以看出实际值与拟合值很接近,说明国内生产总值是符合指数长期趋势的。再把模型(2-2)取反对数得:

=t μ

?t

162940.1757036.2817?, (2-3)

根据拟合的μ值,这里求出残差序列{}t t t X Y μ

?-=,数据见表2.3,残差序列图如图2.3所示。

表2.3

图2.3 残差序列散点图

观察残差序列的散点图可知,该序列有很大的波动性,可认为是非平稳的。 将残差序列t Y (t=1,2,……,29)进行差分使其平稳化,观察其差分散点图如图2.4所示,可认为:2次差分后序列是平稳的,即令

2

12--+-=?t t t t Y Y Y Y )29,,4,3( =t (2-4)

得到序列{}t W 。

从而我们可以认为{}t W 是平稳的。

图2.4 差分后散点图

将序列{}t W 零均值化:由数据求得W =-156.95,令

W

W w t t -= (2-5)

得到序列{}t w ,从而算出序列{}t w 的样本自相关函数k ρ

?与样本偏相关函数kk ??,结果如表

2.4如图2.5-2.6所示。

从自相关一偏自相关图可以看出,k ρ

?随着k 的增大而衰减,有拖尾现象,而偏相关函数kk ??在2=k 就落人随机区(在零附近波动),且3714

.029

2=<

kk ?,则可认为kk ?

?在2>k 是截尾的。所以初步判断残差序列为()2AR 模型。

表2.4

图2.5 自相关函数 图2.6 偏相关函数

注:偏相关函数的计算是用SPSS 软件来实现得到的。因为Excel 中计算很繁琐,有一定的困难。

设模型为

t

t t t a w w w ++=--2211?? (2-6)

需要估计21,??的值,得出解如下:

??

?=+=+6507.0??8502.08502.0?8502.0?2121??

?? ? ??

?-==2603.0?0715.1?21?

?

代入(2-6)式,()2AR 模型为

t t t t a w w w +-=--212603.00715.1

由特征方程()0=B ?可得: 02603.00715.112=+-B B 解此方程得特征根6863.21=λ,4300.12=λ

由1,121>>λλ,则可判断此模型为平稳的()2AR 模型。 由表2.5得到()==2

0?t w E γ43917126.35

?

??

?

?

?

-=-=∑∑==p

j j j p j j j a 1

0102

??1?????ρ?γγ?

γσ

=43917126.35×(1-1.0715×0.8502+0.2603×0.6507 =11347654.49

为了检验模型合理性,计算残差t t t w

w e ?-=的自相关函数(如表2.5-2.6)。 2211???---=t t t w w w

?? 29,,6,5 =t 表2.5

根据残差分析检验方法,由25=n ,取4

6n m <

=,构造统计量:

()∑=?=

6

1

2

6

2

25k k ρχ

计算()k ρ,6

,,2,1 =k

由()0

γγρk k =

,∑-=+?=

k

n i k i t

k e e

n

1

1γ,得到结果见表

2.5-2.6。

表2.6

则可得()=∑=6

12k k ρ0.1045,6025.21045.02562=?=χ

查2χ分布表,当6=m 时,314.4401.02=χ,652.3705.02=χ

因为652.376025.262<=χ,我们可认为{}t e 为白噪声序列,所以所建的模型是合适的。

由()2AR 序列的预测公式:t t t t a w w w

+-=--21?2603.0?0715.1? 当30=t 时,7262.304820549.225582603.0)6090.22968(0715.1?30-=?--?=w

于是,根据公式(2-4)、(2-5), 预测值

2

130302??---+=t t Y Y W Y 66.10655)21.15013(295.1567262.30482+-?+--=

4362.50010-=

那么,由(2-1)、(2-3),2007年的国内生产总值预测值为:

4362.5001017.260987???30

3030-=+=Y X μ 7338.210976=(亿元) 用该模型预测所得的值见表2.7,图2.6为新的预测值拟合图。

表2.7 (数据来源:中国统计年鉴2006)

图2.6 历年国内生产总值预测的时间序列图

对比图2.6与图2.1,显然本模型对原始数据拟合得更好。 比较指数曲线拟合的误差和非平稳模型的误差如下表2.8。

表2.8

对比所得的均方差MSE ,模型t t t Y X +=μ的MSE 值虽有明显减小,但数值仍然很大,模型应该还有改进的余地,这牵涉到序列中异常数据的处理等相关理论知识,由于时间有限,还没有做出深入的研究。

3 总结

时间序列预测方法应用广泛,比起其他分析方法具有其自身的优越性:

(1)很容易收集数据,时间序列的分析仅仅依赖需要预测变量的过去序列值;

(2)确定性时序分析刻画序列的主要趋势,直观简单、便于计算,结合随机时序分析法能反映实际的变化规律。

(3)随机时序分析能揭示出变量的非线性特征,这是回归分析或其他数学模型不容易到的;

在数据处理方面,利用功能强大的Excel电子表格(除特殊说明外)来进行计算和分析,程序简单明确,公式一目了然,节约了预测所发生的费用,预测方法也易于掌握和应用,并且又能达到较高的预测准确性。

数学建模常用模型方法总结精品

【关键字】设计、方法、条件、动力、增长、计划、问题、系统、网络、理想、要素、工程、项目、重点、检验、分析、规划、管理、优化、中心 数学建模常用模型方法总结 无约束优化 线性规划连续优化 非线性规划 整数规划离散优化 组合优化 数学规划模型多目标规划 目标规划 动态规划从其他角度分类 网络规划 多层规划等… 运筹学模型 (优化模型) 图论模型存 储论模型排 队论模型博 弈论模型 可靠性理论模型等… 运筹学应用重点:①市场销售②生产计划③库存管理④运输问题⑤财政和会计⑥人事管理⑦设备维修、更新和可靠度、项目选择和评价⑧工程的最佳化设计⑨计算器和讯息系统⑩城市管理 优化模型四要素:①目标函数②决策变量③约束条件 ④求解方法(MATLAB--通用软件LINGO--专业软件) 聚类分析、 主成分分析 因子分析 多元分析模型判别分析 典型相关性分析 对应分析 多维标度法 概率论与数理统计模型 假设检验模型 相关分析 回归分析 方差分析 贝叶斯统计模型 时间序列分析模型 决策树 逻辑回归

传染病模型马尔萨斯人口预测模型微分方程模型人口预 测控制模型 经济增长模型Logistic 人口预测模型 战争模型等等。。 灰色预测模型 回归分析预测模型 预测分析模型差分方程模型 马尔可夫预测模型 时间序列模型 插值拟合模型 神经网络模型 系统动力学模型(SD) 模糊综合评判法模型 数据包络分析 综合评价与决策方法灰色关联度 主成分分析 秩和比综合评价法 理想解读法等 旅行商(TSP)问题模型 背包问题模型车辆路 径问题模型 物流中心选址问题模型 经典NP问题模型路径规划问题模型 着色图问题模型多目 标优化问题模型 车间生产调度问题模型 最优树问题模型二次分 配问题模型 模拟退火算法(SA) 遗传算法(GA) 智能算法 蚁群算法(ACA) (启发式) 常用算法模型神经网络算法 蒙特卡罗算法元 胞自动机算法穷 举搜索算法小波 分析算法 确定性数学模型 三类数学模型随机性数学模型 模糊性数学模型

对中国大学生数学建模竞赛历年成绩的分析与预测

2012年北京师范大学珠海分校数学建模竞赛 题目:对中国大学生数学建模竞赛历年成绩的分析与预测 摘要 本文研究的是对自数学建模竞赛开展以来各高校建模水平的评价比较和预测问题。我们将针对题目要求,建立适当的评价模型和预测模型,主要解决对中国大学生数学建模竞赛历年成绩的评价、排序和预测问题。 首先我们用层次分析法来评价广东赛区各校2008年至2011年及全国各大高校1994至2011年数学建模成绩,从而给出广东赛区各校及全国各大高校建模成绩的科学、合理的评价及排序;其次运用灰色预测模型解决广东赛区各院校2012年建模成绩的预测。 针对问题一,首先我们对比了2008到2011年参加建模比赛的学校,通过分析我们选择了四年都参加了比赛的学校进行合理的排序(具体分析过程见表13),同时对本科甲组和专科乙组我们分别进行排序比较。在具体解决问题的过程中,我们先分析得出影响评价结果的主要因素:获奖情况和获奖比例,其中获奖情况主要考虑国家一等奖、国家二等奖、省一等奖、省二等奖、省三等奖,我们采用层次分析法,并依据判断尺度构造出各个层次的判断矩阵,对它们逐个做出一致性检验,在一致性符合要求的情况下,通过公式与matlab求得各大学的权重,总结得分并进行排序(结果见表11);在对广东赛区各高校2012建模成绩预测问题中,我们采用灰色预测模型,我们以华南农业大学为例,得到该校2012年建模比赛获奖情况为:省一等奖、省二等奖、省三等奖及成功参赛奖分别为5、9、8、8(其它各高校预测结果见表10)。 针对问题二,我们对全国各院校的自建模竞赛活动开展以来建模成绩排序采用与问题一相同的数学模型,在获奖情况考虑的是全国一等奖、全国二等奖。运用matlab求解,结果见表12。 针对问题三,我们通过对一、二问排序的解答及数据的分析,得出在对院校进评价和预测时还应考虑到各院的师资力量、学校受重视程度、学生情况、参赛经验等因素,考虑到这些因素,为以后评价高校建模水平提供更可靠的依据。 关键词:层次分析法权向量灰色预测模型模型检验 matlab

数学建模的基本步骤

数学建模的基本步骤 一、数学建模题目 1)以社会,经济,管理,环境,自然现象等现代科学中出现的新问题为背景,一般都有一个比较确切的现实问题。 2)给出若干假设条件: 1. 只有过程、规则等定性假设; 2. 给出若干实测或统计数据; 3. 给出若干参数或图形等。 根据问题要求给出问题的优化解决方案或预测结果等。根据问题要求题目一般可分为优化问题、统计问题或者二者结合的统计优化问题,优化问题一般需要对问题进行优化求解找出最优或近似最优方案,统计问题一般具有大量的数据需要处理,寻找一个好的处理方法非常重要。 二、建模思路方法 1、机理分析根据问题的要求、限制条件、规则假设建立规划模型,寻找合适的寻优算法进行求解或利用比例分析、代数方法、微分方程等分析方法从基本物理规律以及给出的资料数据来推导出变量之间函数关系。 2、数据分析法对大量的观测数据进行统计分析,寻求规律建立数学模型,采用的分析方法一般有: 1). 回归分析法(数理统计方法)-用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式。 2). 时序分析法--处理的是动态的时间序列相关数据,又称为过程统计方法。 3)、多元统计分析(聚类分析、判别分析、因子分析、主成分分析、生存数据分析)。 3、计算机仿真(又称统计估计方法):根据实际问题的要求由计算机产生随机变量对动态行为进行比较逼真的模仿,观察在某种规则限制下的仿真结果(如蒙特卡罗模拟)。 三、模型求解: 模型建好了,模型的求解也是一个重要的方面,一个好的求解算法与一个合

适的求解软件的选择至关重要,常用求解软件有matlab,mathematica,lingo,lindo,spss,sas等数学软件以及c/c++等编程工具。 Lingo、lindo一般用于优化问题的求解,spss,sas一般用于统计问题的求解,matlab,mathematica功能较为综合,分别擅长数值运算与符号运算。 常用算法有:数据拟合、参数估计、插值等数据处理算法,通常使用spss、sas、Matlab作为工具. 线性规划、整数规划、多元规划、二次规划、动态规划等通常使用Lindo、Lingo,Matlab软件。 图论算法,、回溯搜索、分治算法、分支定界等计算机算法, 模拟退火法、神经网络、遗传算法。 四、自学能力和查找资料文献的能力: 建模过程中资料的查找也具有相当重要的作用,在现行方案不令人满意或难以进展时,一个合适的资料往往会令人豁然开朗。常用文献资料查找中文网站:CNKI、VIP、万方。 五、论文结构: 0、摘要 1、问题的重述,背景分析 2、问题的分析 3、模型的假设,符号说明 4、模型的建立(局部问题分析,公式推导,基本模型,最终模型等) 5、模型的求解 6、模型检验:模型的结果分析与检验,误差分析 7、模型评价:优缺点,模型的推广与改进 8、参考文献 9、附录 六、需要重视的问题 数学建模的所有工作最终都要通过论文来体现,因此论文的写法至关重要:

数学建模时间序列分析

基于Excel的时间序列预测与分析 1 时序分析方法简介 1.1时间序列相关概念 1.1.1 时间序列的内涵以及组成因素 所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。 时间序列的变化受许多因素的影响 ,有些起着长期的、决定性的作用 ,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。影响时间序列的构成因素可归纳为以下四种: (1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。这一变化通常是许多长期因素的结果。 (2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。这种因素是因经济多年的周期性变动产生的。比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增 地趋势线上下方。 (3)季节性变化(Seasonal variation),指现象受季节性影响 ,按一固定周期呈现出的周期波动变化。尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。

数学建模之时间序列模型

一、时间序列 时间序列分析是当前对动态数据处理的一种有效方法,它不要求考虑影响观测值的各种力学因素,而只是分析这些观测数据的统计规律性。通过对时间序列统计规律性进行分析,构造拟合出这些规律的可能数值,最后给出预测结果的精度分析。 1.1AR 模型: 1.1.1 模型的应用 ①年降雨水量的预测, ②城市税收收入的预测。 1.1.2步骤 ①模型识别 令均值为零的时间序列(1,2,,)t x t n =L ,延迟k 周期的自协方差函数是 [],k k t t k E y y γγ-+== (1) 用?k γ、?k ρ分别表示自协方差函数的估计值和自相关函数的估计值,则自相关系数为 k k k γρργ-== (2) 1 1??,0,1,2,,1n k k k t t k t y y k n n γγ-+==-==-∑L (3) ???,0,1,2,,1k k k k n γρργ-== =-L (4)

(1)对p 阶AR(P)模型有 01122t t t p t p t x x x x φφφφε---=+++++L (5) {}00,()t x AR p φ=当为中心化序列, 当00φ≠ ,可通过平移得到中心化()AR p 序列。 用B 表示移位算子,1;t t j t t j Bx x B x x --==,则AR(P)模型的算子形式: 212(1)p p t t B B B x φφφε----=L 即 ()p t t B x φε= (5)两边同乘t k x +后再取均值得: 1122[,][,()]t k t t k t t p t p t E x x E x x x x φφφε++---=++++L 由协方差函数函数得: 211220k k k p k p k r εφγφγφγσδ---=++++L (6) 取0,1,2,,k p =L ,再将得到的差分方程两边同时除以0γ得: 1121121122 1122p p p p p p p p ρφφρφρρφρφφρρφρφρφ----=+++=+++ =+++L L M L (7) 由上式(7)可得,k ρ应该满足: ()0,0p k B k φρ=> (8) 解得通解为 1122k k k k p p c c c ρλλλ---=+++L (9) 其中,1,2,,i c i p =L 可以由p 个初值021,,,p ρρρ-L 代入计算得到, ,1,2,,i i p λ=L 是特征方程()0p B φ=的根。 平稳条件:P 个特征根都在单位圆外,即||1i λ>。

数学建模spss-时间预测-心得总结及实例

《一周总结,底稿供参考》 我们通过案例来说明: 假设我们拿到一个时间序列数据集:某男装生产线销售额。一个产品分类销售公司会根据过去10 年的销售数据来预测其男装生产线的月销售情况。 现在我们得到了10年120个历史销售数据,理论上讲,历史数据越多预测越稳定,一般也要24个历史数据才行! 大家看到,原则上讲数据中没有时间变量,实际上也不需要时间变量,但你必须知道时间的起点和时间间隔。 当我们现在预测方法创建模型时,记住:一定要先定义数据的时间序列和标记!

这时候你要决定你的时间序列数据的开始时间,时间间隔,周期!在我们这个案例中,你要决定季度是否是你考虑周期性或季节性的影响因素,软件能够侦测到你的数据的季节性变化因子。

定义了时间序列的时间标记后,数据集自动生成四个新的变量:YEAR、QUARTER、MONTH 和DATE(时间标签)。 接下来:为了帮我们找到适当的模型,最好先绘制时间序列。时间序列的可视化检查通常可以很好地指导并帮助我们进行选择。另外,我们需要弄清以下几点: ?此序列是否存在整体趋势?如果是,趋势是显示持续存在还是显示将随时间而消逝??此序列是否显示季节变化?如果是,那么这种季节的波动是随时间而加剧还是持续稳定存在? 这时候我们就可以看到时间序列图了! 我们看到:此序列显示整体上升趋势,即序列值随时间而增加。上升趋势似乎将持续,即为线性趋势。此序列还有一个明显的季节特征,即年度高点在十二月。季节变化显示随上升序列而增长的趋势,表明是乘法季节模型而不是加法季节模型。

此时,我们对时间序列的特征有了大致的了解,便可以开始尝试构建预测模型。时间序列预测模型的建立是一个不断尝试和选择的过程。 spss提供了三大类预测方法:1-专家建模器,2-指数平滑法,3-ARIMA ?指数平滑法 指数平滑法有助于预测存在趋势和/或季节的序列,此处数据同时体现上述两种特征。创建最适当的指数平滑模型包括确定模型类型(此模型是否需要包含趋势和/或季节),然后获取最适合选定模型的参数。

时间管理-时间序列分析(数学建模)

第二讲 时间序列分析 1

1 时间序列成分分析 1.1 时间序列的构成因素 时间序列中的数据(也称为观测值),总是由各种不同的影响因素共同作用所至;换一句话说,时间序列中的数据,总是包含着不同的影响因素。我们可以将这些影响因素合并归类为几种不同的类型,并对各种类型因素的影响作用加以测定。对时间序列影响因素的归类,最常见的是归为3类: z长期趋势(SPSS的名称为Smoothed Trend-Cycle, 2

缩写stc),长期趋势是一种对事物的发展普遍和长期起作用的基本因素。受长期趋势因素的影响,事物表现出在一段相当长的时期内沿着某一方向的持续发展变化。这种变化最常见的是一种向上的发展,对于经济现象而言,通常由各种经济投入(如技术进步、劳动力、资金等)所引起,因此,长期趋势有时也可视作经济成长的因素。 3

z季节周期因子(SPSS的名称为Season Factors Component), 缩写saf,季节周期也称为季节变动,是一种现象以一定时期(如一年、一月、一周等)为一周期呈现较有规律的上升、下降交替运动的影响因素。 通常表现为现象在一年内随着自然季节的更替而发生的较有规律的增减变化(如某些季节性商品的销售额、旅游客流量、各月的降雨量等)。形成季节周期的原因, 4

除了自然因素,也有人为和社会因素。 z不规则变动因子(SPSS的名称为Irregular Component, 缩写err)。不规则变动是一种偶然性、随机性、突发性因素。受这种因素影响,现象呈现时大时小、时起时伏、方向不定、难以把握的变动。这种变动不同于前三种变动,它完全无规律可循,无法控制和消除,例如战争、自然灾害等。 5

数学建模中常用的思想和方法

数学建模中常用的思想和方法(1) knowledge 2010-08-19 00:42:51 阅读160 评论0字号:大中小 在数学建模中常用的方法:类比法、二分法、量纲分析法、差分法、变分法、图论法、层次分析法、数据拟合法、回归分析法、数学规划(线性规划,非线性规划,整数规划,动态规划,目标规划)、机理分析、排队方法、对策方法、决策方法、模糊评判方法、时间序列方法、灰色理论方法、现代优化算法(禁忌搜索算法,模拟退火算法,遗传算法,神经网络)。用这些方法可以解下列一些模型:优化模型、微分方程模型、统计模型、概率模型、图论模型、决策模型。 拟合与插值方法(给出一批数据点,确定满足特定要求的曲线或者曲面,从而反映对象整体的变化趋势):matlab可以实现一元函数,包括多项式和非线性函数的拟合以及多元函数的拟合,即回归分析,从而确定函数;同时也可以用matlab实现分段线性、多项式、样条以及多维插值。 在优化方法中,决策变量、目标函数(尽量简单、光滑)、约束条件、求解方法是四个关键因素。其中包括无约束规则(用fminserch、fminbnd实现)线性规则(用linprog实现)非线性规则、(用fmincon实现)多目标规划(有目标加权、效用函数)动态规划(倒向和正向)整数规划。 回归分析:对具有相关关系的现象,根据其关系形态,选择一个合适的数学模型,用来近似地表示变量间的平均变化关系的一种统计方法(一元线性回归、多元线性回归、非线性回归),回归分析在一组数据的基础上研究这样几个问题:建立因变量与自变量之间的回归模型(经验公式);对回归模型的可信度进行检验;判断每个自变量对因变量的影响是否显著;判断回归模型是否适合这组数据;利用回归模型对进行预报或控制。相对应的有线性回归、多元二项式回归、非线性回归。 逐步回归分析:从一个自变量开始,视自变量作用的显著程度,从大到地依次逐个引入回归方程:当引入的自变量由于后面变量的引入而变得不显著时,要将其剔除掉;引入一个自变量或从回归方程中剔除一个自变量,为逐步回归的一步;对于每一步都要进行值检验,以确保每次引入新的显著性变量前回归方程中只包含对作用显著的变量;这个过程反复进行,直

数学建模常用模型方法总结

数学建模常用模型方法总结 无约束优化 线性规划连续优化 非线性规划 整数规划离散优化 组合优化 数学规划模型多目标规划 目标规划 动态规划从其他角度分类 网络规划 多层规划等… 运筹学模型 (优化模型) 图论模型存 储论模型排 队论模型博 弈论模型 可靠性理论模型等… 运筹学应用重点:①市场销售②生产计划③库存管理④运输问题⑤财政和会计⑥人事管理⑦设备维修、更新和可靠度、项目选择和评价⑧工程的最佳化设计⑨计算器和讯息系统⑩城市管理 优化模型四要素:①目标函数②决策变量③约束条件 ④求解方法(MATLAB--通用软件LINGO--专业软件) 聚类分析、 主成分分析 因子分析 多元分析模型判别分析 典型相关性分析 对应分析 多维标度法 概率论与数理统计模型 假设检验模型 相关分析 回归分析 方差分析

贝叶斯统计模型时间序列分析模型决策树 逻辑回归

传染病模型 马尔萨斯人口预测模型 微分方程模型 人口预测控制模型 经济增长模型 Logistic 人口预测模型 战争模型等等。。 灰色预测模型 回归分析预测模型 预测分析模型 差分方程模型 马尔可夫预测模型 时间序列模型 插值拟合模型 神经网络模型 系统动力学模型(SD) 模糊综合评判法模型数据包络分析 综合评价与决策方法 灰色关联度 主成分分析 秩和比综合评价法 理想解读法等 旅行商(TSP)问题模型 背包问题模型车辆路 径问题模型 物流中心选址问题模型 经典 NP 问题模型 路径规划问题模型 着色图问题模型多目 标优化问题模型 车间生产调度问题模型 最优树问题模型二次分 配问题模型 模拟退火算法(SA) 遗传算法(GA) 智能算法 蚁群算法(ACA) (启发式) 常用算法模型 神经网络算法 蒙特卡罗算法元 胞自动机算法穷

数学建模中时间序列详细说明

数学建模中时间序列详 细说明 Document number:BGCG-0857-BTDO-0089-2022

基于Excel的时间序列预测与分析 1 时序分析方法简介 时间序列相关概念 1.1.1 时间序列的内涵以及组成因素 所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。 时间序列的变化受许多因素的影响 ,有些起着长期的、决定性的作用 ,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。影响时间序列的构成因素可归纳为以下四种: (1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。这一变化通常是许多长期因素的结果。

(2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。这种因素是因经济多年的周期性变动产生的。比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增地趋势线上下方。 (3)季节性变化(Seasonal variation),指现象受季节性影响 ,按一固定周期呈现出的周期波动变化。尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。 (4)不规则变化(Irregular movement),指现象受偶然因素的影响而呈现出的不规则波动。这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。不规则因素是由短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。 时间序列一般是以上几种变化形式的叠加或组合出现的(如图。 图平稳序列图趋势序列

全国大学生数学建模竞赛常用建模方法总结

学院本科毕业论文 题目全国大学生数学建模竞赛常用建模方法探讨学生柴云飞 指导教师闫峰教授 年级2009级本科 专业数学与应用数学 二级学院数学系 (系、部) 学院数学系 2013年6月

重声明 本人的毕业论文是在指导教师闫峰的指导下独立撰写完成的.如有剽窃、抄袭、造假等违反学术道德、学术规和侵权的行为,本人愿意承担由此产生的各种后果,直至法律责任,并愿意通过网络接受公众的监督.特此重声明.论文经“中国知网”论文检测系统检测,总相似比为5.80%. 毕业论文作者(签名): 年月日

全国大学生数学建模竞赛常用建模方法探讨 摘要 全国大学生数学建模竞赛作为全国高校规模最大的基础性学科竞赛,越来越受到人们的重视,所以建模竞赛的方法也就变得尤为重要.随着竞赛的不断发展,赛题的开放性逐步增大,一道赛题可用多种解法,各种求解的算法有时会相互融合,同时也在向大规模数据处理方向发展,这就对选手的能力提出了更高的要求.由于建模方法种类众多,无法一一介绍,所以本文主要介绍了四种比较常用的数学建模竞赛方法,包括微分与差分方程建模方法、数学规划建模方法、统计学建模方法、图论方法,并结合历年赛题加以说明. 关键词:数学建模竞赛统计学方法数学规划图论

Commonly Used Modeling Method of China Undergraduate Mathematical Contest in Modeling Chai yunfei Directed by Professor Yan feng ABSTRACT The China undergraduate mathematical contest in modeling has been attention by more and more people as a basic subject of the largest national college competition. The method of modeling competition has become more and more important. Open questions gradually increased with the development of competition. Most of the games can be solved by lots of solutions. Sometimes these methods can be used together. And there is also a lot of data which puts forward higher requirement on the ability of players. The modeling methods is too numerous to mention, so this article mainly four kinds Commonly used modeling method are introduced that differential and difference equations modeling method, Mathematical programming modeling method, Statistics modeling method, graph theory and interprets with calendar year’s test questions. KEY WORDS:Mathematical contest in modeling Statistics method Mathematical programming Graph theory

相关文档
相关文档 最新文档