文档库 最新最全的文档下载
当前位置:文档库 › 岩溶水系统支持向量机泉流量预报模型研究

岩溶水系统支持向量机泉流量预报模型研究

岩溶水系统支持向量机泉流量预报模型研究
岩溶水系统支持向量机泉流量预报模型研究

岩溶水系统支持向量机泉流量预报模型研究

杨军耀,赵 涛

(太原理工大学水利科学与工程学院,太原 030024)

摘要:针对岩溶系统结构不甚清晰、基础资料不完备条件下泉水流量预报问题,引入了能较好地解

决小样本、非线性、高维数和局部极小点等问题的支持向量机(Support Vector Machines ,S VM )方

法,将泉流量影响因子时间序列与支持向量机方法有机结合,建立了岩溶水系统支持向量机泉流量预报模型,并与BP 神经网络模型进行了实例比较。结果表明,S VM 模型具有泛化能力强、预报精度高的特点,可很好地克服神经网络的过学习问题,同时,针对S VM 模型“峰值”预报精度差的缺点,提出了“峰值”预报解决方案。

关键词:支持向量机;神经网络;时间序列;泉流量预报模型中图分类号:P64118文献标识码:A Abstract :The method of Support Vector Machines (S VM )which is characterized by a small am ount of sam ples ,non 2linearity ,multi 2dimensions as well as the minimum in certain areas is introduced to s olve the problems in predicting the flow of springs based on the indistinct karst topography and incom plete reference.The factor of time sequence which exerts the in fluence on the flow of springs is combined with the method of S VM to produce the S VM m odel for predicting the flow of springs in karst topography.The com paris on of the S VM m odel with the cases of the back propagation neural netw ork is made to indicate the sweeping generalization and high accuracy of the S VM m odel in predicting s o as to s olve the over 2fitting problems of neural netw ork.Meanwhile ,a formula is proposed to settle the problems in predicting the peak value which is aimed at the low accuracy of S VM in predicting the peak value.

K ey w ords :Support Vector Machines ;neural netw ork ;time sequence ;predicting m odel for spring flow 收稿日期:2007201211;修订日期:2007207218

作者简介:杨军耀(1961-),男(汉族),山西闻喜人,副

教授,硕士.

0 前言

支持向量机是由Vapnik 等于1995年在统计学理论的基础上首次提出的一种新的算法,它是建立在VC 维(Vapnik 2Cherv onenks Dimension )理论和结构风险最小原理(Structural Risk Minimization Inductive Principle )基础上的,即在有限样本条件下对统计学中的VC 维理论和结构风险最小原理的具体实现,能较好地解决小样本、非线性、高维数和

局部极小点等实际问题[4,7,8]

。对岩溶泉流量的预报,涉及到水文、气象、开采量以及水文地质条件等多个方面,是一个复杂的高度非线性系统。传统的水文预测方法只能近似描述其过程,因而模拟精度大多不高。随后以神经网络为主的非线性模型开始引入,但是用神经网络进行系统模拟与预测,容

易陷入局部最优的情况[4]

。因此,在本文中将把支持向量机理论与时间序列相结合引入到岩溶泉流量预报之中,以解决以前方法存在的问题。

1 支持向量机的基本原理

[7,8]

支持向量机是从线性可分情况下的最优分类面发展而来的,也是统计学理论中最实用的部分,其基本思想可用图1的二维情况来说明。图1中,实心点和空心点分别代表两类样本,H 为分类超平面,H 1和H 2分别为过各类中离分类超平面最近的样本,且平行于分类超平面的平面,它们之间的距离叫做分类间隔(margin )。所谓最优分类面就是要求分类面不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。距离最优分类超平面最近的向量称为支持向量。

设样本为年n 维向量,某区域k 个样本及其所属类别表示为

(x 1,y 1),…,(x k ,y k )∈R n ×{±1}(1) 超平面H 表示为

9

2 2007年第12期

工程勘察 Geotechnical Investigation &Surveying

图1 线性可分情况下的最优分类面

w ?x +b =0(2)

显然,式(2)中w 和b 乘以系数后仍满足方程,

不失一般性。设对所有样本x i 满足下列不等式:

w ?x 1+b ≥1 若y i =1w ?x 1+b ≤1 若y i =-1

可将上述不等式的规范形式合并为如下紧凑型式:

y i (w ?x i +b )≥1 i =1,…,k (3)点x 到超平面H 的距离为:

d (w ,b ,x )=

|w ?x +b |

‖w ‖

(4)根据最优分类超平面的定义,则分类间隔可表示为:

p (w ,b )=min |x i

:y i

=1|

d (w ,b ,x i )+min |x j

:y j

=-1|

d (w ,b ,x j )

=

min

|x i

:y i

=1|

|w ?x i +b |

‖w ‖+

 min

|x j

:y j

=-1|

|w ?x j +b |

‖w ‖

=

2

‖w ‖

(5)

要使分类间隔最大,就是2Π‖w ‖最大。因此,构造最优分类超平面的问题可转化为在满足式(3)条件下最小化

Φ(w ,b )=12

w ?w (6)

的问题。另外,考虑到可能存在一些样本不能被超平面正确分类,因此引入松驰变量

εi ≥0 i =1,…,k

(7)显然,当分类出现错误时,εi 大于零,

k

i =1

εi

是分类错误数量的一个上界,为此引入错误惩罚分量。因

此,构造广义最优分类超平面问题就转化为在约束条件

y i (w ?x i +b )≥1-εi i =1,…,k

(8)下最小化函数

Φ(w ,b )=12w ?w +C ∑

k

i =1

εi

(9)式中,C 为一正常数,C 越大,对错误的惩罚越

重。其中第1项是样本到超平面的距离尽量大,从而提高泛化能力;第2项使误差尽量小。2 S VM 回归算法

[2]

目前,支持向量机方法常用于分类及回归分析。其基本思想是用少数支持向量代表整个样本集,本质上是通过某一事先选择好的非线性函数φ(?),将训练集数据x 映射到一个高维线性特征空间H ,在这个维数可能为无穷大的线性空间中,按结构风险最小化原理构造最优分类面。并利用原空间的核函数取代了高维特征空间ω和<(x )的点积运算,从而避免了复杂的点积计算。

S VM 的回归方法是将在解决分类识别问题中得到的结果推广应用到函数的估计当中。与分类问题不同的是,分类问题的样本点明确地属于某一类,而回归问题样本点属于的类别事先是不知道的,因而S VM 回归的样本点只有一类。对于给定的样本数据集

{(x i ,y i )|i =1,2,…,k }其中,x i 为输入值,y i 为预测值,要求拟合的函数形式为:

f (x )=ω

φ(x )+b 根据结构风险化最小原则,要寻求最优回归超平

面,满足

min 12‖ω‖2

+C ∑l

i =1

R (f (x i ),y i

式中,C 是不灵敏损失函数。则支持向量机的回归问题就等价于解决一个二次规划(Q p )问题。最优化问题为:

min w ,b ,ε12‖ω‖2+C ∑

l

l =1

(εi +ε3

i )s .t .y i -ωφ(x l )≤b +εl

y i -ωφ(x l )≤b +ε3l εl ≥0,

ε3

l ≥0,

i =1,2,…,l

S VM 用来估计回归函数时,常分为线性和非线

性拟合回归两类。由上式可求得线性回归函数为

f (x )=ωx +b =

∑SV

(αj

3

j

)(x j ,x )+b

对于非线性的情况,引入核函数即可。此时求得的

是非线性回归函数

f (x )=ωx +b =

∑SV

(αj

3

j

)K (x j ,x )+b

03 工程勘察 Geotechnical Investigation &Surveying

2007年第12期 

其中,K(x

i

,x j)=φ(x i)φ(x j)称为核函数。

核函数的选择必须满足Mercer条件,常见的核函数有:

线性函数:K(x

j

,x)=x i?x

多项式函数:K(x

j

,x)=(x i?x+1)d

径向基函数:K(x

j

,x)=exp(-‖x-x i ‖2Πσ2)

两层神经:K(x

j

,x)=tanh(kx i?x+θ)

3 基于S VM的岩溶泉流量预报

311 水文地质概念模型

本文以山西延河岩溶泉为例。延河泉位于山西省晋城市,沁河从中穿过。泉域地下水补给源为以大气降水入渗补给为主,其次为河流渗漏补给;排泄为泉和人工开采。沁河为常年性河流,由于缺乏系列测流资料,故其渗漏量视为一个常数。因此,将泉流量的主要影响因素概化为大气降水与人工开采[1]。

由于大气降水入渗补给以及人工开采对泉水流量影响的延迟性。因此,泉的流量大小还要受到降水量和开采量的时间序列影响,即受当年、前年甚至更长年份的降雨量与开采量的影响。因此,将当年的泉水流量作为输出目标值,将降水量与开采量的序列作为输入项,则形成多个输入一个输出的水文地质黑箱模型。

312 S VM建模

(1)降水量(P)和开采量(Q)的时间序列长度(m)初选

主要采用时间序列模型以及泉水流量与影响因

子动态曲线确定。即将P

m、P m-1……P1和Q m、Q m-1……Q1为输入项,泉水流量为输出项。

(2)样本归一化处理

归一化处理有利于避免各个因子之间的量级差异,消除各个因子由于量纲和单位不同的影响,对样本的输入、输出参数分别用下式进行规格化处理:

y i=2(x i-x min)

x max-x min

-1

式中,x

i 和y

i

分别为规格化前后的变量;x

max

x min分别为x的最大和最小值。

(3)确定核函数

由于核函数对算法的影响较大,故选择一个最好的核函数极为重要。

(4)核参数的选择

采用Cross2validation的方法求取核参数。

(5)采用平均相对误差M APE和均方根相对误差MSE作为预测结果的评估。

(6)如果对预测结果的评估不满意,调整影响因子时间序列长度,返回第二步,直到满意为止。

特别需要指出的是核函数的选取与时间序列的调整是模型建立的关键。

313 确定参数

通过对在程序中使用不同的参数[9,10],并将不同参数下程序运行的预测结果与已有的实测数据进行比较,我们可以得到下面比较好的参数,具体的程序参数如图2的程序运行截图。

4 预测结果分析

本例中最佳时间序列长度为2,即考虑本年度与前一年度的开采量与降水量作输入因子。最佳核函数为RBF函数,即径向基核函数,其形式如下: K(x j,x)=exp(-‖x-x i‖2Πσ2)

为了对比分析,本例还采用了BP神经网络模型进行预测,而BP神经网络模型的参数是有M AT LAB 软件进行确定和预测的。具体预测的数据结果见图2和表1。

延河泉流量S VM模型和BP模型预测结果对比表1年份

实测流量

(m3Πs)

S VM模型预测

流量(m3Πs)

BP模型预测

流量(m3Πs) 19872167216713210156

19883133312755214840

19892193218232217060

19903107311055214960

19912142214208216874

19922161215894213662

19932145215141216184

19942170216996217044

19952135213513215317

19963117214322215989

19972157215688213529

19982133213307215217

19992116211606217058

20001198211213216949

为了定量地评价这两种负荷预测方法的精度,本文采用平均相对误差M APE和均方根相对误差MSE作为预测结果的评估根据,即

MAPE=

1

n

∑n

i=1

|y i-^y i|

MSE=

1

n

∑n

i=1

(|y

i

-^y i|)2

13

 2007年第12期工程勘察 Geotechnical Investigation&Surveying

图2 

程序运行参数截图

图3 延河泉S VM 模型和BP 模型泉流量预测对比

S VM 模型和BP 模型的误差评估结果

表2

评估指标M APE

MSE

模型类别

S VM 模型

BP 模型S VM 模型BP 模型误差

017827

217051

014292

018569

由表1、表2和图3可知,S VM 模型比BP 模型

对实际的泉水流量有更好的预测结果,更加符合实际泉水流量的趋势。但1996年S VM 模型预测值与实际值误差较大,由图3可知,1996年泉水流量出现“峰值”现象,这是由于本模型采用的是惩罚函数“全局误差”最小化准则所固有的缺陷引起的。解决“峰值”预测精度的基本思路是调正惩罚函数“全局误差”最小化准则为“峰值样本误差”惩罚

函数最小化准则[5,6]

,即

min 12‖ω‖2

+C ∑r

i =1

μi R (f (x i ),y i

式中,μi 为误差修正系数,定义为:

μi =

y i y max

式中,y i 为训练样本目标值最大值。5 结论

(1)正确概化水文地质模型和选取影响因子,

是建模的首要问题,是基础。

(下转第42页)

由表2可知,水库蓄水后库周未进行防渗时,沿库周在地下水位或相对隔水层顶板低于正常蓄水位部位的渗漏量很小,不必对库周进行帷幕灌浆,因此选择方案1。由图4可知,2m厚度时的渗漏量与4m厚度时的渗漏量相差很少,故帷幕灌浆厚度选择2m。由图3可知,帷幕深度1Lu以下5m时的渗漏量比3Lu以下5m深度时的渗漏量明显减小,但是后者防渗后的水库渗漏量已满足要求,考虑到工程造价,选择帷幕灌浆深度为3Lu线以下5m。

因此,建议蒲石河抽水蓄能电站上水库防渗设计首选方案为大坝基础进行帷幕灌浆,沿趾板布置一排防渗帷幕,帷幕深度为基岩透水率3Lu线以下5m,帷幕灌浆孔距为2m。该防渗方案不仅能够保证水库大坝的安全、经济、稳定运行,而且水库渗漏量为可接受的渗漏量,水库建成后不至于对下游水文地质环境产生不利的影响,从安全、环境和经济的角度考虑是合理、最优的防渗方案。

4 结论

通过对蒲石河抽水蓄能电站上水库的三维渗流计算及防渗设计方案的优化研究,建议计算区防渗设计首选方案为大坝基础进行帷幕灌浆,沿趾板布置一排防渗帷幕,帷幕深度为基岩透水率3Lu线以下5m,帷幕灌浆孔距为2m。该方案下正常蓄水位运行工况时,总渗漏量为2261165m3Πd,比防渗前减少了3571127m3Πd,仅占有效库容的0122‰。通过对防渗设计方案的三维渗流敏感性分析与计算可知,水库渗漏量随帷幕厚度的变化较小,随帷幕深度的变化比较明显。计算时未考虑降雨入渗和山体地下水的补给,这对防渗设计来说是偏于安全的。

参考文献

[1] 毛昶熙.渗流计算分析与控制[M].北京:水利电力出版

社,1990.

[2] 樊秀峰,吴振祥,钱会,熊传祥.西安市黑河水库左坝肩渗

漏与防渗三维数值模拟研究[J].福州大学学报(自然科学

版),2002,30(2):235~239.

[3] 孙讷正.地下水流的数学模型和数值方法[M].北京:地质

出版社,1981,25~51.

[4] 张景秀.坝基防渗与灌浆技术[M].北京:水利电力出版

社,1992.

[5] 马国彦,林秀山.水利水电工程灌浆与地下水排水[M].北

京:中国水利水电出版社,2001.

[6] 张立杰,杜新强,冶雪艳等.哈尔滨市磨盘山水利枢纽区渗

控方案分析[J].东北农业大学学报,2005,36(3):388~392.

[7] 黄洪海.岩溶水库坝基防渗帷幕灌浆幕深与幕长的结构形式

及处理[J].贵州地质,2003,20(4):223~227.

(上接第32页)

(2)核函数与时间序列是预报精度影响的主要因素。要优选核函数与时间序列长度,以保证模型预报最优。

(3)由预测结果可知,S VM方法是一种在学习样本数有限的情况下处理高度非线性问题的新的机器学习方法,同时在与BP神经网络方法预测结果的对比中,前者具有更好的泛化能力,它可以克服人工神经网络方法中无法避免的局部极值问题,并且容易使用,不需要象使用神经网络那样要求很多的技巧才能有较好预报结果[3],预测的结果更加符合实际情况的发展趋势。

(4)在本例中也看到对“峰值”预报精度较差,要通过“峰值样本误差”惩罚函数最小化准则解决,以提高预报精度。

参考文献

[1] 韩行瑞等.岩溶水系统———山西岩溶大泉研究[M].北京:

地质出版社,1993.[2] 卢敏,张展羽,冯宝平.支持向量机在径流预报中的应用

探讨[J].人民长江,2005,(8).

[3] 梅松,程伟平,刘国华.基于支持向量机的洪水预报模型

初探[J].中国农村水利水电,2005,(3).

[4] 王景雷,吴景社,孙景生,齐学斌.支持向量机在地下水

位预报中的应用研究[J].水利学报,2003,(5).

[5] 俞亭超,张土乔,柳景青.峰值识别的S VM模型及在时用水

量预测中的应用[J].系统工程理论与实践,2005,(1). [6] 张土乔,俞亭超.提高支持向量机洪水峰值预报精度研究

[J].水力发电学报,2005,(2).

[7] Vapnik V.The Nature of S tatistical Learning Theory(2nd ed.)

[M].New Y ork:S pringer2Verlag.2000.

[8] Vapnik V.S tatistical Learning Theory[M].New Y ork:W iley,

1998.

[9] Cherkassky V.,Y unqian M a.Practical Selection of S VM

Parameters and N oise Estimation for S VM Regression[J].Neural

Netw orks,2004,(17):113~126.

[10] Chapelle O.,Vapnik V,Bousquet O,et el.Choosing Multiple

Parameters for Support Vector M achines[J].M achines Learning,

2002,(46):131~159.

小波神经网络的时间序列预测-短时交通流量预测

%% 清空环境变量 clc clear %% 网络参数配置 load traffic_flux input output input_test output_test M=size(input,2); %输入节点个数 N=size(output,2); %输出节点个数 n=6; %隐形节点个数 lr1=0.01; %学习概率 lr2=0.001; %学习概率 maxgen=100; %迭代次数 %权值初始化 Wjk=randn(n,M);Wjk_1=Wjk;Wjk_2=Wjk_1; Wij=randn(N,n);Wij_1=Wij;Wij_2=Wij_1; a=randn(1,n);a_1=a;a_2=a_1; b=randn(1,n);b_1=b;b_2=b_1; %节点初始化 y=zeros(1,N); net=zeros(1,n); net_ab=zeros(1,n); %权值学习增量初始化 d_Wjk=zeros(n,M); d_Wij=zeros(N,n); d_a=zeros(1,n);

d_b=zeros(1,n); %% 输入输出数据归一化 [inputn,inputps]=mapminmax(input'); [outputn,outputps]=mapminmax(output'); inputn=inputn'; outputn=outputn'; %% 网络训练 for i=1:maxgen %误差累计 error(i)=0; % 循环训练 for kk=1:size(input,1) x=inputn(kk,:); yqw=outputn(kk,:); for j=1:n for k=1:M net(j)=net(j)+Wjk(j,k)*x(k); net_ab(j)=(net(j)-b(j))/a(j); end temp=mymorlet(net_ab(j)); for k=1:N y=y+Wij(k,j)*temp; %小波函数 end end

实验2分类预测模型_支持向量机

实验2分类预测模型——支持向量机SVM 一、 实验目的 1. 了解和掌握支持向量机的基本原理。 2. 熟悉一些基本的建模仿真软件(比如SPSS 、Matlab 等)的操作和使用。 3. 通过仿真实验,进一步理解和掌握支持向量机的运行机制,以及其运用的场景,特别是 在分类和预测中的应用。 二、 实验环境 PC 机一台,SPSS 、Matlab 等软件平台。 三、 理论分析 1. SVM 的基本思想 支持向量机(Support Vector Machine, SVM ),是Vapnik 等人根据统计学习理论中结构风险最小化原则提出的。SVM 能够尽量提高学习机的推广能力,即使由有限数据集得到的判别函数,其对独立的测试集仍能够得到较小的误差。此外,支持向量机是一个凸二次优化问题,能够保证找到的极值解就是全局最优解。这希尔特点使支持向量机成为一种优秀的基于机器学习的算法。 SVM 是从线性可分情况下的最优分类面发展而来的,其基本思想可用图1所示的二维情况说明。 图1最优分类面示意图 图1中,空心点和实心点代表两类数据样本,H 为分类线,H1、H2分别为过各类中离分类线最近的数据样本且平行于分类线的直线,他们之间的距离叫做分类间隔(margin )。所谓最优分类线,就是要求分类线不但能将两类正确分开,使训练错误率为0,而且还要使分类间隔最大。前者保证分类风险最小;后者(即:分类间隔最大)使推广性的界中的置信范围最小,从而时真实风险最小。推广到高维空间,最优分类线就成为了最优分类面。 2. 核函数 ω

支持向量机的成功源于两项关键技术:利用SVM 原则设计具有最大间隔的最优分类面;在高维特征空间中设计前述的最有分类面,利用核函数的技巧得到输入空间中的非线性学习算法。其中,第二项技术就是核函数方法,就是当前一个非常活跃的研究领域。核函数方法就是用非线性变换 Φ 将n 维矢量空间中的随机矢量x 映射到高维特征空间,在高维特征空间中设计线性学习算法,若其中各坐标分量间相互作用仅限于内积,则不需要非线性变换 Φ 的具体形式,只要用满足Mercer 条件的核函数替换线性算法中的内积,就能得到原输入空间中对应的非线性算法。 常用的满足Mercer 条件的核函数有多项式函数、径向基函数和Sigmoid 函数等,选用不同的核函数可构造不同的支持向量机。在实践中,核的选择并未导致结果准确率的很大差别。 3. SVM 的两个重要应用:分类与回归 分类和回归是实际应用中比较重要的两类方法。SVM 分类的思想来源于统计学习理论,其基本思想是构造一个超平面作为分类判别平面,使两类数据样本之间的间隔最大。SVM 分类问题可细分为线性可分、近似线性可分及非线性可分三种情况。SVM 训练和分类过程如图2所示。 图2 SVM 训练和分类过程 SVM 回归问题与分类问题有些相似,给定的数据样本集合为 x i ,y i ,…, x n ,y n 。其中, x i x i ∈R,i =1,2,3…n 。与分类问题不同,这里的 y i 可取任意实数。回归问题就是给定一个新的输入样本x ,根据给定的数据样本推断他所对应的输出y 是多少。如图3-1所示,“×”表示给定数据集中的样本点,回归所要寻找的函数 f x 所对应的曲线。同分类器算法的思路一样,回归算法需要定义一个损失函数,该函数可以忽略真实值某个上下范围内的误差,这种类型的函数也就是 ε 不敏感损失函数。变量ξ度量了训练点上误差的代价,在 ε 不敏感区内误差为0。损失函数的解以函数最小化为特征,使用 ε 不敏感损失函数就有这个优势,以确保全局最小解的存在和可靠泛化界的优化。图3-2显示了具有ε 不敏感带的回归函数。 o x y 图3-1 回归问题几何示意图 o x y 图3-2 回归函数的不敏感地

交通流量的神经网络预测研究

交通流量的神经网络预测研究 [摘要]交通流量预测问题是交通信息预测的核心问题,进行交通流量预测理论体系的研究,对于改善我国交通拥堵问题具有十分重要的学术价值和现实意义。本文在总结国内外研究成果的基础上,对已有的交通流预测方法进行了分类分析和介绍,并利用神经网络的方法来对交通流量进行预测分析。基于交通流量的集中分布特点并结合实际交通流量观测数据,我们采用了分区间段进行数据整理,将BP神经网络应用于交通流量预测的过程,通过对比预测结果,验证了BP 神经网络具有良好的预测效果。 [关键词]交通信息交通流预测 BP神经网络

Research on neural network prediction of traffic flow [Abstract] Traffic flow forecasting is the core problem of traffic information prediction,theory system in the prediction of traffic flow,is very important for improving our countrytraffic congestion has academic value and practical significance.Th is paper based on summarizing the domestic and foreign research results,analyzes and introduces the existing traffic flow forecasting methods, andanalysis to predict the traffic flow by neural network. based on centralized distribution of traffic flow and combined with the actual traffic flow data. We use the inter partition of data processing during the process of BP neural network can be used to traffic flow prediction by comparing the predicted results ,proves that BP neural network has the good forecast effect. [Keywords] Traffic Information Traffic flow Prediction BP neural network

支持向量机数据分类预测

支持向量机数据分类预测 一、题目——意大利葡萄酒种类识别 Wine数据来源为UCI数据库,记录同一区域三种品种葡萄酒的化学成分,数据有178个样本,每个样本含有13个特征分量。50%做为训练集,50%做为测试集。 二、模型建立 模型的建立首先需要从原始数据里把训练集和测试集提取出来,然后进行一定的预处理,必要时进行特征提取,之后用训练集对SVM进行训练,再用得到的模型来预测试集的分类。 三、Matlab实现 3.1 选定训练集和测试集 在178个样本集中,将每个类分成两组,重新组合数据,一部分作为训练集,一部分作为测试集。 % 载入测试数据wine,其中包含的数据为classnumber = 3,wine:178*13的矩阵,wine_labes:178*1的列向量 load chapter12_wine.mat; % 选定训练集和测试集 % 将第一类的1-30,第二类的60-95,第三类的131-153做为训练集 train_wine = [wine(1:30,:);wine(60:95,:);wine(131:153,:)]; % 相应的训练集的标签也要分离出来 train_wine_labels = [wine_labels(1:30);wine_labels(60:95);wine_labels(131:153)]; % 将第一类的31-59,第二类的96-130,第三类的154-178做为测试集 test_wine = [wine(31:59,:);wine(96:130,:);wine(154:178,:)]; % 相应的测试集的标签也要分离出来 test_wine_labels = [wine_labels(31:59);wine_labels(96:130);wine_labels(154:178)]; 3.2数据预处理 对数据进行归一化: %% 数据预处理 % 数据预处理,将训练集和测试集归一化到[0,1]区间 [mtrain,ntrain] = size(train_wine); [mtest,ntest] = size(test_wine); dataset = [train_wine;test_wine]; % mapminmax为MATLAB自带的归一化函数 [dataset_scale,ps] = mapminmax(dataset',0,1); dataset_scale = dataset_scale';

支持向量机模型的研究与设计

百度文库- 让每个人平等地提升自我 支持向量机实验模型的研究与设计 用户手册 1.简介 本模型是基于SVM(即支持向量机)的机器学习模型,能够将线性可分的和非线性可分的两种情况下的两类数据集进行分类,并对分类结果进行分析。用户可以选择装载已有的数据进行分类,也可以手动创建两类数据集进行分类。用户根据要分类的数据集,从两个训练算法中选择适当的训练算法,并且从三个核函数中选择适当的核函数对数据集进行分类。 2.系统要求 操作系统方面:Windows 98,Windows NT,Windows ME,Windows 2000, Windows XP及Windows 2003系统; 应用软件方面:必须安装MATLAB 或以上版本 3.使用说明 (1)首先运行或者文件,进入模型主界面,如下图: 用户在进入实验前必须先按“设置路径”按钮设置路径,然后就可以通过“进入支持向量机模型”按钮进入模型。

百度文库- 让每个人平等地提升自我(2)进入支持向量机机器学习模型后,界面如下图:用户可以通过各个按钮对模型进行操作 (3)装载或创建数据 a.通过“装载数据”按钮装载数据,用户选择数据所在的文件 b.通过“创建数据”按钮创建数据

百度文库- 让每个人平等地提升自我 可以创建线性可分数据集如下: 可以创建非线性可分数据集如下: C.装载数据或创建数据后的界面上显示数据点,如下图:

百度文库- 让每个人平等地提升自我 (4)通过“训练SVM”按钮对数据集进行分类 在此仅介绍了对线性可分数据集分类的情况,对其他的数据集,操作也跟如下类似。在数据集线性可分情况下,使用不同算法的分类结果: 选择SMO训练算法和Linear核函数的分类结果: (5)通过“重新设置”按钮,重新选择SMO训练算法和Polynomial核函数的分类结果

交通预测模型【对各种交通流预测模型的简要分析】

交通预测模型【对各种交通流预测模型的简要分析】 摘要:随着社会的发展,交通事故、交通堵塞、环境污染和能源消耗等问题日趋严重。多年来,世界各国的城市交通专家提出各种不同的方法,试图缓解交通拥堵问题。交通流预测在智能交通系统中一直是一个热门的研究领域,几十年来,专家和学者们用各种方法建立了许多相对精确的预测模型。本文在提出交通流短期预测模型应具备的特性的基础上,讨论了几类主要模型的结果和精确度。 关键词:交通流预测;模型;展望 20世纪80年代,我国公路建设项目交通量预测研究尚处于探索成长阶段,交通量预测主要采用个别推算法,又可分为直接法和间接法。直接法是直接以路段交通量作为研究对象;间接法则是以运输量作为研究对象,最后转换为路段交通量。 进入90年代后,我国的公路建设项目,特别是高速公路建设项目的交通量分析预测多采用“四阶段”预测,该法以机动车出行起讫点调查为基础,包括交通量的生成、交通分布、交通方式选择和交通量分配四个阶段。

几十年来,世界各国的专家和学者利用各学科领域的方法开发出了各种预测模型用于短时交通流预测,总结起来,大概可以分为六类模型:基于统计方法的模型、动态交通分配模型、交通仿真模型、非参数回归模型、神经网络模型、基于混沌理论的模型、综合模型等。这些模型各有优缺点,下面分别进行分析与评价。 一、基于统计方法的模型 这类模型是用数理统计的方法处理交通历史数据。一般来说统计模型使用历史数据进行预测,它假设未来预测的数据与过去的数据有相同的特性。研究较早的历史平均模型方法简单,但精度较差,虽然可以在一定程度内解决不同时间、不同时段里的交通流变化问题,但静态的预测有其先天性的不足,因为它不能解决非常规和突发的交通状况。线性回归模型方法比较成熟,用于交通流预测,所需的检测设备比较简单,数量较少,而且价格低廉,但缺点也很明显,主要是适用性差、实时性不强,单纯依据预先确定的回归方程,由测得的影响交通流的因素进行预测,只适用于特定路段的特定流量范围,且不能及时修正误差。当实际情况与参数标定时的交通状态相差较远时,

铁路旅客流量预测

摘要了解和预测铁路客流量对于铁路部门而言是实现利润最大化和保证市场竞争力的重要环节,本文通过对某铁路公司至2015年一月至2016年3月的客流情况进行研究分析,得出了铁路客流量的一般规律并构建了良好的客流量预测模型,借此实现对未来两周客流量的预测以及对车辆资源分配方案的优化. 问题一:根据旅客列车梯形密度表中包含的大量数据,利用图表分析法我们绘制了十二张包含饼图、折线图、散点图等多种形式的图表,这在一定程度上帮助我们很好地实现了客流规律的可视化展现.通过这些图表我们分析研究了不同种客运列车的优劣势、客运量的峰值规律以及站点与客运量的相关性,总结出了客流量的一般规律. 问题二:我们针对附件一所提供的大量数据进行了分类整理,将数据按照控制变量法的原则大致分为三类,即考察车站、车次、时间段三个变量对于客流量的影响.在对原始数据进行研究分析后,我们认为车站对于客流量的影响最为显著,于是我们将车站这个因素选定为了主要变量,然后从这个主要变量着手,我们基于MATLAB平台构建程序,程序的核心思想是通过对系统行为特征指标建立一组相互关联的灰色预测模型,预测系统中众多变量间的相互协调关系的变化,这种模型能够帮助我们很好地挖掘和利用原始数据,同时我们参考了在问题一中所得出的客流量的一般规律,最终采用累减生成的放松得到了一组灰色序列以弱化数据的随机性和预测未来客流量.当然,我们也采用了残差修正的衡量方法来对模型和预测结果进行了完善和校准. 问题三:为了求得铁路车辆资源配置方案的最优解,一方面考虑到问题二中对于未来两周客流量的预测,另一方面为了实现两个基本假设中对于客座率达到75%利润最大的假设,我们决定采用模拟退火算法来对结果进行优化,这可以帮助我们在减少算法耗时的同时得到一个符合生活实际的最优解. 一、问题重述 铁路部门为保持市场竞争力,实现利润最大化,需要了解日常铁路客运流量、淡旺季变动指数、冷热门线路.其中,为了准确把握市场,需要对客流进行充分的了解和预测.铁路客流量受多种因素影响.

(数学建模教材)31第三十一章支持向量机

第三十一章 支持向量机 支持向量机是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问 题的新工具,最初由 V.Vapnik 等人提出,近几年来在其理论研究和算法实现等方面都 取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的 理论基础和实现途径的基本框架都已形成。 §1 支持向量分类机的基本原理 根据给定的训练集 l T = {(x 1,y 1 ), (x 2 ,y 2 ),L ,(x l ,y l )}∈ ( X ? Y ) , 其中 x ∈ X = R n , X 称为输入空间,输入空间中的每一个点 x 由 n 个属性特征组成, i i n y i ∈Y = {-1,1},i = 1,L ,l 。寻找 R 上的一个实值函数 g (x ) ,以便用分类函数 f (x ) = sgn( g (x )), 推断任意一个模式 x 相对应的 y 值的问题为分类问题。 1.1 线性可分支持向量分类机 考虑训练集 T ,若 ?ω ∈ R n , b ∈ R 和正数 ε ,使得对所有使 y = 1 的下标 i 有 i (ω ? x i ) + b ≥ ε(这里 (ω ? x i ) 表示向量 ω 和 x i 的内积),而对所有使 y i = -1 的下标 i 有 (ω ? x i ) + b ≤ -ε ,则称训练集 T 线性可分,称相应的分类问题是线性可分的。 记两 类样本集分别为 M = {x i | y i = 1, x i ∈T }, M = {x i | y i = -1, x i ∈T }。定义 M + 的凸包 conv(M + ) 为 + - ? N + N + ? conv(M + ) = ?x = ∑λ x | ∑ λ λ ≥ 0, j = 1,L , N + ; x ∈ M + ←, = 1, j j j j j ? ↑ j =1 j =1 M - 的凸包 conv(M - ) 为 ? N - N - ? conv(M - ) = ?x = ∑λ x | ∑λ λ ≥ 0, j = 1,L , N - ; x ∈ M - ←. = 1, j j j j j ? ↑ j =1 j =1 其中 N + 表示 + 1 类样本集中样本点的个数, N - 表示 - 1类样本集中样本点的个数,定 理 1 给出了训练集 T 线性可分与两类样本集凸包之间的关系。 定理 1 训练集 T 线性可分的充要条件是, T 的两类样本集 M + 和 M - 的凸包相 离。如下图所示 图 1 训练集 T 线性可分时两类样本点集的凸包 证明:①必要性 -762-

网络流量预测模型研究

2017年第8期信息通信2017 (总第176 期)INFORMATION & COMMUNICATIONS (Sum. N o 176) 网络流量预测模型研究 陈广居\梁鹏2,王坤3 (1.94750部队福建连城366200;2.94937部队浙江杭州310021 ;3.94872部队江西樟树331204) 摘要:针对当前网络通信业务量大,业务种类多的特点,对近年来网络流量预测模型研究现状进行了综述,分析了多种网 络流量预测模型,针对网络流量的不同特点对各种模型从计算复杂度、应用场合及适用范围等方面展开比较分析。比较 结果表明,预测模型与所分析流量特性及应用场合关系密切,在具体应用中应充分考虑预测目标和具体的网络流量特 点,选择合适的预测模型。 关键词:短相关;长相关;线性预测;非线性预测;组合预测 中图分类号:T H393文献标识码:A文章编号:1673-1131(2017)08-0191-04 The R eserch o f N etw ork Traffic Prediction M odel C h e n G u a n g ju1, L ia n g P e n g2, W a n g K u n3 (1. U n it 94750 o f P L A, L ia n che n g F u jia n 366200, C h in a; 2. U n it 94937 o f P L A, H a n g zh o u Z he jia n g 310021, C hin a; 3. U n it 94872 o f P L A, Zhangshu Jia n gxi 331204, C h in a) A b s tra c t:F o r the characteristics o f the current ne tw o rk com m unication traffic, this paper presents an o ve rvie w on the study o f m odels for ne tw o rk traffic prediction in recent years, analyzes different kinds o f ne tw o rk traffic prediction m odels. In v ie w o f the different characteristics o f ne tw o rk traffic, the m odels are analyzed and com pared fro m the aspects o f com putational co m-plexity, application and scope o f application. T h e results p ro ve that prediction m o d e l should correlate to traffic characteristics and scene tightly. It needs to select the appropriate prediction m odels according to the target and the specific characteristics o f ne tw o rk traffic. k e y w o rd s: lo n g range dependence; short range dependence; linear prediction; nonlinear p rediction; com bination Prediction 〇引言 网络流量是网络运行的重要指标,其反映了网络的运行 状态,近年来网络流量建模和预测成为人们的研究热点。针 对网络流量特性进行建模是网络设计规划和网络状态分析的 前提,也对网络管理与故障处置、新的网络协议的开发以及提 高网络运行服务质量具有重大意义;网络流量预测模型的研 究对于更好地理解网络业务的性能和规律、规划网络设计、决 定网络拥塞控制、应用于网络安全、网络管理的异常检测、提 高服务质量意义深远。网络流量预测以过去的流量数据为依据,通过建立适当的数学模型对将来的流量状态进行预测。因此,掌握网络流量的特点对提高预测的精度和深入分析预测 本质尤其重要。在当前的一些网络流量预测资料中,大部分 的研究重点是对网络流量特性的数学分析,单纯针对网络流 量进行预测的研究不多,与之对应,这一领域的研究在河流流 量、道路交通、金融分析等领域中有较多的应用。本文对近年 来网络流量预测算法研究现状进行了综述,分析了多种网络 流量预测模型,并结合不同的网络流量特性对各种模型的适 用范围及应用场合进行了分析比较,最后得出结论,虽然智能 通信机房监控系统采用S O A P传输协议,这个协议是新时期 W e b S e r v ic e服务和物联网体系中的一种存在的标准传输协 议,S O A P协议定义了一个完善的逻辑业务服务请求者和逻辑 业务服务提供者之间相关的信息传输规范,促使X M L数据传 输更加安全,S O A P协议采用了传统的互联网传输协议,使物 联网作为数据传输的标准模式进行传输,可以为用户提供一 个格式化的相关协议信息,并且能够承载相关的物联网传输 协议,这些协议主要包括以下几个关键方面,S O A P封套信息、S O A P编码规则、S O A P R P C进行逻辑业务处理表示等。S O A 能够更好的实现信息的加工和服务,首先用户可以获取相关 的信号数据,接着可以分析信号的类型,如果信号为抽取信号,就可以实现数据抽取功能;如果信号为引用数据失效信号,则 可以将其划分到响应弓丨用数据失效弓丨擎中;如果信号为数据 已变更信号,则可以将数据推送到数据库中;如果信号为即时 获取,可以启动即时获取数据操作引擎。操作完成之后,这些数据均可以持久化地保存到数据存储器中,保证数据的及时 处理,进一步实现数据的加工和服务。通信机房监控系统是 现代无线通信的一个重要标志,物联网采用自适应技术,可以保证通信质量达到最优化,根据信道的传输环境的变化,适时 地改变N B-I O T的发送、接收参数。 3结语 随着我国通信事业的发展,通信机房包含的设备越来越多, 这些设备承载着数以亿计的资源,保?2联网软件的正常运行。 因此提高机房的智能化管理已经成为人们研究的重点,本文提 出利用物联网的数据感知、信息采集和数据分析功能,构建一个 实时的、动态的智能化机房,提高机房的运行管控成效。 参考文献: [1]陈武.物联网信息技术在数据机房建设中的应用研究[J]. 信息系统工程,2016(12):70-72. [2]李铁.基于物联网的机房温度报警系统设计与实现[J].中 国新通信,2017(3):65-66. [3]胥志强,何国平,杨漾.物联网技术在气象部门智能机房 建设中的应用[J].网络安全技术与应用,2017⑵:130-131. [4]王有为.基于物联网思维的高速公路变电所机房监控系 统[J].中国交通信息化,2016(8):116-117. 191

支持向量机(SVM)在作物需水预测中的应用研究综述

第卷第期农业水土工程研究进展课程论文V ol. Supp. . 2015年11月Paper of agricultural water and soil engineering progress subject Nov.2015 1 支持向量机(SVM)在作物需水预测中的应用研究综述 (1.中国农业大学水利与土木工程学院,北京,100083) 摘要:水资源的合理配置对于社会经济的发展具有重要意义。而在农业水资源的优化配置中常常需要提供精确的作物需水信息才能接下来进行水量的优化配置。支持向量机是基于统计学习理论的新型机器学习方法,因为其出色的学习性能,已经成为当前机器学习界的研究热点。但是目前对支持向量机的研究与应用大多集中在分类这一功能上,而在农业水资源配置中的应用又大多集中于预测径流量,本文系统介绍了支持向量机的理论与一些应用,并对支持向量机在作物需水预测的应用进行了展望。 关键词:作物需水预测;统计学习理论;支持向量机; 中图分类号:S16 文献标志码:A 文章编号: 0引言 作物的需水预测是农业水资源优化配置的前提和基础之一。但目前在解决数学模型中需要输入有预期的预测精度的数据时还是会遇到困难。例如,当大量的用水者的用水需求作为优化模型的输入时,预测精度太低时优化结果可能会出现偏差。此外,不确定性也存在于水的需求中,水需求受到一些影响因子和系统组成的影响(即人类活动,社会发展,可持续性要求以及政策法规),这不仅在不确定性因子间相互作用过程中使得问题更为复杂,也使得决策者在进行水资源分配过程中的风险增加。所以,准确的预测对水资源的需求对制定有效的水资源系统相关规划很重要。而提高需水量预测精度一直是国内外学术界研究难点和热点。 支持向量机(Support V ector Machine,SVM)是根据统计学理论提出的一种新的通用学习方法,该方法采用结构风险最小化准则(Structural Risk Minimization Principle),求解二次型寻优问题,从理论上寻求全局最优解,较好地兼顾了神经网络和灰色模型的优点[1][2],克服了人工神经网络结构依赖设计者经验的缺点,具有对未来样本的较好的泛化性能,较好解决了高维数、局部极小等问题[3]。目前,SVM已成功的应用于分类、函数逼近和时间序列预测等方面,并在水科学领域中取得了一些成果,Liong[4]已将SVM应用于水文预报,周秀平等[5]已将SVM应用于径流预测,王景雷等[6]亦已将SVM应用于地下水位预报。而需水预测问题本身也可以看作是一种对需水量及其影响因子间的复杂的非线性函数关系的逼近问题,但将SVM应用于作物需水预测的研究尚处于起步阶段。本文简要介绍支持向量机并对其研究进展进行综述,最后对未来使用支持向量机预测作物需水量进行展望。 收稿日期:修订日期:1支持向量机 1.1支持向量机国内外研究现状 自 1970 年以来,V apnik[1,2]等人发展了一种新的学习机——支持向量机。与现有的学习机包括神经网络,模糊学习机,遗传算法,人工智能等相比,它具有许多的优点:坚实的理论基础和较好的推广能力、强大的非线性处理能力和高维处理能力。因此这种学习方法有着出色的学习性能,并在许多领域已得到成功应用,如人脸检测、手写体数字识别、文本自动分类、非线性回归建模与预测、优化控制数据压缩及时间序列预测等。 1998年,Alex J. Smola[7]系统地介绍了支持向量机回归问题的基本概念和求解算法。Drucher[8]将支持向量机回归模型同基于特征空间的回归树和岭回归的集成回归技术bagging做了比较;Alessandro verri[9]将支持向量机回归模型同支持向量机分类模型和禁忌搜索(basic pursuit denoising)作了比较,并且给出了贝叶斯解释。通过分析得出了如下结论:支持向量机回归模型由于不依赖于输入空间的维数,所以在高维中显示出了其优越性。为了简化支持向量机,降低其复杂性,已有了一些研究成果。比如,Burges[10]提出根据给定的支持向量机生成缩减的样本集,从而在给定的精度下简化支持向量机,但生成缩减样本集的过程也是一个优化过程,计算比较复杂;1998年Scholkopf[11]等人在目标函数中增加了参数v以控制支持向量的数目,称为v-SVR,证明了参数v与支持向量数目及误差之间的关系,但支持向量数目的减少是以增大误差为代价的。Suykens等人[12]1999年提出的最小二乘支持向量机(LS-SVM)算法具有很高的学习效率,对大规模数据可采用共轭梯度法求解;田盛丰[13]等人提出了LS-SVM与序贯最优化算法(SMO)的混合算法。 1.2支持向量机在水资源领域研究现状

基于支持向量机回归模型的海量数据预测

2007,43(5)ComputerEngineeringandApplications计算机工程与应用 1问题的提出 航空公司在客舱服务部逐步实行“费用包干”政策,即:综合各方面的因素,总公司每年给客舱服务部一定额度的经费,由客舱服务部提供客舱服务,而客舱服务产生的所有费用,由客舱服务部在“费用包干额度”中自行支配。新的政策既给客舱服务部的管理带来了机遇,同时也带来了很大的挑战。通过“费用包干”政策的实施,公司希望能够充分调用客舱服务部的积极性和主动性,进一步改进管理手段,促进新的现代化管理机制的形成。 为了进行合理的分配,必须首先搞清楚部门的各项成本、成本构成、成本之间的相互关系。本文首先对成本组成进行分析,然后用回归模型和支持向量机预测模型对未来的成本进行预测[1-3],并对预测结果的评价和选取情况进行了分析。 2问题的分析 由于客舱服务部的特殊性,“费用包干”政策的一项重要内容就集中在小时费的重新分配问题上,因为作为客舱乘务员的主要组成部分—— —“老合同”员工的基本工资、年龄工资以及一些补贴都有相应的政策对应,属于相对固定的部分,至少目前还不是调整的最好时机。乘务员的小时费收入则是根据各自的飞行小时来确定的变动收入,是当前可以灵活调整的部分。实际上,对于绝大多数员工来说,小时费是其主要的收入部分,因此,用于反映乘务人员劳动强度的小时费就必然地成为改革的重要部分。 现在知道飞行小时和客万公里可能和未来的成本支出有关系,在当前的数据库中有以往的飞行小时(月)数据以及客万公里数据,并且同时知道各月的支出成本,现在希望预测在知道未来计划飞行小时和市场部门希望达到的客万公里的情况下的成本支出。 根据我们对问题的了解,可以先建立这个部门的成本层次模型,搞清楚部门的各项成本、成本构成、成本之间的相互关系。这样,可以对部门成本支出建立一个层次模型:人力资源成本、单独预算成本、管理成本,这三个部分又可以分别继续分层 次细分,如图1所示。 基于支持向量机回归模型的海量数据预测 郭水霞1,王一夫1,陈安2 GUOShui-xia1,WANGYi-fu1,CHENAn2 1.湖南师范大学数学与计算机科学学院,长沙410081 2.中国科学院科技政策与管理科学研究所,北京100080 1.CollegeofMath.andComputer,HunanNormalUniversity,Changsha410081,China 2.InstituteofPolicyandManagement,ChineseAcademyofSciences,Beijing100080,China E-mail:guoshuixia@sina.com GUOShui-xia,WANGYi-fu,CHENAn.Predictiononhugedatabaseontheregressionmodelofsupportvectormachine.ComputerEngineeringandApplications,2007,43(5):12-14. Abstract:Asanimportantmethodandtechnique,predictionhasbeenwidelyappliedinmanyareas.Withtheincreasingamountofdata,predictionfromhugedatabasebecomesmoreandmoreimportant.Basedonthebasicprincipleofvectormachineandim-plementarithmetic,apredictionsysteminfrastructureonanaircompanyisproposedinthispaper.Lastly,therulesofevaluationandselectionofthepredictionmodelsarediscussed. Keywords:prediction;datamining;supportvectormachine;regressionmodel 摘要:预测是很多行业都需要的一项方法和技术,随着数据积累的越来越多,基于海量数据的预测越来越重要,在介绍支持向量机基本原理和实现算法的基础上,给出了航空服务成本预测模型,最后对预测结果的评价和选取情况进行了分析。 关键词:预测;数据挖掘;支持向量机;回归模型 文章编号:1002-8331(2007)05-0012-03文献标识码:A中图分类号:TP18 基金项目:国家自然科学基金(theNationalNaturalScienceFoundationofChinaunderGrantNo.10571051);湖南省教育厅资助科研课题(theResearchProjectofDepartmentofEducationofHunanProvince,ChinaunderGrantNo.06C523)。 作者简介:郭水霞(1975-),女,博士生,讲师,主要研究领域为统计分析;王一夫(1971-),男,博士生,副教授,主要研究领域为计算机应用技术,软件工程技术;陈安(1970-),男,副研究员,主要研究领域为数据挖掘与决策分析。 12

短期交通流量预测

短期交通流量预测 摘要 交通流量是一种对于一段时间在某个路口通过的交通实体量,在现在的社会中,智能运输系统等交通理论的研究已经渐渐成为发达国家的研究对象,而交通流量预测分析是其中的核心研究之一。所以,对于交通流量的预测成为叩开智能交通系统大门的最有力的那一把钥匙。 在前面,我们首先面临的一个问题是对于数据的处理。题目以15分钟为一个时间段来测量交通流量,一共有三天的数据,应该有288个数据,但是题目只给出了276个。另外,在数据中还有两个为负的数据。面对缺失数据和异常数据,我们分别使用了热卡插补法和平均值填补法来解决。 然后在进行预测时,我们分别使用了不同的软件来建立不同的预测模型。首先我们使用了灰色预测GM软件来进行灰色模型的预测,在预测前,我们先用模型和前两天的交通流量来预测第三天的交通流量,然后将第三天的真实交通流量与预测交通流量进行相关性检验,检验通过后,再用于预测第四天的交通流量,最后评价模型的好坏。 接着,我们使用了spss软件来进行回归分析模型的预测。在预测之前,我们需要先对数据进行相关性检验,若没有相关性,则回归方程会没有意义。接下来,通过对回归方法的决定性系数检验和方差分析检验,得到最合适方法。之后再进行第四天的预测及预测结果的评价。 然后,我们使用了metlab软件来实现BP神经网络模型的预测。BP神经网

络的实质是用已给出的数据来推出需要的数据,并将新预测出的数据重新返回输入中,得到误差,一直重复,直到误差到达合理的围。在预测之前,我们先得出了误差在合理围,并且看到已给出数据的真实值与预测值得对比。在确保模型是可用的之后,在进行预测与预测结果的评价。 最后,我们使用了eview软件来进行时间序列的预测。时间序列预测要求数据必须是平稳的,所以在预测前,先要对数据进行ADF检验,在检验通过后,才能进行预测,得到预测后的表达式和残差。在最后,还必须对残差进行分析估计。这样之后,对模型进行评价。 在本文的最后,我们进行了进一步的讨论和改进,对四种预测方法进行了一个比较,判断出那个模型是最适合这个题目的。并且对文章中所涉及的模型进行推广,使其更便于运用于生活实际中。 关键词:eviews 热卡插补法相关性检验神经网络时间序列ADF检验

基于四阶段法的城市轨道交通客流预测模型研究开题分析报告

基于四阶段法的城市轨道交通客流预测模型研究开题报告

————————————————————————————————作者:————————————————————————————————日期: 2

毕业设计(论文)开题报告 姓名学号专业 设计(论文)题目基于四阶段法的城市轨道交通客流预测模型研究 1. 毕业设计(论文)的目的及意义(含国内外的研究现状分析): 1.1研究的目的及意义 1.1.1研究目的 随着我国经济快速发展,城市化进程日趋加快,城市人口规模和机动车数量急剧增加,直接导致交通出行量大幅增加,由此引发一系列的交通问题,其中交通拥堵问题最为突出。解决该问题的方法除了控制车辆增长速度以外,大力发展城市轨道交通是一个重要解决手段。 城市轨道交通对城市的发展模式和布局有着重要影响,而城市轨道交通客流量预测是轨道交通建设的基础和前提,在轨道交通建设项目可行性研究和交通状况评价过程中都需要进行交通情况调查和交通量预测。因此城市轨道交通客流量的预测直接关系到城市轨道交通项目建设的科学性和合理性,具有重要的现实意义和理论价值。 1.1.2研究意义 城市轨道交通客流预测是城市轨道交通项目建设的一项重要的基础工作,是确定城市轨道交通建设规模和站点布局的重要依据,是城市轨道交通网络合理规划和初步运营的前提条件。目前,传统的四阶段客流预测方法被广泛地应用于交通客流量预测,虽然这些实践工作为四阶段法进行轨道交通客流预测提供了借鉴以及理论实践案例,但是由于轨道交通自身的特点,运用四阶段法预测交通客流时,考虑的因素和预测程序都较为复杂,因此在研究和实践过程中,传统四阶段法还存在不足之处,为了使四阶段法的交通客流预测结果更能符合城市轨道交通的特点,使其更加实用和完善,对其进行改进具有重大的现实意义和理论价值。通过本课题的研究,有助于发现传统四阶段法所存在的缺点,并对其进行改进,为轨道交通量预测提供新的方法和理论依据,更加合理地规划轨道交通网络和城市空间布局。 1.2国内外研究现状 1.2.1国外研究现状 针对交通量预测,HRB和BRP最先运用转移曲线法实现了交通量分配预测,Moore和Schneider等人在前者的基础上,建立全有全无模型进行交通量分配预测,但是预测结果容

曹安公路远期交通流量预测

曹安公路远期交通流量预测——以华江支路——嘉金高速段为基础 学院:交通运输工程学院 学号: 姓名:

目录 一、报告概述 (3) 工作目标 (3) 工作内容 (3) 技术路线 (3) 二、调查道路和交叉口概述 (4) 三、调查数据处理与现状分析 (4) 3.1调查数据汇总及标准车换算 (4) 3.2路段流量推算 (5) 3.3 AADT计算 (6) 3.4现状分析 (7) 四、远期流量预测 (8) 4.1基于弹性系数的远期交通量预测 (10) 4.2基于线性回归的远期交通量预测 (11) 4.3基于人工神经网络为融合基础的远期交通量组合预测 (12) 五、预测结果分析 (14)

一、报告概述: 工作目标 根据曹安公路华江支路——嘉金高速段历年交通流量数据,综合现场调查结果,预测该段2020—2025年年平均日交通量,并对未来曹安公路道路建设工程提出合理意见。 工作内容 现场数据采集:收集曹安公路华江支路——嘉金高速段两交叉口早晨8:00—9:00车流量; 数据处理与分析:(1)现状与历年流量的差异及差异出现的原因(2)变化趋势与历年趋势的对比,说明影响预测结果的主要影响因素及产生原因(3)预测结果分析 技术路线

二、调查道路和交叉口概述 本次调查区段为曹安公路华江支路—嘉金高速段,共有两个交叉口,分别是翔江公路交叉口和翔封路交叉口。两交叉口相对位置如下图所示: 三、调查数据处理与现状分析 3.1调查数据汇总及标准车换算 将实测的分车型交通量转换为标准车流量。换算系数如下: 各交叉口流量调查及标准车换算

3.2路段流量推算 以采集数据的两个交叉口:翔江公路及翔封路,把华江支路——嘉金高速区段划分成三个路段:华江支路—翔封路,翔封路—翔江公路和翔江公路—嘉金高速。采样时间段内(8:00—9:00)各路段统计交通量如下:

相关文档
相关文档 最新文档