灰色系统理论及其应用
第一章灰色系统的概念与基本原理
1.1灰色系统理论的产生和发展动态
1982年,北荷兰出版公司出版的《系统与控制通讯》杂志刊载了我国学者邓聚龙教授的第一篇灰色系统理论论文”灰色系统的控制问题”,同年,《华中工学院学报》发表邓聚龙教授的第一篇中文论文《灰色控制系统》,这两篇论文的发表标志着灰色系统这一学科诞生
1985灰色系统研究会成立,灰色系统相关研究发展迅速。
1989海洋出版社出版英文版《灰色系统论文集》,同年,英文版国际刊物《灰色系统》杂志正式创刊。目前,国际、国内300多种期刊发表灰色系统论文,许多国际会议把灰色系统列为讨论专题。国际著名检索已检索我国学者的灰色系统论著3000多次。灰色系统理论已应用范围已拓展到工业、农业、社会、经济、能源、地质、石油等众多科学领域,成功地解决了生产、生活和科学研究中的大量实际问题,取得了显著成果。
1.2几种不确定方法的比较
概率统计,模糊数学和灰色系统理论是三种最常用的不确定系统研究方法。其研究对象都具有某种不确定性,是它们共同的特点。也正是研究对象在不确定性上的区别,才派生了这三种各具特色的不确定学科。
模糊数学着重研究“认识不确定”问题,其研究对象具有“内涵明确,外延不明确”的特点。比如“年轻人”内涵明确,但要你划定一个确定的范围,在这个范围内是年轻人,范围外不是年轻人,则很难办到了。
概率统计研究的是“随机不确定”现象,考察具有多种可能发生的结果之“随机不确定”现象中每一种结果发生的可能性大小。要求大样本,并服从某种典型分布。
灰色系统理论着重研究概率统计,模糊数学难以解决的“小样本,贫信息”不确定性问题,着重研究“外延明确,内涵不明确”的对象。如到2050年,中国要将总人口控制在15亿到16亿之间,这“15亿到16亿之间“是一个灰概念,其外延很清楚,但要知道具体数值,则不清楚。
1.3灰色系统理论的基本概念
定义1.3.1信息完全明确的系统称为白色系统。
定义1.3.2信息未知的系统称为黑色系统。
定义1.3.3部分信息明确,部分不明确的系统称为灰色系统。
1.4灰色系统理论的基本原理
公理1(差异信息原理)“差异“是信息,凡信息必有差异。
公理2(解的非唯一性原理)信息不完全,不确定的解是非唯一的。
公理3(最少信息原理)灰色系统理论的特点是充分开发利用已占有的“最少信息“。
公理4(认知根据原理)信息是认知的根据。
公理5(新信息优先原理)新信息对认知的作用大于老信息。
公理6(灰性不灭原理):信息不完全是绝对的
1.5灰色系统理论的主要内容
灰色系统理论经过20多年的发展,现在已经基本建立起一门新兴学科的结构体系。其主要内容包括以灰色代数系统,灰色方程、灰色矩阵等为基础的理论体系。以灰色序列生成为基础的方法体系,以灰色关联空间为依托的分析体系。以灰色模型(GM)为核心的模型体系,以系统分析,评估,建模,预测,决策,控制,优化为主体的技术体系。
1.6灰数
灰数是灰色系统理论的基本“单元“或”细胞“。我们把只知道大概范围而不知道其确切值的数称为灰数。在应用中,灰数实际上指在某一个区间或某个一般的数集内取值的不确定数。通常用记号“
”表示灰数。
灰数有以下几类:
1. 仅有下界的灰数。有下界而无上界的灰数记为
∈
,其中a是灰数
的下确界,是确定的数,我们称
为
的取数域,简称
的灰域。
2. 仅有上界的灰数。有上界而无下界的灰数记为
∈
,其中
是灰数
的上确界,是确定的数。
3. 区间灰数。既有下界又有上界的灰数称为区间灰数,记为
∈
4. 连续灰数与离散灰数。
5. 黑数与白数。当
∈
,称
为黑数;当
∈
且
时,称
为白数。
6. 本征灰数与非本征灰数。
本征灰数是指不能或暂时还不能找到一个白数作为其“代表”的灰数,比如一般的事前预测值,宇宙的总能量等。
非本征灰数是指凭先验信息或某种手段,可以找到一个白数作为其代表的灰数。我们称此白数为相应灰数的白化值。
第二章序列算子与灰色序列生成
灰色系统理论的主要任务之一,是根据社会,经济,生态等系统的行为特征数据,寻找不同系统变量之间或某些系统变量自身的数学关系和变化规律。灰色系统理论认为任何随机过程都是在一定幅值范围和一定时区内变化的灰色量,并把随机过程看成灰色过程。
灰色系统理论是通过对原始数据的挖掘,整理来寻求其变化规律的,这是一种就数据寻找数据的现实规律的途径,我们称为灰色序列生成。灰色系统理论认为,尽管客观系统表象复杂,数据离乱,但它总是有整体功能的,因此必然蕴含某种内在规律。关键在于如何选择适当的方式去挖掘它和利用它。一切灰色序列都能通过某种生成弱化其随机性,显现其规律性。
例如考虑4个数据,记为
,其数据见下表:
序号 1 2 3 4
符号
数据 1 2 1.5 4
将上表数据作图得
上图表明原始数据
没有明显的规律性,其发展态势是摆动的。如果将原始数据作累加生成,记第K个累加生成为
,并且
得到数据如下表所示
序号 1 2 3 4
符号
数据 1 3 4.5 7.5
上图表明生成数列X
是单调递增数列。
2.1冲击扰动系统与序列算子
定义2.1.1 设
为系统真实行为序列,而观察到的系统行为数据序列为
其中,
为冲击扰动项(干扰项)。X称为冲击扰动序列。
所以本章我们的讨论围绕:由X
X
展开(扰动还原真实)
2.2缓冲算子公理
定义2.2.1 设系统行为数据序列为
,
1. 若
,则称X为单调增长序列;
2. 若1中不等号反过来成立,则称X为单调衰减序列;
3. 若
,则称X为随机振荡序列。
4. 设
,则称M-m为序列X的振幅
定义2.2.2 设
为系统行为数据系列,D为作用于X的算子,X经过算子D作用后所得序列记为
称D为序列算子,称XD为一阶算子作用序列。
序列算子的作用可以多次,相应的,若
都是序列算子,我们称
为二阶算子,并称
为二阶算子作用序列,同理,
为三阶序列算子……
定义2.2.3 称下述三公理为缓冲算子三公理,满足缓冲算子三公理的序列算子D称为缓冲算子,一阶,二阶,三阶……缓冲算子作用序列称为一阶,二阶,三阶……缓冲序列。
公理1(不动点公理)设
为系统行为数据系列,D为序列算子,则D满足
。
不动点公理限定在序列算子作用下,系统行为数据序列的数据
保持不变。
根据定性分析的结论,亦可使
以前的若干个数据在序列算子作用下保持不变。例如,令
公理2.(信息充分利用公理)系统行为数据序列X中的每一个数据
,都要充分地参与算子的作用全过程
公理3(解析化、规范化公理)任意的
,皆可由一个统一的
的初等解析式表达。
定义2.2.4 设X为原始数据序列,D为缓冲算子,当X分别为增长序列,衰减序列或振荡序列时:
1.若缓冲序列XD比原始序列X的增长速度(或衰减速度)减缓或振幅减小,则称缓冲算子D为弱化算子。
2.若缓冲序列XD比原始序列X的增长速度(或衰减速度)加快或振幅增大,则称缓冲算子D为强化算子。
2.3实用缓冲算子的构造
定理2.3.1 设原始数据序列
令缓冲序列
其中
;k=1,2,……,n,则当X为增长序列,衰减序列或振荡序列时,D为弱化算子,并称为平均弱化缓冲算子(AWBO)
证明:直接利用
的定义,可知定理成立。
推论2.3.1对于定理1中定义的弱化算子D,
令
,
则
对于增长序列,衰减序列或振荡序列时,皆为二阶弱化算子。
定理2.3.2设原始序列和其缓冲算子序列分别为
其中
则当X为增长序列,衰减序列或振荡序列时,D为强化算子。
推论2.3.2 设D为定理2中定义的强化算子,令
,其中
,
则
对于增长序列,衰减序列或振荡序列皆为二阶强化算子。
定理2.3.3 原始数据序列和其缓冲算子序列分别为
其中
,则当X为增长序列,衰减序列或振荡序列时,D为弱化算子,并称D为加权平均弱化缓冲算子(WAWBO)
定理2.3.4 设
为非负的系统行为数据序列,令
其中
。
则当X为增长序列,衰减序列或振荡序列时,D为弱化缓冲算子,并称D为几何平均弱化缓冲算子(GAWBO)
定理2.3.5 设
为系统行为数据序列,各时点的权重向量为
,则
其中
。则当X D皆为弱化缓冲算子,并称D为加权平均弱化缓冲算子(WAWBO)。
定理2.3.6 设
,各时点的权重向量为
>0,
令
其中
则当X D为弱缓冲算子,并称D为加权几何平均弱化缓冲算子(WGAWBO)。
定理2.3.7 设
为系统行为数据序列,令
其中
。
则当X为增长序列,衰减序列或振荡序列时,D为强化缓冲算子,并称D为平均强化缓冲算子(ASBO)
定理2.3.8 设
为非负的系统行为数据序列,令
其中
。
则当X为增长序列,衰减序列或振荡序列时,D为强化缓冲算子,并称D为几何平均强化缓冲算子(GASBO)
以上列举了部分缓冲算子,当然,我们还可以考虑构造其它形式的实用缓冲算子,缓冲算子不仅可以用于灰色系统建模,而且还可以用于其它各种模型建模。通常在建模之前根据定性分析结论对原始数据序列施以缓冲算子,淡化或消除冲击扰动对系统行为数据序列的影响,往往会收到预期的效果。
[例2.3.1] 河南省长葛县乡镇企业产值数据(1983年-1986年)为
其增长势头很猛,1983-1986年每年平均递增51.6%,尤其是1984-1986年,每年平均递增67.7%。因此普遍认为今后不可能一直保持这么高的发展速度。经过认真分析,大家认识到增长速度高主要是基数低,而基数低的原因是过去对有利与乡镇企业发展的政策没有用足,用活,用好。要弱化序列增长趋势,就要将乡镇企业发展比较有利的现行政策因素附加到过去的年份中去,为此,引进推论1所示的二阶弱化算子,得二阶缓冲序列
用XD
建模预测得,1986-2000年该县乡镇企业每年平均递增9.4%,这一结果是1987年得到的,与“八五”后半期和“九五”期间该县乡镇企业发展实际基本吻合。
2.4均值生成算子
在收集数据时,常常由于一些不易克服的困难导致数据序列出现空缺(也称空穴),有些数据序列虽然完整,但由于系统行为在某个时点上发生突变而形成异常数据,剔除异常数据就会留下空穴,如何填补空穴,自然成为数据处理过程中首先遇到的问题,均值生成是常用的构造新数据,填补原序列空穴,生成新序列的方法。
定义2.4.1 设序列X在
出现有空穴,记为
,即
则称
定义2.4.2设序列
为k处有空穴
的序列,而
称为非紧邻均值生成数,所得序列称为非紧邻生成序列。
定义2.4.3 设序列
,若
,则称
为紧邻生成数,由紧邻生成数构成的序列称为紧邻均值生成序列。
2.5序列的光滑性
定义2.5.1设序列
,Z是X的均值生成序列:
,其中
,
X
是某一可导函数的代表序列,d为n维空间的距离函数,我们将X删去
后所得的序列仍记X,若X满足
1. 当k充分大时,
2.
则称X为光滑序列,1,2为序列光滑条件。
定义2.5.2称
为序列X的光滑比。
定义2.5.3若序列X满足
1.
2.
3.
则称X为准光滑序列。
2.6级比生成算子
定义2.6.1设序列
,则称
为序列X的级比。
2.7累计生成算子与累减生成算子
累加生成是使灰色过程由灰变白的一种方法,它在灰色系统理论中占有极其重要的地位。通过累加可以看出灰量积累过程的发展态势,使离乱的原始数据中蕴含的积分特性或规律充分显露出来。
定义2.7.1设
,D为序列算子
,其中
。
则称D为
的一次累加生成算子,记为1-AGO(Accumulating Generation Operator),称r阶算子
为
的r 次累加生成算子,记为r-AGO,习惯上,我们记
其中
定义2.7.2设
,D为序列算
,其中
2.8灰指数律
定义2.8.1 设序列
,若对于
1.
则称X为齐次指数序列。
2.
,称X为齐次指数序列。
定义2.8.2 设序列
若
1.
,则称序列X具有负的灰指数规律。
2.
,则称序列X具有正的灰指数规律。
3.
则称序列X具有绝对灰度为
的灰指数规律。
4.
时,称X具有准指数规律。
定理2.8.1设序列
为非负准光滑序列,则
的一次累加生成序列
具有准指数规律。
注:定理2.8.1是灰色系统建模的理论基础
第三章灰色关联分析
一般的抽象系统,如社会系统,经济系统,农业系统,生态系统等都包含有许多种因素,多种因素共同作用的结果决定了该系统的发展态势。我们常常希望知道众多的因素中,哪些是主要因素,哪些是次要因素,哪些因素对系统发展影响
大,哪些因素对系统发展影响小,哪些因素对系统发展起推动作用需加强,哪些因素对系统发展起阻碍作用需抑制……
数理统计中的回归分析,方差分析,主成分分析等都是用来进行系统特征分析的方法。但数理统计中的分析方法往往需要大量数据样本,且服从某个典型分布。灰色关联分析方法弥补了采用数理统计方法作系统分析所导致的缺憾.它对样本量的多少和样本有无规律都同样适用,而且计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。
灰色关联分析的基本思想是根据序列曲线几何形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间关联度就越大,反之就越小。例如某地区农业总产值
,种植业总产值
,畜牧业总产值
和林业总产值
,从1997-2002年共6年的统计数据如下:
从直观上看,与农业总产值曲线最相似的是种植业总产值曲线,而畜牧业总产值曲线和林果业总产值去与农业总产值曲线在几何形状上差别较大。因此我们可以说该地区的农业仍然是以种植业为主的农业,畜牧业和林果业还不够发达。