当前位置：文档库 › 基因表达式编程的经济统计时序挖掘

基因表达式编程的经济统计时序挖掘

第４０卷第５期四川大学学报（工程科学版）ｖ０１．４０Ｎｏ．５２００８年９月ＪＯＵＲＮＡＬＯＦＳＩＣＨＵＡＮＵＮＩＶＥＲＳＩＴＹ（ＥＮＧＩＮＥＥＲＩＮＧＳＣＩＥＮＣＥＥＤＩＴＩＯＮ）Ｓｅｐｔ．２００８－－

ＩＩｌｌｌｌ－ｌ｜————Ｉ●——＿———－■—＿—一文章编号：１００９－３０８７（２００８）０５－０１２１－０４

基于ＲＦＩＤ与基因表达式编程的经济统计时序挖掘刘齐宏１’２”，李天德２，周志斌３，易彬４，唐常杰５，刘齐巍６

（１．Ｉ＋ｔ；ｌｌ大学电气信息学院。四川成都６１００６５；２．四川大学经济学院，四川成都６１００６４；３．西南油气田分公司，ＩⅡＩ＃ｌ成都６１００５１；

４．泸州老窖股份有限公司，四川泸州６４６０００；５．四川大学计算机学院，四川成都６１００６５；６．四川大学公共管理学院，四川成都６１００６４）

摘要：为解决基因表达式编程（ＧＥＰ）在符号回归、ＲＦＩＤ分类及经济领域中对时序数据的挖掘速度和精度还不够的问题，提出了统计基因、统计染色体和统计时序一适应度的定义，并针对传统ＧＥＰ经济时序模型进行了综合改，．进；提出了新颖的单变量时序和多变量时序挖掘算法，提高了ＧＥＰ统计时序挖掘的速度和精度；实验表明，与传统ＧＥＰ、单变量ＧＥＰ时序算法相比，多变量ＧＥＰ时序算法挖掘速度快，其预测精度比单变量时序算法高出５％以上。

该算法同样适用于ＲＦＩＤ以及其他经济系统中的时序数据挖掘。

关键词：经济统计时序预测模型；单变量时序；多变量时序；ＧＥＰ函数挖掘

中图分类号：ＴＰ３１１．１３文献标识码：Ａ

ＲＦＩＤａｎｄＥｃｏｎｏｍｙＳｔａｔｉｓｔｉｃａｌＴｉｍｅＳｅｑｕｅｎｃｅＤａｔａＭｉｎｉｎｇ

ＢａｓｅｄｏｎＧｅｎｅＥｘｐｒｅｓｓｉｏｎ

ＬＩＵＱｉ—ｈｏｎ９１＇２”，口Ｔｉａｎ—ｄｅ２，ＺＨＯＵＺｈｉ．ｂｉｎ３，ＨＢｉｎｇ＋，ＴＡＮＧＣｋｎｇ－ｊｉｅ５，ＨＵＱｉ—ｗｅｉ６

（１．ＳｃｈｏｏｌｏｆＥｌｅｃｔｒｉｃａｌＥｎｇ．ａｎｄＩｎｆｏ．，ＳｉｃｈｕａｎＵｎｉｖ．Ｃｈｅ唧ｈ６１００６５，Ｃｈｉｎａ；

２．ＳｃｈｏｏｌｏｆＥｃｏｎｏｍｉｃｓ，ＳｉｃｈｕａｎＵｎｉｖ．，Ｃｈｅｎｇｄｕ６１００６４，Ｃｈｉｎａ；

３．ＳｏｕｔｈｗｅｓｔＯｉｌａｎｄＧａｓｂｆｉｄｄＣｏ．，Ｃｈｅｎｇｄｕ６１００５１，Ｃｈｉｎａ；４．ＩＡＩ小ＯｌｌＬａｏｊｉａｏＣｏ．Ｌｔｄ，ｈａｚｈｏｕ６４６０００，Ｃｈｉｎａ；

５．ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｅｒＳｃｉ．，ＳｉｃｈｕａｎＵｎｉｖ．，Ｃｈｅｎｇｄｕ６１００６５，Ｃｈｉｎａ；

６．ＳｃｈｏｏｌｏｆＰｕｂｌｉｃＡｄｍｉｎｉｓｔｒａｔｉｏｎ，ＳｉｃｈｕｍＵｎ／ｖ．，Ｃｈｅｎｇｄｌｌ６１００６４。Ｃｈｉ眦）

Ａｂｓｔｒａｃｔ：ＩｎｏｒｄｅｒｔｏｓｏｌｖｅｔｈｅｐｒｏｂｌｅｍｔｈａｔＧｅｎｅＥｘｐｒｅｓｓｉｏｎＰｒｏｇｒａｍｍｉｎｇ（ＧＥＰ）ｈａｓｎｏｔｓｔｉｌｌｔｕｒｎｕｐｔｒｕｍｐｓｔｏｔｈｅｍｉｎｉｎｇｒａｐｉｄｉｔｙａｎｄｐｒｅｃｉｓｉｏｎｏｆＲＦＩＤａｎｄＥｃｏｎｏｍｙＳｔａｔｉｓｔｉｃａｌＴｉｍｅＳｅｑｕｅｎｃｅＤａｔａｉｎｓｙｍｂｏｌｒｅｇｒｅｓｓｉｏｎａｎｄｃｈｓｓｄｏｍａｉｎ。ｔｈｅｄｅｆｉｎｉｔｉｏｎｏｆＳｔａｔｉｓｔｉｃａｌ—Ｇｅｎｅ，Ｓｔａｔｉｓｔｉｃａｌ．Ｃｈｒｏｍｏｓｏｍｅ。Ｓｔａｔｉｓｔｉｃａｌ．ｆｉｔｎｅｓｓａｎｄｔｈｅｉｎｔｅｇｒａｔｉｏｎａｍｅｌ．ｉｏｒａｔｉｏｎｔｏｔｒａｄｉｔｉｏｎａｌＧＥＰｔｉｍｅＳｅｑｕｅｎｃｅｍｏｄｅｌｗｅｒｅｐｒｏｐｏｓｅｄ．Ｔｈｅｎｏｖｅｌｍｉｎｉｎｇａｌｇｏｒｉｔｈｍｏｆｓｉｎｇｌｅ—ｖａｒｉａｂｌｅａｎｄｍｕｌｔｉ??ｖａｒｉａｂｌｅｔｉｍｅｓｅｑｕｅｎｃｅｍｉｎｉｎｇａｌｇｏｒｉｔｈｍｗｅｒｅｇｉｖｅｎｔｏｈｅｉｇｈｔｅｎｔｈｅｍｉｎｉｎｇｒａｐｉｄｉｔｙａｎｄｐｒｅｃｉｓｉｏｎｏｆＧＥＰｅ?－

ｍｏｄｅｌ．Ｔｈｅｅｆｆｅｃｔｉｖｅｎｅｓｓｏｆｎｅｗａｌｇｏｒｉｔｈｍｗａｓｄｅｍｏｎｓｔｒａｔｅｄｂｙｅｘｔｅｎｓｉｖｅｅｘｐｅｒｉｍｅｎｔｓａｎｄｃｏｎｏｍｙｔｉｍｅｓｅｑｕｅｎｃｅ

ｔｈｅｒｅｓｕｌｔｓｈｏｗｅｄｔｈａｔｔｈｅｍｉｎｉｎｇｒａｐｉｄｉｔｙｏｆｍｕｌｔｉ—ｖａｒｉａｂｌｅｔｉｍｅｓｅｑｕｅｎｃｅｍｉｎｉｎｇａｌｇｏｒｉｔｈｍｗａｓｒａｐｉｄｎｅｓｓａｎｄｔｈｅｆｏｒｅｃａｓｔｐｒｅｃｉｓｉｏｎｗａｓｈｅｉｇｈｔｅｎｕｐ５％ｃｏｍｐａｒｅｄｗｉｔｈｔｒａｄｉｔｉｏｎａｌＧＥＰａｎｄｓｉｎｇｌｅ－ｖａｒｉａｂｌｅＧＥＰｔｉｍｅｓｅｑｕｅｎｃｅｍｉｎ—ｉｎｇａｌｇｏｒｉｔｈｍ．ＮｅｗａｌｇｏｒｉｔｈｍＷａｓａｐｐｒｏｐｒｉａｔｅｆｏｒＲＦＩＤａｎｄｏｔｈｅｒｅｃｏｎｏｍｙｓｙｓｔｅｍａｓｗｅｌｌ．

Ｋｅｙｗｏｒｄｓ：ｅｃｏｎｏｍｙｓｔａｔｉｓｔｉｃａｌｔｉｍｅｓｅｑｕｅｎｃｅｆｏｒｅｃａｓｔｍｏｄｅｌ；ｓｉｎｇｌｅ?－ｖａｒｉａｂｌｅＧＥＰｔｉｍｅｓｅｑｕｅｎｃｅ；ｍｕｌｔｉ—－ｖａｒｉａｂｌｅｔｉｍｅｓｅｑｕｅｎｃｅ；ＧｅｎｅＥｘｐｒｅｓｓｉｏｎＰｒｏｇｒａｍｍｉｎｇｆｕｎｃｔｉｏｎｍｉｎｉｎｇ

收稿日期：２００ｒ７—１０－３０

基金项目：国家自然科学基金资助项目（６０４７３０７１）；四川省科技攻关资助项目（２００６２０１—０２７）；Ｉ四］ｌｌ省科技支撑计划资助项目（０７ＧＧ００６－０２５）

作者简介：刘齐宏（１９６４一），男，副教授，博士后．研究方向：数据挖掘与金融工程．

１２２四川大学学报（工程科学版）第４０卷

ＧＥＰ经济统计时序挖掘算法涉及到时序基因、

时序染色体和适应度函数等概念，作者提出的ＧＥＰ

时序挖掘模型是针对历年的经济统计时序数据，例

如对成都市国民经济和社会发展总量与速度等经济

指标时间序列进行预测。针对经济统计时序数据特

点，在传统ＧＥＰ概念的基础上¨。Ｊ，提出了Ｓｔａｔｉｓｔｉ．

ｃａｌ—Ｃ，ｅｎｅ、和Ｓｔａｔｉｓｔｉｃａｌ—Ｆｉｔｎｅｓｓ等新概念和技术。

１问题描述

为了形式化描述ＧＥＰ时间序列的统计指标序

列数据对象，引入下列定义：

定义ｌＧＥＰ时序中的统计基因是一个５元组：Ｓｔａｔｉｓｔｉｃａｌ—Ｇｅｎｅ＝（Ｅ，ｒ，Ｆ，Ｄｐ，ｓ），其中，Ｅ为基因型；Ｔ（Ｔｅｒｍｉｎａｌ）为基因终端字符集；Ｆ（Ｆｕｎｃ．ｔｉｏｎ）为基因运算符集合；ｏｐ为基因遗传算子集合。ｓ（ｓｃｏｒｅ）为适应度。

定义２统计时序一适应度：在统计时序一ＧＥＰ模型中，第ｉ个个体的适应度函妣规定由式（１）计算：

Ｚ＝≥：（Ｋ－ＩＰ＃一弓Ｉ）（１）

Ｊ＝１

其中，Ｋ为绝对误差阈值【５。６】，由先验知识确定，Ｐ＃表示第．『个样本根据第ｉ个个体所对的表达式计算的值，ｍ为样本个数，Ｚ为第Ｊ个样本的目标值。由式（１）定义的适应度函数理论最大值为ｍ幸Ｋ，该适应度函数在算法设计中具有简便易行的特点。为了在直观上理解所挖掘的函数模型的精度，针对时间序列函数模型，需要计算出其复相关系数（Ｒ）：

Ｒ２＝１一ＳＳＥ／ＳＳＴ（２）

舸

其中，ＳＳＥ＝∑（乃一觅）２，多为变量Ｙ关于函数ｇ的

用

＾

估计值，称ＳＳＥ为残差平方和。ＳＳＴ＝∑（乃一乃）２，

Ｊｉ

Ｙ为Ｙ的平均值，称ＳＳＴ为总离差平方和。

例１：考虑表达式（（ａ—ｂ）ｇｔ（Ｃ＋ｄ））忱。函数集ＦｕｎｃｔｉｏｎＳｅｔ＝｛Ｑ，事，一，＋｝，Ｑ表述ｓｑｒｔ开方，终结符集ＴｅｒｍｉｎａｌＳｅｔ＝ｌａ，ｂ，ｃ，ｄ｝，图ｌ为时序基因的表达式树，对该ＥＴ进行层次遍历可以得到序列：“ＱＸ一＋ａｂｃｄ”［５－７１ｏ

２统计数据的时序ＧＥＰ算法

目前ＧＥＰ与遗传算法和遗传编程一样，还存在未成熟收敛和收敛精度差的难题ｍ８ｌ。为解决其精度差问题，对ＧＥＰ时间序列模型进行了综合改进。

图１ＧＥＰ时序基因表达式树

Ｆｉｇ．１ＧＥＰｔｉｍｅＳｅｑｕｅｎｃｅ－ＧｅｎｅＥｌ＂

１）ＧＥＰ浮点数系数编码?

在ＧＥＰ算法中，对于数值编码采用了浮点数编码的方法。经过实际应用，发现浮点数编码能提高了ＧＥＰ运算效率，适合精度较高应用。

２）改进了适应度函数设计

在统计学中，Ｒ２是用于表示非线性模型的重要指标，用于评价两组数据符合程度的方法更多的是采用相关系数。所以，在作者建立的多变量的时序ＧＥＰ预测模型中，第ｉ个个体的适应度函数正规定由下式计算：

ｚ＝群＿ｌ－（骞）器－１－鼎

（３）其中，１ｓｐｓｎ，ＳＳＥ＝∑（乃一舅）２，ＳＳＴ＝∑（乃一一

Ｊ。ｌＪ５ｌ

乃）２，榔Ｅ，＝ＳＳＥ／（乃一１），多为变量Ｙ关于函数ｇ的估计值，Ｙ为变量，，的平均值，称ＳＳＥ为残差平方和，ＳＳＴ为总离差平方和。

在时序ＧＥＰ算法中，结合了基因组多样性制导的策略及分阶段进化算法［９－１０１。单变量时序ＧＥＰ算法的基本结构及特点如下：

算法１单变量时序ＧＥＰ基本算法

输入：训练数据集Ｄａｔａｓｅｔ；函数集Ｆｕｃｆｉｏｎｚｅｔ；基因头部长度ＬｅｎｇｔｈＯｆＨｅａｄ等进化参数；

输出：最优个体ＢｅｓｔＣｈｒｏｍｏｓｏｍｅ；

ＢＥＧＩＮ

１．ＲａｎｄｏｍｌｙｉｎｉｔｉａｌｉｚｅｔｈｅＰｏｐｕｌａｔｉｏｎ

／／随机地产生统计染色体初始种群

２．ｗｈｎｅ（ｔｅｒｍｉｎａｔｉｏｎｃｏｎｄｉｔｉｏｎｓａｒｅｎｏｔｒｅａｃｈｅｄ）

３．ＣｏｎｖｅｒｔｔｈｅＣｈｒｏｍｏｓｏｍｅｓｉｎｔｏｅｘｐｒｅｓｓｉｏｎｔｒｅｅｓ／／解析统计染色体

４．ＥｖａｌｕａｔｅｔｈｅＦｉｔｎｅｓｓｏｆＣｈｒｏｍｏｓｏｍｅ

第５期刘齐宏，等：基于ＲＦＩＤ与基因表达式编程的经济统计时序挖掘１２３

／／评价适应度

５．ｉｆ（ｔｅｒｍｉｎａｔｉｏｎｃｏｎｄｉｔｉｏｎｓａｒｅｒｅａｃｈｅｄ）

６．ｒｅｔｕｒｎｔｈｅＢｅｓｔＣｈｒｏｍｏｓｏｍｅ

／／返回最优解

７．ｅｌｓｅ

８．ＫｅｅｐｔｈｅＢｅｓｔＣｈｒｏｍｏｓｏｍｅ

／／保存上一代最优个体

９．ＡｐｐｌｙＧｅｎｅｔｉｃｏｐｅｒａｔｉｏｎｓｏｎＰｏｐｕｌａｔｉｏｎ

／／对统计染色体种群执行遗传（算子）操作１０．ｅｎｄｉｆ

１１．ｅｎｄｗｈｉｌｅ

ＥＮＤ

３ＧＥＰ多变量经济时序挖掘预测算法

在统计系统中，其多个统计变量存在相互影响，因此提出了多维指标的时间序列预测式挖掘。即多变量时序ＧＥＰ算法框架如下：

算法２多变量时序ＧＥＰ算法

输入：Ｍｕｆｔｉ—ＶａｒｉａｂｌｅＤａｔａＳｅｔ

／／原始多变量训练数据集；

输出：ＢｅｓｔＴｉｍｅＳｅｑｕｅｎｃｅ

／／最优时间序列表达式；

ＢＥＧＩＮ

１．ＰＣＡＷ（）；

／／利用ＰＣＡＷ对ＧＥＰ输入变量进行降维预处理

２．ＳｔａｎｄａｎｄＤａｔａ（）；

／／消除每个因素变量的量纲不同对主成分分析和对ＧＥＰ建模带来的影响，对数据进行标准处理；

３．ＤａｔａＭａｔｒｉｘ（）；’

／／求出影响因素的样本相关矩阵；

４．ＣｏｒｒｅｌａｔｉｏｎＭａｔｒｉｘ（）；

／／求出样本相关矩阵的特征值；

５．Ｅｉｇｅｎｖｅｃｔｏｒ（）；

／／求出对应的特征向量和贡献率，特征值接降序排列：

－６．Ｋ—ｃｏｍｐｏｎｅｎｔＤａｔａＳｅｔ（）；

／／计算主成得分值，选取主成分个数ｋ，最后得到新的降维后的测试样本集；

７．ＰＣＡＷ－ＧＥＰ（）；

／／选取主成分作为新的输入样本集数据输入，开始ＧＥＰ的时序挖掘过程；得到ＥＰＴｉｍｅＳｅ—ｑｕｅｎｃｅ；

８．ＧＥＰＴｉｍｅＳｅｑｕｅｎｃｅ（）；

／／将新输入建立模型得出预测值；

９．Ａｎｔｉ—ＳｔａｎｄａｎｄＤａｔａ（）；

／／逆标准化得到真正的预测值；

ｌＯ．Ｋ—ｃｏｍｐｏｎｅｎｔＧＥＰ（）；

／／保留主成分个数，确定输入变量个数，最终建立正确的预测模型；

ＥＮＤ

４实验与性能分析

１）数据来源

原始数据来源于（２００６成都统计年鉴》，选择了影响ＧＤＰ增长的６个指标，建立合适的数学模型并预测２００３，２００４，２００５年的ＧＤＰ。

２）多变量时序ＧＥＰ实验

利用公式龟＝二—二堕Ｌ对样本数据进行归一

玉Ⅲ一再血

化处理，则输入数据位于区间［Ｏ；１］。换算回预测值：

茹。＝（戈ｍｓｔｔ一菇ｍｔ。）量。＋茗。‘。（４）运行实验１００次，得到复相关系数达到了０．９９８３２５。采预报式检验，其挖掘预测函数关系为：ｙ＝

（（（（一“））＋如））＋（（如）一如）宰（魄）一如））））＋如）））

（５）经Ｍａｔｈｅｍａｔｉｃ化简后得：

，，ｉ＝２ｘ２＋石ｌ（茗５一石２）（６）计算得出平均拟合相对误差是０．１５７９％，平均预测相对误差是一０．０９１０５％。得到模型的拟合／预测精度比单变量的ＧＥＰ算法高于５％以上。得到多变量时问序列挖掘模型的拟合／预测如图２所示。

璧塞星蔓塞墨萎室萎鲞萎量量萎

△口口∞昏小吼昏岔凸西呈宴旦

年份

图２ＧＥＰ多变量时序挖掘模型

Ｆｉｇ．２ＧＥＰｍｕｌｔｉ－ｖａｒｉａｂｌｅｔｉｍｅｓｅｑｕｅｎｃｅｍｉｎｉｎｇｍｏｄｅｌ

１２４ＩⅡｔＪＩＩ大学学报（工程科学版）第４０卷

５结论

。根据经济领域中统计数据挖掘对预测国民经济ＧＤＰ数据的特点，提出了新颖的经济统计时序ＧＥＰ函数挖掘与预测方法和技术。主要贡献如下：针对多变量时间序列中各因素之间存在着一定的相关性，所观测到的时序在一定程度上反映的信息有所重叠，提出了基于ＧＥＰ的多变量时序预测模型。通过主成分分析方法对影响时间序列的诸多因素进行成分约简，提取影响因子大的几个综合指标作为输入变量，提高了ＧＥＰ时序挖掘的效率和准确率。通过实验证明，以同一批真实宏观的国民经济统计年鉴ＧＤＰ数据为研究对象，以后面年度ＧＤＰ数据为预测目标，分别建立单变量预测模型和多变量预测模型，然后在不同的经济预测模型上进行仿真挖掘预测。通过实验结果和相关性能指标的对比分析，证明多变量ＧＥＰ经济统计时序预测模型的拟合／预测要比单变量ＧＥＰ算法的预测精度提高了５％以上。该方法同样适用于ＲＦＩＤ应用系统的时序数据挖掘。

参考文献：

［１］ＦｅｒｒｅｉｒａＣ．Ｃ，ｅｎｅＥｘｐｒｅｓｓｉｏｎＰｒｏｇｒａｍｍｉｎｇ：Ａｎｅｗａｄａ砸他ａｌｇｏｒｉｔｈｍｆｏｒ８０ｌｖｉｎｇｐｒｏｂｌｅｍｓ［Ｊ］．ＣｏｍｐｌｅｘＳｙｓｔｅｍｓ，２００１，１３（２）：８７—１２９．．

［２］ＣｏｌｄｂｅｒｇＤＥ，ＷａｎｇＬ．Ａｄａｐｔｉｖｅｎｉｃｈｉｎｇｖｉａｃｏ－ｅｖｏｌｕｔｉｏｎ—ａｒｙｓｈａｒｉｎｇ［ｃ］／／Ｑｕ籼，ｅｔａ１．Ｃ，ｅｎｅｔｉｅａｌｇｏｒｉｔｈｍｉｎｅｎｇｉｎｅｅｒｉｎｇａｎｄｃｏｍｐｕｔｅｒｓｃｉｅｎｃｅ，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，Ｌｔｄ，１９９７：２１—３８．

［３］ＪｉａＸｉａｏｂｉｎ，ＴａｎｇＣｈａ，ｍｉｉｅ，ＺｕｏＪｉｅ，ｅｔａ１．１ＶｌｉｎｉｎｇｆｒｅｑｕｅｎｔｆｕｎｃｔｉｏｎｓｅｔｂａｓｅｄＯｉｌＣ，ｅｎｅＥｘｐｒｅｓｓｉｏｎＰｒｏｇｒａｍｍｉｎｇ［Ｊ】．ＣｈｉｎｅｓｅＪｏｕａｎａｌｏｆＣｏｍｐｕｔｅｒｓ，２００５，２８（８）：１２４７—１２５４．［贾晓斌，唐常杰，左劫，等．基于基因表达式编程的频繁函数集挖掘［Ｊ］．计算机学报，２００５，２８（８）：１２４７—１２５４～

［４］ＹｕａｎＣｈａｎｇａｎ，ＴａｎｇＣｈａｎｇｉｉｅ，ＷｅｎＹｔｕｍｇｕａｎｇ，ｅｔａ１．Ｉｍ．ｐｌｅｍｅｎｔａｔｉｏｎｏｆｉｎｔｅｌｌｉｇｅｎｔｍｏｄｅｌｂａｓｅｓｙｓｔｅｍｂａｓｅｄＯｉｌＧｅｎｅＥｘｐｒｅｓｓｉｏｎＰｒｏｇｒａｍｍｉｎｇ［Ｊ］．ＪｏｕｒｎａｌｏｆＳｉｅｈｕａｎＵｎｉｖｅｒｓｉｔｙ：ＥｎｇｉｎｅｅｒｉｎｇＳｃｉｅｎｃｅＥｄｉｔｉｏｎ，２００５，３７（３）：９９—１０４．［元昌安，唐常杰，温远光，等．基于基因表达式编程的智能模型库系统的实现［Ｊ］．四川大学学报：工程科学版，

２００５，３７（３）：９９—１０４．］

［５］ＨｕａｎｇＸｉａｏｄｏｎｇ，Ｔａｎｇ（：ｈａｎｇｊｉｅ，ＰｕＤｏｎｇｈａｎｇ，ｅｔａ１．Ａｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｇｒａｍｍｉｎｇｂａｓｅｄｒｕｃｔｉｏｎｄｉｓｃｏｖｅｒｙｍｅｔｈｏｄ［Ｊ］．ＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅ，２００３，３０（Ｓｕｐｐｌｅｎａｅｎｔ）：２７８—１８２．［黄晓冬，唐常杰，普东航，等．基于基因表达式编程的函数关系发现方法［Ｊ］．计算机科学，２００３，３０（增刊）：２７８—１８２．］

［６］ＺｈｏｎｇＹｉｘｉａｏ，ＴａｎｇＣｈａｎ商ｉｅ，ＣｈｅｒｔＹｕ，ｅｔａ１．ＩｍｐｒｏｖｅＫＤＤｅｆｆｉｃｉｅｎｃｙｏｆＣｅｎｅＥｘｐｒｅｓｓｉｏｎＰｒｏｇｌ－ａｍｍｉ．ｇｂｙｂａｃｋ—ｔｒａｃｋｉｎｇｓｔｒａｔｅｇｙ［Ｊ］．ＪｏｕｒｎａｌｏｆＳｉｅｈａｔｍＩＪｎｉｖｅｒＢｉｒｙ：ＮａｔｕｒａｌＳｃｉｅｎｃｅＥｄｉｔｉｏｎ，２００６，４３（２）：２９９—３０４．［钟义啸，唐常杰，陈宇，等．提高基因表达式编程发现知识效率的回溯策略［Ｊ］．四川大学学报：自然科学版，２００６，４３（２）：２９９—３０４．］

（７］ＦｅｒｒｅｉｒａＣ．ＧｅｎｅｔｉｃｒｅｐｒｅｓｅｎｔａｔｉｏｎａｎｄｎｅｕｔｒａｌｉｔｙｉｎＧｅｎｅＥｘｐｒｅｓｓｉｏｎＰｒｏｇｒａｍｍｉｎｇ［Ｊ］．ＡｄｖａｎｃｅｓｉｎＣｏｍｐｌｅｘｓｔ８一ｔｅｒｎｓ，２００２，５（４）：３８９—４０８．

［８］ＨｕＪｉ肌ｊｕＪＩ，ＴａｎｇＣｈａｎｇｊｉｅ，Ｐｅｎｇｊｉ．ｇ，ｅｔａ１．ＶＰＳ－ＧＥＰ：Ｓｋｉｐｐｉｎｇｆｒｏｍｌｏｃａｌｏｐｔｉｍｉｚａｔｉｏｎｆａｓｔａｌｇｏｒｉｔｈｍ［Ｊ］．ＪｏｕｍａｌｏｆＳｉｃｈａｕｎＵｎｉｖｅｒｓｉｔｙ：ＥｎｇｉｎｅｅｒｉｎｇＳｃｉｅｎｃｅＥｄｉｔｉｏｎ，２００７，３９（１）：１２８—１３３．［胡建军，唐常杰，彭京，等．快速跳出局部最优的ＶＰＳ．ＧＥＰ算法［Ｊ］．四川大学学报：工程科学版，２００７，３９（１）：１２８—１３３．］

［９］ＰｅｎｇＪｉｎｇ，ＴａｎｇＣｈａｎｇｊｉｅ，ＬｉＣｈｕａｎ，ｅｔａ１．Ｍ—ＧＥＰ：ＡｌｌｅＷ＂ｅｖｏｌｕｔｉｏｎａｌｇｏｒｉｔｈｍｂａｓｅｄ０１３．ｍｕｌｔｉ—ｈｙｅｒｃ：ｈｌ－ｏｎｌ０６０ｌｌｌｅ８ＧｅｎｅＥｘｐｒｅＢｓｉｏｎＰｒｏｇｒａｍｍｉｎｇ［Ｊ】．ＣｈｉｎｅｓｅＪｏｕａｒｄｏｆＣｏｍｐｕｔｅｒ，２００５，２８（９）：１４５９—１４６６．［彭京，唐常杰，李川，等．Ｍ－ＧＥＰ：基于多层染色体基因表达式编程的遗传进化算法［Ｊ］．计算机学报，２００５，２８（９）：１４５９—１４６６．］

［１０］ｕｕＱｉｈｏｒＩｇ，ＴａｎｇＣｈａｎｇｊｉｅ，ＨｕＪｉａｎｊＵｌｌ，ｅｔａ１．Ｇｅｎｅ＆－ｐｒｅｓｓｉｏｎＰｒｏｇｒａｍｍｉｎｇ

ｂａｓｅｄＯｎｄｉｖｅｒｓｉｔｙ?ｇｕｉｄｅｄｇｒａｄｉｎｇｅＶＯ－ｌｕｔｉｏｎ［Ｊ］．ＪｏｕｒｎａｌｏｆＳｉｅｈａｕｎＵｎｉｖｅｒｓｉｒｙ：ＥｎｇｉｎｅｅｒｉｎｇＳｅｉ—ｅｎｃｅＥｄｉｔｉｏｎ，２００６，３８（６）：１０８—１１３．［刘齐宏，唐常杰，胡建军，等．多样性制导分段进化的基因表达式编程［Ｊ］．四川大学学报：工程科学版，２００６，３８（６）：１０８—１１３．］

（编辑杨蓓）