文档库 最新最全的文档下载
当前位置:文档库 › 基于深度学习网络的烟叶质量识别

基于深度学习网络的烟叶质量识别

安徽农业科学,J.Anhui Agric.Sci.2018,46(10) :185 -188

基于深度学习网络的烟叶质量识别

韩东伟,王小明*,王新峰(河南中烟工业有限责任公司许昌卷烟厂,河南许昌461000)

摘要概述了烟叶质量和熟成度分类的主要依据,采用自动编码器预训练方法重构的卷积神经网络构建了烟叶质量识别模型,并采用

实地采集的数据集进行了实验验证,结果表明重构的深度训练自编码器在分类性能上达到99.92%的准确度。

关键词深度学习;智能识别;烟叶质量识别

中图分类号S126 文献标识码A 文章编号0517 -6611(2018)10 -0185 -04

Identification of Tobacco Quality Based on Deep Learning Network

H A N Dong-wei, W A N G Xiao-ming,W A N G Xin-feng(Xuchang Cigarette Factory , Henan China Tobacco Industrial C o.,Ltd Henan 461000)

Abstract The main basis for the identification of tobacco l a quality and ripening degree was summarized. The convolution neural network re-constructed by the automatic encoder pre-training method was used to construct the tobacco l a quality identification model. The experimental data were used to verify the experimental results and the results showed that the reconstructed depth training self-enco racy in classification performance.

Key words Deep learning ; Intelligent identification ;T obacco quality identification

烟草的质量识别长期以来主要依赖人工分拣和分类,效

率慢且受操作人员的主观因素影响较大。深度学习网络作

为一种新的机器学习技术,在图像处理和智能识别领域得到

了广泛应用,并有着优异的性能。随着近年来深度学习技术

的快速发展,以图像处理和语音识别为主的深度学习技术的

应用也得到广泛展开,在各行各业中都得到了普遍应用,并

在农业领域取得了较大的经济与社会收益[1]。我国的烟叶

种植和烟草制品消费量均十分庞大,将深度学习技术与图像

处理相结合并在烟草工业中应用对于烟草行业的现代化建

设十分关键[2]。笔者利用深度学习网络构建烟叶的熟成度

分类模型,进行智能化的烟叶质量识别,旨在提高烟叶分拣

及分类工作的效率和精度。

1烟叶熟成度分类

烟叶的质量和熟成度检验主要分为内部检测和外部检测。内部质量检测指的是烟叶的化学成分、燃烧测试、化学

分析和通过人M官进行的吸烟测试来实现的,而外部质量

检测主要通过人的肉眼对烟叶进行观察。由于烟叶化学成

分复杂,内部质量检测费用较高,且费时费力[3]。因此,外部

质量检测经常在对时间要求较高的情况下被选择来代替内

部质量检测,且烟叶的内部质量也与其外部质量密切相关,有经验的烟厂生产人员往往仅凭肉眼观察就能分辨烟叶的

质量和熟成度。烟叶的外部质量检验包括色泽、熟成度、表

面纹理、大小和形状。在通过人类视觉进行烟叶质量检验时,不可避免地受到检验人员的身体、心理和环境的影响。

烤烟烟叶的具体分级标准可能因国家和地区而异,但烟

叶分类的一般方法和考察的外部特征相似。首先,烟叶被分

类为正常烟叶和异常烟叶。一般情况下,大部分的烟叶都属

于正常烟叶,因此对异常烟叶暂不进行讨论。其次,正常烟

作者简介韩东伟(1982—)男,河南周口人,工程师,硕士,从事计算 机软件研发及信息系统管理工作。*通讯作者,工程师,硕

士,从事计算机软件研发及信息系统管理工作。

收稿日期2018-01-22叶根据其在烟草植株的茎上生长的位置和颜色不同,分为X 下部(lu g s)、C中部(cu tters)、B上部(lea f)。对生长位置的判断主要基于颜色、表面纹理、烟叶的形状和叶脉特征。叶片按颜色分为L梓檬黄色(le m o n)、F橘黄色(orang e)和R红棕色(rid - brown)。通过生长位置和叶片颜色的组合,得到:下部柠檬黄色(X L)、下部橘黄色(X F)、中部柠檬黄色(CL)、中部橘黄色(C F)、上部柠檬黄色(B L)、上部橘黄色(B F)和上部红棕色(BR)。

烟叶熟成度分类参照GB2635 - 1992烤烟的规定。《烤烟》国标中将熟成度分为完熟、成熟、尚熟、欠熟和假熟5个等级。按照国标要求,烤烟烟叶熟成度的判断依据包括成分、结构、密度、油分、气味、颜色、斑点、光滑程度和色度等。烟叶熟成度等级及相应外观特征见表1。其中,结构、颜色、斑点、光滑程度等在一定程度上都可以采用机器视觉技术来进行自动分拣、分类和评级。

表1烟叶熟成度等级及相应外观特征

Table1 The ripening degree level aad appearance characteristics of tobacco

等级

Level熟成度

Ripening degree外观特征

Appearance characteristics

1完熟结构疏松,颜色多橘黄或浅红棕色,有明显的成

熟斑,有些伴有赤星病斑

2成熟没有任何的含青或明显的挂灰和蒸片类的杂

色,没有大面积的光滑叶,色度无异常

3尚熟外观有一定的含青,有较大面积的光滑叶,或有

较明显的挂灰和蒸片等杂色,颜色偏浅淡

4欠熟有较大程度的含青,或者有较大面积的僵硬

(光滑)有严重的挂灰或蒸片等杂色现象

5熟颜色较浅或身份较薄,调制后表现为黄色的

烟叶

2深度学习网络

深度学习网络是基于大数据信息建立的统计学习方

法[],属于人工智能领域中的机器学习学科,其目的是通过大量样本的统计学习,建立针对某种特定问题的专家系统,

186安徽农业科学2018 年

借助或不借助人类知识自动解决某一领域的特定问题。深

度学习的主要思想是:通过建立具有多个的神经网

,实输入数据的深层次表达,从而实的分类与

特征抽取。使用深度学习方法,可以让计算机自动学习到人

工方法未必能够发现的重要特征。

深度学习为人工智能领域和机器学习学科的一

种最新的技术,近年关研究[5]。深度

学习的理论研究、算计系统在许多

[6_7],如语音、图像分类和自然语等[8]。目前

最主要的深度学习包括深度置信网络(Deep belief net-

w o r k,D B N) [] 、卷积神经网络(Convolutional neural network,

C N N)[10]、循环神经网络(Recurrent neural network,R N N)和

堆叠自动编码器(Stacked autoencoders,S A E)等[11]。

A E是 3 j,将输入表达编码为一个降维映射,

并将该降维映射重新解码还原为原输入,在训练过程中最小

化重构误差。

笔者自动编码器和卷积神经网络相结合的方法,建

立一无监督预训练,以 训练深度的专门,通过对烤烟烟叶的图像数据,自动进行烤烟烟叶检验与分。

2.1稀疏自动编码器稀疏自动编码器是神经网络的一种,其机制是试图在无监督过程中使其输出与输入近似。自动编码器的基本模型是一个3 )(图1),其隐神经个数少于输入特征数,因此输隐相当于一个编码过程,而隐含层到输则视为解码。在编码过程中,自动编码器试图将输入向量*按一定的映射编码为^,如式(1)所示。

y=/W⑴

当编码过程完成后,解码过程是将编码的特征向量y重构成新的并^尽可能地还原*,其过程如式(2)。

x,=g(y)(2)

V的维数一般小于*,但其可以通过g(y)来还原*,因此可视其为*的特征。自动编码器的就是通过特征将高维问题转化为低维问题,从而降低问题的度,以使问求解。使*接近于*的过程可以传播算法来训练,从而获得编码y。该算法逻辑如图2所示。

输隐的映射即编码过程,对任何*维向量

*^",经过输隐的映射, 的低维向量y=/(),y E岁。从隐输的过程,自动编码

器的对应低维向量y进行“解码”,得到与*同维度*尽通过反向传播算法训练,并f(*+g(*

的参数以最小化重构误差,使存在一个足的正数Z且

\*'-*l

在具体训练过程中,将电能计量器具的运行条件矩阵I 作为自动编码器的输入矩阵E是矩阵Z中的第i条测试数据的条件向量,将*作为自动编码器的第*个输

入向量,编码层的数量为‘通过式(3)得到编码

图2自动编码机算法逻辑

F i g. 2 The al go rit hm lo g i c o f a utom ati c co d in g ma c h i ne

h^R dxI。

力=?(职*+6)⑶

式中,为编码器的激活函数,如sigmoid函数或者R e L U单元。W^R dx"是权值矩阵,E R dxi是偏置向量。将y输入解码层,通过式(4)重构输入向量,获得*尽E R"xI:

*尽=Sg(Wyl+b')(4)式中,g为解码器的激活函数。权值矩阵一般被限制为珟=见'6尽I』为解码层的偏置向量。

训练过程中,自动编码器通过不断调整解码层和编码层的权阵和偏置这4个参数即P9=\W j^,b,6尽,试图化重构误差:

w w i尽1=|卜g(珟s(W*+6)+ 6尽_*||2() 2.2卷积神经网络卷积神经网络是由用于特征提取的卷积于特征处理的交叠组成的。

输入是一个图像的数阵,输出则是其。输入图像经过若干个“卷积”和“采样”加工后,在全连接层网络实现与输出目标之间的映射。卷积是Hubel、Wiesel等通过对猫科动物视觉系统的研究中受到

计的。

积的卷积层由若干个特征图组成,每个特征图上的所有神经元共享同一个卷积核的参数。积核对前一层输入图像进行卷积运算得到,因此有效缩减了以往全连要优化的权值个数,成功加深了训练层数。第Z 的第J个特征图矩阵*尽可能由前一个特征图卷积加权得到,一般表示为:

* ==! 2^*1- *4 +6j](6)式中,为激活函数;%代表输入特征图的组合,*代表卷积运算,4为卷积核矩阵,6I为偏置矩阵

46卷10期韩东伟等基于深度学J网络的烟叶质量识别187

池化层作用是基于局部相关性原理进行池化采样,从而在减少数据量的同时保留有用信息。采样过程可以表示为:x) =f{down{x j^1))(7)

式中,dW n()表函数。卷积神经网络在卷积层和

后,通常会连接一个或多个全连。全连的和全连的隐相同,全连接层的每个

会与下一层的每个相连。图像分类任务而,在输要Softim x分类器将任务进行

编码,并采用最小化交叉爐作为损失函数。Softm ax归一化概率函数定义如下:

z,-丽^,2,…,m)(8) I,1ex p (Zj)

式中,是每预测的结果,由于终需做归

一化处理,因此减去一个最大值并不终结果,B 计算时的数值稳定性的作用。同时,根据^⑷来预测

输入z,属于每个类别的概率。这样,损失函数定义为:L(= -logo-,(z(1〇)

在训练过程中,卷积神经网络仍采用输入正向传播和误传播算法进行训练,最小化分误差。

3卷积自动编码器网络结构

积权值共享和卷积操作代替了传统神经

与层之间的矩阵内积运算,有效加深深度并提高

的训练效果。但对于深度,反向传播算法的梯

度消失问没有彻底解决。对于的言,网络深度的增加依然会导致网络的学习效能降低。

自动编码器化重构误差进行无监督训练,在堆

叠自动编码器中,这个训练过程实际上成为一种预训练(pre -training)。预训练是一种广泛使用的深度网络训练方,通过预先将权较为有利的位置,可以有效训练深度, 效能。笔者以此重构一种新的

, 间运算积,并在卷积操纵之后使用

积为解,化重误预权。在预训练后,传播算参数,的训练效果。如图3所示,

此外,为自动编码器加入基于Kullbak - Leibler(KL)散度的稀疏性限制,以在训模型练过程中尽量避免过拟合,其限制如式(11)所示。

|叫p||L,j(1)

式中,p表示隐含层的平均活跃度,p =^n f i y;;X L(P lip)表示分别以P和P为均值的2个变量之间的相对熵。引入稀疏性就是的参数近似于0,即权阵的正

则化,所以在这里希望隐参数的一个函数,即平

均活跃度p趋近于近似于0的常数P。K L散度的目的就是建立一个罚函数,使损失函数(loss function)因p偏离p的程度惩罚。||p)的数学表达式如下:

KL(p U p O=p l n-P + (1 -p)l n1—(12)

Pi1-ft

则构建的自动编码器重构误差的损失函数(los function) 归纳式如式(13)所示。式中,为控制稀疏限制的权重因子, L(e)= U Sg(WSf(Wxl+b) +b') -x, U2 +a.^S K l[ p U+6)j(3)

4训练试验、对比和结果

4.1网络结构通过使用同样数据集对最小二乘支持向量机(Least squares support vector machine,LS- S V M)、全连接多层感知机(Full-connection perceptions,F C P)和采用深度训练

自编码器(Stacked sparse autoencoder,D R S S A)进行试验,观察其训练效果。如图4所示。

图4a为全连接多层感知机网络结构图,该模型共含有4个隐,每个隐有5个,层与层之间

188安徽农业科学2018 年

叶熟成度 这一特定的问题求解上具有更好的性能。

全连 式。图4b 为堆叠自动编码器

图,共含有4个自动编码器,编码器 数分别为6、5、4、3,每2层采用无监督预训练编码器输入与输出,并将 上一层编码器的中间 为下一层编码器的输入。输

为全连接层。在训练时将样本数据的1/3作为预训练集 (pre - training datasets )、其余 2/3 作为微调训练集(fine - tuning datasets )。

无监倾训练

a

b

4全连接多层感知机与堆叠稀疏自编码器网络结构

F i g. 4 N et>vor k str u ctur e o f full y con n ecte d m ulti-l a y er p erce p-

tio n ma c h in e an d st a c k s pa rs e sel f -e n co der 训练学习率n =-0. 001,采用随机梯度下降法(Stochas -

tic gradient descent ) 进行训练, batch size =50。 损失函数 (loss function )米用均方误差(mea n squared error , M S E ):

E (f -,D )M SE ^^is r /(,;,) -y ,]2

(14)

i = 1

对于给定

D = i ,y ),(i /,y /),…,(^,y m )丨

e 只乂其中y ,为亦例尤,的真实标记,m 为

样本数据量,学习器预测结果为/()。

4.2

仿真试验试验采用我国云南某烟草产地收集的烟草

图像数据集,数据 数为

3 000,格式均为240 x 240像素

R G B 图像。

数据分别采用最小二乘支持向量机

(Leat

squares support vector machine )、全连接多层感知机(Full - con -nection perceptions , FCP ) 和重构 的堆叠稀疏自 编码器 ( Stacked sparse autoencder , SSA )进彳行式验,观察其训练效果。

从图5可以看出,LS - SV M 在最初几次迭代中效果优于 F C P 和SSA 模型,这是由于SV M 在 间的学习

算法要强。但

训练

数的

,,

的学习 展现,最终F C P 和S S A 的模

要小于L S - S V M ,说明在

数量足够的情况下,算

数据的

,S S A 模型学

习的收敛速度更快,最终误 ,说明S S A 模型在

5

结论

随着烟草行业的发展,对行业整体的自动化和智能化需

求的 ,深度学习技术作为人工智能 的前沿技术,在烟草行业中的应用还有很大的拓展空间。重构的堆叠稀疏 自编码器(Stacked sparse autoencoder , SSA )模型在训练深度

时可以有效 训练效果,一定程度上避免误差消失,并在烟叶熟成度 中表 良好的 會旨。表明,重构的堆叠稀疏自编码器(Stacked sparse autoencoder , SSA )性能优于最小二乘支持向量机(Least square support vector machine )、全连接多层感知机(Full - connection percep -tions , FCP ) 。

参考文献

/]

张帆,张新红,张

?.模糊数学在烟叶分级中的应用/]中国烟草学

,2002,8(3) :45 - 49./]刘朝营,许自成,闫铁军.概视觉技术在烟草行业的应用状况/]中

国农业利技导H 2011,13(4) :79 - 84./]王亚平.烟叶分级存 进措施/]宁夏农林科技,2013,54(1) :112-113./]焦李成,杨淑媛,刘芳,等.神经网络七十年:回顾与展望/]计算机学

,216,39(8): 1697-1716.

[5] BENGIO Y. Learning deep achitectums for A (Foundations a d trends(r) in machine learning)[ M ] Hanover, MA: N o Publishers Inc. , 2009 : 1-127.

/] SCHMIDHUBER J. Deep learning in neural networks: An overview [ J ]. Neural networks, 215,61 :85 -117.[7] 周飞燕,金林鹏,董军.卷积神经网络研究综述[J ]计算机学报,2017, 40(6) :1229-1251.

[8] BENGIO Y,COURVILLE A,VINCENT P. Representation leaning : A re-view? a d new? perspectives [ J ]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013,35(8) :1778 -1128.

[9 ] DENGL. A tutorial survey of architectures, algoothms, and applications for deep learning. APSIPA Transactions on Signal and Information Process- ing[ M ] Cambridge :Cambridge University Press ,2014.

[10] ZHANGX Z, GAO Y S. Face recognition across pose: Areview[J]. Pat-

tern recognition, 2009,42( 11) :2876 - 2896.

[11] T,E Q V,NGIAM J , COATES A, et al. On optimization methods for deep

learning[ C]//Proceedings of the 22th International Conference on Ma-chine Learing. Bellevue, W ashing, U SA : I CML ,211 :265 - 22.

本刊提示文稿题名下写清作者及其工作单位名称、邮政编码;第一页地脚注明第一作者简介,格式如下:作者简介:

姓名(出生年一),性别,籍贯,学历,职称或职务,研究 ”。

500 1 000 1 500 2 000 2 500Generation of iterations

3 000

5 LS - SVM 、F C P 与SSA 训练效果对比

Fig. 5 The training effect comparison among LS-SVM,FCP aad

SSA

输出层

相关文档