神经网络卷积层的作用范例6篇

前言:中文期刊网精心挑选了神经网络卷积层的作用范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

神经网络卷积层的作用

神经网络卷积层的作用范文1

关键词关键词:深度学习;卷积神经网络;古玩图片;图像识别

DOIDOI:10.11907/rjdk.162768

中图分类号:TP317.4

文献标识码:A文章编号文章编号:16727800(2017)005017405

0引言

随着电子商务的发展,大批艺术品交易网站随之兴起,藏品交易规模也越来越大。而当前的古玩网上交易平台还不能够实现对现有藏品图片的自动分类,客户在寻找目标藏品时不得不在众多图片中一一浏览。因此需要一种有效的方法来完成面向图像内容的分类。

在基于内容的图像检索领域,常使用人工设计的特征-如根据花瓶、碗、盘子的不同形态特征:目标轮廓的圆度、质心、宽高比等[1],继而使用BP神经网络、SVM分类器等对特征进行学习分类。文献[2]基于植物叶片的形状特征,如叶片形状的狭长度、矩形度、球状性、圆形度、偏心率、周长直径比等,利用BP神经网络实现对植物叶片进行分类。文献[3]研究印品图像的各类形状缺陷,利用图像缺陷形状的轮廓长度、面积和圆形度等几何特征,导入SVM分类器进行训练,得到分类器模型实现分类。文献[4]提出了一种基于Zernike矩的水果形状分类方法,通过提取图像中具有旋转不变性的Zernike矩特征,并运用PCA方法确定分类需要的特征数目,最后将这些特征输入到SVM分类器中,完成水果形状的分类。上述方法都要求对目标形状分割的准确性,而分割过程中由于存在目标阴影、目标分割不完整问题,会影响到人工特征的准确选取。除了上述人工特征外,最常用的特征是HOG[5,6]、SIFT[7,8]等。HOG的核心思想是所检测的局部物体外形能够被光强梯度或边缘方向的分布所描述。HOG表示的是边缘结构特征,因此可以描述局部形状信息。SIFT在图像的空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量。SIFT特征对于旋转、尺度缩放、亮度变化保持不变。但是,这两种特征在实际应用中,描述子生成过程冗长、计算量太大。而且在上述方法征设计需要启发式的方法和专业知识,很大程度上依靠个人经验。

卷积神经网络不需要手动设计提取特征,可以直接将图片作为输入,隐式地学习多层次特征,进而实现分类[9]。相比目前常用的人工设计特征然后利用各分类器,具有明显的优势。近年来,卷积神经网络已成为语音、图像识别领域研究热点。它的权值共享特点使得网络复杂度降低,权值数量减少。而且,卷积神经网络直接将图片作为输入,避免了复杂的特征设计和提取,具有一定的平移、缩放和扭曲不变性[10]。本文采用卷积神经网络对古玩图片进行分类。首先,将背景分离后的图片作为网络的输入,相比原图作为输入,此方法的网络结构更加简单。然后,卷积层通过不同的卷积核对输入图片进行卷积得到不同特征图,采样层进一步对特征图进行二次提取,最终提取到合适的特征输入分类器进行分类,而在卷积层、采样层征图的大小、数目都会影响到网络的分类能力。因此,本文通过优化网络参数,使网络达到较好的分类效果。

1卷积神经网络

1989年,LECUN等[11]提出了卷积神经网络(Convolution Neural Networks,CNN),CNN是一种带有卷积结构的深度神经网络,一般至少有2个非线性可训练的卷积层、2个非线性的固定采样层和1个全连接层,一共至少5个隐含层[12]。百度于2012年底将深度学习技术成功应用于自然图像OCR识别和人脸识别,此后深度学习模型被成功应用于一般图片的识别和理解。从百度经验来看,深度学习应用于图像识别不但大大提升了准确性,而且避免了人工特征抽取的时间消耗,从而大大提高了在线计算效率[13]。

卷积神经网络作为一种高效的深度学习方法[14],在许多图像识别方面取得了很好的成效[1519]。该网络作为一种多隐层神经网络,可以提取图像的多层次特征进行识别。

卷积神经网络主要包括卷积层和采样层,卷积层通过可学习的卷积核对输入图片进行卷积得到特征图,卷积操作即加强了输入图片的某种特征,并且降低噪声。卷积之后的结果通过激活函数(通常选择Sigmoid函数或Tanh函数)作用输出构成该层的特征图。特征图上的每一个神经元只与输入图片的一个局部区域连接,每个神经元提取的是该局部区域的特征,所有神经元综合起来就得到了全局特征,与神经元相连接的局部区域即为局部感受野[20]。而在卷积层中一般存在多张特征图,同一张特征图使用相同的卷积核,不同特征图使用不同的卷积核[21],此特点称为权值共享,即同一张特征图上的所有神经元通过相同的卷积核连接局部感受野。卷积神经网络的局部感受野和嘀倒蚕硖氐愦蟠蠹跎倭送络训练的参数个数,降低了网络模型的复杂度。

采样层对卷积层提取到的特征图进行局部非重叠采样,即把特征图分为互不重叠的N×N个子区域,对每个子区域进行采样。卷积神经网络的采样方式一般有两种:最大值采样和均值采样。最大值采样即选取区域内所有神经元的最大值作为采样值,均值采样为区域内所有神经元的平均值作为采样值。最大值采样偏向于提取目标的特征信息,而均值采样偏向于提取背景的特征信息[22]。采样后的特征平面在保留了区分度高特征的同时大大减少了数据量,它对一定程度的平移、比例缩放和扭曲具有不变性。

卷积神经网络通过卷积层和采样层的循环往复提取到图像由低层次到高层次的特征,最后一般通过全连接层将所有特征图展开得到一维向量,然后输入到分类器进行分类。

卷积神经网络在处理二维图像时,卷积层中每个神经元的输入与上一层的局部感受野相连接,并提取该局部的特征,权值共享特点又使得各神经元保持了原来的空间关系,将这些感受不同局部区域的神经元综合起来就得到了全局信息。采样层对特征图进行局部特征提取,不会改变神经元之间的空间关系,即二维图像经过卷积层、采样层仍然保持二维形式。因此,卷积神经网络有利于提取形状方面的特征。虽然卷积神经网络的局部感受野、权值共享和子采样使网络大大减少了需要训练参数的个数,但是该网络作为多隐层神经网络还是十分复杂的。对于不同的数据库,为了达到比较好的分类效果,网络的层数、卷积层特征图个数以及其它参数的设置都需要探究。

2基于卷积神经网络的古玩图片分类

2.1特征提取及传递

不同古玩的主要区别在于形状不同,而花瓶、盘子和碗在古玩中最常见,因此将这3类图片作为实验对象,对于其它种类的古玩图片的分类,该网络同样适用。卷积神经网络采用如下图所示的5层网络结构,并对网络各层的特征图数目、大小均作了修改。对于网络的输入,先将原图像进行目标与背景分割,然后进行灰度化、统一分辨率的处理,最后输入到卷积神经网络。由于训练卷积神经网络的根本目的是提取不同古玩的特征,而背景不是目标的一部分,对古玩识别来说并不提供任何有用的信息,反而对特征的提取造成干扰,所以去除背景噪声后,网络结构会更加简单,同时也利于网络对特征的学习。但是因为进行了去背景的预处理,网络也失去了对复杂背景下图片的识别能力,所以使用该网络进行古玩图片分类前都要进行目标分割的预处理过程。

卷积神经网络对古玩图片的特征提取过程如下:

(1)输入网络的图片为100×100大小的预处理图,卷积神经网络的输入层之后为卷积层,卷积层通过卷积核与输入图像进行卷积得到特征平面,卷积核大小为5×5。如图2所示,特征平面上每个神经元与原图像5×5大小的局部感受野连接。卷积核移动步长为1个像素,因此卷积层C1的特征平面大小为96×96。这种卷积操作在提取到输入图像的某一方面特征时,必然会损失掉图像的其他特征,而采取多个卷积核卷积图像得到多个特征平面则会一定程度上弥补这个缺陷。因此,在卷积层C1中使用了6个不同的卷积核与输入图像进行卷积,得到6种不同的特征平面图。如图3所示,同一张特征图上的所有神经元共享一个卷积核(权值共享),图中连接到同一个特征图的连接线表示同一个卷积核,6个不同的卷积核卷积输入图片得到6张不同的特征平面图。卷积之后的结果并非直接储存到C1层特征图中,而是通过激活函数将神经元非线性化,从而使网络具有更强的特征表达能力。激活函数选择Sigmoid函数。

卷积层中所使用的卷积核尺寸若过小,就无法提取有效表达的特征,过大则提取到的特征过于复杂。对于卷积层征图个数的设置,在一定范围内,特征图的个数越多,卷积层提取到越多有效表达原目标信息的特征,但是特征图个数如果过多,会使提取到的特征产生冗余,最终使分类效果变差。卷积层的各平面由式(1)决定: Xlj=f(∑i∈MjXl-1j*klij+blj)(1)

式(1)中,Mj表示选择输入的特征图集合,l是当前层数,f是激活函数,klij表示不同输入特征图对应的卷积核,blj为输出特征图对应的加性偏置。

(2)卷积层C1后的采样层S1由6个特征平面组成,采样层对上一层特征图进行局部平均和二次特征提取。采样过程如图4所示,特征平面上的每个神经元与上一层4×4大小的互不重合的邻域连接进行均值采样,最终每个平面的大小为24×24。采样层的各平面由式(2)决定:

Xlj=f(βljdown(Xl-1j)+blj)(2)

式(2)中,down(.)表示一个下采样函数,l是当前层数,f是激活函数,βlj表示输出特征图对应的乘性偏置,blj为输出特征图对应的加性偏置。

(3)卷积层C2与C1层操作方式一样,唯一区别的是C2层每个特征图由6个不同的卷积核与上一层6个特征图分别卷积求和得到,因此C2层一共有6×6个不同的卷积核,卷积核大小为5×5,C2层每个平面大小为20×20,共6个特征平面。

(4)采样层S2与S1层操作一样,对上一层4×4大小邻域进行均值采样,输出6个5×5大小的特征平面。本文所用的网络共包括2个卷积层、2个采样层、1个全连接层,由于输入图片已经过背景分离的预处理,采样层S2特征图大小为5×5,所以图1所示5层网络已经有很好的表达能力。如果直接将原图作为输入,那么网络的层数以及特征图的个数将比图1所示的网络更加复杂。

(5)全连接层将上一层6个5×5大小的二维平面展开成为1×150大小的一维向量输入Softmax[23]分类器,输出层一共有3个神经元(即分类的种类数目),分类器将提取到的特征向量映射到输出层的3个神经元上,即实现分类。

2.2网络训练

训练方式为有监督地训练,网络对盘子、花瓶和碗共三类图片进行分类,所以分类器输出一个3维向量,称为分类标签。在分类标签的第k维中1表示分类结果,否则为0。训练过程主要分为两个阶段:

第一阶段:向前传播A段。

将预处理过的图片输入卷积神经网络计算得到分类标签。

第二阶段:向后传播阶段。

计算输出的分类标签和实际分类标签之间的误差。根据误差最小化的原则调整网络中的各个权值。分类个数为3,共有N个训练样本。那么第n个样本的误差为:

En=12∑3k=1(tnk-ynk)2(3)

式(3)中,tn表示第n个样本的网络输出标签,tnk对应标签的第k维,yn表示第n个样本的实际分类标签,ynk对应标签的第k维。为了使误差变小,利用权值更新公式(4)更新各层神经元的权值,一直训练直到网络误差曲线收敛。

W(t+1)=W(t)+η・δ(t)・X(t)(4)

式(4)中,W(t)表示算第n个样本时的权值,W(t+1)表示计算第n+1个样本的权值,η为学习速率,选取经验值,δ为神经元的误差项,X表示神经元的输入。

3实验结果及分析

实验在MatlabR2012a平台上完成,CPU 2.30GHz,内存4GB,所采用的图像由相关古玩网站提供,分辨率统一格式化为100×100。由于盘子、花瓶和碗在各种古玩种类中它们之间的形状差别比较明显,本文实验对这三类古玩图片进行分类。对古玩图片进行了水平翻转处理,增加图片数据量,以加强网络对古玩图片分类的鲁棒性。实验数据如表1所示,图5列出了3类图片的部分样本,实验所用图片均与图5所示图片类似,背景比较单一,少数图片下方有类似阴影。

为了形象表示网络各层提取的不同特征,图6展示了当网络输入为盘子时的各层特征图。卷积层C1中6张特征图分别提取到了输入图片的不同特征,而由于权值共享,同一张特征图中神经元的空间关系保持不变,所以6张特征图都抓住了盘子的圆形特征。采样层S1对C1进行均值采样,相当于模糊滤波,所以S1层各特征图看起来模糊了一些。卷积层C2中每张特征图由6个不同的卷积核卷积S1层各特征图叠加而成,S2层与S1层处理方式相同。

为了说明将背景分离后的图片作为输入的网络与原图输入的网络之间的差异,设计了如表3所示的两种网络结构,网络CNN4只需要4层网络层就可以达到0.19%的错误率,而原图作为输入的CNN8共6层网络层,在网络达到收敛的情况下,错误率为5.24%。由此可以说明,将背景分离后图片作为输入的网络结构更加简单。

网络的训练采用了批量训练方式,即将样本分多批,当一批样本前向传播完之后才进行权值更新,每批大小为100,训练集共2 200张图片,网络迭代次数为1时共进行22次权值更新,所以权值更新的计算次数与迭代次数有如下关系:

计算次数=22×迭代次数(5)

图7为网络在训练集上的误差曲线图,横坐标为误差反向传播的计算次数,纵坐标为训练集上的均方误差。可以看出,当网络训练次数达到270次(计算次数约6 000)时,训练集误差趋于平缓,网络已经基本拟合。训练好的网络可以用来对测试集图片进行分类,表4为不同迭代次数下训练的网络在测试集上的分类错误率,可以看出迭代次数在达到270次后,网络在测试集的错误率收敛,此时只有2张图片出现分类错误。

表5给出了图像分类算法中常用的人工特征+BP神经网络、人工特征+SVM分类器以及Hog特征+SVM分类器与CNN方法的性能比较。人工设计的特征包括图片中目标轮廓的最大长宽比、质心、圆度等特征。从准确率方面来看,CNN方法的准确率高于其他方法,Hog特征方法的准确率远远高于人工特征的方法,说明了特征的好坏对图像分类效果有着很大程度上的影响,CNN提取到的特征比Hog和人工设计的特征更具代表性。从测试时间来看,Hog方法与CNN方法相差不多,采用人工特征的方法时间最长。综合两个方面,CNN方法在测试时间和HOG方法相近的情况下,准确率最高。

4结语

针对网上古玩图片分类问题,为了克服现有算法中人工设计特征困难以及往往依赖个人专业经验的不足,提出一种基于卷积神经网络的方法。将背景分离后的目标图片作为网络输入,可以实现自动提取特征进行分类,背景分离后图片作为网络输入使得网络结构更加简单,并且设置了合适的特征图个数以使网络在古玩图片集上取得较好的分类准确率。实验数据表明,该方法能够解决网上古玩图片的分类问题,并且分类准确率达到99%,其准确率优于常用的Hog特征以及人工特征方法。另外该方法不仅可以应用于网上古玩图片,还可应用于鞋类、服装等其它商品图像的分类。

参考文献参考文献:

[1]K KAVITHA,M.V.SUDHAMANI.Object based image retrieval from database using combined features[C].in Signal and Image Processing (ICSIP),2014.

[2]董红霞,郭斯羽,一种结合形状与纹理特征的植物叶片分类方法[J].计算机工程与应用,2014,50(23):185188.

[3]舒文娉,刘全香,基于支持向量机的印品缺陷分类方法[J].包装工程,2014,35(23):138142.

[4]应义斌,桂江生,饶秀勤,基于Zernike矩的水果形状分类[J].江苏大学学报:自然科学版,2007,28(1):3639.

[5]ZHU Q,YEH M C,CHENG K T,et al.Fast human detection using acascade of histograms of oriented gradients[C].Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition,2006.

[6]M VILLAMIZAR,J SCANDALIANS,A SANFELIU bining colorbased invariant gradient detector with Hog descriptors for robust image detection in scenes under cast shadows[C].In Robotics and Automation,ICRA IEEE International Conference on.Barcelona,Spain:IEEE,2009.

[7]CHEN J,LI Q,PENG Q,et al.CSIFT based localityconstrained linear coding for image classification[J].Formal Pattern Analysis & Applications,2015,18(2):441450.

[8]AHMAD YOUSEF K M,ALTABANJAH M,HUDAIB E,et al.SIFT based automatic number plate recognition[C].International Conference on Information and Communication Systems.IEEE,2015.

[9]LAWRENCE S,GLIES C L,TSOI A C,et al.Face recognition:a convolutional neuralnetwork approach[J].IEEE Transactions on Neural Networks,1997,8(1):98113.

[10]TREVOR HASTIE,ROBERT TIBSHIRANI,J FRIEDMAN.The elements of statistical learning[M].New York:Springer,2001.

[11]Y LECUN,L BOUOU,Y BENGIO.Gradientbased learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):22782324.

[12]DAHL J V,KOCH K C,KLEINHANS E,et al.Convolutional networks and applications in vision[C].International Symposium on Circuits and Systems (ISCAS 2010),2010:253256.

[13]余凯,贾磊,陈雨强,等.深度学习的昨天、今天和明天[J].计算机研究与发展,2013(09):17991804.

[14]MAIRAL J,KONIUSZ P,HARCHAOUI Z,et al.Convolutional kernel networks[DB/OL].http:///pdf/1406.3332v2.pdf.

[15]Z世杰,杨东坡与刘金环,基于卷积神经网络的商品图像精细分类[J].山东科技大学学报:自然科学版,2014(6):9196.

[16]程文博等,基于卷积神经网络的注塑制品短射缺陷识别[J].塑料工业,2015(7):3134,38.

[17]邓柳,汪子杰,基于深度卷积神经网络的车型识别研究[J].计算机应用研究,2016(4):14.

[18]T JONATAN,S MURPHY,Y LECUN,et al.Realtime continuous pose recovery of human hands using convolutional networks[J].ACM Transaction on Graphics,2014,33(5):3842.

[19]S SKITTANON,A C SURENARAN,J C PLATT,et al.Convolutional networks for speech detection[C].Interspeech.Lisbon,Portugal:ISCA,2004.

[20]HUBEL D H,WIESEL T N.Integrative action in the cat's lateral geniculate body[J].Journal of Physiology,1961,155(2):385398.

[21]JAKE BOUVRIE.Notes on convolutional neural networks[DB/OL].http:///5869/1/cnn_tutorial.pdf.

神经网络卷积层的作用范文2

黑匣认为,复杂神经网络、LSTMs(长短期记忆网络)、注意力模型(Attention Models)等十大趋势将塑造人工智能未来的技术格局。

上述判断来自NIPS(神经信息处理系统) 2015大会。NIPS始于1987年,是人工智能领域两大重要学习会议之一,由于AI的爆炸式发展,近年来逐渐成为许多硅谷公司必须参加的年度会议。在蒙特利尔召开的NIPS 2015吸引了众多AI学界与业界的顶级专家,与会人数接近4000。大会总共收录了403篇论文,其中深度学习课题约占11%。来自Dropbox的高级软件工程师Brad Neuberg分享了他所注意到的十大技术趋势,黑匣将对每种趋势做了详细分析。

1、神经网络的架构正变得越来越复杂

感知和翻译等大多数神经网络的架构正变得越来越复杂,远非此前简单的前馈神经网络或卷积神经网络所能比。特别需要注意的是,神经网络正与不同的技术(如LSTMs、卷积、自定义目标函数等)相混合。

神经网络是多数深度学习项目的根基。深度学习基于人脑结构,一层层互相连接的人工模拟神经元模仿大脑的行为,处理视觉和语言等复杂问题。这些人工神经网络可以收集信息,也可以对其做出反应。它们能对事物的外形和声音做出解释,还可以自行学习与工作。未来的人工智能,最热门的技术趋势是什么?

(人工模拟神经元试图模仿大脑行为|图片来源:Frontiers)

但这一切都需要极高的计算能力。早在80年代初期,Geoffrey Hinton和他的同事们就开始研究深度学习。然而彼时电脑还不够快,不足以处理有关神经网络的这些庞大的数据。当时AI研究的普遍方向也与他们相反,人们都在寻找捷径,直接模拟出行为而不是模仿大脑的运作。

随着计算能力的提升和算法的改进,今天,神经网络和深度学习已经成为人工智能领域最具吸引力的流派。这些神经网络还在变得更复杂,当年“谷歌大脑”团队最开始尝试“无监督学习”时,就动用了1.6万多台微处理器,创建了一个有数十亿连接的神经网络,在一项实验中观看了千万数量级的YouTube图像。

2、酷的人都在用LSTMs

当你阅读本文时,你是在理解前面词语的基础上来理解每个词语的。你的思想具有连续性,你不会丢弃已知信息而从头开始思考。传统神经网络的一大缺陷便是无法做到这一点,而递归神经网络(RNN)能够解决这一问题。

RNN拥有循环结构,可以持续保存信息。过去几年里,RNN在语音识别和翻译等许多问题上取得了难以置信的成功,而成功的关键在于一种特殊的RNN——长短期记忆网络(LSTMs)。

普通的RNN可以学会预测“the clouds are in the sky”中最后一个单词,但难以学会预测“I grew up in France…I speak fluent French。”中最后一个词。相关信息(clouds、France)和预测位置(sky、French)的间隔越大,神经网络就越加难以学习连接信息。这被称为是“长期依赖关系”问题。未来的人工智能,最热门的技术趋势是什么?

(长期依赖问题|图片来源:CSDN)

LSTMs被明确设计成能克服之一问题。LSTMs有四层神经网络层,它们以特殊的方式相互作用。这使得“能记住信息很长一段时间”可以被视作LSTMs的“固有行为”,它们不需要额外学习这一点。对于大多数任务,LSTMs已经取得了非常好的效果。

3、是时候注意“注意力模型(attention models)了

LSTMs是人们使用RNNs的一个飞跃。还有其他飞跃吗?研究者共同的想法是:“还有注意力(attention)!”

“注意力”是指神经网络在执行任务时知道把焦点放在何处。我们可以让神经网络在每一步都从更大的信息集中挑选信息作为输入。

例如,当神经网络为一张图片生成标题时,它可以挑选图像的关键部分作为输入。未来的人工智能,最热门的技术趋势是什么?

(拥有“注意力”的RNN在图像识别中的成功运用|图片来源:Github)

4、神经图灵机依然有趣,但还无法胜任实际工作

当你翻译一句话时,并不会逐个词汇进行,而是会从句子的整体结构出发。机器难以做到这一点,这一挑战被称为“强耦合输出的整体估计”。NIPS上很多研究者展示了对跨时间、空间进行耦合输出的研究。

神经图灵机(Neural Turing Machine)就是研究者们在硅片中重现人类大脑短期记忆的尝试。它的背后是一种特殊类型的神经网络,它们可以适应与外部存储器共同工作,这使得神经网络可以存储记忆,还能在此后检索记忆并执行一些有逻辑性的任务。未来的人工智能,最热门的技术趋势是什么?

(模仿人类短期工作记忆的神经图灵机|图片来源:arXiv)

2014年10月,Google DeepMind公布了一台原型电脑,它可以模仿一些人类大脑短期工作记忆的特性。但直到NIPS2015,所有的神经图灵机都过于复杂,并且只能解决一些“小玩具”问题。在未来它们或将得到极大改进。

5、深度学习让计算机视觉和自然语言处理不再是孤岛

卷积神经网络(CNN)最早出现在计算机视觉中,但现在许多自然语言处理(NLP)系统也会使用。LSTMs与递归神经网络深度学习最早出现在NLP中,但现在也被纳入计算机视觉神经网络。

此外,计算机视觉与NLP的交汇仍然拥有无限前景。想象一下程序为美剧自动嵌入中文字幕的场景吧。

6、符号微分式越来越重要

随着神经网络架构及其目标函数变得日益复杂和自定义,手动推导出“反向传播”(back propagation)的梯度(gradients)也变得更加苦难而且容易出错。谷歌的TensorFlow等最新的工具包已经可以超负荷试验符号微分式,能够自动计算出正确的微分,以确保训练时误差梯度可被反向传播。

7、神经网络模型压缩的惊人成果

多个团队以不同方法大幅压缩了训练一个良好模型所需的素材体量,这些方法包括二值化、固定浮点数、迭代修剪和精细调优步骤等。

这些技术潜在的应用前景广阔,可能将会适应在移动设备上进行复杂模型的训练。例如,不需要延迟就可以得到语音识别结果。此外,如果运算所需要的空间和时间极大降低,我们就可以极高帧率(如30 FPS)查询一个模型,这样,在移动设备上也可以运用复杂神经网络模型,从而近乎实时地完成计算机视觉任务。

8、深度学习和强化学习继续交汇

虽然NIPS 2015上没有什么强化学习(reinforcement learning)的重要成果,但“深度强化学习”研讨会还是展现了深度神经网络和强化学习相结合的前景。

在“端对端”(end-to-end)机器人等领域出现了令人激动的进展,现在机器人已经可以一起运用深度和强化学习,从而将原始感官数据直接转化为实际动作驱动。我们正在超越“分类”等简单工作,尝试将“计划”与“行动”纳入方程。还有大量工作需要完成,但早期的工作已经使人感到兴奋。

9、难道你还没有使用批标准化?

批标准化(batch normalization)现在被视作评价一个神经网络工具包的部分标准,在NIPS 2015上被不断提及。

神经网络卷积层的作用范文3

关键词: 积分投影; 循环神经网络; 长短时记忆网络; 防止过拟合技术; 精度; 留一法

中图分类号:TP391.4 文献标志码:A 文章编号:1006-8228(2017)04-13-04

Abstract: The existing research on micro expression recognition is mainly based on the improved LBP (local binary patterns) algorithm and SVM (support vector machine). Recently, integral projection has been applied in the field of face recognition. The long and short memory network (LSTM), as a kind of recurrent neural network, can be used to process time series data. So LSTM-IP model, which combines integral projection with LSTM, is proposed, and experimented on the latest micro-expression database CASME II. The horizontal and vertical projection vectors obtained by integral projection are used as the input of LSTM and classified, and the over-fitting preventing method is used. The experimental results show that LSTM-IP algorithm gets better results than the previous method.

Key words: integral projection; recurrent neural network; long and short memory network; prevent over-fitting; accuracy; leave-one-subject-out cross validation

0 引言

人们表情的短时间变化,也叫微表情,心理学在这方面的研究很早就开始了。近年来,有关利用机器学习的方法来对微表情进行研究的学者越来越多,其成为当前一个热门研究方向。微表情的研究成果可用于测谎[2-4]、临床诊断等方面,因橐话闳思幢闶切睦硪缴也很难注意到1/25~1/5秒人表情的变化[1],而这时,机器可以很好的对微表情进行自动的识别。

最近,基于积分投影和纹理描述符的方法被用在人脸识别[5],然而,很少有研究将积分投影用于包含人脸的时间序列中进行识别。微表情与人脸识别有很大不同,特征很难单从每帧图片中提取,这时就需要考虑时间轴。LSTM可以对时序数据进行分类,以前基本用在语音识别和自然语言处理的任务中,很少用于图像识别,可能是因为LSTM处理的是一维的数据,而图像是二维的数据。将图像的二维信息积分投影到一维(水平方向和垂直方向),并以此作为LSTM的输入并分类,这样就能将二者很好的结合起来。

本文构造了基于积分投影和LSTM的深度学习的模型来对微表情进行识别。得到的结果不仅比以前的基于局部二值模式(LBP)的方法好,而且也略微的优于最近基于积分投影的论文中的方法。

1 CASME II微表情数据集介绍

2014年,中科院心理研究所建立了更进一步改进的自然诱发的微表情数据库CASMEII[8]。CASMEII有26个平均年龄为22岁左右的亚洲人,9类表情(happiness, surprise, disgust, fear, sadness, anger, repression, tense, negative)组成。用来录制的高速相机为200 fps。高速相机可以捕捉更细节的微表情。CASMEII是据我们所知目前最好的自然诱发的微表情数据库。

2 基于差分图像的积分投影

Mateos等人的开拓性工作[6-7]表明积分投影可以提取同一人脸图像的共同基本特征。积分投影将人脸的特征水平和垂直投影,可以用公式⑴和⑵表示:

其中It(x,y)表示时间为t时,图像位于(x,y)时的像素值,Ht(y)和Vt(x)表示水平和垂直积分投影。直接将积分投影应用到CASME II微表情数据集上效果如图1所示。

然而,由于微表情的变化是十分微小的,若直接采用上面的积分投影会有很多噪声,从图1(c)可以看出区分不是很明显。因此,我们采用改进的积分投影方法。可以用公式⑶和⑷表示:

我们将每个视频下的2到N帧微表情的图像减去第1帧,将得到的差分图像做积分投影,效果如图2所示。

从图2的(c)可以看出,采用基于差分图像的水平积分投影效果更好,去掉了不必要的噪声。

3 长短时记忆网络

循环神经网络(RNN)可以用来处理时序数据,但它有一个明显的缺陷,就是不能记忆发生在较久以前的信息。长短时记忆网络(LSTM)[9]是一种特殊的RNN,比RNN多了一些特殊的门和细胞,可以学习长期依赖信息。LSTM结构如图3所示。

最上面横着带箭头的线包含细胞单元,作用是记忆之前LSTM单元的信息。x和+表示点分的乘法与加法,表示Sigmoid激活函数(如公式⑸),tanh表示双曲正切激活函数(如公式⑹)。

最下面圆圈中的X和最上面圆圈中的h分别表示时序输入和输出。

通用的LSTM结构可以参考图4,图4中,底层节点为输入,顶层节点为输出,中间层为隐藏层节点或记忆块。(a)描述的是传统的 感知机(MLP)网络,即不考虑数据的时序性,认为数据是独立的;(b)将输入序列映射为一个定长向量(分类标签),可用于文本、视频分类;(c)输入为单个数据点,输出为序列数据,典型的代表为图像标注;(d)这是一种结构序列到序列的任务,常被用于机器翻译,两个序列长度不一定相等;(e)这种结构会得到一个文本的生成模型,每词都会预测下一时刻的字符。

4 LSTM-IP模型

因为CASME II数据集每个视频下微表情图像帧数是不一样的,为了方便我们统一LSTM的输入,所以我们提取了最能代表这个视频微表情的10帧,同时,本文将整个数据集图像的尺寸统一到200×200像素,将原来彩色图像转化为灰度图像。通过基于差分图像的积分投影,得到一个视频下差分图像每帧图像的水平和垂直投影,一个图像可以得到一个200维的水平向量和一个200维的垂直向量,因为差分图像是后面9张减去了第一张图像,所以一个视频下共有9个水平向量和9个垂直向量,初始化两个9×200大小的一维向量分别保存水平向量和垂直向量。

本文采用图4(b)和图4(e)结合的LSTM结构,如图5所示。

顶层的X_IP表示将一个视频下9个差分图像的水平投影组成的9×200的一维特征向量作为输入,经过第一层LSTM得到9×128的一维特征向量,接着经过第二层LSTM得到9×128的一维特征向量,最后经过一层LSTM得到一个128的特征向量,Y_IP也是同样的处理过程。最后将这两部分的128的特征向量连接起来作为一个256的特征向量输入softmax分类器,结果输出属于五类微表情的哪一类。在图5的每两层之间加入一层Dropout层,Dropout的比率设为0.5。LSTM内部参数初始化采用了glorot_normal,相比较于其他初始化方法,glorot_normal效果最好。

Softmax和Dropout在深度学习中都是常用的技术。Softmax是逻辑斯特回归应用于多分类的推广。Dropout[10]这种技术的作用是减少过拟合,是一种正则化技术,通过防止由完全连接的层引起神经元的参数过多,有助于减少神经网络的过度拟合问题。给定 dropout率p,其在我们的LSTM中被设置为0.5,50%单位将被保留,而另外50%将被放弃。简单地说,“Dropout”只是随机忽略一些神经元。然而在测试阶段,每个神经元的输出将通过因子1-p(保持率)加权以保持与训练阶段中产生相同的效果。如图6所示。

我们的实验采用基于Theano的keras框架,keras借b了Torch的搭建深度学习网络的方式,而且使用笔者比较熟悉的Python语言(Torch使用Lua语言),keras的底层可以是Theano或者Tensorflow,可能是因为keras最先在Theano开发的,经过实验比较单个GPU下,Theano的速度要比Tensorflow快,所以我们的底层采用Theano。

5 实验结果与分析

现在微表情识别的算法主要是基于LBP改进的算法,例如LBP-TOP[11](Local Binary Pattern-Three Orthogonal Planes)、LBP-SIP[12](LBP-Six Intersection Points)和LOCP-TOP[13](Local ordinal contrast pattern-

TOP)等。我们将LSTM-IP算法与以前的方法做了比较,如表1所示。

实验是在CASME II上做的,因为CASME II微表情数据集是最新最好的微表情数据集。STLBP-IP也是基于积分投影的,结合了1DLBP来提取特征。通过表1的比较我们发现,基于积分投影的算法效果好于原来基于LBP的算法,可以得出,采用提取积分投影特征的方法在微表情数据集CASME II上效果比较好。可以看出,STLBP-IP的性能优于文献[27]的重新实现,STLBP-IP的精度提高了20.64%。从表1中可知,时间插值法(TIM)可以提高LBP-TOP的性能,其中LBP-TOP增加到39.68%。然而,与STLBP-IP相比,LBP-TOP在微表情识别上的效果上有很大的差距(19.43%)。比较两种基于积分投影的方法,本文提出的方法略微好于STLBP-IP,但通过阅读STLBP-IP的论文笔者发现,这种方法存在繁琐的调参过程,比如图像如何分块,SVM核参数的选择,而本文提出的LSTM-IP算法可以自动从差分图像的积分投影中学习,调参的内容比较少,而且速度也很快。这些结果表明,LSTM-IP实现了令人满意的效果,而不是LOCP-TOP和LBP-SIP。 这部分地解释了LSTM-IP通过使用积分投影来保持形状和辨识的能力。

实验采用了留一法交叉验证,CASME II有26个subjects,通过把每个subject作为测试,其余作为训练,循环26次,最后把每次测试得到的正确视频个数相加除以总的视频数,得到识别精度,这种方法现在是微表情识别主流的验证方法。

6 Y束语

基于差分图像的积分投影方法,保存了我们微表情形状的特征,然后增强微表情的辨别力。深度学习在图像识别领域已经取得了很不错的成绩,而现在深度学习的技术还没有应用于微表情识别。本文将差分图像的积分投影与LSTM结合,从实验结果上看,结果要好于以前的方法。我们认为深度学习的探索不会停止,会有越来越多新的网络模型产生,也会有越来越多的深度学习的技术应用于微表情识别。

我们将继续探索基于深度学习的微表情识别的方法及技术手段。卷积神经网络在图像识别上取得了很好的成绩,但笔者也将卷积神经网络应用于微表情上,效果并不好,可能是因为微表情在图像上变化比较细微,卷积神经网络不容易捕捉到特征,但如果考虑了一个视频时间序列的特性,也许会有比较好的结果,对此还有待进一步研究。随着技术的进步,相信微表情识别效果会越来越好,并最终能够应用于我们的生活中。

参考文献(References):

[1] Ekman P. Micro Expressions Training Tool[M]. Emotion-

srevealed. com,2003.

[2] Ekman P. Darwin, deception, and facial expression[J].

Annals of the New York Academy of Sciences,2003.1000(1):205-221

[3] Ekman P. Lie catching and microexpressions[J]. The

philosophy of deception,2009:118-133

[4] Ekman P, O'Sullivan M. From flawed self-assessment to

blatant whoppers: the utility of voluntary and involuntary behavior in detecting deception[J]. Behavioral sciences & the law,2006.24(5):673-686

[5] Benzaoui A, Boukrouche A. Face recognition using 1dlbp

texture analysis[J]. Proc. FCTA,2013: 14-19

[6] Mateos G G. Refining face tracking with integral projections

[C]//International Conference on Audio-and Video-Based Biometric Person Authentication. Springer Berlin Heidelberg,2003: 360-368

[7] García-Mateos G, Ruiz-Garcia A, López-de-Teruel P

E. Human face processing with 1.5 D models[C]//International Workshop on Analysis and Modeling of Faces and Gestures. Springer Berlin Heidelberg,2007:220-234

[8] Yan W J, Li X, Wang S J, et al. CASME II: An improved

spontaneous micro-expression database and the baseline evaluation[J]. PloS one, 2014.9(1):e86041

[9] Hochreiter S, Schmidhuber J. Long short-term memory[J].

Neural computation,1997.9(8):1735-1780

[10] Hinton G E, Srivastava N, Krizhevsky A, et al. Improving

neural networks by preventing co-adaptation of feature detectors[J]. Computer Science,2012.3(4):212-223

[11] Zhao G, Pietikainen M. Dynamic texture recognition

using local binary patterns with an application to facial expressions[J]. IEEE transactions on pattern analysis and machine intelligence,2007.29(6).

[12] Wang Y, See J, Phan R C W, et al. Lbp with six

intersection points: Reducing redundant information in lbp-top for micro-expression recognition[C]//Asian Conference on Computer Vision. Springer International Publishing,2014:525-537

[13] Chan C H, Goswami B, Kittler J, et al. Local ordinal

contrast pattern histograms for spatiotemporal, lip-based speaker authentication[J]. IEEE Transactions on Information Forensics and Security,2012.7(2):602-612

神经网络卷积层的作用范文4

全球关注的人机世纪之战

人们总是对未知领域充满了好奇与敬畏,从计算机诞生之日起,各种有关人工智能的猜想便从终止过。人们一方面希望人工智能能够超越人类智慧,一方面又害怕被科技超越,矛盾的心态下,每一次以智慧为焦点的人机对战都会成为市场关注的焦点。

2016年3月9日至15日,被称为“世纪人机大战”的韩国棋手李世石VS谷歌围棋机器人AlphaGo的比赛最终以AlphaGo赢得四局落下帷幕,虽然本身关注和懂得围棋的人并不多,但这场人机世纪大战却通过各种渠道让全球亿万计的人们知道了―人类智慧被人工智能打败了!回顾以往的人机大战,人类并非永恒的胜者,美国IBM公司的“深蓝”超级计算机以2胜1负3平战胜了当时世界排名第一的国际象棋大师卡斯帕罗夫,但绝大多数人却不以为意,除十分接近的胜败结果外,深蓝主要是依靠运算能力穷举所有路数来选择最佳策略,它当时可以实现每秒两亿步的运算。很多人觉得卡斯帕罗夫的落败与体力有关,深蓝的策略多少有些“无赖”。

但AlphaGo却在“深蓝”获胜十九年后的今天,拥有自主深度学习进化的AlphaGo以难以让人争议的过程和结果,在围棋这一人类智慧竞技的高地上战胜了韩国棋手李世石。

能够深层学习的AlphaGo

“深蓝”之所以能够有超人的绝佳表现,几乎纯粹是靠运算能力。依靠存储的数百万个国际象棋案例,能在众多可能性中进行筛选,从而确定下一步棋的最佳位置。这给人感觉在用体力玩智慧游戏了,但AlphaGo却给人们展示了一个几乎完全靠自学,并通过观察成功与失败案例来掌握得胜技巧的系统。谷歌利用大数据与深度学习的技术优势为AlphaGo构建了一套策略网络,机器通过深度学习能力,模拟人脑的机制来学习、判断、决策。即AlphaGo可以从大量的棋谱和对局中学习策略,形成一套落子决策判断与数据解读的能力体系,让其在冲杀状态下懂得一套试探与引导的能力,最终成功击败人类棋手李世石。

人类是惟一能够将直觉(隐式的)和符号(显式的)知识结合起来的物种,人类具有这样的双重能力,将前者转换成后者,然后通过后者的反馈反过来改善前者,这在以往是人类拥有的特殊性和唯一性。但今天,AlphaGo无缝使用了分层的网络(即深度卷积神经网络)进行直觉学习,强化,评估和策略,配以强悍的计算能力,它完全不需要解决任何语义复杂性并且可从容地从现实考虑中分离,人的思维模式加上科技的理性结合,这让AlphaGo能够在对局结束前30分钟就向Google技术分析团队报告自己确信必胜。

下一步是理解

没有人性弱点的AlphaGo让我们看到了人工智能神经网络的前景在于它在不断缩小机器和人类之间的差距,而且随着技术开发者的跟进,人工智能将会对理解人类语言,揣摩人类情感。

理解人类,这对于巨头们的想象空间在于,基于用户需求的商业决策会因此更加精准。人机对战让我们看到,推理、判断、分析问题等功能处理之外,识别人的情感与情绪与对人的语言理解力将是未来发展的高地。

围棋大战,只能体现出,在封闭规则的计算领域,机器比人类聪明得多,因为我们的心算能力本身与计算器相差甚远;但是思维、对话、情感等都是不确定的。而前面说到,机器没有情绪,只有它懂得了人类的语言,逐渐了解人类表达的意思甚至是情绪,才意味着人工智能达到了更高的领地。AlphaGo及其背后的AI领域真的能实现,而这一切都是建立在搜索的原理与算法的未来改进上。

小知识:它不是一条狗

阿尔法围棋(AlphaGo)是一款围棋人工智能程序,由位于英国伦敦的谷歌(Google)旗下DeepMind公司的戴维 西尔弗、艾佳 黄和戴密斯 哈萨比斯与他们的团队开发,这个程序利用“价值网络”去计算局面,用“策略网络”去选择下子。2015年10月阿尔法围棋以5:0完胜欧洲围棋冠军、职业二段选手樊麾;2016年3月对战世界围棋冠军、职业九段选手李世石,并以4:1的总比分获胜。

四位一体的AlphaGo系统

归根到底,AlphaGo系统目前还是一件科技产物,其本身由走棋网络、快速走子、估值网络和蒙特卡罗树搜索四个部分组成,正是这四个部分的协同与融合,让AlphaGo拥有能够学习的智慧,最终战胜李世石。走棋网络(Policy Network),给定当前局面,预测/采样下一步的走棋。快速走子(Fast rollout),目标和1一样,但在适当牺牲走棋质量的条件下,速度要比1快1000倍。 估值网络(Value Network),给定当前局面,估计是白胜还是黑胜。蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS),把以上这三个部分连起来,形成一个完整的系统。

让电脑拥有棋感的走棋网络

走棋网络把当前局面作为输入,预测/采样下一步的走棋。它的预测不只给出最强的一手,而是对棋盘上所有可能的下一着给一个分数。棋盘上有361个点,它就给出361个数,好招的分数比坏招要高。以往的科技只是单纯基于规则或者基于局部形状,利用简单的线性分类器训练完成走子,整个过程是不可能形成类似人类围棋选手的棋感。

AlphaGo去利用更高效的、宽度为192的网络(正常棋盘上有361个点,电脑给出361个数,好招的分数比坏招要高。),下出有最高置信度的落子。这样的做法一点也没有做搜索,但是大局观非常强,不会陷入局部战斗中,说它建模了“棋感”一点也没有错。但是走棋网络会不顾大小无谓争劫,会无谓脱先,不顾局部死活,对杀出错等等,更多像是高手凭借“自觉”在下棋,因而需要加入搜索功能,让电脑做出有价值的判断。

追求效率的快速走子

作为人类智慧竞技的高地,围棋用用天文数字般的局面数,走棋网络能让AlphaGo达到3毫秒的下子速度,但想要进一步提高AlphaGo的“反应”及“思考”能力,就需要快速走子系统的帮助了。

利用传统的局部特征匹配(local pattern matching)加线性回归(logisticregression)的方法,AlphaGo在吸纳了众多高手对局之后就具备了用梯度下降法自动调参的能力,从而实现了2微秒的走子速度和24.2%的走子准确率。24.2%的意思是说它的最好预测和围棋高手的下子有0.242的概率是重合的,相比之下,走棋网络在GPU上用2毫秒能达到57%的准确率。在AlphaGo有了快速走子之后,不需要走棋网络和估值网络,不借助任何深度学习和GPU的帮助,不使用增强学习,在单机上就已经达到非常高的水平了。

锦上添花的估值网络

估值网络对盘面的评估应用上同快速走子有些重叠,都是通过模拟落子得分评估当前及后面布局的优劣,但通过估值网络和快速走子的互补,在复杂的死活或对杀时,也就是进行到中盘阶段的时候,估值网络的重要性就会得到提升。前面提到AlphaGo能够提前30分钟知道自己必胜,估值网络就起到了很大的作用。

尽量选择更好的蒙特卡罗树搜索

“蒙特卡洛树搜索”是一种启发式的搜索策略,能够基于对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。

一位名叫苏椰的知乎用户举了这样一个例子,以通俗的语言进行了解释:假如筐里有100个苹果,让我每次闭眼拿1个,挑出最大的。于是我随机拿1个,再随机拿1个跟它比,留下大的,再随机拿1个……我每拿一次,留下的苹果都至少不比上次的小。拿的次数越多,挑出的苹果就越大,但我除非拿100次,否则无法肯定挑出了最大的。这个挑苹果的算法,就属于蒙特卡罗算法:尽量找好的,但不保证是最好的。

拥有两个大脑的AlphaGo

AlphaGo是通过两个不同神经网络“大脑”合作来改进下棋。这些大脑是多层神经网络跟那些Google图片搜索引擎识别图片在结构上是相似的。它们从多层启发式二维过滤器开始,去处理围棋棋盘的定位,就像图片分类器网络处理图片一样。经过过滤,13个完全连接的神经网络层产生对它们看到的局面判断。这些层能够做分类和逻辑推理。

AlphaGo的第一个神经网络大脑科学全称应该是“监督学习的策略网络(Policy Network)”,观察棋盘布局企图找到最佳的下一步。团队通过在KGS(网络围棋对战平台)上最强人类对手,百万级的对弈落子去训练大脑。这就是AlphaGo最像人的地方,目标是去学习那些顶尖高手的妙手。这个不是为了去下赢,而是去找一个跟人类高手同样的下一步落子。AlphaGo这个大脑的出色之处在于不单要模仿学习,更要追求速度,不断模拟计算围棋局面变化,最终选择正确率最高的落子。

价值评估则可看做AlphaGo的第二个大脑,通过整体局面判断来辅助落子选择器。AlphaGo能够决定是否通过特殊变种去深入阅局面和落子,如果局面评估器说这个特殊变种不行,那么AI就跳过阅读在这一条线上的任何更多落子。

深度神经网络的运用

人类在下围棋时,通常会经历常识-棋感-计算-判断四个过程,AlphaGo的常识源于其“监督学习的策略网络(Policy Network)”带来的深层学习能力,而棋感和计算则需要深度神经网络同蒙特卡洛算法的融合,两者的融合让AlphaGo整个运作方式更接近人类。通过对比使用蛮力计算的“深蓝”眼中的国际象棋落子思路和AlphaGo眼中的围棋落子思路会发现,围棋的复杂度需要更“聪明”的AI才能完成了。

两个大脑加上深度神经网络,AlphaGo以Value networks来评估大量的选点,而以Policy networks来选择落子,并且开发了一种新式算法来结合蒙特卡洛算法和以上两个神经网络。在这种结合下,研究者们结合参考人类职业对局的监督式学习,和AI大量积累自对弈实现的深度学习,来训练和提高AI的围棋实力。

AI的进步与期望

围棋代表了很多人工智能所面临的困难:具有挑战性的决策制定任务、难以破解的查找空间问题和优化解决方案如此复杂以至于用一个策略或价值函数几乎无法直接得出。通过将策略和价值网络与树搜索结合起来,AlphaGo终于达到了专业围棋水准,让我们看到了希望:在其他看起来无法完成的领域中,AI也可以达到人类级别的表现。

当然,这一切都是建立在人类千年来在围棋领域积累上的,没有积累就不会围棋AI的今天。AlphaGo让世人看到了AI领域的巨大进步,但想要真正理解人类和语言,其还有一段很长的路要走。相比围棋,人类在生活上的行为习惯,需要AlphaGo们拥有更出色的学习能力以及判断能力,无论是存储容量还是搜索算法,都需要几何倍数的递增,从这个角度看,现在担心AlphaGo们拥有自己的意识或情感,都太早了一些。

渗透进入人们生后的AI

AlphaGo不是DeepMind惟一项目,也不是最大的项目。DeepMind的最终目标是智能助手、医疗和机器人。另外,尽管AlphaGo只是针对围棋开发的系统,但其原理可以被应用到现实问题中。以医疗为例,IBM已经依靠认知学习平台“Watson”进入了医疗领域,Watson在泰国和印度的两家医院协助医生诊断乳腺癌、肺癌和结肠直肠癌。尽管Watson自身不会诊断疾病,但它能够找到医生应该进一步认真检查的地方,并提出治疗方案。

而无人驾驶汽车其实也可以看做具备了身躯的AI,家喻户晓的特斯拉汽车便使用了基于深度学习的现有计算机视觉技术。当然,工业或者服务用机器人都是AI渗透进入人们生活的表现。AI公司们正在努力晚上其产品,争取能够无缝进入人们生活的各个领域,当AI设备在可靠性、适应性和灵活性等方面都有长足进步时,人们未来的生活也将变得更美好。

谷歌改变人类的野心

AlphaGo很强大很厉害,但对于近年来谷歌的谋划而言,AlphaGo无非是其在人工智能领域的小玩具而已。改组Alphabet的谷歌,疯狂地在全球收购各个尖端前沿领域的顶尖公司,把触角伸到了生命科学、人工智能、无人驾驶、虚拟现实等等许多的领域。AlphaGo背后的英国Deepmind公司,只是他们收购的许许多多家公司中的一个而已。

除了传统Youtube、Gmail和地图等等互联网业务,生命科学、人工智能、无人驾驶、虚拟现实等新领域其实谷歌并没有赚到什么钱,更多是对未来的投资和布局,但今天,AlphaGo的表现已经让我们看到了谷歌的投入回报,再加上众多具有颠覆性或者划时代意义的谷歌黑科技,让我们清楚看到了谷歌改变人类未来的野心。相比之下,国内BAT三大巨头在技术积淀和领域格局方面,就显得有些小气了。

人工智能的竞赛

在2010年到2015年期间,企业对人工智能创业公司的投资增长了15倍。BBC预测,人工智能市场将继续保持高速增长,2020年全球市场规模将达到183亿美元,约合人民币1190亿元。庞大的数据和潜力,足以让企业们疯狂。

在硅谷,截至2015年初就有超过1700家创业公司加入人工智能浪潮―这一数字过去1年还在不断增加之中。谷歌、Facebook、亚马逊等科技巨头们的巨大投入都推动AI整个领域取得巨大进步。图像识别、语音识别已经成为苹果、微软、Google、IBM等科技大公司激烈竞争的焦点,而在医疗识别、模拟大脑图像等细分领域中,也涌现出不少初创的科技企业。可以说,一场席卷全球的AI竞赛正在展开,谁能让科技变得更聪明,谁就有望在未来的竞争中占据有利位置。

神经网络卷积层的作用范文5

在为人们提供便捷服务的同时,互联网应用也存在很多安全问题及威胁,如计算机病毒、变异木马等,利用大规模互联网集成在一起产生的漏洞攻击网络,导致数据泄露或被篡改,甚至使整个网络系统无法正常运行。随着网络接入用户的增多,互联网接入的软硬件资源也更多,因此对网络安全处理速度就会有更高的要求,以便能够提高木马或病毒处理速度,降低网络病毒的感染范围,积极的响应应用软件,具有重要的作用和意义。

2网络安全防御技术应用发展现状

目前,人们已经进入到了“互联网+”时代,面临的安全威胁也更多,比如木马病毒、DDOS攻击和数据盗窃等。互联网受到的攻击也会给人们带来严重的损失,比如勒索病毒攻击了许多的大型跨国公司、证券银行等,到这这些政企单位的办公电脑全都发生了蓝屏现象,用户无法进入到操作系统进行文件处理,勒索病毒要求这些单位支付一定额度的赎金才可以正常使用系统,导致许多公司损失了很多的资金。分布式服务器攻击(DDOS)也非常严重,模拟大量的用户并发访问网络服务器,导致正常用户无法登陆服务器。因此,为了提高信息安全,人们提出了防火墙、杀毒软件或访问控制列表等安全防御技术

2.1防火墙

防火墙是一种比较先进的网络安全防御软件,这种软件可以设计很多先进的规则,这些规则不属于互联网的传输层或网络层,可以运行于互联网TCP/IP传输协议栈,使用循环枚举的基本原则,逐个检查每一个通过网络的数据包,如果发现某个数据包的包头IP地址和目的地IP地址及包内容等存在威胁,就可以及时的将其清除,不允许通过网络。

2.2杀毒软件

杀毒软件是一种非常先进的程序代码,其可以查杀网络中存在的安全威胁,利用病毒库中一些收录的病毒或木马特征,判断互联网中是否存在这些类似的病毒或木马。杀毒软件采用了很多技术,如主动防御、启发技术、特征码技术、脱壳技术、行为分析等,这些都可以实时的监控访问互联网的运行状态,确保网络正常使用。目前,许多大中型企业都开发了杀毒软件,比如360安全卫士、江民杀毒、腾讯卫士、卡巴斯基等,取得了显著的应用成效。

3基于人工智能的网络安全防御系统设计

3.1系统功能分析

基于人工智能的网络安全防御系统利用机器学习或模式识别技术,从互联网中采集流量数据,将这些数据发送给人工智能模型进行分析,发现网络中是否存在网络病毒。具体的网络安全防御系统的功能包括以下几个方面:

3.1.1自动感知功能

自动感知是人工还能应用的一个重要亮点,这也是网络安全系统最为关键的功能,自动感知可以主动的分析互联网中是否存在安全隐患,比如病毒、木马等数据片段,利用这些片段特征实现网络病毒的判断。

3.1.2智能响应功能

人工智能在网络安全系统中可以实现智能响应,如果一旦发现某一个病毒或木马侵入网络,此时就需要按照实际影响范围进行智能度量,影响范围大、造成的损失较多就可以启用全面杀毒;影响范围小、造成的损失较少就可以启动局部杀毒,这样既可以清除网络中的病毒或木马,还可以降低网络的负载,实现按需杀毒服务。

3.2人工智能应用设计

人工智能在网络安全防御中的应用流程如下所述:目前互联网接入的设备非常多,来源于网络的数据攻击也非常多,比如DDOS攻击、网站篡改、设备漏洞等,因此可以利用人工智能技术,从根本上发现、分析、挖掘异常流量中的问题,基于人工智能的网络安全系统具有一个显著的特征,这个特征就是利用先进的机器学习技术构建一个主动化防御模型,这个模型可以清楚网络中的木马或病毒,能够有效的避免互联网受到攻击,也可以将这些病毒或木马牵引到一些备用服务器,在备用服务器上进行识别、追踪,判断网络病毒的来源,从而可以彻底根除后患。人工智能在网络安全防御中引入很多先进的杀毒技术,比如自我保护技术、实时监控技术,基于卷积神经网络、机器学习、自动审计等,可以自动化快速识别网络中的病毒及其变异模式,将其从互联网中清除,同时还可以自我升级服务。

4结束语

目前,互联网承载的应用软件非常多,运行积累了海量的数据资源,因此安全防御系统可以引入数据挖掘构建智能分析系统,可以利用人工智能等方法分析网络中是否存在一些病毒特征,即使这些病毒特征发生了变异,人工智能处理方法也可以利用先进的机器学习技术发现这些病毒的踪迹,从而可以更加准确的判断病毒或木马,及时的启动智能响应模块,将这些病毒或木马清除。人工智能在查杀的时候还可以按需提供服务,不需要时刻占据所有的负载,提高了网络利用率。

参考文献

[1]于成丽,安青邦,周丽丽.人工智能在网络安全领域的应用和发展新趋势[J].保密科学技术,2017(11):10-14.

[2]王海涛.基于大数据和人工智能技术的信息安全态势感知系统研究[J].网络安全技术与应用,2018(03):114-115.

神经网络卷积层的作用范文6

【关键词】电力行业;热工自动化;发展前景

1. 当前电力行业热工自动化技术的发展

随着世界高科技的飞速发展和我国机组容量的快速提高,电厂热工自动化技术不断地从相关学科中吸取最新成果而迅速发展和完善,近几年更是日新月异,一方面作为机组主要控制系统的DCS,已在控制结构和控制范围上发生了巨大的变化;另一方面随着厂级监控和管理信息系统(SIS)、现场总线技术和基于现代控制理论的控制技术的应用,给热工自动化系统注入了新的活力。

1.1DCS的应用与发展。

火电厂热工自动化系统的发展变化,在二十世纪给人耳目一新的是DCS的应用,而当今则是DCS的应用范围和功能的迅速扩展。

1.1.1DCS应用范围的迅速扩展。

20世纪末,DCS在国内燃煤机组上应用时,其监控功能覆盖范围还仅限DAS、MCS、FSSS和SCS四项。即使在2004年的Q/DG1-K401-2004《火力发电厂分散控制系统(DCS)技术规范书》中,DCS应用的主要功能子系统仍然还是以上四项,但实际上近几年DCS的应用范围迅速扩展,除了一大批高参数、大容量、不同控制结构的燃煤火电机组的各个控制子系统全面应用外,脱硫系统、脱硝系统、空冷系统、大型循环流化床(CFB)锅炉等新工艺上都成功应用。可以说只要工艺上能够实现的系统,DCS都能实现对其进行可靠控制。

1.1.2单元机组控制系统一体化的崛起。

(1)随着一些电厂将电气发变组和厂用电系统的控制(ECS)功能纳入DCS的SCS控制功能范围,ETS控制功能改由DCS模件构成,DEH与DCS的软硬件合二为一,以及一些机组的烟气湿法脱硫控制直接进入单元机组DCS控制的成功运行,标志着控制系统一体化,在DCS技术的发展推动下而走向成熟。

(2)由于一体化减少了信号间的连接接口以及因接口及线路异常带来的传递过程故障,减少了备品备件的品种和数量,降低了维护的工作量及费用,所以近几年一体化控制系统在不同容量的新建机组中逐渐得到应用。

(3)控制系统一体化的实现,是电力行业DCS应用功能快速发展的体现。排除人为因素外,控制系统一体化将为越来越多的电厂所采用。

1.1.3DCS结构变化,应用技术得到快速发展。

(1)随着电子技术的发展,近年来DCS系统在结构上发生变化。过去强调的是控制功能尽可能分散,由此带来的是使用过多的控制器和接口间连接。但过多的控制器和接口间连接,不一定能提高系统运行可靠性,相反到有可能导致故障停机的概率增加。何况单元机组各个控制系统间的信号联系千丝万缕,互相牵连,一对控制器故障就可能导致机组停机,即使没有直接导致停机,也会影响其它控制器因失去正确的信号而不能正常工作。因此随着控制器功能与容量的成倍增加、更多安全措施(包括采用安全性控制器)、冗余技术的采用(有的DCS的核心部件CPU,采用2×2冗余方式)以及速度与可靠性的提高,目前DCS正在转向适度集中,将相互联系密切的多个控制系统和非常复杂的控制功能集中在一对控制器中,以及上述所说的单元机组采用一体化控制系统,正成为DCS应用技术发展的新方向,这不但减少了故障环节,还因内部信息交换方便和信息传递途径的减少而提高了可靠性。

(2)此外,随着近几年DCS应用技术的发展,如采用通用化的硬件平台,独立的应用软件体系,标准化的通讯协议,PLC控制器的融入,FCS功能的实现,一键启动技术的成功应用等,都为DCS增添了新的活力,功能进一步提高,应用范围更加宽广。

1.2全厂辅控系统走向集中监控。

(1)一个火电厂有10多个辅助车间,国内过去通常都是由PLC和上位机构成各自的网络,在各车间控制室内单独控制,因此得配备大量的运行人员。为了提高设备控制水平和劳动生产率,达到减员增效的目的,随着DCS技术和网络通讯功能的提高,目前各个辅助车间的控制已趋向适度集中,整合成一个辅控网(简称BOP 即Balance Of Plant的缩写)方向发展,即将相互独立的各个辅助系统,利用计算机及网络技术进行集成,在全厂IT系统上进行运行状况监控,实现控制少人值班或无人值班。

(2)近几年新建工程迅速向这个方向发展。如国华浙能宁海电厂一期工程(4×600MW)燃煤机组BOP覆盖了水、煤、灰等共13个辅助车间子系统的监控,下设水、煤、灰三个监控点,集中监控点设在四机一控室里,打破了传统的全厂辅助车间运行管理模式,不但比常规减员30%,还提升了全厂运行管理水平。整个辅控网的硬件和软件的统一,减少了库存备品备件及日常管理维护费用[1]。由于取消了多个就地控制室,使得基建费用和今后的维护费用都减少。一些老厂的辅助车间也在进行BOP改造。

1.3变频技术的普及应用与发展。

(1)变频器作为控制系统的一个重要功率变换部件,以提供高性能变压变频可控的交流电源的特点,前些年在火电厂小型电机(如给粉机、凝泵)等控制上的应用,得到了迅猛的发展。由于变频调速不但在调速范围和精度,动态响应速度,低速转动力矩,工作效率,方便使用方面表现出优越性,更重要的是节能效果在经济及社会效益上产生的显著效应,因此继一些中小型电机上普遍应用后,近年来交流变频调速技术,扩展到一些高压电机的控制上试用,如送、引风机和给水泵电机转速的控制等。

(2)因为蕴藏着巨大的节能潜力,可以预见随着高压变频器可靠性的提高、一次性投资降低和对电网的谐波干扰减少,更多机组的风机、水泵上的大电机会走向变频调速控制,在一段时间内,变频技术将继续在火电厂节能工作中,扮演重要角色。

1.4局部系统应用现场总线。

(1)自动化技术的发展,带来新型自动化仪表的涌现,现场总线系统(FCS)是其中一种,它和DCS紧密结合,是提高控制信号传输的准确性、实时性、快速性和机组运行的安全可靠性,解决现场设备的现代化管理,以及降低工程投资等的一项先进的和有效的组合。目前在西方发达国家,现场总线已应用到各个行业,其中电力行业最典型的是德国尼德豪森电厂2×950MW机组的控制系统,采用的就是PROFIBUS现场总线。

(2)我国政府从“九五”起,开始投资支持现场总线的开发,取得阶段性成果,HART仪表、FF仪表开始生产。但电厂控制由于其高可靠性的要求,目前缺乏大型示范工程,缺乏现场总线对电厂的设计、安装、调试、生产和管理等方面影响的研究,因此现场总线在电厂的应用仍处于探讨摸索阶段,近二年我国有十多个工程应用了现场总线,但都是在局部系统上,其中: 某电厂,在单元机组的开、闭式水系统中的电动门控制采用Profibus DP总线技术,电动执行机构采用原装进口德国欧玛公司的一体化智能型产品Puma Matic,带有双通道Profibus-DP冗余总线接口作为DP从站挂在总线上。为了提高安全性可靠性,总线光纤、作为总线上的第一类DP主站的AP和相应的光电转换装置都采用了冗余结构,这是国内首家在过程控制中采用现场总线技术的火力发电厂。

(3)某电厂的补给水处理系统和废水系统[2],采用了二层通讯网络结构的现场总线控制系统,其链路设备和主站级网络采用冗余配置。控制系统人机终端与主控制器之间采用工业以太网通讯,以太网交换机采用ITP形式接口,四台交换机构成光纤高速路网。现场设备层之间采用Profibus-DP现场总线通讯。主环网采用光缆,分支现场总线通讯选用总线电缆。配置二套冗余的主控制器,分别用于锅炉补给水系统和废水系统,且各自有两条由光电耦合器组成的现场总线环形光缆网构成冗余配置,所有现场仪表和气动阀门定位器(均采用带PA总线接口),通过DP/PA耦合器连接到现场总线上。中低压电器设备(MCC)采用具有现场总线通信接口功能的智能电机控制器。加药泵的电动机采用带总线的变频器。锅炉补给水的阴阳离子床气动隔膜阀的电磁控制阀,采用具有总线接口的阀岛来控制,阀岛与现场总线连接。这是国内在局部过程控制中全面采用现场总线技术的首个火电厂,其应用实践表明,辅控网全面采用现场总线技术已成熟。

1.5热工控制优化技术的应用发展。

(1)随着过程生产领域对控制系统要求的不断提高,传统控制方法越来越难以满足火电厂热力流程对系统稳定性和性能最优化方面的要求,汽温超标已经成为制约机组负荷变化响应能力和安全稳定运行的主要障碍之一(燃烧优化主要是锅炉专业在进行,本文不作讨论)。由此基于现代控制理论的一些现代控制系统逐步在火电厂过程控制领域中得到应用。如基于过程模型并在线动态求解优化问题的模型预测控制(简称MPC)法、让自动装置模拟人工操作的经验和规律来实现复杂被控对象自动控制的模糊控制法、利用熟练操作员手动成功操作的经验数据,在常规的串级PID调节系统的基础上建立基于神经网络技术的前馈控制作用等,在提高热工控制系统(尤其是汽温控制系统)品质过程中取得较好效果。

(2)如某电厂使用的西门子公司PROFI系统,充分使用了基于模型的现代控制理论,其中汽温控制原理示意图如图1所示。

(3) 图1中,用基于状态空间算法的状态观测器解决汽温这种大滞后对象的延迟造成的控制滞后,焓值变增益控制器解决蒸汽压力的变化对温度控制的影响,基于模型的Smith预估器对导前温度的变化进行提前控制;通过自学习功能块实时补偿减温水阀门特性的变化;而对再热汽温控制,尽量以烟道挡板作为调节手段,不采用或少采用减温水作为控制手段,以提高机组效率;在机组协调控制模块中,采用非最小化形式描述的离散卷积和模型,提高系统的鲁棒性;根据控制品质的二次型性能指标连续对预测输出进行优化计算,实时对模型失配、时变和干扰等引起的不确定性因素进行补偿,提高系统的控制效果;PROFI投入后,AGC状态下以2% Pe /min负荷率变化时的响应时间为57秒,压力最大偏差0.208MPa,汽包水位变化最高和最低之差为-38.86mm,炉膛负压变化曲线最高值和最低值差-145Pa,主蒸汽温度偏差稳态基本控制在2℃以内,动态基本控制在5℃以内。

1.6SIS系统的应用发展。

(1)SIS系统是实现电厂管理信息系统与各种分散控制系统之间数据交换、实时信息共享的桥梁,其功能包括厂级实时数据采集与监视,厂级性能计算与分析。在电网明确调度方式有非直调方式且应用软件成熟的前提下,可以设置负荷调度分配功能。设备故障诊断功能、寿命管理功能、系统优化功能以及其它功能(根据电厂实际情况确定是否设置)[3]。自从国家电力公司电力规划总院在2000年提出这一概念和规划后,至今估计有200家多电厂建立了SIS系统,可谓发展相当迅速。

(2)但是自从SIS系统投运以来,其所起的作用只是数据的采集、存储、显示和可打印各类生产报表,能够真正把SIS的应用功能尽情发挥出来的很少,其面向统计/生产管理的数据分析工具,基于热经济性分析的运行优化,以品质经济性为目标的控制优化,以提高可靠性为目的的设备故障诊断等功能基本多数都未能付绪实施。其原因主要有设计不够完善,多数SIS厂家并没有完全吃透专业性极强的后台程序及算法,使其在生产实际中未能发挥作用,加上与现场生产脱节,因此SIS商所能做的只是利用网络技术,边搭建一个基本的SIS 架构边进行摸索。此外SIS应涵盖哪些内容没有统一的标准也缓慢了其功能的应用。

(3)但从大的方向上看,SIS系统的建设符合技术发展的需要和中国电力市场发展的趋势,将给发电厂特别是大型的现代化发电厂带来良好的经济效益。

2. 电力行业热工自动化系统的未来发展动向及前景

随着国家法律对环保日益严格的要求和计算机网络技术的进步,未来热工系统将围绕 “节能增效,可持续发展”的主题,向智能化、网络化、透明化,保护、控制、测量和数据通信一体化发展,新的测量控制原理和方法不断得以应用,将使机组的运行操作和故障处理,象操作普通计算机一样方便。

2.1单元机组监控智能化是热工自动化系统发展方向。

(1)单元机组DCS的普及应用,使得机组的监控面貌焕然一新,但是它的监控智能化程度在电力行业却没有多大提高。虽然许多智能化的监视、控制软件在国内化工、冶金行业中都有较好的应用并取得效益,可在我国电力行业直到近几年才开始有所起步。随着技术的进步,火电厂单元机组自动化系统的智能化将是一种趋势,因此未来数年里,实现信息智能化的仪表与软件将会在火电厂得到发展与应用。

(2)如:仪表智能管理软件,将对现场智能传感器进行在线远程组态和参数设置、对因安装位置和高静压造成的零位飘移进行远程修正,精度自动进行标定,计算各类误差, 并生成标定曲线和报告;自动跟踪并记录仪表运行过程中综合的状态变化,如掉电、高低限报警、取压管路是否有堵或零位是否有飘移等。

(3)阀门智能管理软件将对智能化阀门进行在线组态、调试、自动标定和开度阶跃测试,判断阀门阀杆是否卡涩, 阀芯是否有磨损等,通过阀门性能状况的全面评估,为实现预测性维护提供决策。

(4)重要转动设备的状态智能管理软件将对重要转动设备的状态如送风机,引风机,给水泵等,综合采用基于可靠性的状态监测多种技术,通过振动、油的分析以及电机诊断,快速分析(是否存在平衡不好,基础松动, 冲击负荷,轴承磨损)等现象和识别故障隐患, 在隐患尚未扩展之前发出报警,为停机检修提供指导和帮助。

(5)智能化报警软件将对报警信号进行汇类统计、分析和预测,对机组运行趋势和状态作出分析、判断,用以指导运行人员的操作;故障预测、故障诊断以及状态维修等专用软件,将在提高机组运行的安全性,最大限度地挖掘机组潜力中发挥作用。单元机组监控智能化将带来机组检修方式的转变,以往定期的、被动式维护将向预测性、主动式为主的维护方式过渡,检修计划将根据机组实际状况安排。

2.2过程控制优化软件将得到进一步应用。

(1)进一步提高模拟量控制系统的调节范围和品质指标,是火电厂热工自动化控制技术研究的一个方向。虽然目前有关自适应、状态预测、模糊控制及人工神经网络等技术,在电厂控制系统优化应用的报道有不少,但据笔者了解真正运行效果好的不多。随着电力行业竞争的加剧,安全、经济效益方面取得明显效果、通用性强、安装调试方便的优化控制专用软件(尤其是燃烧和蒸汽温度优化、性能分析软件、)将会在电厂得到亲睐、进一步发展与应用。

(2)目前机组的AGC均为单机方式(由调度直接把负荷指令发给投入AGC的机组)。由于电网负荷变化频繁,使投入AGC的机组始终处于相应的变负荷状态,锅炉的蒸汽压力和温度波动幅度大,辅机、阀门、挡板等设备动作频繁,这种方式对机组和设备的寿命都会产生一定的负面影响。随着发电成本的提高,发电企业需从各个角度考虑如何切实降低电厂运行成本,延长机组的使用寿命。因此配置全厂负荷分配系统(即电网调度向电厂发一个全厂负荷指令,由电厂的全厂负荷分配系统,以机组的煤耗成本特性为基础,在机组允许的变化范围内,经济合理地选择安排机组的负荷或变负荷任务,使全厂发电的煤耗成本最低,降低电厂的发电成本)将是发电企业必然的要求,相信不久的将来,单机AGC方式将会向全厂负荷分配方式转变。

(3)SIS系统将结合生产实际进行二次开发,促进自身应用技术走向成熟,在确保火电厂安全、环保、高效益及深化信息化技术应用中发挥作用。

2.3现场总线与DCS相互依存发展。

未来一段时间里,现场总线将与DCS、PLC相互依存发展,现场总线借助于DCS和PLC平台发展自身的应用空间,DCS和PLC则借助于现场总线完善自身的功能。

2.3.1现场总线与DCS的关系。

现场总线作为一个完整的现场总线控制系统,目前还难以迅速应用到整个电厂中,而DCS虽然是电厂目前在线运行机组的主流控制系统,但由于其检测和执行等现场仪表信号仍采用模拟量信号,无法满足工程师站上对现场仪表进行诊断、维护和管理的要求,限制了控制过程视野,因此DCS通过容入通信协议国际标准化的现场总线和适合现场总线连接的智能化仪表、阀门,并将自身的输出驱动功能分离移到现场或由现场智能驱动器代替,功能简单且相对集中的控制系统下放到采用FCS控制和处理功能的现场智能仪表中,然后由少量的几根同轴电缆(或光缆)和紧急停炉停机控制用电缆,通过全数字化通信与控制室连接。将有助于降低电厂造价,提高自身的可靠性,拓宽各自的功能,推动各自的发展。除新建电厂将会更多的采用现场总线的智能设备外,也会成为运行多年的机组下一步的改造计划。

2.3.2现场总线与PLC的关系。

(1)现场总线在电厂的应用将借助于PLC,这不但因为PLC已广泛应用于电厂辅助设备的控制,将现场总线技术和产品溶合到PLC系统中,成为PLC系统中的一部分或者成为PLC系统的延伸部分,在辅助设备的控制中将直接明显地体现其经济效益。还因为现场总线和PLC的制造商间关系密切,如、ProfiBus等本身就是由PLC的主要生产供货商支持开发。

(2)由于电厂现场的环境恶劣,温度高、灰尘多、湿度变化大,因此现场总线在电厂应用,首先要解决的是自身质量。

2.4辅助车间(系统)集控将得到全面推广。

随着发电厂对减员增效的要求和运行人员整体素质的提高,辅助车间(系统)通过辅控网集控将会得到进一步全面推广。但在实施过程中,目前要解决好以下问题:

(1)辅控系统I/O点数量大,各辅助车间物理位置分散,存在远距离通信、信号衰减和网络干扰问题,因此监控系统主干通信网宜采用多模光缆以确保通信信号的可靠性。

(2)各辅助控制系统采用不同的控制设备,控制系统的通信接口协议不同,甚至不同的物理接口,因此须解决网络通信协议的转换问题,选型时应事先规定好各系统间的接口连接协议。

(3)各个辅助车间的控制系统为不同的厂商供货,由于使用的软件不同,其操作员站的人机界面很有可能不一致。因此选型时应注意上位机软件,设计统一的人机界面,采用统一的风格及操作方式,以便方便各系统画面接入BOP网络。

辅助车间集控系统能否实现设计目标,除了自身的技术以外,很大程度上取决于辅助系统本身的自动投入情况。因此高可靠性的执行机构、动作灵活可靠的限位开关、智能化的变送器将会得到应用。

2.5单元机组监控系统的物理配置趋向集中布置。

过去一个集控室的概念,通常为一台单元机组独用或为二台机组合用,电子室分成若干个小型的电子设备间,分别布置在锅炉、汽轮机房或其它主设备附近。其优点是节省了电缆。但随着机组容量的提高、计算机技术的发展和管理水平的深化,近几年集控室的概念扩大,出现了全厂单元机组集中于一个控制室,单元机组的电子设备间集中,现场一般的监视信号大量采用远程I/O柜的配置方式趋势。

2.6APS技术应用。

(1)APS是机组级顺序控制系统的代名词。在机组启动中,仅需按下一个启动控制键,整个机组就将按照设计的先后顺序、规定的时间和各控制子系统的工作情况,自动启停过程中的相关设备,协调机炉电各系统的控制,在少量人工干预甚至完全不用人工干预的情况下,自动地完成整台机组的启停。但由于设备自身的可控性和可用率不满足自动化要求,加上一些工艺和技术上还存在问题,需要深入地分析研究和改进,所以目前燃煤机组实施APS系统的还不多见。

(2)由于APS系统的实质是电厂运行规程的程序化,其优势在于可以大大减轻运行人员的工作强度,避免人为操作中的各种不稳定因素,缩短机组启停时间。作为提高生产效率和机组整体自动化水平,增强在电力企业的市场竞争能力行之有效的方法,将会成为未来机组控制发展的方向之一,引导设计、控制系统厂商和电厂人员更多地去深入研究,设计和完善功能,并付绪实施。

2.7无线测量技术应用。

无线测量技术能监视和控制运行过程中发生的更多情况,获得关键的工艺信息,整合进入DCS。除节省大量安装成本以外,还将推动基本过程和自动化技术的改善。如供热、供油和煤计量,酸碱、污水区域测量等,都可能通过无线测量技术实现远程监控。

2.8提高热工自动化系统可靠性研究将深入。

由于热控系统硬软件的性能与质量、控制逻辑的完善性和合理性、保护信号的取信方式和配置、保护连锁信号的定值和延迟时间设置,以及热控人员的检修和维护水平方面,都还存在一些不足之处,由此使得热控保护系统误动作引起机组跳闸事件还时有发生。在电力生产企业面临安全考核风险增加和市场竞争加剧的环境下,本着电力生产“安全第一,预防为主”的方针,以及效益优先原则,从提高热工自动化系统的可靠性着手,深入开展技术研究,是热工自动化系统近期的一项急需进行的工作。提高热工自动化系统的可靠性技术研究工作,包括控制软硬件的合理配置,采集信号的可靠性、干扰信号的抑制,控制逻辑的优化、控制系统故障应急预案的完善等。随着机组控制可靠性要求的提高,重要控制子系统的硬件配置中,将会采用安全型控制器、安全型PLC系统或者它们的整合,保护采集信号将会更多的采用三选二判断逻辑。独立的测量装置需要设计干扰信号抑制功能。此外基建机组一味以最低价中标的招标模式也应得到扭转(最低价中标,迫使厂商通过减少配置来降低投标价,导致控制系统可靠性下降)。

2.9火电厂机组检修运行维护方式将改变。

(1)随着电力市场的竞争,发电企业将趋向集约化经营和管理结构扁平化,为提高经济效益,发电企业在多发电,以提高机组利用小时的同时,将会通过减少生产人员的配备,密切与外包检修企业之间的联系,让专业检修队伍取替本厂检修队伍的方式来提高劳动生产率。因此检修维修工作社会化将是一种趋势。此外DCS的一体化及其向各功能领域渗透,提高电厂整体协调和信息化、自动化水平的同时,也将会使电厂原专业间及专业内的分工重新调整,比如热工与电气二次回路的专业划分打通。为了降低成本,电厂不再保持大批的检修维修人员,因此检修维护方式也将因此而改变,比如让生产厂家和公司承担DCS和相关设备的检修工作。