前言:中文期刊网精心挑选了神经网络特征范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络特征范文1
关键词:SOM神经网络;负荷特性曲线;聚类分析
中图分类号:TM7 文献标识码:A 文章编号:1007-0079(2014)33-0204-03
在国家提出建设坚强智能电网的背景下,提高电力营销服务水平和智能用电技术已成为电网企业关注的焦点。电力营销服务水平与智能用电技术的提升离不开在对电力用户用电行为特征的准确、全面、及时地掌握,而从海量负荷数据中提取用户日负荷特征曲线并进行深入分析成为研究用户用电行为特征的一种有效方式。
从研究对象层面来看,以往相关研究侧重专线用户(负荷数据来源为SCADA系统)和专变用户,并以传统意义上的行业分类作为提取负荷特征曲线时聚类的依据。从研究方法层面来看,电力用户日负荷特征曲线的提取多使用聚类算法,主要有统计方法、机器学习方法、人工神经网络方法和面向数据库的方法。人工神经网络因具有大规模的并行协同处理能力、较强的容错能力、联想能力、学习能力和自适应能力,故能够较好地适应海量数据背景下的数据挖掘。应用较多的典型的神经网络模型包括BP网络、Hopfield网络、ART网络和Kohonen网络。[1-3]BP网络属于有监督学习的神经网络,需要提供聚类对象类别数量的先验知识,而公变用户缺乏传统意义上类似专变用户的行业分类,故不适合采用BP网络。Hopfield网络、ART网络和Kohonen网络都属于无监督学习的神经网络,在解决聚类问题上有其各自的优缺点。
本文提出采用SOM神经网络[4-6]聚类算法提取公变用户日负荷特征曲线,用MATLAB软件进行仿真,输出可视化聚类结果,并对聚类结果进行分析,验证了采用SOM神经网络聚类算法提取出的公变用户日负荷特征曲线能够较好地显示不同类型公变用户用电行为特征上的差异,具备良好的聚类效果,同时为电网企业优化电力营销服务提供参考和指导。
一、SOM神经网络
SOM(Self-Organizing Map,自组织映射)神经网络是较为广泛应用于聚类的神经网络。它是由Cohonen提出的一种无监督学习的竞争型神经网络模型,通过不断缩小获胜神经元的邻域来达到聚类的目的。主要功能是将输入的高维空间数据映射到一个较低的维度,通常是一维或者二维输出,同时保持数据原有的拓扑逻辑关系。
SOM神经网络由输入层和输出层两层组成,输入层中的每一个神经元通过权与输出层中的每一个神经元相连,如图1所示。输入层的神经元以一维的形式排列,输入神经元的个数由输入矢量中的分量个数决定,输出层的神经元一般以一维或者二维的形式排列,计输入层的神经元数量为m,输出层神经元数量为c。输入的样本总数为n,第i个输入样本用矢量表示为,每个输出神经元的输出值记为,。与第j个输出神经元相连的权用矢量表示为:。
Kohonen算法是无教师示教的聚类方法,它能将任意维输入模式在输入层映射成一维或二维离散图形,并保持其拓扑结构不变,即在无教师示教的情况下,通过对输入模式的自组织学习,在输出层将聚类结果表示出来。此外,网络通过对输入模式的反复学习,可以使连接权矢量空间分布密度与输入模式的概率分布趋于一致,即连接权矢量空间分布能反映输入模式的统计特性。该算法往往在完成极高维数、超大量数据和高度非线性问题的聚类,模式表征和数据压缩,分类等任务时是一个很有效、很简便,且快速、稳健、泛化性好的算法。
Kohonen的学习算法如下:
(1)初始化:将整个输入向量存储在矩阵p中,对权值w进行初始化,权值向量的每一维的取值范围同输入向量每一维的取值范围。
(2)选择一个输入向量,提供给网络输入层。
(3)按照下式计算输出层每一个神经元 j 的权值与输入向量之差:,其中,。
(4)按照“胜者为王”的原则,对每一个神经元j,以minDist中的最小值所对应的神经元 k作为胜者,对它和它的邻域内的神经元的权值进行调整,假设当前处于学习的第l步,权值的修正按照下式进行:
其中,lr表示学习速率,br表示邻域调整率;表示获胜神经元的邻域,即:。
(5)选择另一个输入向量,返回(3),直到所有的输入向量全部提供给网络。
(6)返回(2),直到达到最大训练步数。
二、MATLAB仿真算例
1.MATLAB仿真实现
对于日负荷特征曲线的提取,负荷曲线的采样点越多,曲线越精细,越容易进行分类,研究数据来自于电力用户用电信息采集系统,从中提取公变用户每15分钟采集一次的有功功率构成其日负荷曲线,一天共96个采样点。从某省电力用户用电信息采集系统中随机抽取1000台公用变压器,选取其2012年7月10日(工作日,该省全年负荷最高日)作为典型日进行日负荷特征曲线提取和分析。每台公变日负荷曲线由96个有功采样点组成。由于每台公变额定容量大小不等,为了有效聚类,首先需要对负荷数据进行归一化处理。
本文采用聚类SOM神经网络,在MATLAB环境下,对这些数据进行聚类仿真。聚类SOM神经网络的MATLAB实现步骤如下:(1)准备数据源。首先从原始数据库读取相关数据(输入样本总数70,每一个样本有96个采集时点)作为输入矢量,并将其以二维数组70×96形式输入。(2)确定参数。输入神经元个数为采集时点的个数96;输出神经元以二维数组3×3形式呈现。(3)运用rand( )函数产生[0,1)之间的随机数作为权值。(4)调用SOM创建函数newsom( ),创建自组织映射网络net=newsom( )。(5)对迭代次数net.trainParam.epochs赋值2000;对net.trainParam.show赋值20,表示每20次显示一下误差变化情况。(6)运用网络训练函数train( )训练上述初始化后的网络net=train( )。(7)调用plot( )画输入点; plotsom( )作训练后的权值点及其与相邻权值点的连线。
2.仿真结果分析
经MATLAB仿真运行后得到聚类结果图2所示:
图2所示为SOM神经网络聚类结果,将样本公变用户分为7个类别,为便于后文描述,不妨按照行优先的顺序为各激活的优胜神经元标识聚类编号,依次分别为为:公变用户第一类(包含13个样本用户)、公变用户第二类(包含12个样本用户)、公变用户第三类(包含5个样本用户)、公变用户第四类(包含10个样本用户)、公变用户第五类(包含10个样本用户)、公变用户第六类(包含10个样本用户)、公变用户第七类(包含10个样本用户)。
每个竞争层神经元与各输入神经元之间的连接权构成的向量代表了该优胜神经元所标识类别的聚类中心即日负荷特征曲线,竞争层神经元邻域权值距离如图3所示,颜色越深表示领域神经元间的权值距离越远,即邻域神经元的聚类中心距离越远、提取的日负荷特征曲线差异越大。
图4所示为通过SOM神经网络聚类算法提取的七大类公变用户日负荷特征曲线。日负荷特征曲线较为明显地反映了不同类型公变用户在该典型日的用电行为。
第一类公变日负荷特征曲线呈现出明显的午高峰和晚高峰特征,且晚高峰明显高于午高峰。推测此类为城镇居民生活的典型日负荷特征曲线,可能由于部分居民上班因素造成晚高峰高于午高峰;第二类公变日负荷特征曲线走势同全网负荷基本一致,呈现出明显午高峰和晚高峰,但午高峰一枝独秀,可能该公变下的用户类型较多,包括居民用户和一般工商业用户,由于各类用电特征比例与全网比例类似,形成具有全网负荷特征的曲线;第七类公变日负荷特征曲线与前六种主要集中在白天用电不同,主要在天黑时间段内(晚上7点左右至第二天早上6点)用电,推测这类用户主要集中在市政工程类。
三、总结与展望
本文将SOM神经网络聚类算法应用到电力用户日负荷特征曲线提取的研究中,选取某省公变用户作为分析样本,通过MATLAB仿真计算将样本公变用户分为七个类别,以优胜神经元与输入神经元之间连接权向量作为聚类中心即该类别用户的日负荷特征曲线。根据提取出的日负荷特征曲线,结合电力用户用电信息采集系统中的营销档案分析了不同类别公变用户的用电特征与习惯。分析表明,采用SOM神经网络聚类算法提取日负荷特征曲线具有良好的效果,提取出的日负荷特征曲线能够较好反映该类型用户的用电行为与特征,为电力企业了解用户用电习惯、细分电力市场、调整定价策略和实施需求侧管理提供了有益参考。
下一步研究将考虑采用电力用户全年负荷数据进行聚类分析,验证小样本下的聚类结果、发现新的用户类型;同时改进SOM神经网络算法,使其适应海量数据下的负荷曲线聚类分析,并通过调整竞争层神经元个数与抑制权值使训练结果更加稳定,得到更好的聚类效果。
参考文献:
[1]马玉梅,马志超.基于人工神经网络的手写阿拉伯数字识别[J].中央民族大学学报(自然科学版),2007,(4).
[2]刘小波,李亚玲,赵景涛,等.基于KOHONEN神经网络的电压控制分区[J].浙江电力,2007,(3).
[3]莫礼平.基于Kohonen神经网络的故障诊断方法[J].成都大学学报(自然科学版),2007,(1).
[4]李培强,李欣然,陈辉华,等.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,(24).
神经网络特征范文2
关键词关键词:神经网络;数字识别;特征提取
中图分类号:TP312文献标识码:A 文章编号:16727800(2014)002005803
0引言
数字识别是模式识别领域的一个重要分支,在表单自动读取、信息录入等方面有着重要作用。图像的像素特征反映了图像的大量信息,稳定性好、易于实现。其矩特征具有平移、旋转和缩放不变性,匹配性好[1]。
人工神经网络是由大量简单的基本元件——神经元相互连接,通过模拟人的大脑神经处理信息的方式,进行信息并行处理和分线性转换的复杂网络系统[2]。自1943年心理学家McCulloch和数学家Pitts提出神经元生物学模型以来,人工神经网络经过不断地发展成熟,至今已经广泛地应用于各个领域。本文将图像的像素特征和矩特征相结合,用于人工神经网络分类器的训练和测试,获得了良好的识别效果。
1图像特征提取
特征提取是根据测量数据确定出对分类有意义的数据作为特征数据,这些特征类内样本距离应尽量小,类间样本距离应尽量大[3]。特征提取算法应具有较高的稳定性和鲁棒性,同时又便于提取,易于实现。在特征提取之前,需要对图像进行预处理。首先,将图像进行二值化处理,保证目标像素值为1,背景像素值为0;然后,将图像归一化为16*16像素大小。在完成图像二值化和归一化的基础上,再对图像的像素特征和Hu矩特征进行特征提取。
1.1像素特征提取
将16*16的二值图像矩阵转化为256维的0、1向量,得到图像的256维像素特征。
将图像水平分成四份,垂直分成两份,分别统计这8个区域内白像素的个数,得到8维特征。水平和垂直各划两条线把水平和垂直分割成三分,统计这四条线穿过的白像素的个数,得到4维特征。字符图像全部白像素数作为1维特征,得到图像的13网格特征[4],数字1-9的13网格特征如表1所示。
本文设计的PNN神经网络输入向量为上文提取的276维特征向量,激活函数采用高斯函数,与BP神经网络采用相同的测试集,识别率达到92.5%。与BP神经网络相比,识别率有了大大提高,且省去了训练时间。
3结语
BP神经网络采用学习率可变的训练算法,收敛速度最快,可有效节省时间。PNN神经网络在创建网络的过程中对网络进行训练,简化了BP神经网络复杂的学习过程,且与BP神经网络相比具有更好的分类性能。在模式识别领域,PNN神经网络有着巨大的优越性。当然,本文使用的276维特征存在一定程度的冗余,是制约分类器性能的一方面原因,在以后的研究中需要在这些方面作出改进。
参考文献:
[1]李晓慧. 基于MATLAB的BP神经网络的应用[J].科技信息,2010(26).
[2]徐远芳,周旸,郑华. 基于MATLAB的BP神经网络实现研究[J].微型电脑应用,2006(08).
[3]Neural Network Toolbox[M].Mathworks,2007:113.
[4]TAN, KOK KIONG.Neural network control:theory and applications[M].Research Studies Press,2004.
[5]周明,孙树栋.遗传算法原理及应用[M].北京:国防工业出版社,1999.
[6]魏海坤.神经网络结构设计的理论与方法[M].北京:国防工业出版社,2005.
[7]吕琼帅.BP神经网络的优化与研究[D].郑州:郑州大学,2011.
[8]高隽.人工神经网络原理及仿真实例[M].北京:机械工业出版社,2003.
神经网络特征范文3
关键词:神经网络;入侵检测;模块
中图分类号:TP393 文献标志码:A 文章编号:1009-3044(2015)13-0171-02
网络给我们带来巨大机会和发展的同时也给我们带来了恶意入侵的危险。就现在的整体情况来看,经常使用的网络安全技术还局限于防火墙等一些静态的安全保护方式,要是没有积极主动的一些安全防护方式相配合,他的安全性能就是有残缺的。开发一种主动防御、及时控制的技术就很有必要。入侵检测技术恰恰就是这样的一种技术。入侵检测在国内有很多文献进行研究,目前入侵检测存在的最大问题是检测中误报率较高。所以我们要提高入侵检测的智能型。神经网络顾名思义模仿人的大脑,具有很好的并行计算,自适应计算,抗干扰和智能判断的特征,可以准确处理失真信号。这些特征能优化现有的入侵检测方法,是发展的必然趋势。
1网络攻击的分类
从攻击的技术手段方面看,网络攻击分为两大类。第一类分析攻击行为,并在数据包的载荷部分把其特征隐藏。有字符串结合而成的,服务于系统的一些常用命令,没有被显示出来。但是一旦点击包含此字符串的对象,入侵行为就被激活。这种利用计算机本身系统结构特点和应用层协议的一些漏洞产生的攻击称为高层网络攻击。第二类攻击称为低层网络攻击。主要攻击发生在网络连接的时间和数据流量上,这类攻击主要是针对TCP/IP协议栈中的基础协议的漏洞进行攻击。
2入侵检测原型总体结构
图1描述了原型的总体结构模型。对主要模块的总体功能进行如下介绍。
1)数据捕获模块,捕获在系统中运行的数据包,预处理模块处理这些数据包。在实现时,将网络接口设成混杂模式,方便数据流通,并同时监听经过设备的数据[1]。
2)数据预处理模块分析网络上获得的信息,对数据包根据协议类型一层一层解析。记录和计算TCP连接信息,半开连接信息,保护网络主机不同端口连接信息和半开连接信息,并对SYN报文和FIN报文的链表状态和链表结点进行维护。IP协议处理函数中进行碎片信息的处理和记录,目的是把基于碎片的拒绝服务攻击提供给神经网络模块。总结信息并把信息转化,进行归一化处理,结合TCP数据报的标志位送入神经网络检测模块,检测攻击的存在。最后把得到的特征用于ICMP协议的扫描或攻击检测。
3)数据预处理模块把得到的特征传给神经网络检测模块,神经网络检测模块负责计算输出层的输出结果,并根据结果判断攻击。神经网络检测模块有三大模块构成。能检测网络漏洞扫描和TCP协议中拒绝服务攻击的TCP神经网络检测模块;能通过检测到拒绝服务攻击和ICMP的IP神经网络检测模块;基于ICMP的主机活性扫描和拒绝服务攻击的检测被神经网络检测模块实现。
4)神经网络训练模块对己知的网络攻击离线训练,以矩阵形式将训练好的神经网络的各层连接权存入磁盘文件中,在系统开始运行时神经网络检测模块读入磁盘中的权值到神经网络结构中。神经网络训练模块也可分为TCP神经网络训练模块、m神经网络训练模块和ICMP神经网络训练模块[1]。
5)响应报警模块报告当前的被检测数据对象是否存在攻击的迹象,判断依据是神经网络的输出。
3基于神经网络入侵检测原型详细设计
详细设计分为数据捕获模块、数据预处理模块、神经网络训练模块、神经网络测试模块、响应报警模块五个模块。
数据捕获模块。网络数据的捕获通过Libpcap编程接口实现。这种接口是网络数据包的标准捕获接口,它效率高、独立性和移植性强。使用具有快速的网络数据包过滤功能的BPF数据包捕获机制。数据捕获过程中通过Libpcap截获网络数据包。
数据预处理模块。数据预处理模块接收网络数据包,这些数据包由数据捕获模块送过来。接收后先处理这些数据包,并将处理的结果转化为向量送入神经网络检测模块检测。数据预处理模块处理的数据包分别针对三种协议:IP、TCP、ICMP。IP协议的预处理主要提取针对基于m碎片的攻击特征;TCP协议的预处理针对基于TCP协议网络扫描并对拒绝服务攻击特征提取。
神经网络训练模块。采用双隐层BP神经网络作为神经网络训练模块的网络结构。离线状态下运行神经网络训练模块。网络攻击和正常网络流通的一些知识,让检测模块在对网络攻击事件进行检查入侵之前学会。提供给神经网络训练模块已知攻击的输入特征向量和与之对应的期望输出向量由系统管理员负责。本原型输入特征向量是预处理模块得到的可描述攻击行为的特征向量;期望输出数据一般为一串二进制0、1串指示了是何种具体的攻击。本原型对基于IP、ICMP、TCP协议的网络扫描和拒绝服务攻击进行检测,相应定义了三种(IP、ICMP、TCP)神经网络[2]。
神经网络检测模块。神经网络检测模块接受的特征向量是由预处理模块送来,这些特征向量做为神经网络的输入向量,是由神经网络的各层计算出结果,然后把结果在输出层输出。输出结果可能显示的是正常的数据流,可能指示某一种网络攻击,也可能是未知的结果即这个结果在神经网络训练时没有定义。针对这种情况,对于前两种情况,系统管理员应记录下这时神经网络的输入向量和输出向量,在神经网络进行训练时,加入这两种情况。对于后一种情况,需要在进行分析。
响应报警模块。响应报警模块对接受神经网络输出向量,根据编码的对应关系,判断攻击行为。发现对应的攻击。就会有相应的消息打印在屏幕上,并会有指示这种攻击的全局变量在系统中设置;若没有找到对应攻击,则不打印消息。理论上讲训练神经网络时,对输出向量的编码是0、1串。但真正的输出不会严格的是0、1串,所以约定,数值大于0.7的按1对待,小于0.3的按0对待。
改进后BP神经网络的训练
4神经网络训练流程
P代表样本总数。
F代表不合格样本数。
M代表正确率,设在1%-100%之间。
E为网络训练后要达到的精度,设为小数。
5神经网络检测
对参数和变量进行初始化;
从记事本文件中读取检测样本、期望值、权值、阈值;
for(n=1;n
{放入矩阵第一行;
{for(n=1;n
根据阈值和权值的到线性输出,放入矩阵第二行;
…
}
if(小于正确率) 不合格样本数++;
}
输出该组数据的检测结果;
end
正确率输出结果越接近l,表明可能受到攻击。
6 结束语
本文调研了常见的网络攻击手段,探讨了入侵检测技术的研究方法、入侵检测的发展方向。根据神经网络的特点,将神经网络与入侵检测结合。设计了一个简化的基于神经网络的网络入侵检测原型。原型通过统计底层网络协议的数据流量信息数据包协议头的信息,将这些信息预处理后送入已训练过的神经网络模块,以此判断当前网络数据流量存在的攻击或扫描行为。此原型提出了具有更高检测率并且能检测变种攻击的模块设计。
参考文献:
[1] 张文修,梁怡.基于包含度的不确定推理[M]. 北京:清华大学出版社,2007.
神经网络特征范文4
关键词:BP神经网络、图像分割、特征提取
Abstract: the image recognition process including the image preprocessing, feature extraction, image understanding and analysis. Which BP artificial neural network in the image segmentation using better; In the feature extraction phase BP neural network is also very good find application, and obtain the better feature extraction results; In the image understanding and the analysis phase using neural network classifier design, can get accurate classification results.
Keywords: BP neural network, image segmentation, feature extraction
中图分类号:TP183 文献标识码:A文章编号:
引言
BP人工神经网络算法是现今应用较为广泛的多层前向反馈式神经网络算法,BP人工神经网络有较好的容错能力、鲁棒性、并行协同处理能力和自适应能力,受到了国内外众多领域学者的关注。由于神经网络高效率的集体计算能力和较强的鲁棒性,它在图像分割方面的应用已经很广泛,Jain和Karu采用了多通道滤波与前向神经网络相结合的方法实现图像纹理分割算法。神经网络算法在特征提取阶段,压缩特征数量,以提高分类速度和精度。在图像识别领域中神经网络作为分类器的研究也得到了很大的进展,尤其是其学习能力和容错性对于模式识别是非常有利的,在一定程度上提高了训练速度和识别率。Le Cun等人提出了多层特征选择(Multilayer Selection Procedure)方法用于字符识别,每一层神经网络处理较低层次的特征,获取该层特征信息并传给上一层。
BP神经网络的基本原理
人工神经网络的研究起源于对生物神经系统的研究,它将若干处理单元(即神经元)通过一定的互连模型连结成一个网络,这个网络通过一定的机制可以模仿人的神经系统的动作过程,以达到识别分类的目的。人工神经网络区别于其他识别方法的最大特点是它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。神经网络的学习过程实际上就是不断地调整权值和阈值的过程。根据有无训练样本的指导可以将神经网络的学习方式分为两种:监督学习方式和非监督学习方式,也称为有导师指导学习方式和无导师指导学习方式。监督学习方式,是在给定固定的输入输出样本集的情况下,由网络根据一定的学习规则进行训练学习,每一次学习完成后,通过对比实际的输出和期望的输出,以此决定网络是否需要再学习,如果还没有达到期望的误差,则将实际误差反馈到网络,进行权值和阈值的调整,使实际的误差随着学习的反复进行而逐步减小,直至达到所要求的性能指标为止。非监督学习方式,是在没有外界的指导下进行的学习方式,在学习过程中,调整网络的权重不受外来教师的影响,但在网络内部会对其性能进行自适应调节。
BP神经网络分类器的设计
BP神经网络是基于误差反向传播算法(Back Propagation Algorithm,BPA)的多层前向神经网络,由输入层、输出层、一个或多个隐含层所组成。BP神经网络结构确定之后,通过对输出和输入样本集进行训练,反复修正网络的权值和阈值,达到学习训练的期望误差,以使网络能够实现给定的输入输出映射关系。BP人工神经网络的学习过程分为两个阶段,第一阶段是输入己知的学习样本数据,给定网络的结构和初始连接权值和阈值,从输入层逐层向后计算各神经元的输出;第二阶段是对权值和阈值进行修改,即根据网络误差从最后一层向前反馈计算各层权值和阈值的增减量,来逐层修正各层权值和阈值。以上正反两个阶段反复交替,直到网络收敛。具体实现步骤如下:
(1) 网络的初始化:首先对输入的学习训练样本进行归一化处理,对权值矩阵W和阈值向量赋初值,将网络计数器和训练次数计数器置为1,网络误差置为0。
(2) 输入训练样本,计算输入层,隐含层以及输出层的实际输出。
(3) 计算网络输出误差。将实际的输出和期望的输出值进行对比,采用均方根误差指标作为网络的误差性能函数。
(4) 若误差还没达到期望标准,则根据误差信号,逐层调整权值矩阵和阈值向量。
(5) 若最终调整之后的网络输出达到了误差范围之内,则进行下一组训练样本继续训练网络。
(6) 若全部的训练样本训练完毕,并且达到了期望的误差,则训练结束,输出最终的网络联接权值和阈值。
BP神经网络可以逼近任意连续函数,具有很强的非线性映射能力,而且BP神经网络中间层数、各层神经元数及网络学习速率等参数均可以根据具体情况设定,灵活性较强,所以BP神经网络在许多领域中广泛应用。一般来说,神经网络方法应同传统的人工智能方法相联系的。神经网络本身结构及性能上的特点使其对问题的处理更富有弹性,更加稳健。神经网络的基本特点是采用自下而上的设计思路,使其容易确定具体的目标分割或识别算法,在增加了不确定因素的同时也产生了网络最优化的问题,这就是所谓的伪状态(pseudo-trap)。尽管在实践中并非所有的伪状态对应完全失败的结果,但是毕竟这不符合对之完美的或者说合理的期望。人工智能则一般采用自上而下的方法,偏重于逻辑推理建立系统模型。因此将神经网络同人工智能结合起来,相当于赋予神经网络高层指导的知识及逻辑推理的能力,具有潜在的优势。
输入层中间层 输出层
图1 BP人工神经网络结构
BP神经网络的训练
4.1 BP神经网络的设计
BP神经网络的设计主要包括两方面内容:一是神经网络结构的确定,特别是隐含层层数及隐含层单元数目的确定;二是高精度收敛问题,隐含层和隐含层单元数过多,将导致训练时间过长并出现过度拟和的问题,隐含层单元数过少又导致网络收敛速度慢甚至不收敛,达不到误差精度要求。在确定隐含层层数以及隐含层单元数目时,没有一个严格的理论依据指导,需要根据特定的问题,结合经验公式确定大致范围来进行逐步试算比较得到。
4.2 数据预处理
为了加快网络的训练速度,通常在网络训练前进行神经网络输入和输出数据预处理,即将每组数据都归一化变为[-1,1]之间的数值的处理过程。
4.3 神经网络的训练
%当前输入层权值和阈值
inputWeights=net.IW{1,1}
inputbias=net.b{1}
%当前网络层权值和阈值
layerWeights=net.LW{2,1}
layerbias=net.b{2}
%设置训练参数
net.trainParam.show = 1000;%限时训练迭代过程
net.trainParam.lr = 0.1; %学习率,缺省为0.01
net.trainParam.epochs = 100000; %最大训练次数,缺省为100
net.trainParam.goal = 0.001; %训练要求精度,缺省为0
[net,tr]=train(net,P,T);%调用 TRAINGDM 算法训练 BP 网络
A = sim(net,P) %对 BP 网络进行仿真
E = T - A;%计算仿真误差
MSE=mse(E)
结束语
BP网络因为具有较强的学习性、自适应型和容错性,在很多领域均已经大量运用。本文将BP人工神经网络运用于图像的识别,探索人工神经网络在图像识别领域中的重要的现实意义。研究表明,BP人工神经网络应用于图像识别在一定程度上提高了识别的效率和准确率。但是,BP神经网络算法还存在以下几点不足之处:(1)权的调整方法存在局限性,容易陷入局部最优;(2)网络的结构需要提前指定或者在训练过程中不断的修正;(3)过分依赖学习样本,由于学习样本是有限的或者学习样本质量不高,那么会导致训练达不到效果;(4)对于规模较大的模式映射问题,存在收敛速度慢、容易陷入局部极小点、判断不准确等缺陷。总之,如何解决以上问题,如何进一步提高识别精度,扩大识别范围,使之更具有更好的工程实用性,是有待进一步研究的内容。
参考文献:
[1] WE Blanz,S L Gish.A Connectionist Classifier Architecture Applied to Image Segmentation.Proc.10th ICPR,1990,272-277.
[2] Y Le Cun,L D Jackel,B Boser,J S Denker,H P Graf,I Guyon,D Henderson,R E Howard,and W Hubbard,Handwriten Digit Recognition:Applications of Neural Network Chips and Automatic Learning,IEEE Comm.Magazine.Nov.1989.
[3] A K Jain and K Karu,Automatic Filter Design for Texture Discrimination,Proc.12th Int’l Conf.NeuralNetworks,Orlando,Oct.1994,454-458.
[4] 边肇其,张学工.模式识别(第二版)[M].清华大学出版社,北京.1999,12.
[5] 陈书海,傅录祥.实用数字图像处理[M].科学出版社,北京.2005.
[6] 万来毅,陈建勋.基于BP神经网络的图像识别研究[J].武汉科技大学学报(自然科学版).2006,6.
[7] 丛爽.面向MATLAB工具箱的神经网络理论与应用(第2版)[M].北京:中国科学技术出版社,2003.
[8] 王娟,慈林林等.特征方法综述[J].计算机工程与科学.2005.27(12).68-71.
[9] 贾花萍.基于神经网络的特征选择与提取方法研究[J].网络安全.2008,7.33-35.
[10] 龚声荣,刘纯平等编著.数字图像处理与分析[M].清华大学出版社,北京.2006.7.
神经网络特征范文5
关键词: 图像检索; 特征提取; 神经网络; 机器学习; 相关反馈
中图分类号: TN711?34; TM417 文献标识码: A 文章编号: 1004?373X(2016)21?0078?05
Design and development of image retrieval platform based on artificial neural network
ZHANG Weihua, GAO Ang
(Department of Information Engineering, Zhengzhou Chenggong University of Finance and Economics, Gongyi 451200, China)
Abstract: Since the difference exists between the high?level abstract semantics and underlying feature of the user?description image, the retrieval system based on the image content feature can′t accurately accomplish the user′s retriecal task. To solve the above problem, an image matching calculation method based on neural network is proposed. The correct mapping from image low?level feature to image classification is formed by means of sample automatic learning and user feedback learning. The neural network after learning can classify and retrieve the image automatically. This method is combined with the image low?layer feature description and user high?level semantics feedback to effectively recover the semantic gap. The whole process of neural network learning and image retrieval was realized by integrating the Web front end, image extraction module, neural network module and database module.
Keywords: image retrieval; feature extraction; neural network; machine learning; relevance feedback
在利用神经网络进行图像检索的过程中,图像的大小、精度及细节越来越丰富,信息含量相应的也越来愈多,当使用大量的信息进行神经网络的构建和训练时,所需的时间和成本都大大增加,并且神经网络的检索效率也会降低,这就使得其满足不了用户准确搜索图像的需求[1]。同时,随着神经网络技术的发展,可以利用各种改进技术提高神经网络的学习效率和预测准确率,使得利用神经网络来模拟人脑对图像的分类和检索可以得到更好的效果。
1 图像特征的提取
系统使用图像分割方法对图像的形状特征进行描述,提取图像中各个部分的形状特征。
1.1 形状特征的提取
使用K?均值聚类分割算法进行图像的分割。将图像分割后,由于每个簇中的像素在视觉特征上具有很强的相似性,因此对每一区域的特征进行简单的描述,提取相应的图像特征然后保存结果,并将其作为图像检索系统的区域特征库。系统针对不同的图像特征选取不同的方法进行描述:
(1) 区域颜色特征,提取该区域中像素点在Lab颜色空间中的均值来描述。
(2) 区域位置特征,提取该区域中像素点在二维空间中的坐标的平均值来描述。
(3) 区域纹理特征,提取该区域中像素的平均对比度及平均各向异性来描述。
(4) 区域形状特征,提取该区域的封闭轮廓,并将其分解为可由若干椭圆重构的由椭圆参数组成的序列,然后通过傅里叶描述符来描述该封闭曲线[2]。
1.2 颜色特征的提取
由于颜色直方图的限制,选择颜色相关图进行图像颜色的提取。图像的颜色相关图就是由所有颜色对进行索引的表,在表中[(i, j)]的第[m]个条目表示找到与颜色为[i]的一个像素点距离为[m]的颜色为[j]的一个像素点的几率。在计算颜色相关图时需采用一些并行计算,这样可以提高计算效率。
1.3 纹理特征的提取
通过对比基于Tamura纹理特征算法的检索程序、基于灰度?梯度共生矩阵算法的检索程序和基于Gabor小波变换算法,基于Tamura纹理特征提取算法的检索程序的查询准确率要比后两者都高,且其查询使用的时间也要少很多,因此系统选择采用Tamura纹理特征提取算法。
2 BP神经网络模型的搭建
2.1 BP神经网络特点
选择BP神经网络作为图像的神经网络分类器,其将[n]维图像底层视觉特征映射为图像的分类。通过实验对BP神经网络进行一些改进和优化,使其能有效地完成图像检索的任务。典型样本集的选择、学习复杂性、网络结构的选择、输入特征向量的选择、预测能力的极限都是需要在搭建BP神经网络时需要考虑的问题[3]。
2.2 BP神经网络的原理及拓扑结构
基于BP神经网络相关原理的学习与分析,确定了系统中BP神经网络的结构和构建过程:首先定义输入层、隐含层和输出层的神经元数目分别为[n,l]和[m,]则[(x1,x2,…,xn)]为网络的输入矢量,[(h1,h2,…,hl)]为隐含层神经元的输出矢量,[(y1,y2,…,ym)]为网络的实际输出矢量,同时定义[(d1,d2,…,dm)]为训练样本所对应的预期输出矢量。然后定义输出层神经元[i]与隐含层神经元[j]的连接权值为[Vij,]隐含层神经元[j]与输出层神经元[k]的连接权值为[Wjk,]隐含层神经元[j]的阈值为[b,]输出层神经元[k]的阈值为[c。]由于传递函数需要表示具有线性特性的输入信号与输出信号的联系,又根据BP神经网络要求传递函数必须连续可导,因此其一般使用在(0,1)之间连续并可导的Sigmoid函数作为传递函数,该函数公式为:
[f(x)=11-e-x] (1)
实际输出矢量与预期输出矢量的误差计算公式为:
[E=12j=1m(dk-yk)2] (2)
隐含层神经元输出矢量的计算公式为:
[hj=fj=1N-1Vijxi+?j] (3)
输出层神经元输出矢量的计算公式为:
[yk=fj=0L-1Wjkhj+θk] (4)
BP神经网络通过反向传播算法调整权值,其权值修正公式为:
[Wij(n+1)=Wij(n)+ηδjx′i] (5)
在式(5)中,[Wij(n)]表示第[n]次学习后的神经元[i]与神经元[j]之间的连接权值,信号输出的神经元为[i,]信号输入的神经元为[j,][Xi]为神经元[i]的实际输出,[η]为网络的学习速率,[δj]为神经元[j]的学习误差。
系统中BP神经网络的构建流程如下:
(1) 初始化网络的连接权值和阈值,其值为均匀分布的随机数。
(2) 对网络使用一组样例数据进行训练。
(3) 网络搭建完成,将输入矢量输入网络可仿真输出符合预期的输出矢量[4]。
2.3 BP神经网络的学习过程
通过对相关反馈算法的学习,提出了一种基于BP神经网络进行学习的图像检索方法,它包含两种学习过程:
(1) 自动样例学习,首先通过包含高层语义标注的样例图像的学习构建图像高层语义的分类器,其中对于图像的每种语义分别构造一个分类器,输入样例图像后使系统提取图像的底层特征作为神经网络的输入,然后经过一定时间的学习可以得到网络的解,使分类器能够初步完成分类任务;
(2) 用户交互学习,首先通过用户的指导,将初步检索结果进行分类,然后系统将用户的反馈整理为学习样本,同样使用自动样例学习过程进行学习,最后得出网络最新的解,使分类器能更精确地完成分类任务。系统中BP神经网络的学习流程如图1所示。
2.4 BP算法的改进
使用附加动量法可以使网络在修正连接权值时,不只考虑误差在其梯度上的变化趋势,还考虑误差在其曲面上的变化趋势。在没有附加动量的情况中,网络在训练过程中有可能陷入局部极小状态,通过使用附加动量则可以在一定程度上绕过这些极小值,避免进入极小状态[5]。附加动量法在反向传播过程中,在每一个神经元的连接权值及阈值的当次训练的变化量上附加一个正比于上次训练后的连接权值及阈值的变化量的项,根据新的变化量计算出新的连接权值及阈值。添加了附加动量因子的连接权值和阈值的变化量计算公式分别为:
[Δwij(k+1)=(1-mc)ηδjpj+mcΔwij(k)] (6)
[Δbj(k+1)=(1-mc)ηδj+mcΔbij(k)] (7)
式中:[k]表示第[k]次训练;[mc]表示动量因子,[mc]的取值一般在0.95附近。
在结合附加动量法的网络训练过程中,需要根据不同条件判断何时使用动量因子来修正权值,其判断条件为:
[mc=0,E(k)>E(k-1)×1.040.95,E(k)
式中[E(k)]为第[k]步的误差平方和。
自适应学习速率的调整公式为:
[η(k+1)=1.05η(k),E(k+1)E(k)×1.04η(k),etc] (9)
式中[E(k)]为第[k]步的误差平方和。
动量法可以帮助BP算法正确找到全局最优解,自适应学习速率法可以帮助BP算法缩短训练时间,通过这两种方法的使用,可以有效地提高神经网络的学习效果。
2.5 实验结果分析
实验目的为确定系统中BP神经网络分类器的隐含层神经元数目。首先根据研究获得的图像特征向量的元素个数构建神经网络分类器的学习样例,此处每个样例的输入向量的元素个数为165个,因此构建16组含有165个元素的输入向量,4个一组划分为一种类别,最终形成含有4种类别的16组训练样本,以此方法再生成该4种类别的4组测试样本。然后根据经验公式获得合适隐含层神经元数目的取值范围,此处为9~17个。最后将训练样本及测试样本先后输入隐含层神经元数目不同的网络中进行训练和测试,记录数据。
表1记录了隐含层神经元数目及对应的训练误差和测试误差的数据,由其数据可以看出,随着隐含层神经元数目的增加训练误差总体上逐渐减小,当个数超过15后训练误差出现一定程度的波动,出现小幅的增加,虽然不影响网络的学习效果,但是过多的神经元个数会增加学习时间,而此时测试误差还是处于降低的趋势。综合分析实验结果,本系统确定采用较合适的15个隐含层神经元。
3 检索系统的设计与实现
3.1 系统结构分析
3.1.1 系统结构
系统的结构如图2所示,图中除了与用户交互的Web前端,其余的图像特征提取模块、神经网络模块及数据库都在服务器端,这种浏览器?服务器结构平台搭建后,用户可以通过不同客户端的Web浏览器进行图像检索的功能,而不必安装本地应用程序,同时将主要的核心功能集中到服务器上,不仅大大简化了系统的开发和维护流程,降低了成本,还增强了系统的扩展性。
3.1.2 系统流程
系统针对不同的功能需求设计了相应的不同流程,这些流程包括系统样例学习流程、用户反馈学习流程、用户查询流程。
如图3所示,在系统的样例学习过程中,系统接收到样例数据后会先对数据进行分析,然后交给神经网络进行学习,最终生成对应类别的分类器,这些分类器会在用户检索时对数据库中的图像进行分类,查找到符合用户需求的图像[6]。样例学习的流程是本系统学习分类知识的关键步骤,在该步骤中用户并不参与系统的学习过程,整个学习过程均为系统自动进行,因此需提供大量被正确标注的清晰图像样例,通过对这些优质样例的学习,系统会自动生成针对图像各种分类所对应的分类器,且经过长时间的学习,这些分类器的准确率会不断上升,最终使查询结果更符合用户需求。
如图4所示,在系统的用户查询流程中,用户的查询条件为图像特征的语义描述,系统最终返回为包含该描述特征的图像集,这个过程利用神经网络分类器学习的高层描述语义与低层图像特征之间的映射,因此随着神经网络学习时间的增大,这种映射也就越精确,系统完成的查询也就越符合用户要求。
3.1.3 图像特征提取模块
如图5所示,当图像输入到图像特征提取模块中时,图像会进行K?均值聚类分割算法处理、颜色相关图算法处理及Tamura纹理特征算法处理,这三个处理过程并行进行。
经过K?均值聚类分割算法处理,图像被分割为若干块区域,每个区域中的像素都具有相似的属性,对于每个区域,会提取其简单的区域特征,如颜色特征、位置特征、纹理特征及形状特征等;经过颜色相关图算法处理,生成当前图像的颜色自相关图;经过Tamura纹理特征算法处理,计算出图像的粗糙度、对比度、方向度、线性度等数值。将经过三个算法处理后得到的数值整理后得到图像的特征向量[7]。
3.1.4 神经网络模块
系统中的图像神经网络分类器由三层组成,分别为输入层、隐含层及输出层,其中输入层的神经元个数与归一化后的图像特征向量的个数相同,为固定值;隐含层的神经元个数通过前文中的实验得出,适合于本系统中神经网络的要求;输出层只有一个神经元进行分类,设定1为属于该分类的学习期望,设定0为不属于该分类的学习期望,但是实际运行时需要设定1为0.9,0为0.1,这是因为Sigmoid函数无法经过有限的连接权值计算得到1与0的值[8]。
3.1.5 Web 平台模块
系统的Web界面包括用户查询输入框、用户图像上传框、查询结果浏览框等。
3.2 实验结果分析
为了检验图像检索平台的性能,首先将系统设置为学习模式,然后从图像库中选取1 000幅已进行人工标注的样例集输入系统,最后当系统发出已训练完毕信号后,对系统已学习的分类当作查询输入系统进行检索,记录系统检索结果。
检索结果可知经过人工指导学习,系统可以仿真模拟更符合人类视觉感知的分类方式,并将其记忆于相应的神经网络分类器中,经过不断的学习,系统可以返回更准确的符合用户需求的检索结果。
4 结 论
本文主要研究包括基于内容的图像检索技术及人工神经网络技术两个方面。首先使用K?均值聚类分割算法、颜色相关图算法及Tamura纹理特征提取算法提取图像相应的形状、颜色及纹理特征,通过整合形成可以完整描述图像信息的特征向量。同时,针对基于内容的图像检索系统中用户高层语义与图像底层特征之间存在的问题,通过样例自动学习和用户反馈学习两种学习方式,BP神经网络通过反向传播学习算法调节网络权值,从而形成图像底层特征到图像分类的正确映射,学习后的神经网络通过这种映射可以进行图像的自动分类及检索,该方法结合了图像的底层特征描述及用户的高层语义反馈,有效地弥补了语义鸿沟。
参考文献
[1] KHERFI M L, ZIOU D. Relevance feedback for CBIR: a new approach based on probabilistic feature weighting with positive and negative examples [J]. IEEE transactions on image processing, 2006, 15(4): 1017?1030.
[2] TRAINA A J M, MARQUES J. Fighting the semantic gap on CBIR systems through new relevance feedback techniques [C]// Proceedings of 2011 the 21th IEEE International Symposium on Computer?Based Medical Systems. [S.l.]: IEEE, 2006: 881?886.
[3] 周资云.基于内容的图像检索系统研发与应用[J].华章,2012(29):22.
[4] 刘丽,匡纲要.图像纹理特征提取方法综述[J].中国图象图形学报,2013,14(4):622?635.
[5] KANUNGO T, MOUNT D M, NETANYAHU N S, et al. An efficient k?means clustering algorithm: analysis and implementation [J]. IEEE transactions on pattern analysis and machine intelligence, 2002, 24(7): 881?892.
[6] WILLIAMS A, YOON P. Content?based image retrieval using joint correlograms [J]. Multimedia tools and applications, 2007, 34(2): 239?248.
神经网络特征范文6
关键词:人工神经网络;故障诊断;水泵
中图分类号:TU
文献标识码:A
文章编号:1672-3198(2010)04-0295-02
1 人工神经网络理论应用于水泵故障诊断研究的理论意义
采用人工神经网络(ANN)技术解决机械故障诊断问题的主要着眼点在于:
(1)ANN的大规模分布式并行处理能力,适于解决复杂的诊断问题。
(2)ANN具有较强的非线性处理能力,适宜于解决故障诊断中复杂的非线性模式识别问题。
(3)ANN具有任意复杂映射的强有力的逼近能力,适宜于解决故障领域中的预测与控制问题。
水泵工作故障往往表现为工作平稳性恶化、振动加剧以及噪声增大,这往往又是衡量机器制造质量和工作性能的重要指标。本文以某型号离心泵为对象,通过测取故障振动信号来进行故障诊断。
水泵转子由于制造误差、装配不当或在不适当的条件(载荷、等)下使用,常会发生以下故障:①转子不平衡;②不对中;③油膜涡动。而这些故障将会使轴承的旋转精度降低,产生振动、噪声,增加轴承旋转的阻力,最终将使轴承受到阻滞或卡死,造成整个工业系统的失效。振动中不平衡、不对中以及油膜涡动占整个故障发生率的80%。因此对上述故障进行诊断具有非常重要的意义。
神经网络之所以适合于故障诊断,是因为神经网络具有以下优越性:自组织和自学习能力可以根据对象的正常历史数据训练神经网络,然后将此信息与当前测量数据进行比较,以确定故障;联想记忆神经网络具有滤出噪声及在有噪声情况下得出正确结论的能力,可以训练神经网络来识别故障信息,使其能在噪声环境中有效地工作,这种滤除噪声的能力使得神经网络适合在线故障检测和诊断;非线性映射能力神经网络对于高维空间模式识别和非线性模式识别问题的分类精度高,具有分辨故障原因及类型的能力,这为实现故障诊断奠定了基础。因此,神经网络理论在故障诊断领域显示出了极大的应用潜力。本文将新兴的神经网络理论应用于水泵的故障诊断和状态检测,以某型号水泵的实测数据为例,对神经网络模型进行训练分析,取得了令人满意的结果,具有实际应用价值。
2 人工神经网络应用于水泵故障诊断技术的实现
2.1 样本数据的获取
实验采用便携式Dasylab测试系统进行测试,在现场对三种故障进行模拟,将数据信号存储在磁盘中,得到水泵三种故障:(1)转子不平衡;(2)转子不对中; (3)油膜涡动的时域曲线和频域曲线。对各个故障的频域曲线,提取了五个不同频率的幅值作为描述水泵故障的特征值,并把这组特征值作为输入量。
2.2 特征提取
要从样本中提取对诊断故障贡献大的有用信息,这一工作就是特征提取。特征提取就是利用已有特征参数构造一个较低维数的特征空间,将原始特征中蕴含的有用信息映射到少数几个特征上,忽略多余的不相干的信息,从数学意义上讲,就是对一个n维向量X=[x1.x2,…,xn]T进行降维变换成低维向量Y=[y1,y2,…,yn]T,m
由于水泵设备总是运行在噪声、电磁干扰等环境中,在振动信号分析与处理方法中,常用快速傅立叶(FFT)变换对振动信号进行频谱分析。
2.3 样本数据的预处理
原始样本数据不宜直接作为神经网络输入,那会使网络连接权值相差极大,使网络输出性能变得不稳定。因此在输入网络前通常需要将数据进行预处理。为了一开始就使各变量的重要性处于同等地位,神经网络学习和测试时要对提取的数据进行归一化处理,即:令
x′i=xi-xminxmax-xmin(1.1)
xi――不同频率下的幅值
xmin――最小幅值xmin=min(xi)
xmax――最大幅值xmax=max(xi)
这样,网络所有输入都在[0, 1]内。
2.4 水泵故障诊断神经网络模型结构
由于故障机理(故障征兆和故障原因之间的关系)往往隐含于故障实例之中,通过一些故障实例(称为故障样本)对神经网络进行训练学习,可以建立起系统的故障诊断模型,而故障诊断的推理规则隐含于神经网络的网络拓扑结构和网络权值之中。
多层前馈神经网络的输入和输出之间的关系,可以看成是一种映射关系,这种映射是一个高度非线性映射,如果输入节点数为L,输出节点数为N,网络是从L维欧氏空间到N维欧氏空间的映射。三层神经就已经能够逼近任意函数了,因此,水泵故障诊断神经网络采用三层结构即输入层、输出层和隐含(中间层)。通过有监督的训练方法训练网络权值。
(1)输入层设计。
特征参数组成特征向量,特征向量作为网络输入。所以,特征参数选取的正确与否直接影响到网络的性能。
通常,选取的方法应该通过理论分析、专家经验、试验找出对水泵性能影响较大,同时对各种故障都有较明显反应的变量作为特征参数,然后将这些特征参数组成特征向量,经过数据的预处理,作为BP网络的输入。第二章通过水泵故障机理的分析可以发现5个参数在故障情况下变动明显。因此,本文选取以上5个参数作为BP网络的输入参数。
输入层中神经元节点的个数对应着上述状态特征描述参数矢量或数组。通过对水泵故障的分析,提取了频域曲线中五个不同频率的幅值作为描述水泵故障的特征值,并把这组特征值作为输入量,所以水泵故障诊断神经网络的输入单元为5个。
(2)输出层设计。
网络输出向量,通常是具体问题的目标结果。本文的目的是判断某一状态下处于何种故障,输出层中神经元节点的个数对应于神经网络要识别的故障模式矢量或矩阵。本故障诊断神经网络需要对不平衡、不对中和油膜涡动三种故障进行识别。因此水泵故障诊断神经网络的输出为3个单元。
如以上所述,BP神经网络的输入神经元有5个,输出神经元有3个。隐层神经元数目是由训练样本数目决定的。
(3)中间层设计。
中间层数及其神经元节点的个数与输入的技术特征参数的复杂程度及所需识别的故障模式种类有关。当输入模式和输出模式相当不同时,就需要增加中间层,形成输入信号的中间转换。处理信号的能力随层数的增加而增加,如果有足够的中间层单元,输入模式也总能转换为适当的输出模式。一般来说,还没有任何理论根据采用两层以上的中间层。对大多数的实际问题来说,一层中间层即三层网络己经足够了。根据经验,采用两层以上的中间层几乎没有任何益处。采用越多的中间层,训练时间就会急剧增加,这是因为中间层越多,误差向后传播的过程计算就越复杂,使训练时间急剧增加。另外中间层增加后,局部最小误差也会增加,网络在训练过程中,往往容易陷入局部最小误差而无法摆脱,网络的权重难以调整到最小误差处。
根据试验的需要和具体的分析,本研究所建立的网络为一层中间层,确定中间层以后的一个重要问题是选择适当的中间层处理单元。可以说,选用中间层单元数往往是网络成败的关键,因为中间层处理单元数选用太小,则网络所能获取的用以解决问题的信息太少,难以处理复杂的问题;但若中间层处理单元数过多,不仅使网络的训练时间急剧增加,难以在人们所能接受的时间内完成训练,更重要的是过多的中间层处理单元还可能出现所谓“过度吻合”问题。也就是说,如果网络具有过多的信息处理能力,甚至把训练集中一些无关紧要的非本质的东西,也学的惟妙惟肖时,则网络就难以分辨数据中真正的模式。
一般来说,中间层单元数可根据下式确定,
n1=n+m+α
式中n1――中间层单元数 m――输出层单元数 n――输入层单元数
α――1-10之间的整数
本文中,m取3,n取5,根据上面公式中间层单元数n1取5。从而该水泵故障诊断神经网络结构如图所示。
图1
2.5 神经网络关键程序实现
(1)创建网络。
使用newff()函数创建网络,网络参数设置如下:
隐藏层神经元设置为5,输出层神经元个数为3,根据神经网络的要求和所要达到的网络输出目的,选择输入层到隐藏层间的传递函数为tansig,即S型的正切函数,隐藏层到输出层间的传递函数为logsig型函数,即为S型的对数函数。
使用训练函数trainlm来训练网络。
(2)设置训练次数。
将训练次数设置为1000次。
(3)设置学习效率。
学习速率决定每一次循环训练中所产生的权值变化量,用η表示。η较大时,权值的变化量就较大,学习速率比较快,但有时会导致振荡。η较小时,学习速率慢,然而学习过程平稳。这样,在实际的学习过程中,可以将η值取为一个与学习过程有关的变量,并且在学习刚开始时η值相对大,然后随着学习的深入,η值逐渐减小。在一些简单的问题中,η可取为一个常数,满足0
(4)网络训练。
使用学习样本和目标向量训练网络,P和T分别设为训练样本向量和目标向量。
(5)诊断测试。
利用待诊断数据样本P_test,使用sim()函数实现测试。
3 结束语
本文采用Dasylab测试软件采集故障信号,以信号频谱中各阶倍频和分频作为智能诊断的特征因子,提取故障样本,进行BP网络的训练。利用MATLAB建立了水泵故障诊断神经网络学习和诊断程序,实现了基于人工神经网络理论的某型号水泵故障诊断模型。结果表明,本神经网络故障诊断模型不仅克服了传统诊断方法的弊端,而且大大提高了水泵故障诊断的准确率和诊断效率。
参考文献
[1]廖伯瑜.机械故障诊断基础[M].北京:冶金工业出版社,2003:1-36.
[2]田景文.工神经网络算法研究及应用[M].北京:北京理工大学出版社,2006:70-90.
[3]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006:50-85.