前言:中文期刊网精心挑选了神经网络的训练方法范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络的训练方法范文1
关键词:风电机组;matlab;人工神经网络;风功率预测
1 风电功率预测模型
1.1 径向基神经网络
神经网络算法是近年来发展起来的一种新型人工智能算法。不同于以往的数学算法,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型,具有自学习、自适应和自组织能力的特点。
径向基神经网络(即RBF神经网络)是一种三层前向网络,由输入层、隐含层和输出层组成,网络结构如图1所示。由输入到输出的映射是非线性的,而隐含层到输出层是线性的,从而大大加快了学习速度并避免局部极小问题。
根据径向基函数中心选取方法的不同,RBF神经网络有很多学习方法,如随机选取中心法、梯度训练法、有监督选取中心法和正交最小二乘法等。这里,选用梯度训练法作为RBF神经网络的学习方法。
1.2 梯度训练方法
RBF网的梯度训练方法是通过最小化目标函数实现对各隐节点数据中心、扩展常数和输出权值的调节。使用一种带遗忘因子的单输出RBF网学习方法,此时神经网络学习的目标函数为:
(1)
其中,?茁j为遗忘因子,误差信号ej的定义为:
(2)
由于神经网络函数F(X)对数据中心ci、扩展常数ri和输出权值wi的梯度分别为:
(3)
(4)
(5)
考虑所有训练样本和遗忘因子的影响,ci、ri和wi的调节量为
(6)
(7)
(8)
其中,?椎i(Xj)为第i个隐节点对Xj的输出,?浊为学习速率。
1.3 数据归一化
数据归一化是神经网络预测前对数据常用的一种处理方法。数据归一化处理将所有数据都转化为[0,1]之间的数,其目的是取消各维数据间数量级别差,避免因为输入输出数据数量级差别较大而造成神经网络预测误差较大。
风速归一化:应用多年统计的极限风速对风速数据进行归一化处理
(9)
其中,Vg为归一化处理后的风速标量值;vt为应用于预测的历史风速值;vmax为风场气象观测到的历史最大风速,如不超过风场风机最大切除风速,则取为风机的切除风度。
风功率归一化:根据风电机组额定功率,采用与风速归一化相同的方式,对风电机组历史出力情况进行归一化,并对网络预测的输出功率进行反归一化,得到预测结果。
1.4 神经网络的构建
首先挑选几组数据风功率作为样本,将每个样本的前n个风速和风功率值进行归一化处理,将处理后的数值作为RBF神经网络的输入;可将每个样本的后n个风速和风功率值进行归一化处理,将处理后的数值作为RBF神经网络的目标输出,通过对RBF神经网络的训练学习,实现从输入空间到输出空间的映射。
2 短期风功率预测结果
将前10天的风功率数据作为训练样本,对风机功率提前1小时进行预测。图2预测风功率与实测风功率比较可知,可以看到神经网络预测风功率变化趋势与实际风功率变化基本趋势一致,并且预测功率比实际功率变化平缓。
神经网络在风功率预测时,每点的预报误差不尽相同,这主要与早晚温差造成的风速突然变化以及当天天气变化情况等有关,从预测曲线的总体趋势以及与实际曲线误差值大小来看,该神经网络模型预测结果基本令人满意。
3 结束语
采用人工神经网络进行预测精度较高、训练速度快,适用于在线预测的场合。但是由于所用训练数据为风速相对平稳时期的数据,所以该模型对于突变风速的处理能力仍然有限,为提高预测结果的精度,还需对模型进行进一步改进。总体而言,通过建立神经网络模型,对短期风功率进行预测,虽有一定局限性,但其预测精度满足工程要求。
参考文献
[1]Tony Burton,等.风能技术[M].北京:科学出版社,2007.
神经网络的训练方法范文2
[关键词]小生境遗传算法神经网络股票预测
一、引言
股票和股票市场对国家企业的经济发展起到了积极的作用,如可以为投资者开拓投资渠道,增强投资的流动性和灵活性等。但股票价格的形成机制是颇为复杂的,股票价格既受到多种因素,诸如:政治,经济,市场因素的影响,亦受技术和投资者行为因素的影响,个别因素的波动作用都可能会影响到股票价格的剧烈波动。因此,股票价格和各影响因素之间很难直接建立明确的函数关系表达式。针对这一情况,将可有效处理非线性问题的神经网络引入到股票价格的预测中来,但神经网络收敛慢,易陷入局部极小点,出现振荡,鲁棒性差。所以有的学者用遗传算法(GA)来优化神经网络,这种神经网络可能获得个别的甚至局部的最优解,即GA早熟现象。本文引进能较有效地保持种群多样性的小生境遗传算法(NGA),采用NGA优化与用GA优化的BP网络权值进行对比,证实了NGA的判别准确性和寻优能力。
二、小生境遗传算法优化的神经网络
1.BP神经网络
反向传播(BP)算法又称为误差逆传播校正方法,它是1974年P.Werbos(哈佛大学)提出的。BP算法用来训练多层前馈神经网络,属于监督学习算法。BP网络具有结构清晰,易实现,计算功能强大等特点。因而是目前最常见,使用最广泛的一种神经网络。但是在实际应用中,传统的BP算法存在以下问题:收敛速度慢;若加快收敛速度易产生振荡;存在局部极小和平台问题;泛化能力差;隐节点数和初始值的选取缺乏理论指导;未考虑样本选择对系统学习的影响等。所以很多学者提出许多改进的方法,用小生境遗传算法优化神经网络权值的神经网络来预测股票价格。
2.小生境遗传算法
小生境遗传算法(IcheGeneticalGorihm)的基本思想是:首先比较任意两个个体间的距离与给定值的大小,若该距离小于给定值,则比较其适应值大小。对适应值较小的个体施加一个较强的惩罚,极大地降低其适应值。也就是说,在距离L内将只有一个优良个体,从而既维护了群体的多样性,又使得各个体之间保持一定的距离,并使得个体能够在整个约束空间中分散开来。
3.神经网络连接权的优化
用小生境遗传算法可以优化神经网络连接权,神经网络结构,学习规则等,这里我们对神经网络的连接权进行优化,具体步骤如下:
(1)随机产生一组权值分布,采用某种编码方案对该组中的每个权值(或阈值)进行编码,进而构造出一个码串(每个码串代表网络的一种权值分布),在网络结构和学习规则已确定的前提下,该码串就对应一个权值和阈值取特定值的一个神经网络。
(2)对所产生的神经网络计算它的误差函数,从而确定其适应度函数值,误差越大,则适应度越小。
(3)选择若干适应度函数值最大的个体,直接遗传给下一代。
(4)利用交叉和变异等遗传操作算子对当前一代群体进行处理,产生下一代群体。
(5)重复(2)(3)(4),使初始确定的一组权值分布得到不断地进化,直到训练目标得到满足为止。
这种由小生境遗传算法训练神经网络的方法也可以称做混和训练法。将基于小生境遗传算法的遗传进化方法和基于梯度下降的反传训练相结合,这种训练方法吸取两种方法的各自特点,所以收敛速度快。
三、股票价格预测仿真
根据经验选取输入预测日前四天开盘价、收盘价归一化后做为作为输入量,输出为第五天收盘价归一化数值。所以,本文采用神经网络结构为(8,5,1),即网络的输入层6个节点,隐含层9个节点,输出层1个节点。本文选择了“XDG新梅(600732)”从2006年3月14日到2006年7月1日数据进行了仿真。利用MATLAB6.5编程,取70组训练样本和30组测试样本。如图(1)表示用遗传算法和小生境遗传算法对神经网络的权值进行优化时,误差曲线变化;从图中可以看出,小生境遗传算法收敛速度要快;图(2)表示股票预测值和实际值比较,从图中可以看出,遗传算法和小生境遗传算法对神经网络的权值的模型进行股票价格的预测,都能预测出股票走向趋势,但是,后者的预测精度显然要比前者高。
四、结束语
股票市场的不确定因素太多,股票的价格更是多种因素影响的集合体,是典型的非线性动力学问题。股票价格的中长期准确预测很难。本文建立了用小生境遗传算来优化神经网络模型来预测股票价格,结果表明,这种方法比单用遗传算法优化的神经网络收敛速度快,预测精度高。对于股票价格预测具有较好的应用价值。
参考文献:
[1]龙建成李小平:基于神经网络的股票市场趋势预测[J].西安电子科技大学学报(自然科学版.2005.3(32):460-463
[2]王波张凤玲:神经网络与时间序列模型在股票预测中的比较[J].第27卷第6期武汉理工大学学报·信息与管理工程版.2005.9(27):69-72
神经网络的训练方法范文3
[关键词] 神经网络 RBF 股票 预测
一、引言
股票市场是国民经济的晴雨表,其作用不仅被政府所重视,更受到广大投资者的关注。对投资者来说,未来股价变化趋势预测越准确,对利润的获取及风险的规避就越有把握;对国家的经济发展和金融建设而言,股票预测研究同样具有重要作用。因此对股票内在性质及预测的研究,可以帮助投资者更好地预测和分析股市,优化组合投资,降低投资风险,获得最大收益,具有重大的理论意义和诱人的应用前景。
自股票出现以来,股票预测便受到学术界的广泛关注与积极研究,国内外许多学者对其进行了研究,提出了许多预测分析方法。如:证券投资分析方法、时间序列分析法、专家评估法、马尔可夫法等等。自20世纪90年代初至今,人工智能得到了很大的发展,特别是神经网络的研究取得了划时代的进展,并且应用于各个领域。在金融领域,以欧美为中心,很多学者开展了神经网络的研究与应用。本文利用上海证券综合指数(下称“上证综指”)400多个交易日的每日收盘价作为样本,建立神经网络模型,并尝试进行预测。
二、神经网络
1.人工神经网络简介
人工神经网络(Artificial Neural Network),亦称神经网络,是由大量处理单元(神经元Neurons)广泛互联而成的网络,是对人脑的抽象、简化和模拟,反映人脑的基本特性。人工神经网络的研究是从人脑的生理结构出发来研究人的智能行为,模拟人脑信息处理的功能。人工神经网络是由简单的处理单元所组成的大量并行分布的处理机,这种处理机具有存储和应用经验知识的自然特性,它与人脑的相似之处概括为两个方面:一是通过学习过程利用神经网络从外部环境中获取知识;二是内部神经元(突触权值)用来存储获取的知识信息。
从神经网络的基本模式看,主要类型有:前馈型、反馈型、自组织型及随机型网络。近几年由于模糊、分形及小波理论与神经网络的结合分别形成了模糊神经网络、分形神经网络及小波神经网络。
2.BP神经网络
目前,在众多神经网络中,误差反向传播(Error Back Propagation)网络由于其良好的逼近能力和成熟的训练方法而得到了最为广泛的应用。BP网络由Rumelhart等人于1985年建立,它是一种多层前馈神经网络,由一个输入层、一个输出层和若干个隐含层所组成。位于同一层的单元之间不允许有连接,各层的单元只能向高层的单元输出激活信号。BP网络采用有教师的学习规则,其算法的核心是通过一边向后传播误差,一边修正误差的方法来不断调节网络参数(权、阈值),以实现或逼近所希望的输入、输出映射关系。
3.径向基神经网络
RBF(Radial Basis Function)神经网络是一种由输入层、隐含层和输出层组成的神经网络。RBF网络是采用一组正交归一化的径向基函数的线性组合来逼近任意函数。从输入层到隐含层通过径向基函数完成非线性变换;而隐单元到输出空间是线性映射的,因此输出层权值的调整可通过线性规划方程直接算出,大大加快了学习速度,避免了局部极小问题。Broomhead和Lowe[2]1988年首次将径向基函数用于神经网络设计。Light[3]和Powell[4]证明了RBF网络能够逼近任意紧集上多变量连续函数到任意精度,因此,RBF网络具有优良的特性。
RBF网络不仅收敛快,而且拟合误差小。而BP网络由于隐层激活函数是全局的,如果要进一步提高拟合精度,需要增加隐层单元数或选择多个隐层结构的网络,但这样很容易导致拟合的局部振荡,影响网络的泛化能力。本文选用RBF神经网络进行大盘指数的预测研究。
三、上证指数的RBF神经网络预测
1. 建立网络模型
为建立神经网络模型,现假设上证指数的日收盘受到前10天的收盘价影响。使用RBF神经网络模型对上证指数时间序列进行预测,步骤如下:
(1)选取样本数据。选取2005年5月12日至2007年4月13日,共470个交易日的上证指数收盘价作为样本数据。将前440个交易日的数据作为训练数据,后30个交易日的数据作为预测和验证数据。
(2)数据预处理。为了提高RBF网络的准确度,将数据进行归一化处理,即将所有数据线性映射到[-1,1]中。
(3)建立RBF网络并训练。将10个交易日的数据作为网络的输入,后10个交易日数据作为输出,共得到44组训练数据。
(4)预测数据验证。将测试数据输入训练好的网络,得到预测结果,并与真实数据进行比较。根据拟合程度和运算时间调整网络参数Spread的值,获得更好的效果和性能。拟合程度采用平均预测误差衡量:
(1)
2. 训练结果
RBF神经网络的Spread参数经过反复的训练和预测测试,选为430500。此时的RBF网络训练结果如图2所示。
3. 预测结果
推广能力(Generalization)是衡量神经网络性能好坏的重要标志。所谓推广能力,就是指神经网络对训练样本以外的新样本数据的正确反映能力。一个“过度训练”(Over fitted)的神经网络可能会对训练样本达到较高的匹配效果,但对于一个新的输入样本矢量却可能会产生与目标矢量差别较大的输出,即神经网络不具有推广能力或推广能力较差。
网络设计完成后,要运用样本集进行训练。对推广能力的测试不能用训练集的数据进行,而要用训练集以外的测试数据来进行检测。使用训练好的RBF神经网络对2007年3月5日至4月13日的上证综指进行预测,共计30个交易日,结果如图3所示。
平均预测误差为1.4467%,可见,此神经网络具有良好的预测效果。此时,RBF神经网络的训练拟合效果并不是最优的。一般地,为了取得更好的拟合效果,Spread参数应该较小,但太小的Spread参数会导致严重的训练过度问题,因此要综合考虑训练和预测的误差,以保证神经网络的推广能力。
四、结论与展望
利用神经网络的非线性映射,可以实现任意数据的函数逼近,而无需明确模型的细节。文中用RBF神经网络实现了对上证指数的预测,模型具有良好的推广能力,对证券市场的预测具有一定的参考价值。对于本文的实例数据,RBF神经网络比BP神经网络(实验中使用Levenberg-Marquart算法)拥有更快的拟合速度和更好的预测结果。由于股票市场的特殊性,虽然BP神经网络训练拟合效果要大大好于RBF神经网络,但是预测结果非常不理想,预测数据完全无法反映数据的真实情况。限于篇幅,BP神经网络和RBF神经网络的比较不再赘述。
近年来,国内外的学者都在试图研究更为有效的经济预测方法,以提高预测的质量和效率。神经网络的优良特性越来越多地吸引了人们的目光,将在更广泛的领域中得到应用。
参考文献:
[1] 曾昭才 段虞荣 段绍光: 基于径向基函数网络的混沌时间序列分析[J]. 重庆大学学报(自然科学版),1999,22(6):113-120
[2] Broomhead D S,Lowe D. Multivariable functional interpolation and adaptive networks [J]. Complex System,1988,2:321-355
神经网络的训练方法范文4
关键词: BP神经网络; 模拟电路; 故障特征; 故障诊断
中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2013)16?0009?03
客观世界信号的本质决定了模拟电路的普遍性和不可替代性。模拟电路由于故障模型复杂、元件参数的容差、非线性、噪声以及大规模集成化等现象使电路故障信息表现为多特征、高噪声、非线性的数据集,且受到特征信号观测手段、征兆提取方法、状态识别技术、诊断知识完备程度以及诊断经济性的制约,使模拟电路的故障诊断技术滞后于数字电路故障诊断技术而面临巨大的挑战。而神经网络是对生物神经系统的功能抽象,以分布方式存储信息,有很强的容错能力和自学习能力,能够对网络的输入产生联想输出,具有处理模糊信息的能力[1],其理论研究和实际应用进入了一个蓬勃发展的时期[2]。
1 BP神经网络
1.1 BP网络模型
多层网络学习算法训练的神经网络即BP神经网络。BP网络的信息从输入层流向输出层,因此是一种多层前馈神经网络。由BP神经元构成的二层网络如图1所示[2]。由于BP网络神经元采用的传递函数通常是可微函数,所以可以实现输入和输出间的任意非线形映射[3],因此在诸如模式识别、状态预测等很多方面应用十分广泛。
1.2 BP学习规则
BP算法由两部分组成:信息的正向传递与误差的反向传播。在正向传播过程中,输入信息从输入经过隐含层逐层计算传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层没有得到期望的输出,则计算输出层的误差变化值,然后转向反向传播,通过网络将误差信号沿原来的连接通路反向回来修改各层神经元的权值直至达到期望目标[4]。
2 故障特征提取
2.1 故障特征提取概述
随着电路结构日趋复杂,其故障类别越来越多,反映故障的状态、特征也相应增加[5]。在实际诊断过程中,要使诊断结果正确可靠,都是通过搜集尽可能全面的样本,这样才能得到接近完整的故障信息。但是样本太多,会消耗过多的存储空间和计算时间,大量的特征输入也会导致训练过程减缓,甚至阻碍训练的收敛,最终影响故障定位精度。所以,需要从样本中提取对诊断故障贡献大的有用信息,即特征提取[6]。
特征提取方法很多,一般有主元特征提取和基于Fisher的线性变换相关识别分析法。实际应用中,要达到高分辨率信息压缩所需的映射通常是非线性的[7],因此多分辨分析适于模拟电路的特征提取。
2.2 基于多分辨分析的故障特征提取
一般模拟电路软故障的变化是很小的,利用小波变换来提取各频带的故障信息,分解过程用Matlab算法实现,可以用高频分解的部分来反映信号的变化,故可将故障信号的高频系数序列进行绝对值求和,并按尺度顺序排列,作为模拟电路故障特征向量[8]。具体步骤如下:
(1)对信号进行N层Matlab分解,得到N个高频小波分解系数序列[9]:[d1,d2,…,dn];
(2)对各层高频系数序列求绝对值和,则有[Dj=i=1ndji],其中n为序列dj中分量的个数[9];
(3)特征向量构成,按尺度顺序,以各层高频小波分解系数序列的绝对值之和为元素作为特征向量[9]:[D1,D2,…,Dn];
(4)为了提高神经网络收敛速度,进行归一化处理。
3 BP神经网络应用于模拟电路故障诊断
BP网络应用于电路故障诊断是以一些电路的典型故障样本送入神经网络训练,使之有判断能力,而成为故障识别系统。其工作步骤如下:
(1)确定待测电路的故障集和故障模式特征参量,在电路考虑元件容差的情况下, 对电路的可能的故障状态用PSPICE分析得出各故障发生时节点电压和电流的测量值[10],归一化处理后构成训练样本集。
(2)设计BP神经网络并训练。根据要求和经验设计神经网络的结构、传递函数以及训练算法。然后用训练样本集中的样本训练好网络,即完成学习的过程[11]。
(3)一般采用3层BP神经网络,输入层节点数与电路状态特征参量的维数相同,输出层节点数可与电路待测故障类别数相同,也可小于待测故障类别数(采用编码指示对应故障)[11]。
4 诊断实例及仿真
本文的诊断电路选自ITC’97的国际标准电路CTSV(continuous?time state?variable filter)滤波器[12],如图2所示。其标称值分别为R1=R2=R3=R4=R5=10 kΩ,R6=3 kΩ,R7=7 kΩ,C1=C2=20 nF,输入幅度为1 V的交流信号。
考虑到各元件的容差,将电阻的容差设为5%,电容的容差设为10%,当输入为1 V的交流信号时,对输出响应进行1~100 kHz采样,采用Haar小波对采样信号进行5层小波分解,将电路用PSpice进行直流灵敏度分析,从结果可知,当R1,R3,C1,C2变化时,输出波形Vout变化较大,所以考虑有8种故障:R150%,R150%,R350%,R350%,C150%,C150%,C250%,C250%,还有正常状态共9种故障模式,故障模式采用常见的“n?1”表示法,即0表示正常,1表示故障。
(1)为构造训练和测试样本集,对电路每种故障状态进行50次蒙特卡洛分析,其中40次作为训练样本,10次作为测试样本,电路正常情况下的采样信号曲线如图3所示。
(2)将其作为传统BP神经网络的输入,目标误差0.05,其误差变化曲线如图4(a)所示。
(3)将其各层小波分解序列的能量值归一化后作为神经网络的输入,同时可以确定神经网络的结构6?13?8,神经网络采用LM算法的训练方法,目标误差为0.01,网络经过164次训练调整后达到了期望的均方误差,误差变化曲线如图4(b)所示,测试样本的平均正确诊断率达98.89%,诊断结果如表1所示。
(4)将其作为传统BP神经网络的输入,目标误差0.05,经训练调整后误差变化曲线如图5(a)所示。
(5)将其经小波多层分解预处理后输入,目标误差为0.01,网络经过110次训练调整后达到了期望的均方误差。误差变化曲线如图5(b)所示。
总测试样本的平均正确诊断率达95.6%,诊断结果如表2所示。
表2 多软故障测试样本的神经网络诊断结果
5 结 语
本文采用多分辨分析故障提取和神经网络相结合的方法,首先通过PSpice采集故障样本集,将其归一化后作为神经网络的输入,这是传统的神经网络的方法,再由多分辨分析故障特征将样本集进行处理,然后运用神经网络对处理后的故障特征进行学习、训练,将两种方法进行对比后发现,经多分辨分析处理后训练的网络故障特征的覆盖率高,收敛速度明显提高,最终达到诊断的目的。仿真实验表明该方法能够有效地解决单软故障和多软故障的故障诊断问题。
参考文献
[1] 赵军容,石秀华,王永虎,等.基于灵敏度分析的模拟电路故障特征优化[J].弹箭与制导学报,2007,27(5):262?263.
[2] 周开利,康耀红.神经网络模型及其Matlab仿真程序设计[M].北京:清华大学出版社,2005.
[3] 厉芸,何怡刚,徐卫林,等.基于BP神经网络的大规模电路模块级故障快速诊断方法[J].电路与系统学报,2005,10(4):13?14.
[4] AMINIAN M, AMINLAN F. Neural?network based analog?circuit fault diagnosis using wavelet transform as preprocessor [J]. IEEE Transactions on Circuits and Systems Ⅱ: Analog and Digital Signal Processing, 2000, 47(2): 151?156.
[5] KAMIN E D. A simple procedure for punning back propagation trained neural networks [J]. IEEE Transactions on Neural Network, 1990, 1: 239?242.
[6] 袁海英,陈光,谢永乐.故障诊断中基于神经网络的特征提取方法研究[J].仪器仪表学报,2007,28(1):90?94.
(上接第11页)
[7] 虞和济,陈,张省,等.基于神经网络的智能诊断[M].北京:冶金工业出版社,2000.
[8] 李明亮.基于神经网络的模拟电路故障诊断方法研究[D].北京:中国地质大学,2007.
[9] 秦志强,黄继达,王晨宇,等.Matlab结合PSpice在模拟电路故障特征提取中的应用[J/OL].[2009?12?01].http:///releasepaper/content/200912?17.
[10] 胡惟文,何怡刚.基于神经网络的模拟电路故障诊断[J].湖南文理学院学报:自然科学版,2004:16(2):40?41.
神经网络的训练方法范文5
关键词 河流,人工神经网络,水质,DO,BOD,COD
1.前言
河流水体作为淡水资源的重要组成部分,与人类的生活密切相关。目前我国大部分河流都有长期的水文、水质监测资料。但是部分河段和部分指标测量的频率还是比较低。
在河流水体中,存在着复杂的物理、化学和生物的变化,以及贯穿其中的能量循环和物质循环。这些变化和循环使得河流的各个水质指标之间存在着非线性的、复杂的联系。而随着季节的变化,河流的水位及水质也进行着复杂的变化。神经网络是一种非常适合解决复杂的非线性响应关系的数学模型。它可以用在分类、聚类、预测等方面,通过历史数据对神经网络进行训练,网络可以学习到数据中隐含的非线性映射关系。本文试图应用人工神经网络,来研究河流的水质参数之间随着季节变化的规律,从而为河流水质的预测、建立河流水质数学模型时对数据的补充和修正提供新的思路和工具。
2.研究区域以及参数选择
选择白龙江的某河段作为研究对象。神经网络的输出层神经元选择参数为河水的溶解氧DO。输入层神经元选择三个参数,一个是时间方面的参数月份;两个是水质参数:生化需氧量BOD5和化学需氧量COD。
3. 人工神经网络的结构
图1为人工神经网络DO模型的结构图。输入层有3个神经元,分别对应月份、BOD5和COD。隐含层有4个神经元,输出层有1个神经元,对应DO值。输入层和隐含层之间以及隐含层和输出层之间用sigmoid函数作为激活函数进行信息的传递。
图1.人工神经网络DO预测模型结构图
4.网络的训练和验证
4.1网络的训练
使用Visual Basic语言在PC机上进行程序的编写,从监测数据中选取各个月份的月平均BOD5、COD值和DO值作为训练样本对网络进行训练。训练步骤如下:(1)将训练样本的输入层和输出层数据进行归一化处理:将数据进行线性变换到区间[0,1]。(2)给神经网络的各个神经元的阈值赋初值,同样给各个神经元之间的连接权值也赋初值。(3)将训练样本归一化后的输入层数据赋值给输入层神经元。通过计算,得出隐含层神经元和输出层神经元的值。(4)将计算出的输出层神经元的值和该神经元的期望值进行对比,计算误差函数。(5)将误差逆向传递给隐含层和输入层,计算网络中各个权值和阈值的修正值,得到修正后的权值和阈值。(6)从步骤(3)开始重复以上步骤多次进行训练,直至误差函数满足精度要求。
4.2网络的验证
将训练好的网络进行验证。从监测数据中选取各个月份的月平均BOD5值和DO值作为检验样本。检验步骤如下:(1)将检验样本的输入层和输出层数据进行归一化处理:将数据进行线性变换到区间[0,1]。(2)将归一化处理后的检验样本输入层数据赋值给输入层神经元。通过计算,得出隐含层神经元和输出层神经元的值。(3)将计算出的输出层神经元的值通过归一化处理的逆变换还原为仿真值。(4)将计算出的仿真值结果与该监测数据的实测值进行对比,计算误差,得出验证结果。
经过验证,使用几组检验样本进行仿真预测,得出的结果与实测结果进行比较,精度在90%以上,能够满足水质预测工作的实际要求。
5.预测结果
将训练之后的网络用于水质预测。分别预测了在3、8、11月不同的BOD5和COD值时,对应的DO的值。结果见表1。
表1. DO的预测结果
6.结论与建议
6.1结论
本文利用神经网络的适合处理非线性映射关系的特点,建立了基于神经网络的水质预测模型。通过验证,证明该预测模型可以在允许的误差范围内模拟月份、BOD5、和COD与DO之间的非线性关系。
6.2建议
(1)由于人工神经网络的学习收敛速度慢,需要较长的训练时间。建议采用改进方法对神经网络的训练方法进行改进,以增快网络的学习速率和收敛速度。
(2)本文使用的训练算法可以使权值和阈值收敛到某个系列值,但并不保证其为误差平面的全局最小值,这是因为采用梯度下降法可能产生一个局部最小值。对于这个问题,要着重在检验网络的时候进行验证。
(3)本网络采用4个神经元节点的隐含层,计算精度可以达到水质预测工作的要求。 增加或者减少隐含层神经元个数对预测的影响尚待讨论。
神经网络的训练方法范文6
关键词: 电子信息系统; 故障诊断; 神经网络; 故障字典
中图分类号: TN710?34 文献标识码: A 文章编号: 1004?373X(2013)20?0166?05
目前,电子信息系统的复杂化、自动化和信息化程度越来越高,对可靠性、可维修性和技术保障能力的要求日趋迫切。系统中每一个部件发生故障都可能会产生链式反应,影响系统效能发挥或造成重大的经济损失。因此,电子信息系统的状态监测与故障诊断技术早已得到世界各个发达国家相关部门的重视[1]。电子信息系统的功能电路大部分为模拟电路,许多元件参数具有很大的离散性,即具有容差。容差的普遍存在,导致实际故障的模糊性,加大了其故障定位的困难系数[2]。因此,针对该型电子信息系统的电路原理,综合运用故障字典和神经网络相结合的故障诊断方法,研究某型电子信息系统模块级故障诊断技术,具有一定的理论意义和和重要的实用价值。同时,本文研究的成果可以推广到其他型号的电子信息系统故障诊断技术研究[3]。
1 故障诊断流程图和电路仿真
1.1 功能模块级故障诊断流程图
首先对某型电子信息系统需要诊断的电路进行仿真,然后将得到的数据建成故障字典,最后,在故障字典中找出具有典型性的故障数据作为神经网络的输入,利用BP神经网将故障定位在具体的元器件上。图1为模块级故障诊断流程图。
1.2 电路仿真
某型电子信息系统中的典型电路图如2所示。
(1)晶体管的故障模型
由于无源元器件如电阻、电容的可靠性较高,发生故障的概率较小,因此假设电路中电阻、电容均无故障,只有5个晶体管出现故障。通过对故障晶体管的分析,将其的故障表现归结为三类:内部短路、内部开路、局部击穿。考虑到以下的事实:开路的引脚不能与其他引脚短路、击穿;两个引脚开路等效于三个引脚同时开路;两个PN结短路,等效于三个引脚同时短路;将三类故障在晶体管的三个引脚、两个PN结之间进行故障组合后,可归结为21种故障类型[4],见表1。
(2)故障近似模型
在电路仿真的过程中,对使用最多的双极型晶体管的近似故障模型进行研究,使用一种基于晶体管正常模型——GP模型为故障近似模型[5]。为使用软件进行故障模拟,下面给出晶体管的故障模型,见图3。其中故障引脚电阻RC,RB,RE为晶体管各引脚与电路相应节点间的串联电阻;故障结电阻RBC,RBE,RCE。分别为并联于晶体管某两引脚之间的电阻,用于模拟晶体管PN结的短路和击穿。
正常情况下,故障引脚电阻RC,RB,RE阻值近似为零;故障结电阻RBC,RBE,RCE阻值为无穷大。仿真时,按如下方法设置电阻阻值:
(1)某引脚开路,对应的故障引脚电阻阻值设置为无穷大,文中设置为10 000 Ω。
(2)某两引脚短路,对应的故障结电阻阻值设置为0 Ω(此处为理想值)。
(3)某两引脚击穿时,对应的故障结电阻阻值设置为700 Ω(PN结击穿后电阻阻值一般在500~1 500 Ω之间)。
(3)仿真软件
仿真软件选择的是Multisim,该软件操作简单、快捷,最主要的是它可以直接调用所需元器件,而不必近似地画出被测电路的等效电路图,使得仿真结果更加接近于真实值。
(4)仿真过程
图4为某型电子信息系统中的典型电路在软件Multisim仿真时的界面图。
2 故障字典的建立
(1)故障定义
现将图2电路中与晶体管相关的106种故障(包括正常状态F0)定义列于表2中。表中V代表晶体管,s代表短路,o代表开路,d代表击穿,b代表基极,e代表发射极,c代表集电极。例如V4ecsbed就代表第4个晶体管发射极和集电极短路,基极和发射极击穿[6]。其他故障以此类推。
(2) 测试量
本电路共有106种情况,即1个正常情况和105种个故障情况。在9个测试点上共得到[106×9=954]个电压值。模拟图2进行仿真,所得的954个数据列于表3。
(3)删除不需要的测试点
由表3可见,节点1上的电压不提供任何有用的信息,所以将其删除。节点6和节点9上的电压完全相同,所以删除节点9。同一测试点,在两种故障现象下,被测电压之差超过0.1 V,则认为这两个故障可分离;若被测电压之差不超过0.1 V,则认为这两个故障为不可惟一隔离的模糊故障组合。通过分析表中的数据,可以看到F2与F4等均为两个不能唯一隔离的故障。
但由于它们皆与晶体管V1有关,任一故障可通过更换V1来排除,因此,无需进一步隔离的必要[7]。类似情况,经过整理就得到了一个规范标准的故障字典列于表4。
3 BP神经网络的应用
基于BP神经网络能够出色地解决那些传统故障诊断方法难以解决的问题,所以某型电子信息系统模块级故障诊断系统采用故障字典和是神经网络相结合的方法,力求准确、快速地进行功能模块级故障诊断[8]。
3.1 BP神经网络的故障诊断步骤
应用神经网络检测模拟电路故障的基本步骤为[9]:
(1) 建立故障字典或故障状态表。应用软件模拟出对应电路的正常状态所对应得各测试点的理论值,并把它建成一个故障字典或故障状态表。
(2)建立神经网络。把故障字典或状态表中的数据作为神经网络的输入,按照电路故障特征点的数目以及所优化处理得到的故障输出类别的数目建立神经网络。
(3) 神经网络的训练、学习。设定神经网络学习速度、训练方法及相关参数,对网络进行学习、训练。
(4)利用训练好的BP神经网络进行故障隔离。将电路的故障字典建立在神经网络之中,网络的输入节点由电路的可测节点决定,输出节点由故障状态的数目决定。
输出有多少个故障状态,输出层就选用多少个神经元,每一种故障状态对应一个相应的神经元。诊断是某种状态时对应的那个神经元被激活,输出其对应的编码。
3.2 仿真试验及结果分析
(1) 本系统采用故障字典和神经网络相结合故障诊断技术研究,采用三层神经网络。通过电路的分析,选择7个关键点的电压作为神经网络的输入。选择6种故障现象作为神经网络的输出模式,因此实际的神经网络输入神经元数为7,输出神经元数为6,隐含层的单元数按照前面介绍的公式计算为9。通过分析看到,在BP神经网络的输出端应该有6个节点,分别对应1个无故障和5个故障。网络的期望输出如表5所示。
将仿真数据进行归一化处理后,以实际故障样本为网络的原始训练样本,网络输入层、隐含层和输出层节点数分别取7、9和6,系统总误差[E
最后,可用仿真得到的其余数据验证神经网络的训练情况。表6为神经网络的验证数据。表7为验证数据对应的输出结果。
(2) 由三层BP神经网络组成的诊断系统在进行故障诊断时,采取数据驱动的正向推理策略,从初始状态出发,向前推理,到达目标状态为止。
故障诊断推理步骤如下:
①将故障样本输入给输入层各节点,并将其作为该层神经元的输出;
②求出隐含层神经元的输出并作为输出层的输入;
③求出输出层神经元的输出;
④由阈值函数判定输出层神经元的最终输出结果[10]。
假设用[Yn]表示故障类型,则故障类型阈值判定函数为:
式中:[Φk=0.90],当某模式下神经网络的输出大于0.90,而其他值均较小时,则可认为发生了该故障。则表7变为相应的表8。
表8 整理结果
通过表8与表5的对比,可见仿真结果与事实相符。
4 结 语
本文针对某型电子信息系统的电路原理,综合运用故障字典和神经网络相结合的故障诊断方法,研究该型电子信息系统模块级故障诊断技术,具有一定的理论意义和和重要的实用价值。同时,本文研究的成果可以推广到其他型号的电子信息系统故障诊断技术研究。
参考文献
[1] 徐章遂,房立清,王希武,等.故障信息诊断原理及应用[M].北京:国防工业出版社,2000.
[2] 宋小安.模拟电路故障诊断的专家系统法与BP神经网络法研究[D].南京:河海大学,2005.
[3] 胡昌华,许化龙.控制系统故障诊断与容错控制的分析和设计[M].2版.北京:国防工业出版社,2001.
[4] 朱大奇.电子设备故障诊断原理与实践[M].2版.北京:电子工业出版社,2004.
[5] 刘志海,鲁青,李桂莉.基于故障树的故障诊断专家系统的研究[J].矿山机械,2006,34(5):75?76.
[6] 张翼.基于故障字典法的模拟电路印刷板故障诊断[D].南京:南京理工大学,2001.
[7] 余浩章,陈新华.基于故障树的故障诊断推理新方法[J].上海海运学院学报,2001,22(3):65?67.
[8] 高隽.人工神经网络原理及仿真实例[M].北京:机械工业出版社,2003.
[9] 王玉德,许振方,陈春延.基于BP算法的模拟电路故障诊断[J].电子测量技术,2006,29(6):205?206.
[10] 王承.基于神经网络的模拟电路故障诊断方法研究[D].成都:电子科技大学,2005.