前言:中文期刊网精心挑选了人工神经网络的缺点范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
人工神经网络的缺点范文1
1.1人工神经网络研究简况
1943年,生理学家W.S.McCulloch和数学家W.A.Pitts首次提出二值神经元模型。半个世纪以来人们对神经网络的研究经历了五六十年代的第一次热潮,跌人了70年代的低谷;80年代后期迎来了第二次研究热潮,至今迭起,不亚于二战期间对原子弹研究的狂热。
人工神经网络是模仿生物脑结构与功能的一种信息处理系统。作为一门新兴的交叉学科,人工神经网络以其大规模并行结构、信息的分布式存储和并行处理,具有良好的自适应性、自组织性和容错性,具有较强的学习、记忆、联想、识别功能气引起众多领域科学家的广泛关注,成为目前国际上非常活跃的前沿领域之一。
1.2人工神经网络的基本模型及其实现
1.2.1人工神经网络的基本模型人工神经网络的基本模型见表1?
1.2.2以误差逆传播模型说明人工神经网络的实现人工神经网络中应用最多的是误差逆传播(ErrorBack-Propagation)网络,简称BP网络,从结构讲’BP网络是典型的多层网络,分为输入层、隐含层和输出层3层,层与层的神经元之间多采用全互连方式,而同层各神经元之间无连接,见图1。BP网络的基本处理单元(输入层单元除外)为非线性输人-输出关系,一般选用S型作用函数f(x)=l/(1+e-当给定网络一个输人模式时,它由输人层单元传到隐含层单元,经隐含层单元逐层处理后再送到输出层单元,由输出层单元处理后产生一个输出模式。这是一个逐层状态更新的过程,称为前向传播。如果期望输出与实际输出之间的误差不满足要求,那么就转人误差反向传播,将误差值沿通路逐层传送并修正各层连接权值(w1,W2),这是一个逐层权值更新的过程,称为误差反向传播过程。随着2个过程的反复进行,误差逐渐减小,直至满足要求为止。
2常用人工神经网络模型的应用分析
当前,人工神经网络方法主要应用于有机有毒化合物毒性的分类及定量预测、对不同污染物生物降解性能的预测、单要素环境质量评价、环境质量综合评价、环境预测、环境综合决策等方面。
2.1预测性能的分析
以BP网络为例,就近两年来应用BP网络进行预测的成功研究来看,人工神经网络的预测性能得到了充分的肯定。
1997年,刘国东等141应用BP网络建立的雅砻江和嘉陵江流域气温、降水和径流之间关系的网络模型,具有较高的拟合精度和预报精度,并具有精度可控制的优点。计算结果同国内外研究成果的一致性表明,用BP网络分析、研究气候变化对一个地区(或流域)水资源环境的影响是一种新颖、有效的方法。
王瑛等w指出,当外界环境和系统本身性质发生剧烈变化时,BP网络能提供一种有效的方法来更新模型,实现新旧模型之间的转换。他们利用最近12年(1981~1992年)的环境经济数据对2000年环境指标进行了预测,并根据预测结果对未来的环境对策进行了分析。这为解决环境预测的模型问题提供了一条新思路。
张爱茜等用人工神经网络预测含硫芳香族化合物好氧生物降解速率常数和孙唏等⑺对胺类有机物急性毒性的分类及定量预测的结果都说明了,人工神经网络作为一种非线性模型预测能力大大优于多兀线性回归模型。
2.2 评价性能的分析
人们在环境评价中主要应用了BP网络、Hopfield网络、径向基函数网络等模型,并不断地改进应用方法,对其在环境评价中的性能进行比较研究》李祚泳的研究结果表明BP网络用于水质评价具有客观性和实用性。刘国东等?改进了BP网络的应用kf法,并比较了BP网络与Hopfield网络在水质综合评价中的性能。他们指出Hopfield网络采用模式(图象)联想或匹配,既适用于定量指标的水质参数又适用于定性指标的水质参数,而且使水质评价形象化,因此更优于BP网络.郭宗楼等将径向基函数人工神经网络(RBF—ANN)模型应用于城市环境综合评价,结果-表明RBF网络不仅具有良好的推广能力,而且避免了反向传播那样繁琐、冗长的计算,其学习速度是常用的BP网络无法比拟的。郭宗楼等[|11又以三峡工程为背景,把该模型应用于水利水电工程环境影响综合评价的人工神经网络专家系统中,与分级加权评价法相比较具有更高的推理效率。
环境科学研究的问题,如环境污染、生态破坏、自然灾害、资源耗竭、人口过量等等,无一不是在某种程度上损伤或破坏了人——环境的和谓。人——环境关系有着自身的变化规律,是可以进行科学量度的。显然这一M?度是多方位、多因素的非线性评价问题,至今尚未建立起一种适当的评价模型,我们是否可以借鉴人工神经网络的应用优点,考虑建立基于人工神经网络方法的评价模型。
人工神经网络的缺点范文2
关键词: 人工神经网络BP算法改进BP算法倒立摆小车
1.引言
倒立摆系统是时变的、非线性、多变量和自然不稳定系统,在控制过程中,它能有效地反映可镇定性、鲁棒性、随动性和跟踪等许多控制中的关键问题,是检验各种控制理论的理想模型。人工神经网络BP算法,在多变量输入情况下具有精度高、实现快、算法简单、鲁棒性好等优点,从而满足了系统的要求[1]。
2.人工神经网络BP算法简介
人工神经网络(ANN)由于具有信息的分布存储、并行处理和自学习能力等优点,在信息处理、模式识别、智能控制等领域得到了越来越广泛的应用。近年来,已有多种ANN模型被提出研究,80%―90%的人工神经网络模型是采用BP网络或其改进形式,它是前向网络的核心部分,体现了网络最精华的部分[2]。标准的BP网络是根据Widrow―Hoff规则,采用梯度下降算法,主要由信息信号的正向传播和误差信号的反向传播两部分组成。
但BP网络存在需较长的训练时间、收敛于局部极小值等缺点,为此人们对BP算法进行了许多改进。改进主要有两类:一类采用启发式技术,如附加动量法、自适应学习率法;另一类是采用数字优化技术,如共轭梯度法、拟牛顿法、Levenberg―Marquardt(LM)法[3]。由于LM算法收敛速度最快,精度较高,且经过大量仿真实验分析比较,LM效果最好,故我们采用LM法对网络进行训练。
LM优化方法权重和阈值更新公式[4]为:
其中J为误差对权值微分的雅可比矩阵,e为误差向量,μ为一个标量。依赖于μ的幅值,该方法光滑地在两种极端情况之间变化,即牛顿法(当μ0)和著名的最陡下降法(当μ∞)。
3.神经网络控制器设计
3.1训练样本的选取
BP神经网络在未经任何训练的情况下,不能作为系统控制器使用。在实际仿真过程中,我们选择极点配置控制为BP网络的教师进行学习,经过试探训练,样本数为2000时结果较为合理,此时样本数据能够反映系统的基本特征,可以得到预期的仿真结果。极点配置-2+5i-2-5i-5+4i-5-4i;A=[0 1 0 0;0-0.0883167 0.629317 0;0 0 0 1;0-0.235655 27.8285 0];B=[0 0.883167 0 2.35655]’;C=[1 0 0 0;0 1 0 0;0 0 1 0;0 0 0 1];D=[0 0 0 0]’;p=[-2+5i-2-5i-5+4i-5-4i]; K=acker(A,B,p)。
3.2 BP网络结构
BP网络设计时,增加层数主要可以进一步降低误差,提高精度,但却使网络复杂化。而增加隐含层的神经元数也可提高误差精度,且训练效果更易观察和调整。为了使误差尽可能小,我们要合理选择初始权重和偏置,如果太大就容易陷入饱和区,导致停顿,一般应选为均匀分布的小数,介于(-1,1)。
根据需要,在网络初始化时,BP采用0.5*Rands函数初始化权值,权值初始值选在(-0.5,0.5),选取训练目标误差为0.0001,训练次数上限为5000次。通过多次仿真实验性能比较,选取[4 9 1]的单隐层神经网络结构,隐含层、输出层分别采用Tansig、Purelin函数,仿真实验表明变学习率训练算法训练时间长,5000次还不能达到所要求的精度,且系统容易发散,控制倒立摆效果不好,采用改进的LM训练算法对网络进行学习训练可以得到较好的控制效果且训练时间短。在实际仿真过程中,BP网络经过53次训练即达到了训练目标。
4.BP网络训练结果
图1分别给出了倒立摆小车位移、摆角和控制力的BP算法与极点配置算法仿真曲线对比图,仿真结果表明:相较极点配置,BP算法精度高、实现快、鲁棒性好,倒立摆小车在BP算法下只需2.5s左右就可以达到所设定精度的稳定效果,且超调量很小,满足了系统的要求。
5.结论
通过对人工神经网络BP算法的分析,笔者进行了倒立摆小车改进BP算法的控制系统仿真实验。仿真表明该改进BP算法收敛性好、计算量小,尤其在非线性和鲁棒控制等领域具有良好的应用前景。BP神经网络从理论上可以逼近任意非线性函数,所以它特别适合控制像倒立摆这样的严重非线性、多变量系统。
参考文献:
[1]于秀芬,段海滨,龚华军.基于人工神经网络BP算法的倒立摆控制研究[J].测控技术,2003,22(3):41-44.
[2]张志华,朱章森,李儒兵.几种修正的自适应神经网络学习算法及其应用[J].地球科学,1998,23(2):179-182.
[3]苏高利,邓芳萍.论基于Matlab语言的BP神经网络的改进算法[J].科技通报,2003,19(2):130-135.
人工神经网络的缺点范文3
关键词:质谱解析;模式识别;算法
中图分类号:TP302 文献标识码:A 文章编号:1009-3044(2016)36-0181-03
在生活中,人们能够认出周围不同的人分辨他们说话的声音和方式,认出住的小区工作的单位,人们的这种能力就是“模式识别”。随着科技的发展,人们研究用计算机模拟人的模式识别能力,对不同类型形式的数据进行描述、分类、识别。
模式识别的计算过程大致概况成以下几部分:首先从训练样本获得原始数据,对各元素进行综合分析,获得最能反映样本属性的观测量,从众多的特征中找到合适有效的特征量,然后进行特征提取,构成模式空间或特征空间。数据需要预先进行处理,处理后,即可通过模式识别算法进行训练和分类,然后根据训练分类所得的判据对未知样本进行判别(或称计算机预报)。过程如图1所示。
1 线性学习机(linear learning machine)
1.1 原理
此方法亦称为纠错反馈法。最早由Kowalski等引入化学数据的解析,之后被广泛地用于质谱、红外光谱及核磁共振谱。
该方法使用判别函数进行分类,判别函数在二维空间为一直线,在三维空间为一平面,而在多维空间则为一超平面,判别函数将N维空间分成类别区域,预测实验样本属于哪一类别。在LLM中,判别函数先将样本分为两类,使属于一类的样本处于平面的一侧,而属于另一类的样本处于另一侧。判别函数可以通过训练样本求得,并在通过校验集的验证后用于预测待测样本的归属。
1.2 算法步骤
线性学习机是一种有监督的学习类型的简单线性判别函数的迭代算法,可通过以下步骤来实现:
设在训练集中有两类样本,记为[ω1]和[ω2],
1)随机选取一个与样本矢量具有相同维数的矢量作为w
2)对于每个样本都进行计算(k=1~n)。如果[xk∈ω1],而且如果[wtxk>0],则[wnew=wold](判决矢量保持不变)。反之,如果[wtxk
3)重复第二步,直至对所有的样本都正确分类。
值得提出的是,以上算法是对于线性可分的情况而设计的,对于线性不可分的情况,则规定重复次数,到了规定次数还不能完全将训练集分开,则认为属于线性不可分的。
另外,在本算法中的修正判决矢量的计算,实际上是将当前的不能正确分类的判决矢量进行反射,这是因为
[wtnewxk=(wold-λxk)txk=wtoldxk-2wtoldxkxtkxk/xk2=-wtoldxk]
也就是说,经过这样的修正以后,原来不能正确分类的现在可以分类正确了。一般来说,这样的重复次数在20次左右就足够了。
1.3 缺点
LLM方法的缺点之一是没有唯一解,当训练对象的表示次序发生改变时会出现不同的答案。并且只有当样本线性可分时,LLM才能很好的工作。LLM的另一缺点是判别面简单、异常点容易错误分类以及收敛缓慢的不足。另外,LLM只适用于区分两个类别的情况。
2 K最邻近法(K-nearest neighbors,K-NN)
2.1 原理
K最邻近法在化学上应用极为广泛,它是直接以模式识别的基本假设即同类样本在模式空间相互靠近为依据的分类方法。它计算在最近邻域中k个已知样本到未知的待判别样本的距离,即使所研究的体系线性不可分,此方法仍可适用。
KNN法对每一个待分类的未知样本都要计算它到全体已知样本之间的距离,得到它的k个最近邻点进行判决。若k=1,未知样本属于这一个最近邻样本。若k>1,则未知样本与这k个最近邻样本不一定属于一类。这时要采用权值的方法,对这k个近邻的情况按少数服从多数进行表决。一个近邻相当于一票,但考虑k个邻近与未知样本的距离有所判别,所以对各票进行加权,距离最近的近邻的类属,应予以较重的权。
[V=i=1kviDi]或[V=i=1kviD2i]
式中,[vi]为近邻的类属取值。对两类分类,i属于第一类时取“+1”,属于第二类时取“-1”。Di为未知样本与第i个近邻的距离,k樽罱邻数。当V>0时,则未知样本归入为类1;否则归于类2。
这种方法因采用获多数“票”的方法确定未知样本的归属,所以k一般采用奇数。k值不同时,未知样本的分类结果可能不同。
2.2 算法步骤
1)取一个未知样本,记为[xunknown],计算该样本到训练集各样本的距离[Di](i=1,2,…,n),在此n为所有训练集样本的总数。
2)取出k个距离最短的训练集样本,计算它们的权值和
[Vunknown=ViDi] (i=1,2,…,k)
如果[xi∈ω1],则取[Vi=1];反之,如果[xi∈ω2],[Vi=-1];[Di]是待判别的一本与近邻的距离。
3)建立判别标准,即当[Vunknown>0],则[xunknown]判别为第一类[ω1];反之,[Vunknown
2.3 缺点
不幸的是,这种分类方式依赖于每一类中的对象个数。当类与类有重叠时,未知对象将被分配给对象个数较多的类。在没有唯一标准而允许近邻数可变的条件下,这种情况有时也可以得到解决。
3 人工神经网络判别法
3.1 原理
人工神经网络(artificial neural network)的研究是受人脑组织的生理学启发而创立的,是由处理单元(神经元)组成,通过一定的模型结成一个网络,相互间的联系可以在不同神经元之间传递增强或抑制信号。人工神经网络用于化学模式识别的基本思路与判别分析方法是相同的,它也是通过对已知类别的训练集的拟合来建立模型从而进行分类与预测。
3.2 算法
人工神经网络有多种算法,大致分为两类:有管理的人工神经网络和无管理的人工神经网络。有管理的人工神经网络的方法主要是对已知式样进行训练,然后对未知式样进行预测。例如BP(Back Propagation)人工神经网络,是一种误差反向传输网络,其采用最小均方差学习方式,是一种使用最广泛的网络。无管理方法,也称自组织(self-organization)人工神经网络,无需对已知样本进行训练,则可用于化合物的分类,例如被称为自组织特征映射网络(SOM)的Kohonen神经网络和典型的反馈式网络Hopfield神经网络。BP人工神经网络是使用最广泛的网络,所以下面对它进行介绍。
BP算法由以下几步构成:
1)数据预处理。因大都采用由s型非线性函数(sigmoid nonlinearity)为其活性函数,即[fu=(1+e-u)-1],其输出值都介于0~1之间,所以需要对网络的输出进行预处理,使之同样落入0~1之间。这样的预处理不会影响问题的一般性。
2)随机选取连接权重[wme2ki]和[wme1ij](j=1,…,n;i=1,…,m;k=1,…,L),其中n为输入矢量的节点数(或称输入矢量的维数);m为隐节点数;L为输出节点数。一般用(-0.5~0.5)的均匀分布随机函数产生。
3)设a=1,…,A,重复迭代以下步骤,直至收敛。
a.前传计算。按照
[ymej=fwme1ijlnpi+wme10]
和
[Outk=fwme2kiymej+wme20=fwme2ki[fwme1ijlnpi+wme1oi]+wme2o]
来计算Out,并与所期望得到的数值比较,计算出误差函数E。
b.反鞯鹘凇<扑隳勘旰数对连接权重的一阶导数,以此调节连接权重[wme2ki]和[wme1ij](在此只介绍最陡梯度法,用的是一阶导数,别的优化算法同样可行)。
[Δwij=ρδiuj]
式中:[ρ]―― 一步长因子可在(0~1)之间取值;
[u]――第j节点上的抽象变量,视其是在输出层还是隐蔽层,就分别等于[fwme1ijlnpi+wme10]或[fwme2kiymej+wme20];
[δ]――梯度因子,对于不同层,有不同表达式
[] [δi]= [(ui-Expi)(ui)(1-ui)] 如[ui]为输出节点
[(wme1ijδk)(ui)(1-ui)] 如[ui]为隐蔽层节点
在这里[u(1-u)=u′]。这是因为
[u=fwme1ijlnpi+wme10=fx=1/(1+e-x)]
所以有
[u′=f″x=[1/(1+e-x)]/dx=-(1+e-x)-2(e-x)(-1)=(11+e-x)[1-(11+e-x)]=u(1-u)]
[Δwij=ρδiuj]中步长因子[ρ]的取值大小对收敛速度有很大影响,如取值太大,可能引起迭代过程的振荡(oscillation);反之若取值太小,则会导致权重调节的迭代过程收敛太慢。一般来说,为了加快迭代过程且防止迭代过程的振荡,在[Δwij=ρδiuj]中引入一个惯量因子λ,有
[Δwij(a+1)=ρδiuj+λΔwij(a)]
以保证迭代收敛速度。
3.3 缺点
人工神经网络能精确的对复杂问题进行预测,但却难以理解。此外也有其他一些问题,如网络训练速度问题、神经网络易受训练过度的影响,网络中的神经网络节点个数难以确定,网络结构优化等问题。
4 小结
人类能很轻易通过视觉辨别文字、图片,通过听觉辨别语言,这是人的一种基本技能。但是要机器模拟人进行识别,涉及的问题就比较复杂。本文就模式识别中的三种常用算法:线性学习机、K最邻近法、人工神经网络判别法,简单分析比较了他们的优缺点。
参考文献:
[1] 郭传杰.计算机辅助质谱解析的谱图匹配和模式识别方法[J].质谱学杂志,1984,5(3):19-24.
[2] Jurs P C, Venhour T L. Chemical Application of Pattern Recognition[M].Wiley Interscience Publication,1975.
[3] Kowalski B R, bender C F,J.Am.Chem.Soc.,94,5632 (1972).
人工神经网络的缺点范文4
摘要:
针对水文时间序列的非平稳性特征,以长江三峡宜昌站1904~2003年年平均流量为例,分别建立了小波分析(WA)与BP神经网络和径向基函数神经网络(RBF)耦合的预测模型,探究了两种组合模型的预测效果,并与传统的单一人工神经网络模型对比;并采用5种常见的预测性能评价指标分析预测效果。结果表明:组合模型预测成果的精度较单一模型显著提高;组合和单一模型中RBF网络模型均优于BP网络模型;小波径向基函数神经网络组合模型具有较优的预测精度和泛化能力,是提高预测精度的有效方法,在径流预测中具有可行性。
关键词:
ATrous小波分析;BP神经网络;径向基函数神经网络;预测模型;水文预报
中长期水文预报是根据已知水文与气象要素信息对未来一定时期内的水文状态作出定性和定量的预测。目前,通常预报的水文要素有流量、水位、冰情和旱情等[1]。水文时间序列预测对防汛、抗旱、水资源开发利用等具有重大的实用意义,然而水文系统是一个高度复杂的非线性系统,在由降雨经过蒸散发、下渗、截留、填洼形成径流的过程中,还受到流域地形地貌、气候变化、人类活动等因子的干预,因此,水文时间序列表现出极大的复杂性,给预测带来一定困难。传统的中长期水文预报大多采用回归分析法和时间序列分析方法[2]。常用的回归分析法主要有一元线性回归分析法、多元线性回归分析法、逐步回归分析法、最小二乘回归分析法、聚类分析法和主成分分析法等[2],其因建模简单、易于实现的优点成为了径流中长期预报应用最早也是最广的方法[3],但回归分析法中存在因子个数合理性的选择、预报成果取均值而忽略了极大与极小值情况等问题;时间序列分析法常用自回归序列(AR)模型、滑动平均序列(MA)模型、自回归滑动平均序列(ARMA)模型、求和自回归滑动平均序列(ARIMA)混合模型、门限自回归序列(TAR)模型等[4]。
该方法能够很好地分析和处理具有季节性、趋势性的水文预报问题,但在建模过程中存在模型参数估计和合理定阶等问题[2]。随着计算机技术的发展,一些智能新方法被广泛应用于中长期水文预测中,主要包括模糊分析、人工神经网络、灰色系统分析、混沌理论、投影寻踪、小波分析等方法[5],然而目前还没有一种水文预报模型能够对所有水文序列具有完全适应性。近年来,小波分析和人工神经网络组合模型成为中长期径流预测的研究热点[6-7]。利用小波变换可将径流序列的趋势项、周期项和随机项成分较好地分离,为克服水文时间序列成因复杂、难以详尽表述其变化规律等困难提供了一种便利的分析技术[8],再将不同频率下的小波变换成分输入神经网络进行预测,能够较好地提高预测精度。只有选择合适的小波神经网络组合模型的结构,才能得到精度更高的预报结果。本文提出将小波分析与不同类型的神经网络组合,分别建立小波分析与加动量的BP神经网络相结合、小波与RBF网络相结合的径流预报模型,对两种组合模型及传统单一的神经网络模型的模拟效果进行对比分析。
1模型结构及原理
1.1小波分析对水文时间序列进行小波分析时,使用连续小波变换或离散小波变换得到的小波变换系数冗余,因此常用快速的小波变换算法计算,不涉及具体的小波函数,主要有Mallat算法和ATrous算法。相比原始时间序列,Mallat算法重构后的时间序列因其二进抽取、插值处理,容易出现相位失真[9-11],并会发生一定的偏移,而ATrous算法为无抽取离散小波变换,具备平移时不变性的特性,它只是对滤波器组进行内插补零,其每级分解系数和原始时间序列的长度保持一致,因此本文小波分析采用ATrous算法。
1.2BP神经网络BP神经网络的拓扑结构图如图1所示[12]。BP神经网络预测模型,运用了神经网络可以任意逼近非线性函数的特性,输入与输出间的复杂关系表示具有非线式的特点,其适用性明显高于一般显式线性预测模型[12]。水文时间序列是受多因子复杂影响的一种非稳定性的时间序列,并非可用单一的线性或非线性函数计算所得。BP神经网络相当于一个“黑箱”模式,不需要知道输入与输出数据间的函数关系,仅通过对输入输出数据进行训练学习,获得误差达到最优的一种映射关系,就可将训练好的模型用于预测,它具有自学习、计算简单、容错性较好、泛化能力较强的特点。
1.3径向基函数神经网络径向基函数神经网络(RBF,RadialBasisFunc-tion)是一种能够以任意精度逼近任意非线性函数的神经网络结构,具有单隐层的3层向前网络[12],其中隐层函数为径向基函数。RBF神经网络仅对输入空间的某一局部区域存在少数的神经元,用来决定网络的输出,且RBF网络中的重要参数中心向量和宽度向量是根据样本集中的训练模式来试算确定或者初始化的,因此,RBF神经网络具有避免陷入局部极小值的解域中的优点。RBF神经网络的拓扑结构图如图2所示[12]。
2预测性能评价指标
为了对预测模型的适应性进行分析,需用预测成果的精度来度量。本文采用常用的3种误差评定方法和预测值的相对误差小于10%和20%的合格率,来评价模型的预测精度[13-14]。NMSE和MRE反映出实测值和预测值之间的偏差,NMSE和MAE越小,表明预测值越接近于实测值,即预测的效果越好。DVS以百分比形式表示正确预测目标值变化方向,其值越大,表明预测效果越好。以预测值相对误差满足小于10%和小于20%的合格率来反映预测值与实测值之间的逼近程度,其值越大,预测效果越好。
3模型仿真
长江宜昌水文站是长江上游出口的唯一控制站,且三峡工程位于其上游约44km处,对宜昌站年径流量的预测具有重要的实践意义。本文利用宜昌站1904~2003年为期100a的实测年均流量资料,采用MATLAB编程,利用小波神经网络组合模型对其预测,选取两种不同神经网络模型对比分析。
3.1小波变换本文选取宜昌站100a年均径流量,利用ATrous算法进行分解尺度为3的小波变换,求取径流序列的细节系数W1、W2、W3和近似系数C3,用作神经网络输入。小波分析成果见图3。
3.2基于小波变换的BP模型构建一个3层双隐层的BP神经网络模型,可以以任意精度逼近给定的非线性函数,而双隐层可以提高模型的逼近精度。小波BP网络模型即将BP神经网络模型中对径流量直接输入预测替换为对小波变换系数的预测。小波分析将具有复杂非稳定性特征的径流量分解成不同频率的高频细节序列和低频概貌序列,因此可以更好地利用神经网络模拟成因复杂、具有时-频特征的径流量序列的形态变化特征和趋势。构建一个4-10-8-1结构的3层双隐层BP模型,隐含层函数选用transig,输出层函数选用purelin,采用有动量加自适应lr梯度下降法选择参数,设置最大训练次数为5000、训练要求精度0.00001、学习速率0.01。利用Matlab软件进行网络训练,对预测结果进行反归一化处理,得到最终预测结果,成果见表1。
3.3基于小波变换的RBF模型与小波BP网络模型类似,将归一化后的前90a的年均径流量小波变换系数作为RBF网络模型训练样本的输入,Q(t+T)作为训练样本输出,预见期为2a,后10a的资料作为测试。不同于BP神经网络的初始权值选取对于网络训练的精度影响很大这一特点,RBF神经网络只需用试错法调整参数SPREAD。在Matlab平台上,调用RBF模型,调用方式为net=newrb(P,T,GOAL,SPREAD,MN,DF),SPREAD为径向基层的扩展速度常数,其取值会影响神经网络的运算速度和精度[10]。通过试算得SPREAD的最优解为67.3。将训练好的模型用来预测后10a的年均径流量,成果见表1。
3.4单一人工神经网络模型直接将实测的年均径流量作为模型的输入,预见期为2a。因径流的成因复杂及形成过程具有较多干扰因素,单一的人工神经网络模型不一定能较好地模拟其内部的变化特征,本文分别采用单一的BP神经网络和RBF网络对后10a的年均径流量进行预测,预测成果见表1。
4模型适用性分析
根据三峡宜昌站100a径流量资料,建立不同组合的小波神经网络模型,利用Matlab软件平台对模型进行网络学习,分别调试不同模型得到最优预测径流量,成果见表1。为了判断4种预测模型的预测结果是否保持实测序列的主要统计特性和变化特征,采用以下5种常见的预测性能评价指标验证模型的适用性,成果详见表2。(1)由宜昌站1994~2003年年均流量的预测值与实测值比较计算得NMSE、MRE、DVS、合格率e<10%和合格率e<20%的5种误差评定参数。从预测整体NMSE和MRE上看,小波人工神经网络组合模型预测精度明显高于传统单一的人工神经网络模型,而组合模型中,小波RBF网络模型预测效果更优,单一神经网络模型中RBF网络预测精度也高于BP网络。这表明,组合模型用于长江径流预测是合理可行的,具有较好的预测精度和泛化能力,是提高模型预测精度的有效方法。但BP神经网络存在收敛速度较慢、易陷入局部极值、易发生“过拟合”或“欠拟合”情形等缺陷[15],而RBF神经网络以对点径向对称且衰减的非负非线性函数为传递函数[16],能够避免BP网络产生的缺点,具有更好的逼近能力。(2)小波RBF神经网络DVS表明,预测目标值方向的正确率高达88.89%,单一的BP网络的DVS指标却只有33.33%。这表明,小波神经网络组合模型较单一神经网络模型能更准确地预测目标值变化方向,RBF神经网络在模式识别能力方面也优于BP神经网络。(3)多数小波神经网络组合模型成果的预测相对误差小于10%,而单一神经网络合格率则只接近半数,其中无论组合模型还是单一模型,RBF模型预测值的合格率都要高于BP神经网络模型。由表2可知,4种模型预测精度基本达到(合格率e<20%),即人工神经网络由于其较强的非线性映射能力、鲁棒性、容错性和自适应、自组织、自学习等特性[17],对于水文径流量预测具有可行性,而进行小波分析处理后再建立神经网络模型能提高预测的精度,选择合适的神经网络模型则能优化预测成果。
5结语
笔者提出小波分析与不同人工神经网络耦合的预测模型。组合模型可将高度复杂的非稳定年径流序列分频率提取的成分输入人工神经网络进行预测,巧妙地避开了单一预测模型预测精度不高的问题;而不同的小波神经网络组合模型则进一步探讨了小波分析和不同人工神经网络耦合的密切程度,得到预测精度较高的小波神经网络模型的组合结构。本文以宜昌水文站100a实测年均径流量序列为例,进行实例对比验证。对比分析模型模拟成果表明,小波神经网络组合模型对径流预测的适应性强于人工神经网络模型,而小波RBF网络模型比小波BP网络模型具有更优适应性,小波RBF网络模型能更好地揭示水文随机序列的变化特性且提高了预测精度和速率,为水文工作提供了有效可行的预报方法,对水文资料的预测和插补延长具有实际意义。
参考文献:
[1]包为民.水文预报[M].北京:中国水利水电出版社,2009.
[2]宋一凡,郭中小,卢亚静.基于遗传算法优化的小波神经网络在中长期水文预报中的应用———以三门峡为例[J].中国水利水电科学研究院学报,2014,12(4):337-343.
[3]宋荷花,胡国华,李正最.湘江流域中长期水文预报[D].长沙:长沙理工大学,2008.
[4]钟登华,王仁超,皮钧.水文预报时间序列神经网络模型[J].水利学报,1995,(2):69-74.
[5]王丽学,杨军,孙靓,等.基于灰色系统与RBF神经网络的中长期水文预报[J].人民长江,2015,46(17):15-17.
[6]BatesJM,GrangerCWJ.Thecombinationofforecasts[J].Opera-tionalResearchQuarterly,1969,20(1):451-468.
[7]王文圣,丁晶,李跃清.水文小波分析[M].北京:化学工业出版社,2005.
[8]LiZuoyong.Progressofstudyonhydrologywaterresourceandwaterenvironment[J].JournalofSichuanUniversity:EngineeringScienceEdition,2002,34(2):1-4.
[9]孙延奎.小波分析及其应用[M].北京:机械工业出版社,2005.
[10]李贤彬,丁晶,李后强.基于子波变换序列的人工神经网络组合预测[J].水利学报,1999,(2):1-4.
[11]MATLAB中文论坛.MATLAB神经网络30个案例分析[M].北京:北京航空航天大学出版社,2010.
[12]杨淑莹.模式识别与智能计算:Matlab技术实现[M].北京:电子工业出版社,2008.
[13]汪丽娜,陈晓宏,李艳.不同径流尺度的小波神经网络预测[J].华南师范大学学报:自然科学版,2013,45(2):104-106.
[14]SL250-2000水文情报预报规范[S].
[15]崔东文,金波.改进BP神经网络模型在小康水利综合评价中的应用[J].河海大学学报:自然科学版,2014,42(4):306-313.
[16]黄剑竹.改进RBF-Adadoost模型及其在年径流预测中的应用[J].人江,2015,45(1):32-36.
人工神经网络的缺点范文5
关键词: 100 m栏;高水平运动员;女子短跑;神经网络
中图分类号: G 822.6 文章编号:1009783X(2012)03026503 文献标志码: A
收稿日期:20100517
基金项目:中央高校基本科研业务费专项资金资助”(SWJTU11BR121 ;SWJTU11BR122)。
作者简介:宋爱玲(1977—),女,山西大同人,硕士,副教授,研究方向为体育教育训练;刘静(1977—)女,四川人,硕士,讲师,研究方向为体育教育训练;李征(1979—),男,四川人,博士,讲师,研究方向为体育教育训练。
作者单位:1西南交通大学体育部,四川 成都 610031;2西南民族大学体育学院,四川 成都 610041
1.Department of Physical Education,Southwest Jiaotong University,Chengdu 610031,China;2.Basketball Teaching & Research Section,Capital Institute of Physical Education,Beijing 100088,China. 运动员专项成绩与身体素质训练水平之间存在明确的函数映射关系[12],通过建立运动员专项成绩与身体素质关系的理论模型,可实现运动员专项成绩的准确预测,并可为制定身体素质的备战训练提供科学的理论依据。
目前,运动员专项成绩与身体素质关系理论模型的建立一般采用多元回归方法和灰色方法,这些方法的收敛性、适应性及预测精度均受到不同程度的限制,因而预测效果不佳[35]。文献[68]利用人工神经网络强大的函数映射能力对训练样本进行学习,克服了多元回归方法和灰色方法所建数学模型的缺点,建立了多个项目运动员精确的专项成绩预测模型;然而,到目前为止,仍未有女子100 m栏运动员相关预测模型的文献报道。有鉴于此,本文基于Matlab仿真分析平台,以我国女子100 m栏冠军刘静的专项成绩与素质训练水平为学习样本(见表1),利用人工神经网络函数映射方法,建立了其专项成绩预测模型。该模型预测精度高,且其拓展应用可为女子100 m栏运动员科学训练提供重要理论指导。
利用以上曲线,教练员和运动员可分析出各项素质训练水平对专项成绩的影响程度,据此,可科学合理地安排运动员的训练,提高比赛成绩。
3 结论
运动员专项成绩与身体素质训练水平之间存在明确的函数映射关系,通过建立运动员专项成绩与身体素质关系的理论模型,可实现运动员专项成绩的准确预测,并可为制定身体素质备战训练提供科学的理论依据;因此,本文基于Matlab仿真分析平台,利用人工神经网络函数映射方法,建立了女子100 m栏运动员专项成绩预测模型。该模型预测精度高,且其拓展应用可为女子100 m栏运动员科学训练提供重要理论指导。
参考文献:
[1] 张正红,刘志兰.刘翔分段成绩与专项成绩的灰色关联综合分析及模式化训练途径[J].武汉体育学院学报,2008,42(4):9092.
[2] 赵永寿.关于构建铅球运动员成绩的人工神经网络预测模型的研究[J].北京体育大学学报,2006,29(4):486488.
[3] 袁磊.世界优秀男子跳高运动员身体素质与专项成绩相关关系的递归神经网络模型构建[J].北京体育大学学报,2008,31(2):202204.
[4] 钟平,龚明波.链球运动员身体素质与专项成绩相关关系的神经网络模型[J].广州体育学院学报,2004,24(1):3335.
[5] 钟武,唐岳年.铅球运动员专项成绩的神经网络预测模型的构建[J].西安体育学院学报,2005,22(3):7881.
[6] 刘志兰,龙斌,王阳春,等.基于BP神经网络的刘翔成绩与分栏时间预测模型研究[J].兰州交通大学学报,2008,27(5):177180.
[7] 邓云玲,张广林,许世岩,等.男子110 m栏运动员专项能力指标体系与成绩预测模型的构建[J].西北师范大学学报:自然科学版,2007,43(2):98101.
[8] 陈海英,郭巧,徐力.基于神经网络的人体100 m跑运动能力综合评价[J].中国体育科技,2003,39(2):13.
人工神经网络的缺点范文6
关键词:人脸识别;奇异值分解;BP神经网络;粒子群优化算法
分类号:TP391 文献标识码:A
Face Recognition Classifier based on PSO and Neural Network
DUAN Xiang-jun
( Nanjing College of Information Technology, Nanjing 210046, China )
Abstract: Because BP neural network for face recognition classifier has slow convergence and easy to fall into the local minimum, using particle swarm optimization (PSO) to improve the BP network training method, establishing an algorithm based on the improved PSO-BP neural network, which can more reasonable and effectively to determine the neural network connection weights and thresholds, applying this method to the classification of the face recognition system, and compared results with using the BP neural network classification only, experiment shows that the recognition speed is quicker and recognition result is better.
Key words: face recognition; singular value decomposition; BP neural network; particle swarm optimization
0引言
通常情况下,一个人脸自动识别系统包括以下三个主要技术环节:人脸检测、人脸特征提取、人脸识别。人脸识别即将人脸特征提取结果与库中人脸对比得出分类结果,即识别分类;分类器的选择在人脸识别系统整个过程中起着成败与否的关键作用。因此,要慎重选择研究分类器的设计,确保具有优秀的识别结果。
目前,应用较广泛的人脸识别分类器主要有:最小距离分类器[1]、基于PCA的分类法[2]、支持向量机识别方法[3]、人工神经网络[4]等模式识别方法。由于人工神经网络具有较强的容错能力、自适应学习能力以及并行信息处理结构、速度快等三大优势,在模式识别领域有广泛的应用,而人工神经网络模型又以标准三层BP神经网络最为经典。但由于传统的BP算法是基于梯度下降法的,而梯度下降法通常具有收敛速度慢、易陷入局部极小等缺点而导致学习失败,另外,BP网络学习时间较慢,不适合大规模的网络求解[5]。而粒子群算法(Particle Swarm Optimization, PSO)[6]源于对鸟群捕食行为的研究,系统初始化为一组随机解,粒子在解空间追随最优的粒子进行搜索,通过迭代搜寻最优值,所以用它来完成前期的搜索能较好的克服BP算法的缺点。
1 BP神经网络分类器
BP算法的基本思想是:BP神经网络的学习过程由信号的正向传播与误差的反向传播两部分组成。正向传播时,输入样本从输入层输入,经各隐含层逐层处理后,传向输出层。若输出层的实际输出与期望的输出(教师信号)不符,则转入误差的反向传播阶段。误差的反向传播是将输出误差以某种形式通过输出层向隐含层逐层反传,并将误差分摊给各层的所有单元,从而获得各层单元的误差信号,以此误差信号来修正各单元权值。权值不断调整的过程,也就是网络的学习训练过程。此过程一直进行到网络输出的误差减少到可接受的程度,或进行到预先设定的学习次数为止。其用于人脸识别的结构模型图如图1所示。
2 粒子群算法原理
如果我们把一个优化问题看作是在空中觅食的鸟群,那么在空中飞行的一只觅食的“鸟”就是PSO算法在解空间中进行搜索的一个“粒子”(Particle),也是优化问题的一个解,“食物”就是优化问题的最优解。粒子的概念是一个折衷的选择,它只有位置和速度,没有质量和体积。
PSO算法中每个粒子就是解空间中的一个解,它根据自己的飞行经验和同伴的飞行经验来调整自己的飞行状态。每个粒子在飞行过程中所经历过的最好位置,就是粒子本身找到的最优解。整个群体所经历过的最好位置,就是整个群体目前找到的最优解。前者叫做个体极值(pBest),后者叫做全局极值(gBest)。每个粒子都通过上述两个极值不断更新自己,从而产生新一代群体。实际操作中通过由优化问题所决定的适应度函数值(fitnessvalue)来评价粒子的“好坏”程度。很显然,种群中每个粒子的行为都是:追随着当前的最优粒子,在解空间中进行搜索[7]。