前言:中文期刊网精心挑选了神经网络范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络范文1
人工神经网络是近年来迅猛发展的前沿课题,它对突破现有科学技术的瓶颈起到重大的作用。本文剖析了人工神经网络的特征、模型结构以及未来的发展趋势。
【关键词】人工神经网络 神经元 矩阵
1 人工神经网络概述
人工神经网络(ANN)是一种用计算机网络系统模拟生物神经网络的智能神经系统,它是在现代神经生物学研究成果的基础上发展起来的,模拟人脑信息处理机制的一种网络系统,它不但具有处理数值数据的计算能力,而且还具有处理知识的学习、联想和记忆能力。
人工神经网络模拟了大脑神经元的组织方式,反映了人脑的一些基本功能,为研究人工智能开辟了新的途径。它具有以下基本特征:
1.1 并行分布性
因为人工神经网络中的神经元排列并不是杂乱无章的,往往是以一种有规律的序列排列,这种结构非常适合并行计算。同时如果将每一个神经元看作是一个基本的处理单元,则整个系统可以是一个分布式处理系统,使得计算快速。
1.2 可学习性和自适应性
一个相对很小的人工神经网络可存储大量的专家知识,并能根据学习算法,或利用指导系统模拟现实环境(称为有教师学习),或对输入进行自适应学习(称为无教师学习),可以处理不确定或不知道的事情,不断主动学习,不断完善知识的存储。
(3)鲁棒性和容错性
由于采用大量的神经元及其相互连接,具有联想映射与联想记忆能力,容错性保证网络将不完整的、畸变的输入样本恢复成完整的原型,鲁棒性使得网络中的神经元或突触遭到破坏时网络仍然具有学习和记忆能力,不会对整体系统带来严重的影响。
1.3 泛化能力
人工神经网络是大规模的非线性系统,提供了系统协同和自组织的潜力,它能充分逼近任意复杂的非线性关系。如果输入发生较小变化,则输出能够保持相当小的差距。
1.4 信息综合能力
任何知识规则都可以通过对范例的学习存储于同一个神经网络的各连接权值中,能同时处理定量和定性的信息,适用于处理复杂非线性和不确定对象。
2 人工神经网络模型
神经网络是在对人脑思维方式研究的基础上,将其抽象模拟反映人脑基本功能的一种并行处理连接网络。神经元是神经网络的基本处理单元。
在神经网络的发展过程中,从不同角度对神经网络进行了不同层次的描述和模拟,提出了各种各样的神经网络模型,其中最具有代表性的神经网络模型有:感知器、线性神经网络、BP网络、自组织网络、径向基函数网络、反馈神经网络等等。
3 神经元矩阵
神经元矩阵是神经网络模型的一种新构想,是专门为神经网络打造的一个矩阵,它符合神经元的一切特征。
神经元矩阵采用矩阵形式,它可为n维向量组成。引入向量触头和信使粒的概念,向量触头可生长,即长度可变,方向可变,信使粒可“游荡”在矩阵中,建立各种联系。如图1即是神经元矩阵模型
(1)容器可产生一种无形的约束力,使系统得以形成,容器不是全封闭的,从而保证系统与外界的沟通和交互;各向量间可用相互作用的力来联系,而各个信使粒则受控于容器、中空向量以及其它的信使粒。各神经元之间自主交互,神经元矩阵是一种多层次的管理,即一层管理一层。系统具有明显的层级制和分块制,每层每块均独立且协同工作,即每层每块均含组织和自组织因素。
(2)向量触头是中空的,信使粒可以通过向量或存储于向量中,所以又称为中空向量。向量存储了信使粒后,可以吸引更多的信使粒在附近,或使邻近向量转向、伸长,进而形成相对稳定的信息通路。
(3)当两条或更多的信息通路汇集时,可能伴随着通路的增强、合并,以及信使粒的聚集、交换,这是神经元矩阵运算的一种主要形式。通路的形成过程,也就是是神经元矩阵分块、分层、形成联接的过程,也为矩阵系统宏观管理、层级控制的实现奠定了基础。
神经元矩阵亦是一种具有生物网络特征的数学模型,综合了数学上矩阵和向量等重要概念,是一种立体的矩阵结构。尤其是将矩阵的分块特性和向量的指向特征结合起来,更好的体现了神经网络的整体性和单元独立性,系统的组织和自组织特征也更为凸显。信使粒以“点”的数学概念,增强了系统的信息特征,尤其是增强了矩阵的存储和运算功能。
4 人工神经网络的发展趋势
人工神经网络是边缘叉科学,它涉及计算机、人工智能、自动化、生理学等多个学科领域,研究它的发展具有非常重要意义。针对神经网络的社会需求以及存在的问题,今后神经网络的研究趋势主要侧重以下几个方面。
4.1 增强对智能和机器关系问题的认识
人脑是一个结构异常复杂的信息系统,我们所知道的唯一智能系统,随着信息论、控制论、计算机科学、生命科学的发展,人们越来越惊异于大脑的奇妙。对人脑智能化实现的研究,是神经网络研究今后的需要增强的地发展方向。
4.2 发展神经计算和进化计算的理论及应用
利用神经科学理论的研究成果,用数理方法探索智能水平更高的人工神经网络模型,深入研究网络的算法和性能,使离散符号计算、神经计算和进化计算相互促进,开发新的网络数理理论。
4.3 扩大神经元芯片和神经网络结构的作用
神经网络结构体现了结构和算法的统一,是硬件和软件的混合体,神经元矩阵即是如此。人工神经网络既可以用传统计算机来模拟,也可以用集成电路芯片组成神经计算机,甚至还可以生物芯片方式实现,因此研制电子神经网络计算机潜力巨大。如何让传统的计算机、人工智能技术和神经网络计算机相融合也是前沿课题,具有十分诱人的前景。
4.4 促进信息科学和生命科学的相互融合
信息科学与生命科学的相互交叉、相互促进、相互渗透是现代科学的一个显著特点。神经网络与各种智能处理方法有机结合具有很大的发展前景,如与专家系统、模糊逻辑、遗传算法、小波分析等相结合,取长补短,可以获得更好的应用效果。
参考文献
[1]钟珞.饶文碧.邹承明著.人工神经网络及其融合应用技术.科学出版社.
神经网络范文2
原理与方法
神经网络是一个具有高度非线性的超大规模连续时间动力系统。是由大量的处理单元(神经元)广泛互连而形成的网络。它是在现代神经科学研究成果的基础上提出的,反映了脑功能的基本特征。但它并不是人脑的真实描写,而只是它的某种抽象、简化与模拟。网络的信息处理由神经元之间的相互作用来实现;知识与信息的存储表现为网络元件互连间分布式的物理联系;网络的学习和计算决定于各神经元连接权系的动态演化过程。因此神经元构成了网络的基本运算单元。每个神经元具有自己的阈值。每个神经元的输入信号是所有与其相连的神经元的输出信号和加权后的和。而输出信号是其净输入信号的非线性函数。如果输入信号的加权集合高于其阈值,该神经元便被激活而输出相应的值。在人工神经网络中所存储的是单元之间连接的加权值阵列。
神经网络的工作过程主要由两个阶段组成,一个阶段是工作期,此时各连接权值固定,计算单元的状态变化,以求达到稳定状态。另一阶段是学习期(自适应期,或设计期),此时各计算单元状态不变,各连接权值可修改(通过学习样本或其他方法),前一阶段较快,各单元的状态亦称短期记忆(STM),后一阶段慢的多,权及连接方式亦称长期记忆(LTM)〔1〕。
根据网络的拓扑结构和学习规则可将人工神经网络分为多种类型,如不含反馈的前向神经网络、层内有相互结合的前向网络、反馈网络、相互结合型网络等〔2〕。本文的人工神经网络模型是采用BP算法的多层前馈网络。
该模型的特点是信号由输入层单向传递到输出层,同一层神经元之间互不传递信息,每个神经元与邻近层所有神经元相连,连接权用Wij表示。各神经元的作用函数为Sigmoid函数,设神经网络输入层的p个节点,输出层有q个节点,k-1层的任意节点用l表示,k层的任意节点用j表示,k+1层的任意节点用l表示。Wij为k-1层的第i个神经元与k层的第j个神经元相连接的权值。k-1层的节点i输出为O(k-1)i,k层节点j的输出为:
k层节点j的输出为:
Okj=f(netkj)
设训练样本为(X,Ye),X为p维向量,加到输入层;Ye为q维向量,对应于期望输出;网络的实际输出Y也是q维向量。网络在接受样本对的训练过程中,采用BP算法,其权值调整量为:
ΔWij=-ηδkjO(k-1)i
其中,对于输出层为:
δkj=yj(1-yj)(yej-yj)
对于非输出层为:
η为训练步长,取0<η<1。
用样本集合反复训练网络,并不断修改权值,直到使实际输出向量达到要求,训练过程结束〔3〕。
上述人工神经网络可以完成多种信息处理任务,如从二进制数据中提取相关知识,完成最近邻模式分类,实现数据聚集等。而本文要用的是其极强的数学逼近映射能力,即开发合适的函数f:ARnBRn,以自组织的方式响应以下的样本集合:(x1,y1),(x2,y2)…,(xm,ym),其中yi=f(xi)。这里描述的是一般的数学抽象,像识别与分类这些计算都可以抽象为这样的一种近似数学映射。
所谓诊断,实质上是一个分类问题。即根据候诊者的症状,医学检查结果(如体温、心跳等)等一些情况,它们可以用一向量(e1,e2,…,em)来表示,将其归类为病人或非病人。这也可以转化为寻找一差别函数f使得:
(1)f(e1,e2,…,em)>ε,(e1,e2,…,em)∈T
(2)f(e1,e2,…,em)>ε,(e1,e2,…,em)T
其中集合T表示患病。
因此,病情诊断最终也可作为一类函数的逼近问题。
而许多研究已表明,前向神经网络可作为非线性逼近的标准型。对于实数空间的任一函数,只要它满足一定的条件,一定存在唯一的具有单一隐层的前向网络作为它的最优最佳逼近。而含有两个隐含层的前向网络可在任意的平方误差内逼近某一实函数〔3〕。
诊断步骤
肺癌病例数据选自1981~1994年在某医院住院的病人,共计551例。其中486例(88%)经病理学、细胞学诊断证实为肺癌。每一病例都包括多项数据,其中用于诊断的数据项有:病人的一般情况(如年龄、性别等),家族史、既往史、吸烟史、术后病理、X射线检查、CT检查、纤维支气管镜检查、PAT痰检等多达58项。因此,原则上58项数据应作为神经网络的输入项,而神经网络的输出值就是病人是否患肺癌的结果。
1.网络训练集的确定:在最原始的551例病人数据中存在着各种各样的差别,如性别差异(419例男性,132例女性),诊断结果的差异(486例经证实为肺癌),所患肺癌种类的差异(鳞癌、小细胞癌、大细胞癌等),患病程度上的差异(早、中晚期的不同)等等。显然,训练数据集应最大限度地保证兼顾各种病例情况。经过仔细筛选,选择了含有460个病例的集合作为肺癌诊断用的网络的训练集。
2.神经网络输入和输出数据的预处理
按照人工神经网络的理论,神经网络的输入输出数据都应该属于(0,1)区间的实数,为此我们需对原始数据进行如下的规一化处理:
其中xi为原始数据项,而Max=max{xi∶xi∈X},Min=min{xi∶xi∈X}。这里X为原始数据集。经过(7)式变换后,yi将在(0,1)区间。因此,可作为神经网络的输入输出。
3.应用神经网络进行肺癌诊断
将描述病人各种情况的数据作为前向网络的输入数据加到其输入端,并按(1)~(6)式计算各神经元的输入和输出,同时调整神经元之间的连接权值以使网络的输出和实际的病例情况相符。即当病人确实患肺癌时网络的输出结果也恰好指示为肺癌,反之亦然。如果对所有的训练样本集网络的输出基本上(95%或更高)能保证与实际结果一致,则训练过程结束。我们认为神经网络已建立起病人的各种因素与他是否是肺癌患者之间的函数映射关系。对于一个新的候诊病人来说,只要将他的情况输入到训练好的神经网络中去,根据网络的输出结果就可以知道他是否已患肺癌。
表1基于不同发病因素的诊断网络模型
类型训练集精度测试集精度
基于遗传因素的诊断网53.8%46.3%
基于个人生活习惯的诊断网57.1%44.9%
基于病症的诊断网89.4%83.3%
基于医学检查结果的诊断网98.5%92.6%
上述结果表明不同类型的因素应分开来考虑。于是我们将58项输入数据分成四类,这四类有各自的BP诊断网,依次称为诊断一、诊断二、诊断三、诊断四。它们先单独测定,然后再将它们各自的结果综合起来得出最后的判断。
上述四种诊断网络所得结果的可靠性各不相同。其中,根据医学检查结果所作的诊断准确性最高,因此在最后的综合分析中要重点考虑它的诊断结果,我们给它设一个相对最高的权值。其次,根据病人的症状所作的诊断往往也具有较高的准确性,因此给它的权值也较高,但比医学检查结果的稍低。其他两类因素在有关肺癌的诊断中仅具参考作用,因而所设的权值相对较小。转
最后的结果O为:
O=a1.O1+a2.O2+a3.O3+a4.O4
a1+a2+a3+a4=1
其中Oi,ai,i=1,2,3,4分别为各诊断网的输出及其对应的权值。
当O>0.5时最后的诊断结果为患肺癌,反之则正常。对所有的病例数据经上述方法的诊断结果见表2。
表2神经网络对肺癌诊断结果分析
神经网络
诊断结果训练数据测试数据
肺癌患者非肺癌患者肺癌患者非肺癌患者
+4602253
-038122
其中对于训练集,肺癌病人的正确检出率为100%,非肺癌病人误诊率为5%。对于测试集,肺癌病人的正确检出率为96.2%;非肺癌患者正确检出率为88%,误诊率为12%。
讨论
1.本研究所采用的人工神经网络的肺癌诊断方法的结果较好地符合了已知数据,具有较高的准确性,特别是对于肺癌患者一般都能准确地做出诊断,有利于肺癌的早期发现和治疗。
2.要想进一步提高该方法的准确性,应该注意收集更多更全面的病例数据。人工神经网络主要是利用它能自动从数据集中抽取函数的关系的功能。如果我们所使用的数据越多越全面,则其中所蕴含的事物本身的规律性就越强,利用人工神经网络从中所抽取的函数关系就越具有普遍性,因而就更准确。
3.实现对肺癌的诊断的关键在于准确找到罹患肺癌的判定函数,可利用前向网络的函数逼近功能来实现。但是这里涉及到两个问题。首先,由于差别函数和预测率函数都是利用人工神经网络从已知的病例数据集中抽取出来的,它实际反映的是这些数据集中输入输出对的映射关系。因此要想保证诊断具有较高的准确性,就应该使用来建立函数关系的这些数据集(称训练集)具有充分的代表性,即这些数据应基本蕴含肺癌诊断的医学原理。这就涉及到如何选择网络合理的训练集及关键的输入项。另一个问题涉及到神经网络本身的要求,即网络的输入输出数据值都应在区间(0,1)中。这可以通过数据的编码和归一化来实现。
4.由于某些原因有些病人的病例数据不完整,约占总病例数据的10%左右。显然,如果按照传统的方法来建立肺癌病人的诊断模型〔4〕,这些有缺项的数据是不太好处理的,但是由于人工神经网络有较强的容错性,输入数据在某些项上的错误对网络最终结果的正确性影响不大。
参考文献
1.焦李成.神经网络系统理论.第1版.西安:西安电子科技大学出版社,1995,3
2.WangZhenni,ThamMingT,MorrisA.MultilayerFeedforwardNeuralNetworks:ACanonicalformApproximationofNonlinearity,IntJ.Control,1992,56(3):655~672.
神经网络范文3
引言
分子蒸馏是一种新型的在高真空条件下进行的液-液分离技术,具有蒸馏温度低(低于物质沸点温度)真空度高,物料受热时间短,分离程度高等特点;且分离过程不可逆,没有沸腾鼓泡现象[1]。特别适用于分离高沸点、热敏性、高粘度和易被氧化的物质。但是分子蒸馏过程是一个极其复杂的过程,实际生产中除了发挥其优点外,还要要兼顾生产效率及产品质量,因此,分子蒸馏生产工程的工艺参数优化是一个多目标组合优化问题[2]。生产中根据生产目标选择相应的工艺指标,这就需要进行反复实验来获取目标下的最佳工艺参数值。由于分子蒸馏过程的复杂性,导致其工艺参数比较多,难以用数学方法来解决。而人工神经网络具有人体脑神经系统的信息处理机制,可以映射任何较为复杂的非线性关系,具有自学习能力。本文采用应用较为广泛的BP神经网络和遗传算法相结合,将其运用到分子蒸馏过程中的工业参数优化中,通过给定分子蒸馏的工艺参数及生产指标,经过大量样本的学习训练使网络达到允许的误差范围,映射工艺参数与生产指标之间的复杂非线性关系[3-4]。以该模型的预测性能输出作为目标函数,对工艺参数进一步优化,从而实现预定的工艺指标下的分子蒸馏工艺参数的优化。
1分子蒸馏参数测试实验
1.1分子蒸馏过程模型气体分子从液体表面溢出,由于其自由程的不同,与其他分子碰撞前的飞行距离各不相同。分子蒸馏技术就是利用不同种类分子逸出液面后平均自由程不同的性质实现分离的。Langmuir[5]根据理想气体的动力学理论提出了分子自由程的数学模型:式中,p为分子所处环境压强;λm为分子运动平均自由程;d为分子有效直径;T为分子所处环境温度;k为玻尔兹曼常数。由式(1)分子平均自由程公式可知,气体分子平均自由程与温度成正比,与压强反比。当加热板上的物料达到一定温度时,分子平均自由程大于板间距离的轻组分脱离加热板飞向冷凝板,在冷凝板上捕获,而平均自由程小于板间距的重组分到达不了冷凝板,从而实现了物质的分离。其分离过程如图1所示。
1.2实验设备本文在DCH-300三级分子蒸馏装置的基础上进行参数测试实验研究。实验装置的刮膜式短程蒸发器分子蒸馏过程为:液料放入原料罐被计量泵抽取。泵用稳定流量输送物料,经过管道被送入降膜器内的旋转分配器,在离心力的作用下,被甩向夹套加热室内壁,这时物料液体受重力的作用,沿着内壁向下流动,与此同时装在转轴上的刮板,把料液刮成簿膜,这样料液受加热而蒸发,由于在重力及离心力的作用下,不断地更新液膜。根据分子运动理论知道,液体混合物的分子受热后运动会加剧,当接受到足够的能量时,轻组分首先就会从液面溢出而成为气体分子,当气体分子逸出碰到内冷凝列管时,瞬即从气体变为液体并被柱下气相罐收集,重组分因达不到逸出温度,而仍然以液体状态流出蒸馏柱,由液相罐收集。图2为蒸馏装置的工艺原理图,其中,H1、H2、H3为三级的蒸发器,蒸发器面积分别为0.02m2,0.26m2,1.1m2。L1、L2、L3为三级的冷凝器,并且每一级的蒸发器都配有各自的刮膜电机,可以控制刮膜转速,提高蒸发速率,每一级的冷凝系统都与冷机相连,保证具有合适的冷凝温度。第二级包括一个水环真空泵、2个罗茨真空泵,1个增压真空泵构成的泵组,第三级包括旋片真空泵和增压泵,三级真空度越来越高,蒸馏的温度就可以逐级降低,达到负压低温蒸发的降低能耗的目的。
1.3实验方案及结果本实验采用了3次蒸馏,第一级蒸馏为预脱气、脱水处理阶段,即薄膜蒸发阶段,为确保后续蒸馏时具有足够高的真空,而除去物料的空气和溶剂等组份。物料进蒸馏器之前,经一级除气装置进行脱气处理,然后以一定的速率进入二级、三级分子蒸馏刮膜器中,在高真空和适宜的蒸馏温度下进行,分离出残余物和馏出物。实验安排采用在改变一个因素的单因素实验设计下,固定其他参数,对得到的实验结果进行比较,以便对这一因素的影响作出结论。实验水平如表1所示。本次实验共采用9组进行试验,通过改变蒸馏温度、进料速率和真空度等参数,对实验所得精油含量与得率的影响。实验结果如表2所示通过上述试验结果可以看出,并不是工艺参数(即蒸馏温度、进料速率和真空度的值)越大越好,且没有规律可循。也有采用正交试验进行工艺参数优化的方法,但对于分子蒸馏采取该种方法不可行,因为正交实验法是当真空度不变时,通过多次实验得到最佳温度,在此温度下再通过多次蒸馏实验摸索最佳真空度,而分子蒸馏的蒸发器的温度与真空度是具有耦合关系的量,当真空度改变,物质的沸点发生改变,即真空度变化,最佳蒸馏温度随之改变,因此为了提高生产效率及产品指标,进行高效、高质地分离提取,本文采用了基于BP网络和遗传算法的分子蒸馏工艺参数优化方法。
2BP神经网络及遗传算法优化模型的建立
2.1基本原理人工神经网络信息处理、鲁棒性、自学习及非映射能力较强,遗传算法具有并行、随机和自适应搜索等优点[6]。本文采用神经网络与遗传算法相结合的优化设计方法,充分利用二者优点。基本原理是:首先通过试验获得目标函数与工艺参数之间的离散试验数据关系。将试验数据作为网络的样本,对网络进行训练,当网络达到误差要求时,存储权值阈值,利用网络的记忆功能,建立起工艺参数与指标之间的非线性映射关系。再利用遗传算法对这一黑匣型的函数求解。上述优化问题的数学表达形式为:其中,xi表示神经网络的输入,yi表示神经网络的输出,f是评价函数。算法的实现过程为:运用试验获得的大量样本对网络进行训练,建立稳定的BP网络预测模型,对训练好的模型在一定范围内随机产生多组输入向量,通过BP预测出相应的输出量,再通过评价函数,计算个体适应度值,再利用遗传算子通过适应度值调整输入向量,产生具有更好适应性的新的种群。通过遗传算子的计算得到优化目标,相应输入即为目标的优化结果。
2.2BP神经网络预测模型BP神经网络是目前应用最广、最为成熟的1种采用误差反向传播的前馈型多层神经网络。包括输入层、中间层和输出层。选取1组训练样本提供给神经网络,经过隐含层激活函数后向输出层传播,隐含层的输出作为输出层的输入,最后获得网络的输入响应。接下来进行的误差的反向传播阶段,即按照网络输出与目标值之间的误差减小方向传播,从输出层到隐含层再到输入层,逐层修正各层之间的连接权值[7-8]。含有一个隐层的3层BP神经网络可以任意精度逼近任何有理函数。本文采用单隐含层的BP神经网络作为预测模型,其模型结构如图3所示。大量学习样本对BP神经网络进行训练后,分子蒸馏工艺参数与产品指标之间就会通过神经网络建立起1种能映射二者之间内在关系的连接关系,即获得产品指标预测的BP神经网络模型。本文在Matlab7.0神经网络工具箱的基础上[8-9],安排了18组试验样本,选择9组作为训练样本,其余9组作为测试样本,网络结构为3×6×2,输入层节点为3,分别为蒸馏温度,真空度及进料速率;隐层节点为6,输出层为2,分别为产品的含量和得率。数据归一化处理,训练时,不同的训练函数的训练速度和精度不同,这里采用梯度下降法,训练误差曲线如图4所示。经过42次的网络训练,网络的训练误差值就收敛到预定的目标误差0.001。训练后的神经网络用于产品指标预测,由预测结果与试验结果进行比较可知,训练后的神经网络具有较高的预测精度。
2.3优化模型的建立遗传算法是1种通过模拟自然进化过程,根据自然选择和遗传算法,进行随机、自适应搜索最优解的方法。遗传算法将自然界适者生存、劣者淘汰的生物进化原理引入到待优化参数问题中,将待优化变量进行编码,组成初始种群,将其按一定的适应度函数及遗传算子的操作,即选择、交叉和变异,选择适应度值较大的个体,形成高适应值的新群体,经过反复进行,最终找到适应度最大的个体[10],此时的个体即为优化结果。本文以遗传算法作为蒸馏工艺参数的优化方法。式中,W1和W2分别为工艺权值,T1,T2分别为含量与得率的目标值。可见目标函数越小预测值越接近目标值,当目标函数最小时对应的工艺参数值为最优值。遗传算法在进化搜索中基本不利用外部信息,仅以适应度函数为依据,个体的适应度越大,表明其适应能力越强[12-15]。建立的目标函数需符合适应度函数要求,本文采用的适应度函数就是目标函数的倒数。工艺参数优化流程如图5所示。经过遗传算子作用后的工艺参数作为神经网络的输入,通过训练好的神经网络模型输出目标函数值,再计算个体适应度函数值,再进行选择,交叉概率为0.8,变异概率为0.01等遗传操作获得新一代种群。通过反复进化计算,直至适应度函数值趋于稳定,此时的输入值为最优解,优化结果如图6所示。此时W1=W2=0.5,达到稳定后的适应度值为38.97。此时蒸馏温度为120℃,进料速率295r/min,进料速率60L/h。
神经网络范文4
关键词: 小波神经网络; 网络流量; 预测研究; 训练样本
中图分类号: TN711?34 文献标识码: A 文章编号: 1004?373X(2016)23?0098?02
Research on network traffic prediction based on wavelet neural network
LI Xin, SUN Shanshan
(College of Information Engineering, Suihua University, Suihua 152000, China)
Abstract: The relevant theory and method of wavelet neural network are used to establish and predict the network traffic situation of a certain uptown. The acquired network traffic change situation is used as the training sample of the wavelet network to realize the traffic prediction of the network. The simulation results show that the constructed wavelet neural network model has high precision to predict the network traffic.
Keywords: wavelet neural network; network traffic; prediction research; training sample
0 引 言
随着互联网规模的不断增大以及各种网络“新应用”、“新服务”的不断涌现,网络信息变得越来越庞大和多变,对网络访问流量进行精确地预测从而实现对网络运行状态的有效管理,已经逐步成为目前的一个研究热点。网络流量预测是实现网络控制、网络规划,保证网络安全以及提高网络服务质量的重要前提。
网络流量具有自相似性、长相关性和多重分形性等复杂性质,对其进行精确地预测一直以来都是一个难点。目前,常见的网络流量预测方法主要有自回归分析法、马尔科夫分析法、分形布朗运动分析法和神经网络分析法。与前面三种传统方法相比,利用神经网络对网络流量进行预测具有预测精度高、方法简单、泛化性强和稳定性好的特点,正在逐步成为网络流量预测研究中的主流方法。
文献[1]根据网络流量的变化特征,基于BP神经网络提出了一个P2P网络流量预测模型,实现了网络流量的较高精度预测。文献[2]结合小波变换和人工神经网络的优势,建立一种网络流量预测的小波神经网络模型,通过将流量时间序列进行小波分解,获得了网络的训练和验证样本,试验表明采用这种方法进行流量预测,要比直接采用神经网络对样本进行预测的精度高。文献[3]根据网络流量自身的特征,研究了BP神经网络和小波神经网络在校园流量预测中的应用,其所建立的模型,经仿真验证证明,可以较好地预测学校网络的流量变化情况,可以为校园网络的规划和管理提供一定参考。
小波神经网络是一种以BP神经网络拓扑结构为基础,把小波基函数作为隐含节点的传递函数,其拓扑结构如图1所示。它类似于BP神经网络权值修正算法,采用梯度修正法修正网络的权值和小波基函数参数,从而使小波神经网络预测输出不断逼近期望输出[4?5]。
采用小波神经网络进行网络流量预测的基本流程如图2所示。
1 网络流量预测
1.1 试验数据来源
采用网络流量监测软件对某小区的网络流量进行实时采集,得到了该小区5天内的网络流量数据,每隔15 min记录一次该时间段内的网络流量值,一共获得了480个时间点的数据。用4天共384个网络流量的数据训练小波网络,最后用训练好的小波神经网络预测第5天的网络流量。为了避免局部数值偏移造成的误差,本文采用编组的方式提高模型预测精度,用前三个时间点的网络流量来综合预测后一个时间点的网络流量情况[6?7]。
图1 小波神经网络的拓扑结构
图2 小波神经网络进行预测的流程图
1.2 构建小波神经网络模型
本文采用的小波基函数为Mexican Hat小波基函数,其表达式为:
[ψ(t)=(1-t2)e-t22ψ(ω)=2πω2e-ω22]
函数的时域和频域波形图如图3所示[7?8]。
图3 Mexican Hat函数的时域和频域特征
本文采用的小波神经网络结构为3?5?1;输入层有3个节点,表示预测时间节点前3个时间节点的网络流量;隐含层有5个节点;输入层有1个节点,为预测的网络流量。设置网络预期误差值为[1×10-2,]将训练数据输入到Matlab软件中进行训练,训练过程中小波神经网络的误差变换情况如图4所示。由图4可知,该小波神经网络经过58步运算后收敛到预定精度要求。
用训练好的小波神经网络对该小区内第五天的网络流量情况进行预测,预测结果与交通流量的实际值比较如图5所示。在图5中,加“*”曲线对应预测数据,加“[]”曲线对应实际数据,可以看到小波神经网络可以较好地预测网络流量。
为了进一步分析仿真结果,采用绝对值误差均值(MAE)和绝对百分比误差均值(MAPE)两个指标进行评价分析,其中MAE和MAPE分别用下式计算[9]:
[MAE=1ni=1nxi-xiMAPE=1ni=1nxi-xixi×100%]
式中:[xi]表示模型的预测值;[xi]表示模型预测值的算术平均值;[n]为样本数。
小波神经网络的MAE和MAPE值如表1所示。
从表1可以看出,本文构建的小波神经网络的MAE值在3.36 GB左右,而MAPE值小于0.1,说明该预测模型可以较好地预测网络流量的变化情况,反应该小区的流量信息变化,为小区网络的规划和管理提供可靠的依据。
2 结 论
本文在网络流量的预测研究中引入了小波神经网络模型,利用收集到的某小区5天内的网络流量变化数据作为训练和测试样本对构建的小波神经网络进行训练和测试研究。试验结果表明,本文构建的小波神经网络具有较高的预测精度,可以对该小区网络的流量变化情况进行较高精度的预测。
参考文献
[1] 韩志杰,王汝传.一种新的 P2P 网络流量预测模型[J].计算机科学,2008(9):39?14.
[2] 雷霆,余镇危.一种网络流量预测的小波神经网络模型[J].计算机应用,2006(3):526?528.
[3] 张昕.校园网络流量分析与预测研究[D].西安:西安电子科技大学,2012.
[4] 王鸣,孙奕鸣.小波支持向量机的网络流量预测研究[J].计算机仿真,2012,29(11):198?201.
[5] ZHANG Li, ZHOU Weida, JIAO Licheng. Wavelet support vector machine [J]. IEEE transactions on systems, man, and cybernetics, 2004, 34(1): 34?39.
[6] 邓远.BP神经网络评价方法在交通流量评价方面的应用[J].中国交通,2011,35(5):146?151.
[7] 李远航.网络流量预测技术的应用[J].计算机工程应用研究,2014,34(1):131?138.
神经网络范文5
关键词 神经网络;BP;优化算法
中图分类号:TP183 文献标识码:A 文章编号:1671-7597(2014)13-0066-01
1 人工神经网络模型
人工神经网络简称ANN,它是一种将人类大脑的组织结构和运行机制作为其研究基础来模拟人类大脑内部结构和其智能行为的处理系统。人工神经网络中的神经元细胞将其接收到的所有信号进行处理,如加权求和等操作,进行操作后经轴突输出。
2 人工神经网络的分类
2.1 前馈型神经网络
前馈型神经网络通过对其网络中的神经元之间的连接关系进行复合映射,因此这种网络模型具有非常强的非线性处理的能力。如图1所示,在这里前馈型神经网络模型被分为三层,分别为输入层、输出层和隐含层,一般常用的前馈型神经网络有BP神经网络、RBF神经网络、自组织神经网络等。
图1 前向神经网络模型
2.2 反馈型神经网络
反馈型神经网络其结构,在这个模型中我们假设网络总的神经元个数为N,则每个神经元节点都有N个输入值及一个输出值,每个神经元节点都如此,节点之间相互联系。现在被大量使用的反馈型神经网络一般有离散Hopfield神经网络模型、Elman神经网络模型等等。
3 BP神经网络
3.1 BP神经网络简介
1986年,Rumelhant和McCelland提出了BP神经网络的一般模型,BP神经网络是一种具有多层网络的反向传播学习算法。BP神经网络模型的基本思想是:整个过程主要由信号的正向传播和误差的反向传播两个过程组成。目前,BP神经网络的应用范围为数据压缩、数据分类、预测分析和模式识别等领域。
3.2 BP神经网络的结构
如图2所示,这里是BP神经网络的一种模型结构,在这种模型结构中输入信号量为m,具有隐含层的数量为j,输出信号量为q的模型结构。
BP神经网络一般具有一个或多个隐含层单元,其差别主要体现在激活函数的不同。针对BP神经网络所使用的激活函数一
图2 BP神经网络模型结构
般采用S型对数函数或者采用正切激活函数,而输出层则一般采用线性函数作为激活函数。
3.3 BP神经网络的改进方法
BP神经网络作为当今对研究电力负荷预测应用最多的一种神经网络,但标准的BP神经网络算法存在的一些缺陷,这里就对一些经常使用的典型改进方法进行描述。
1)增加动量项。在一般的BP神经网络算法中,其模型中的各层权值在进行更新的过程中,是按照t时刻误差曲线进行梯度下降方式进行调整的,在这里并没有考虑其之间的梯度下降的方向,如果使用这种方式进行调整则会造成训练的过程不稳定,容易发生振荡,导致收敛过程缓慢的结果。因此有些学者就为了使网络训练的速度提高,收敛过程加快,就在一般网络模型的权值更新环节添加了一个动量项因子即:
(1)
在这个式子中,W表示BP神经网络中每一层的权值矩阵,O则表示神经网络中每一层的输出向量矩阵,α则被称为该神经网络的动量系数因子,其取值范围在0到1之间,在该网络在进行训练的过程中,如果其误差梯度网线出现了局部极小值现象,虽然在这里的第一项会趋搂于零,但是这一项,
这样就会使该训练过程避免了限入局部极小值区域的形势,从而加快了其训练速度,使该神经网络收敛速度加快,因此这种带有动量项因子的BP神经网络算法应用到了很多的BP网络中。
2)学习速度的自适应调节方法。学习速度η在一个标准的BP神经网络中是以一个常数出现的我们也称为之步长,而在实际的运算过程中,很难找到一个数值作为最优学习速度。我们从误差曲面图形中可以看出,当曲面中区域处于一个平坦区域时,我们需要设置一个比较大的η值,使它能够跳出这个平坦的区域;而当曲面中的区域处于变化比较很大的区域时,这时的η的数值我们又需要将其进行减小或者增大操作。自适应调整学习速度η则可以根据网络的总误差来进行自我调整,在网络经过多次调整后,如果E总继续上升,则表明这里的调整是无效的,且η=βη, ;而经常调整这里的E总下降了,则表明这里的调整是有效果的,且η=αη,。
3)引入陡度因子(防止饱和)。在网络训练的过程中,由于其误差曲面具有平坦区,当处于这个区域时,由于S型激活函数有饱和特性,促使权值的调整速度放慢,从而影响了调整的速度。在训练的过程中,如果算法调整进入了这个区域,我们可以减小神经元的输入量,使其输出值迅速脱离激活函数的饱和区域,这里误差函数的数值则会随之发生改变,其权值的调整也就脱离了该平坦区。想要实现以上思路则需要在激活函数中引入一个陡度因子λ。
(2)
当趋近于0时,而数值较大时,调整其进入误差曲面中的平坦区,此时λ的值应选择大于1的数值;而当调整脱离平坦区域后,再设置λ大于1,使激活函数能够恢复到原始数值。
4 总结
综上所述,设计一个人工神经网络应用到实际问题中,可以归结为网络自身权值参数的学习与合理的设计网络拓扑结构这两大类优化问题。由于人工神经网络的训练是一个非常复杂的问题,使用传统的学习算法进行训练则要花费很长的时间,BP算法用到了梯度下降法,才只能在一定范围内找到合适的参数值及其模型结构。因此,为了更好的提高神经网络的泛化能力,及将网络拓扑结构设计的更加合理,大量关于神经网络的优化算法相继产生。
参考文献
神经网络范文6
关键词:神经网络;应用研究
中图分类号:TP393文献标识码:A文章编号:1009-3044(2008)22-635-02
Application of Neural Network Study
WANG Ying1,LI Bing-fu2
(1.Information Science and Technology College,Zhanjiang Normal College,Zhanjiang 524048,China;2.Registry,Information Science and Technology College,Zhanjiang Normal College,Zhanjiang 524048,China)
Abstract:The study of the purpose of Artificial Neural Network,from the neural network of research and advantages, and other aspects proceed, the statement focused on neural networks in the economic field, the food industry, environmental science and engineering applications.
Key words: Neural Networks; Applied Research
1 引言
人工神经网络(Artificial Neural Network, ANN)简称神经网络,是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所做出的交互反应,并利用机器模仿人类的智能是长期以来人们认识自然、改造自然和认识自身的理想。研究人工神经网络的主要目的包括:探索和模拟人的感觉、思维和行为的规律,设计具有人类智能的计算机系统;探讨人脑的智能活动,用物化了的智能来考察和研究人脑智能的物质过程及其规律。
2 神经网络(ANN)的研究内容
1)理论研究:ANN模型及其学习算法,试图从数学上描述ANN的动力学过程,建立相应的ANN模型,在该模型的基础上,对于给定的学习样本,找出一种能以较快的速度和较高的精度调整神经元间互连权值,使系统达到稳定状态,满足学习要求的算法;2)实现技术的研究:探讨利用电子、光学、生物等技术实现神经计算机的途径;3)应用的研究:探讨如何应用ANN解决实际问题,如模式识别、故障检测、智能机器人等;4)基本模型如图1示。
■
图1生物神经元功能模型
3 神经网络(ANN)的研究在各领域的优缺点
人工神经网络的理论研究和应用研究已取得丰硕成果,对于在各领域的应用具有以下优点:1)学习能力:人工神经网络具有学习的能力,通过学习,人工神经网络具有很好的输入-输出映射能力。学习方式可分为:有导师学习(Learning With a Teacher)和无导师学习(Learning Without a Teacher);2)容错性:容错包括空间上的容错、时间上的容错和故障检测。容错性是生物神经网络所具有的特性,靠硬件或软件实现的人工神经网络也具有容错性。由于在人工神经网络中信息存储具有分布特性,这意味着局部的损害会使人工神经网络的运行适度地减弱,但不会产生灾难性的后果;3)适应性:人工神经网络具有调整权值以适应变化的能力,尤其是在特定环境中训练的神经网络能很容易地被再次训练以处理条件的变化,这反映了人工神经网络的适应性;4)并行分布处理:采用并行分布处理方法,同时由于计算机硬件的迅猛发展,使得快速进行大量运算成为可能;5)仿真软件的逐步完善:人工神经网络仿真软件的逐步完善,将人们从繁琐的编程中解放出来,同时也为人工神经网络在各领域的应用研究提供了可进行分析和预测的能力。
缺点:研究受到脑科学研究成果的限制;缺少一个完整、成熟的理论体系;研究带有浓厚的策略和经验色彩;与传统技术的接口不成熟。
4 神经网络在各领域的应用研究探讨
4.1 神经网络在经济领域的应用研究探讨
神经网络在经济领域的应用主要有:1)价格预测影响商品和服务:价格变动的因素是复杂、多变的,传统的统计经济学方法存在不适合动态系统、建模复杂等局限性,难以对价格变动做出科学的预测,人工神经网络容易处理不完整的、模糊不确定或规律性不明显的数据,所以用人工神经网络进行价格预测是可行的,且有着传统方法无法比拟的优势;2)风险评估:风险是由于从事某项特定活动过程中存在的不确定性而产生的经济或财务的损失、自然破坏或损伤的可能性。防范风险的最好办法就是事先对风险做出科学的预测和评估,传统的专家评估依赖于专家的经验,存在着人为和主观的因素,人工神经网络的预测思想是建立风险来源和风险评价系数的非线性映射,提供定量的解决方案,弥补了主观评估的不足。商业银行的风险管理问题是我国加入WTO后的一个突出问题。目前,信用风险仍然是我国商业银行最主要的风险。我国商业银行目前正处在转轨时期,用传统方法评估信用风险难以达到满意的效果,而神经网络学习能力强,容错性好,具有很强的鲁棒性,适合评价信息不全的系统。根据我国的具体现实,运用人工神经网络技术,构造出适合中国的信用风险模型,并对某国有银行提供的数据进行了实证研究。
4.2 神经网络在食品工业中的应用研究探讨
神经网络在食品工业中的应用研究主要有:1)外来物的探测:对食品中偶尔混入极少量的外来物采用先进的仪器探测方法,如X射线衍射,可较为快速而准确地检测出食品中夹带的外来物。仪器探测法产生大量的测量数据可以利用分析运算方法能快速地从大量的数据中找出差异而判别出外来物,从而提高生产的效率。分析方法很多,但目前较为有效的是ANN法――例如对于软质外来物如木屑和塑料,在X射线数据上外来物与食品原料的差异很小,情况更为复杂,很难做出判别。根据ANN自学习自适应的特点,不是只采用一个简单的ANN,而是构造了一组子网络。让每一子网络用来识别一种外来物,各自训练子网络,然后将结果最后融合输入一个决策单元,让决策单元决定食品是否合格;2)掺假食品的鉴别:掺假物是人为地故意地加入食品中,可根据不同食品初步估计加入的掺假物的种类,选用相应的检测方法,并结合ANN算法对测量数据分析,可获得较满意的结果;3)分类与分级:果蔬外观特征很多,随季节、产地和品种不同而不同,可抽取主要特征,再运用ANN模式识别算法进行分类。颜色往往是衡量果蔬外部品质的一个重要指标,也间接反映果蔬的成熟度和内部品质,高品质的果蔬一般着色好。此外,ANN除可进行果蔬分类(分级)外,还可以对肉类分级。从肉类的图像处理数据中提取“大理石纹值”(marbling score,表征脊肉中脂肪分布密度)来表征肉类质量,运用三层前向型ANN进行模式识别,效果令人满意;4)加工过程的仿真与控制:食品加工过程总是难以规范地操作,因为食品物料的性质与季节、产地与气候紧密地联系,同是由于缺乏合适的传感器或不足够和不精确的在线测量,以及食品的物性的时变性。在传统的过程仿真中,需要建立假设、简化和大量的参数用来建立数学模型,这有可能与实际情况相差很远。因此,具有对非线性和非稳态系统有强处理能力的ANN尤适合应用于食品加工;5)感观评价与预测、食品配方设计等:以往常用的建模方法是多元回归法,但是在多因子、非线性的条件下多元回归法并不适用。ANN则有效地解决这一问题。采用ANN先对已有的27组数据进行拟合;然后用ANN进行模拟,输入各种配方成分的含量,ANN就会输出预测结果,从中挑选出最佳的配方。
4.3 神经网络在环境科学与工程中的应用探讨
神经网络在环境科学与工程中的应用主要有:1)环境质量评价;2)环境系统因素预测;3)环境因素定量关系模拟构效分析、成因分析;4)污染防治系统建模。由于BP神经网络具有优良的非线性逼近能力,1994年以来,已在环境科学与工程的环境质量评价与预测、监测点的优化布置、社会经济环境可持续发展、污染物降解与释放、水(处理、生态)系统的模拟与预测等方面获得了广泛的应用。
5 结束语
由于神经网络学科的范围涉及很广泛,文中仅在那些有发展前途的领域中,列举出少数几个方向,应该说明的是,除了上述列举的以外,还有形形的、规模可观的研究工作正在进行,其未来的发展必将是激动人心的。神经网络理论的前沿问题必将渗透在21世纪科学的挑战性问题中,并将取得重大的突破。
参考文献: