前言:中文期刊网精心挑选了神经网络方法范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络方法范文1
关键词:神经网络;数据挖掘;算法
1.数据挖掘过程及常用的神经网络模型
1.1数据挖掘过程
数据挖掘是一个由诸多步骤共同组成的具有反复特性的迭代过程,其最主要的目的是从海量的数据当中,找出人们最感兴趣的信息。大体上可将数据挖掘过程分为3个阶段,即数据准备、模式提取以及结果的解释与评估。
(1)第一个阶段为准备所需的数据,具体可将这个阶段细分为数据清洗、数据选取以及数据预处理和数据表示四个步骤。数据是数据挖掘过程中不可或缺的重要前提和基础,但大量的实践表明,只有数据是很难进行挖掘工作的,必须在对数据进行挖掘前,做一些相应的准确工作,这些工作也成为数据挖掘的重要环节。
(2)第二阶段为模式提取。该阶段是数据挖掘的核心环节,需要先明确数据挖掘的任务及目标,并在正式确定目标之后,选择合适的算法或工具,开始对数据进行挖掘操作。在这个环节当中,算法是关键,即可选择单一的算法,也可多种方法联合使用,具体的选择应视挖掘的任务而定。
(3)第三阶段为解释与评价。挖掘过程中发现的模式应当以最容易理解的形式呈现给用户,其间要对发现的模式进行比较、校验,看是否与用户的要求相符,进而确定出挖掘效果。
1.2神经网络模型
现阶段,已知的人工神经网络模型有40多种,较为常用的有以下几种:
(1)BP神经网络。BP是误差反向传播的简称,这种神经网络归属于前馈网络的范畴,其具有多层映射的特征,该网络所采用的主要学习方式为最小均差,结构简单、学习训练算法成熟、工作状态稳定是BP模型的3大特点,正因如此使得该模型获得了非常广泛的应用。由于BP算法对误差函数有着一定的要求,即误差函数必须可微,故此,为了有效克服局部极小的问题,多以全局优化算法为主,如遗传算法等。
(2)RBF神经网络。RBF是径向基函数的简称,该网络与BP网络在归属的范畴上相同,也属于前馈网络。RBF网络在激活函数方面有多种可选择,最常用的是高斯函数,因为这种函数具有很多显著的特点,如形式简单、径向对称、容易解析等等。由于RBF网络是一个多层前馈网络,故此只要隐单元足够多,便可达到任意给定精度,其在逼近目标时,采用的化整为零的思想,即将目标分解成为若干个局部对象。
(3)混合型神经网络。这是―种将其它方法有机融合到―起构成的神经网络模型,它与传统网络模型的拓扑结构相同,但学习机制却有所不同。常用的混合型神经网络有模糊和进化2种。
2.基于神经网络的数据挖掘方法
2.1神经网络在数据挖掘中的应用优势
神经网络是一门实用性较强的科学技术,其集多种现代技术于一身,有诸多并行分布的处理单元连接而成。从系统的角度上讲,神经网络归属于动态系统的范畴,具有自适应和非线性的特征,对噪声数据有着非常强的容错和承受能力。由于神经网络所具有的这些特点,使得基于神经网络构建的数据挖掘模型具备了与之相同的特点,这样便可以适应数据环境的不同变化,由此进一步提升了数据挖掘模型的准确性。可见,神经网络十分适用于数据挖掘领域。
2.2基于神经网络的数据挖掘过程
由上文分析可知,在数据挖掘领域中,神经网络具有较高的适用性,以此为基础的数据挖掘过程分为以下几个阶段。
2.2.1数据的选择及预处理阶段
数据选择的主要目的是为神经网络的构建提供相应的数据支撑,这个过程可以细分为以下2个环节:(1)对数据进行训练,(2)对数据进行测试。观察和理解是选择数据时必须做的工作,当样本数据集确定之后,便可按照挖掘目标,并结合挖掘方法,对数据进行编码处理。
2.2.2网络训练与剪枝
当数据选择和处理工作完成之后,数据挖掘人员需要选用一个神经网络模型,同时确定相应的网络训练算法,通过该算法对神经网络进行训练。剪枝的主要作用是以神经网络的准确性为前提,去除掉没有意义和价值的冗余结点由此会使网络模式更加简练,也更容易理解。
2.2.3规则的提取与评估阶段
经过以上2个阶段后,神经网络当中便会蕴含着学习到的规则,也就是常说的知识,但是此时的规则由于存在形式的原因,不容易理解,所以需要对规则进行提取。提取规则的主要目的在于将规则的形式转化为容易理解的形式,如模糊逻辑、决策树等,然后再借助测试样本对规则的可靠性进行测试、评估。
2.3基于RBF神经网络的数据挖掘模型设计
下面本文以RBF神经网络为依托,对数据挖掘模型进行设计,其整体框架结构如图1所示。
整个系统由以下模块构成:数据获取、数据处理、数据分类与评估、控制与干预、GUI人机交互、知识库。系统模块的设计情况如下。
2.3.1数据准备
①数据选择。在数据选择中,让用户利用数据访问接口对数据集进行自行选择,进一步确定数据集类型、数据集名称及数据集处所位置。数据访问接口为对象模型,该模型覆盖了数据访问的各个层面,具体可使用的接口包括ADO,DAO和ODBC三种,本系统采用的数据库访问方案为DAO/ODBC,选择该方案的主要原因是DAO既能够与Microsoft Jet数据库引擎并用,还可借助ODBC Direct选项不与其并用。同时,通过DA0对Jet进行访问更加简单、便捷,并且使用DATE控件和DAO,能够创建出与数据库本身无任何关联性的虚拟代码。②数据清理。该环节的主要目的是将不希望包括在内的观测值筛选掉,操作过程既可借助SQn吾句实现,也可借助相关程序予以实现。③数据合成。该环节是将独立的数据合成数据集,操作过程较为简单,只要规则确定便可利用sQL语句或相关程序来实现。
2.3.2数据挖掘
(1)挖掘方法的选择与管理。该环节在系统中具有重要的作用,与系统的可扩充性和最佳挖掘方法的选择有关。挖掘方法管理可对系统中使用的全部方法所产生的接口信息进行保存,如对文本文件分词方法、Web日志的Session戈0分方法等挖掘方法中产生的特定数据信息予以保存,粗糙集、决策树属于通用的挖掘方法。在对该模块进行设计的过程中,针对分类预测问题,使用了聚类和神经网络以及统计学等方法。选择方法的主要目的是几乎所有的方法都是数据依赖,并没苻一种方法能够在所有的数据上表现良好。因此在方法选择的初始阶段,通过专家的人为干预是有必要的。经过对前人的研究成果进行总结后发现,将多种不同的方法联合运用可大幅度提升运用效果。对于本文构建的数据挖掘系统而言,其核心部分为数据挖掘模块,该模块的设计分为3个方面:①训练模块,以训练RBF网络为主,采用数学模型方法构建网络分类模型;②预测模块,在分类实际数据的基础上,将分类产生的数据结果快速传递到评估模块;③重构模块,该模块地能够确保数据挖掘模型具有―定的可扩展性和自适应能力,按照具体需要对模型进行重新构建。(2)结果显示。该环节以多种形式显示数据挖掘结果,如列表、树、图等是最为常见的显示方式。本文采用了可视化的方法进行数据挖掘结果显示,这样能够使用户对挖掘结果的了解更加直观、具体。(3)结果评估。在评估中,采用数据挖掘评价方式,通过比较分析不同模型下产生的数据挖掘效果,从而得出各类型分析工具的最终结果,再配以相应的标准图标进行直观显示,方便用户利用相关数据信息开展定量评价。在结果评估中,强调获取规则的价值评定,其评价关键点为查看数据挖掘结果与用户期望的符合程度,并对挖掘结果的可靠性和价值性进行评价,将其作为知识库是否纳入规则的重要评判依据。在GUI交互界面上,数据挖掘系统与用户可以进行交互操作。
2.4安全性保障措施
基于RBF神经网络的数据挖掘系统在使用过程中,安全性非常重要,为此,本文提出几点安全性保障措施,以此来确保数据挖掘的安全。
(1)采用登录机制确保数据安全。所谓的登录机制主要是针对客户端的一种安全控制措施。由于用户与服务器端需要通过网络的方式进行数据传输,为了进一步提高数据传输的安全性,可对数据进行加密处理,并将用户挖掘到的数据结果存储在服务器上,由此在不同的计算机上使用客户端均可对之前挖掘到的数据结果进行利用。
(2)设置权限。可以通过用户管理来完成用户的注册、登录以及使用权限管理。当用户需要使用数据挖掘系统进行数据挖掘时,要先进行账号注册,并在使用前通过注册的账号和密码进行登录,从而保证每个用户的数据安全。此外,用户管理能够实现分级管理,赋予不同用户不同的权限,这使安全性获得了进一步提升。
神经网络方法范文2
关键词:卷积神经网络;深度学习;图像处理;训练时间
中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)33-0167-04
如今在机器学习领域中,深度学习方法已经占据了相当重要的地位,通过模仿人X学习方式构造模型,在图像、文本、语音处理方面取得了显著成果[1]。目前应用较为广泛的深度学习模型包含多层感知器模型(MLP)[2],卷积神经网络模型和限制性玻尔兹曼机模型等[4]。多层感知器[2]网络结构的神经节点一般分层排列,主要由输入层,输出层和一些隐层组成,同层之间的神经元节点无连接,相邻的两层神经元进行全连接,前一层的神经元的输出作为后一层神经元的输入,但本身此种算法存在着一些问题,那就是它的学习速度非常慢,其中一个原因就是由于层与层之间进行全连接,所以它所需要训练的参数的规模是非常大的,所以对其进行改进,产生了卷积神经网络模型。卷积神经网络模型在图像识别方面的应用十分广泛[5,8,9]。从它的结构上来看,层与层之间的神经元节点采用局部连接模式,而并非MLP的全连接模型,这样就降低了需要训练的参数的规模。而在它卷积层中,它的每一个滤波器作为卷积核重复作用于整个输入图像中,对其进行卷积,而得出的结果作为输入图像的特征图[6],这样就提取出了图像的局部特征。而由于每一个卷积滤波器共享相同的参数,这样也就大大降低了训练参数的时间成本。而本文,以卷积神经网络为研究对象,在其模型的基础上通过对其结构中卷积核也就是滤波器的大小进行调整并结合卷积核个数调整和gpu加速等已有的训练提速方法,达到降低训练时间并且对识别结果并无太大影响的目的。
1 卷积神经网络
卷积神经网络在MLP的基础上,已经对结构进行了优化,通过层与层之间的局部连接以及权值共享等方式对要训练的参数的进行了大幅减低。
1.1局部连接
BP神经网络中,神经元在本层中呈线性排列状态,层与层之间进行全连接,而在卷积神经网络中,为了减少每层之间的可训练参数数量,对连接方式进行了修改,相对于BP神经网络的全连接,卷积神经网络采取了局部连接的连接方式[7],也就是说按照某种关联因素,本层的神经元只会与上层的部分神经元进行连接。
2.2 权值共享
在CNN中,卷积层中的卷积核也就是滤波器,重复作用在输入图像上,对其进行卷积,最后的输出作为他的特征图,由于每个滤波器共享相同的参数,所以说他们的权重矩阵以及偏置项是相同的。
我们从上图看出,相同箭头连线的权值是共享的,这样在原有的局部连接的基础上我们又降低了每层需要训练的参数的数量。
2.3卷积过程
特征图是通过滤波器按照特定的步长,对输入图像进行滤波,也就是说我们用一个线性的卷积核对输入图像进行卷积然后附加一个偏置项,最后对神经元进行激活。如果我们设第k层的特征图记为[hk],权重矩阵记为[Wk],偏置项记为[bk],那么卷积过程的公式如下所示(双曲函数tanh作为神经元的激活函数):
2.4 最大池采样
通过了局部连接与权值共享等减少连接参数的方式卷积神经网络中还有另外一个重要的概念那就是最大池采样方法,它是一种非线性的采样方法。最大池采样法在对减少训练参数数量的作用体现在两个方面:
1 )它减小了来自m-1层的计算复杂度。
2 )池化的单元具有平移不变性,所以即使图像在滤波后有小的位移,经过池化的特征依然会保持不变。
3卷积神经网络整体构造以及减少训练时间的方法
3.1使用GPU加速
本次论文实验中,使用了theano库在python环境下实现卷积神经网络模型,在lenet手写数字识别模型上进行改进,由于theano库本身支持GPU加速,所以在训练速度上实现了大幅度的提高。
3.2 数据集的预处理
本次实验使用的两个数据集是mnist手写数字库以及cifar_10库
Mnist手写数字库具有60000张训练集以及10000张测试集,图片的像素都为28*28,而cifar_10库是一个用于普适物体识别的数据集,它由60000张32*32像素的RGB彩色图片构成,50000张图片组成训练集,10000张组成测试集。而对于cifar_10数据集来说,由于图片都是RGB的,所以我们在进行实验的时候,先把其转换为灰度图在进行存储。由于实验是在python环境下运行,theano函数库进行算法支持,所以我们把数据集进行处理,此处我们对使用的数据集进行了格式化。格式化的文件包括三个list,分别是训练数据,验证数据和测试数据。而list中每个元素都是由图像本身和它的相对应的标签组成的。以mnist数据集为例,我们包含train_set,valid_set,test_set三个list,每个list中包含两个元素,以训练集为例,第一个元素为一个784*60000的二维矩阵,第二个元素为一个包含60000个元素的列向量,第一个元素的每一行代表一张图片的每个像素,一共60000行,第二个元素就存储了对相应的标签。而我们取训练样本的10%作为验证样本,进行相同的格式化,而测试样本为没有经过训练的10000张图片。在以cifar_10数据集为实验对象时,把其进行灰度化后,进行相同的格式化处理方式。
3.3实验模型结构
本次实验是在python环境下基于theano函数库搭建好的lenet模型进行参数的调整,以达到在实验准确度可接受情况下减少训练时间的目的。
上图为实验中的基础模型举例说明实验过程,首先以mnist数据集为例,我们的输入图像为一个28*28像素的手写数字图像,在第一层中我们进行了卷积处理,四个滤波器在s1层中我们得到了四张特征图。在这里要特别的说明一下滤波器的大小问题,滤波器的大小可根据图像像素大小和卷积神经网络整体结构进行设置,举例说明,假如说我们的输入图像为28*28像素的图像,我们把第一层卷积层滤波器大小设置为5*5,也就是说我们用一个大小为5*5的局部滑动窗,以步长为一对整张图像进行滑动滤波,则滑动窗会有24个不同的位置,也就是说经过卷积处理后的C1层特征图的大小为24*24。此处的滤波器大小可进行调整,本论文希望通过对滤波器大小的调整,已达到减少训练时间的目的,并寻找调整的理论依据。C1层的特征图个数与卷积过程中滤波器数量相同。S1层是C1经过降采样处理后得到的,也就是说四点经过降采样后变为一个点,我们使用的是最大池方法,所以取这四个点的最大值,也就是说S1层图像大小为12*12像素,具有4张特征图。而同理S1层经过卷积处理得到C2层,此时我们滤波器的大小和个数也可以自行设置,得到的C2层有6张特征图,C2到S2层进行降采样处理,最后面的层由于节点个数较少,我们就用MLP方法进行全连接。
3.4实验参数改进分析
由此可见,我们对滤波器的大小以及个数的改变,可以直接影响到卷积训练参数的个数,从而达到减少训练时间的目的。
从另一种角度来看,增大滤波器的大小,实际效果应该相似于缩小输入图像的像素大小,所以这样我们可以预测增大滤波器的大小会减少样本的训练时间,但是这样也可能会降低训练后的分类的准确率,而滤波器的大小是如何影响训练时间以及分类准确率的,我们通过对两种图片库的实验来进行分析。
4 实验结果与分析
4.1以mnist手写数字数据集作为实验数据
我们知道卷积层可训练参数的数字与滤波器的大小和数字有关,所以我们通过对卷积层滤波器大小的变化来寻找较为普遍的可减少训练参数从而达到减少训练时间的目的。在实验记录中,我们表格纵列记录两层卷积层滤波器大小,横列分别为对已经过训练图像识别和对未经过训练的验证图像进行识别的错误率,最后记录每种滤波器大小搭配的使用时间。我们设定每次试验都进行100次重复训练,每次对权重矩阵进行优化。
此处我们记录两层滤波器大小之和作为横坐标,比较滤波器大小与实验之间的关系。两层滤波器大小相加后相同的元素我们把其对应时间做平均。
4.2以cifar_10数据集作为实验数据
同样是以100次循环训练进行测试,通过改变两层中滤波器的大小来寻找减少训练时间的设定。
此处以同样的方法,记录两层滤波器大小之和作为横坐标,比较滤波器大小与实验之间的关系。
4.3实验结果分析
从两组试验中,在不同的数据集下,我们得到了滤波器的大小与训练时间成反比的关系,而在减少了训练时间的同时确实增大了训练的错误率。
5 总结
通过实验结果分析表明,增大卷积层滤波器大小的方法,在此两种数据库的情况下,是有效减小训练时间的方式,而在不同的数据库对分类准确率的影响程度不同,mnist手写数字数据库中图像之间的相似度非常高,所以滤波器的增大对准确率产生的负面影响较小,而ifar_10数据集中图像之间的相似度较小,所以增大滤波器的大小对其分类结果的准确率的负面影响较大。
参考文献:
[1]LeCun Y, Bengio Y, Hinton G. Deep learning[J]. Nature, 2015, 521(7553): 436-444.
[2] Ruck D W, Rogers S K, Kabrisky M. Feature selection using a multilayer perceptron[J]. ]Journal of Neural Network Computing, 1990, 2(2): 40-48.
[3]LeCun Y, Bengio Y. Convolutional networks for images, speech, and time series[J]. The handbook of brain theory and neural networks, 1995, 3361(10): 1995.
[4] Larochelle H, Bengio Y. Classification using discriminative restricted Boltzmann machines[C]//Proceedings of the 25th international conference on Machine learning. ACM, 2008: 536-543.
[5]Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Advances in neural information processing systems. 2012: 1097-1105.
[6] Zeiler M D, Fergus R. Visualizing and understanding convolutional networks[C]//European Conference on Computer Vision. Springer International Publishing, 2014: 818-833.
[7] Jarrett K, Kavukcuoglu K, Lecun Y. What is the best multi-stage architecture for object recognition?[C]//2009 IEEE 12th International Conference on Computer Vision. IEEE, 2009: 2146-2153.
神经网络方法范文3
关键词:雷达干扰效能评估;RBF神经网络;BP神经网络;隶属度函数
DOIDOI:10.11907/rjdk.151190
中图分类号:TP301
文献标识码:A 文章编号:16727800(2015)006005103
基金项目基金项目:
作者简介作者简介:员志超(1980-),男,山东泰安人,硕士,山东科技职业学院信息工程系讲师,研究方向为智能识别、数据库技术、图像处理。
0 引言
雷达干扰机的干扰能力在现代战争中越来越重要,如何评估干扰机的综合干扰效能成为一项重要课题。雷达干扰效能与雷达、干扰机的工作参数、空间电磁环境及战场环境等因素关系密切,如何有效利用错综复杂的影响因素对雷达干扰效能进行准确评估,一直是电子对抗领域的难点问题。
针对干扰效能评估问题,国内外专家学者提出了诸多行之有效的方法,比如模糊多属性决策法[1]、灰色关联法和层次分析法、计算实验方法[2]等。以上方法都需要相关评价专家对所评估问题的各层权重进行赋值,这就使得评估或多或少受到主观因素影响。雷达干扰效能评估是诸多因素共同影响的非线性系统,而神经网络算法作为一种新型的人工智能算法,能够逼近任意复杂的非线性系统,具有较好的学习能力、容错能力和稳定性[3],所以神经网络算法越来越多地用于雷达干扰效能评估[4]。
本文探讨了一种基于 RBF 神经网络的干扰评估方法:首先建立雷达干扰效能评估指标体系, 然后根据该指标体系建立用于效能评估的RBF 网络, 并选定足够的样本训练所构造的RBF神经网络, 通过动态的自适应调整, 直到满足误差要求,使该网络成为干扰效能评估的有力工具[5]。
1 RBF神经网络基本原理
C.Darken和J.Moddy早在20世纪80年代就提出了RBF神经网络(径向基网络),它具有单隐层的三层前馈网络,能够以任意精度逼近任意连续函数。
1.1 RBF神经网络基本思想
RBF神经网络的基本思想是:用RBF作为隐单元的“基”构成隐含层空间,这样就可以将输入直接映射到隐空间。当RBF的中心点确定以后,也就确定了这种映射关系。由于网络的输出是隐单元输出的线性加权,因而输出空间与隐含层空间的映射是线性的,通过线性方程对网络权值进行求解,从而得到目标函数的最优解。
RBF作为一种前向神经网络,它是以函数局部逼近理论为基础的,具有针对复杂系统的映射能力和最佳逼近能力,且不存在局部最优解问题,因而在诸多领域获得了广泛应用。
1.2 RBF神经网络基本结构
RBF神经网络由输入层、隐含层、输出层构成,图1所示为m-j-n结构的RBF网络,该网络有m个输入,j个隐节点,n个输出。
2 干扰效能评估模型
2.1 评估指标体系
雷达系统是由多个雷达发射站和接收站组成的雷达网,而干扰系统通常由多部干扰站和多种干扰样式构成综合干扰系统,各雷达站的不同工作状态和干扰站的不同干扰策略都将影响最终的干扰效能。单一的干扰评估指标很难对整个动态的干扰过程进行综合评估,因而必须选取多个干扰效能评估指标构成评估指标体系,才能对雷达干扰效果进行综合评估。
影响干扰效能评估的因素主要分为以下几类:①干扰功率;②干扰频率;③干扰样式;④干扰时机,如噪声压制、假目标欺骗等;⑤雷达的工作体制和状态,如相控阵雷达的搜索状态、跟踪状态等;⑥雷达的抗干扰措施,如低截获概率(LPI)波形、旁瓣匿影、参数捷变等。通过对诸多因素的综合分析,这里选取干扰功率、干扰频率、干扰样式、干扰时机4个指标构成评估指标体系[6],对雷达干扰效能进行综合评估。
2.2 指标体系隶属度函数
干扰效能的好坏程度是通过对雷达干扰效能评估指标的量化描述得到的,这里采用[0,1]区间的实数值对干扰效能进行量化分析,表达式为:
式(3)中x值表示干扰效能评价的好坏程度。对于本文选取干扰功率、干扰频率、干扰样式、干扰时机4个指标进行量化时,通常建立各个指标的隶属度函数对x进行计算。通过对各个指标的综合分析,确定4个指标的隶属度函数。
(1)干扰频率隶属度函数确定。干扰机的干扰频带是否能够覆盖雷达的工作频带,是决定干扰机对雷达能否进行干扰的重要因素。因此,要定义干扰频率瞄准程度函数来评价干扰机对雷达在频率上的干扰效果。
(4)干扰样式隶属度函数。
雷达的技术体制决定了干扰机对雷达干扰样式的选择,同一台干扰机对雷达实施不同的干扰样式会产生不同的干扰效果。将干扰样式和雷达技术体制的映射确定成干扰样式隶属度函数,一般通过专家评审的方法来确定雷达的隶属度准确值。
2.3 RBF神经网络结构
传统的网络结构是使隐含层单元数与输入向量的元素相等,当输入矢量过多时,会导致RBF网络的训练和学习速度过慢。为解决此问题,我们对RBF网络结构进行了改进。基本改进原理是将神经元的初始个数设为0,通过网络学习、训练检查输出误差,使网络自动增加神经元。每次训练迭代,是将RBF产生的最大误差所对应的输入向量作为权值向量,增加一个新的隐含层神经元,然后检查新网络的误差,循环此过程直到满足误差要求或达到最大隐含层神经元数为止。比较可知,改进的RBF网络具有输出与初始权值无关、结构自适应确定等优点。
2.4 学习样本构造
构造用来训练神经网络的学习样本直接关系到评估结果的可信度。为了反映雷达干扰的真实效果,使评估结果符合实际,本文通过以下3种方法来构造网络学习和训练的原始样本。
(1)若4个指标隶属度的值都在[0.9,1]区间内,则雷达干扰效能评估为优;若值都在[0.8,0.9]区间内,则雷达干扰效能评估为良;若值都在[0.6,0.8]区间内,则雷达干扰效能评估为中等;若值都在[0.5,0.6]区间内,则雷达干扰效能评估为差;若值都小于0.5,则干扰效果评估为很差。若4个隶属度值中任何一个小于0.2,雷达干扰效能评估都为很差。
(2)利用典型试验数据作为RBF网络输入样本对网络进行训练,使得通过网络学习后的雷达干扰效能评估结果逼近真实值。
(3)根据专家系统和统计数据对样本进行综合分析,验证样本的合理性。
3 仿真实例
对上述RBF神经网络算法和BP神经网络算法进行仿真实验。利用Matlab编程实现基于RBF神经网络算法和BP神经网络算法的两种评估方法,然后输入样本数据进行训练,用以构造并调整网络结构以及网络参数,通过测试样本进行测试评估。两种方法的仿真测试结果如图3、图4所示。
由图3和图4可以看出,两种神经网络算法的预测输出都接近期望输出, 表明两种神经网络算法都具备了干扰效能评估与预测能力,但相对于BP神经网络算法,RBF神经网络算法吻合效果、干扰效能的预测精度更好。
为了比较两种网络输出性能的稳定性,我们进行多次仿真实验,实验表明,对于同一组测试样本,RBF网络测试样本输出是固定的,而BP网络每次输出都是波动的,甚至给出了不同的评价结果,造成干扰效能评估的误判。表1是针对相同测试样本的500次蒙特卡洛实验。
通过表1分析可知,在应用RBF网络对10个测试样本进行仿真时,正确评估的概率都为100%,取得了很好的评估效果。而BP网络的测试样本输出出现了很大波动,在有些样本点取得较好的评估效果,有些样本点出现较多的错误评估,导致整体评估效果不是很理想。这主要是因为BP网络隐含层节点数很难确定,从而难以得到最优的网络结构,同时由于网络的初始权值和阈值是随机获取的,通常使得网络陷入局部寻优。
由于RBF网络能够依据误差要求自适应调整网络结构,所得到的网络结构通常是最优的,而且具有训练速度快、与网络的初始权值无关以及较强的泛化能力等优点,从而克服了BP神经网络的不足,因此RBF网络比BP网络评估效果更好。
4 结语
雷达干扰效能评估受诸多因素共同影响。本文将RBF神经网络应用在干扰效果评估模型中,通过选取干扰效能评估指标体系建立指标隶属度函数,利用专家经验和统计数字的综合分析,构建该神经网络的训练样本, 然后对样本进行学习训练,使得通过网络学习后的雷达干扰效能评估结果满足精度要求。仿真效果表明,RBF神经网络比BP神经网络具有更好的评估效果。训练好的RBF神经网络可“离线”运行,不再依靠专家系统,消除了评估中人为因素的影响,具有较高的应用价值。
当然,本方法在利用RBF神经网络解决干扰效能评估时,怎样使用专家系统更加合理构造学习样本等问题,还需要深入研究及改进。
参考文献:
[1]庄瑾,张善文.防空作战系统效能的模糊综合评判研究[J].电光与控制,2005,12(4):4446.
[2]王飞跃.计算实验方法与复杂系统行为分析和决策评估[J].系统仿真学报,2004,6(5):893897.
[3]阎平凡, 张长水.人工神经网络与模拟进化计算[M].北京: 清华大学出版社, 2001.
[4]高彬,郭庆丰. BP神经网络在电子战效能评估中的应用[J].电光与控制, 2002(1):6971.
神经网络方法范文4
【关键词】 图像识别技术 神经网络识别
模式识别研究的目的是用机器来模拟人的各种识别能力―比如说模拟人的视觉与听觉能力,因此图像识别的目的是对文字、图像、图片、景物等模式信息加以处理和识别,以解决计算机与外部环境直接通信这一问题。可以说,图像识别的研究目标是为机器配置视觉“器官”,让机器具有视觉能力,以便直接接受外界的各种视觉信息。
一、图像识别系统
一个图像识别系统可分为四个主要部分:被识图像、图像信息获取、图像预处理、图像特征提取、分类判决。
二、图像识别方法
图像识别的方法很多,可概括为统计(或决策理论)模式识别方法、句法(或结构)模式识别方法、模糊模式识别方法以及神经网络识别方法。重点介绍神经网络识别方法。
2.1神经网络识别方法
2.1.1人工神经网络的组成
人工神经网络(简称ANN)是由大量处理单元经广泛互连而组成的人工网络,用来模拟脑神经系统的结构和功能。而这些处理单元我们把它称作人工神经元。
2.1.2人工神经网络的输出
2.1.3人工神经网络的结构
人工神经网络中,各神经元的不同连接方式就构成了网络的不同连接模型。常见的连接模型有:前向网络、从输入层到输出层有反馈的网络、层内有互联的网络及互联网络。
2.1.4 学习算法
1)感知器模型及其算法
算法思想:首先把连接权和阈值初始化为较小的非零随机数,然后把有n个连接权值的输入送入网络中,经加权运算处理后,得到一个输出,如果输出与所期望的有较大的差别,就对连接权值参数按照某种算法进行自动调整,经过多次反复,直到所得到的输出与所期望的输出间的差别满足要求为止。
2)反向传播模型及其算法
反向传播模型也称B-P模型,是一种用于前向多层的反向传播学习算法。
算法思想是:B-P算法的学习目的是对网络的连接权值进行调整,使得调整后的网络对任一输入都能得到所期望的输出。学习过程包括正向传播和反向传播。正向传播用于对前向网络进行计算,即对某一输入信息,经过网络计算后求出它的输出结果;反向传播用于逐层传递误差,修改神经元之间的连接权值,使网络最终得到的输出能够达到期望的误差要求。
B-P算法的学习过程如下:
第一步:选择一组训练样例,每一个样例由输入信息和期望的输出结果两部分组成;第二步:从训练样例集中取出一样例,把输入信息输入到网络中;第三步:分别计算经神经元处理后的各层节点的输出;第四步:计算网络的实际输出和期望输出的误差;第五步:从输出层反向计算到第一个隐层,并按照某种原则(能使误差向减小方向发展),调整网络中各神经元的权值;第六步:对训练样例集中的每一个样例重复一到五的步骤,直到误差达到要求时为止。
3)Hopfield模型及其学习算法
它是一种反馈型的神经网络,在反馈网络中,网络的输出要反复地作为输入再送入网络中,使得网络具有了动态性,因此网络的状态在不断的改变之中。
算法思想是:
(a) 设置互连权值
其中xis是s类样例的第i个分量,它可以为1或0,样例类别数为m,节点数为n。
(b) 未知类别样本初始化。 Yi(0)=Xi 0≤i≤n-1
其中Yi(t)为节点I在t时刻的输出,当t=0时,Yi(0)就是节点I的初始值,Xi为输入样本的第I个分量。
(c) 迭代直到收敛
神经网络方法范文5
论文关键词:内燃机 人工神经网络 辅助方法
论文摘要:针对汽车发动机设计和性能评测当中有关参数计算的特点,提出应用人工神经网络方法进行辅助计算,以提高数据计算的结构化程度和处理速度。通过对具体数据的实际操作表明,应用本方法能够很好地表达原图表数据关系,所得结果的精度能够满足计算要求。
汽车发动机的性能包括动力性、经济性、生态特性——排放与噪声、可靠性及耐久性等多个方面,这些参数要通过在一定条件下的测试计算来获得。当发动机在非标准环境下运转时,其相关计算要通过参数进行修正,比如发动机的有效功率和燃油消耗率的计算。当发动机在非标准环境下运转时,其有效功率及燃油消耗率应修正到标准环境状况,当然也可由标准环境状况修正到现场环境状况,其中的有效功率和燃油消耗率修正系数在GB1105..1-87中以图表的形式给出,使用很不方便,本文应用人工神经网络对此图表信息进行处理,提高了数据计算的结构化程度和处理速度,取得了满意的效果。
1.神经网络的识别原理
在神经网络系统中,其知识是以大量神经元的互连和各连接的权值来表示的.神经网络映射辩识方法主要通过大量的样本进行训练,经过网络内部自适应算法不断调整其权值,以达到目的.状态识别器就隐含在网络中,具体就在互连形式与权值上.在网络的使用过程中,对于特定的输入模式,神经网络通过前向计算,产生一输出模式,通过对输出信号的比较和分析可以得出特定解。目前神经网络有近40多种类型,其中BP(Back Propagation,即反向传播)网络是最常用和比较重要的网络之一,本文就应用一种改进型的BP网络进行相应数据图表的识别映射。
BP网络由输入结点、输出层结点和隐层结点构成,相连层用全互连结构.神经网络的工作过程主要有两个阶段:一个是学习期,通过样本学习修改各权值,达到一稳定状态;一个是工作期,权值不变,计算网络输出。
B
P网络的学习过程由正向传播和反向传播两部分组成。在正向传播过程中,输入信息从输入层经隐层单元逐层处理,并传向输出层,每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望的输出,则转入反向传播,将误差信号沿原来的路径返回,通过修改各层神经元的权值,使得误差信号最小。
当给定一输入模式X=(x1,x2,….,xm)和希望输出模式Y=(y1,y2,…..,yn)时,网络的实际输出和输出误差可用下列公式求出:
隐含层输出:
式中——输入层至隐含层,隐含层至输出层的连接权;
——隐含层结点、输出层结点的阀值;
m、h、n——输入层、隐含层、输出层结点数;
f—— s型函数,f(x)=(1+e-x)-1.
如果误差太大不能满足要求,则需要用下列公式修正各连接权和阀值
为网络提供一组特定的训练模式,随机产生初始连接权和阀值,不断币复上述计算过程,直到网络全局误差小于给定的极小值为止.
由于BP网络的高识别能力,应用中采用了此结构形式.同时为提高其识别效果,加快网络的训练速度,缩短工作周期,应用了附加动量项和自适应速率的改进算法.
附加动量项法使网络在修正其权值时,不仅考虑误差在梯度上的作用,而且考虑在误差曲面上变化趋势的影响,其作用如同一个低通滤波器,允许网络上的微小变化特性,使网络陷入局部极小值的可能性大大减少。自适应速率是通过改变学习率,提高BP算法的有效性和收敛性,缩短训练时间.
2具体应用
根据以上理论,采用改进的BP神经网络形式,动量因子取0.9,对有效功率校正系数和燃油消耗率校正系数与指示功率比和机械效率的关系同时进行识别,采用双输入双输出的2-10-2结构、2-15-2结构、2-20-2结构进行训练,识别情况分别如表3-5所示。
转贴于
从实际的应用效果来看,2-15-2和2-20-2的逼近能力相似,2-15-2的速度快于2-20-2结构,而2-20-2结构的识别能力要远低于前两种结构,采用更少的隐层结点数就会使训练的时间过长,甚至使训练过程无法进行.因此最后选择2-15-2的BP网络结构作为最终的神经网络形式。如图1所示为训练次数与误差平方和之间的关系曲线,表4为部分网络输出与实际数值的比较.
通过以上计算分析可见,神经网络的映射输出能力是相当强的,通过合理的网络结构选择和具体的参数应用,完全可以满足优化设计的计算要求,大大缩短优化当中的计算迭代时间,提高计算效率。
3结论
(1)人工神经网络有很强的数据映射能力,能够很好地识别所给数据之间的对应关系,映射的精度可以满足一般设计计算要求.
(2)对于包含无规律图表数据的有关计算问题,应用神经网络是一个很好的加快运算速度的解决方法.
(3)在数据的映射识别当中,网络的结构形式和参数选择对于问题的求解精度和速度都是致关重要的’同时应当注意数据的过度训练问题.
(4)智能算法的应用为具体的工程计算提供了更方便、有效的手段,寻找有效的计算方法,以及多种算法的混合应用将是摆在设计人员的一个课题.
参考文献
[1]焦李成.神经网络系统理论[M]西安:西安电子科技大学出版社,1990.
[2]焦李成.神经网络的应用与实现[M].西安:西安电子科技大学出版社,1993.
[3]王文成.神经网络及其在汽车工程中的应用[M].北京:北京理工大学出版社,1998.
[4]张成宝,丁玉兰,雷雨成.人工神经网络在汽车变速器齿轮故障诊断中的应用[J].汽车工程,1999,21(6) 374-378.
[5]Watanahle Y, Sharp H S. Neural network learning control of automotive aotic-e suspension systems.lnternational,lournal of Vehicle Design[J],1999,21(2/3):124一147.
神经网络方法范文6
关键词: 地基微波辐射计; BP神经网络; 大气中水汽含量反演; 云中液态水含量反演
中图分类号: TN926?34; P407 文献标识码: A 文章编号: 1004?373X(2016)14?0009?03
Water vapor/ liquid content inversion method based on neural network
WANG Xu1, NIU Haibin1, YANG Guiling2
(1. College of Physics and Electronic Engineering, Henan Normal University, Xinxiang 453007, China;
2. Communication Engineering Department, China Research Institute of Radio wave Propagation, Xinxiang 453003, China)
Abstract: The brightness temperature received by ground?based microwave radiometer has no perfect linear relationship with the atmospheric water vapor and cloud liquid water contents for describing weather and climate. The nonlinear problem can be solved with the neural network algorithm. The historical radiosonde data of Zhengzhou district is used to simulate 24 GHz and 35 GHz dual channel brightness temperature, ground temperature, barometric pressure and relative humidity to constitute the input vector. The atmospheric water vapor and the cloud liquid water contents calculated with same radiosonde data are taken as the output vector to train the BP neural network, and then the validation sample is input into the trained network to carry out simulation. The comparison and detection results show that it has a good correlation with the atmospheric water vapor and cloud liquid water total contents calculated as the true values. The correlation coefficients are 0.953 82 and 0.934 75. The validity of the method was testified.
Keywords: ground?based microwave radiometer; BP neural network; inversion of water vapor content in air; inversion of liquid water content in cloud
近年来,我国多发的灾害性天气给工农业生产和国民经济的发展带来了巨大损失,必须不断加强现代化的气象探测手段,提高天气气候预报准确性,增强人工影响天气能力[1]。目前,双通道地基微波辐射计测量大气中水汽含量和液态水总量的反演方法,大都运用统计回归,需要随地区、时间的不同而分别进行[2?3]。朱元竟等人在河北省使用北京大学研制的双频共天线微波辐射计参加人工增雨作业中,反演大气中水汽含量和云中液态水含量时采用了统计回归的方法,在建立统计关系时,引入二次项和交叉项[4]。贺宏兵等人采用线性统计回归的方法,分春夏秋冬四季针对南京地区反演了水汽总量和云水总量[5]。
与统计回归方法相比,神经网络方法无需建模和复杂的计算就可以很好地求解非线性问题;而本文通过BP神经网络反演方法,利用探空资料对郑州夏季大气中水汽总量和云中液态水总量进行神经网络训练,并对训练好的网络的反演能力进行数值核验,分析了反演精度。
1 理论基础
微波一般指波长范围为1 mm~30 cm的电磁波。垂直遥感水汽总量时,一般选择大气吸收主要依赖于水汽、但又比较透明的微波波段,即通道中心频率应偏离吸收线中心(22.235 GHz)以便大气辐射亮温主要由水汽总量决定,与水汽垂直分布关系不大。于是本文选择了24 GHz和35 GHz的频率来遥感大气水汽总量和云中液态水总量[6]。
1.1 地基微波遥感基本方程
在20~60 GHz微波波段,由于微波辐射的波长较长,忽略水汽、云和干燥空气的散射,并采用瑞利?金斯近似,可以得到地基微波辐射计遥感方程:
[Tbf=Tcexp-0aazsecθdz+ 0∞Tzazsecθexp0aazsecθdzdz] (1)
式中:[Tbf]表示地面辐射计接收到的亮度温度;[f]是频率;[Tz]表示大气温度的垂直分布;z是高度;[θ]是地基辐射计天线指向天顶角(本文中取0°,天线垂直对着天空);[Tc]是宇宙太空的亮度温度,一般取2.9 K;[az]为吸收系数是水汽分子的吸收系数、氧气分子的吸收系数和液态水的吸收系数之和。
1.2 计算方法
用V和L两个物理量分别表示大气中水汽总量和云中液态水总量,计算方法如下:
[V=0∞ρH2Odz] (2)
式中:V为大气中水汽总量单位为cm;[ρH2O]为大气中水汽密度。
[L=Z1Z2ρldz] (3)
式中:L为云中液态水总量单位是cm;[ρlz]为云中水密度;[z1]和[z2]分别为云底和云顶的高度。本文计算了从地面到8 000 m高空的大气中水汽总量和云中液态水总量。
2 神经网络反演方法
神经网络反演算法在理论上可以逼近任意复杂的非线性关系,而不依赖于物理正向模型。人工神经网络最精华的模型是BP网络(Back propagation Neural Network),其应用最为广泛 [7?8]。本文使用Matlab神经网络工具箱,利用BP神经网络算法反演大气中水汽总量和云中液态水总量与探空资料计算出来的大气中水汽总量和云中液态水总量作为真值做对比分析。
2.1 BP神经网络的设计
选取郑州市2009―2014年5年七月份每天北京时间早晨8:00和晚间20:00各一次的8 000 m以下探空资料,对每一份探空资料采用相对湿度阈值方法来判断是否有云并得到云层厚度,然后根据本地区云中含水量的观测资料把云中含水量按文献[9]做法,以相对湿度[≥85%]作为判断有云;当相对湿度[95%]时,取值为0.5 g/m3,而相对湿度在[85%]和[95%]之间时,云液态水浓度的取值满足线性关系。经过对探空资料的分析得到样本数为84组,然后利用式(1)进行模拟计算出两个通道的亮温。计算得到的两个通道的亮温、地面的温度、地面气压和地面相对湿度构成输入样本。采用的双通道地基微波辐射计有5个BP网络输入节点。
三层的BP网络中间一层是隐含层,目前没有一套完善的理论方法来确定网络的隐含层节点,通常采用经验公式确定隐含层节点数,如下:
[M=L+N+a] (4)
式中:L和N分别为输入层和输出层的神经元个数,[a]是[0,10]之间的常数[10]。本文经过多次测试,根据训练时间和反演结果确定隐含节点数是10个。
输出样本构造,根据本文实际需要由0[~]8 000 m大气中水汽总量和云中液态水总量分别构成输出样本,所以输出节点数为2个。BP神经网络反演精度除了与网络的结构有关外,还受网络所采用的转移函数影响。本文采用函数feedforwardnet建立网络,第一层采用LM(Levenberg?Marquardt)算法的变梯度反向传播算法,选取转移函数trainlm。trainlm函数一般自动将输入输出样本数据分为3部分:70%作为训练样本,15%作为确认样本,15%作为测试样本。第二层选取线性转移函数purelin。图1中,IW{1,1}为输入层到隐层的权重值;LW{2,1}为隐层到输出层的权重值;b{1},b{2}分别为两层的偏置值。
神经网络方法的反演步骤为:
(1) 利用历史探空资料,利用式(1)~式(3)分别计算出双通道的辐射亮温值、大气中水汽总量和云中液态水总量。
(2) 创建一个三层BP神经网络,利用双通道的模拟计算出来的双通的辐射亮温和同一时段的地面的温度、地面气压和地面相对湿度作为输入层,与之对应计算出来大气中水汽总量和云中液态水总量作为输出层,训练网络,得到参数固定的网络。
(3) 利用已经得到的网络,将没有参加训练的双通辐射亮温值作为网络的输入,计算得到的输出向量就是要反演的大气中水汽总量和云中液态水总量。
2.2 误差评估方法
假设检验样本为n,作为真值的探空测量值记为[Vi;]BP网络反演值记为[Ui,]这里i表示第i个样本,则反演值对真值的平均绝对误差(MAE)和标准偏差(SD)分别表示为:
平均绝对误差和标准偏差数值越小,说明反演结果的精度越高,离散程度越小。
3 仿真结果及分析
本文使用的是Matlab工具箱里的BP网络,该算法使用广泛且成熟。将计算得到的双通道亮温、地面的温度、地面气压和地面相对湿度5个节点作为输入,对应不同的网络,大气中水汽总量和云中液态水总量2个节点作为输出。神经网络的输入和输出之间构成了一个复杂的非线性关系,通过训练确定它们的对应关系;一旦BP网络训练完成,就可以直接反演大气中水汽总量和云中液态水总量。将84组数据抽取24组用来检测训练好的BP网络的精度,其余60组用来训练网络。按照第2节中给出的方法得到输入、输出样本并进行训练BP神经网络,随后将检测样本输入到训练好的BP网络中,就可反演出大气中水汽总量和云中液态水总量。
图2和图3分别表示的是大气中水汽总量训练BP网络的输出结果与探空计算的大气中水汽总量的相关性和云中液态水总量训练BP网络的输出结果与探空计算的云中液态水总量的相关性。
大气中水汽总量值的对比
用历史探空样本训练设置好的BP神经网络,训练结束后,将网络仿真的输出结果和标准输出作线性回归分析。并得到大气中水汽总量训练BP网络的输出结果与探空计算的大气中水汽总量的相关系数为0.953 82,平均绝对误差MAE为0.012 1 cm,标准偏差SD为0.012 2 cm和云中液态水总量训练BP网络的输出结果与探空计算的云中液态水总量的相关系数为0.934 75,平均绝对误差MAE和标准偏差SD分别为0.027 3 cm和0.029 1 cm。
云中液态水总量值的对比
4 结 论
根据仿真反演结果及误差分析得出,BP神经网络反演大气中水汽总量和云中液态水总量与探空资料计算的云天大气中水汽总量和云中液态水总量有很好的线性相关性,且不需要建立物理模型,反演计算速度快,结果稳定,可更可靠地应用于实时反演大气中水汽总量和云中液态水总量。
参考文献
[1] 张北斗.地基多通道微波辐射计的反演算法及应用[D].兰州:兰州大学,2014.
[2] 李铁林,刘金华,刘艳华,等.利用双频微波辐射计测空中水汽和云液水含量的个例分析[J].气象,2007,33(12):62?68.
[3] 刘亚亚,毛节泰,刘钧,等.地基微波辐射计遥感大气廓线的BP 神经网络反演方法研究[J].高原气象,2010,29(6):1514?1523.
[4] 朱元竞,胡成达,甄进明,等.微波辐射计在人工影响天气研究中的应用[J].北京大学学报(自然科学版),1994,30(5):597?606.
[5] 贺宏兵,杜晓勇.遥感反演水汽总量和云水总量的研究[J].气象科学,2000,20(2):194?199.
[6] 王世杰.乌鲁木齐夏季降水特征及其强降水过程水汽演变分析[D].乌鲁木齐:新疆师范大学,2012.
[7] 莫林.分布式降水估算的模型与方法研究[D].武汉:华中科技大学,2007.
[8] 刘D.利用人工神经网络方法反演晴空大气湿度廓线的研究[D].南京:南京信息工程大学,2011.