人工神经网络的不足范例6篇

前言:中文期刊网精心挑选了人工神经网络的不足范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

人工神经网络的不足范文1

关键词:人工神经网络 矿山 安全状态 评判能力

中图分类号:TD77;TP181 文献标识码:A 文章编号:1007-9416(2015)04-0206-01

通过改变神经网络训练样本等方式,对神经网络不同训练样本的反应能力进行对比分析,从而探讨人工神经网络对矿山安全程度评价的适应性。为了有效的提高人工神经网络对矿山安全程度评价的能力,可以通过改变神经网络的神经元数目以及初值赋值的方式来测试不同的结构,从而得出不同参数下神经网络对相同训练样本的评价结论,以便提高其评价能力,在矿山安全状态评判中充分发挥出人工神经网络的作用。

1 人工神经网络中的网络结构设计与原始数据的准备

本文中主要采取如1所示的神经网络结构,根据测试目的的差异性,其测试过程中神经网络的部分性能也就不同,但是对整个网络结构的性能不会改变。

这种神经网络的主体结构是单输入、三层式BP的网络结构,输出连接、目标连接、输入权重连接、偏置连接以及层权连接等是其主要的连接方式。各层神经元的分类包括:第一隐含层有8个正切S型神经元,第二隐含层有8个对数S型的神经元,输入层有4个元素,输出层有一个线性神经元。其网络函数主要包括训练函数、初始化函数、性能函数以及各网络层的层初始化函数。其训练函数需要采取TRAINLM回转方法来运算;初始化函数需要采取逐层初始化的方法运算;性能函数需要采取均方误差法来计算;各网络层的层初始化函数需要采取优化规则的方式计算,有的时候还需要采取INITWB的方式进行运算。各个权阈值的初始化需要采用RANDS方法来计算。在人工神经网络训练的原始样本数据以及期望值中,这些数据主要是用来评价地质因素对矿山安全影响程度的原始数据。当训练完成之后,需要对其各种数据进行仿真测试,以便评断这种人工神经网络结构在矿山安全状态中的应用价值与能力,并对其不足之处以及缺陷问题等进行分析,以便寻找出更加优化的方案,从而提高人工神经网络在矿山安全状态中的评判作用与能力。

2 人工神经网络对矿山安全状态评判能力的训练以及仿真测试

对矿山安全评价的方法较多,但是能够较好的应用于矿山安全评价的方法却很少,例如事故树分析法、概率风险评价法以及事件树分析法等,这些方法均由于基本事件的发生概率的确定方面存在一定的困难,从而导致运用于矿山过程中的安全评价效率不高。另外,在矿山安全状态评价的过程中,其安全检查表、专家评价方法等存在一定的缺点与不足,其在评价的过程中,主观性较强,受到个人意识的影响较大。综合指标评价法由于其指标间的逻辑关系,指标的权值与指标的量化等问题,从而导致该方法难以在矿山安全状态中进行准确的评价。只有能够更好的适应这种复杂的动态系统的安全评价方法,才能够将其更好的应用在矿山安全状态评价中[1]。

其中人工神经网络在处理无法使用简单规则或公式进行描述的大量的原始数据的问题时,以及在处理规律不清楚的问题时,其具有较大的优势。也正是由于这种方法能够对复杂的非线性动力学系统的适应,才能够使其在矿山安全状态评价中得到引进与推广。将人工神经网络对矿山安全状态评价能力的训练进行仿真实验,在每次实验检测之前,都需要对同一神经网络进行重新初始化,之后需要运用相同的训练样本数据对神经网络进行训练,以便达到训练要求后对网络进行仿真测试,训练性能函数的误差需要保持在10以内。其神经网络的训练过程是网络在初始权阈值的基础上,对其权阈值进行不断的修改,以便寻找出它们之间的某种联系,使得输入的整个训练样本集数据经过网络的运算之后,其输出与相应的目标数据差别能够满足性能函数的要求。因此,在人工网络对矿山安全状态进行评判的时候,即使所有数据与性能均符合要求,但是由于在训练的时候就被赋予了不同的权阈值,训练之后得到的权阈值的最终组合也会存在较大的差异。通过神经网络对矿山进行安全评判的目的在于运用神经网络总结分析数据,对矿井各个致灾的贡献率进行分析,进而对矿山的安装状态进行评判。从神经网络的角度来分析,通过运用网络的运算功能对训练样本的数据进行统计分析,并从中找出满足目标值以及性能要求的权阈值组合形式,从而通过仿真方式来评价矿山的安全状态。

3 结语

通过对人工神经网络在矿山安全状态的评判能力进行训练以及仿真测试后,发现人工神经网络与人类评判方法存在一定的差异性,在今后的发展过程中,还需要对人工神经网络在矿山安全状态中的评判能力进行不断的优化与改进,以便更好的适应矿山安全状态的评判,在矿山安全状态的评判中充分发挥出人工神经网络的作用,从而更好的确保矿山生产与经营的安全性。

人工神经网络的不足范文2

本文主要介绍了人工神经网络的概念,并对几种具体的神经网络进行介绍,从它们的提出时间、网络结构和适用范围几个方面来深入讲解。

【关键词】神经网络 感知器网络 径向基网络 反馈神经网络

1 引言

人工神经网络是基于对人脑组织结构、活动机制的初步认识提出的一种新型信息处理体系。它实际上是一个由大量简单元件相互连接而成的复杂网络,具有高度的非线性,能够进行复杂的逻辑操作和非线性关系实现的系统,通过模仿脑神经系统的组织结构以及某些活动机理,人工神经网络可呈现出人脑的许多特征,并具有人脑的一些基本功能,利用这一特性,可以设计处具有类似大脑某些功能的智能系统来处理各种信息,解决不同问题。下面对几种具体的神经网络进行介绍。

2 感知器网络

感知器是由美国学者Rosenblatt在1957年首次提出的,感知器可谓是最早的人工神经网络。感知器具有分层结构,信息从输入层进入网络,逐层向前传递到输出层。感知器是神经网络用来进行模式识别的一种最简单模型,属于前向神经网络类型。

2.1 单层感知器

单层感知器是指只有一层处理单元的感知器,它的结构与功能都非常简单,通过读网络权值的训练,可以使感知器对一组输入矢量的响应达到元素为0或1的目标输出,从而实现对输入矢量分类的目的,目前在解决实际问题时很少被采用,但由于它在神经网络研究中具有重要意义,是研究其他网络的基础,而且较易学习和理解,适合于作为学习神经网络的起点。

2.2 多层感知器

多层感知器是对单层感知器的推广,它能够成功解决单层感知器所不能解决的非线性可分问题,在输入层与输出层之间引入隐层作为输入模式的“内部表示”,即可将单层感知器变成多层感知器。

3 线性神经网络

线性神经网络类似于感知器,但是线性

神经网络的激活函数是线性的,而不是硬限转移函数。因此线性神经网络的输出可以使任意值,而感知器的输出不是0就是1。线性神经网络最早的典型代表就是在1963年由美国斯坦福大学教授Berhard Windrow提出的自适应线性元件网络,它是一个由输入层和输出层构成的单层前馈性网络。自适应线性神经网络的学习算法比感知器的学习算法的收敛速度和精度都有较大的提高,自适应线性神经网络主要用于函数逼近、信号预测、系统辨识、模式识别和控制等领域。

4 BP神经网络

BP神经网络是1986年由以Rumelhart和McCelland为首的科学家小组提出的,是一种按误差逆传播算法训练的多层前馈网络,在人工神经网络的实际应用中,80%~90%的人工神经网络模型采用BP网络或者它的变化形式,它也是前向网络的核心部分,体现了人工神经网络最精华的部分,BP神经网络由信息的正向传播和误差的反向传播两个过程组成。输入层各神经元负责接收来自外界的输入信息,并传递给中间层各神经元;中间层是内部信息处理层,负责信息变换,根据信息变化能力的需求,中间层可以设计为单隐层或者多隐层结构;最后一个隐层传递到输出层各神经元的信息,经过一步处理后完成一次学习的正向传播处理过程,由输出层向外界输出信息处理结果。当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐层、输入层逐层反传。周而复始的信息正向传播和误差反向传播过程,是各层权值不断调整的过程,也是神经网络学习训练过程,此过程一直进行到网络输出的误差减少到可以接受的程度,或者达到预先设定的学习次数为止。

BP网络主要应用于以下方面:

(1)函数逼近:用输入矢量和相应的输出矢量训练一个网络逼近一个函数。

(2)模式识别:用一个特定的输出矢量将它与输入矢量联系起来。

(3)分类:对输入矢量以所定义的合适方式进行分类。

(4)数据压缩:减少输出矢量维数以便于传输或存储。

5 反馈神经网络

美国加州理工学院物理学家J.J.Hopfield教授于1982年发表了对神经网络发展颇具影响的论文,提出一种单层反馈神经网络,后来人们将这种反馈网络称作Hopfield网。在多输入/多输出的动态系统中,控制对象特性复杂,传统方法难以描述复杂的系统。为控制对象建立模型可以减少直接进行实验带来的负面影响,所以模型显得尤为重要。但是,前馈神经网络从结构上说属于一种静态网络,其输入、输出向量之间是简单的非线性函数映射关系。实际应用中系统过程大多是动态的,前馈神经网络辨识就暴露出明显的不足,用前馈神经网络只是非线性对应网络,无反馈记忆环节,因此,利用反馈神经网络的动态特性就可以克服前馈神经网络的缺点,使神经网络更加接近系统的实际过程。

Hopfield神经网络的应用:

(1)在数字识别方面。

(2)高校科研能力评价。

(3)应用于联想记忆的MATLAB程序。

6 径向基神经网络

径向基RBF网络是一个3层的网络,除了输入、输出层之间外仅有一个隐层。隐层中的转换函数是局部响应的高斯函数,而其他前向网络,转换函数一般都是全局响应函数。由于这样的差异,要实现同样的功能,RBF需要更多的神经元,这就是RBF网络不能取代标准前向型络的原因。但是RBF网络的训练时间更短,它对函数的逼近时最优的,可以以任意精度逼近任意连续函数。隐层中的神经元越多,逼近越精确。

径向基网络的应用:

(1)用于曲线拟合的RBF网络。

(2)径向基网络实现非线性函数回归。

7 自组织神经网络

自组织竞争型神经网络是一种无教师监督学习,具有自组织功能的神经网络,网络通过自身的训练。能自动对输入模式进行分类,一般由输入层和竞争层够曾。两层之间各神经元实现双向连接,而且网络没有隐含层。有时竞争层之间还存在着横向连接。

常用自组织网络有一下几种:

(1)自组织特征映射网络。

(2)学习矢量量化网络。

(3)自适应共振理论模型。

(4)对偶传播网络。

参考文献

[1]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.

[2]周品.神经网络设计与应用[M].北京:清华大学出版社,2013.

作者简介

孔令文(1989-),男,黑龙江省齐齐哈尔市人。现为西南林业大学机械与交通学院在读研究生。研究方向为计算机仿真。

人工神经网络的不足范文3

【关键词】员工安全等级;粗糙集理论;人工神经网络

1.引言

电力行业是国民经济的基础产业,它直接关系到经济发展和社会稳定。然而,电力企业员工在生产过程中,由于知识、能力与经验的不足或者心理因素等原因,为了追求某些利益,从而导致人身事故、电网事故、设备事故和火灾事故等人因事故[1]。据统计60%-70%电力生产事故是由人的失误造成的,所以减少人因失误是有效控制电力生产事故发生的关键[2-3]。

目前专门针对电力企业生产中人因失误的研究成果还不是很丰富,对电力企业生产中人的不安全行只分析了其对电力系统的影响,提出了防范不安全行为的措施,并没有对不安全行为的严重程度进行划分。另外,一些地区已经开始着手进行了员工等级的鉴定工作,但标准和方法不一致且过于简单造成了结果的不具有可比性,并且存在着评价周期长、缺乏准确性等诸多弊端。所以,需要构建统一的电力企业员工安全等级评价模型。

2.电力企业员工安全等级评价模型的设计

电力企业中现行的管理经验和方法缺乏系统性和前瞻性,管理还比较粗放,特别是员工的习惯性违章仍屡禁不止,为了从根本上提高电力企业员工的安全意识,减少人因事故的发生,本文在充分研究电企中人因失误问题的基础上,基于粗糙集与BP神经网络设计了电力企业员工安全等级评价模型,模型框架如图1所示。

评价前,首先要确定宽泛的评价属性集,然后收集数据,界定属性值语义,并对每个属性界定属性值,最后构建出属性约简决策表。构建员工属性决策表是进行员工安全等级评价的首要问题,决策表是一类特殊而重要的知识表达系统,多数决策问题都可以用决策表形式来表达。

评价中,将粗糙集作为人工神经网络的前置系统,以减少神经网络的复杂性。

评价后,为了进一步检验评价模型的性能,评价结束后要对评价结果进行仿真分析。利用相关函数对网络进行仿真,并计算输出结果和目标输出之间的误差,从而作为网络训练结果优劣的判别依据。

3.评价核心要素的提取方法

在评价过程中,为了解决人工神经网络当输入的信息空间维数较大时,网络结构复杂和训练时间长的问题,所以在这里使用粗糙集作为神经网络的前置系统[4]。

3.2 属性约简算法

粗糙集的属性约简就是指在保持原始决策表条件属性和决策属性之间的依赖关系不发生变化的前提下删除冗余的属性和属性值[5]。粗糙集的属性约简算法有很多种,本文使用的是基于区分矩阵的约简算法。算法具体如下:

(1)计算区分矩阵,将区分矩阵的核赋给约简后的集合;

(2)找出不含和指标的指标组合;

(3)将不包含和指标的指标集表示为合取范式;

(4)将合取范式转换为析取范式的形式;

(5)根据需要选择合理的指标组合。

4.BP神经网络的实现

6.结论

笔者在综合分析国内外相关研究基础上,提出了电力企业员工安全等级的概念,并基于粗糙集与人工神经网络设计了电力企业生产中员工安全等级评价模型,模型将粗糙集作为神经网络的前置系统,用以缩减神经网络学习时的训练样本,可达到简化神经网络结构、提高评价模型工作效率的目的,同时BP神经网络能够有效减少噪声对粗糙集评价过程的影响。最后,通过实例对模型进行应用,仿真结果说明,该网络能够较好地对电力企业员工安全等级进行评估。

参考文献

[1]袁周.电力生产事故人因分析与预防简明问答[M].北京:中国电力出版社,2007.

[2]马京源,李哲,何宏明,钟定珠.电气误操作事故人因因素分析与控制[J].中国电力,2010(5):72-76.

[3]林杰.安全行为科学理论在电力生产中的应用研究[D].贵州:贵州大学硕士论文,2006.

人工神经网络的不足范文4

1 模糊系统的Takagi-Sugeno模型

模糊系统理论[11]是沟通经典数学的精确性与现实世界中大量存在的不精确性之间的桥梁。它是以模糊集合的形式表示系统所含的模糊性并能处理这些模糊性的系统理论,能够有效地处理系统的不确定性、测量的不精确性等模糊性。Takagi-Sugeno模糊系统(T -S模糊系统)作为函数模糊系统的一种特例,由于构成的各条规则采用线性方程式作为结论,使得模型的全局输出具有良好的数学表达特性,这在处理多变量系统时能有效地减少模糊规则个数,具有很大的优越性[12]。其规则表达如下[13]:

2 T-S模糊神经网络

模糊系统在模糊建模的过程中常存在学习能力缺乏,辨识过程复杂,模型参数优化困难等问题。而人工神经网络具有自学习、自组织和自适应的能力,具有强大的非线性处理能力。二者的结合构成模糊神经网络,可以有效地发挥模糊逻辑与神经网络的各自优势,弥补各自的不足[14]。

2.1 T-S模糊神经网络的结构

基于标准型的T -S模糊神经网络结构如图1所示。图1中第1层为输入层;第2层每个结点表示一个语言变量值;第3层用来匹配模糊规则前件,计算出每条规则的隶属度;第4层用于归一化计算,输出第 条规则的平均激活度[14];第5层是输出层,它所实现的是清晰化计算。T -S模糊神经网络由前件网络和后件网络两部分组成。前件网络用来匹配模糊规则的前件,其结构与图1的前4层结构完全相同;后件网络用来产生模糊规则的后件,由N个结构相同的并列子网络组成[15]。

2.2 T-S模糊神经网络的学习算法

T -S模糊神经网络需要学习的参数主要有后件网络的连接权pkki以及前件网络第二层各结点隶属函数的中心值ckj及宽度σkj。设取误差代价函数为:

3 应用研究

以下通过实例介绍T -S模糊神经网络在地下水水质评价中的应用。

3.1 研究区概况

吉林省西部地区位于松嫩平原的西南部,地理坐标为东经123°09′~124°22′,北纬44°57′~45°46′。研究区东接吉林省长春市,南接四平市及辽宁省,西邻,北接黑龙江省,东北以嫩江、松花江和拉林河与黑龙江省为界。吉林省西部属半干旱半湿润的大陆性季风气候区,四季变化明显。该区多年平均气温3~6℃,多年平均降雨量为400~500mm。研究区大部分属于松嫩盆地,该盆地为一个巨大的含水层系统,埋藏有多层含水层,包括孔隙潜水含水层和承压水含水层(分别为浅层、中深层)、上第三系大安组、泰康组孔隙-裂隙含水层(深层)和白垩系下统及上统裂隙孔隙含水层(深层)。研究区的地下水补给来源主要为降水入渗,排泄以潜水蒸发和人工开采为主。

3.2 原始数据

原始数据取自于吉林西部2005年50个地下水水化学监测点的水质监测数据,结合研究区地下水水质状况,有针对性地选择了铁、氨氮、硝酸盐、亚硝酸盐、硫酸盐、氯化物、溶解性总固体、氟化物和总硬度共9项指标作为评价因子。地下水水质评价标准参照GB/T 14848-93《地下水质量标准》,评价标准见表1。

3.3 神经网络的准备工作

(1)训练样本、检验样本及其期望目标的生成。采用Mat-lab7.0的linspace函数在各级评价标准之间按随机均匀分布方式内插生 成 训 练 样 本。各 级 评 价 标 准 之 间 生 成500个,共2 000个训练样本,以解决仅利用各级评价标准作为训练样本,导致训练样本数过少的问题[16]。检验样本用生成训练样本同理的方法生成400个样本。小于一级标准的训练样本和检验样本的期望目标为按照生成训练样本和检验样本的内例产生对应的0~1.5之间的数值;一、二级标准之间的训练样本和检验样本的期望目标为按照生成训练样本和检验样本的内例产生对应的1.5~2.5之间的数值;同理,二、三级和三、四级标准之间的训练样本和检验样本的期望目标为2.5~3.5、3.5~4.5之间的数值。(2)水质评价等级的划分界限。据上述生成训练样本与检验样本目标输出的思路可以确定一、二、三、四、五各级水的网络输出范围分别为:<1.5、1.5~2.5、2.5~3.5、3.5~4.5、>4.5。(3)原始数据的预处理。利用Matlab7.0中的mapminmax函数将原始数据归一化到0与1之间。

3.4 T-S模糊神经网络的建立、训练、检验及水质评价

3.4.1 T-S模糊神经网络的建立

模糊神经网络的构建根据训练样本维数确定模糊神经网络输入/输出结点数、模糊隶属度函数个数。由于输入数据为9维,输出数据为1维,通过试错法确定模糊神经网络结构为9-18-1,即有18个隶属度函数。选择10组系数p0-p9,模糊隶属度函数中心和宽度c和σ随机得到,通过动态BP算法对网络的权值在线调整。隶属度函数采用高斯函数,模糊推理采用sum-product[14],解模糊采用加权平均法。网络模型的概化如图1所示。T -S模糊神经网络的第3层输出为输入数据的隶属度函数;第4层输出为第 条规则的平均激活度;后件网络实现了T -S模型模糊规则空间到输出空间的映射,输出为yj=pjk0+pjk1x1+…+pjkmxm和y=∑αk×yj。

3.4.2 网络的训练、检验及水质评价

采用归一化的训练样本和检验样本数据,对网络进行训练和检验。以10个水质待评点的基础数据(表2)为例,利用已训练好的模糊神经网络对其进行水质评价。网络输出结果见表3。

3.4.3 不同水质评价方法的对比分析

利用内梅罗指数法和BP人工神经网络法分别对上述水质待评点进行水质评价。BP人工神经网络的训练与检验样本生成方式同T -S模糊神经网络,确定BP神经网络的结构为9-3-1。规定各等级的期望输出值,为0.1,0.3,0.5,0.7,0.9。两种方法得到的评价结果如表3。由表3可知,3种方法的评价结果大体相同。利用训练好的模糊神经网络模型对50个待评点水质进行评价,结果如表4所示。由表4可以看出,吉林西部地区地下水资源已经遭受不同程度的污染,且部分地区地下水资源污染严重,需要进行有效的保护。

人工神经网络的不足范文5

【关键词】神经网络 手写 识别系统 应用

随着计算机技术的快速发展,其在人们的办公学习和日常生活成了不可替代的工具。键盘已经几乎完全替代了笔在人们生活中的地位,随之而来的后果就是人们越来越少的区书写汉字,导致越来越多的中国人甚至都忘记了汉字该如何书写,这种现象在很多研究和报道中都有体现。计算机和键盘是由西方国家发明的,其符合西方国家的语言习惯,对于中国人来说,用字母、符号去完成方块汉字的输入就需要使用者非常熟悉汉语拼音或者五笔编码,对于文化程度较低的使用者来说,这些都限制着他们使用计算机。鉴于计算机键盘的这些缺陷,联机手写输入法应运而生,这为计算机的输入带来了新的发展机遇和挑战。

1 联机汉字手写识别的意义及难点

联机汉字识别是用书写板代替传统纸张,笔尖通过数字化书写板的轨迹通过采样系统按时间先后发送到计算机中,计算机则自动的完成汉字的识别和显示。

1.1 联机汉字手写识别的意义

联机手写汉字识别的诞生具有非常重要的意义。首先这种输入方法延续了几千年中华文明的写字习惯,实现用户的手写输入,对于长时间不提笔写字的用户来说能够加强其对汉字书写方面的认识,防止“提笔忘字”现象的继续恶化。其次,手写汉字输入不需要学习和记忆计算机的汉字编码规则,其完全符合中国人的写字习惯,使人机之间的交流更人性化,更方便快捷。另外,随着移动智能终端的不断普及,联机汉字手写识别的应用范围将进一步扩大,以适用于不同层次人群对信息输入的需要,具有较大的市场发展前景。

1.2 联机手写汉字识别问题的难点

手写汉字识别是光学字符读出器中最难的部分,也是其最终的目标,手写汉字识别的应用主要依赖于其正确识别率和识别速度[1]。手写汉字识别系统的问题具有其特殊性:

(1)中国汉字量大。我国目前的常用汉字大概在4000个左右,在实际应用中的汉字识别系统应该能够完全识别这些常用的字才能够满足需要,由于超大的汉字量,使得手写识别的正确率和识别速度一直不高。

(2)字体多,结构复杂。汉字的手写字体丰富多彩,且汉字的笔画繁多,以及复杂的结构,再加上汉字中的形近字颇多,这些都为汉字识别系统的发展造成了很大的困难。

(3)书写变化大。不同用户在进行手写输入时其字体的变化是很大的,这种变化因人而异,对汉字识别造成了很大的干扰,增加了汉字匹配的难度。

2 人工神经网络概述

人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,通常简称为神经网络,是一种仿生物神经的信号处理模型。在二十世纪四十年代初人们开始进行神经网络的研究,经过几十年的发展,神经网络也产生了一系列的突破,目前应用最多的是Hopfield模型和BP算法。

神经网络的一般模型一般包括十个方面:环境、处理单元、传播规则、神经网络的状态、互联模式、稳定状态、操作模式、活跃规则、活化函数和学习算法。其中,神经元、互联模式、学习算法是神经网络模型中的三个关键因素。神经网络的一个重要内容就是学习,其学习方式可以分为监督学习和无监督学习,其学习过程一般遵循Hebb规则,误差修正学习算法以及胜者为王的学习规则,其中Hebb规则是神经网络学习中最基本的规则。

人工神经网络具有独特的优越性。首先其具有主动学习的功能,在汉字识别过程中,先将汉字模板及可能的识别结果输入到神经网络中,神经网络能够通过其自身的学习过程来实现对汉字的识别,自学功能对于神经网络的预测功能具有非常重要的意义。其次,神经网络系统具有联想存储功能,其反馈功能能够实现这种联想。另外,通过计算机的高速运算能力,神经网络具有高速寻找优化解的能力。

3 人工神经网络在联机手写识别系统中的应用

汉字识别属于大类别模式识别,人工神经网络可以通过函数逼近、数据分类、数据聚类三种作用方式以及“联想”的特殊模式对汉字进行识别。Hopfield神经网络作为反馈网络的一种,其自联想记忆网络可以使系统不需要通过大量的训练即可对汉字进行识别,因此Hopfield神经网络对于汉字识别来说具有独特的优势。其中的离散型Hopfield神经网络能够通过串行异步和并行同步的工作方式,使其反馈过程具有非常好的稳定性,而网络只有通过不断的演变稳定在某一吸引子状态时,才能够实现正确的联想。

联机手写识别可以分为训练阶段和识别阶段。训练阶段流程依次为:标准书写字符图像预处理,提取特征并建立特征库,建立Hopfield网络模型,训练网络,保存权值。识别阶段的流程为:坐标序列转化为bmp图像,预处理测试样本,提取特征,送入网络运行,运行网络到平衡状态,分析结果值。根据联机手写识别的工作流程以及Hopfield网络模型的理论,基于Hopfield神经网络的联机手写识别系统在Matlab环境下得到了仿真模拟,效果非常理想。

4 总结

手写识别系统能够弥补普通键盘的不足,在提高汉字书写频率的同时,能够满足不同层次人群对计算机应用的技术需要。基于Hopfield神经网络的联机手写识别系统一起自身独特的性能,不仅能够满足手写汉字识别的正确率,而且其识别过程速度非常快。因此它对于实现联机手写识别以及图像识别具有非常重要的意义。

参考文献

[1]俞庆英.联机手写汉字识别系统的研究与实现[D].安徽大学,2005(5).

[2]郭力宾.交叉点的神经网络识别及联机手写字符的概率神经网络识别初探[D].大连理工大学,2003(03).

[3]赵蓉.基于神经网络的联机手写识别系统研究与实现[D].西安电子科技大学,2011(01).

人工神经网络的不足范文6

关键词:树叶识别;支持向量机;卷积神经网络

中图分类号 TP18 文献标识码:A 文章编号:1009-3044(2016)10-0194-03

Abstract: In this paper, the convolution neural network recognition in the leaves, and the process by convolution of image visualization. Experiments show that the neural network application identification convolution leaves a 92% recognition rate. In addition , this neural network and support vector machine comparative study can be drawn from the study , convolutional neural network in either speed or accuracy better than support vector machines, visible, convolution neural network in the leaves aspect has good application prospects.

Key words recognition leaves; SVM; convolutional neural network

1 概述

树叶识别与分类在对于区分树叶的种类,探索树叶的起源,对于人类自身发展、科普具有特别重要的意义。目前的树叶识别与分类主要由人完成,但,树叶种类成千上万种,面对如此庞大的树叶世界,任何一个植物学家都不可能知道所有,树叶的种类,这给进一步研究树叶带来了困难。为了解决这一问题,一些模式识别方法诸如支持向量机(Support Vector Machine,SVM)[1],K最近邻(k-NearestNeighbor, KNN)[2]等被引入,然而,随着大数据时代的到来,这些传统分类算法暴露出越来越多的不足,如训练时间过长、特征不易提取等不足。

上世纪60年代开始,学者们相继提出了各种人工神经网络[3]模型,其中卷积神经网络由于其对几何、形变、光照具有一定程度的不变形,因此被广泛应用于图像领域。其主要特点有:1)输入图像不需要预处理;2)特征提取和识别可以同时进行;3)权值共享,大大减少了需要训练的参数数目,是训练变得更快,适应性更强。

卷积神经网络在国内研究才刚刚起步。LeNet-5[4]就是一种卷积神经网络,最初用于手写数字识别,本文研究将卷积神经网络LeNet-5模型改进并应用于树叶识别中。本文首先介绍一下卷积神经网络和LeNet-5的结构,进而将其应用于树叶识别,设计了实验方案,用卷积神经网络与传统的模式识别算法支持向量机(SVM)进行比较,得出了相关结论,并对进一步研究工作进行了展望。

2人工神经网络

人工神经网络方面的研究很早就已开展,现在的人工神经网络已经发展成了多领域、多学科交叉的独立的研究领域。神经网络中最基本的单元是神经元模型。类比生物神经元,当它“兴奋”时,就会向相连的神经元发送化学物质,从而改变这些神经元的状态。人工神经元模型如图1所示:

上述就是一个简单的神经元模型。在这个模型中,神经元接收来自n个其他神经元传递过来的输入信号,这些信号通过带权重的w进行传递,神经元接收到的总输入值将与神经元的阈值进行比较,然后通过“激活函数”来产生输出。

一般采用的激活函数是Sigmoid函数,如式1所示:

[σz=11+e-z] (1)

该函数图像图2所示:

2.1多层神经网络

将上述的神经元按一定的层次结构连接起来,就得到了如图3所示的多层神经网络:

多层神经网络具有输入层,隐藏层和输出层。由于每一层之间都是全连接,因此每一层的权重对整个网络的影响都是特别重要的。在这个网络中,采用的训练算法是随机梯度下降算法[5],由于每一层之间都是全连接,当训练样本特别大的时候,训练需要的时间就会大大增加,由此提出了另一种神经网络―卷积神经网络。

2.2卷积神经网络

卷积神经网络(CNN)由于在图像分类任务上取得了非常好的表现而备受人们关注。发展到今天,CNN在深度学习领域已经成为了一种非常重要的人工神经网络。卷积神经网络的核心在于通过建立很多的特征提取层一层一层地从图片像素中找出关系并抽象出来,从而达到分类的目的,CNN方面比较成熟的是LeNet-5模型,如图4所示:

在该LeNet-5模型中,一共有6层。如上图所示,网络输入是一个28x28的图像,输出的是其识别的结果。卷积神经网络通过多个“卷积层”和“采样层”对输入信号进行处理,然后在连接层中实现与输出目标之间的映射,通过每一层卷积滤波器提取输入的特征。例如,LeNet-5中第一个卷积层由4个特征映射构成,每个特征映射是一个24x24的神经元阵列。采样层是基于对卷积后的“平面”进行采样,如图所示,在第一个采样层中又4的12x12的特征映射,其中每个神经元与上一层中对应的特征映射的2x2邻域相连接,并计算输出。可见,这种局部相关性的特征提取,由于都是连接着相同的连接权,从而大幅度减少了需要训练的参数数目[6]。

3实验研究

为了将LeNet-5卷积网络用于树叶识别并检验其性能,本文收集了8类树叶的图片,每一类有40张照片,如图5所示的一张树叶样本:

本文在此基础上改进了模型,使用了如图6卷积神经网络模型:

在此模型中,第一个卷积层是由6个特征映射构成,每个特征映射是一个28*28的神经元阵列,其中每个神经元负责从5*5的区域通过卷积滤波器提取局部特征,在这里我们进行了可视化分析,如图7所示:

从图中可以明显地看出,卷积网络可以很好地提取树叶的特征。为了验证卷积神经网络与传统分类算法之间的性能,本文基于Python语言,CUDA并行计算平台,训练同样大小8类,一共320张的一批训练样本,采用交叉验证的方法,得到了如表1所示的结论。

可见,无论是识别率上,还是训练时间上,卷积网络较传统的支持向量机算法体现出更好地分类性能。

4 总结

本文从人工神经网络出发,重点介绍了卷积神经网络模型LeNet-5在树叶识别上的各种研究并提取了特征且进行了可视化,并与传统分类算法SVM进行比较。研究表明,该模型应用在树叶识别上较传统分类算法取得了较好的结果,对收集的树叶达到了92%的准确率,并大大减少了训练所需要的时间。由于卷积神经网络有如此的优点,因此在人脸识别、语音识别、医疗识别、犯罪识别方面具有很广泛的应用前景。

本文的研究可以归纳为探讨了卷积神经网络在树叶识别上的效果,并对比了传统经典图像分类算法,取得了较好的分类精度。

然而,本文进行实验的样本过少,当数据集过多的时候,这个卷积神经网络算法的可行性有待我们进一步的研究;另外,最近这几年,又有很多不同的卷积神经网络模型出现,我们会继续试验其他的神经网络模型,力求找到更好的分类算法来解决树叶识别的问题。

参考文献:

[1]Bell A, Sejnowski T. An Information-Maximization Approach to Blind Separation and Blind Deconvolution[J]. Neural Computation, 1995, 7(6):1129-59.

[2]Altman N S. An Introduction to Kernel and Nearest-Neighbor Nonparametric Regression[J]. American Statistician, 1992, 46(3):175-185.

[3]Ripley B D, Hjort N L. Pattern Recognition and Neural Networks[M]. Pattern recognition and neural networks. Cambridge University Press,, 1996:233-234.

[4]Lécun Y, Bottou L, Bengio Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11):2278-2324.