前言:中文期刊网精心挑选了神经网络隐含层数的确定范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络隐含层数的确定范文1
关键词 人工神经网路 林分材种出材率 BP算法
引言
林分材种出材率是林分调查工作的重要指标,它可以进一步评价森林木材资源的经济价值,而研究森林木材,又可以合理正确的经营森林资源,达到人与自然和谐相处的目的。林分林种出材率就是原木材积于立木材积之比,我国现行的森林采伐限额制度、查处乱砍滥伐林木案件、制订林业发展规划、计划和编制森林经营方案、预测和计算、开展森林资源资产评估等等,都需掌握积蓄量和材种的出材率的指标。我国已经不断学习借鉴前苏联的先进技术编制自己的材种出材率表了,随着我国天然林保护工程的全面实施和林业分类经营的逐步推行,人工商品林比例的不断提高,我国森林结构和性质也有所变化,所以传统的统计学以难以解决很多问题,运用人工神经网络在林业生成与运用则是一个不二之选的方法,对林业的发展也有很大的理论价值和推广意义。
人工神经网络(Artificial Neural Network-ANN),简称“神经网络”,是由大量处理单元过极其丰富和完善的互联组成的非线性、自适应信息处理系统。它的提出是基于现代神经科学研究成果上,以模拟大脑神经网络处理、记忆信息的方式进行信息处理。涉及学科较多,较为广泛。
1 研究内容和方法
平均树高,平均胸径,林种年龄,立地质量,积蓄量,保留密度等等因素都会影响林分材种出材率,而林分林种出材率具有非线性和非确定性的因素,一般采用统计分析方法进行预测采样,需要大量的林木样本元素,模型涉及的许多参数无法或很难有较高的精确度。
人工神经网络(Artificial Neural Network)具有非线性,非局限性,自适应,自组织,自学习的特征,相较于传统的统计学方法,不同之处在于它的容错性和储存量,通过单元之间的相互作用,相互连接能模拟大脑的局限性。ANN的独到之处,也使得人们注意了ANN,并且广泛的应用于各种学科之中,如心理学,逻辑学,数学模型,遗传算法,语音识别,智能控制等等。当然,运用人工神经网络对林分林种出材率进行预测也同样具有很好的效果与实现。
研究主要完成,通过对数据的采样和分析处理,对神经网路预测模型的结构,参数进行优化,再应用到林分材种出材率的预测中。以c++程序设计为设计平台,运用人工神经网络中的BP算法,分析各隐含层神经元的数量,训练的次数,隐含层函数,样本数量,进行优化建立林分材种出材率的预测模型。
1.1BP人工神经网络
BP(Back-Propagation Network)神经网络是一种以误差逆传播算法(BP)训练的多层前馈网络,目前应用较为广泛的神经网络模型之一。BP神经网络能学习和存贮多个输入-输出模式映射关系,而且无需事前对这种映射关系的数学方程进行描述。它通过不断反向传播来调整神经网络的权值和阈值,使神经网络的误差平方和最小。BP神经网络模型拓扑结构由三层组成分别是输入层(input)、隐层(hidelaver)和输出层(output layer)。
BP人工神经网络主要以标准BP算法为主,而标准BP算法有存在许多问题,由于是非线性梯度优化算法,就会存在局部极小值问题,使得精确度受限;算法迭代系数过多,使得学习率降低,收敛速度降低;网络对初始化的值存在发散和麻痹;隐节点不确定性的选取。所以引进了几种BP算法:动量BP算法、学习速率可变的BP算法和LM算法(Levenberg-Marquardt)。动量BP算法以上一次修正结果来影响本次的修正,动量因子越大,梯度的动量就越大。学习效率可变的BP算法怎是力求算法的稳定,减小误差。为了在近似二阶训练速率进行修正时避免计算HeSSian矩阵,选择LM算法。所以为了神经网络计算的速度与精确度,所以运用不同的优化算法来改善BP网络中的局部极小值问题,提高收敛速度和避免了抖动性。
2 基于BP人工神经网络和林分材种出材率预测模型的建立
分析了大量的材种出材率的相关资料后,均有非线性的特征,对于模型的建立和预测,传统的识别系统在研究和实践中有很大的问题,而采用人工神经网络,不仅其特征是非线性,而且人工神经网络具有较为稳定的优越性,所以,对于林分材种出材率的预测和建立采用BP人工神经网络。
2.1建模工具
研究采用c++程序设计对数值的计算和预测,对模型进行编译和实现。c++语言是受到非常广泛应用的计算机编程语言,它支持过程化程序设计,面向对象程序设计等等程序设计风格。c++是一门独立的语言,在学习时,可以结合c语言的知识来学习,而c++又不依赖于c语言,所以我们可以不学c语言而直接学习C++。
用c++来模拟BP网络是相对较好的程序设计语言,以面向对象程序设计来设计和实现林分材种出材率的BP算法,直观而简洁。
2.2BP神经网络结构的确定
对于使用BP算法,关键在于隐含层层数和各层节点数。而神经元的输入输出又影响着隐含层层数,而对于BP万罗中的输入输出层是确定的,重点就在于隐含层层数,增加隐含层数可以提高网络的处理能力,是的训练复杂化,样本数目增加,收敛速度变慢等,而隐含层的节点数越多,可以提到其精确度。
研究过程中,多层隐含层会将训练复杂化,所以我们往往选择三层就够了,即一个输入层,一个隐含层,一个输出层的基本单层BP网络结构。最后确定以下四个神经元:平均树高、平均胸径、林种年龄、每公顷积蓄量作为输入单元。输出单元为林分材种出材率。
结论
以BP神经网络建立林分材种出材率的网络模型,使得出材率的精确度提高。根据样本的选取和整理,算法的优化,避免了异常数据和算法的不安全性对神经网络的学习影响,提高了网络的繁华能力,利用数据归一化节约了网络资源,学习负担减轻,避免了训练过程中的抖动与麻痹状态。岁模型的总体分析,减少神经元个数的输入,权值减少,极大的提高了网络训练中的收敛速度,也使得网络的稳定性和容错性提高。
神经网络隐含层数的确定范文2
关键词 滚动轴承 状态监测 MATLAB BP神经网络
中图分类号:TH133 文献标识码:A
1 监测轴承的意义和重要性
滚动轴承是各种旋转机械中应用最广泛的一种通用机械部件,它们在旋转机械中起着关键的作用,旋转机械的故障30%是由滚动轴承故障引起的,其运行状态的正常与否直接影响到整台机器的性能(包括精度、可靠性及寿命等)。因此,及时发现滚动轴承的故障并消除,能有效保证机器正常运转,提高使用寿命。
2 常见轴承故障
滚动轴承在工作过程中,常见的轴承故障可总结为损伤和磨损两大类。损伤类故障有疲劳剥落、塑性变形、轴承烧伤、锈蚀 、断裂、胶合六种;磨损类故障为轴承长期正常工作引起的渐变性故障。
(1)疲劳剥落
在工作中,轴承滚子和滚道接触面相对滚动的同时又互相挤压,轴承部件接触面将产生小的剥落坑,最终发展为大面积剥落,该现象称作疲劳剥落。
(2)塑性变形
当工作载荷过重时,由于滚 动 轴 承 承受 的 过 大 的 冲 击 力 和 静 载 荷 的 原 因 ,轴承滚道的表面上形成的不均匀凹坑,这种现象主要发生在低速旋转的轴承上。
(3)断裂
过大的负荷和工作过程中摩擦产生的热应力过大时能引起轴承零件断裂。
(4)轴承烧伤
轴承不良、应用变质的油、装配过紧或存在较大偏斜量能引起轴承的烧伤。
(5)胶合
轴承在高速高负荷和欠缺的情况下,摩擦产生的热量能使轴承部件迅速升温,到达一定温度时能引起轴承部件接触的金属表面相互粘接,该现象称作胶合。
3 常用的滚动轴承监测数据分析手段
利用振动信号对故障进行诊断,是设备故障诊断方法中有效且常用的方法。机械设备和机构系统在运行过程中的振动及其特征信息是反映系统状态及其变化规律的主要信号。通过各种动态测试仪器提取、记录和分析动态信息,是进行系统状态监测和故障的主要选径。常用的信号处理方法主要有时域分析、频域分析和小波分析等。
4 信号采集和特征值提取
通过加速度传感器可提取到振动信号。滚动轴承的振动信号的特征包括时域和频域特征,这些特征的合理组合能够很好的反应滚动轴承的运行状态,实现对其的监测,并能通过进一步处理实现故障的识别。时域特征可包含信号的能量、波动性等信息,但远远不足以准确判断故障所在;频域的特征则是更加明显。然而只有两累特征综合来判断才能对故障进行准确识别。
对时域和频域的各个参数分别进行分析,从中抽取特征,可用作模式识别的输入量。特征选取依据以下原则:(1)同种状态信号的特征重复性好;(2)不同种状态信号的特征差异性好,即当被监测对象状态发生改变时,特征值会明显改变。
5 神经网络的模式识别
5.1 人工神经网络的基本原理
(1)人工神经元模型
最早提出神经元模型并且影响较人的是1943年心理学家在分析总结神经元基本特性的基础上首先提出的MP模型。人工神经元模型是由大量处理单元广泛互连而成的网络,是人脑的抽象、简化、模拟,反映人脑的基本特性。
(2)人工神经网络结构。
神经网络常分成两大类:没有反馈的前向神经网络和相互结合型网络,如图4.1所示。
前向神经网络由输入层、一层或多层的隐含层和输出层组成,每一层的神经元只接受前一层神经元的输出。相互连接是指网络中任意两个单元之间都是可达的,即存在连接路径。
5.2 BP神经网络
(1)BP神经网络的结构
BP神经网络,即多层前馈式误差反传神经网络,通常由输入层、输出层和若干隐含层构成:每一层都由若干个节点组成,每一个节点表示一个神经元,上层节点与下层节点之间通过权值连接,层与层之间的节点采用全互联的连接方式。神经网络的结构图如下所示:
(2)网络参数的确定
①网络层数的确定
BP网络是通过输入层到输出层的计算来完成的。多一层的隐含层虽然能提高网络的训练速度,但是需要较多的训练时间,而训练速度可以用增加隐含层节点个数来实现,因此在应用BP神经网络时,选取只有一个隐含层的三层BP神经网络就足够了。
②输入、输出层神经元个数的确定
输入层的神经元个数就是提取到的有效特征值的个数;输出层神经元的个数要看问题模式的种类数,监测轴承的好坏有正常与故障两种模式,故输出层神经元的个数为1。当输出为1时表示该轴承为正常轴承,输出为0时表示该轴承为故障轴承。
③隐层神经元个数的确定
隐层神经元个数的确定比较复杂。在具体设计时,首先根据经验公式初步确定隐含层神经元个数,然后通过对网络进行训练对比,再最终确定神经元数。通用的隐含层神经元数的确定经验公式有:
其中为隐含层神经元的个数,n为输入层神经元的个数,m为输出层神经元的个数,a为常数且1 < a < 10。
6 结束语
通过对轴承特征值的提取,提取到了重复性好、差异性好的有效特征值。利用神经网络模式对轴承的工作状态进行有效的识别,将归一化处理后的有效特征值作为神经网络的输入参数输入,用实验所测得的数据对BP神经网络进行训练,从而达到轴承状态识别的目标。
参考文献
[1] 雷建中,张增岐.国内外轴承废品及失效分析.NSTL期刊,2010.7.
[2] 武栋梁.滚动轴承常见故障及其振动信号特征.中国航空导弹研究院,2012.6
[3] 苏宝定.滚动轴承振动检测与智能诊断系统研究.大连理工大学,2008.12
[4] 常文龙,胡朋.滚动轴承运行状态智能化监测.科教导刊,2013.3
神经网络隐含层数的确定范文3
关键词:企业财务困境预警;人工神经网络
中图分类号:F23
文献标识码:A
doi:10.19311/ki.16723198.2016.21.066
1人工神经网络
人工神经网络是基于理论化的人脑神经网络,是通过模仿大脑神经网络结构和功能模拟建立起来的一种信息处理系统,此类人工神经网络由大量较简单的人工神经元根据一定的规律连接起来形成复杂网络,具有高度的非线性,在系统功能上能够满足复杂的逻辑操作和非线性关系实现。在网络中信息的转播、存储方式以及信息存储在各个神经元的连接权上都与生物神经网络进行信息传播存储相似。两者都是运用并行式的“集体”工作方式。这种信息处理系统是通过人工模仿人脑神经网络而建立的,因此被人称为人工神经网络。
设输入模式向量为Xk=(xk1,xk2,…,xkn)T(k=1,2,…,m),对应输入模式的期望输出向量为Yk=(yk1,yk2,…,ykq)T;中间隐含层净输入向量Sk=(sk1,sk2,…,skp)T,输出向量Bk=(bk1,bk2,…,bkp)T;输出层净输入向量Lk=(lk1,lk2,…,lkq)T,实际输出向量为Ck=(ck1,ck2,…,ckq)T。
2财务预警指标体系的构建与模型设计
(1)财务数据的确定。
财务数据选取为2015会计年度报表中的财务数据,数据来源于东方财富网和巨潮资讯网。其中沪市A股上市公司代码60XXXX。
(2)基于BP神经网络的财务预警模型的构建从常规来看,BP网络的结构设计主要包括隐含层、确定输入层、输出层及各层之间的传递函数。事实上,网络的应用往往转化为如何确定网络的结构参数和网络模型的最终连接权值。在实验过程中,模型的具体设置如下。
①网络层数的设计。神经网络主要由出入层、隐含层和可以加强网络映度的隐含层组成。在模型设置中对于多层神经网络而言最重要的是要确定隐含层的具体数目。在模型设置中,通过采用单隐含层BP神经网络,即仅利用一个输入层、一个输出层和一个隐含层就能够实现将财务危机良好分类。
②输入层的设计。在模型设计过程中通过输入相关变量决定输入层的神经元个数,使输入节点与网络的逼近效果呈正相关。但是在模型设计过程中,一味盲目的扩大节点数也会加大网络的负担,从而对网络的训练时间和训练效果进而影响网络的训练时间和训练效果,此次研究的输入层节点数为财务预警指标的个数,即9个。
③输出层的设计。输出值代表模型要实现的目标功能,这种网络结构同一般指标预警有着共同点,输入层和隐含层分别为预警指标和警情指标。
④隐含层的设计。在模型系统中,对网络的性能产生重要影响的因素是算法的神经网络中各层节点数。实验要达到预定的映射关系必须克服单隐含层网络的非线性映射能力较弱这一缺点。实验中在设计隐含层节点时,进行反复测算,当隐含层神经元个数为18个时选择预测结果最为理想。
⑤传递函数。传递函数又称为激活函数,对输入层到隐含层的传递函数为tan Sigmoid函数。隐含层到输出层之间的传递函数确定为Purelin型线性传递函数。
⑥网络参数。此论文在研究过程中设置如下网络参数:目标误差0.0000001,学习速率为0.1,训练循环次数200次。通过测试,得出最优学习速率为0.03。
(3)预警模型的检验与测试。
利用BP神经网络的财务预警模型设计,将实验所需的样本集分为训练样本和测试样本2组。从样本集中随机抽取10家企业作为测试样本,剩下的ST企业和非ST企业作为训练样本。将上述对应样本输入程序,通过计算机程序运算就得到了测试样本模型演算的输出值。程序运行情况表明该BP网络模型的误差曲线是收敛的,通过24步训练,该程序的网络性能达标,符合初始化均方差的要求。此程序模型对训练样本和测试样本的判定结果如表1所示。
将财务困境公司判定为财务健康公司和将财务健康公司判定为财务困境公司是BP神经网络模型样本误判的两种类别。实验结果表明,从训练样本的角度来看,误判的样本个数为0个,也就意味着其判定准确率达到100%。从测试样本的角度来看,被误判的样本个数为2,两种误判类型的样本个数各占一个,以上实验结果表明误判率为20%,判定准确率为80%,总的判定准确率为96%。
3研究结果
每个企业可能会有不同的财务状况短板,但是利用以上系统进行直观的数据分析,能够从宏观方面看出存在财务危机可能性的企业的整体财务状况要比非ST企业差很多。也进一步说明了在该模型的测试下,随机抽样的方式选择样本数据,依然具有较高的准确率。
参考文献
[1]杨淑娥,黄礼.基于BP神经网络的上市公司财务预警模型[J].系统工程理论与实践,2005,(01):1218,26.
神经网络隐含层数的确定范文4
Abstract: Neural network is widely applied for character recognition. Through the analysis of the problems, this paper recognizes character by the application of improved BP neural network, so as to improve recognition rate. This method has high recognition rate, fast speed, strong practicability, and can be applied to various high noise environment.
关键词: 神经网络;图像预处理;特征提取;字符识别
Key words: neural network;image preprocessing;feature extraction;character recognition
中图分类号:TP301.6 文献标识码:A 文章编号:1006-4311(2014)10-0206-02
0 引言
字符识别是指采用扫描仪、数码相机等输入设备,把英文字母、数字、条形码等特殊字符的图形文件输入计算机,由识别软件对图片信息上的字符信息进行识别并变换成可编辑文档的识别技术。主要有光学字符识别(Optical
Character Recognition,OCR)、图像字符识别(Image Character Recognition,ICR)和智能字符识别(Intelligent Character Recognition,ICR),实际上这三种自动识别技术的基本原理大致相同。
1 常用字符识别方法
字符识别方法基本上都是为了区分结构识别、统计识别以及两者相结合的三大类方法,这三大类方法都包含具体的识别方法。
1.1 结构识别 结构识别是早期字符识别的研究的主要方法,我们也可以称之为句法结构识别。其思想是提取含有一定规律的结构信息,作为识别的依据。识别过程类似一个逻辑推理过程。结构识别的优点在于对字符变化的适应性强,区分相似字符能力强。但是在实际获取字符图像的过程中,由于存在着很多扭曲、倾斜等因素,就导致不能够准确地提取结构特征,后面的识别过程就成了无源之水。此外,结构识别的算法描述也较为复杂,匹配过程的复杂度也很高,因此,我们原有的句法识别就受到新的挑战。
1.2 统计识别 统计决策论的发展相对较早而且成熟,是为了提取待识别字符的一组统计特征,然后按照一定的准则进行决策函数的分类判决的。而统计识别是将字符点阵看作是一个能够经过大量统计数据得到的整体,是以后所用的特征都需要经过的。统计特征主要是以抗干扰能力强为主要特点,以实现匹配与分类的算法简单,且容易实现的。不足之处在于细分能力较弱,区分相似字的能力差一些。
1.3 结构识别与统计识别相结合 上述方法各有优缺点,而随着研究的深入,这些方法逐渐得到融合。网格化特征就是结合的产物。特征的统计以网格为单位,即使个别点的统计有误差也不会造成大的影响,增强了特征的抗干扰性。这种方法正得到日益广泛的应用。
字符的结构特征直接反映了字符的特有属性,而用字符的统计特征进行字符识别则是利用了计算机软件善于处理数字的特点。虽然近几年流行的神经网络方法主要采用的是局部特征,但其分类机理也与传统的统计识别方法相类似,优点是灵活性强。
2 字符识别流程
字符识别技术在当今社会的许多领域都有着广泛的商业应用前景。常见应用有条码识别、车牌识别、盲人的辅助阅读设备和邮包自动分检等。本文以车牌识别为例说明字符识别的应用以及识别流程。车牌识别系统的工作流程如图1所示。
经过字符分割后,得到可以进行字符识别的图像。本文采用神经网络方法进行字符识别,识别的具体过程如图2所示。
3 基于改进型BP神经网络的字符识别算法
3.1 BP神经网络简介 神经网络最早的研究是20世纪40年代,由心理学家Mcculloch和数学家Pitts合作提出的,由此拉开了神经网络研究的序幕。人工神经网络是通过对人脑生物神经机理进行简化,抽象和模拟之后建立起来的一种计算模型,属于机器学习的重要研究领域。人工神经网络可以应用于字符识别、人脸识别等领域。
随着神经网络的威力逐渐显现以及付诸应用的现实性,大量的学者对此进行了深入研究,出现了多种神经网络,如径向基神经网络和Hopfield网络等。1986年科学家Rumelhart和McCelland提出了BP(Back Propagation)神经网络,是一种按误差逆传播算法训练的多层前馈网络,是目前在字符识别中应用最广泛的神经网络模型之一。BP网络能学习和存储大量的输入输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。
BP神经网络的结构如图3所示。从左至右分别是输入层、隐含层和输出层。
从图3可以看出,某一层的输出就是下一层的输入,即:am+1=fm+1(Wm+1am+bm+1),m=0,1,…M-1……
这里,M为神经网络的层数。第一层的神经元的输入为a0=p,最后一层神经元的输出是a=aM,即为整个神经网络的输出。BP神经网络虽然在字符识别领域有着重要的应用价值,但其存在如下问题:①进行字符识别时存在局部极小值问题;②算法通常需要迭代几千步甚至更多,收敛速度慢;③隐含层和隐含层节点的数量难以确定。要解决上述问题,就需对BP神经网络算法进行改进。
3.2 基于改进型BP神经网络的字符识别
3.2.1 图像预处理 在字符图像采集、输入的过程中由于受到多种噪声的干扰,会使图像质量下降,为字符识别工作带来困难,因此需要对初始图像进行必要的预处理。图像预处理的具体步骤如下:①选取合适的阈值进行图像二值化;②灰度变换增强对比度,改善视觉效果;③选取合适的方法去除噪声,常用的有中值滤波、均值滤波、高通滤波等方法;④图像分割,即将图像中的字符独立的分割出来。
3.2.2 字符特征值的提取 如果直接采用分割后的字符进行对比,那么需要对比的信息量很大,程序运行的时间也会大大增加。所以需要对分割后的字符进行特征提取,本文使用了类似九宫格的方法进行特征提取,即在字符图像的水平方向上将图像均匀分成三部分,在每一部分用一条水平方向的扫描线从左至右穿过字符,进行查找;垂直方向上原理相同,扫描线从上到下穿过字符,进行查找。取这六条线上的特征作为字符图像的特征,这样就得到了每个字符的六个特征值。
3.2.3 改进型BP神经网络 针对BP神经网络的局限性,为了避免落入局部极小值点,提高网络训练的精度和速度,对其算法进行了改进,常用的方法有:①优化初始权重。由于BP网络的误差曲面存在多个局部最小点和算法采用误差梯度下降的方法调整网络权重,因此导致了网络的训练结果极容易落入局部极小点。所以,网络的初始权重对网络的最终训练结果影响非常大,它是影响网络最终能否达到需求精度的重要因素之一。②调整自适应学习率。学习率η也称步长,在标准的算法中为常数。BP算法的收敛特性和收敛速度很大程度上取决于学习率,对于不同的问题,其取值范围也会不同。η取值过大可以加快学习速度,但会导致学习过程不收敛;η取值过小,则迭代次数明显增加,导致学习速度过慢。为了加速收敛的过程,可以自适应改变学习速率。③附加动量法。动量法是指在反向传播的基础上,在每个权值调整值上加上一项正比于前次权值变化的值,并根据反向传播法来产生新的权值变化。
本文为了简单起见,采用附加动量法只对数字和英文字母进行字符识别,利用梯度下降法,使权值沿函数的负梯度方向改变。提高了学习速度,增加了算法的可靠性。
带有附加动量项的权值调节公式为:
Wij(k+1)=Wij(k)+η[(1-α)D(k)+αD(k-1)]
其中,α是附加的动量项,取值范围为0
3.2.4 设计改进型BP神经网络进行字符识别 本系统采用了两个BP网络来进行数字和字母的识别。BP神经网络的建立主要是三个层的神经元数目的确定。①输入层节点数。此节点个数即为图像预处理后所输出的特征的维数。本系统输入层节点数为24×48。②隐含层节点数。确定隐含层节点数的基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐含层节点数。本系统的两个神经网络,可以根据输出层神经元的多少来确定其个数,即输出层神经元越多,其隐含层神经元个数也越多。③输出层节点数。用于识别数字的BP网络,由于只有10个数字,所以采用了8421码进行编码,输出层的神经元数目为4。而识别26个字母的BP网络,其输出层的神经元数目为5。待识别的字符图像和训练好网络后识别的结果分别如图4和图5所示。
4 结束语
在字符识别的过程中,每一步都会有不同程度的误差,本文神经网络经验证后识别率可达95.1%,平均识别时间为0.6s。影响识别成功率的主要因素是训练样本的数量和训练次数,要保证一定数量以上的训练样本和训练次数,以保证识别率。另外,神经网络的层数和各层神经元的个数,对神经网络算法的运行速度和识别率也有着直接的影响,其数量越多,识别率越高,但也制约着识别速度,因此,如何处理好两者关系很重要。
参考文献:
[1]关学忠,刘勇智.基于数字图像处理的车牌定位及字符分割方法[J].装备制造,2010(01).
[2]武桐.基于图像匹配的汉字识别系统研究与实现[D].上海:上海交通大学,2010.
神经网络隐含层数的确定范文5
关键词:BP神经网络、房地产估价、房价
中图分类号:F293文献标识码: A
我国从20世纪80年代后期开始,随着市场经济的发展,房地产制度改革不断深化,房地产作为商品参与流通。加之不同规模,不同性质的新建住宅往往差别很大,这就要求评估人员必须对评估对象做出更加准确的评估。科学地进行房地产估价已经成为一个十分紧迫的课题。BP神经网络,以其工作状态稳定、易于硬件实现、简单可行等优点,为广大科技工作者采用。但是,如何进一步提高待判样本模式的准确率,则是神经网络用于分类普遍存在的问题。
1.基于神经网络的房地产价格评估的特点
应用BP神经网络方法进行房地产估价,可以改善传统评估方法的随意性和不确定性,但是该技术方法也存在一定的缺陷与不足,对于其估价特点总结如下:
(1)BP神经网络应用于房地产估价,其适用范围很广。对于某类房地产,只要能够在市场上找到该类型一定数量的成交案例,就可以使用此方法。
(2)采用该方法进行房地产估价是通过对样本案例的学习,寻找房地产价格与其影响因素之间存在的客观规律。可以肯定的是,这种规律是非线性的,所以采用该方法进行估价,可以不用事先假设它们之间服从某种数学关系,一定程度上增强了估价客观性。
(3)训练样本的选择、网络拓扑结构的设计以及网络参数的设定对应用神经网络方法进行房地产估价有非常重要的作用,而当某种类型房地产估价的神经网络模型一旦训练成功,就可以对大批量的类似房地产进行快速、准确地估价。
2.BP神经网络的房地产估价模型
BP神经网络进行计算包括收集数据、设计神经网络、输入学习样本、网络的学习过程、计算评估结果等部分组成,对应市场比较法估价的流程。
(1)选择案例
运用市场法估价,首先需要拥有大量真实的交易实例。只有拥有了大量真实的交易实例,才能把握正常的市场价格行情,才能据此评估出客观合理价格或价值。
(2)分解影响因素
运用BP神经网络进行轨道交通周边房地产估价时,根据轨道交通对于房地产价格影响的因素,收集整个住宅小区中对房地产价格密切相关的因素,例如距离站点的直线距离、交通状况、建筑类型、容积率、绿化率、开发商实力、小区配套设施、周边环境等因素。
(3)因素修正
在市场比较法中,一般以待估房地产的各个因素指标为100,其他已成交案例的对应因素为100上下的数字,以此进行比较。采用房地产市场上已成交的交易案例作为学习样本。
(4)计算评估结果
市场比较法在最后计算待估房地产价格的过程中,一般采取算术平均法或者加权平均法,对于经过因素修正后的已成交案例价格进行计算。
3.网络参数的确定
(1)确定输入/输出变量
以下两条是选择输入/输出变量应该遵循的原N-一个输入变量选取对输出影响很大且能够检测或提取的变量;另一个要输入变量之间的不相关性值得关注。
(2)确定网络层数
具有偏差和至少一个S型隐层加上一个线性输出层的神经网络,在理论上被证明能够逼近任何有理函数。
(3)确定隐层单元数
为了使网络训练精度的提高,可以采用一个隐藏层,而增加其神经元数量的方法来实现,而且比增加网络隐含层数量的方法简单的多。隐藏层单元数的确定是关键。
(4)初始权值的选取
由于运算系统是非线性的,初始值直接影响学习是否达到局部最小、能否收敛。所以一般让经过初始加权后的每个神经元的输出值都接近于零,这样可以保证每个神经元的权值都能够在他们的S型激活函数变化最大之处进行调节。
(5)期望误差的选取应当
在设计网络的训练过程中,期望误差值也通过对比训练后确定一个合适的值,这是相对于所需要的隐含层的节点数来确定,因为较小的期望误差值是要靠增加隐含层的节点,以及训练时间来获得。本文训练模型根据实际训练情况采用期望误差为0.005。
4.BP神经网络应用于房地产估价的可行性分析
房地产估价人员依靠经验,对数据、资料进行处理,测算出评估结果。这种专家大脑的思维方式与神经网络的工作方法恰好吻合。根据市场比较法和神经网络理论特点,将神经网络理论引入于市场比较法,结合两者的优势,将会产生较好的应用前景。神经网络基本理论知识可知,神经网络具有极强的非线性动态处理问题的能力,不必事先假设数据服从何种分布、变量之间符合什么规律,更不需要精确地数学模型,通过对输入、输出数据的学习获得有用的知识,实现其预测功能。由于房地产价格与其影响因素之间存在着复杂的非线性关系,无法用一个具体的数学模型来准确地表达他们之间的关系,即各因素对价格的影响程度是未知的。
5.房地产估价引入BP神经网络的改进建议
房地产估价的前提是市场信息足够充分,能得到实际状况的数据,这样模型所模拟出的价格才是剔除泡沫成分,符合市场规律的。现行我国房地产价格居高不下,远远背离市场价值规律,投机成分是主要原因。我国现行国有土地招拍挂制度存在着一些不合理的现象,在土地价格的形成过程中从总体上提升了房价。因此运用BP神经网络进行房地产估价存在一定的前提条件:即在市场资料足够充分,提取能体现公允价值的不含泡沫成分的房地产价格信息。在现阶段,能够参考的体现公允价值的房地产价格信息参照二手房交易价格;随着我国土地交易制度改革的深入和完善,土地交易标底价或者静态博弈拍卖价格有可能成为重要估价的参考。在房地产估价的过程中,都要经历成交案例的选取、影响因素修正、待估房地产价格计算这三步骤。其中,影响因素修正和待估房地产价格计算容易由于估价人员根据主观判断和计算的不全面性,带来最后估价结果的偏差。如果在房地产估价的后两个环节里,运用一定的数学模型模拟房地产估价的过程,通过关键数据的录入能实现对房地产价格的预测,最终能够减少估价人员的主观性对估价结果的负面影响,提高估价的精确度。
参考文献
[1]彭涛.人工神经网络房地产价格评估模型的研究及应用[]],时代金融,
2010.(7)
[2]王军武,林晶.BP神经网络在城市房屋拆迁估价中的应用 [J].2006.(11)
[3]段玉三.人工神经网络文献综述[J].科技信息.2011,(12)
[4]李刚.基于人工神经网络的房地产估价研究[J].上海金融,2007.(12)
神经网络隐含层数的确定范文6
内容摘要:本文从河北省的物流需求现状出发,通过分析区域物流需求量的衡量指标和影响因素,建立了区域物流需求量预测指标体系,并根据实际数据采用BP神经网络方法建立预测模型,通过与指数平滑法预测结果比较可以看出,采用BP神经网络方法进行物流需求量预测较指数平滑法更精确,在一定程度上能够为河北省物流规划提供定量决策依据,并以此为基础为整个区域物流需求量预测提供科学依据。
关键词:BP神经网络 河北省 物流需求量 预测
环渤海经济区科技发达,资源丰富。近年来,随着经济的快速发展,物流业也呈现迅猛发展的势头。河北省地处环渤海经济区的核心地带,与该地区整体经济情况一样,该省近年来物流需求量发展迅速。货运量作为物流需求量的重要体现,2008年货运量达到11.1亿吨,同比增长率为7%;2009年货运量更是达到13.68亿吨,同比增长率为22.8%。河北省作为环渤海经济区的重要组成部分,其物流系统的规划和建设对整个环渤海经济区乃至整个华北、东北地区的经济发展都有至关重要的影响。物流需求量的预测是物流系统规划、物流资源合理配置的重要环节,同时也为政府制定物流产业发展政策、物流基础设施建设提供必要的决策依据。为了更好的实现优化河北省的物流发展环境、培育物流龙头企业、加快物流项目建设、加快行业物流发展、加快物流改革开放、编制物流规划、做好基础工作等目标,对河北省的物流需求量进行准确预测显得尤为重要。
最常用的物流需求预测方法有指数平滑法、移动平均法和回归分析法等,杨培华(2009)和李海建,曹卫东等(2003)运用移动平均模型对物流发展的规模进行了预测;张云康,张晓宇(2008)和濮帅(2009)直接用指数平滑法对物流需求进行预测,并在此基础上进行了物流需求多种方法组合预测;李慧(2004)和陈德良等(2009)运用线性回归预测模型,对运输物流以及区域物流进行相关预测;王隆基,张仲鹏,孙晓霞(2005)和肖丹,倪梅,李伊松(2003)利用灰色模型对物流园区的货流量等进行了预测。传统方法在进行物流预测前都需要建立函数模型,这就无形中增加了预测的难度;更重要的是,传统方法主要是基于线性的决策思想,而物流影响因素和物流需求之间存在的是高度的非线性映射关系,这些非常符合BP神经网络所解决问题的特点,即它不需要建立模型和进行参数估计就可以比较精确的描述因素之间的非线性映射关系。因此,本文采用BP神经网络对河北省物流需求量进行预测,文中给出了预测的网络模型、算法原理及实施方案,实际应用证明了方法的有效性和适用性。
物流需求量的影响因素
表征物流需求量的指标非常多,本文选用“货运量”来表征物流需求量。因为区域物流所研究对象是区域内的所有物流活动,牵涉时间长、范围广,虽然货运量只是物流需求量中的一个部分,但运输贯穿物流活动的始终,是联系其他物流服务功能的纽带,据统计,区域每年的运输费用占物流总成本的二分之一以上,从这个角度来说,货运量y(万吨)在一定程度上能够反映物流需求规模的变化规律。
根据预测指标选取的可测性、可比性、代表性和数据可得性原则,选取地区生产总值x1(亿元)、第一产业产值x2(亿元)、第二产业产值x3(亿元)、第三产业产值x4(亿元)、地区零售总额x5(亿元)、地区进出口贸易总额x6(万美元)、居民消费水平x7(元)作为河北省物流需求量预测的经济影响因素。其中地区生产总值和经济结构都对物流需求有影响,贸易和商务流通是区域物流需求的重要组成部分。
区域经济规模是首要因素,因为区域经济发展的整体水平和规模是区域物流需求的根本决定性因素,区域经济总量水平越高,对原料、半成品、产成品的流通要求也就越高;区域经济增长速度越快、区域经济越活跃,其区域物流需求增长也越快,如果区域经济停滞或倒退将导致区域物流需求不足和下降,即物流产业与国民经济发展之间存在着较强的相关关系。其次,是产业结构对区域物流需求的影响。随着产业结构从第一产业向第三产业调整,物流需求表现为从低附加值产品的物流需求向专业化和综合化的需求转变,不仅对运输和仓储继续保持较强的需求,对包装、流通加工等增值服务需求也大大增加。再次是区域商贸流通、区域外贸总额和居民消费水平对物流需求的影响。区域商贸流通和区域外贸活动越活跃,居民消费水平越高越能促进商业连锁和各种超市、大卖场以及网购的蓬勃发展,进而推动以需求为导向的物流配送服务的发展。
BP神经网络原理
(一)BP神经网络原理
BP神经网络(即误差反向传播网络)是一种多层前馈网络,运用梯度搜索理论,使得网络实际输出与期望输出的均方差达到最小,BP网络的学习过程包括正向传播和反向传播两部分。当给定网络一个输入模式时,它由输入层至隐含层并进行计算,并向下一层传递,这样逐层传递和计算,最后到输出层,产生一个输出模式,这是一个逐层状态更新的过程,称为正(前)向传播。如果实际输出模式与期望输出模式有误差,那么就将误差信号沿原来的连接通路从输出层至输入层逐层传送,并修改各层的连接权值,使误差减小,直至满足条件为止,这个过程称为反向传播。当所有训练模式都满足要求时,本文认为BP网络已经学习好。需要指出的是,一旦BP网络学习好了,运用时就只需要正向传播,不再进行反向传播。
BP神经网络由输入层、一个或多个隐含层和输出层组成。网络通过实际的输入和既定的输出来调节隐含层节个数和权值,从而使BP神经网络快速收敛达到期望的输出。本文选用典型的三层BP网络结构,其拓扑结构如图1所示。
(二)BP神经网络算法思想
根据BP神经网络的基本思想,其算法过程可以描述如下:
指标体系的建立;对评价目标值进行归一化处理;当输入向量的各分量量纲不同时,应对不同的分量在其取值范围内分别进行变换;当各分量物理意义相同且为同一量纲时,应在整个数据范围内确定最大值和最小值,然后进行同一的变换处理,以使输入的评价目标值在区间[-1,1]中。用随机数(一般是0-1之间的数)初始化网络节点的权值(wij)和阈值θj;为了尽可能避免由于权值和阈值的迭代收敛造成的网络饱和,并考虑到网络的收敛速度以及样本数据的复杂性,权的初始值域取(-0.05,0.05)比较好,因为较小的初始值域更利于权值均匀地随机初始化。隐含层数目的确定;输入标准化的样本X=(x1,x2…xn)以及对应期望输出Y=(y1,y2…ym);正向传播,计算各层节点的输出;计算各层节点的误差dik;修正权系数wij和阀值θj;根据计算误差,按给定指标判别是否满足要求。如果满足要求,则算法结束;如果未满足要求,则返回第六步执行。训练后的网络就可以用于正式的预测。建立模型的流程如图2所示。
河北省物流需求量预测
BP神经网络通过若干已知物流需求量指标值对神经网络进行学习训练,使其获得物流需求量各项指标值间的关系,以及对预测指标倾向性认识,这些指标值之间的关系最终以确定的权值和阈值表现出。当需要对新的样本模式进行预测时,人工神经网络通过权值和阈值的应用,再现训练所得的经验、知识和直觉思维,将待预测样本的各项指标值输入神经网络,网络便可输出物流需求量的预测值,这样就完成了预测。
(一)模型的建立与数据处理
货运量y作为输出,x1…x7作为输入,也即三层拓扑结构中的n的值为7,m的值为1。如何确定隐含层节点的数目,目前还没有明确而又广泛适用的结论,但也有学者对此给出了一些经验公式如隐含层节点数H与输入节点数N的关系为:H=log2N、 H=2N+1、H=+a(其中N为输入层节点数;H为隐含层节点数;a为1~10之间的一个常数)等。本文经过多次试验采用公式H=2N+1,得到H的值为15。
对应上文中确立的物流需求量预测指标,从《河北经济年鉴》中找得对河北省物流需求量进行预测的相关指标数据如表1所示。
本文BP神经网络是借助MATLAB来进行数据处理以及模型建立的,这使得预测模型的建立、训练以及应用过程大大简化。选取表1中1990-2003年这14年的各指标值(x1…x7)作为训练模型的样本输入,1991-2004年的货运量作为样本输出,以此来训练BP神经网络。由于不同分类的样本数据相差较大,这往往会使得训练过程复杂,经过归一化处理后的数据一方面可以方便处理,另一方面也可以保证程序运行时收敛加速。因此,本文在MATLAB中通过Premnmx函数来实现这一归一化过程,将样本集数据的均值和方差做标准化处理,使得样本数据位于[-1,1]的范围内,大大方便计算。归一化后的数据如表2所示。
(二)模型的设计及训练
函数Trainlm收敛速度快,网络的训练误差也比较小,因此本文训练是采用LM算法,结合物流活动的非线性特点,传递函数一般用Sigmoid(S型)函数,输入层到隐含层的函数设置为Tansig函数,隐含层到输出层的函数设置为Purelin函数。训练目标及训练的最小误差为1e-5,学习速率为0.05,允许的最大训练步数为50000,每间隔显示一次训练结果的步数为100。
该BP网络经过不到6个训练周期即达到了设定的均方误差,均方误差MSE为1.38873e-009/1e-005,训练效果较好。运行误差界面如图3所示,由于每次训练的初始权值是随机分布的,每次训练的结果都不相同,可以经过多次的训练,使预测数据更加接近真实数据。
(三)预测结果
选取表1中2004-2009年的5组数据作为验证样本,即将2004-2008年的各项指标值作为样本的输入,2005-2009年河北省货运量作为期望输出,以模型的实际输出结果与期望输出相比较来验证模型的确立是否成功。对于模型的验证过程,我们使用Tramnmx函数。
BP神经网络的预测结果与指数平滑法预测结果与真实值的比较如表3所示。从表3可以看出BP神经网络方法具有比指数平滑法更好的吻合度和更高的准确度,预测值与实际值基本接近,平均误差为2.82%,因此用BP神经网络作为河北省的货运量的预测是合适的。根据建立的BP神经网络预测河北省2010货运量(2011年河北经济年鉴未公布),输入P=[17026.6;2218.9;8874.9;5932.8;5764.9;2961131;7193],预测结果为1.3644e+005万吨。
事实上,利用BP神经网络模型还可以对未来第r年的货运量进行预测且更有实际意义。这是因为现实经济社会中往往不能及时收集到所有数据,尤其是近期数据,这样使用前面介绍的滚动预测方法就会有很多不便,而采用跨越式的预测方法就可以使用时间较久的数据对未来进行预测。这时只需对网络的样本输入和样本输出进行如下设计:以第1―第n-r年的各指标值作为样本输入P,以第1+r―第n年的货运量作为样本输出T,对BP神经网络进行训练。训练完成后用第n年的各指标值作为输入,经过BP神经网络的模拟运算即可得到第n+r年的货运量预测值。例如r取2,预测出2011年的货运量为1.6210e+005万吨;制定产业规划一般以5年为一个周期,若r取5,即可预测未来第5年的河北省货运量进行预测,为国家、省经济甚至企业的5年规划提供决策依据。
结论
本文以1990-2008年的河北省货运量及其影响因素为基础建立BP神经网络,可以对未来1年或者第r年的货运量进行预测,经过验证和与指数平滑法比较可以看出取得较好的预测效果。从2009和2010年的预测结果可以看出河北省未来的物流需求将有较快的增长速度,物流业将有好的发展前景,河北省物流预测的成功同时也证明此区域物流预测模型的正确性。另由于掌握的信息有限,未来也是不确定的,故预测结果可能与未来实际发生的物流需求量存在一定的差距,但通过模型预测得到的结果可以定量反映其发展变化的趋势,在短期能够为区域物流决策的制定提供依据。
参考文献:
1.李赤林,胡小辉.基于BP神经网络的武汉城市圈物流需求预测[J].武汉理工大学学报(信息与管理工程版),2009(5)
2.王亚彬.河北省确定物流业发展重点为积极培育龙头企业[OL].finance.省略/china/dfjj/20100225 /10407455876.shtml. 2010-02-25
3.王隆基,张仲鹏,孙晓霞.基于BP神经网络的物流预测方法[J].起重运输机械,2005(5)
4.肖丹,倪梅,李伊松.物流需求分析指标研究[J].铁道物资科学管理,2003(21)
5.文培娜,张志勇,罗斌.基于BP神经网络的北京物流需求预测及分析[J].物流技术,2009(6)
6.张代远.神经网络新理论与方法[M].清华大学出版社,2006
7.杨培华.基于拉动系数时间序列法的物流市场容量预测.消费导刊,2009(9)
8.李海建,曹卫东等.芜湖市物流业发展的现状分析及规模预测.安徽师范大学学报(自然科学版),2003(2)
9.张云康,张晓宇.组合预测模型在宁波港集装箱吞吐量预测中的应用.中国水运,2008(1)
10.濮帅.江苏物流需求预测分析.物流科技,2009(9)
11.李慧.线性回归预测与控制在物流作业成本法中的应用.重庆交通学院学报,2004(6)
12.陈德良等.多元线性回归模型在物流需求预测中的应用.中国物流与采购,2009(20)
13.杨帅.武汉市物流需求预测.当代经济,2007(10)