前言:中文期刊网精心挑选了神经网络回归问题范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络回归问题范文1
本文主要介绍的模型和算法都是数据挖掘中最常见的和应用最广泛的,在计算机科学、统计数学、和人工智能领域的科学家们已经在研究和改进这些算法方面作了大量的工作。
【关键词】
数据挖掘;算法;神经网络
1 神经网络的应用
神经网络近来越来越受到人们的关注,因为它为解决大复杂度问题提供了一种相对来说比较有效的简单方法。神经网络可以很容易的解决具有上百个参数的问题。神经网络常用于两类问题;分类和回归。
在结构上,可以把一个神经网络划分为输入层、输出层和隐含层(见图1)。输入层的每个节点对应一个个的预测变量。输出层的节点对应目标变量,可有多个。在输入层和输出层之间是隐含层,隐含层的层数和每层节点的个数决定了神经网络的复杂度。
图1 一个神经元网络
除了输入层的节点,神经网络的每个节点都与很多它前面的节点(称为此节点的输入节点)连接在一起,每个连接对应一个权重Wxy,此节点的值就是通过它所有输入节点的值与对应连接权重乘积的和作为一个函数的输入而得到,我们把这个函数称为活动函数或挤压函数。如图2中节点4输出到节点6的值可通过如下计算得到:
W14*节点1的值+W24*节点2的值
神经网络的每个节点都可表示成预测变量(节点1,2)的值或值的组合(节点3-6)。注意节点6的值已经不再是节点1,2的线性组合,因为数据在隐含层中传递时使用了活动函数。实际上如果没有活动函数的话,神经元网络就等价于一个线性回归函数,如果此活动函数是某种特定的非线性函数,那神经网络又等价于逻辑回归。
调整节点间连接的权重就是在建立(也称训练)神经网络时要做的工作。最早的也是最基本的权重调整方法是错误回馈法,现在较新的有变化坡度法、类牛顿法、Levenberg-Marquardt法、和遗传算法等。
图2 带权重Wxy的神经元网络
决定神经网络拓扑结构(或体系结构)的是隐含层及其所含节点的个数,以及节点之间的连接方式。要从头开始设计一个神经网络,必须要决定隐含层和节点的数目,活动函数的形式,以及对权重做那些限制等。
2 传播式神经网络
在诸多类型的神经网络中,最常用的是前向传播式神经网络,也就是我们前面图示中所描绘的那种。我们下面详细讨论一下,为讨论方便假定只含有一层隐含节点。
可以认为错误回馈式训练法是变化坡度法的简化,其过程如下:
前向传播:数据从输入到输出的过程是一个从前向后的传播过程,后一节点的值通过它前面相连的节点传过来,然后把值按照各个连接权重的大小加权输入活动函数再得到新的值,进一步传播到下一个节点。
回馈:当节点的输出值与我们预期的值不同,也就是发生错误时,神经网络就要“学习”(从错误中学习)。我们可以把节点间连接的权重看成后一节点对前一节点的“信任”程度。学习的方法是采用惩罚的方法,过程如下:如果一节点输出发生错误,那么他看他的错
误是受哪个(些)输入节点的影响而造成的,是不是他最信任的节点(权重最高的节点)陷害了他(使他出错),如果是则要降低对他的信任值(降低权重),惩罚他们,同时升高那些做出正确建议节点的信任值。对那些收到惩罚的节点来说,他也需要用同样的方法来进一步惩罚它前面的节点。就这样把惩罚一步步向前传播直到输入节点为止。
对训练集中的每一条记录都要重复这个步骤,用前向传播得到输出值,如果发生错误,则用回馈法进行学习。当把训练集中的每一条记录都运行过一遍之后,我们称完成一个训练周期。要完成神经网络的训练可能需要很多个训练周期,经常是几百个。训练完成之后得到的神经网络就是在通过训练集发现的模型,描述了训练集中响应变量受预测变量影响的变化规律。
由于神经网络隐含层中的可变参数太多,如果训练时间足够长的话,神经网络很可能把训练集的所有细节信息都“记”下来,而不是建立一个忽略细节只具有规律性的模型,我们称这种情况为训练过度。显然这种“模型”对训练集会有很高的准确率,而一旦离开训练集应用到其他数据,很可能准确度急剧下降。为了防止这种训练过度的情况,我们必须知道在什么时候要停止训练。
图3中的曲线可以帮我们理解为什么利用测试集能防止训练过度的出现。在图中可以看到训练集和测试集的错误率在一开始都随着训练周期的增加不断降低,而测试集的错误率在达到一个谷底后反而上升,我们认为这个开始上升的时刻就是应该停止训练的时刻。
图3 神经网络在训练周期
增加时准确度的变化情况
3 神经网络的优点
神经元网络和统计方法在本质上有很多区别。神经网络的参数可以比统计方法多很多。如图1中就有13个参数(9个权重和4个限制条件)。由于参数如此之多,参数通过各种各样的组合方式来影响输出结果,以至于很难对一个神经网络表示的模型做出直观的解释。实际上神经网络也正是当做“黑盒”来用的,不用去管“黑盒”里面是什么,只管用就行了。在大部分情况下,这种限制条件是可以接受的。比如银行可能需要一个笔记识别软件,但他没必要知道为什么这些线条组合在一起就是一个人的签名,而另外一个相似的则不是。在很多复杂度很高的问题如化学试验、机器人、金融市场的模拟、和语言图像的识别等领域神经网络都取得了很好的效果。
4 在使用神经网络时有几点需要注意
第一,神经网络很难解释,目前还没有能对神经网络做出显而易见的解释的方法学。
第二,神经网络会学习过度,在训练神经网络时一定要恰当的使用一些能严格衡量神经网络的方法,如前面提到的测试集方法和交叉验证法等。这主要是由于神经网络太灵活、可变参数太多,如果给足够的时间,他几乎可以记住任何事情。
第三,除非问题非常简单,训练一个神经网络可能需要相当可观的时间才能完成。当然,一旦神经网络建立好了,在用它做预测时运行还是很快的。
第四,建立神经网络需要做的数据准备工作量很大。一个很有误导性的就是不管用什么数据神经网络都能很好的工作并做出准确的预测。这是不确切的,要想得到准确度高的模型必须认真的进行数据清洗、整理、转换、选择等工作,对任何数据挖掘技术都是这样,神经网络尤其注重这一点。
【参考文献】
熊熊,汪德馨,宋轶民.利用模糊神经网络进行模糊数据挖掘的一种算法[J].系统工程学报,2000,3(1):32-37.
神经网络回归问题范文2
论文关键词:人工神经网络(ANN),船舶与海洋工程,海洋预报与预测,海洋资源评估,海洋环境监测
人工神经网络是对人类大脑特性的一种描述。它是一个数学模型,可以用电子线路实现,也可以用计算机程序来模拟。是人工智能研究的一种方法。主要功能有:联想记忆、分类识别、优化计算、非线性映射。由于其具有好的容错性、并行处理信息、自学习性及非线性映射逼近能力等特点,因此被广泛的应用于各个领域。
ANN在海洋领域的应用起步较晚。20世纪90年代以来,国内外掀起了应用ANN研究海洋问题的热潮。相比传统方法,由于ANN提高了预测的准确性,减少了对数据的要求并且便于应用,到目前为止,ANN模型的应用已经遍布海洋工程(包括港口、沿海、近海和深海工程)海洋环境监测,海洋预报与预测,海洋资源与环境等各方面,并且应用前景不断扩大。本文通过梳理相关文献,分析和总结了ANN在海洋领域的研究进展和主要成果,以期为相关研究提供参考。
1 船舶与海洋工程
钢材腐蚀问题是海洋工程的重大课题。国内许多学者通过建立ANN模型考察海水环境相关参数与钢材腐蚀速度的相关性。刘学庆等根据四层BP神经网络分析了3C钢腐蚀速度与海水环境参数的相关性,建立了3C钢在海洋环境中腐蚀速度的人工神经网络模型,证明该方法在监测与评价区域海洋环境腐蚀性方面具有实际应用价值[1]。邓春龙等研究建立了海洋环境材料腐蚀与防护数据库,收集和整理了大量的材料腐蚀数据。并在此基础上建立了误差反传(BP)人工神经网络预测模型和灰色GM(1,1)腐蚀预测模型。从而形成一套较完整的数据采集、处理和分析网络系统[2]。王佳等采用电化学、人工神经网络和数据库方法研究了5种海洋工程钢材在深海环境中非现场腐蚀行为评价技术。结果表明,结合采用多种非现场方法可以可靠评价深海环境钢材的腐蚀行为[3]。刘艳侠等同样利用三层BP神经网络,根据已有的3C钢在不同海水环境参数下的腐蚀速度数据,建立了3C钢在海洋环境中腐蚀速度的人工神经网络模型;并分析预测了海水环境参数与腐蚀速度之间的关系 [4]。
ANN在海洋工程中的应用主要是海洋平台的抗击性和稳定性的模拟。许亮斌等针对海洋平台桩基模拟中存在的问题,将神经网络应用于桩基分析 [5]。淙在引进遗传算法的基础上构造了工程结构优化的神经网络模型,计算结果表明这一方法具有很好的稳定性和全局收敛性[6]。周亚军等将经典最优控制算法与人工神经网络相结合,采用BP神经网络模型,实现了受随机波浪力作用下的海洋平台的振动主动控制[7]。由于神经网络的优越性能,克服了传统算法本身的时滞问题,为海洋平台的振动控制提供了一条新的思路。
以上学者都对神经网络进行了一定程度的改进和完善,达到了良好的模拟和预测效果,推进了海洋工程中ANN理论的发展。除此以外,针对波浪数据的完备性对于海岸海洋工程设计的关键作用, 人工神经网络作为一个具有高度非线性映射能力的计算模型,在工程中具有广泛的应用前景。在数值预测方面,它不需要预选确定样本的数学模型海洋环境监测,仅通过学习样本数据即可以进行预测论文格式范文。
2 海洋预报与预测
赤潮作为海洋灾害的一种,对海洋经济造成巨大影响。蔡如钰利用人工神经网络BP算法,建立了赤潮预报模型 。杨建强通过比较发现人工神经网络方法在模拟和预测方面优于传统的统计回归模型,具有较强的模拟预测能力及实用性 。在此基础上,为克服BP网络训练易陷入局部最优的缺点,王晶采用遗传算法改进网络训练方法,建立赤潮生物密度与环境因子的人工神经网络的预报模型,保证网络达到全局最优。此外,还有部分学者将改进的人工神经网络模型用于赤潮预报,经过实证研究,取得良好的预测效果。
潮汐预报对人类活动和降低海洋环境建筑成本是非常重要的。为了解决潮位预测中存在的时滞问题,提高预测精度,不少学者进行了初步探索,并且普遍认为BP模型应用于潮汐预报具有较高的预测精度和良好的泛化能力,它为海洋潮汐预报工作提供了一种全新的思路和方法。张韧利用人工神经网络BP模型及其优化算法,建立起了赤道太平洋纬向风和滞后的东太平洋海温之间的映射关系和预报模型,结果表明,这种方法可有效用于辩识和反演复杂的大气、海洋动力系统及其预报模型.冯利华针对海洋预报问题,初步建立了基于神经网络的预报分析系统,给出了应用实例。以我国东南沿海地区一次登陆台风所造成的最大24小时暴雨量为例来说明ANN在海洋预报中的应用问题。罗忠辉采用人工神经网络智能方法,建立了多参数声速预报神经网络模型海洋环境监测,克服了回归拟合方法在获得海底沉积物声速预报中存在的不足,为海底沉积物的声速预报提供了一条新途径。
3 海洋资源评估
张富元等利用东太平洋CC区多波束海底地形测量、结核覆盖率深拖系统探测、结核丰度地质采样和地球物理地震勘探资料,运用板块构造和沉积动力学理论,并与丰度趋势面和神经网络分析结果对比,对东太平洋CC区构造与多金属结核资源效应关系进行了探讨。李少波等讨论了如何利用神经网络预测天然气水合物的合成和分解。利用了声速、幅度、频率来反映天然气水合物的合成,建立了一个3层前向型网络,通过实验,人工神经网络的引用取得了良好的效果。近年来人工神经网络还越来越多地被用来预测水资源。在水资源应用中,前馈神经网络建模技术是使用最广泛的类型。
4 海洋环境监测
非法排放油污和海上漏油事件对海洋生态系统造成的严重危害,人工神经网络可以有效的用于海水石油污染诊断。李伟认为海中悬移质是决定海洋光学性质、海洋水质,河口海岸带演变动力过程的重要环境参数。利用模拟遥感反射比数据集建立人工神经网络反演悬移质浓度,并利用东中国海现场同步数据对该算法进行验证,神经网络技术对于反演大洋水和沿岸海域中的组分浓度有一个很好的前景。刘辉等采用BP神经网络和广义回归神经网络2种方法进行训练,建立了南海南部海区的上混合层深度人工神经网络计算模型 。结果显示,人工神经网络方法精度较高,是一种切实可行的上混合层深度估算方法。
5 结语
人工神经网络在海洋领域的应用遍布海洋工程、海洋科学技术、海洋环境资源等各个方面。国内外学者根据研究的需要设立了不同的ANN模型,随着时间的发展,这些模型的预测和分析能力逐步完善。大量实证结果表明,很多ANN模型都取得了良好的模拟和预测效果。大部分的人工神经网络模型对传统的统计回归计算、时间序列分析、模型匹配和数值方法等产生了替代或补充作用。在某些情况下,神经网络的应用减少了对数据的要求。在未来,随着现有模型的不断完善和ANN模型缺陷的不断纠正,先进和混合神经网络结构很可能会在海洋领域更多方面得到广泛应用。
参考文献
[1]刘学庆,唐晓,王佳.3C钢腐蚀速度与海水环境参数关系的人工神经网络分析[J].中国腐蚀与防护学报, 2005,(1):11-14.
[2]邓春龙,孙明先,李文军等.海洋环境中材料腐蚀数据采集处理网络系统的研究[J].装备环境工程,2006,(3):58-62.
[3]王佳,孟洁,唐晓等.深海环境钢材腐蚀行为评价技术[J].中国腐蚀与防护学报. 2007,(1):1-7.
[4]刘艳侠,高新琛,张国英等.BP神经网络对3C钢腐蚀性能的预测分析[J].材料科学与工程学报,2008,(1):94-97.
[5]许亮斌,陈国明.神经网络在平台桩基分析中的应用[J].中国海上油气(工程),2001,(1):7-10.
[6]淙.海洋工程结构优化的遗传Hopfield神经网络算法研究[J].中国海洋平台,2001,(5-6):58-61.
[7]周亚军,赵德有,马骏.基于人工神经网络的海洋平台振动主动控制[J].船舶力学, 2003,(5):65-69.
神经网络回归问题范文3
关键词:Elman神经网络;股价预测;时间序列
引言
在股市中,影响股票交易和股价波动的因素有很多。对于单支股票来说,股价不但受到该企业经营业绩的影响还受到其他外界因素诸如财政政策、利率变动、经济周期和人为操作的影响,对整个股市来说,其开盘价的波动情况就更为复杂了。因此,股票市场可以被看做是一个复杂的非线性系统。由于受到多方面的限制限制,传统的统计建模方法并不适合这样的复杂非线性系统,难以揭示其内在的规律。人工神经网络的发展,为股票市场建模与预测提供了新的方法。人工神经网络具有自组织、自适应和自学能力以及具有非线性、非局域性、非定性和非凸性等特点[1]。这些特点使其具有分类和预测的功能,常常被用来对股票系统进行预测和分析。目前在股市的预测应用中大多数采用的是静态前馈神经网络和RBF神经网络[2,3],但股票市场是动态变化的,需要采用一种动态神经网络才可以更为有效的反映系统的动态特性。Elman回归网络是一种典型的动态神经元网络,具有适应系统时变特性的能力,特别适合处理时间序列问题。
本文用Matlab工具箱建模,建立一个六个输入,一个输出的Elman神经网络预测模型,利用上证股市280个交易日的开盘价作为原始数据,对Elman神经网络进行训练、仿真,并预测后51天的开盘价。通过计算其与实际开盘价的相对误差,表明了本文构建的预测模型具有较好预测效果。
Elman神经网络是Elman于1990年首先针对语音处理问题而提出来的,它是一种典型局部递归网络。由于Elman神经网络在处理贯序数据输入输出具有优越性,得到了广泛的应用[4]。Elman网络,如图1所示是一个两层的网络,其隐含层神经元到输入层神经元之间还存在一个反馈连接通道,这种反馈连接通道在神经网络术语中称为回归连接。由于存在回归连接,因此Elman网络可以记忆过去的状态,特别适合处理时间序列问题。
式中:k表示时刻,是输出层的输出向量;是n维中间层结点单元向量;是输入层输入向量,反馈状态向量;是中间层到输出层的连接权值;输入层到中间层的连接权值;是输出神经元的传递函数,采用purelin函数。是中间层神经元的传递函数,采用tansig函数[5]。Elman神经网络的学习算法采用的是优化的梯度下降算法,通常使用误差平方和函数作为学习指标函数。
2.数据的选取与预处理
本文的股价预测中,不考虑股市的其他经济指标,而只是是采用过去的股价预测下期的股价,因此相当于一个时间序列问题,可以使用Elman神经网络进行求解。本文选取2012年6月30日至2013年12月1日的上证开盘价进行预测分析,总共选取337条开盘价格。根据前N期的开盘价格预测下一期开盘价,其映射函数可以表示为:
对于给定的开盘价数据,先将其划分为训练样本和测试样本,使得测试样本晚于训练样本,与股价的产生顺序相吻合。以训练样本为例,抽取组成第一个样本,其中为自变量,为目标函数值,抽取组成第二个样本,其中为自变量,为函数值,依此类推形成网络的训练矩阵。为了保证网络的性能和稳定性,还需要对数据进行归一化处理,经过如此的处理便将原始数据构成了可供Elman网络处理的样本集。
3.模型预测实验结果和数据分析
本文中利用Elman网络进行股市开盘价预测的步骤如图2所示:首先要进行原始数据的处理,处理方法上文已经做了详细介绍本部分不再赘述。然后要进行Elman网络的创建,确定输入层,隐含层和输出层的神经元的个数,利用训练样本对Elman网络进行训练,最后对经过训练的网络进行测试,完成预测过程。
利用MATLAB神经网络工具箱中的函数,本文对2012年6月30日至2013年12月1日的上证指数开盘价进行了预测分析,创建的Elman网络包含20个隐含神经元,最大迭代次数为2000次,误差容限为0.0001,最多验证失败次数是5。
在神经网络的训练过程中,经过500次的训练,网络基本趋于稳定,基本收敛,误差收敛过程如图3所示。网络训练完成以后,就可以利用该训练好的网络进行股价的预测,预测的结果如图4所示,从图中的结果可以看到Elman网络很好的预测了股价在未来短期的变化趋势及变化空间。表1是测试样本输入到网络后,计算得到的网络输出值与真实股价之间的相对误差,从相对误差来看得到比较理想的预测结果。
4.结束语
分析上述实验结果可以看出,股市开盘价格也是遵循一定的规律的,在一定范围内是可以可预测的,至少短期内的变化是可以较为准确的预测的。对于股价预测来说,长期的准确性是很难实现的,意义不大,股价在未来短期内的变化趋势才会对投资具有参考意义。本文采用的Elman神经网络实现了较好的短期预测效果,虽然预测股价的准确值方面还有所欠缺,但很好的预测了股价在短期内的变化趋势,因此也具有一定的参考价值。
10.15%130.52%25-0.50%370.49%490.91%
2-1.55%142.00%26-1.55%380.57%500.07%
3-2.94%150.84%270.43%390.70%510.14%
4-1.51%16-0.39%281.51%40-0.27%
50.37%17-1.26%290.83%411.24%
6-0.43%18-1.15%301.26%42-0.78%
70.53%190.55%31-0.08%43-2.25%
80.52%20-1.40%32-1.68%44-2.54%
92.08%21-0.14%330.54%45-0.22%
10-0.60%220.33%34-0.93%460.29%
11-1.02%231.27%350.74%47-0.23%
120.23%240.71%36-0.58%480.29%
(作者单位:河北工业大学)
参考文献:
[1]陈瑛,罗鹏飞.基于神经网络的混沌时间序列建模及预测计算机工程与应用,2005,41(11):77-79.
[2]禹建丽,孙增圻.基于神经网络的股市建模与决策系统工程理论与实践,2003,23(5):15-19.
[3]姜静清,梁艳春,孙延风,等.引入收益因素的RBF神经网络及其应用吉林大学学报(信息科学版).2002.8.68-72.
神经网络回归问题范文4
关键词:粮食产量预测;小波分析;GM(1,1)模型;广义回归神经网络
中图分类号:TP393文献标识码:A文章编号:0439-8114(2011)10-2135-03
Prediction Model of Food Yield Using Wavelet Generalized Regression Neural Network
YU Ping-fu,LU Yu-ming,WEI Li-ping,LIANG Yi-jie,SU Xiao-bo,KONG Ling-zi,LAN Zong-bao
(Agriculture and Technology Information Research Institute, Guangxi Academy of Agricultural Sciences, Nanning 530007,Guangxi,China)
Abstracts: Wavelet generalized regression neural network (WGRNN) model was constructed using wavelet analysis and generalized regression neural network (GRNN). This prediction model had better precision on predicting total food yield during 2007~2008 if compared to GRNN and grey model GM(1,1), and it did not only have the advantages of nonlinear mapping approximation ability and convenience of calculation of neural network, but also the function of showing partial characteristics on time and frequency of wavelet analysis. It would provide a new method on quantification and intelligentialization of predicting food yield.
Key words: prediction of food yield; wavelet analysis; grey model GM(1,1); generalized regression neural network
我国是一个农业大国,粮食安全是整个国家安全系统的重要组成部分,是直接关系到我国国民经济健康发展和社会稳定的重大问题。因此,准确预测粮食产量,科学地进行农业决策,对保证我国粮食安全具有重要意义。目前,粮食产量预测模型较多,常用于粮食产量预测的模型主要有时间序列模型(指数平滑模型、灰色预测模型及基于马尔可夫链的预测模型)、回归模型(线性回归模型和双对数模型)和人工神经网络模型[1,2]。近年来,随着智能技术的发展,小波分析、粗糙集理论、人工神经网络等新技术与有关模型相结合的组合预测成为当前研究的热点。本文拟采用小波分析与广义回归神经网络相结合的方法,建立一种小波广义回归神经网络模型(WGRNN)来预测我国粮食产量。
1模型的构建
1.1小波多分辨率分析
小波分析是从傅立叶变换发展起来的,属于时频分析方法的一种,核心是多分辨率分析。它在时域和频域同时具有良好的局部化性质,可将分析的重点聚焦到任意的细节,揭示非线性系统不同层次上详细结构[3]。
小波基的最优选择是小波分辨率分析的重要步骤。常用的小波基主要有:Haar、Daubechies(dbN)、Complex gaussian、BiorNr.Nd、CoifN等。本文选用Daubechies(db15)小波。
1.2广义回归神经网络
广义回归神经网络(GRNN)是一种高度并行的径向基网络,它不仅具有全局逼近性质,而且具有最佳逼近性质。GRNN是由输入层、隐层和输出层构成。隐层为径向基神经元层,输出层为线性层。隐层神经元采用径向基函数作为激励函数,通常采用高斯函数作为径向基函数。与BP神经网络相比,GRNN的特点是人为调节的参数少,只有一个散布常数或扩展常数,网络的学习全部依赖于数据样本。这个特点决定了网络得以最大限度地避免人为主观假定对预测结果的影响[4,5]。
1.3小波广义回归神经网络模型
本文采用广义回归神经网络(GRNN)与小波分析相结合,建立小波广义回归神经网络模型(WGRNN)。
1.3.1小波分解与重构对原始时间序列f(t)进行小波变换,分解为低频成分an(t)和高频成分d1(t)、d2(t)…dn(t),再重构到原尺度上,得到频率成分比原始时间序列单一的若干子序列can(t)和cd1(t)、cd2(t)…cdn(t)。
1.3.2GRNN输入序列重构采用Complex gaussian小波系数实部等值线图和小波方差确定输入样本维数m,将小波重构子序列再重构成数据序列gan(tj)和gd1(tj)、gd2(tj)…gdn(tj),并建立对应数据序列gan(tj+1)和gd1(tj+1)、gd2(tj+1)…gdn(tj+1)。其中gan(tj)={can(tj),can(tj+1),…,can(tj+m-1)},gan(tj+1)={can(tj+m)};gdi(tj)={cdi(tj),cdi(tj+1),…,cdi(tj+m-1)},gdi(tj+1)={gdi(tj+m)},i=1,2,…,n。
1.3.3WGRNN的模型建立以gan(tj)和gd1(tj)、gd2(tj)…gdn(tj)与gan(tj+1)和gd1(tj+1)、gd2(tj+1)…gdn(tj+1)作为广义回归神经网络模型的输入与输出进行预测,将各子序列的预测值进行合成得到序列总的预测结果f(t+1)。其模型结构如下。
2模型的应用
以1962~2009年度我国粮食总产量(单位:万t)为分析样本,分别进行粮食总产量小波广义回归神经网络模型与单一广义回归神经网络模型和GM(1,1)模型检验与预测。分析数据来源于《中国统计年鉴》。
2.1模型预测结果
运用Daubechies小波系中db15小波对我国粮食总产量进行小波变换,分解为4层并进行重构,可得到小波分解重构序列{ca4(t)和cd1(t)、cd2(t)、cd3(t)、cd4(t)},结果见图2。其中ca4(t)代表小波分解后再重构的低频部分,通常可以体现原始时间数列的趋势,cd1(t)、cd2(t)、cd3(t)和cd4(t)代表小波分解后再重构的高频部分。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
对小波重构序列进行数据重构分析,确定分析样本数为40,输入输出维数分别为5和1;对重构数据序列样本的输入和输出样本做初始化处理,将数据归一化到区间[-1,+1]中,并进行反归一化处理;确定模型的扩展系数为0.1。以1962~2006年的数据作为训练样本,2007~2009年数据作为预测检验样本,建立各频率成分的小波广义回归神经网络模型。
测试结果表明,采用小波广义回归神经网络模型对1967~2006年我国粮食产量进行检测的相对误差为-0.711%~2.481%,平均相对误差为0.241%;2007~2009年预测相对误差为-0.276%~1.969%,平均相对误差为0.753%,其检测预测相对误差和平均相对误差都在2.500%和1.000%以内,检测与预测结果都较为准确(表1)。
2.2预测结果评价分析
为了反映小波广义回归神经网络预测模型的有效性,按照预测效果评价原则,选用平均绝对误差(MAE)、平均相对误差(MPE)和Theil不等系数(U)3种指标进行评价,表2为3类模型的评价指标结果。
从表2可以看出,小波广义回归神经网络模型的检测平均绝对误差、平均相对误差和Theil不等系数均要低于相应的单一GRNN模型和GM(1,1)模型;而WGRNN模型的各种预测误差指标值则明显低于其他两种模型的预测误差。说明WGRNN模型的检测预测精度高,预测有效合理。从图3可以更直观地看出,小波广义回归神经网络比单一GRNN及GM(1,1)模型具有更高的预测精度,该方法应用于粮食总产预测合理可行。
3 结束语
本文提出了一种基于小波变换与广义回归神经网络相结合的粮食产量预测模型,该模型充分利用了小波变换良好的时、频多分辨率功能和人工神经网络的自学习功能,具有有效识别主要频率成分和提取局部信息的能力以及较强的逼近和容错能力。将二者进行结合可以充分利用两者的优点,提高模型预测的精度。
研究实例表明,与单一GRNN模型和GM(1,1)模型相比较,小波神经网络模型进一步提高了粮食产量的预测精度。同时也证明了小波神经网络预测模型在对粮食产量预测的可行性和优越性及较强的适应性,为粮食产量预测的定量化和智能化提供了一条有效途径。
参考文献:
[1] 宰松梅,贾艳辉,丁铁山,等.基于最小二乘支持向量机的灌区粮食产量预测研究[J].安徽农业科学,2010,38(1):98-100.
[2] 李炳军,李秋芳,卢秀霞.色线性回归组合模型在河南省粮食产量预测中的应用[J].河南农业科学,2009,10:44-47.
[3] 刘丙军,邵东国,沈新平.基于小波变换的BP神经网络参考作物腾发量预测模型[J].武汉大学学报(工学版),2007,40(1):69-73.
[4] 李 伟,陈国明,郑贤斌.基于广义回归神经网络的交流电磁场检测裂纹量化研究[J].中国石油大学学报(自然科学),2007,31(2):105-109.
[5] 于平福,陆宇明,韦莉萍,等.灰色广义回归神经网络在木薯产量预测中的应用[J].西南农业学报,2009,22(6):1709-1713.
神经网络回归问题范文5
【关键词】锅炉;运行;检测
1.锅炉运行故障的可预测性
锅炉是由汽水、燃烧及烟风等子系统组成的复杂多层次系统,而每个子系统又可以划分为若干次级子系统和部件,各层次子系统是相互关联的,只要某一个子系统出现异常或失效,就可能会使其它子系统产生功能异常或失效,甚至使整个机组处于故障状态,并且从原发性故障到系统级故障的发生、发展是一个量变到质变的过程。故锅炉运行故障具有层次性、相关性、延时性的特点。
锅炉运行故障一般具有一定的时延性,即从原发性故障到系统故障的发生、发展与形成,是一个渐变过程。以其高温过热器壁温为例,其某一时刻的壁温值,与其在过去时刻的壁温值有一定的关系,使其壁温序列间有一定的关联性(确定性),这种关联性是锅炉故障预测的基础。另外,由于影响高温过热器壁温的因素很多,如负荷、烟气温度、主蒸汽温度等,它们之间相互关联,且在锅炉运行中还受一些不确定因素的影响,使其运行故障预测具有一定的随机性,这种随机性使壁温序列间的关联性减弱,这就决定了高温过热器壁温值小能准确地预测,而只能从统计意义上做出最佳预测,使预测误差满足一定的精度要求。故障预测是故障诊断的一部分,故障诊断的最终目的就是为了指导运行和维修,因此,进行锅炉运行故障预测,对提高锅炉现代化运行水平和机组可用率具有重要意义。
2.锅炉运行故障预测相关知识
人工智能故障诊断与预测技术是随着现代化技术、经济高速发展而出现的一门新型技术,它能鉴别设备的状态是否正常,发现和确定故障的部位和性质并提出相应的对策,以提高设备运行的可靠性,延长其使用寿命,降低设备全寿命周期费用。且采用故障预测技术可以实现对故障的早期发现并预测其未来的发展趋势,便于对火电机组及时调整以避免恶性事故的发生,使机组能安全可靠的运行,同时提高机组的经济性。
根据预测期限长短的不同可将故障预测分为:长期预测,为了制定锅炉机组的长远维修计划和维修决策而进行的预测。时间一般为一个月以上。预测精度要求低;中期预测,对锅炉机组在未来比较长的时间内的状态进行预测,为机组的中期维修计划和维修决策服务。时间一般为一周左右。预测精度要求较低;短期预测,对锅炉机组的近期发展情况进行预测。时间为一大左右。对预测精度要求高。对于中、长期预测,由于精度要求不高,可考虑采取简单的预测模型,建立单变量时间序列模型进行预测。而对于短期预测,由于对精度要求较高,同时也由于各相关因素对当时的状态值影响较大,因此在进行短期预测时,除了要考虑时间序列本身外,还应适当将其他相关因素考虑进去,这就需要建立多变量时间序列模型进行预测,以满足短期预测对精度的要求。
3.常用的锅炉运行故障预测方法
近年来不少研究者采用线性回归分析法、时间序列分析法、灰色模型预测法、专家系统、人工神经网络等方法进行锅炉设备故障诊断研究,以探索快速有效的故障诊断与预测方法。常用的预测方法有:
3.1线性回归分析法
回归分析是寻找几个不完全确定的变量间的数学关系式之间进行统计推断的一种方法。在这种关系式中最简单的是线性回归分析。
3.2时间序列分析法
时间序列是指按时间顺序排列的一组数据:时间序列分析法是指采用参数模。型对所观测到的有序的随机数据进行分析与处理的一种数据处理方法。时间序列。分析法主要参数模型有以下四种:①曲线拟合②指数平滑③季节模型④线性随机模型。时间序列分析法主要适用于进行单因素预测,而对锅炉故障预测这种既有确定性趋势,又有一定的随机性的多因素预测时,需要进行确定性趋势的分离,计算比较复杂,同时还需对分离残差的零均值及平稳性进行假定,且其预测的精度不高。
3.3灰色模型预测法
灰色模型预测法是按灰色系统理论建立预测模型,它是根据系统的普遍发展。规律,建立一般性的灰色微分方程,然后通过对数据序列的拟合,求得微分方程的系数,从而获得灰色预测模型方程。
应用灰色系统理论作故障预测主要有两种方法,一是基于灰色系统动态方程GM(或DM)的灰色预测模型,二是基于残差信息数据列的残差辨识预测模型。其中,GM(1,1)预测模型即1阶1个变量的微分方程描述的灰色模型比较常用。灰色预测的解从数学的角度看,相当于幂级数的叠加,它包含了一般线性回归和幂级数回归的内容,故灰色预测模型优于一般的线性回归或指数曲线拟合,也好于确定性时间序列分析法。灰色预测模型不要很多的原始数据,短数据GM(1,1)模型有较高的预测精度,并具有计算简单速度快的优点。
3.4专家系统预测法
专家系统能成功地解决某些专门领域的问题,也有很多优点,但经过多年的实践表明,它离专家的水平总是相差一段距离,有时在某些问题上还不如一个初学者。分析其原因,主要有以下几方面: 知识获取的“瓶颈”问题;模拟专家思维过程的单一推理机制的局限性;系统缺乏自学习能力。
3.5人工神经网络预测法
神经网络的故障诊断存在很多问题,它不能很好的利用领域专家积累的经验知识,只利用一些明确的故障诊断实例,而且需要一定数量的样本学习,通过训练最后得到的是一些阑值矩阵和权值矩阵,而不是像专家经验知识那样的逻辑推理产生式,所以缺乏对诊断结果的解释能力。目前应用神经网络进行故障预测的网络训练收敛速度慢,因此无法应用于实时诊断,只能处理历史记录数据。
神经网络回归问题范文6
关键词经济活动预测模型人工神经网络
经济活动诸如商品价格走势、生产活动的产量预测、加工的投入产出分析、工厂的成本控制等方面都是重要的技术经济层面。定量化的经济活动分析是经济学研究的必由之路,而建模是量化分析的基础,这是因为模型为科学分析和质量、成本等控制提供了理论依据。本文针对经济活动中大多数研究对象都具有的非线性特点,给出了用人工神经网络(ArtificialNerveNetwork)模型建立经济活动的预测模型的原理和方法,并描述了神经网络与各种先进的建模方法相结合的模型化方法,为经济活动的分析、预测与控制提供了理论基础。
1神经网络模型方法
现实的经济系统是一个极其复杂的非线性系统,客观上要求建立非线性模型。传统上使用回归与自回归模型刻画的都是线性关系,难于精确反映因变量的变化规律,也终将影响模型的拟合及预报效果。为揭示隐含于历史记录中的复杂非线性关系必须借助更先进的方法———人工神经网络(ANN)方法。
人工神经网络具有并行处理、自适应、自组织、联想记忆及源于神经元激活函数的压扁特性的容错和鲁棒性等特点。数学上已经证明,神经网络可以逼近所有函数,这意味着神经网络能逼近那些刻画了样本数据规律的函数,且所考虑的系统表现的函数形式越复杂,神经网络这种特性的作用就越明显。
在各类神经网络模型中,BP(Back-Propagation误差后向传播)神经网络模型是最常用的也是最成熟的模型之一。本质上,BP模型是对样本集进行建模,即建立对应关系RmRn,xk∈Rm,ykRn。数学上,就是一个通过函数逼近拟合曲线/曲面的方法,并将之转化为一个非线性优化问题来求解。
对BP神经网络模型,一般选用三层非循环网络。假设每层有N个处理单元,通常选取连续可微的非线性作用函数如Sigmoid函数f(x)=1/(1+e-x),训练集包括M个样本模式{(xk,yk)}。对第P个训练样本(P=1,2,…,M),单元j的输入总和记为apj,输出记为Opj,则:
apj=WQ
Opj=f(apj)=1/(1+e-apj)(1)
对每个输入模式P,网络输出与期望输出(dpj)间误差为:
E=Ep=((dpj-Opj)2)(2)
取BP网络的权值修正式:
Wji(t+1)=Wji(t)+?浊?啄pj+?琢(Wji(t)-Wji(t-1))(3)
其中,对应输出单元?啄pj=f’,(apj)(dpj-Opj);对应输入单元?啄pj=f’,(apj)?啄pkWkj;
?浊是为加快网络收敛速度而取值足够大又不致产生振荡的常数;?琢为一常数项,称为趋势因子,它决定上一次学习权值对本次权值的影响。
BP学习算法的步骤:初始化网络及学习参数;提供训练模式并训练网络直到满足学习要求;前向传播过程,对给定训练模式输入,计算网络的输出模式,并与期望比较,如有误差,则执行下一步,否则返回第二步;后向传播过程,计算同一层单元的误差?啄pj,按权值公式(3)修正权值;返回权值计算公式(3)。BP网络的学习一般均需多周期迭代,直至网络输出与期望输出间总体的均方根误差ERMS达到一定要求方结束。
实践中,BP网络可能遇到如下问题:局部极小点问题;迭代收敛性及收敛速度引起低效率问题。此外还有,模型的逼近性质差;模型的学习误差大,记忆能力不强;与线性时序模型一样,模型网络结构及节点作用函数不易确定;难以解决应用问题的实例规模与网络规模之间的矛盾等。为克服这样的一些问题,同时为了更好地面向实际问题的特殊性,出现了各种基于神经网络模型或与之结合的模型创新方法。
2灰色神经网络模型
灰色预测和神经网络一样是近年来用于非线性时间序列预测的引人注目的方法,两种方法在建模时都不需计算统计特征,且理论上可以适用于任何非线性时间序列的建模。灰色预测由于其模型特点,更合用于经济活动中具有指数增长趋势的问题,而对于其他变化趋势,则可能拟合灰度较大,导致精度难于提高。
对于既有随时间推移的增长趋势,又有同一季节的相似波动性趋势,且增长趋势和波动性趋势都呈现为一种复杂的非线性函数特性的一类现实问题,根据人工神经网络具有较好的描述复杂非线性函数能力特点,用其对季节性建模;最后根据最优组合预测理论,建立了兼有GM(1,1)和ANN优点的最优组合预测模型。该模型能够同时反映季节性时间序列的增长趋势性和同季波动性的双重特性,适用于一般具有季节性特点的经济预测。
首先,建立GM(1,1)模型,设时间序列x(0)=(x(0)(1),x(0)(2),?撰,x(0)(n)),作一阶累加生成:
x(1)=(x(1)(1),x(1)(2),?撰,x(1)(n))(4)
其中x(1)(k)=(x(0)(i),k=1,2,?撰,n
构造一阶线性灰色微分方程并得到该方程的白化微分方程:
+ax=u
用最小二乘法求解参数a,u,得到x(1)的灰色预测模型:
(1)(k+1)=(X(0)(1)-u/a)e-ak+u/a,(k=0,1,2,?撰)(5)
其次,根据上节方法建立BP人工神经网络模型。
第三,将两模型优化组合。设f1是灰色预测值,f2是神经网络预测值,fc是最优组合预测值,预测误差分别为:e1,e2,ec,取w1和w2是相应的权系数,且w1+w2=1,有fc=w1f1+w2f2,则误差及方差分别为ec=w1e1+w2e2,Var(ec)=w21Var(e1)+w22Var(e2)+2w1w2cov(e1,e2)
对方差公式求关于w1的极小值,并取cov(e1,e2)=0,即可得到组合预测权系数的值。
2基于粗糙集理论的神经网络模型
粗糙集理论与模糊集理论一样是研究系统中知识不完全和不确定问题的方法。模糊集理论在利用隶属函数表达不确定性时,为定义一个合适的隶属函数,需要人工干预,因而有主观性。而粗糙集理论由粗糙度表示知识的不完全程度,是通过表达知识不精确性的概念计算得到的,是客观的,并不需要先验知识。粗糙集通过定义信息熵并进而规定重要性判据以判断某属性的必要性、重要性或冗余性。
一般来说,BP神经网络模型对模型输入变量的选择和网络结构确定等都基本凭经验或通过反复试验确定,这种方法的盲目性会导致模型质量变差。用粗糙集理论指导,先对各种影响预测的因素变量进行识别,以此确定预测模型的输入变量;再通过属性约简和属性值约简获得推理规则集;然后以这些推理规则构造神经网络预测模型,并采用加动量项的BP的学习算法对网络进行优化。有效改善了模型特性,提高了模型质量。其建模步骤为:由历史数据及其相关信息历史数据构造决策表;初始化;对决策表的决策属性变量按划分值域为n个区域的方式离散化;采用基于断点重要性的粗糙集离散化算法选择条件属性变量和断点(分点),同时计算决策表相容度,当决策表相容度为1或不再增加时,则选择条件属性变量和分点过程结束;由选择的条件属性变量及其样本离散化值构造新的决策表,并对其约简,得到推理规则集;由推理规则集建立神经网络模型;对神经网络进行训练;若神经网络拟合误差满足要求,则结束,否则,增加n。必须指出,区间分划n太小,会使得拟合不够,n太大,即输出空间分得太细,会导致过多的区域对应,使网络结构过于复杂,影响泛化(预测)能力。
3小波神经网络模型
人工神经网络模型存在的网络结构及节点函数不易确定问题,结合小波分析优良的数据拟合能力和神经网络的自学习、自适应特性建模,即用非线性小波基取代通常的非线性S型函数。
设非线性时间序列变化函数f(t)∈L2(R),定义其小波变换为:
Wf(a,b)==f(t)?渍()dt(6)
式中,?渍ab(t)称为由母小波?渍t(定义为满足一定条件的平方可积函数?渍(t)∈L2(R)如Haar小波、Morlet小波、样条小波等)生成的依赖于参数a、b的连续小波,也称小波基。参数a的变化不仅改变小波基的频谱结构,还改变其窗口的大小和形状。对于函数f(t),其局部结构的分辩可以通过调节参数a、b,即调节小波基窗口的大小和位置来实现。
用小波级数的有限项来逼近时序函数,即:
(t)=wk?渍()(7)
式中(t),为时间序列y(t)的预测值序列;wk,bk,ak分别为权重系数,小波基的平移因子和伸缩因子;L为小波基的个数。参数wk,bk,ak采用最小均方误差能量函数优化得到,L通过试算得到。
4模糊神经网络模型
模糊集合和模糊逻辑以人脑处理不精确信息的方法为基础,而人工神经网络是以大量简单神经元的排列模拟人脑的生理结构。二者的融合既具有神经网络强大的计算能力、容错性和学习能力,又有对于不确定、不精确信息的处理能力,即同时具有底层的数据处理、学习能力和高层的推理、思考能力。
一种应用模糊理论的方法是把模糊聚类用来确定模糊系统的最优规则数,从而确定模糊神经网络的结构。这样确定的网络结构成为四层:第一层为直接输入层;第二层为模糊化层,对输入做模糊化处理;第三层为模糊推理层,对前层模糊结果做模糊推理;第四层为非模糊化层,可以采用重心非模糊化法,产生网络输出。该网络采用动态处理法,增强了其处理能力,且适用性强、精度高。
5结语
除上述几种结合式神经网络方法之外,人工神经网络模型在算法设计方面一直在取得巨大的进步。神经网络模型方法是一种先进的具有智能的非线性建模方法,其在自然科学、经济现象、社会活动等方面的应用正在不断深化,把神经网络方法引入经济活动的分析和预测中,并紧密联系诸多先进的建模方法,是使工业经济、商业经济及其对经济本质规律的研究等各项工作推向前进的重要理论武器。
参考文献