前言:中文期刊网精心挑选了神经网络的优势范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络的优势范文1
关键词:人工神经网络;东盟自由贸易区;人才需求预测
中图分类号:C962 文献标识码:A 文章编号:1006-723X(2014)04-0083-05
中国-东盟自由贸易区不仅是目前世界上第三大自由贸易区,也是由发展中国家组成的最大的自由贸易区。中国通过中国-东盟自由贸易区加强了与东盟国家在各个领域的合作,中国的资金、技术以及人才的流动从国内转向国际,“人才是关键”,这是中国与东盟国家已达成的共识。同时,伴随着东盟自由贸易区的快速发展,东盟自由贸易区对人才需求也将大大增加,人才需求的类型也由原来较为单一的翻译、经贸以及旅游等方面人才而转向更加多样化的人才。因此,关于东盟自由贸易区未来人才需求量的预测的研究就势在必行。作为与东盟国家临近的中国省份,自从中国-东盟自由贸易区建立以来,云南省由一个中国边疆省份成为对外开放的前沿,云南省也加强了与东盟国家的合作。随着东盟国家对人才需求量的增加,云南省外向型高级人才也十分紧缺,云南省与发达省区的差距最为明显的也是人才上的差距,这是云南面对种种挑战中最为严峻的挑战。基于此,本文选用BP人工神经网络模型对东盟自由贸易区人才需求趋势进行预测,并提出云南省在人才培养中的应对措施,具有一定的理论和现实意义。
一、相关研究文献回顾
人工神经网络理论是20世纪80年展起来的一个前沿研究领域,BP神经网络是人工神经网络的重要模型之一,拉皮得(Lapedees)等人(1987)首先采用非线性神经网络对由计算机产生的时间序列仿真数据进行了学习和预测,并将神经网络引入预测工作中。此后,神经网络预测模型的应用领域逐步扩大,被广泛应用于经济、管理以及工程等领域,取得了很好的预测效果[1](P21)。
国内相关学者运用神经网络理论进行了大量的研究。常引(2008年)运用BP神经网络理论,找出影响农民收入的主要因素,建立了神经网络预测模型,在此基础上以陕西省历年农民收入数据为实例样本,对陕西省农民收入进行预测[2](P3);何永贵等(2005)分别使用多元线性回归、灰色相关方法和神经网络方法对某供电企业的人力资源需求进行预测,在此基础上将三种预测结果进行误差分析和比较,最后确定神经网络方法为比较理想的预测方法,该方法可以作为较好预测供电公司人力资源需求[3](P80);邹子建(2010)运用 BP 神经网络理论,结合衡水市历年经济总量数据,构造出区域经济预测模型,在此基础上借助MATLAB软件,对衡水市未来经济总量进行预测。本文作者对预测值和实际值进行了比较分析,证明BP 神经网络方法对经济总量预测具有较高的预测精度。因此,BP神经网络方法可以广泛运用到对某一区域的经济预测中[4](P3)。
综上所述,基于BP人工神经网络理论的预测方法已经比较成熟,利BP人工神经网络模型应用的领域也越来越广泛。但是到目前为止,尚未发现将BP人工神经网络模型应用于东盟自由区人才需求量预测方面的研究成果。本文运用BP神经网络模型对东盟自由贸易区的人才需求量进行预测,在此基础上提出云南省的应对措施,以期对相关部门的决策提供理论支持。
二、基于BP人工神经网络模型的
东盟自由贸易区人才需求趋势
预测过程及结果 BP人工神经网络(Back Propagation Artificial Neural Network)也被称为误差反向传播神经网络,BP人工神经网络大量应用于经济管理、优化控制以及趋势预测等方面。从结构上讲,BP人工神经网络具有输入层、隐含层和输出层三层结构,同一层单元之间不存在相互连接,层与层之间多采用全连接的方式[5](P38)。我们运用BP人工神经网络模型对东盟自由贸易区人才需求量进行预测如下:
(一)样本数据的选取和处理
首先,需要对东盟自由贸易区人才需求进行量化分析。因为受统计资料的限制,我们难以从统计资料中查找到历年东盟自由贸易区人才需求量数据 ,但是从东盟统计年鉴2011年中可以查找到历年东盟自由贸易区劳动力总数数据。我们可以将东盟自由贸易区劳动力总数的10%作为东盟自由贸易区人才需求量数据,这种替代方法也是具有一定道理的。
其次,需要对东盟自由贸易区人才需求量的影响因素进行分析。应用BP人工神经网络模型对东盟自由贸易区人才需求量趋势进行预测,需要找出东盟自由贸易区人才需求量的影响因素,这是至关重要的。目前学术界普遍认为,东盟自由贸易区比较紧缺的人才是外语人才、经贸人才、法律人才、文化人才以及宗教人才。而这些人才的紧缺是与东盟自由贸易区经济快速发展、进出口贸易总额快速增长、吸引外资量和吸引旅游者人数大大增加有着较为密切的关系。因此,我们将东盟自由贸易区人才需求量的影响因素定为人均GDP、吸引FDI量、吸引旅游者人数和进出口贸易总额。这些指标数据也可以从东盟统计年鉴2011年中查找到(如表1所示)。
最后,通过各解释变量的时间序列模型预测出各解释变量2011~2020年的数年。人才需求预测各解释变量的时间序列模型,包括人均GDP时间序列模型、吸引FDI量时间序列模型、吸引旅游者人数时间序列模型以及进出口贸易总额时间序列模型。通过对这些时间序列模型进行研究,可以对未来东盟的人才需求量进行简单的总结归纳。根据2000年~2010年的时间序列数据,运用普通最小二乘法(OLS),并利用EViews软件可得各时间序列模型的表达式如下:
其中,Xt表示各时间序列模型的被解释变量(i=2000,2001,…2010),t表示年份数(t=1,2,…,10),Ut表示随机误差项。
上述模型就是利用EViews软件得出的人才需求预测解释变量时间序列模型,将上述模型的自变量即(2011~2020年)代入上述模型,可得东盟自由贸易区人均GDP、吸引FDI量、吸引旅游者人数以及进出口贸易总额在2011~2020年的大体数据(如表2所示)。考虑到这些评价指标数据的量纲和数量级不一致,如果直接用这些数据进行计量分析,BP神经网络难以做出有效判断,因此,需要对这些数据进行无量纲化处理(无量纲化处理后的数据略)。
(二)基于BP人工神经网络模型的东盟自由贸易区人才需求趋势预测过程
在建立模型过程中,我们确定将2000~2010年影响东盟自由贸易区人才需求量四个因素数据作为输入变量,将2000~2010年东盟自由贸易区人才需求量数据作为输出数据。在此基础上,要把样本分为训练样本和测试样本两部分。我们将2000~2009年东盟自由贸易区人才需求量数据作为训练样本,将2010年东盟自由贸易区人才需求量数据作为测试样本,用2000~2009年东盟自由贸易区人才需求量数据对BP神经网络进行训练,在这里我们假定2010年东盟自由贸易区人才需求量数据是未知的,然后将2010年东盟自由贸易区人才需求量影响因素输入到我们训练的神经网络模型中,得到预测值,再来看一下预测值跟实际值之间是否能达到预期的误差范围之内。
我们建立一个输入层(包括四个输入变量)、一个隐含层、一个输出层(包括一个输入变量)的三层BP神经网络结构。隐含层的节点数(神经元数目)方面,如果隐含层节点数过少,网络很难识别样本,网络的容错性差,导致网络预测能力下降。如果隐含层节点数过多,则会增加网络的迭代次数,从而延长网络的训练时间,也会导致网络预测能力下降。在具体设计时, 首先根据经验公式初步确定隐含层节点数, 然后通过对不同隐含层节点数的网络进行训练对比, 再最终确定隐含层节点数。通用的隐含层隐含层的确定经验公式有:
(三)基于BP人工神经网络模型的东盟自由贸易区人才需求趋势预测结果
运用BP人工神经网络模型对东盟自由贸易区人才需求趋势进行预测是一个多次训练过程,经过多次训练,终于得到训练好的BP人工神经网络,BP人工神经网络经过两步后收敛。运用训练好的BP人工神经网络可以得到2010年东盟自由贸易区人才需求量为1.216,与真实值(1.222)的偏离程度是(-0.5%),差距已经非常小了,可以较好预测2011~2020年东盟自由贸易区人才需求量。我们运用训练好的BP人工神经网络预测2011~2020年东盟自由贸易区人才需求量分别为:1.245、1.336、1.372、1.391、1.409、1.434、1.471、1.508、1.540、1.565。将这些数据还原后得到2011~2020年东盟自由贸易区人才需求量真实数据为:2661.773万人、2856.328万人、2933.295万人、2973.916万人、30124万人、3065.849万人、3144.954万人、3224.059万人、3292.474万人、3345.923万人。
三、基于BP人工神经网络模型
预测结果的云南省人才培养
存在问题及应对措施 本文运用BP人工神经网络模型对东盟自由贸易区的人才需求量进行预测,经过分析可以得出2020年东盟自由贸易区人才需求量达到3345.923万人,是2000年东盟自由贸易区人才需求量的1.56倍。随着中国与东盟诸国全方位、多层次、宽领域的合作与交往的日益增多,今后面向东盟的人才需求是大量的。没有各方面人才资源的支持,我们将会丧失很多的机遇。谁拥有人才,谁就会占有先机,并拥有广阔的发展空间,因此,中国应该制定好相应的人才应对措施。由于地缘关系,中国面向东盟自由贸易区的人才培养较积极的主要在西南一些省区,而这些省区工业基础相对薄弱,经济和教育发展水平不如东部省份。以云南省区为例,云南省经济不够发达,人才培养方面普遍存在着人才总量不足、人才结构不合理、高层次人才复合型人才不多以及人才流失严重等问题。此外,云南省虽然与东盟诸国是近邻,但过去对东盟诸国的研究并不多,这方面的人才储备也不足。尽管国家在政策上给予支持,但云南省现有人才总量以及结构不能适应中国与东盟各国在自由贸易区的经济交流和扩大经贸往来的需要。我们认为,为进一步应对东盟自由贸易区对人才的需求,以下几条措施可供参考:
(一)加快专业课程调整的步伐
如前所述,伴随着东盟自由贸易区的快速发展,东盟自由贸易区对人才需求的类型由原来较为单一的翻译、经贸以及旅游等方面人才而转向更加多样化的人才。因此云南省应该加快专业课程调整,以应对新形势下东盟自由贸易区对人才的需求。专业调整方面,云南省一些高校应该增加诸如:小语种、国际经济与贸易、国际文化交流、国际经济法、商贸外语、旅游管理以及宗教学等专业,已经设置这些专业的高校应该扩大招生规模。课程调整方面,可以向法律专业的学生设置经济类课程;可以向英语类专业的学生设置小语种类课程、经济管理类课程或者旅游管理类课程;可以向经济管理类的学生设置旅游管理类课程、小语种类课程或者国际法课程;可以向其他专业的学生设置小语种类课程、经济管理类课程、国际关系类课程、国际政治类课程、宗教类课程或者旅游管理类课程等等。
(二)加强开展与东盟国家的教育合作
本文预测结果表明,2020年东盟自由贸易区人才需求量达到3345.923万人,是2000年东盟自由贸易区人才需求量的1.56倍。因此,为了应对东盟自由贸易区人才需求量快速增加的势头,应该实施走出去请进来的教育合作方式,构筑中国与东盟国家教育交流与合作的平台,广泛开展云南与东盟国家教育合作。首先,要扩大留学生引进规模。云南省各高校应突出各自的学科专业优势,整合校际教育资源,通过多种形式的奖学金和国际通行的奖学金管理办法吸引东盟国家的留学生,尤其应向缅甸、柬埔寨和老挝等教育比较落后的国家提供政府奖学金,并且欢迎这些国家自费留学生到我国学习深造;其次,要扩大留学生输出规模。鼓励和支持国内学生到东盟国家尤其是新加坡和泰国等高等教育比较发达的国家留学,当前要加快培养中国-东盟自由贸易区建设所需的大量外语人才、科技人才、经贸人才,特别是熟悉东盟各国国情、语言以及国际经贸知识的复合型人才;最后,要完善学位制度。在学位、学分、证书相互承认方面制定若干办法,提高留学生学历以及学位教育水平和层次[7](P38)。
(三)实施人才质量认证国际化战略
针对东盟自由贸易区人才需求量增加及需求类型多元化的情况下,实施人才质量认证国际化战略势在必行。国际型人才的培养,毕业生质量需要得到各国认可,只有实施人才质量认证国际化战略,才能使毕业生在他国就业畅通无阻。目前ISO系列标准已经成为各国普遍承认的国际标准,一些国家的教育机构对他国毕业生质量的认定都采取ISO9000系列标准。云南省高等教育管理并没有完全跳出单一、僵化以及封闭的模式,如果云南省高等教育管理和质量评价不能与国际接轨, 其培养的毕业生就难以得到国际认可,在国际交流与合作中将难以取得主动。如果将ISO9000系列标准广泛应用于云南省高等教育管理,云南省高等教育的质量就会得到明显提高。目前国内许多高校都引入ISO9000质量标准体系,引入ISO9000质量标准体系,也是云南省高校与国际社会接轨的一个途径,能够明显改变目前云南省教学管理模式中存在的种种弊病,能够明显提高云南省高校教学管理水平,能够明显提高云南省高校培养人才的国际竞争能力。
(四)营造有利于国际型人才成长的环境
为了应对新形势下东盟自由贸易区对人才的需求,除了以上措施以外,营造有利于国际型人才成长的环境也是必不可少的。人才的成长需要一定的环境条件,培养国际型人才就需要运用国际国内两种资源,营造有利于国际型人才成长的环境。我们认为,首先应该举办和承办国际性学术会议,邀请国际学术界知名人士做学术报告,给广大教师与学生提供一个学习与交流的机会;其次应该组织教师与学生到东盟国家讲学、考察、参观以及实习等,通过这些活动亲身体验东盟国家的风土人情,并且学会国际交往的知识;最后应该在一些高校成立“中国-东盟自由贸易区研究所”“东盟研究所”以及“东盟研究院”等国际性和区域性研究机构,积极开展东盟问题的研究[8]29。
[参考文献][1]Lapedees.A.Farber., Genetic Data Base Analysis with Neural Networks[J], Neural Information Processing System-Nature and Synthetic,2002 (10),IEEE,1987.
[2]常引.基于BP人工神经网络的陕西省农民预测研究[D].西安:西北农林科技大学,2008.
[3]何永贵, 韩月娥,杨实俊,等.人力资源需求预测模型的优选[J].华北电力大学学报,2005,(6).
[4]邹子建, 基于BP神经网络的衡水市经济预测研究[D].西安:西北农林科技大学,2010,(5).
[5]傅荟璇,赵红.MATLAB神经网络应用设计[M].成都:机械工业出版社,2010.
[6]焦淑华,夏冰,徐海静,等.BP神经网络预测的MATLAB实现[J].哈尔滨金融高等专科学校学报,2009,(3).
[7]杨行玉.中国与东盟国家高等教育合作及发展对策[J].东南亚纵横,2012,(7).
[8]莫光政,适应中国-东盟自由贸易区发展需要的国际型人才培养的战略构想[J].东南亚纵横,2007,(9).
The Forecast of Talent Demand Trend of the ASEAN Free Trade
Area based on BP Artificial Neural Network Model
――On the countermeasure of Yunnan Province Concurrently
YANG Jun-sheng1, XUE Yong-jun2
(1. Business School, Yunnan Normal University, Kunming, 650106, Yunnan, China;
2. School of Economics and Management, Yunnan Normal University, Kunming, 650500, Yunnan, China)
神经网络的优势范文2
【关键词】旅游上市公司;财务危机预警;BP神经网络
一、引言
随着经济的不断发展,人民的物质生活水平得到很大的改善,当前就旅游业这样第三产业,已成为一种支柱型产业。首先,旅游业在国家实施应对危机、扩大内需、促进增长的战略中,发挥了巨大的发展潜力和起到了强大的关联带动作用,受到前所未有的重视;其次,对我国的经济发展有着举足轻重的作用,对经济的推动效果也是十分的显著,因为旅游业作为一个劳动密集型行业无论是在在解决劳动就业方面,还是在刺激消费、平衡社会财富方面,甚至对我们创建和谐社会都做出了应有的显著贡献。
受全球金融危机冲击和甲型H1N1流感疫情的影响,2009年中国旅游业企业面临前所未有的挑战,然而在旅游投资领域,全国却出现了近年来的新一轮旅游投资。这是中央政府和地方政府大力推动、积极主导的结果,特别是目前正处于“十二五”时期,这将是旅游业公司发展的最佳时机,是高速增长的新阶段。但是,因为现在存在很多可能导致旅游公司产生财务危机的不确定因素,这将严重影响旅游业的发展,让其难以适应现在的发展趋势,因此应适时的研究一些解决旅游公司财务危机的方法。
因为财务危机在爆发之前是有一些“预兆”的,我们可以根据这些“预兆”来采取相应的措施预防其发生,以“预兆”为研究对象预测财务危机的方法是提醒关联方的预警器,能起到很好的预警作用。
然而,目前我国有关旅游业企业财务危机预警的研究相对缺乏,这与市场经济发展的趋势是很难适应的,因此笔者认为很有必要从旅游这一行业出发对财务危机预警进行进一步的研究。
以往关于其他行业的财务危机预警模型大多依赖于统计数据以及数量经济模型,例如,Z-Score模型、判别分析以及Logistic模型等,这些方法虽然能够根据样本的历史数据建立预测模型,但它们不能动态地归纳新的数据,从而也就影响了其预测的准确性。近年来,随着人工智能技术的发展和数据挖掘技术的成熟,神经网络模型等也被应用到各行业的财务预警上来。因此本文拟将基于神经网络模型来判别和分析旅游上市公司的财务状况。
二、研究对象的确定
目前我国旅游业上市公司总体数量有限共20家,其中在2007-2011年度之间被ST处理的企业共4家。首先,本文以ST公司界定为财务失败的企业,选取被ST处理的4家企业并相应的选择相同年份、同行业的10家非ST公司作为研究样本,总样本为14家旅游企业,研究范围覆盖了大部分的旅游业,因此相对其他行业同类型研究更具说服力;其次,本文并按照1:1的比例随机将总体样本分为两组:训练组和测试组,每组分别由5家非ST公司和2家ST公司组成。总样本为14家,如表1所示:
三、财务指标的选取
神经网络模型是一种自然的非线性模型,它能以任意精度逼近任意复杂的非线性映射,而不需要对多变量正态分布或事先概率进行假定。因此,本文研究从是否与企业危机预测相关、在国内外研究成果中出现的频率、中国上市公司的实际情况三个角度出发,并在遵循尽可能全面反映上市公司财务特征的原则下,选择了五类财务指标:每股指标、营运能力、盈利能力、成长性以及现金流量。
因为涉及本文选择的五大类指标下有将近100个指标,这五大类所覆盖的全部指标,能不能有效地区分ST公司与非ST公司,现在还不能确定。如果某项指标在ST和非ST公司间没有明显的区分度,而作为BP神经网络输入,将会降低BP神经网络的准确度。因此,为了保证财务危机预警指标体系能有效地判别财务危机,需要对财务指标进行双样本t检验,判别它们是否存在显著性差异。利用SPSS软件对原始数据做指标显著性t检验,得到14家公司的均值、标准差、t值,从检验结果中可以看出:非ST公司和ST公司在其中的23个指标上存在显著性差距,能够作为区别非ST公司和ST公司的财务指标。本文采用的23个财务指标具体见表2。
四、神经网络模型的构建
1、神经网络
神经网络是一种旨在模仿人脑结构及其功能的信息处理系统,它能够通过预先存储的信息或自适应学习机制,从不完整的信息和噪声干扰中恢复原始的完整信息;此外,它还能通过对系统输入输出样本对的学习自动提取蕴含其中的映射规律,从而以任意精度拟合任意复杂的非线性函数。本文采用最常用的三层BP前馈神经网络,网络各层之间完全连接,包括输入层、隐藏层与输出层,如图1所示:
2、模型构建
本文模型的输入变量为的23个财务指标,输出变量是企业财务危机程度,用Y表示:Y=0表示ST公司,Y=1表示非ST公司,因此最终建立的BP神经网络模型共有23个输入神经元,16个隐层神经元,2个输出神经元,得到的神经网络拓扑结构为23*16*2。
(1)网络训练时采用快速训练方法,即采用traingdx训练函数来训练,利用编写的Matlab语言程序,经过反复试验,确定采用如下参数进行训练:循环间隔数100,目标误差0.05,学习速率0.205,学习速率增加的比率1.05,动量因子0.1,最大循环次数1000。
(2)用训练组样本值对神经网络模型进行训练,训练过程中得到了BP神经网络误差曲线,如图2所示:
(3)用测试组对训练好的模型进行测试,得到相关测试组的输出结果如表3所示:
五、结论
从图5我们可以明显地看到:公司代号从1-25之间神经网络输出值基本保持在(-0.5,0.5)这个区间进行波动,而从25-35之间大部分输出数值则在(-1.5,-0.5)U(0.5,1.5)这个区间波动,数据表明了桂林旅游、丽江旅游、云南旅游、旅游、中国国旅这5个旅游上市公司2007-2011年度的输出值绝对值接近0,ST东海A、ST金马上市公司2007-2011年度的输出值绝对值接近1,因为本文在前面设置输出值用Y表示:Y=1表示ST公司,Y=0表示非ST公司,神经网络的输出结果基本符合设置值,即输出值接近0的桂林旅游、丽江旅游、云南旅游、旅游、中国国旅是正常的公司未发生财务危机;而输出值接近1的东海和金马上市公司则发生了财务危机。
图3
从准确度上来看,经过具体计算得到BP神经网络模型的准确度为86.84%,而前面的学者用logistic回归模型同类预测结果为76.67%,显而易见本文采用神经网络输出的预测结果高于用logistic回归模型的预测结果,并且相差很大,更为主要的是:后者模型的建立非常复杂,不容易应用;而神经网络模型程序实现只需借助于MATLAB语言非常简单;并且因为企业进行财务危机预警的目标就是要以最小的出错率、最高的效率将财务危机公司和正常公司分开,本文运用神经网络对旅游业上市公司财务危机预测的结果到达了企业预定的目标和要求。
因此,笔者建议旅游业上市公司在进行财务危机预警时应多尝试使用神经网络模型,并且可以将其使用范围延伸到对投资对象的分析和对企业经营业绩的评价等诸多方面。这是企业运用人工智能技术开发各种风险评测模型,有效发现潜在财务风险,提高企业经营管理准确性、科学性和有效性的重要途径。
参考文献:
[1]李健,刘翔.借助遗传神经网络开展上市公司财务危机预警[J].财会月刊,2011,1.
[2]甘敬义,黄明和,袁晶.中国金融风险预警模型分析[J].商业时代,2011,27.
[3]韩力群.人工神经网络理论、设计及应用[M].化学工业出版社,2002,1.
[4]刘兆峰.神经网络在公司财务风险预警中的应用[J].水运科学研究所学报,2001,4.
神经网络的优势范文3
欧阳亮(1984―),女,湖南大学工商管理学院(长沙,410082)。研 究方向:金融工程与风险管理。
[关键词]汇率预测;汇率波动;神经网络
汇率作为一个重要的经济变量,其变动对国民收入的增减、工农业的发展、国内利率、就业 等各方面都有着重要的影响。因此,汇率预测受到广泛的关注,大量的计量经济模型和时间 序列模型被用于汇率预测。其中,人工神经网络(Artificial Neural Networks, ANN)作为 一种非参数的数据驱动型的方法,不需要对数据特征进行事先假设,通过合理的样本训练, 学习专家的经验、模拟专家的行为,并引入非线性转换函数来求解各种复杂的非线性问题, 具有很强的模式识别能力和高速信息处理能力,从而在时间序列数据预测方面有独特的优 势。[1]
利用神经网络方法预测汇率波动,国内外学者已经进行了比较广泛的研究。总结国内外学者 的研究成果,用神经网络预测汇率有3个层次。它们分别是同质神经网络模型、 异质神经网络模型和神经网络组合模型。
一、汇率预测的同质神经网络模型
同质神经网络预测模型是用神经网络根据历史汇率数据来预测未来汇率,这是作为一种汇 率预测的非参数方法提出来的。由于汇率波动具有非线性相关性和 长效记忆性,因此通过历史数据进行汇率预测是一种可行的方法。同质神经网络预测模型认 为;汇率有一个隐含的生成机制,历史汇率和未来的汇率都由这个机制生成,通过对历史数 据的观测,识别这个生成机 制,就可用这个生成机制预测未来的汇率。由于神经网络是一个数据驱动的自适应的非参数 方法,不基于假设,即使产生数据的过程是未知的,或者很复杂,神经网络也能识别。
用同质神经网络进行汇率预测,是根据汇率的历史数据加上输入延迟来预测汇率的变化或变 化趋势。用于汇率预测的神经网络模型很多,其中最常用的是多层后向神经网络模型,即BP 神经网络。BP神经网络一般采用三层结构:输入层、隐含层、输出层。BP神经网络的算法 和训练如图1。
以t时刻汇率种类R的预测为例,滞后期为n,预测长度为L。输入层的数据是从时刻t开始前n 期的历史汇率观测值序列,yt,…, yt-n,输入才由长度n的滑动窗口产生。输出层 依次输出从t时刻开始的L个汇率预测值,yt+1,…, yt+L。相邻汇率的时间间 隔是等长的。汇率预测的同质神经网络模型的结构如上图2。
用同质神经网络预测汇率的研究很多,1993年,Refenes等人采用神经网络方法预测汇率变 动,他们将数据分成训练组(Training Subsample)、测试组(Testing Subsample)和预测组( Forecasting Subsample),先用训练组和测试组数据训练神经网络,然后用预测组数据进行 预测,这种尝试以及随后的评议肯定了神经网络在一定的情况下比“标准”的预测方法表现 要好。[2]Kuan和Liu(1995)用神经网络对5个不同币种兑美元的汇率进行预测。这5 种货币包括英镑、加拿大元、德国马克、日元以及瑞士法郎。研究发现神经网络对日元和英 镑的预测的均方差(MSE)很低,但对其余3个币种的预测效果一般。[3]De Matos(19 94)通过对日元期货预测比较了多层后向神经网络(MLFN)和重复网络的预测效果。[4]Zhang和Hu(1998)用多层后向神经网络对英镑和美元的汇率进行预测,发现神经网络的预 测效果明显优于线性模型,尤其在预测期比较短的时候。[5]
虽然研究表明神经网络的预测效果比其他方法好,但是其预测精度和可靠性仍然不尽人意。 对此,学者们对神经网络进行了改进,提出了诸如聚类神经网络、重复神经网络、广义回归 神经网络、模糊神经网络等经改进的神经网络进行汇率预测,或者将其他方法与神经网络结 合,以改善神经网络的预测能力。例如,Shazly等(1999)用遗传算法训练神经网络的权值。 惠晓 峰和胡运权等(2002)结合遗传算法,提出了基于实数编码的GA-BP神经网络汇率预测人民币 兑美元汇率的模型。姚洪兴, 盛昭瀚和陈洪香(2002)提出了一种改进的小波神经网络结构。
这些研究在一定程度上提高了神经网络的预测效果,但是神经网络的结构、训练算法、阀值 函数的选择以及滞后期的确定等问题仍然难以解决。而且,汇率由历史汇率唯一决定这一 前提也缺乏足够的理论支持。
二、汇率预测的异质神经网络模型
用异质神经网络模型进行汇率预测,是指在预测过程中,考虑影响汇率的各种因素,如利率 、通货膨胀率、原油价格、货币供应、贸易收支差额、消费价格指数、消费信心指数等,根 据这些影响因素来预测汇率。Shazly(1997)选取一个月欧洲美元存款利率、一个月欧洲外币 存款利率、即期汇率 和一个月的远期汇率作为输入变量,预测一个月后的即期汇率。结果表明,神经网络的预测 效果比通过远期汇率进行的预测效果要好。[6]杨火斤 和马洪波(1999)选取GNP、CPI、工业股 票价格指数、短期利率、货币供应量、长期利率6个影响因素,将这些变量作为神经网络的 输入变量,训练神经网络根据这些变量预测汇率。[7]Hui Xiao-feng等(2005)也用 模糊神经网 络进行汇率预测,输入的变量包括两国的CPI和GDP、两国的利率差、货币供应比、净出口额 等。[8]
异质神经网络模型的网络结构和训练算法与同质神经网络相似。区别在于同质神经网络的输 入是一段时滞的历史汇率数据,是一维的数据,而异质神经网络的输入数据是多个变量的数 据,是二维的数据。令x1, x2,…, xn分别表示影响汇率变动的各个因素,异质神经 网络的结构如图3所示。
图3 异质神经网络模型
随着布雷顿森林体系的崩溃,各国纷纷采用浮动汇率制度,影响汇率变动的因素更加多样化 、复杂化,难以确定。因此,学者们开始用神经网络与其他预测方法结合使用。一种是与基 本因素分析模型如购买力平价模型、利率平价模型等相结合。根据这些模型确定的影响因素 作为神经网络的输入变量,通过神经网络训练优化变量的权值,从而进行汇率预测。例如, Qi和Wu(2003)用基于货币理论的神经网络对英镑和马克1个月、6个月、12个月的汇率进行预 测,输入变量为货币供应量M1,各个国家的实际工业生产收入、利率作为输入变量。Lee和W ong(2007)用微观结构理论和宏观经济的6个变量作为神经网络的输入,预测汇率波动。
另一种方法是用神经网络与协整方法结合。先通过协整分析确定影响汇率变动的因素,再用 神经网络确定各变量的权值。Inc和Trafalis(2006)构建了一个结合协整方法和人工神经网 络的汇率预测模型方法,先用协整方法确定对汇率有影响作用的变量,然后用ANN对这些变 量进行非线性组合,预测汇率。[9]
异质神经网络模型将汇率视为整体经济系统中的一个变量,汇率波动受众多因素的影响,因 此汇率的波动是根据这些影响因素的波动来预测的,与同质神经网络模型相比有更强的理论 支持。但是,它的预测效果取决于影响因素的选择,因此汇率的影响因素的选择是异质神经 网络预测模型的关键。
三、汇率预测的神经网络组合模型
神经网络进行汇率非线性组合预测是一个两步组合预测模型。Bates和Granger(1969)证明了 预测方法的线性组合比单模型能产生更小的误差。[10]此后,一些学者在这方面做 了很多研 究。在众多的组合方法中,神经网络非线性组合是最广泛使用的方法。Hu和Tsoukalas(1999 )用不同的GARCH模型预测条件波动,并对这些预测值分别进行线形和非线性组合,结果表明 用神经网络进行非线性组合的预测效果是最好的。[11]Tseng等(2002)用BP神经网 络和时间 序列模型――SARIMA模型进行组合,用SARMIA(Seasonal Autoregression Moving Integrat e Average)对汇率进行线性预测,再用神经网络处理SARMIA模型预测的残差,进行汇率预测 。[12]用同样的方法还有Zhang(2003)用ARIMA和ANN组和对英镑和美元汇率进行预 测。[13]Yu, Wang和Lai(2005)组合广义线性自回归模型(GLAR)和神经网络进行 汇率预测。[14]
用神经网络对汇率进行非线性组合预测时,是将汇率数据分解成线性部分和非线性部分。先 用基本因素模型或者参数模型对汇率进行第一步预测;然后用神经网络对第一步预测残差进 行非线性组合;再根据两步的预测结果进行汇率预测。或者用神经网络对不同的参数模型的 预测结果进行非线性组合。下面以神经网络和ARIMA模型的非线性组合为例,说明神经网络 组合模型的基本原理。
(3)用神经网络mode残差:[AKn^]t=f(et-1,et-2,…,et-n)[JY](4)
其中,f表示神经网络的预测的非线性函数,et是随机误差。
(4)组合ARIMA和神经网络:[AKy^]=[AKl^]+[AKn^]t[JY](5)
神经网络组合模型使用神经网络和线性方法进行非线性组合,考虑了汇率作为一个复杂系统 同时具有线性和非线性特征的实际,充分利用了参数方法和非参数方法的优势,并综合了各 种汇率理论的分析结果。大量的实际研究表明,组合预测的效果比单独用线性模型或单独用 神经网络预测的效果要好。
四、比较与结论
同质神经网络预测模型是根据历史数据进行汇率预测,是用一维的数据训练神经网络。它没 有 考虑汇率作为经济系统中的一个变量,受到众多因素的影响,而仅仅把汇率视为一系列没有 经济含义的无规则数据。而异质神经网络模型则把汇率视为复杂经济系统中的一个变量,认 为在统计上无规则的汇率数据是由众多因素共同决定的。异质神经网络模型用二维数据进行 训练,与同质神经网络模型相比,其预测有更充分的理论支持。但是,影响汇率的因素至今 没有定论也没有统一的选取法则。
同质神经网络预测模型和异质神经网络预测模型都将汇率视为单纯的非线性变化的时间序列 ,而实际汇率的波动不是单纯的线性或非线性的,而是同时包含线性和非线性模式,因此单 纯的线性模型和非线性模型都不能很好地预测汇率。而神经网络组合预测模型则与前两种方 法有本质的不同,它同时考虑了汇率的线性和非线性特征,在线性预测的基础上再进行非线 性组合,充分利用参数方法和非参数方法的优势。一方面,研究表明线性预测有很多效果很 好 的方法,如ARIMA,GARCH等参数模型;另一方面,这些模型都基于很强的假设条件,不同的 条 件下预测效果有很大差别。因此,在实际预测时候,很难确定某个模型比其他模型有更好的 样本外预测效果。最优模型的选择是件很困难的事情。用神经网络组合模型,避免了 最优模型选择的问题,又综合了不同的汇率理论的分析结果。
另外,同质神经网络预测模型和异质神经网络预测模型都是单模型的一步预测的方法,研究 表明单一的模型往往只能适应某一特定的情况或者反映一部分的信息,而实际汇率是一个复 杂的系统,组合不同的参数模型或者参数模型不同参数的预测结果,能够较大限度地利用各 种预测样本信息,比单个预测模型考虑的问题更系统、更全面,从而提高了预测的精度。
自2005年7月21日起,中国实行汇率改革以来,央行入市干预的力度明显减弱。由市场供求 关系决定的人 民币汇率受到众多因素的影响,波动幅度较以往明显加大。用神经网络组合模型对人民币汇 率进行预测,充分考虑了汇率波动的复杂性。结合线性方法和非线性方法的优势,能抓住汇 率波动的线性和非线性特征,并能全面挖掘和反映样本信息,有较好的样本外预测效果。因 此,神经网络组合模型是人民币汇率预测的最佳选择。
但是,用神经网络组合模型进行汇率预测也存在一些难以解决的问题。首先是神经网络自身 的优化问题,如隐藏层数及隐藏层结点数的确定、激活函数的确定、局部最优等,神经网络 的结构直接影响着预测效果。其次,在神经网络进行组合预测时,如何选择被组合的模型以 及模型的个数,是另外一个难以解决的问题。第三,神经网络可以根据残差最小的原则不断 地调整参数来改变预测效果,但是它不能改变输入数据,而汇率数据往往是剧烈波动,存在 噪音的。因此,如何对数据进行除噪,优化神经网络的输入数据是另一个值得研究的问题。
主要参考文献:
[1]Guoqiang Zhang, Eddy Patuwo, Michael Hu. Forecasting with artificialneural networks: The state of the art[J]. International Journal of Forecastin g, 1998, 14: 35-62.
[2]Refenes. Constructive learning and its application to currency excha nge rate forecasting. In: Neural networks in finance and investing: using artifi cial intelligence to improve real world performance, 1993, 465-493.
[3]CM Kuan, T Liu. Forecasting exchange rates using feedforward and rec urrent neural networks[J]. Journal of Applied Econometrics, 1995, 10(4): 347-6 4.
[4]De Matos. Neural networks for forecasting exchange rates: [disserta tion n]. Canada: The University of Manitoba, 1994.
[5]Gioqinang Zhang, Michael Y. Hu. Neural Network Forecasting of the Br itish Pound/US Dollar Exchange Rate[J]. Omega, Int. J. Mgmt Sci, 1998, 26(4):495-506.
[6]Mona R. El Shazly, Hassan E. El Shazly. Comparing the forecasting pe rformance of neural networks and forward exchange rates[J]. Journal of Multina tional Financial Management, 1997(7): 345-356.
[7]杨 火斤, 马洪波. 人工神经网络在中长 期汇率预侧中的应用[J]. 系统工程, 1999, 17(1): 18-24.
[8]HUI Xiao-feng, LI Zhe, WEl Qing-quan. Using fuzzy neural networks fo r RMB/USD real exchange rate forecasting[J]. Journal of Harbin Institute of Te chnology (New Series), 2005, 12(2): 189-192.
[9]Huseyin Ince, Theodore B. Trafalis. A hybrid model for exchange rateprediction[J]. Decision Support Systems, 2006, 42(10): 1054-1062.
[10]Bates JM, Granger CWJ. The combination of forecasts[J]. Operation s Research Quarterly, 1969, 20: 451-68.
[11]Michael Y. Hu, Christos Tsoukalas. Combining conditional volatilityforecasts using neural networks: an application to the EMS exchange rates[J].Journal of International Financial Markets, Institutions and Money, 1999, (9):407-422.
[12]Fang-Mei Tseng, Hsiao-Cheng Yub, Gwo-Hsiung Tzeng. Combining neuralnetwork model with seasonal time series ARIMA model[J]. Technological Forecas ting & Social Change, 2002, 69: 71-87.
[13]G peter Zhang. Time series forecasting using a hybrid ARIMA and neu ral network model[J]. Neuro computing, 2003, 50: 159-175.
[14]LeanYu, Shouyang Wang, K. K. Lai. A novel nonlinear ensemble foreca sting model incorporating GLAR and ANN for foreign exchange rates[J]. Computer s & Operations Research, 2005, 32: 2523-2541.
Forecasting Exchange Rate with ANN: A Comparative Anal ysis
Xie Chi1 Ouyang Liang2 Abstract:With the popularity of floating exchange rate system,a lot of methods with parameter and non-parameter are adopted to forecast the ex change rate, and ANN is one of them. There are three types of ANN for exchange r ate forecasting, namely the homogenous ANN model, the heterogeneous ANN model an d the hybrid ANN model. This paper researches on the three models, specificallytheir characteristics and limitations, and draw the conclusion that both ANN mod el give full consideration to the linearity and nonlinearity characters of the e xchange rate. The ANN model can offer better results in a more systematic and co mprehensive way, because it adopts the thoughts integrating the analysis of diff erent exchange rate theories, and broadly utilizes the forecast samples.
Key words:Exchange Rate Forecasting; Exchange Rate Fluctuation;ANN
神经网络的优势范文4
【关键词】工程估算;神经网络;遗传算法
一、引言
工程项目建设前期,详细的项目信息尚未明确,工程造价具有较大模糊性。由于人工神经网络具有准确性高、非线性处理能力强等优点,已被许多学者应用到工程估算领域。但传统的BP神经网络收敛速度慢、易陷入局部极小,而采用遗传神经网络建立的工程估算模型,则可以利用遗传算法全局快速寻优的优势,有效解决上述问题。
二、模型介绍
1、 BP神经网络
人工神经网络是人工智能研究的一种方法,具有较强的非线性映射能力。其拓扑结构具有多层感知器结构,包括输入、输出层和若干个隐层。网络输入信息先通过输入层节点,向前传播到隐层节点,经过计算节点的激活函数后,将各个计算节点的输出信息传播到输出节点,最后得到最终输出结果。
所谓BP算法,即反向误差传递法,主要分为向前传播阶段和向后传播阶段。在向前传播阶段中,信息从输入层经过逐层的变换,传送到输出层。而后向传播阶段即根据期望输出计算反向误差,对权值进行修正,如果误差小于给定值或迭代次数超过设定值结束学习。BP神经网络具有优化计算能力,它可以在已知的约束条件下,寻找一组参数组合,使该组合确定的目标函数达到最小。但BP神经网路寻优的过程受初始点的选择影响,初始点如果靠近局部最优点而非全局最优点,就无法得到正确的结果,这也是其无法得到全局最优解的一个原因[1]。
2 、遗传算法
遗传算法(GA)是借鉴生物界自然选择和群体进化机制形成的一种全局寻优算法。在GA中, 将问题空间中的决策变量通过一定编码方法表示成遗传空间的一个个体,它是一个基因型串结构数据;同时,将目标函数值转换成适应值,用以评价个体的优劣,并作为遗传操作的依据。遗传操作主要包括三个算子:选择、交叉和变异。选择算子用来实施适者生存的原则,即把当前群体中的个体按与适应值成比例的概率复制到新的群体中, 构成池;交叉算子是从池中的个体随机配对, 然后将两两配对的个体按特定方式相互交换部分基因;变异是对个体的某些基因值按某一较小概率进行改变。从产生新个体的能力方面来说, 交叉算子是产生新个体的主要方法, 它决定了GA的全局搜索能力,而变异算子只是产生新个体的辅助方法, 但也必不可少, 因为它决定了GA的局部搜索能力。交叉和变异相配合,共同完成对搜索空间的全局和局部搜索[2]。
3 遗传神经算法
考虑到GA的全局搜索能力,采用GA对BP神经网络的初始权值和阈值进行优化。算法基本步骤如下[3]:
1)设定种群规模。随机生成设定规模的个体的初始种群,给定一个数据选定范围, 采用线性插值函数生成种群中个体的一个实数向量作为GA的一个染色体;
2)确定个体的评价函数。给定一个BP神经网络进化参数,将步骤(1)中得到的染色体对BP 神经网络权值和阈值进行赋值,输入训练样本进行神经网络训练,达到设定的精度得到网络训练输出值,以训练误差平方和作为种群中个体的适应值;
3)选择操作。基于适应值比例的选择策略对每一代种群中的染色体进行选择,选择概率为适应值与所有适应值之和的比值;
4)交叉操作。对群体进行随机配对,并随机设置交叉点位置,相互交换配对染色体之间的部分基因;
5)变异操作。随机产生变异点位置,依照某一概率将变异点的原有基因值取反;
6)将GA得到的最优个体分解为BP神经网络的权值和阈值,BP 神经网络预测模型经训练后, 输出预测值。
三、应用实例
为验证本算法在工程估算领域的有效性,特选取上海市建筑建材业市场管理总站的十个建筑项目的工程特征信息及造价指标进行分析。工程特征选取的是影响造价指标的七个关键因素,造价指标选取单方造价。具体数据如下表。
表一工程特征及造价指标表
地点
结构类型
建筑面积(m2)
建筑高度(m)
抗震烈度
建设年份
单方造价(元/m2)
1
1
7141
22.3
7
2009
4988.4
3
2
8580
39.2
6
2010
3115.3
2
2
2748
16.3
7
2010
2385.4
3
2
7675
22.8
7
2011
2750.5
1
1
18070
51.0
7
2007
2880.5
2
2
30489
53.7
7
2008
3773.0
1
1
65697
99.6
7
2008
2934.2
1
3
49900
76.7
7
2009
7396.4
3
1
51428
65.1
7
2010
3014.6
1
3
110577
208.0
7
2010
8124.8
其中地点分三类:内环(1)、外环(2)、外环外(3);结构类型分三类:框剪(1)、框架(2)、钢框架-钢筋混凝土核心筒(3)。
10个项目样本中选7个作为学习样本,3个作为预测检验样本。采用Matlab软件分别构建一般神经网络和遗传神经网络模型,测试样本进行预测的结果如下:
表2 造价指标预测结果与误差分析
检验样本
实际值
BP神经网络
遗传神经网络
预测值
相对误差%
预测值
相对误差%
1
7396.4
8563.5
15.8
7920.0
7.1
2
3014.6
3353.2
11.2
3289.6
9.1
3
8124.8
7146.6
-12.0
7561.7
-7.0
平均相对误差
13.0%
7.7%
通过实验结果可以发现一般神经网络和遗传神经网络两个模型均能满足项目估算阶段20%的准确率要求,但相较而言,遗传神经网络模型预测精度要高于一般神经网络模型。此外,通过对比收敛过程(收敛过程图略)发现,后者收敛速度更快。因此遗传神经网络无论从全局搜索能力和收敛速度上都优于BP神经网络,更能满足工程估算指标预测的实际需要。
四、结论
针对BP神经网络在局部极小缺陷和收敛速度慢的问题,采用遗传算法进行改进,通过GA优化神经网络权值和阈值,实现BP神经网络的全局快速寻优,弥补了神经网络固有的缺陷。经两模型预测结果进行对比,验证了遗传神经网络具有更好的非线性拟合能力和更准确的预测能力。
参考文献:
[1]任谢楠.基于遗传算法的BP神经网络的优化研究及MATLAB仿真[D].天津师范大学,2014.
神经网络的优势范文5
摘 要 遗传算法具有很强的全局搜索能力,但是容易造成未成熟的收敛,而径向基函数RBF神经网络的优势在于采用全局收敛的线性优化算法,唯一最佳逼近点唯一,二者结合的应用能弥补各自的缺陷。两种方法结合应用到核电厂安全管理评价领域,建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型,对核电厂安全管理存在的风险进行评价,有助于核电厂安全管理人员及时发现风险,采取应对措施,对于降低核电厂安全管理风险,确保人民群众生命财产安全和社会环境安全都具有极其重要的现实意义。
关键词 遗传算法 神经网络 核电厂 安全管理评价
核电厂的安全管理评价是对核电厂的安全管理现状进行的评价分析。科学合理准确的评价可以对核电厂的日常安全管理提供指导,为科学的开展安全管理提升提供参考。
利用遗传算法对RBF神经网络进行优化,保证了并行处理规模较大信息的能力,发挥了概括、联想、类比、推理等综合处理数据的能力。因此常被用来处理复杂问题,并做出科学的预测。建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型,既确保了对大规模数据的处理能力,又提升了安全管理评价的科学化水平,对于准确掌握核电厂安全管理现状,提升核电厂日常管理水平,有效保障企业员工的生命安全、国家财产安全和生态环境安全具有重要意义。
一、遗传算法和RBF神经网路原理
遗传算法于1975年,由美国的J.Holland教授提出。该随机化搜索方法借鉴了自然进化法则,即优胜劣汰、适者生存的遗传机制。该方法直接对结构对象进行操作;选用概率化的寻优方法,自动获取和指导优化的搜索范围。但该方法在实际应用中也存在部分局限性:因借鉴了优胜劣汰、适者生存的遗传机制,所以如果出现优势个体(局部最优解)时,就造成了过早收敛现象,也就无法搜索产生全局最优解;其次在经过多次重组演化后,容易丢失上一代的的基因片段,即同样造成无法得到全局最优值;再次传统的遗传算法通过杂交变异的手段,确定搜索空间,导致相似模式的数据种群占据优势,同样无法产生全局最优解。
RBF神经网络是一种前馈式神经网络,网络结构分为三部分:输入层、隐含层、输出层。它依据输入层少数的神经元(基础数据),利用隐含层(高效径向基函数),决定神经网络的输出层(预测数据)。隐含层(高效径向基函数),实际是通过利用高斯函数,执行固定的非线性操作指令,即将输入层(基础数据)映射到一个新的空间,通过输出层节点线性加权组合,输出形成结果。
输出函数为:
为隐含层神经元的输出, 为权值,二者的乘积累加和即为RBF神经网络的输出。输入层、隐含层相互连接,其中隐含层为一系列同一类型的径向基函数(高斯函数)[3]。RBF神经网络由高斯函数表示为:
其中,Ci代表了基函数的中心, 代表了函数的宽度参数。从上述公式中可以看出:高斯函数的径向范围与 函数的宽度参数成反比。在实际计算中,函数宽度参数 的确定一般采用自适应梯度下降法确定,而确定Ci 、 、w的取值也就确定了为隐含层神经元的输出 。
二、对RBF神经网路原理的优化
依据生物神经网络的机理建立基于RBF神经网络安全管理评价模型,通过在不同网络传递环节选取恰当的算法对模型进行优化改进,以此得到安全管理评价的优化模型。但是在应用过程中RBF神经网络关键函数基函数中心值、网络权值等难以得到最优解,因此选择遗传算法,利用其优势对神经网络模型进行优化完善。
(一)最优基函数中心值的确定
应用遗传算法进行数据编码。将学习样本进行编号:1,2,3,……,N,进而从样本中随机选择M个数据为一组中心矢量作为种群中的一个个体进行编码。如下所示,以第i个染色体为例,神经网络的m应度函数 为期望输出 和实际输出 之差的绝对值累加和的倒数:
从上一代中任意选取两个母体进行交叉以此获得两个子个体,再将两个子个体以一定的概率进行变异,染色体其他位的编号值用1,2,3,……,N,中任意值以一定的变异概率替换。将母体与子体进行比较从中选择优势个体即完成一次进化。以此方式循环迭代,直到个体达到给定最大代数或满足给定的精度,此时个体则为最优基函数中心值。
(二)最优权值w的确定
权值的优化是一个长期复杂的过程,实数编码值能够较好地反应现实情况,用一个数码代表一个染色体,一个染色体则代表一个X值;群体初始化,根据遗传算法的搜索范围将权值以 分布随机确定(-0.8,0.4,0.65,0.5);选取适应度函数,将输出样本的平方作为适应度函数:
根据遗传操作原理,采用染色体交叉变异,选择交叉的概率Pn、变异的概率Pm。
U11=(-0.8,0.4,0.65,0.5),U21=(0.3,0.7,0.6,-0.8),交叉:U21=(-0.8,0.4,0.6,0.5)变异:U22=(-0.8,0.4,0.5,0.5)
三、安全管理评价模型的建立
依据核电厂安全管理评价指标,建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型。其实现流程如图所示:
四、结语
本文建立基于遗传算法和RBF神经网络的核电厂安全管理评价模型,对核电厂安全管理存在的风险进行评价,有助于核电厂安全管理人员及时发现风险,采取应对措施,切实降低了核电厂安全管理风险,并为核电厂科学管理,安全管理提升提供参考和技术支持。
参考文献:
[1] 郭赞.基于遗传算法和RBF神经网络的铀尾矿库安全预警模型[J].绿色科技,2015.3:243-245.
[2] 魏艳强.基于RBF神经网络的公路货运量预测方法研究[J].天津理工大学学报,2008.2(1):17-20.
[3] 徐杰.基于遗传算法的RBF神经网络优化及应用[J].信息技术,2011(5):165-168.
神经网络的优势范文6
关键词: 神经网络; 入侵检测模型; 网络安全; 漏报率; 误报率
中图分类号: TN711?34 文献标识码: A 文章编号: 1004?373X(2015)21?0105?04
Application of neural network technology in network
intrusion detection model and system
ZHAN Muqing
(Jingdezhen Ceramic Institute, Jingdezhen 333403, China)
Abstract: The network intrusion detection model and system including neural network module are studied mainly. The defects of the traditional intrusion detection system and the advantages of neural network technology applied in intrusion detection are analyzed, and the network intrusion detection system including misuse and abnormal detection based on neural network was established. A large number of intrusion detection tests were carried out by using this system. The test results show that the established model has low missing alarm rate and false alarm rate, can detect a variety of network intrusion types better, and improve the safety performance of the network greatly.
Keywords: neural network; intrusion detection model; network security; missing alarm rate; false alarm rate
0 引 言
最近十年,随着互联网技术的迅速发展,网络安全越来越受到人们的重视,各种利用网络漏洞和病毒入侵的手段层出不穷,极大地威胁着网络安全。而传统的杀毒软件和防火墙技术面对端口扫描和新型木马等网络攻击显得力不从心。在此背景下,作为一种积极主动的安全防护策略,网络入侵检测技术得到了人们广大的关注,获得了广泛的应用。但是随着网络入侵技术的进化,传统的入侵检测技术暴露出诸多缺陷,因此,本文引入了神经网络技术对传统入侵检测系统进行升级,以提高系统的检测性能。
目前国内外有许多学者和机构都进行了基于神经网络的网络入侵检测系统的研究和探索。美国国防部为了提高计算机网络系统的防入侵能力,从20世纪90年代开始陆续起草了一系列的建议草案和标准,从结构体系上规定了计算机网络入侵防御的相关技术标准,并资助MIT了KDDCUP99入侵检测测试集,为相关研究提供了研究样本; 美国学者L Tony等采用单隐含层的简神经网络构建了一个IDES的入侵检测专家系统,实现了对局域网内几种典型入侵行为的判断,开启了利用神经网络对网络入侵行为进行判断的新途径。随着网络技术,特别是网络入侵技术和大数据技术的迅速发展,国外的网络安全提供商分别推出了自己完善的反网络入侵解决产品,如:思科的IDS?4250T和Internet Security的 Realsecure等[1]。
我国的网络入侵检测技术研究起步于20世纪90年代,哈尔滨工程大学的唐立力教授采用KDDCUP99入侵检测测试集作为研究样本,利用RBF神经网络作为判断模块,根据知识库中已经定义好的网络攻击方式来判断是否发生入侵行为,通过网络训练,对常见的四大类型的入侵行为进行了很好的判断;华中科大的周毅等采用遗传算法对BP网络输入参数进行优化,建立了GA?BP的诊断网络,大大提高了对网络入侵行为的诊断精度和速度,提高了网络的使用安全性[2]。虽然国内外对神经网络技术在入侵检测中的研究有着许多亮点,也取得了很多成绩,但是从目前的研究情况来看,大多学者采用的方法存在的普遍问题有:一是构建的网络入侵检测模型缺乏泛化能力,模型稳定差,当系统加入新的入侵类型时,模型诊断精度较低;二是除了国外少数商业软件巨头,其他研究者并未建立有效的基于检测模型的防入侵检测系统,即相关研究的实际用途有待进一步提高;三是检测系统的可扩展性和检测效率低。
1 入侵检测系统的组成
1.1 常见的两种入侵检测方法
在目前常见的入侵检测系统中,根据其检测方法的不同,可分为异常检测和误用检测两种方法。
异常检测的基础是建立一个安全行为的数据库,在此数据库外的操作会被进行比对,当其严重偏离安全行为时即被判断为入侵行为。此方法的优点是对未知的入侵行为有较好的检测效果,漏报率较低;缺点是容易将一些未定义的正常行为判定为入侵行为,即误报率较高。
误用检测则是一种基于入侵行为数据库的检测,该数据库是多种已知入侵行为及特征的集合,且数据库是实时更新的。误用检测工作时,会对网络行为与数据库中的信息进行比对,以判定其是否属于入侵行为。误用检测的优势是可以快速有效地判断常见入侵形式;缺点是数据库需要快速和持续的进行更新,随着数据库规模的持续增大,可能影响检测的速度。
本文研究了两种检测法的优缺点,决定在本文所构建的系统中同时采用这两种检测法,并以神经网络技术作为其实现的基础。
1.2 现有入侵检测系统存在的问题
一般来说,目前常见的入侵检测系统具有以下一些问题:
(1) 检测效率较低。不管是误用检测还是异常检测都很难快速检测具有欺骗性的入侵行为;异常检测的正常运行需要系统维护记录的实时更新,误用检测则需要复杂的专家系统shell来编码和解释,需要耗费大量的系统资源,因此其效率较低。
(2) 维护性和系统更新能力较低。一个入侵检测系统需要实时维护及更新,目前广泛存在的系统在维护和更新时往往要求操作者了解专家系统规则语言,使得操作者的学习成本大大提高。
(3) 漏报和误报问题。目前常见的入侵检测系统普遍存在漏报率和误报率偏高的问题,这极大的影响了系统的性能。
1.3 将神经网络技术应用于入侵检测系统的优势
将神经网络技术应用到入侵检测研究中。主要有以下优势:
(1) 误警率低。现有系统的一大缺点就是误报率较高,这是由于其采用的模式匹配模块缺乏自学习能力导致的,神经网络模型有较高的自适应和自学习能力,可以很好的解决这一问题。
(2) 自适应性好。传统的入侵检测系统需要对每种已知的攻击行为制定专家系统shell来编码和解释。当新的攻击类型出现时,需要重新进行编码和解释,这极大的增加了系统的更新和维护成本。而基于神经网络技术的系统则不依靠信号的模式匹配,其具有很强的自适应性,当需要对系统进行更新时,也不会造成太大的学习成本。
(3) 漏报率低。传统入侵检测系统,特别是采用误用检测法的系统对于新的攻击行为会有较高的漏报率,而采用神经网络技术则可以有效解决这一问题。
1.4 基于神经网络的入侵检测模型
本文借鉴文献[3?4],结合神经网络的相关特点,建立了如图1所示的检测模型。
在图1的入侵检测系统中,神经网络训练模块1在发现新的攻击类型后会将相关信息输入到神经网络训练模块2中进行训练,从而扩充误用检测库的数量,极大地提高了该系统的实用性,该系统主要分为以下几个模块:
(1) 数据采集模块
数据采集模块采用Winpcap来捕获网络中的数据包和处理系统日志并送入预处理模块。Winpcap体系结构利用的Packet.dll和Wpcap.dll两个API为用户提供支持。
(2) 数据预处理模块
对Winpcap采集到的数据进行筛选和处理,检查其格式,并调用不同的分析程序段对包中不同协议类型的内容进行分析,以转化为神经网络所能识别的标准格式。
(3) 神经网络模块
本系统建立了分别基于误用和异常检测库的神经网络模型。该网络首先需要一定样本的训练,然后即可以对相关的入侵行为进行识别,并把确定的行为报送给入侵响应模块。
(4) 报警响应模块
该模块的功能主要有两个:一是记录入侵行为的时间日志,以便复查、分析及作为证据,并保证这些记录不能被擦除或远程销毁;二是及时报警,通知网络管理人员及时采取相应措施以阻止网络入侵行为。
2 系统的试验过程及结果分析
2.1 实验环境
本次实验的硬件平台为Intel i5 3.2 GHz,8 GB内存和1 TB硬盘的计算机,实验在Windows 8平台上用Matlab语言编程实现。
2.2 试验数据源的选取
本文所采用的分析数据是目前入侵检测研究中常用的KDD Cup 1999 Data数据集,该数据集包含了近500万条模拟网络环境中的各种攻击和正常访问链接的记录。其中入侵行为主要包含4种常见的攻击类型和1种新的攻击类型,它们分别是拒绝服务攻击(Denial of Service,DOS)、本地用户权限提升攻击(User to Root,U2R)、远程攻击(Remote to Local,R2L)、探测攻击(Probe)和新类型攻击(Other)[5],这5种攻击类型中包含的18种具体的攻击名称如表1所示。
由图4可知,当训练经过23次迭代之后达到了满意的期望误差限。
2.5 结果分析
为了表征入侵检测系统的性能,本文采用漏报率和误报率来作为其性能指标,其值按下式计算:
[漏报率=错误标示为正常的异常数据测试样本集中的异常数据总和]
[误报率=错误标识为异常的正常数据测试本集中的正常数据总和]
经计算各个样本的漏报率和误报率如表4所示。
从表4可以知道,本文构建的入侵检测模型不管是对于已知入侵类型或新的攻击类型的检测都有较好的检测效果,可以起到提高系统安全的作用。
3 结 语
本文主要对神经网络技术在网络入侵检测中的应用进行了研究,分析了传统入侵检测系统存在的检测效率低和漏报、误报率高等问题,指出了将神经网络运用于入侵检测系统可以有效降低漏报、误报率,提高系统自适应性和减去数据过载等优势。本文构建的系统共有数据采集、数据预处理、神经网络和报警响应四个模块组成。通过利用该系统进行的仿真实验表明,采用神经网络技术的网络入侵检测系统具有较高的检测精度,可以有效提高网络的安全性。
参考文献
[1] KOZIOL J.Snort入侵检测实用解决方案[M].吴溥峰,孙默,许诚,译.北京:机械工业出版社,2005.
[2] 危胜军,胡昌振,姜飞.基于BP神经网络改进算法的入侵检测方法[J].计算机工程,2005,31(13):154?155.
[3] GHOSH A K, SEHWARTZBARD A. A study in using neural networks for anomaly detection And misuse detection [C]// Proceeding of 2009 the 8th Usenix Security Symposium. [S.l.]: ACM, 2009: 534?537.
[4] 李恒华,田捷,常b,等.基于滥用检测和异常检测的入侵检测系统[J].计算机工程,2003(10):14?16.