人工神经网络分析法范例6篇

前言:中文期刊网精心挑选了人工神经网络分析法范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

人工神经网络分析法

人工神经网络分析法范文1

[关键词]信用评价 指标 模型

信用风险一直以来都是各个经济主体面临的重要金融风险,信用风险评价的研究在国际上得到了高度的重视和迅速的发展。次贷危机的爆发,使得信用评价研究的重要性更加不言而喻。我国的信用风险度量方法虽然起步较晚,但随着我国市场经济和金融市场地发展不断演进,越来越多的学者加入到信用评价的研究中来。

综观我国的信用评价研究,焦点主要集中在信用评价指标体系的建立、信用评价的分析方法和信用评价模型中的有效性研究三个方面。

一、信用评价指标体系的研究

在指标的选取上,许剑生(1997)认为现行企业信用等级评定指标体系存在着以企业资产负债表和损益表数据为主,忽略了对企业现金流量的分析和部分指标设置不科学两大缺陷。

夏红芳、赵丽萍(1998)则指出现行指标体系存在着与新财务管理准则的核算口径不统一、定性分析指标太多、单项指标设置内涵过宽三个方面做得不足。认为当前的指标系统未能全面反映企业经营情况。

周佰成等(2003)认为一个指标体系应能准确地反映评估对象的特点与实际水平。

李小燕、卢闯(2004)研究了基于业绩企业信用评价指标与股权所有者的利益相关性,从而提出改进和完善现有企业信用评价模型的构想。研究结果表明:企业信用评价指标体系中的业绩指标较非业绩指标与企业的信用等级更相关。

田俊平(2005)在其硕士论文中提出现有信用评价指标较多关注企业的短期能力,应更多地关注反映企业长期能力的指标。

曲艳梅(2006)根据平衡计分卡原理,分别设计定性指标和定量指标的四个维度。其中定性指标的四个维度指标均衡分布,各为25分。而定量指标中的偿债能力指标定为50分。

综合现有文献中所采用的信用评价指标体系,信用评价所强调的是债权人的利益,而非股东的利益,故指标体系中最为看重的是体现偿债能力的指标。现有的指标体系普遍存在着定量指标比重过大,定性指标较少的现象,评价指标中所涉及的现金流量指标也较少。

二、信用评价的分析方法研究

当前我国学者研究得更多的是各种分析方法在信用评价模型中的应用。

最早用于建立信用评价模型的线性判别法(Liner Discriminate Analysis,简称LDA)是一种简单的参数统计方法。考虑到财务比率的多维性,信用评价模型中更为常用的是多元判别法(Multivariate Discriminate Analysis,简称MDA)。近年来,线性概率模型和Logistic回归模型,特别是神经网络法等也被广泛应用于企业信用评级。

最先将多元线性判别法用于信用分析的是美国的Redward•Altman于1968使用22个财务指标分析了美国破产企业和非破产企业,并从中选出5个最有代表性的关键指标建立了著名的五变量Z模型。该模型简单且成本低,在美国商业银行得到广泛应用。我国学者陈静(1999)使用多元判别法进行实证研究,建立了评价企业信用风险水平的现行判别模型。方洪全、曾勇(2004)以银行实际贷款数据样本为分析对象,使用SAS软件在66个财务指标中选取7个财务指标运用多元统计技术建立起4水平的线性判别模型,并根据对模型的检验证实了该判别模型对信用风险的定量评估有较强的解释和预测能力。

这些多元判别分析模型一般情况下只能对企业信用划分成两类,即还本付息和违约。这种分类不利于使用者对企业的风险进行更深层的管理。同时,由于多元判别分析法对变量数据要求较多,应用前提过于严格,而实际所使用的数据却有一定的违背,使得这种模型的误判率较高。

为了解决多元判别法应用前提的局限,美国学者Ohlson将多元逻辑回归(Logistic regression,简称Logit分析法)引入了信用评价研究中。使用Logit分析法的模型采用Logistic函数,在数据不满足正态分布情况下其判别正确率高于多元判别分析法的结果。

在国内,许多学者将Logit模型用于上市公司财务困境的预测研究,并取得了不错的效果。陈晓、陈治鸿(2000)使用Logit模型对ST公司和非ST公司进行了预测,其判别准确率为86.5%。常丽娟、张俊瑞(2007)建立了多元因变量Logit模型对69家进行了实证分析,并使用一个样本进行检验,评价结果与中介机构评价结果一致。

随着信息技术的发展,人工智能模型被引入到企业信用评估中,最典型的是人工神经网络(Artificial neural networks,简称ANN)的运用。神经网络对数据的要求不严格,处理非线性关系的变量具有良好的效果。但其工作的随机性较强,往往需要进行多重的训练。国外学者Altman、Marco、Jenson等都使用了神经网络分析法对公司的财务危机进行了预测研究,并取得了一定的成果。

王春峰、万海晖、张维(1999)使用神经网络法对100个企业样本进行了信用分析,研究结果中使用判别分析法的误判率为25.45%,神经网络法的误判率为18.18%。神经网络的预测准确性明显优于判别分析法。刘庆宏,刘列励(2009)对各类方法中的代表模型使用了两个数据集来验证他们的在信用评级应用中的评价效果,结论认为在各种方法中人工神经网络方法较为灵活与准确。但由于该研究数据为澳大利亚与德国企业的数据,未能代表其在中国的应用效果。

由于神经网络工作的随机性较大,需要人为地对网络结构进行调试,其应用受到了一定的限制。Altman(1997)经过研究后认为“神经网络分析方法在信用风险识别和预测中的应用,并没有实质性低优于线性判别模型”。

也有部分学者针对如何解决各种样本存在的问题,在模型中引入了各种处理方法进行改进。在解决小样本问题上,王春峰(2001)、胜(2004)的研究结果认为将cross-validation法引入信用风险评估建模技术,对于小样本情况更为有效。章华、卢太平(2006)考虑到企业财务信息不确定和样本的非典型分布特征,将灰靶模型引入对企业信用等级的评价。王慧玲等(2009)的研究表明在财务信用评价中引入熵模型,能够更加客观的确定评价指标的权重。

综合相关文献,我们可以发现随着统计分析方法的发展,越来越多的方法被应用到信用评价模型的分析中来以解决样本数据存在的缺陷。尽管信用风险评估方法层出不穷,但主流的方法只有多元Logistic回归、多元判别分析和神经网络法三大类。当前在准确性上较为认可的是神经网络法。

三、信用评价模型有效性研究

现代信用风险度量模型主要包括Credit Metrics模型、基于精算方法的信用风险附加(Credit Risk)模型、信用证券组合(Credit Portfolio View)模型以及基于期权定价理论的KMV模型。国内对现代信用风险度量模型的涉及最初见于对信用风险模型的综述类和比较类文献。阳(2000)、梁世栋等(200)、春等(2004)分别对各种信用风险度量模型做了比较分析。李志光(2007)在其硕士论文中对Credit Metrics模型、KMV模型、Credit Risk模型、CPV模型进行了分析比较,得出了Credit Metrics模型比其他模型在我国商业银行更具适用性和可行性的结论。

而对于Credit Risk模型,常丽娟等(2007)认为在我国的银行贷款业务中,行业特征和风险会对各笔贷款的独立性产生影响,不符合Credit Risk模型将每笔贷款是为独立的重要假设,该模型在我国的适用性令人怀疑。

国内对CPV模型进行的研究较少。靳凤菊(2007)基于CPV模型,选取了综合领先指标、中国房地产开发企业综合景气指数和企业景气指数三个指标从宏观层面对房地产信贷的信用风险进行了研究。杨岗、陈帅(2009)对KMV模型与CPV模型进行比较分析后认为,CPV模型能更好地把握经济变化对信用风险的影响。谢赤等(2006)对Credit Metrics模型与CPV模型进行了比较研究,结论认为CPV模型有利于提高信用风险度量的精确性,特别适用于投机性债务人。

国内较多的研究验证集中于KMV模型在我国的适用性。主要研究成果有:薛锋等(2003)讨论了运用KMV模型分析我国上市公司信用风险的优缺点和运用前景。常丽娟、张俊瑞(2007)使用中国上市公司数据,对KMV模型做了有效性检验,研究结果认为KMV模型在我国股票市场环境下具备整体有效性,但由于我国股票市场信息效率存在一定的缺陷,模型的预测效力尚显不足。李磊宁等(2007)在KMV模型中引入了公司资产价值增长率,使得模型在我国的适用性有了提高。李博、王海生(2008)使用修正后的KMV模型进行信用风险评价并检验了模型识别我国房地产上市公司信用风险的能力,发现模型能较好的识别出ST与非ST公司之间信用风险的差别,但同时也认为其在我国上市公司的预测准确率同其在国外的预测准确率相比相对较低。夏红芳、马俊海(2008)利用KMV模型,通过对我国4家上市公司5年股票价格的违约距离实证分析表明,KMV模型的灵敏度和预测能力都相当好。

这些学者普遍认为KMV模型在我国的实用性不高,主要在于我国缺乏一个完善的违约数据库,难以确定一个较为准确客观的经验EDF值。且我国资本市场上处于初步发展阶段,企业信息披露存在不足。必须结合我国的实际情况,不断地对模型进行修订与校验,才能提高KMV模型在我国的有效性。

四、小结

近年来我国经济一直在保持持续增长,在增长的同时我国的社会信用体系建设却严重滞后。企业缺乏一个良好的信用氛围,对于社会保障各种信用关系的健康发展和整个金融市场的稳定有着一定的影响。目前我国政府也越来越重视这个问题,并相应出台了一系列政策措施。如何有效地、客观地对企业的信用进行评价,不仅有利于保障企业各相关经济关系主体的利益,更有助于我们今后继续推进社会的信用体系建设。

参考文献

[1]夏红芳,赵丽萍.企业债券信用评级指标体系及神经网络方法[J].华东船舶工业学院学报,1998 (2).

[2]李小燕,卢闯等.企业信用评价模型、信用等级与业绩相关性研究[J].中国软科学,2003 (5).

[3]陈晓,陈治鸿.企业财务理论、方法及应用[J].投资研究,2000 (2).

[4]常丽娟,张俊瑞.企业财务信用评价与管理研究[M].大连:东北大学出版社,2007.

[5]王春峰,万海晖,张维.商业银行信用风险评估及其实证研究[J].管理科学学报,1998,1(1).

[6]李志光:Credit Metrics模型在我国商业银行信用风险管理的应用研究――基于我国商业银行某分机构的实证分析[D].上海财经大学,2007.

人工神经网络分析法范文2

关键词:BP神经网络算法;货运量;预测模型;实证分析

中图分类号:F252 文献标识码:A

交通运输系统是国民经济大系统中的一个子系统,运输需求同时受到来自系统内部和系统外部因素的影响,同时又反作用于国民经济系统[1]。其中,货运量是反映运输生产成果,体现运输系统为国民经济服务数量的重要指标[2],它作为衡量一个国家或地区经济发展的重要经济指标,愈加受到人们的重视,如何正确、有效地根据相关影响因素做出货运量预测,对于物流产业的发展具有至关重要的作用。

货运量预测具有较大的复杂性和非线性等特点[3],进行货运量预测的方法很多,常用的方法包括时间序列法、回归分析法和灰色系统法等,这些方法都集中在对其因果关系回归模型和时间序列模型的分析上,所建立的模型不能全面和本质地反映所预测动态数据的内在结构和复杂特性,从而丢失了信息[4]。人工神经网络具有良好的曲线拟合能力、学习能力、抗干扰能力[4-5],采用BP神经网络方法,建立货运量预测模型,具有更好的说服力。

近几年来,在国家政策的大力扶持和倾斜下,整个新疆的经济社会发展都步入了快车道。经济社会的快速发展,对相应的物流能力提出了更高的要求。现有的南疆兵团物流企业已经难以满足其经济快速高效发展的需要,日益成为制约南疆兵团经济快速发展的瓶颈。科学合理地预测南疆兵团物流企业的货运量以对其物流能力进行客观评价,对于优化配置南疆兵团有限的物流资源,实现南疆兵团物流企业的可持续发展,具有重要的现实意义和实践价值。

1 BP神经网络算法与模型

近年来,全球性的神经网络研究热潮再度兴起,不仅仅是因为神经科学本身取得了巨大的进展,更主要的原因在于发展新型计算机和人工智能新途径的迫切需要。迄今为止在需要人工智能解决的许多问题中,人脑远比计算机聪明的多,要开创具有智能的新一代计算机,就必须了解人脑,研究人脑神经网络系统信息处理的机制。另一方面,基于神经科学研究成果基础上发展出来的人工神经网络模型,反映了人脑功能的若干基本特性,开拓了神经网络用于计算机的新途径[6],它对传统的计算机结构和人工智能是一个有力的挑战,引起了各方面专家的极大关注。

目前,已发展了几十种神经网络, 例如Hopficld模型、Feldmann等的连接型网络模型、Hinton等的玻尔茨曼机模型,以及Rumelhart等的多层感知机模型和Kohonen的自组织网络模型,等等[6]。神经网络模型中,应用最广泛的是多层感知机神经网络。多层感知机神经网络的研究始于20世纪50年代,但一直进展不大。直到1985年,Rumelhart等人提出了误差反向传递学习,即BP算法[7],实现了Minsky的多层网络设想,如图1所示。

BP算法不仅有输入层节点、输出层节点,还可有一个或多个隐含层节点。对于输入信号,要先向前传播到隐含层节点,经作用函数激励后,再把隐含层节点的输出信号传播到输出节点,最后给出输出结果。节点的作用激励函数通常选取S型函数,如:

式中Q为调整激励函数形式的Sigmoid参数。该算法的学习过程由正向传播和反向传播组成。在正向传播过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。每一层神经元的状态只影响下一层神经元的状态。如果输出层得不到期望的输出,则转入反向传播,将误差信号沿原来的连接通道返回,通过修改各层神经元的权值,使得误差信号最小。

从上述BP算法可以看出,BP模型把一组样本的I/O问题变为一个非线性优化[8],是优化中最普通的梯度下降法。如果把神经网络的看成输入到输出的映射,则这个映射是一个高度非线性映射。

设计一个神经网络专家模型的构成和学习算法的选择,一般来说,是根据所研究领域及要解决的问题确定的[6]。通过对所研究问题的大量历史资料数据的分析及目前的神经网络理论发展水平,建立合适的模型,并针对所选的模型采用相应的学习算法,在网络学习过程中,不断地调整网络参数,直到输出结果满足要求为止。

2 货运量预测模型与实证分析

基于上述BP神经网络算法与模型,结合新疆兵团各师物流实际,构建南疆兵团各师货运量的预测模型,采用Matlab软件编制程序(见附录),将2006~2010年间的各师货运量数据[9]代入Matlab程序中,以对南疆兵团各师货运量加以预测。下面对Matlab中神经网络训练函数的训练步数、收敛精度及误差加以比较,通过反复训练来确定最佳的BP神经网络训练函数[8],以此来确定最优的货运量BP神经网络模型。

通过运行程序,得到训练均方误差曲线图如图2:

由图2可看出,误差训练值接近10e-2,而目标训练值为10e-7,说明经过2 000次步长训练,均方误差逐渐趋于目标值,训练结果非常小,结果较满意。同时,得到训练梯度及有效性检查曲线图如图3:

由图3可得出,训练梯度为0.00021324,检查错误几乎为0,说明经过2 000次步长训练,在这期间训练梯度变化不大,且错误趋于0,进一步说明预测结果较好。与此同时,得到训练回归曲线图如图4。

由图4可得到,目标训练值R=0.99983,趋于1,说明回归训练效果较好,预测精度较高,而同时回归曲线近似趋于一线性函数,其训练起点和终点(图中黑点)与源数据(白圆点)都很好的分布在曲线两侧,由此可见,运用BP神经网络仿真的效果十分理想,训练后的BP网络能很好地逼近给定的目标函数,据此表明训练效果很好。由此可见,所建模型与实际吻合度较高,模型结果具有可信度和说服力。

3 结果分析

通过运行BP神经网络程序,求得2006~2010年南疆兵团各师货运量的的预测值,将之与实际值放在一起进行比较,汇编结果如表1。

由表1可以看出,南疆兵团各师货运量持续上升,而且增加幅度逐年加快。事实上,近年来随着新疆经济社会的快速发展,南疆兵团各师的货运量呈现一个较大程度的逐年递增,这一点是符合客观事实的。

通过南疆兵团各师货运量的预测值和实际值的比较分析,发现预测值与实际值之间相对误差较小,位于0.8%~7.8%之间,平均相对误差约为4.45%,误差达到通常的精度要求10e-2,计算精度较高。由此可见,通过BP神经网络算法建立的南疆兵团各师货运量预测模型,所得结果符合计算精度要求,而且泛化能力较好,模拟结果比较可靠,与实际吻合度较高。

4 结 论

本文通过对近几年南疆兵团各师货运量的分析,合理地设计了BP神经网络结构;同时,通过比较Matlab中神经网络训练函数的训练步数、收敛精度及误差,反复训练并确定了最佳的BP神经网络训练函数;并以2006~2010年南疆兵团各师货运量数据为基准,建立南疆兵团各师货运量的预测模型,采用Matlab提供的神经网络工具箱编程求解,得到相应的南疆兵团各师货运量的预测值,通过实际值与预测值的比较,发现二者之间的相对误差较小,所得结果具有较好的说服力和可信度。

本文的研究结果,对于南疆兵团地区优化配置物流资源,引导地方政府决策提供理论依据,具有重要的现实意义和实践价值。人工神经网络具有良好的曲线拟合能力、学习能力、抗干扰能力,采用BP神经网络算法,建立相应的预测模型,所得结果因与实际吻合度较高,而具有较好的可信度。BP神经网络算法,可以广泛地应用于复杂经济系统的评价与预测工作。文中所采用的建模思想方法,还可以广泛地应用于其他复杂经济系统的建模工作,具有一定的普遍性,有着良好的应用推广价值。

参考文献:

[1] 王振军. 交通运输系统工程[M]. 南京:东南大学出版社,2008:13-17.

[2] 张艳云,艾力·斯木吐拉. BP神经网在新疆货运量预测中的应用[J]. 运输与物流,2011(17):144-147.

[3] 许银甲. 公路货运量预测的系统动力学模型构建[J]. 交通科技与经济,2007,9(6):95-97.

[4] 赵闯,刘凯. 基于广义回归神经网络的货运量预测[J]. 铁道学报,2004,26(1):12-15.

[5] 徐优丽. 基于神经网络的物流需求预测[J]. 浙江树人大学学报,2008(1):56-58.

[6] 飞思科技产品研发中心. MATLAB6.5辅助神经网络分析与设计[M]. 北京:中国统计出版社,2003:64-69.

[7] 高宁,邵陆寿. 基于MATLAB的BP神经网络在农作物预报中的应用[J]. 计算机与农业,2003(7):16-18.

人工神经网络分析法范文3

中图分类号:R2-03 文献标识码:A 文章编号:1005-5304(2013)04-0103-05

由于中医诊断主要根据医生的经验来决定,因此,在临床施治过程中存在较大的主观性和不确定性等问题。在中医诊断领域引进数据挖掘技术,不但符合现在多学科交叉发展的潮流,在解决实际问题上,无疑也是中医客观化进程中的又一催化剂。作为一门融合人工智能、机器学习和数理统计等方法的新型学科技术,数据挖掘在克服人类本身认知和思维长度的基础上,充分利用海量临床数据,通过模拟临床诊断推理过程来挖掘临床诊断数据中繁杂的证、症关系,对寻求中医专家的辨证规律有重要价值。目前,在该领域涉及到的数据挖掘方法较多,主要有贝叶斯网络、人工神经网络、粗糙集理论、关联分析、决策树、聚类分析、判别分析、支持向量机、多标记学习、随机森林等。笔者现对这些方法的相关应用综述如下。

1 常见数据挖掘方法

1.1 贝叶斯网络

贝叶斯网络是通过简明的图形方式结合统计理论来定性表示变量间复杂因果或概率关系的一种数据分析方法,包括网络集和概率集两部分。该方法具强大的执行高效推理任务的功能,能充分利用先验知识,而使其在诊断领域的应用价值极大。在解决中医定量诊断问题上,其体现出的功能主要表现在:揭示众多症症之间以及症与证间的复杂关系,探究证候的主要症状和次要症状,定量确定其诊断价值,这有助于确定证候诊断的标准和规范,而且建立的证候诊断模型以概率形式给出诊断结果,能有效辅助专家作出决策。因此,该方法对促进中医诊断学发展所做的贡献不可忽视。张氏等[1]对255例肺癌患者证候以症状之间的关联性及关联强度为基础,利用贝叶斯网络概括出了肺癌的证候要素,包括病机要素9个、病位要素5个及病机要素之主要症状与次要症状。曲氏等[2]对611例抑郁症患者的中医证候进行了研究,采用贝叶斯网络对抑郁症中医症状进行评定,发现拟定的中医证型包含了抑郁症的核心症状和周边症状的不同组合方式,体现了抑郁症临床多变的证候特点。范氏等[3]对收集到的1512例类风湿关节炎(RA)患者的临床数据采用基于聚类的贝叶斯网络模型,提取出了RA的7项主特征及4型的类特征,为中医辨证分型及RA中医诊断标准提供了临床依据。龚氏等[4]对2501例2型糖尿病的临床数据运用该方法分析,发现空腹血糖异常患者及糖化血红蛋白异常患者均以阴虚热盛多见,而餐后2 h血糖异常患者则以阴虚多见。王氏等[5]应用此方法通过分析474例血瘀证临床诊断数据进行血瘀证定量诊断,发现了血瘀证的7个关键症状,并与此同时建立“是否血瘀证”的分类器模型,经交叉验证发现此分类器诊断准确率达96.6%。郭氏等[6]认为,证候的复杂性表现为证候各因素之间的高维高阶性,他们运用贝叶斯网络技术对肺系疾病证候构成因素之间关联形式进行了研究,发现各因素间的联结形式是线性相关与非线性相关并存的,它们相互交织,形成复杂的网络结构,表现出典型的非线性特征。

1.2 人工神经网络

人工神经网络是在对人脑神经网络结构认识理解的基础上人工构造的新型信息处理系统。目前的神经网络模型有:用于分类、预测和模式识别的前馈式神经网络模型,用于联想记忆和优化计算的反馈式神经网络模型,以及用于聚类的自组织映射方法。其中前馈式神经网络模型是目前应用最广泛的神经网络之一。对于将其应用于中医诊断领域,陈氏[7]认为,中医学辨证施治本质上就是对众多数据信息进行处理并提取规律的过程,而人工神经网络恰恰具备较好获得数据规律的能力。人工神经网络模型的优势主要体现于其黑箱结构,这赋予人工神经网络强大的非线性拟合能力,使其能够任意精度逼近非线性函数。

但不足的是,在中医研究中,人工神经网络不能进行变量筛选,对其得到的结果也只是局部最优而非全局最优。如李氏等[8]对142例脾气虚弱及肺脾气虚证HIV/AIDS患者的主要实验指标、四诊信息的主要症状和舌象运用Clementine中的特征选择节点进行筛选,建立脾气虚弱和肺脾气虚的人工神经网络模型,发现该模型能较好地诊断艾滋病患者脾气虚弱和肺脾气虚证型,其样本模型训练集诊断的正确率和测试集诊断的正确率分别为87.25%和80.00%。傅氏等[9]认为,运用数据驱动模式建立中风人工神经网络模型,将为进行繁杂多变的中风证候的动态研究、掌握证候的动态演变规律及在不同时点进行疗效评价提供一个新的探索方向。许氏等[10]通过对心血管疾病中医临床信息数据库中的临床信息和证候类别之间的关系进行分析,发现人工神经网络尤其是OCON网络对该病常见的中医证型的识别率最高,其中心气虚证和心阳虚证分别高达92.4%、82.9%。有研究运用人工神经网络分析RA、糖尿病肾病(DN),分别建立RA和DN证候的BP网络模型,并采用三倍交叉验证的方法,发现这2种模型平均诊断准确率分别为90.72%、92.21%[11-12]。余氏[13]通过文献资料和临床资料收集选用人工神经网络等方法开展2型糖尿病证候诊断标准模型建立及对比研究,所建模型在临床数据测试样本的正确辨识率为73%。

1.3 粗糙集理论

粗糙集理论主要用于分析研究不完备数据,这是继概率论、模糊集、灰色理论之后又一个刻画不确定、不完备系统的有力数学工具。基于其具有能有效处理各种不确定、不完备信息的强大能力,有研究者认为将其用于分析中医症状-辨证要素间相关性,建立定性定量标准,有很大前景[14]。其最大优点在于不需要问题所需处理数据之外的任何先验信息,能够在保留关键信息的前提下求得知识的最小表达式。因此,将粗糙集理论引入中医,运用到中医诊断上,将可能是实现中医诊断智能化的又一个发展方向。

陈氏等[15]以450例老年人细菌性肺炎患者在就诊过程中的285项指标为研究对象,采用粗糙集方法对已经过初始数据处理的各数据进行挖掘分析,得到7种中老年肺炎的证候诊断标准,为疗效评价指标提供了客观依据。陈氏等[16]从与原发性高血压相关的古今医案中收集237例病案,对其症状和体征进行数据预处理,运用基于粗糙集理论的KDD决策分析系统Rosetta软件约简病证属性,获取到了原发性高血压肝阳上亢证的专家知识,为进一步研究原发性高血压肝阳上亢证奠定基础。刘氏[17]运用粗糙集理论对脾胃系疾病的证候诊断进行相关研究,建立了可进行辨证分型的计算机软件,并通过这一软件量化标准来判断患者所属证候,为治疗脾胃系疾病辨证提供可靠依据。谢氏[18]建立了一个基于粗集理论的中医诊断专家系统模型,以模拟中医专家诊断的过程。秦氏等[19]把粗糙集应用于中医类风湿证候诊断,并在类风湿病的各证候诊断上应用。

1.4 关联分析

在数据挖掘方法中,关联分析常用来挖掘特征之间或者数据之间的相互依赖关系,对给定的事务数据库找出满足最小支持度和最小置信度的关联规则。与其他数据分析方法不同的是,关联规则的引入,可以从大量貌似繁杂症与证的数据中,找到隐形的关联,极大促进中医诊断学的发展;并且其所得结果清晰有用,同时支持间接数据挖掘;可处理变长的数据,为寻找诊断数据中的隐性关联带来了方便,其计算的消耗量也可以预见[20]。

肖氏等[21]设计了一种基于遗传算法的正相关关联规则挖掘算法,发现胃部不适症状与处方、证候重要关联关系。陈氏等[22]通过对400例肝硬变患者进行关联分析,找出符合最小支持度和最小置信度并形成规则的中医证候气滞/气郁证和血瘀证,这表明肝硬变和气滞证、血瘀证之间关联度非常高。钟氏等[20]采用关联规则的分析算法,探求胃炎症状与“中虚气滞”辨证之间的关系,得到在中虚气滞证中,口干欲饮这个症状对辨证的影响最大。

1.5 决策树

决策树算法是一种逼近离散值函数的方法,常用来形成分类器和预测模型,是建立在信息论基础之上对数据进行分类的一种方法。岳氏[23]通过选取300例确诊为小儿肺炎患者的数据为基础,成功构建了基于决策树算法的小儿肺炎指纹辨证分类模型,准确率达84.5%。钟氏等[20]从中医胃炎数据中筛选出“中虚气滞”的病历,通过决策树,以“中虚气滞”为目标属性,根据病历中症状辨证是否与目标属性相同设置“yes”和“no”两值,再通过设置的训练样例运用ID3算法构建决策树,以判断未知中医证型的病例是否归属“中虚气滞”。查氏等[24]将397例已确诊活动期RA患者随机分为中药和西药治疗组,通过对其初诊中西医症状及检查结果采用决策树进行证病信息和疗效的相关关系探索,得出可从证候信息的角度获得药物治疗的最佳适应证,从而实现个体化治疗。徐氏等[25]对406例慢性胃炎病例用bootstrap抽样扩增,采用基于信息熵的决策树c4.5算法建立中医辨证模型,测试集模型分类符合率为81.25%。

1.6 聚类分析

聚类分析的实质就是聚集数据成类,使类间的相似性最小,而尽可能增大类内的相似性。其优点是:作为一种探索性的统计分析方法,聚类分析方法可以在对数据没有先验知识的情况下对数据资料进行分类,根据数据的内在相似或相关程度,可使得类别内数据“差异”尽可能小,类别间“差异”尽可能大,对中医药领域中的症状组合规律、证候规律等方面的研究具有一定的推动作用。但由于中医证候复杂程度较大,聚类分析在解决这些问题时存在的局限性表现在:①多结果,主观性大。此分析方法无法根据数据内部特点自主确定分为几类,需要研究者依据其学科知识和经验来确定到底聚为几类、聚到哪一类为最佳;此外,选择不同的类间距离和变量间距离的定义方法,结果将大有不同,因此,多次尝试、反复分析对于此类分析方法来说是必须的。②单分配,即变量只能被聚到某一类。在研究症状的聚类问题时,中医的一个症状常需要能被聚到不同的类中,但聚类分析只能将一个症状归入某一个类别里面。

李氏等[26]应用系统聚类的方法对276例乙肝后肝硬化的症状、体征进行分析研究,得出乙肝后肝硬化基本中医证候有湿热内蕴证、肝肾阴虚证、肝郁脾虚证、脾虚湿盛证、脾肾阳虚证、血瘀证、气(阳)虚证共7类。卢氏等[27]通过制定“中医证候临床观察表”,对106例儿童中间型β地中海贫血患者进行中医证候调查,采用聚类分析等统计学方法得出广州地区中间型β地中海贫血患儿中医证候分布特点为气血两虚证>肝肾阴虚证>脾肾阳虚证>阴阳两虚证,这为进一步规范化辨证论治提供了一定依据。何氏等[28]采用临床流行病学的方法,对143例冠心病PIC术后患者的症状、体征等临床资料进行了聚类分析,得出冠心病PIC术后患者证候分为气虚痰浊、肾虚血瘀、肝气郁结、脾气亏虚、心气亏虚、气阴亏虚共6类。黄氏等[29]应用变量聚类分析的数理统计方法,对慢性疲劳综合征(CFS)进行了中医辨证分型,并对收集到的237例CFS患者的症状、舌象和脉象等临床资料进行了变量聚类分析,得出变量聚类分析能帮助CFS在中医证候中合理分为精髓空虚、阴液亏虚、脾肾阳虚和肝火亢盛共4型,解释比例为61.68%。

1.7 判别分析

与其他统计学方法不同的是,判别分析的主要目的是建立一个线性组合,使其可用最优化的模型来概括分类之间的差异。该方法常用来根据已知数据的分类情况判断未知待分析数据的归属问题等,在证候的研究方面应用最广。

胡氏等[30]根据所收集的413例亚健康失眠患者的中医证型对证候变量进行逐步判别分析,建立判别函数式,得出亚健康失眠中医证型判别函数与临床诊断吻合良好,逐一回代法判别总一致率达81.1%。夏氏等[31]对77例慢性再生障碍性贫血(CAA)患者进行辨证分型分组,应用逐步判别分析方法建立CAA中医证型判别方程,筛选出了与判别方程最相关的6个免疫学和血常规指标。郦氏等[32]以脑梗死中医证型标准化研究结果为基础,采用逐步判别分析,建立了脑梗死各证型与观察指标间的数学判别方程。赵氏等[33]对收集符合RA诊断标准的患者按照辨证对变量进行逐步判别分析,建立了一个具有较好的判别效果的判别模型。薛氏等[34]选用已进行频数分析的文献207篇进行肝病证候的判别分析,认为肝郁脾虚证辨证标准难以脱离疾病特点。

1.8 支持向量机

支持向量机是基于统计学习和结构风险最小化原则的学习机器,可以通过核函数将低维输入空间的数据特征投射到高维数据控件,并求得最优分类的超平面。该算法的关键思想是利用核函数把一个复杂的分类任务映射,使之转化成一个线性可分问题。在许多实际学习问题中,它允许扩大的空间维数非常大,在某些情况下可能无穷大,能较好地解决小样本、非线性、高维数和局部最小等问题。支持向量机方法较适用于中医诊断数据的现状和对中医临床经验的总结。

徐氏等[35]以中医心系503个样本为例,利用支持向量机进行中医心系证候分类研究,结果表明,该方法在证候分类中能达到较高的准确率。王氏等[36]以名医诊治冠心病典型医案115例建立冠心病名医诊疗数据库,运用支持向量机方法提取到名医诊治冠心病8个主要证候要素并确定其定量诊断,阐释了证候要素应证组合规律。殷氏等[37]对舌诊数据进行主成分提取,分别建立Logistic回归和支持向量机模型,发现在小样本情况下支持向量机模型更优,敏感度达92.8%,特异度达92.3%。杨氏等[38]精选1个家系虚寒证的相关基因信息,选择间接比较实验方案进行基因芯片实验,对5例虚寒证和5例正常人差异表达基因的表达值进行建模,使用支持向量机、K近邻分类法等方法,将家系中其他人样本带入,发现其能够正确判别。在舌象诊断鉴别上,谢氏[39]依据支持向量机理论,以径向基函数作为核函数构造多分类分类器,将舌象的特征参数作为输入样本,对病证进行分类,并以肝病病证分类做了仿真。

1.9 多标记学习方法

与其他分类方法不同的是,多标记学习方法的每个研究对象不再对应于单一的概念标记,而是由单个示例(属性向量)表示并对应于多个概念标记,即一个样本和多个类标相关联。鉴于现实社会涉及到的很多真实对象往往都具多语义、多分类目标性,如疾病的证候、证型,待分类的文档、网页,生物信息学中的基因等,因此,多标记学习方法的成熟对促进这些领域的发展也就显得十分重要。然而该方法存在的一个主要问题是不能充分利用各训练样本所含概念标记之间的相关性,从而有效提高学习系统的泛化能力;此外,由于其存在复杂程度较大,运用该方法进行研究尚存在降维方法和特征选择方法较少的不足。

针对中医临床证候兼夹的多标记特点,研究人员首次将多标记学习算法引入到中医问诊的客观化研究。该研究将多标记学习结合频次分析,应用于冠心病的问诊证候模型建立,有效提高了诊断模型的识别率;在此基础上,还结合中医数据特点,提出了多标记学习算法(REAL),并结合信息增益等特征选择方法,挑选出常见证候的20个最优特征,显著提高了慢性胃炎的证候的识别率[40-41]。邵氏等[42]运用多标记学习结合混合优化的特征选择算法(HOML),用于冠心病中医问诊数据分析,建立了中医冠心病数据模型,并获得了冠心病问诊症状的最优特征子集。

1.10 随机森林

随机森林是决策树算法的一种改进,其综合思想是组合多棵bootstrap样本建立的决策树的预测,通过投票给出有效的错判率估计、分类器强度、相关性和变量的重要性等指标。该方法对每个被分析的数据都给出了重要性的评分,在某种程度上有利于有效的特征变量的挑选,降低数据维度。随机森林作为一种自然的非线性建模工具,具有很高的预测准确率,能很好地容忍异常值和噪声,不易出现过拟合,降低分类错误率;也不会出现在bootstrap样本中的OOB数据,还能为样本提供一个数据内部估计,可用来高效估计组合分类器中的泛化误差,有助于理解分类精度以及如何提高精度。

洪氏等[43]通过引入随机森林方法,对《慢性疲劳(CF)中医临床症状分级量化表》中的95个症状进行数据编码,选取CF常见证候要素的主要症状并衡量症状对各证候要素的贡献程度,得到了CF脾虚证、心虚证、肝郁证以及气虚证4个证候要素的症状集,将各症状集作为模型输入,各模型预测准确率分别为96.13%、94.75%、95.89%、94.26%。邹氏等[44]借用特定脾虚证临床数据集证明基于特征提取的分类集成模型比其他集成方法具更低的错误率,认为特征提取在降低错误率上作出了明显的贡献,但其结果是否适用于其他小样本数据尚未证实。王氏等[45]通过文献调研,推测使用随机森林提取亚健康关键症状或指标可帮助亚健康状态的判断。

2 讨论

中医临床诊断数据存在的一个显著特点是证候夹兼、数据多而繁杂、各数据之间的关系藏而不现。因此,借助现代化的信息技术手段,综合运用数理统计分析方法以进一步挖掘四诊以及证候之间的隐性关联具有重要意义。然而,在数理统计方法研究发展正处于高峰期的信息化时代,如何根据待分析的数据库的特点选择正确恰当的方法是当前数据挖掘首先要考虑的问题。

一个样本量较大的数据库,当需要进行一定的数据分类时,可能有必要对上述方法进行探索。聚类分析可满足对数据进行一定的症状的组合、证候规律的挖掘;若是在已知数据的分类情况下需要对待分析数据进行分类,判别分析恰有这方面的优势;决策树则在实现数据分类挖掘过程中的可视化方面凸显其优势;随机森林可在决策树的基础上进一步提高有效特征变量的提取率,同时还能避免数据预处理过程中的过拟合现象。当然,在临床数据分析过程中也经常出现数据样本量较小、维度较高等现象,支持向量机方法在中医领域的引进则为这些数据的分析带来新的契机。除了对数据进行分类挖掘外,数据之间的关联讨论也是数据分析必不可少的,尤其在中医诊断中探讨各症、证之间的关联领域的应用;在隐性关联分析的众多分析方法中,多标记学习法有效解决了证候夹兼的现象;粗糙集理论有利于建立定量定向标准;人工神经网络在识别证型上主要体现其强大的非线性拟合能力;此外,在探究症与证关系上,贝叶斯网络还是诊断领域的常用之法,该方法还可帮助我们进一步探讨症状集中的主次症。

总之,集各种数据挖掘方法之长于一体来对某一数据库进行挖掘分析将为中医界数据挖掘技术的成熟带来不可预料的进展。目前,大部分数据挖掘方法都只是被单一采用,即使有同时运用多种挖掘方法进行数据分析,也只是对某一数据系统运用多种方法相互比较,所获得的结果效用度较小。多重方法相互交融、相互补充、综合运用于某一数据分析系统中的研究在在中医领域尚不很成熟,或许可以成为数据挖掘在中医药研究中的进一步的模式和规则,为数理统计在中医药知识的创新和发展中开辟一条新的途径。

参考文献:

[1] 张霆,陈波,马胜林,等.基于贝叶斯网络的肺癌证候研究[C]//庆祝浙江省中西医结合学会成立三十周年论文集粹.杭州:浙江省中西医结合学会,2011:50-52.

[2] 曲森,启盛,包祖晓.贝叶斯网络模型在中医证候研究中的应用[C]//世界中联第三届中医、中西医结合老年医学学术大会论文集.北京:世界中医联合会,2010:61-63.

[3] 范建平,李常洪,吴美琴,等.贝叶斯网络在中医诊断中的应用研究[J].管理科学学报,2008,11(6):143-150.

[4] 龚燕冰,倪青,高思华,等.Ⅱ型糖尿病主要理化指标与中医证候相关性的贝叶斯网络分析[J].中华中医药杂志,2010,25(1):3l-33.

[5] 王学伟,瞿海斌,王阶.一种基于数据挖掘的中医定量诊断方法[J].北京中医药大学学报,2005,28(1):4-7.

[6] 郭蕾,王学伟,王永炎,等.论高维高阶与证候的复杂性[J].中华中医药杂志,2006,21(2):76-78.

[7] 陈伟青.浅论人工神经网络在中医学上的应用[J].河南中医学院学报, 2004,19(11):12-13.

[8] 李玉森,施学忠,杨永利,等.人工神经网络在HIV/AIDS患者主要虚证诊断中的应用[J].中华中医药杂志,2012,27(5):1269-1271.

[9] 傅勤慧,裴建,惠建荣,等.中风证候动态研究现状与展望:数据与模型驱动模式的应用[J].中西医结合学报,2011,9(12):1292-1300.

[10] 许朝霞,王忆勤,颜建军,等.基于支持向量机和人工神经网络的心血管疾病中医证候分类识别研究[J].北京中医药大学学报,2011,34(8):539-543.

[11] 白云静,申洪波,孟庆刚.基于共轭梯度下降算法的类风湿性关节炎BP神经网络症候模型研究[J].中国中医药信息杂志,2010,17(3):96-97.

[12] 白云静,申洪波,孟庆刚,等.基于人工神经网络的中医证候非线性建模研究[J].中国中医药信息杂志,2007,14(7):3-4.

[13] 余学庆.基于智能计算的2型糖尿病中医证候诊断方法研究[D].北京:北京中医药大学,2007.

[14] 晏峻峰,朱文锋.粗糙集理论在中医证素辨证研究中的应用[J].中国中医基础医学杂志,2006,12(2):90-93.

[15] 陈楚湘,沈建京,陈冰,等.运用粗糙集理论建立中老年肺炎中医症候诊断标准[C]//第二中国控制会议论文集.上海:中国自动化学会控制理论专业委员会,2010:40-42.

[16] 陈素玲,付爽,高云,等.基于粗糙集理论的原发性高血压肝阳上亢证辨证系统的建立[J].山东中医药大学学报,2010,34(3):201-203.

[17] 刘泉.粗糙集在脾胃系疾病中医辨证中的应用研究[D].武汉:湖北中医学院,2008.

[18] 谢国明.基于粗集理论的中医诊断模型的建立[J].数理医药学杂志, 2005,18(4):302-304.

[19] 秦中广,毛宗源,邓兆智.粗糙集在中医类风湿证候诊断中的应用[J].中国生物医学工程学报,2001,20(4):357-363.

[20] 钟颖,胡雪蕾,陆建峰.基于关联规则和决策树的中医胃炎诊断分析[J].中国中医药信息杂志,2008,15(8):97-99.

[21] 肖光磊,陆建峰,李文林,等.正相关关联规则及其在中医药中的应用[J].计算机工程与应用,2010,46(6):227-233.

[22] 陈明,杨慧芳,余蕾.基于关联规则的肝硬变辨证数据挖掘研究[J].河南中医杂志,2009,29(3):258-260.

[23] 岳路.决策树算法在小儿肺炎中医临床诊断中的研究与应用[D].济南:山东大学,2011.

[24] 查青林,何羿婷,喻建平,等.基于决策树分析方法探索类风湿性关节炎证病信息与疗效的相关关系[J].中国中西医结合杂志,2006,26(10):871-986.

[25] 徐蕾,贺佳,孟虹,等.基于信息熵的决策树在慢性胃炎中医辨证中的应用[J].中国卫生统计,2004,21(6):329-331.

[26] 李毅,刘艳,寇小妮,等.乙肝后肝硬化症状学聚类研究[J].中医药导报,2012,18(2):14-16.

[27] 卢焯明,钱新华.以聚类分析法研究儿童中间型β地中海贫血的中医证候分布规律[J].中华中医药杂志,2012,27(3):607-611.

[28] 何庆勇,王阶.基于聚类分析的冠心病介入术后中医证候分类及诊断[J].中医杂志,2008,49(10):918-921.

[29] 黄小波,李宗信,陈文强,等.慢性疲劳综合征的中医证候聚类分析[J].中华中医药杂志,2006,21(10):592-594.

[30] 胡万华,陈克龙,赵娜,等.亚健康失眠患者中医证型的判别分析[J].中医杂志,2012,53(2):142-144.

[31] 夏乐敏,王运律.慢性再生障碍性贫血中医证型判别方程的建立与使用[J].中华中医药学刊,2012,30(2):409-411.

[32] 郦永平,温淑云.脑梗死证型量化分级的判别方程研究[J].中国中医急症,2012,21(1):81-82.

[33] 赵宝利,黄可儿,赵敏.类风湿关节炎中医辨证分型的判别分析[J].中华中医药杂志,2012,27(1):240-242.

[34] 薛飞飞,汪南.基于判别分析的肝病肝郁脾虚证证候特点的文献研究[J].中华中医药杂志,2011,26(6):1260-1263.

[35] 徐,王亿勤,邓峰.基于SVM的中医心系证候分类研究[J].世界科学技术―中医药现代化,2010,12(5):713.

[36] 王阶,吴荣,周雪忠.基于支持向量机的名老中医治疗冠心病证候要素研究[J].北京中医药大学学报,2008,31(8):540.

[37] 殷彬,方思行.脾虚证诊断的数学模型[J].暨南大学学报:自然科学版,2006,26(3):363-367.

[38] 杨丽萍,黄睿,张洛欣,等.用特征功能模块法挖掘一个虚寒证家系的基因表达谱[J].中华中医药杂志,2010,25(5):683-685.

[39] 谢铮桂.基于多分类支持向量机的中医舌诊诊断的研究[J].计算机与数字工程,2008,36(11):60.

[40] Liu GP, Li GZ, Wang YQ. Modelling of inquiry diagnosis for coronary heart disease in TCM by using multi-label learning[J]. BMC Complementary and Alternative Medicine,2010,10:37.

[41] Liu GP, Yan JJ, Wang YQ, et al. Application of multi-label learning using the relevant feature for each label (REAL) algorithm in the diagnosis of chronic gastritis[J]. Evidence- Based Complementary and Alternative Medicine,2012,6:3-5.

[42] 邵欢,李国正,刘国萍,等.多标记中医问诊数据的症状选择[J].中国科学:信息科学,2011,41(11):1372-1387.

[43] 洪燕珠,周昌乐,张志枫,等.基于随机森林法的慢性疲劳证候要素特征症状的选择[J].中医杂志,2010,51(7):634-638.

[44] 邹永杰,周继鹏,王桂香,等.基于特征提取的分类集成在脾虚证诊断中的应用[J].计算机应用与软件,2010,27(3):22-25.

人工神经网络分析法范文4

关键词:配电网 规划 经济 负荷预测

配电系统安全、可靠、经济的运行,一方面关系到电力公司的经济效益,另一方面对于满足人们生活和经济发展需要,提高用户的满意度和树立良好的公司形象有着重要意义,同时可以最大限度地节约国家基建投资,促进国民经济健康发展,提高其他行业的经济和社会效益,因而其重要性不可低估。因此,对配电网规划问题进行研究,以期最大限度地提高规划质量,具有重大的现实意义。

1配电网规划存在的问题

随着国家大力加强对城乡电网建设与改造的投入,配电网的发展取得了巨大成就。配电网的供电可靠性逐年提高,配电线路的回路数量大幅度增加,供电半径大大缩短,设备的健康状况取得了较大的提高,在技术改造和技术进步方面积累了一定的经验。但由于国民经济的发展迅速,用电负荷需求量猛增,对供电的质量和可靠性要求也逐渐提高,普遍出现城乡电网不能充分满足各方面要求,电网严重过负荷的现象。并且由于各种原因城乡网建设严重滞后电源建设和负荷的发展,电网有电送不进、供不出、用不上的现象非常严重。这表明城乡电网己成为制约用电市场进一步扩大的瓶颈,影响到国民经济的发展,加速城乡电网建设与改造己经是当前电力工业的急迫任务。

在我国电力工业发展的过程中,长期以来存在着“重发轻供”的倾向,致使大多数配电系统网架薄弱。具体表现为:1)配电系统建设明显滞后于城市建设和发输电系统的建设;2)网架薄弱,供电不合理,有些地方存在“有电送不出”的现象;3)供电质量差,可靠性低,损耗高;4)配电自动化程度低;5)电压等级低,致使变电站布点和馈线布线都存在困难。

2配电网规划的一般思路及方法

电力系统规划的推动力是负荷的增长和变化。用户负荷的增加和变化必然会引起低压和中压配电系统的变化,这就使得输电系统也要作相应的变动。配电网规划的作用在于剖析当前规划区域内电网运行状况,在考虑经济效益的前提下,合理分布上级电源,选取最优的网架建设方案,提高线路可转供电能力,清理改造残旧设备及线路,保证电网安全稳定运行。一般而言,配电网规划主要内容包括:现状电网分析、电力负荷预测及变电站布点结果、规划原则、配电网建设项目及估算投资、规划方案评估、结论和建议等,其中电力负荷预测在配电网规划当中尤为重要。

2.1现状电网分析

配电网规划的第一步是现状电网分析,只有了解电网的现状,才能有针对性的对其进行改造。电网规划工作不仅需要大量有关社会经济发展的历史数据及其分析,还需对电力供需现状进行深入的调查,同时也要对社会经济发展有比较全面的认识和准确的把握。在明确配电网供电接线方式、供电能力、供电设备更新的必要性及可靠性,并考虑经济效益的前提下制定合理的改造目标。供电接线方式多种多样,常见的有放射性供电,单环网供电,两供一备供电,双环网供电等。不同的供电方式适应不同的需求,比如在负荷密度较低的农村地区,我们可以选择放射性线路供电,以节省投资,提高投入产出比;而在负荷密度较高的城区,则比较适合采用单环网供电,以提高供电可靠性,当负荷进一步增长时,则可以考虑两供一备环网供电。

2.2电力负荷预测及变电站布点结果

电力负荷预测是城乡电网规划设计的基础。电力负荷的发展水平是确定供电方案、选择电气设备的主要依据。它关系到规划地区的电源开发、网络布局、网络的接线方式、供电设备的装机容量以及电气设备参数选择等一系列问题的合理确定。在充分考虑一些重要的系统运行特性、增容决策、自然条件与社会影响的条件下,研究或利用一套系统处理过去与未来负荷的数学方法,在满足一定精度要求的前提下,确定未来某特定时刻的负荷数值,称为负荷预测。它包括两个方面的含义:一是未来需求量的预测,即功率;二是未来用电量的预测,即能量。按照负荷预测的周期,一般可分为:(1)近期预测:其预测周期为1-5年,对配电网的增容、规划极为重要。(2)中期预测:其预测周期为6-15年,主要应用于电力系统中期规划。(3)长期预测:其预测周期为16-35年,主要应用于电力系统远景规划。电力负荷行为受许多因素的影响。这些因素大致包括四种类型:经济因素、时间因素、气候因素以及随机干扰。虽然电力负荷受着这许多因素的影响,但负荷仍呈现明显的特征。从时间特性来看,电网负荷具有年间负荷不断增大及年内周期性变化两种特征;从空间特性来看,电网负荷随着用户的增多及区域的扩大,负荷同时率及负荷增长行为的变化是有规律的。

进行负荷预测的一般过程如下:(l)根据实际需要,确定合理、可行的预测内容。(2)广泛收集相关资料,并进行审核和必要的加工整理。(3)对基础资料作初步分析,从中选出有代表性的、可用度高的有关资料,同时将资料中的不良数据进行分析和处理。(4)选择适当的预测模型。可考虑本地区实际情况,采用多种数学模型进行计算,以便对比选择。(5)对多种预测结果综合分析,进行比较、判断和评价,合理修正初步预测结果,确定最终的预测值。负荷预测结果的准确性直接影响到电网的技术经济指标。对电力负荷预测过高,将造成电力设备、资金的积压和浪费,降低了电力投资的经济效益;反之,过低的负荷预测,将导致设备容量过小而不能生产和输送足够的电力,将影响国民经济的发展和人民生活水平的提高。因此,应尽可能提高预测的精度。

负荷预测工作可以从全面和局部两方面进行。一是对全地区总的需要量进行全面宏观预测,以便确定规划年的输配电系统所需要的设备分量;二是对供电区内每个分块(分区)需要量进行局部预测,以确定变电站的合理分布,一般变电站建在负荷中心。负荷预测的方法是多种多样的。目前,人们对它的研究比较深入,方法也很多,如回归分析法、时间序列法、经济计量模型、神经网络、专家系统、模糊预测等。

(1)年平均增长法是负荷预测中常用的一种方法,它是趋势外推法的一种。电力负荷的变化一方面有其不确定性,如气候的变化、意外事故的发生等造成对电力负荷的随机性干扰。另一方面,在一定条件下,电力负荷存在着明显的变化趋势。一旦找到了负荷的变化趋势,按照该变化趋势就能对未来负荷情况作判断。因此可以利用对历史数据的分析,总结出其电量、负荷的发展变化的增长率,同时结合考虑该城市的近、中、远期的规划发展,确定出在规划期间各规划年的增长率,即可得知各规划年的电量和负荷值。

(2)人工神经网络理论是一门新兴的交叉学科,目前正处在迅速发展阶段。人工神经网络是由大量的简单神经元组成的非线性系统,每个神经元的结构和功能都比较简单,而大量神经元组合产生的系统行为却非常复杂。它具有较强的学习能力、计算能力、变结构适应能力、复杂映射能力、记忆能力、容错能力及各种智能处理能力。在人工神经网络的研究领域中,有代表性的网络已达数十种。随着应用研究的不断深入,新的模型也在不断推出。目前研究和应用最多的是四种基本模型,即神经网络、多层前馈神经网络、自组织神经网络和概率神经网络以及他们的改进模型。

(3)灰色系统理论是80年代初由我国学者邓聚龙教授提出并发展的,在灰色理论研究中,将各类系统划分为白、黑和灰色系统。“白”指信息完全已知,“黑”指信息完全未知,“灰”指信息不完全。灰色系统理论将随机量当作是在一定范围内变化的灰色量,将随机过程当作是在一定范围、一定时区内变化的灰色过程。对灰色量不是从找统计规律的角度,通过大样本量进行研究,而是用数据处理即数据生成的方法,将杂乱无章的原始数据整理成规律性较强的生成数列再做研究。基于灰色模型GM(1,N)进行的定量预测称为灰色预测,灰色预测一般不需要大量的时间数据和空间数据,而是根据实际情况选择适量的数据,进行累加生成、建模和预测。

根据负荷预测、城市经济发展状况及用户报装负荷,预测规划年电力需求增长,考虑变电站布点及建设容量。变电站是电能汇集和分配的主要设施,其选址和容量设置在规划中发挥着重要的基础作用。变电站站址应尽可能的选在负荷最密集的地方,这样在变电站出线上可以节省许多投资,并且有效降低线路运行损耗。

2.3配电网规划原则

配电网规划即是采用科学的方法确定何时何地在规划区内新建或改建何种电力设施,力求在规划期末使配电网络达到一个比较理想的结构。理想的网架结构应该满足以下基本要求。

(l)尽量满足用户的用电要求。配电比例适当,容量充裕,在各种运行方式下,都能尽量满足国民经济各部门及人民生活不断增长的用电需求。电力工业的发展速度,应超前于其他部门的发展速度,起到先行作用。应竭力避免由于缺电而使工业企业不能充分发挥其生产能力的情况。

(2)保证用户供电的可靠性。电力系统中发生事故是导致供电中断的主要原因,但要杜绝事故的产生是非常困难的。对于供电中断将会造成重大损失的负荷及重要供电地区,需设置两个或以上独立的供电电源。电源间应能自动或手动切换,以便在任一电源发生故障时,使这类用户的供电不致中断。

(3)保证良好的电能质量。电压支持点多,能在正常及事故情况下保证电网的安全及电能质量。

(4)保证系统运行的灵活性。电网结构应能适合多种可能的运行方式,包括正常及事故情况下,高峰及低谷负荷时的运行方式。在变动运行方式或检修时,应保证操作安全、简便,对通信线路影响小等。

(5)保证系统运行的经济性。配电网直接与用户相连,供电半径大,供电范围广,连接用户多,负荷波动与变化频繁,加上由于主客观原因造成不明线损,使配电网线损量占整个电力系统线损比重很大。因此,加强配电网的经济运行,降低配电网的线损,对提高整个电力系统的经济性有特别重要的意义。

(6)保证网架结构合理。以”简单即可靠”的理念为导向,根据规划区现状网架的特点及理想网架的模式,选取合理的网架结构。一般来说,理想的网架为2-1环网、3-1环网、两供一备、三供一备等,这类网架结构既简单可靠,又经济合理。

2.4配电网建设项目及估算投资

配电网建设项目及估算投资,是在已知电力负荷预测方案和电源建设计划的基础上,为满足电力送出、规划区域供电能力和完善网架结构,提出规划年建设项目方案,论证确定规划水平年最优的电网结构,以保证将电力安全可靠地送至用户,并使电网建设、运行费用最小,方案主要考虑能否有效提高规划区域供电能力,同时必须兼顾考虑建设的经济性。

3地理信息系统在配电网规划中的应用

利用GIS技术,存储地理数据以描述“真实的世界”,并使这个世界真实的再现于设计者眼前,同时对将人工智能技术与地理数据结合,有效的利用GIS的空间分析功能与网络分析功能,使配电系统规划更准确、更经济,而且设计标准化,加速了设计的过程。在GIS环境下利用计算机进行配电网规划的综合方法,协调实现三个功能:空间负荷预测、长期配网规划、短期配网规划,其中,长期配网规划从长远观点来看是为短期配网规划确立一个方向,短期配网规划则必需确定设备的容量、尺寸以及地理上和电力结构上的精确位置。在实现空间负荷预测和长期规划时采用了GIS空间数据模型,在实现短期规划时采用了点-线数据模型。国外利用GIS技术已实现自动化配电网规划,如可随时根据负荷要求得出需要新增线路的最佳路径及最佳导线截面,即实现负荷报装自动化。

4以电力负荷预测为基础,搞好配电网规划

电网建设既属于城市基础建设的一部分,又是保证一个地区建设和发展的重要产业,因此在电网开发建设过程中应提高电力负荷预测的精度,负荷预测的精确度将直接影响到配电网规划中电源的布点以及目标网架的结构和规模。因此负荷预测在方法上要求具备很强的科学性,在结果上既要求具有前瞻性又要具有精确性。采用能反映电力负荷客观规律和发展趋势的科学方法,以现状负荷水平为基准,预测将来负荷的发展。以便更准确的把握电力需求变化,将投资落在最有效益的地方。

参考文献

[1] 陈为邦.对新时期我国城市规划若干问题的探讨[J].城市规划学刊,2004,(06):7-10.

[2] 王涛.电力系统配电网规划面对的新问题探究[J].科技视界,2012,(24):293-294.

[3] 杨育泽.配电网规划研究杨育泽[J].科技资讯,2012,(18):137.

[4]沈道义,杨振睿.智能配电网供电模式与优化规划研究展望[J].华东电力,2012,(08):1395-1398.

人工神经网络分析法范文5

【关键词】配电网;负荷预测;规划信息

一、配电网负荷预测的方法分析与研究。

1)单耗法。单耗法分为产品单耗法和产值单耗法,可用于计算工业用户的负荷预测,通过对过去的单位产值耗电量进行详细地统计分析,结合产业结构调整寻找相关规律,预测规划第一、第二、第三产业的综合单耗,根据国民经济和社会发展规划指标,按单位产值耗电量进行预测,近期预测效果较佳。其优点是方法简单,对短期负荷预测效果较好。缺点是需要进行大量细致的调研分析工作,表现形式笼统,很难反映出现代经济、政治、气候等条件的影响。

2)电力弹性系数法。电力弹性系数分为电力生产弹性系数和电力消费弹性系数,是指年用电量(或年最大负荷)的年平均增长率与国内生产总值年平均增长率的比值,需要掌握今后国内生产总值的年平均增长速度,再依靠过去各阶段的电力弹性系数值,分析变化趋势,选用适当的电力弹性系数(一般大于1)。由于它是一个宏观指标,与各省、各地区的国民经济结构及发展有关,各省及地区需对本省、本地区的电力弹性系数资料进行统计分析,找出相对适合的电力弹性系数发展趋势。其优点是方法简单、易于计算;缺点是需做准确的调研工作和经济发展预测,人的主观影响大。

3)负荷密度法。负荷密度是指单位面积的用电负荷数,是一个反映城市和人民生活水平的综合指数。主要用于法定图则和详细蓝图规划阶段的负荷预测,根据对不同规模城市的调查,用每平方公里面积用电负荷来测算城镇负荷水平。它的关键是单位建筑面积负荷取值,并根据用电负荷特点进行分类取值。通常来说,城市的经济和电力负荷趋于一种不连续(跳跃式)的发展状态,而负荷密度法则是比较直观的一种方法。

4)分类负荷预测法。根据用途不同,常将负荷划为工业用电、农业用电、生活用电和其它用电等四类,并分别进行预测,相加后乘系数即能得到。优点是可以快速地发现其增长趋势的不正常情况,并能对各类负荷进行预测,所以总的负荷结果比较明确;而缺点则是,统计信息的搜集工作庞大复杂,不易于短期快捷处理。

5)趋势分析法。根据已知的历史资料拟合一条曲线,用以反映负荷本身的增长趋势,根据增长趋势曲线,在曲线上估计未来某一点的负荷预测值,通常很多情况下它确实能得出较好的预测结果,基本上是一种确定的外推。在处理历史资料、拟合曲线并得到模拟曲线的过程中,完全不必考虑随机误差,适用于中、长期负荷预测。

6)回归分析法。又叫统计分析法,是目前广泛应用的一种定量预测方法。通过对影响因子值和用电的历史资料的拟合,用回归分析建立两者之间的函数关系,然后就能够预测用电,需要建立人口与居民用电、各产业同各产业用电的关系,采用政府部门提供的人口及经济规划指标,预测对应年度的售电量值。但是,选用该法在某些情况下会受到限制,这是因为选用何种因子和该因子系用何种表达式有时只是一种推测,而且会影响用电因子的多样性和某些因子的不可测性。

7)组合分析法。它将几种预测方法所得的预测结果选取适当的权重进行加权平均的预测方法或在几种预测方法中进行比较,选择拟合优度最佳或标准离差最小的预测方法。其中,等权平均组合预测法不需了解单一预测值的预测精度及误差间的相互关系,方法简单,是在对各种预测方法的预测精度完全未知的情况下,所采取的一种较稳妥的方法。方差-协方差组合预测法则是在不知道各预测精度的条件下所采用的一种组合预测方法,在能够了解到各单独预测值的预测精度的情况下。

8)灰色预测方法。以单数列的微分方程为基础,得到各类灰色预测方案,将微分方程渗透到局势决策与经典的运筹学的规划中,建立灰色决策系统,将已建立的关联度、关联度空间包括在内,即可将灰色预测方法应用于系统分析、信息处理(生成)、预测、决策以及控制等领域。其优点是适应性强、应用面广,建模时不需计算统计特征量,可以适用于任何非线性变化的负荷指标预测;缺点是微分方程指数解较适合有指数增长趋势的负荷指标,对其它趋势的指标则拟合灰度较大,精度提高难。

9)人工神经网络模型。目前,这种新技术应用

多的是带有隐层的前馈型神经网络,通常由输入层、输出层和若干隐层组成。误差反传训练算法是对多层感知器最简单、最实用的一种,实质是一梯度算法,将各种有关的数据作为输入,通过历史样本的训练收敛后便可进行预测。小波神经元则是近两年结合小波变换与人工神经元网络思想而成的一种数学建模方法,通过对小波分解进行平移和伸缩变换后得到的级数,并形成小波函数网络,具有小波分解的一般逼近函数的性质。以上新技术的优点是能够智能化处理,以及其学习和自适应功能,但有难以科学确定网络结构、学习速度慢、存在局部极小点、记忆不稳定性等缺陷。

二、配电网规划信息的分析

开展配电网规划工作,目的是在小区负荷分布预测结果的基础上,科学地确定各级电压配电网的变电所位置及容量、变电所的供电区域、配电网的网络接线模式、线路的走径及导线型号、配电网无功电源配置方案等。这是一项非常复杂、庞大的工程,所以需要开发一种研制方便、实用的具有智能决策功能的配电网规划管理决策系统,而以gis系统为基础平台为用户提供日常规划的综合管理平台十分符合需求。它的模块化设计由两大部分组成,即规划信息管理部分和规划设计决策部分。其中,规划信息管理部分包括综合管理模块、地理信息模块、电网信息模块、统计查询模块、数据接口模块等;规划设计决策部分则包括了配电网规划及网络分析模块、专家决策模块等。

1)规划信息管理部分。通常需要开展以下工作,即收集、组织、检索并再开发相关数据信息;将数字信息生动化、形象化,这需要利用图形和多媒体技术;建立提示和帮助系统;对软件的各个功能模块进行规范,使其能够独立应用;为便于多方工作人员参与规划工作,推广使用计算机网络技术。

2)规划设计决策部分。gis数据库的信息管理部分基本完善或完成后,利用gis系统强大的空间数据处理能力和网络的拓扑分析功能,工作人员可以用来处理配电系统大部分与空间有关的信息,然后进行配电网的规划及决策分析。

人工神经网络分析法范文6

关键词:理论发展,仪器发展,影响,机遇与挑战

Abstract: the engineering survey study field both relative stability, it is ever-changing. Engineering measurement in all aspects continuously development, directly to the improvement of people's living environment, improve people's quality of life play an important role. Engineering measurement are constantly meet opportunities and challenges, this paper will discuss with you all in the engineering survey of development, and the opportunities and meet challenges.

Keywords: theory development, instrument development, influence, challenges and opportunities

中图分类号:[TU198+.2]文献标识码:A文章编号:

一.工程测量理论的发展

1. 测量平差理论

最小二乘法广泛应用于测量平差。最小二乘配置包括了平差、滤波和推估。附有限制条件的条件平差模型被称为概括平差模型,它是各种经典的和现代平差模型的统一模型。测量误差理论主要表现在对模型误差的研究上,主要包括:平差中函数模型误差、随机模型误差的鉴别或诊断;模型误差对参数估计的影响,对参数和残差统计性质的影响;病态方程与控制网及其观测方案设计的关系。观测值粗差的研究促进了控制网可靠性理论,以及变形监测网变形和观测值粗差的可区分性理论的研究和发展。针对观测值存在粗差的客观实际,出现了稳健估计(或称抗差估计);针对法方程系数阵存在病态的可能,发展有了偏估计。

2. 工程控制网优化设计理论和方法

网的优化设计方法有解析法和模拟法两种。解析法是基于优化设计理论构造目标函数和约束条件,解求目标函数的极大值或极小值。一般将网的质量指标作为目标函数或约束条件。网的质量指标主要有精度、可靠性和建网费用,对于变形监测网还包括网的灵敏度或可区分性。对于网的平差模型而言,按固定参数和待定参数的不同,网的优化设计又分为零类、一类、二类和三类优化设计,涉及到网的基准设计,网形、观测值精度以及观测方案的设计。在工程测量中,施工控制网、安装控制网和变形监测网都需要作优化设计。由于采用GPS定位技术和电磁波测距,网的几何图形概念与传统的测角网有很大的区别。

3. 变形观测数据处理

工程建筑物及与工程有关的变形的监测、分析及预报是工程测量学的重要研究内容。其中的变形分析和预报涉及到变形观测数据处理。但变形分析和预报的范畴更广,属于多学科的交叉。

(1) 变形观测数据处理的几种典型方法

根据变形观测数据绘制变形过程曲线是一种最简单而有效的数据处理方法,由过程曲线可作趋势分析。如果将变形观测数据与影响因子进行多元回归分析和逐步回归计算,可得到变形与显著性因子间的函数关系,除作物理解释外,也可用于变形预报。多元回归分析需要较长的一致性好的多组时间序列数据。

如果对一个变形观测量(如位移)的时间序列,通过建立一阶或二阶灰微分方程提取变形的趋势项,然后再采用时序分析中的自回归滑动平均模型ARMA,这种组合建模的方法,可分性好且具有以下显著优点:将非平稳相关时序转化为独立的平衡时序;具有同时进行平滑、滤波和推估的作用;模型参数聚集了系统输出的特征和状态;这种组合模型是基于输出的等价系统的理想动态模型。

(2) 变形的几何分析与物理解释

传统的方法将变形观测数据处理分为变形的几何分析和物理解释。几何分析在于描述变形的空间及时间特性,主要包括模型初步鉴别、模型参数估计和模拟统计检验及最佳模型选取3个步骤。变形监测网的参考网、相对网在周期观测下,参考点的稳定性检验和目标点和位移值计算是建立变形模型的基础。变形模型既可根据变形体的物理力学性质和地质信息选取,也可根据点场的位移矢量和变形过程曲线选取。

(3) 变形分析与预报的系统论方法

用现代系统论为指导进行变形分析与预报是目前研究的一个方向。变形体是一个复杂的系统,它具有多层次高维的灰箱或黑箱式结构,是非线性的,开放性(耗散)的,它还具有随机性,这种随机性除包括外界干扰的不确定性,此外,还具有自相似性、突变性、自组织性和动态性等特征。

系统论方法还涉及变形体运动稳定性研究,这种稳定性在数学上可转化为微分方程稳定性的研究,主要采用李亚普诺夫提出的判别方法。

二.工程测量仪器的发展

1.专用仪器是工程测量学仪器发展最活跃的,主要应用在精密工程测量领域。其中,包括机械式、光电式及光机电(子)结合式的仪器或测量系统。主要特点是:高精度、自动化、遥测和持续观测。

2.高程测量方面,最显著的发展应数液体静力水准测量系统。这种系统通过各种类型的传感器测量容器的液面高度,可同时获取数十乃至数百个监测点的高程,具有高精度、遥测、自动化、可移动和持续测量等特点。两容器间的距离可达数十公里,如用于跨河与跨海峡的水准测量;通过一种压力传感器,允许两容器之间的高差从过去的数厘米达到数米。

3. 与高程测量有关的是倾斜测量(又称挠度曲线测量),即确定被测对象(如桥、塔)在竖直平面内相对于水平或铅直基准线的挠度曲线。各种机械式测斜(倾)仪、电子测倾仪都向着数字显示、自动记录和灵活移动等方向发展,其精度达微米级。

三.新技术、新设备在工程测量中的影响作用

激光准直测量系统有激光束准直和波带板激光准直,前者受激光束漂移的影响,准直距离一般在十米范围内,准直精度一般为 1/10万左右。后者采用三点测量方法,削弱了激光束漂移的影响,准直精度可达 1/100万左右。激光准直测量系统的探测器采用CCD和PSD光电位置传感器,提高了探测的采样率和灵敏度。激光准直测量系统已在大型汽轮发电机组、电子加速器、大型机械设备等安装和检修中进行轴线测量。静力连通管高程测量系统采用电容、电感等位移传感器自动探测液面位置,可以得到高精度的基准平面,主要应用于大型柴油机、设备安装平台的水平面测量。

原来大坝变形监测中的引张线、波带板激光准直、垂线和连通管等观测方法得到发展和应用,在计算机控制下多个测点装置连成一个系统,并实现了观测自动化、观测数据的自动传输和预处理。

变形观测数据的处理和分析方法,除回归分析法和有限元分析法外,时间序列分析法、频谱分析法、卡尔曼滤波分析法、小波分析法以及人工神经网络分析法也已在一些工程变形监测中应用。工程建筑物的变形观测和数据分析,对了解工程建筑物的变形规律,预计可能出现的变形量,使工程建筑物在安全运行下更好发挥效益以及进行工程维护有着重要作用。

在地下工程和某些特殊的场合需要高精度的方向测量,高精度陀螺经纬仪的发展,全自动化测量过程,可以在数分钟内完成得到3-5秒的高精度定向。手持式激光测距仪可以在建筑工地替代普通钢尺的距离测量。在高耸建筑物施工中,使用高精度天顶天底投点仪、激光铅直仪,进行轴线测量,保证轴线的铅直方向。在大面积平整场地中,如飞机场施工,使用激光扫平仪进行水平测量。在矿山、隧道等地下工程施工中使用断面仪进行断面测量等。

四.机遇与挑战

1.高超的外语水平近年来,我国的对外开放不断扩大,特别是入世以来,我国经济与世界经济更加紧密相连,人才的流动、市场的竞争,将给工程建设注入新的活力,提供良好的发展机遇。国内人士在境外承担工程建设项目或在境内承担外资、合资企业工程建设的机会越来越多,外国公司在我国承揽工程项目的情形也将不足为奇。中国人与外国人的接触与交往日益频繁,而注册测量师制度的推行,更有利于测量人员走出国门、走向世界,扩大对外交流与合作。

2.娴熟的计算机应用能力计算机是20世纪科学技术发展的结晶, 21世纪是网络的时代、信息的世界,计算机正以不同的方式、不同的程度迅速深入到每一个领域、每一个行业、每一个地方和每一个人的生活之中。作为信息科学重要组成部分的测绘科学,与计算机的联系非常紧密,甚至密不可分。从野外数据的采集、内业计算、处理、分析、绘图到信息化管理,都离不开计算机。工程测量技术人员,必须熟练掌握计算机的基本操作,广泛运用计算机进行测量据处理、图形绘制、图像处理、程序设计、系统管理等。积极探索计算机在测绘科学中应用的新方法、新途径,并不断提高自身的计算机应用能力和水平,为各类工程建设提供实时的、可靠的、多维的信息资源。

3.强烈的责任心和紧迫的责任感在工程建设中,测量人员的造假,即编造假数据、假资料,撰写假报告等,或图省时省力,提高效率,或在检查验收中蒙混过关,或为施工单位提供施工方便,无论用心何在,均会给工程建设造成严重的后果。因此,工程测量技术人员必须具备强烈的责任心和紧迫的责任感,要有严肃认真的工作作风,一切从实际出发,事实求是,真正发挥测量人员在工程建设中的“尖兵”和“眼睛”的作用。然而在高科技发展如此迅速的今天,却频频出现楼垮、桥塌、井陷、堤崩等奇闻,无不使人痛心疾首。作为工程测量技术人员,一定要掌握好手中的测。

总结