前言:中文期刊网精心挑选了深度神经网络综述范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
深度神经网络综述范文1
关键词:垃圾邮件;深度置信网络;分类;受限玻尔兹曼机;支持向量机
0 引言
电子邮件的速度快、成本低等优势使其成为人们用于思想和信息交流的强大工具,然而伴随而来的垃圾邮件成为当今网络的一个重要问题[1]。根据Ferris的研究估计,垃圾邮件数量占美国一家企业组织总电子邮件的15%至20%。在这样的情况下,垃圾邮件造成了大量的带宽浪费和邮件系统超载。由于以上严重问题,必须采取措施来解决垃圾邮件现象。已有研究证明最好的方法是垃圾邮件过滤。
通常有两种邮件过滤的方法:知识工程(Knowledge Engineering, KE)以及机器学习(Machine Learning, ML)。基于第一种方法的垃圾邮件过滤通常使用预定义的集合和用户定义的规则,这样的规则尝试识别信息中垃圾邮件的典型特点;然而,已经证明在实践中该方法的泛化能力较差。
实验表明机器学习分类器具有更好的性能,因此大量的分类方法被提出来实现垃圾邮件检测任务。Puniskis等[2]将神经网络方法应用到垃圾邮件分类。也有其他研究人员将朴素贝叶斯法(Naive Bayes, NB)和支持向量机(Support Vector Machine, SVM)[3-9]应用到垃圾邮件分类任务中。深度置信网络(Deep Belief Net, DBN)是拥有深层架构的前馈神经网络,其中包含多个隐含层,而使用DBN的障碍在于如何训练这样的深层网络。通常情况下,由于网络权值的随机初始化,基于梯度的优化容易陷入局部最小值[10]。Hinton等[11]提出了一种新的贪婪逐层非监督算法来初始化基于受限玻尔兹曼机(Restricted Boltzmann Machine, RBM)的DBN。这个算法提供了网络权值的初始化方法,随后使用基于梯度的算法如梯度下降法来微调网络权值。研究指出,DBN初始化方法的有效性在多个数据集中得到验证[12]。
在受限玻尔兹曼机的快速学习算法的驱动下, 本文提出了使用深度置信网络来解决垃圾邮件问题,并且在三个充分研究的垃圾邮件数据集上评价分类方法的性能。将本文的算法和较好的垃圾邮件检测方法支持向量机分类器[13]进行比较,结果表明,基于深度置信网络的方法表现出和SVM相似的性能或者说比SVM更好的性能。
1 深度置信网络分类
人工神经网络(Artificial Neural Network, ANN)研究主要关注的是训练网络来找到正确的权重,可以正确地将输入样本分类。最成功的算法是著名的反向传播(Back Propagation,BP)算法。反向传播的问题是:ANN代表一个f(X,W)的非线性映射,其中:X是输入向量,W是整个网络的权重矩阵。随着网络层数的增加,函数f变得越来越复杂,如此一来将得到多个局部最小值。反向传播算法根据权重W的初始化来收敛到某一最小值,但有时它会收敛到一个表现差的局部最小值而不是全局最小值。对于一些人工智能任务,有些局部最小值是没有问题的,但是有些是不可以接受的。此外,随着网络层数的增加,训练时间变得越来越长。反向传播的另一问题是它需要大量的标签数据,这对于许多需要分类的人工智能任务来说是不可能的。对于之前提到的问题,Hinton等[11]基于DBN和RBM介绍了一种快速学习算法来训练深度人工神经网络。
1.1 深度置信网络模型
DBN由多层RBM和一层BP神经网络构成,它的结构如图1所示。其中,多层RBM网络采用无监督的学习方法,而BP神经网络采用有监督的学习方法。自底向上每一层RBM对输入数据进行提取、抽象,尽可能保留重要信息,将最后一层RBM网络的输出信息作为BP神经网络的输入数据。由于每层RBM训练只能使该层网络参数达到最优,而不能使整个网络达到最优,因此本文使用有监督的BP神经网络将误差反向传播,自顶向下微调整个模型。同时,经过若干层RBM网络优化得到的信息作为BP神经网络的输入数据,解决了BP神经网络由于随机初始值容易陷入局部最小值和收敛速度慢的问题。DBN网络是一种深层学习模型,增加RBM网络的层数,可以使提取的信息更抽象,网络的精度更高。
3.3 实验结果
下面描述DBN和SVM训练的细节以及在三个数据集上的分类性能表现。对于LingSpam,设置k=1500,而对于SpamAssassin和Enron1设置k=1000。对于SpamAssassin,需要去掉其中的HTML标签。三个数据集上的实验都使用10折交叉验证[15]。Lingspam已经被其创建者划分为10份;对于其他两个数据集,随机将语料库拆分成10份,并保证每一部分保留原有语料库的垃圾邮件比例。
为了将DBN应用到垃圾邮件检测,必须决定隐含层个数
以及每层隐含单元的个数的合适值。
根据已有研究,实验选择了比较简单的有3个隐含层的网络[11-12];通过选择不同隐含单元为网络尝试不同的配置,设置三个隐含层的神经元个数分别为50、50、200,每一层神经元的数量适度的变化并没有显著的影响结果。为了强调DBN方法对于不同架构的鲁棒性,本文实验使用相同的架构。
4 结语
通过逐层无监督的学习方法预训练深度网络的权值参数,解决了权值的初始化问题,提出了基于深度置信网络的分类方法,并将其应用到垃圾邮件过滤中。实验结果表明,深度置信网络的分类方法在垃圾邮件过滤中有较好的表现,但是也有一些问题将在今后的工作中继续探讨,例如,如何更好地选择深度置信网络隐藏层数以及每层的单元个数来提高算法的性能。
参考文献:
[1]PU C, WEBB S. Observed trends in spam construction techniques: a case study of spam evolution [C]// CEAS 2006: Proceedings of the Third Conference on Email and AntiSpam. Mountain View, California: CEAS, 2006: 104-112.
[2]PUNIKIS D, LAURUTIS R, DIRMEIKIS R. An artificial neural nets for spam Email recognition [J]. Electronics and Electrical Engineering, 2006, 69(5): 73-76.
[3]ANDROUTSOPOULOS I, PALIOURAS G, MICHELAKIS E. Learning to filter unsolicited commercial Email [M]. Athens, Greece: "DEMOKRITOS", National Center for Scientific Research, 2004.
【谷歌图书查找】
[4]METSIS V, ANDROUTSOPIULOS I, PALIOURAS G. Spam filtering with naive Bayes ― which naive Bayes? [C]// CEAS 2006: Proceedings of the Third Conference on Email and AntiSpam. Mountain View, California: CEAS, 2006: 27-28.
[5]ZHANG L, ZHU J, YAO T. An evaluation of statistical spam filtering techniques [J]. ACM Transactions on Asian Language Information Processing, 2004, 3(4): 243-269.
[6]HOVOLD J. Naive Bayes spam filtering using wordpositionbased attributes [C]// CEAS 2005: Proceedings of the Second Conference on Email and AntiSpam. Palo Alto, CA: CEAS, 2005: 41-48.
[7]FUMERA G, PILLAI I, ROLI F. Spam filtering based on the analysis of text information embedded into images [J]. The Journal of Machine Learning Research, 2006, 7: 2699-2720.
[8]ALMEIDA T A, ALMEIDA J, YAMAKAMI A. Spam filtering: how the dimensionality reduction affects the accuracy of Naive Bayes classifiers [J]. Journal of Internet Services and Applications, 2011, 1(3): 183-200.
[9]ALMEIDA T A, YAMAKAMI A, ALMEIDA J. Evaluation of approaches for dimensionality reduction applied with Naive Bayes antispam filters [C]// ICMLA09: Proceedings of the 2009 International Conference on Machine Learning and Applications. Piscataway: IEEE, 2009: 517-522.
[10]SUN Z, XUE L, XU M, et al. Overview of deep learning[J]. Application Research of Computers, 2012, 29(8): 2806-2810. (孙志军,薛磊,许明阳,等.深度学习研究综述[J]. 计算机应用研究, 2012, 29(8): 2806-2810.
[11]HINTON G E, OSINDERO S, TEH YW. A fast learning algorithm for deep belief nets [J]. Neural Computation, 2006, 18(7): 1527-1554.
[12]BENGIO Y, LAMBLIN P, POPOVICI D, et al. Greedy layerwise training of deep networks [C]// NIPS06: Proceedings of the 2007 Twentieth Annual Conference on Neural Information Processing Systems. Cambridge: MIT Press, 2007, 19: 153-160.
[13]BEUGES C J C. A tutorial on support vector machines for pattern recognition [J]. Data Mining and Knowledge Discovery, 1998, 2(2): 121-167.
深度神经网络综述范文2
关键词: 粒子群优化算法; 神经网络; 体育动作; 识别与分类
中图分类号: TN711?34 文献标识码: A 文章编号: 1004?373X(2016)19?0049?04
Abstract: In order to improve the recognition accuracy of sports action, a sports action recognition model based on particle swarm optimizing neural network is proposed. The background subtraction method is used to process the sports video image to obtain the profile of sports action, segment the sports action, and extract the features of sports action. The kernel component analysis is performed for features. The BP neural network is used to train the feature vector. The particle swarm optimization algorithm is used to select the parameters of BP neural network to establish the recognition classifier of sports action. The test results show that the proposed model can improve the recognition rate of sports action and reduce the false recognition rate of sports action, and meet the online recognition requirement of sports action.
Keywords: particle swarm optimization algorithm; neural network; sports action; recognition and classification
0 引 言
随着经济水平不断增长,人们越来越重视体育运动,而动作是体育运动的基本行为,对体育动作进行正确识别和分析,有利于规范运动员的动作和科学训练,提高运动员成绩,因此对体育动作识别进行研究具有十分重要的意义[1?3]。
体育动作识别是多分类的模式识别问题,包括两个关键问题:体育动作特征和体育动作的分类[4]。体育动作特征有侧影和轮廓两种类型,侧影特征维数高,使得体育动作的分类器输入向量数量过大,计算时间复杂度较长,不能满足体育动作的在线识别要求[5?7]。相对于侧影特征,轮廓特征能够更好地刻画体育的动作类别,常采用傅里叶变换获得体育动作轮廓特征,特征数量越多,越不利于体育动作的分类和识别,需要对轮廓特征进行降维处理,选择一些重要特征进行体育动作识别建模[8]。体育动作识别的分类器主要采用神经网络设计,尤其BP神经网络的分类性能最优,应用最广泛[9]。在体育动作分类过程中,BP神经网络的初始阈值和连接权值影响识别率,当前主要根据经验设置初始阈值和连接,难以获得最优BP神经网络结构。
为了获得更加理想的体育动作识别结果,提出粒子群优化神经网络的体育动作识别模型(PSO?BPNN),并通过具体实验测试体育动作识别结果的优劣。
1 PSO?BPNN的体育动作识别模型
1.1 工作思路
PSO?BPNN的体育动作识别思路为:通过傅里叶变换获得体育动作的特征,采用核主成分分析(KPCA)选择重要特征;然后采用粒子群优化算法选择BP神经网络的初始阈值和连接权值,并对选择重要特征进行学习,建立体育动作识别的分类器,具体如图1所示。
1.2 体育动作检测
在体育动作识别过程中,首先要检测出运动员的动作,结合运动员的动作特点,采用帧间差分法实现动作检测,并对检测结果进行膨胀、腐蚀轮廓强化等处理,具体如下:
1.5.2 粒子群优化算法
要获得性能优异的体育动作识别分类器,确定合理的BP神经网络的初始权值和阈值,采用粒子群优化(PSO)算法解决初始权值和阈值确定问题,以获得更优的体育动作识别效果。
(2) 采用KPCA对体育动作的原始特征进行处理,选择对识别结果有重要贡献的特征。
(3) 根据选择特征对体育动作训练集和测试样本进行简化。
(4) 将简化后的训练样本集输入到BP神经网络中进行学习,并通过粒子群优化算法确定BP神经网络的阈值和连接权值。
(5) 根据最优阈值和连接权值建立BP神经网络的体育动作识别分类器。
(6) 将简化后的测试样本集输入到已建立的体育动作识别分类器中进行测试,并输出识别结果。
2 实验结果与分析
为了检验PSO?BPNN的体育动作识别性能,在4核 2.75 GHz Intel CPU,8 GB RAM,Win7 OS的个人计算机上采用VC++编程实现识别模型。选择10个运动员,他们演示各种简单体育动作,共得到600个数据,随机选择400个数据构建训练集,其余数据构建测试集,基本动作如图3所示。对比体育动作识别模型为:KPCA选择特征,BPNN的初始阈值和连接值随机确定(KPCA?BPNN);全部原始体育动作特征,粒子群算法优化BPNN的初始阈值和连接值(BPNN),采用体育动作识别率和平均一个动作的识别时间(s)作为性能评价指标。
采用训练样本构建体育动作识别模型,然后采用测试样本进行测试,它们的识别率如图4所示,从图4可以得到如下结论:
(1) 相对于KPCA?BPNN,PSO?BPNN的体育动作识别率更高,有效降低了体育动作的误识率,这表明KPCA?BPNN采用随机方式确定BPNN的初始阈值和连接值,无法构建结构最优的BP神经网络,这样体育动作分类器没有达到最优,难以获得理想的体育动作识别结果,从而验证了PSO算法优化BP神经网络的有效性。
(2) 相对于BPNN,PSO?BPNN提高了体育动作的识别率,这表明体育动作原始特征中有一些重复特征和无用特征,它们会对体育分类器构建产生不利影响,这样体育动作的识别结果有待改善,而PSO?BPNN采用KPCA选择一些重要特征,同时解决了特征选择和分类器参数优化问题,使体育动作的识别结果更加可靠。
经常要进行体育视频动作的在线识别,因此采用测试实验分析体育动作的识别速度,PSO?BPNN与其他模型的体育动作平均识别时间如表1所示。从表1的体育动作平均识别时间可知,PSO?BPNN的体育动作平均识别时间要少于KPCA?BPNN以及BPNN,这是因为PSO?BPNN采用KPCA选择重要特征,降低了体育动作分类器的输入维数,加快了体育动作识别的建模速度,同时采用PSO算法确定BP神经网络的阈值和连接权值,加快了BP神经网络的收敛速度,提高了体育动作的识别效率,更好的满足了实际应用要求。
3 结 语
针对当前体育动作识别建模中的分类器参数优化问题,提出PSO?BPNN的体育动作识别模型,采用测试实验验证了其有效性,结果表明,PSO?BPNN找到了体育动作识别的重要特征子集,PSO算法可以确定BPNN的最佳阈值和连接权值,获得了比其他体育动作识别模型更高的识别率,执行时间缩短,加快了体育动作识别速度,可以为体育教学、训练提供有价值的参考信息。
参考文献
[1] 周巧云,于仕琪.运动体育动作分析[J].先进技术研究通报,2009,3(5):47?51.
[2] 阮涛涛,姚明海,瞿心昱,等.基于视觉的人体运动分析综述[J].计算机系统应用,2010,20(2):245?253.
[3] CHEN L, HOEY J, NUGENT C D, et al. Sensor?based activity recognition [J]. IEEE transactions on applications and reviews, 2012, 42(6): 790?808.
[4] 黎洪松,李达.人体运动分析研究的若干新进展[J].模式识别与人工智能,2009,22(1): 70?78.
[5] 苗雪兰.体育动作量化分析智能系统的设计与实现[J].体育科学,2000,20(3):85?87.
[6] 张毅,张烁,罗元,等.基于Kinect深度图像信息的手势轨迹识别及应用[J].计算机应用研究,2012,29(9):3547?3550.
[7] 曹雏清,李瑞峰,赵立军,等.基于深度图像技术的手势识别方法[J].计算机工程,2012,38(8):16?18.
[8] 刘寅,滕晓龙,刘重庆.复杂背景下基于傅里叶描述子的手势识别[J].计算机仿真,2005,22(12):158?161.
[9] 苗雪兰.基于模糊神经网络理论的体育动作模式识别方法[J].计算机工程与应用,2006(6):155?157.
[10] 王萧.基于KPCA的探地雷达自适应杂波抑制算法研究[J].现代电子技术,2014,37(11):31?33.
[11] 张玲,王玲,吴桐.基于改进的粒子群算法优化反向传播神经网络的热舒适度预测模型[J].计算机应用,2014,34(3):775?779.
深度神经网络综述范文3
关键词:数据挖掘;体育训练;决策树ID3
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)22-5492-04
Application Review and Analysis of Data Mining Techniques in Sport Training
XU Jian-min, OU Mu-hua, XIONG Jin-zhi
(Computer College, Dongguan University of Technology, Dongguan 523808, China)
Abstract:With the continuous development of sports, most sports are using IT to access and accumulate. Faced with a huge database and fierce competition in the game, the data mining technology in the field of sports will become a trend. This study focuses mainly on the implementation of the various algorithms based on the data mining, which investigates the algorithm based on decision tree classification applied to tennis, the algorithm based on BP neural network, and the FP-tree algorithm based on association rules. Finally, on the basis of the above method, the study analyzes the direction of improvement to and possible drawbacks of the decision-making ID3 algorithm, and provides a way of research of data mining which will be applied to sports.
Key words: data mining; sports training; decision tree ID3
目前体育数据信息的分析通常采用常规统计方法:抽样理论、假设检验、决策理论、估计理论、时间序列等[1],大多数统计分析技术都要求完善的数学理论和严谨的使用技巧,对使用者要求很高,且大多属于抽样研究,存在不同程度的丢失信息现象。此外,传统统计方法很难挖掘出数据资料的潜在规律。随着近年来体育领域数据增多,各种指标的体质监测数据,各种各类体育竞技比赛数据等越来越多,形成海量数据[2]。与此同时,计算机应用技术在存储、模拟分析数据方面有着很明显的发展潜力。于是,如何在海量数据中寻找各种因素间的相互关系、发现它们之间的变化规律,进而对数据深入分析就成为了计算机的重要发展方向之一。因此,数据挖掘技术的研究和应用成为体育科学研究中不可或缺的内容之一。
该文首先介绍数据挖掘的定义和基本方法,其次综述数据挖掘技术在国内外体育训练的应用情况,最后在此基础上经过对方法和研究方向的分析,提出未来数据挖掘技术在体育训练上的研究方向。
1数据挖掘的基本方法
数据挖掘作为一门跨学科的应用技术,它涵盖了统计学、机器学习、人工智能、模糊数学等诸多科学领域,形成了根据具体任务而进行数据分析以及知识萃取的方法体系。同样,对于相同的问题也可以根据不同的应用领域特点选择不同的算法。比如,处理描述性挖掘任务有数据特征化和数据区分等概念抽象和数据汇总概要处理;预测性挖掘任务因目标变量属性的不同有分类和预测方法。
数据挖掘的方法主要有:
1)分类:按照分析对象的属性分门别类加以定义,建立类组。
2)回归:是使用一系列的现有数值来预测一个连续数值的可能值。
3)预测:根据对象属性的过去观察值来估计该属性未来的值。
4)聚类:是将一组数据按照相似性和差异性分为几个类别,其目的是使得属于同一个类别的数据间的相似性尽可能大,不同类别中的数据间的相似性尽可能小。
5)关联:是要找出在某一事件同时出现的事件。主要是要找出:如果甲因素出现在某一事件的一部分,则乙因素也出现在该事件中的机率有多大。
数据挖掘常用的技术主要有决策树、遗传算法、聚类分析、神经网络技术、关联规则等[3-4]。
1)决策树
一种用树枝状展现数据受各变量的影响情况的分析预测模型,根据对目标变量产生效应的不同而制定分类规则,它是建立在信息论基础之上,对数据进行分类的一种方法。它首先通过一批已知的训练数据建立一棵决策树,然后采用建好的决策树对数据进行预测。决策树的建立过程是数据规则的生成过程,因此这种方法实现了数据规则的可视化,其输出结果容易理解,精确度较好,效率较高,因而较常用。常用的方法有分类及回归树法、卡方自动交互探测法等[3]。
2)遗传算法
一种新的最佳化空间搜索方法,它应用算法的适应函数来决定搜索的方向,运用一些拟生物化的人工运算过程进行一代又一代的周而复始的演化,求得一个最佳结果。特点是具有强固形与求值空间的独立性。强固形使问题的限制条件降到最低,并大幅度提高系统的容错能力;而求值空间的独立性则使遗传算法的设计单一化,且适用于多种不同性质、领域的问题。将遗传算法运用于数据挖掘,可以开采出与众不同的信息,是别的算法所不能替代的。
3)聚类分析
聚类分析是将数据对象分成类或簇的过程,使同一簇中的对象之间具有很高的相似度,而不同簇中的对象高度相异。一个好的聚类方法会最大化类内的相似性,最小化类间的相似性。主要聚类方法有:划分算法、层次算法、基于密度的方法、基于网格的方法、基于模型的方法。
4)神经网络技术
一种模仿人脑思考结构的数据分析模式,由输入变量或数值中自我学习并根据学习经验所得的知识不断调整参数,以期得到资料的模式。是建立在自学习的数学模型基础之上,它可以对大量复杂的数据进行分析,并能完成对人脑或计算机来说极为复杂的模式抽取及趋势分析。神经网络的处理过程主要是通过网络的学习功能找到一个恰当的连接加权值来得到最佳结果。比较典型的学习方法是回溯法。通过将输出结果同一些已知值进行一系列比较,加权值不断调整,得到一个新的输出值,再经过不断的学习过程,最后该神经网络得到一个稳定的结果。
5)关联规则
关联规则挖掘就是从大量的数据中挖掘出有价值描述数据项之间相互联系的有关知识。关联规则主要应用在商业数据库中:商品分类设计、降价经销分析、生产安排、货架摆放策略等。关联规则主要反映了一个事物与其他事物之间的相互依存性和关联性。给定一个事务集D,挖掘关联规则的问题就变成如何产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则问题。
2数据挖掘在体育领域中的应用
2.1数据挖掘国内外研究情况
1)数据挖掘在体育训练国内研究的情况
查阅中国期刊中文数据库,硕士博士论文中,涉及到体育数据挖掘的体育科研论文内容主要有:体育教学、学生体质调研、运动训练监控、临场比赛优化、体育信息管理等的数据挖掘研究以及优化数据挖掘工具在体育领域的应用研究。
杨双燕、赵水宁比较全面地介绍了数据挖掘技术在学生体质调研、体育产业、竞技体育、体育决策管理中的应用方向[5]。高洪歌通过对优秀运动员参加的国际比赛中的各项技战术参数,然后运用关联规则、聚类分析和基于马尔代夫过程的数据挖掘算法,揭示了隐含于数据中的很多信息[6]。孟宪明、凌培亮从视野和步长等方面对人工鱼群算法进行改进,并提出基于该算法的乒乓球技战术分类规则数据挖掘模型,分析顶级乒乓球运动员比赛实例,结果表明与乒乓球技战术关联规则数据挖掘相比,该模型在挖掘质量和挖掘效果上有较大优势[7]。龚明波,钟平中通过对通过球队进球、射门、射门命中率、角球等11项攻防技术指标进行主成分分析的基础上,确定球队技战术能力聚类的综合指标,形成聚类样本。在此基础上,引入模拟人类视觉系统的尺度空间理论,提出了基于尺度层次空间聚类的球队技战术分类方法[8]。陈健、姚颂平以CBA联赛为背景运用关联规则得出核心运动员的得分与球队获胜的关联度,核心运动员的上场时间和关联度等[9]。
2)数据挖掘在国外体育领域中的应用现状
在新世纪初美国NBA的教练运用IBM公司提供的DM工具Advanced Scout能在比赛中辅助教练员林场决定队员替换方案,取得了很好地效果。此后,NBA球队从各方面广泛使用该系统来优化他们的战术组合。
美国国家曲棍球联盟与IBM建立了一个合资公司,推出了电子实时比赛计分和统计系统NHL-ICE.该软件可以让教练、播音员、记者及球迷共同利用NHL各类数据,使用NHL-ICE挖掘各自所需的信息。
意大利运用数据挖掘技术开发了Data Volley软件系统,实现了排球比赛的技战术统计分析。
2.2决策树算法的应用
决策树是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。分类(Classification)任务就是通过学习获得一个目标函数(Target Function),将每个属性集x映射到一个预先定义好的类标号y。分类任务的输入数据是纪录的集合,每条记录也称为实例或者样例。
决策树算法最具影响和最为典型的算法的主要是ID3算法。ID3算法的基本思想:以信息熵为度量,用于决策树节点的属性选择,每次优先选取信息量最多的属性,亦即能使熵值变为最小的属性,以构造一颗熵值下降最快的决策树,到叶子节点处的熵值为0。此时,每个叶子节点对应的实例集中的实例属于同一类[10]。
2.3神经元网络的应用
BP算法的基本思想是:学习过程分为两个部分:信号正向传播和误差的反向回传。信号从正向传播时,输入数据从输入层进入,经过各级隐层网络依次逐层处理,传递到输出层,如果输出层输出的结果和期望不相符或者差距很大,那么将误差值当做调整的信号一次各层向着相反的方向传回来,通过作用神经元之间的连接权矩阵,使误差减小。经过不断的学习,最后使得误差减小到可以接受的范围以内。具体的算法步骤如下:
1)从训练数据集中取出某一样本数据,将信息录入到神经网络中的输入端。
2)根据各个节点间的连接情况正向逐层的处理后,可以得到神经网络的输出数据。
3)计算网络输出的数据值与期望输出的数据值的误差。
4)把误差逐层按照相反的方向传回到之前各层网络,并且按照一定的原则将误差信号的值作用到连接的权值上,使整个神经网络的连接权值误差越来越小。
5)将数据集输入—输出样本逐一重复以上步骤,直到整个样本集的误差减小到可以接受的范围。
目前国内有学者将BP神经网络技术应用到研究体育生化指标对竞技的影响[12]。他们采用采用BP神经网络,输入的神经元个数为4个,隐含层5个神经元,输出1个神经元。经研究得到的结论是:
1)BP神经网络精确度比较高,预测结果清晰地预测了运动员竞技能力和比较科学的预测了运动员的未来发展趋势。
2)在体育训练中,运用BP神经网络模型对运动员生化指标数据可以预测运动员竞技成绩并且对指导教练员选拔运动员有一定的科学帮助。
2.4关联规则
数据关联是数据库中存在的一类重要的可被发现的知识。若两个或多个变量的取值之间存在某种规律性,就称为关联.关联分析的目的是找出数据库中隐藏的关联网[13]。
设I={i1,i2,…,im}是项的集合。关联规则:形如A => B的蕴涵式,其中A?I , B?I ,并且A∩B =?。支持度:P(AUB),即A和B这两个项集在事务集D中同时出现的概率.置信度:P(B I A),即在出现项集A的事务集D中,项集B也同时出现的概率.如果一条关联规则同时满足最小支持度阈值和最小置信度阈值,那么就认为它是有趣的,并称为强关联规则。给定一个事务集D,挖掘关联规则问题就是产生支持度和可信度分别大于用户给定的最小支持度和最小可信度的关联规则[14]。
3分析
3.1各种常用方法的适用范围及不足
基于数据挖掘决策树分类方法即ID3方法,比较简单明了,它构建树的步骤简单,在属性不多的情况下人为就可建立,实用性非常强。
基于数据挖掘关联规则方法的乒乓球技战术分析系统可以根据乒乓球比赛的实战数据结果进行统计分析,应用关联规则中的FP-growth算法,深入挖掘选手A和选手B在各项技术的比拼,切磋过程中的弱项和强项,也就是选手A与选手B进行比赛时哪些技战术会让自己得分,运用哪些技战术会使自己失分。不仅有利于自身选手在体育训练中加强自己的薄弱环节,并且在自己水平有限的情况下和某个个体选手对决时可以充分发挥自己的强项,尽量避免使自己失分的弱项,这样可以把握形势的主动权,取得更好的成绩。所以数据挖掘在体育训练方面的应用可以挖掘众多体育信息中潜在的规律,使体育训练和比赛朝着理性化和精确化的道路发展,故数据挖掘在体育方面产生的影响是举足轻重的。
将乒乓球比赛技战术分析做成一个实用、有效的软件,广泛的被各个乒乓球队使用,作为为教练做出正确的分析和决策提供一个参考,使教练的意见和训练更加的客观,使体育比赛更加的科学精准[11-12]。
不过这种方法有一定的不足:
1)比如如果只录入一场比赛,那么数据的说服力和准确度都会下降。并且在这种不完全数据的统计中技术水平往往也和现场情况选手的压力、体能情况和发挥息息相关。
2)就是FP-tree关联规则本身具有一定的误差。源于它是以支持度-置信度为基础的关联规则挖掘方法,在理论上缺乏严格的理论证明和基础。在阈值参数设定缺乏客观标准时就将其直接应用到客户细分中,可能会产生一些误导。
基于关联规则本身的局限,我们有必要开发更好的算法,克服这些不足,在发现规则的同时需要更多的数据,更深层次的联系才行。
3.2对基于决策树ID3算法的思考
决策树ID3算法通过学习建立一棵决策树。在生成决策树的时候,通常采用信息增益方法来确定生成每个节点时所应选择的合适属性,也就是通过选择具有最高信息增益的属性作为测试是否合适做当前属性的方法。目的是为了将划分后的获得的训练样本进行分类所需要信息最小。也就是利用该属性进行信息划分会使产生的各样本子集中不同类别混合程度降低。因此决策树采用这种规则能够有效减少对象分类所需要的划分次数。
理想的决策树有三种:1)叶子结点数最少;2)叶子节点深度最小;3)叶子结点数最少且叶子节点深度最小。但是这种最优的决策树是NP难题。因此,决策树优化问题是很难解决的。不过可以尽量通过结合实际情况优化算法使数据挖掘的分类更有效[13]。决策树ID3算法在网球的例子中尚可正确执行和得出可行的结论。但是ID3算法有一些不足:1)用户信息的计算比较依赖于特征取值的数目较多的属性,这样不太合理。
2)ID3算法在建树时,每个结点仅含有一个属性,是一种单元的算法,属性特征间的相关性强调的不够充分,无法体现出属性间相互联系的特点。
3)ID3对噪声较为敏感。
4)当数据样本集增加时,ID3的决策树会随之变化。
4结论
该文首先是对国内体育训练中数据挖掘技术的应用状况进行综述,然后对决策树的应用,BP神经网络技术在研究体育生化指标对竞技的影响的应用以及FP-Tree算法在乒乓球比赛技术分析中的应用进行分析,最后对ID3算法和FP-Tree算法提出自己的见解:虽然做成最优的决策树是一个难题,但是我们可以根据自己的经验和实际情况灵活的运用算法,即可在实际应用中取得更好的效果,比如训练人员可以根据天气等情况判定每日是否适合户外训练或比赛;另外,运用关联分析数据挖掘技术可以实现乒乓球比赛中技术运用更加合理、精确;它可以实现对实战中选手自身的技术弱项和强项的挖掘,以及运用哪些技术可以得分或失分,为比赛中技术运用提供了科学的依据。
参考文献:
[1]迟殿委,周兴斌.数据挖掘的体育训练决策支持系统[J].微型计算机,2009(25):190-192.
[2]郝丽,刘乐平.数据挖掘(Data Mining)在体育统计中的应用[J].华东理工学院学报,2004,6(5): 92-95.
[3]胡斐.数据挖掘在体育领域中的应用研究综述[J].科技创新导报,2010(27):211-212.
[4]朱明.数据挖掘[M].2版.合肥:中国科学技术大学出版社,2008.
[5]杨双燕,赵水宁.体育数据中数据挖掘技术的应用研究[J].浙江体育科学,2003,2(30): 49-51.
[6]高洪歌,赵会群.关联规则挖掘在乒乓球比赛技战术分析中的应用[J].北方工业大学学报,2003,18(1): 15-20.
[7]孟宪明,凌培亮.基于人工鱼群算法的乒乓球数据挖掘[J].计算机工程,2010,36(5): 28-31.
[8]龚明波,钟平.尺度空间层次聚类在足球球队技、战术能力分类中的应用研究[J].体育科学,2005,25(1):87-90.
[9]陈健,姚颂平.关联分析在篮球技术统计数据分析中的应用[J].上海体育学院学报, 2009, 33(5):91-94.
[10]栾丽华,吉根林.决策树分类技术研究[J].计算机工程,2004,5(9):95-96.
[11]高洪敏.数据挖掘技术在乒乓球比赛技战术分析中的应用研究[D].北京,北方工业大学,2006.
[12]赵会群,孙晶,花勇民,等.数据挖掘技术在体育比赛技战术分析中的应用研究[J].北京体育大学学报,2008,31(5):712-715.
深度神经网络综述范文4
【关键词】电力系统;故障诊断;研究现状;发展趋势
中图分类号:F407文献标识码: A 文章编号:
引言
电力系统故障诊断是近年来十分活跃的研究课题之一。主要包括系统故障诊断和元件故障诊断两个方向,系统级故障诊断是指通过分析电网中各级各类保护装置产生的报警信息、断路器的状态变位信息以及电压电流等电气量测量的特征,根据保护、断路器动作的逻辑和运行人员的经验来推断可能的故障元件和故障类型的过程。
1国内外研究发展状况
1.1 基于专家系统的诊断方法
专家系统(expert System)利用专家推理方法的计算机模型来解决问题,已获得日益广泛的应用。目前,专家系统用于电力系统故障诊断是比较成功的。根据故障诊断的知识表示和所用推理策略的不同,专家系统主要有两类:
(1)基于启发式规则推理的系统。此类系统把保护、断路器的动作逻辑以及运行人员的诊断经验用规则表示出来,形成故障诊断专家系统的知识库,采用数据驱动的正向推理将所获得的征兆与知识库中的规则进行匹配,进而获得故障诊断的结论。现在大多数故障诊断属于这一类。
(2)结合正、反推理的系统。此类系统结合了正反向混合推理方法,根据断路器和继电保护与被保护设备之间的逻辑关系建立推理规则,同时通过反向推理,有效地缩小可能故障的范围,以动作的继电保护与故障假设的符合程度计算可信度。文献[1]介绍了基于事例推理(CBR)和基于规则推理(RBR)的混合推理的故障诊断专家系统。由于采用了混合推理,提高了故障诊断专家系统的适应性与自学习能力。
基于专家系统的诊断方法的主要特点是可以方便地把保护、断路器的动作逻辑以及运行人员的诊断经验用规则表示出来,并允许在知识库中增加、删除或修改一些规则,以确保诊断系统的实时性和有效性,同时还能够给出符合人类语言习惯的结论,并具有相应的解释能力等,比较适合中小型电力系统和变电站的故障诊断。该方法在实际应用中仍然存在如下主要缺陷:①建立知识库及验证其完备性比较困难;②容错能力较差,缺乏有效的方法识别错误信息;③大型专家系统的知识库的维护难度很大;④专家系统在复杂故障诊断任务中会出现组合爆炸和推理速度慢的问题。这些缺陷使得专家系统难以满足大规模电力系统在线故障诊断的需要,目前主要应用于离线故障分析。
1.2基于人工神经网络的诊断方法
与专家系统相比,基于人工神经网络(ANN—artifieial neural network)的故障诊断方法具有鲁棒性好、容错能力强和学习能力强等特点。
目前应用于电力系统故障诊断的ANN有:基于BP(baekpropagation)算法的前向神经网络和基于径向基函数的神经网络等。文献[1]给出了典型的故障诊断神经网络BP模型,其实现方法是:以电力系统继电保护信息作为ANN的输人,以可能发生的故障作为其输出,选择适当的样本集训练ANN。整个训练过程为:首先根据网络当前的内部表达,对输人样本进行前向计算;然后比较网络的输出与期望输出之间的误差,若误差满足条件,则训练结束,否则,将误差信号按原有的通路反向传播,逐层调整权值和阑值,如此反复,直至达到误差精度要求。文献[2]将大型输电网络分区,对各个区域分别建立基于BP算法的故障诊断网络,然后综合获得最终的故障诊断结果。
基于ANN的诊断方法的主要特点是避免了专家系统故障诊断所面临的知识库构造等难题,不需要推理机的构造。由于用于ANN训练的完备样本集获取困难,目前该方法只比较适合中小型电力系统的故障诊断。ANN方法在故障诊断应用中存在的问题主要是:①其性能取决于样本是否完备,而大型的电力系统的完备样本集获取非常困难;②与符号数据库交互的功能较弱;③不擅长处理启发性的知识;④不知如何确保ANN训练时收敛的快速性和避免陷人局部最小;⑤缺乏解释自身行为和输出结果的能力。以上缺点限制了ANN故障诊断方法在线应用于大型电力系统。如何设计适用于大型电力系统的故障诊断系统,仍然是一个有待进一步研究的问题。
1.3 基于粗糙集理论的诊断方法
粗糙集理论(roughSettheory)是波兰Z.Pawlak教授于1982年提出的一种处理不完整性和不确定性问题的新型数学工具。粗糙集理论的主要思想:在保持分类能力不变的前提下,通过知识约简,导出问题的决策或分类规则。它无需提供问题所需处理的数据集合之外的任何先验信息,能有效地分析和处理不精确、不一致、不完整等各种不完备数据,从中发现隐含知识,揭示潜在规律。鉴于粗糙集理论的优越性,已经有不少研究人员把它引人到故障诊断系统中。
文献[3][4]把粗糙集理论应用于电力系统故障诊断和警报处理,尝试应用粗糙集理论来处理因保护装置和断路器误动作、信号传输误码而造成的错误或不完整警报信号,提出的方法考虑各种可能发生的故障情况,建立决策表(类似于ANN故障诊断的训练样本集),然后实现决策表的自动化简和约简的搜索,删除多余属性后抽取出诊断规则,揭示警报信息内在冗余性。
文献[5]提出了基于粗糙集理论与二元逻辑运算相结合的属性约简算法以及改进的值约简算法,并将其应用于由断路器和保护作为条件属性、故障区域作为决策属性的诊断决策表的约简过程中,利用决策表的约简形成综合混合知识模型。文献[5]提出和构造了四类不同的粗糙集与神经网络(NN)组合的故障诊断模型,给出了粗糙集与NN在四类模型中实现不同的互补性、关联关系、应用机理和原则及相应的局限性。
2 电力系统故障诊断发展趋势
随着电网建设的发展、计算机技术和网络技术以及数学和智能科学理论的发展,不断有新的电网故障诊断方法出现,从电力系统故障诊断理论与方法研究和应用的深度、广度可以清晰地看到,其研究仍停留在理论和模型的探索阶段,基本上没有非常成功的成型实用系统,实用化方面一直未有太大的发展。由于以前技术和设施的原因,导致信息资源比较有限,从发表的文献来看,电网故障诊断系统大多依托于调度端或变电站内,分别利用调度SCADA系统的实时信息或站内综合百动化系统收集的信息来实现;随着系统、计算机和网络技术的发展,以及故障录波专用网络的建设,后来又发展了基于故障录波信息的故障诊断系统。此系统的建设,使诸多的信息孤岛纳入系统中,对故障后所有相关的故障信息,例如保护装置信息、录波器信息、雷电定位信息、监控装置信息等,进行采集、传输、存储和处理,为电网故障处理提供了信息支持。这些宝贵的信息为新的电网故障诊断方法提供了基础,大大拓展了电网故障诊断的研究方向。因此,在电网故障诊断理论的实用化过程中,必须充分重视信息的收集与整理工作,包括用于故障诊断的数据仓库的构建、故障综合信息的预处理和诊断知识的提取等。
3结束语
电力系统故障诊断是关系到电力系统安全稳定运行的重要问题,国内外从20世纪80年代起已经进行了大量的研究工作,提出了多种故障诊断技术和方法,但实际系统中该问题并未很好地解决。随着电力系统规模日趋庞大,结构更加复杂,对电力系统故障诊断提出了更高的要求。本文综述了电力系统故障智能诊断的研究方法,评述了这些方法中需要改进之处,进一步指出了该领域的一些主要发展趋势。它们对构建电力系统故障诊断智能辅助决策系统具有重要的指导意义,对保证电力系统的安全运行、减少事故的经济损失具有重要的理论和现实意义。
参考文献
[1]杜一,张沛超,郁惟墉.基于事例和规则棍合推理的变电站故障诊断系统[J].电网技术,2004,28(l).
[2]YANGH,CHANGW,HUANGC.power system Distributed On line Fault Seetion EstimationUsingDeeisionTreeBasedNeuralNetsApproaeh.IEEETransonPowerDelivery,1995,10(1).
[3]张琦,韩祯祥,文福拴一种基于粗糙集理论的电力系统故障诊断和警报处理新方法[J].中国电力,1998,31(4).
深度神经网络综述范文5
在不平衡电压下PWM整流器的无电流传感器控制策略研究
非平衡电桥数字温度计的设计
英国皇家学会举办非洲科学发展研讨会
回线源瞬变电磁法探测深度的影响因素探讨
厌氧粘接剂在螺栓连接中的应用研究
定量荧光技术在录井油气中的应用
液体容积式流量计容量示值误差的测量结果不确定度
GPSRTK实时动态测量技术的特点与应用浅谈
电力配网线损管理系统的研究与开发
加拿大企业研制出新型太阳能飞艇
基于PLC的液压实验台监控系统的研制及开发
Premiere利用Cool3D搭桥实现烟花制作
欧洲议会联盟力促可再生能源的加速发展
浅析反渗透海水淡化装置高压泵变频控制系统的应用研究
IBM开发高性能计算系统云技术与工程服务
浅谈计算机网络信息和网络安全防护策略
计算机数据库在信息管理中的应用
高职校园网组建设计与实现
中低压配电网络自适应电流保护的研究
视频流应用层组播系统的设计与实现
基于OracleRowID实现批量数据的分页下载
使用PHP动态生成SVG图形
VLAN在嵌入式Linux以太网交换机中的划分与实现
Linux下管道通信的实现
下一代网络(NGN)综述
Cygnal_C8051F020与80C51单片机的区别
物联网技术在动产质押动态监管系统中的应用
基于PROFIBUS-DP现场总线的制造业企业能源监控系统设计——以某机车车辆制造企业为例
一种基于免疫的入侵检测系统框架
个性化网络信息检索方法与技巧探讨
蓄电池化成电源的设计与实现
混沌与混沌电路设计方法的可行性研究
一种用于PPT翻页控制的无线遥控收发电路
微机五防系统在220kV普光变电站的应用
变电站综合自动化系统发展趋势探讨
电力数据的采集与无线传输
关于输配电线路安全运行的措施探析
浅析直流电动机的励磁保护
国内核电反应堆微型精密控制网测量方法介绍
基于数字证书的单点登录技术研究及应用
德国第一个海上风力发电场实现并网发电
CMOS电荷泵锁相环中电荷泵的研究与设计
NS2中随机早期检测算法的优化设计和实现
PWM控制技术及其在调平控制器中的应用
BP神经网络在WSN数据融合中的应用
基于MarcXchange查询处理的优化
太阳能制冷空调进入试用阶段
从“番茄花园事件”谈中国软件业知识产权战略
计算机网络环境下的自主学习策略及模式
基于GPRS/CDMA通信的山洪灾害预警系统的设计
IBM拟用DNA开发下一代芯片
基于组织机构代码数据库信息共享的质监业务信息平台建设
浅谈Excel软件在产品原材料消耗计算中的应用
美研发出新型医用黏合剂
钻井平台电网中高次谐波的危害及抑制措施
酒精装置的自控设计
LPG发动机技术发展展望
深度神经网络综述范文6
关键词: 语音识别; 识别原理; 声学建模方法; 多维模式识别系统
中图分类号: TN912.3?34 文献标识码: A 文章编号: 1004?373X(2013)13?0043?03
Summary of speech recognition technology and its application
YU Lin?lin
(Naval Aviation Military Representative Office Stationed in Beijing, Beijing 100041, China)
Abstract: As a key technology of human?computer interface in information technology, speech recognition has great research significance and broad application value. the development history of speech recognition technology is introduced, the basic knowledge of speech recognition is expounded, such as concept, basic principle, the acoustic modeling approach. The application of speech recognition technology in various fields are briefly introduced.
Keywords: speech recognition; recognition principle; acoustic modeling approach; multi?dimension pattern recognition system
0 引 言
语言是人类相互交流最常用、最有效、最重要和最方便的通信形式,语音是语言的声学表现,与机器进行语音交流是人类一直以来的梦想。随着计算机技术的飞速发展,语音识别技术也取得突破性的成就,人与机器用自然语言进行对话的梦想逐步接近实现。语音识别技术的应用范围极为广泛,不仅涉及到日常生活的方方面面,在军事领域也发挥着极其重要的作用。它是信息社会朝着智能化和自动化发展的关键技术,使人们对信息的处理和获取更加便捷,从而提高人们的工作效率。
1 语音识别技术的发展
语音识别技术起始于20世纪50年代。这一时期,语音识别的研究主要集中在对元音、辅音、数字以及孤立词的识别。
20世纪60年代,语音识别研究取得实质性进展。线性预测分析和动态规划的提出较好地解决了语音信号模型的产生和语音信号不等长两个问题,并通过语音信号的线性预测编码,有效地解决了语音信号的特征提取。
20世纪70年代,语音识别技术取得突破性进展。基于动态规划的动态时间规整(Dynamic Time Warping, DTW)技术基本成熟,特别提出了矢量量化(Vector Quantization,VQ)和隐马尔可夫模型(Hidden Markov Model,HMM)理论[1]。
20世纪80年代,语音识别任务开始从孤立词、连接词的识别转向大词汇量、非特定人、连续语音的识别,识别算法也从传统的基于标准模板匹配的方法转向基于统计模型的方法。在声学模型方面,由于HMM能够很好的描述语音时变性和平稳性,开始被广泛应用于大词汇量连续语音识别(Large Vocabulary Continous Speech Recognition, LVCSR)的声学建模[2?3];在语言模型方面,以N元文法为代表的统计语言模型开始广泛应用于语音识别系统[4]。在这一阶段,基于HMM/VQ、HMM/高斯混合模型、HMM/人工神经网络的语音建模方法开始广泛应用于LVCSR系统,语音识别技术取得新突破。
20世纪90年代以后,伴随着语音识别系统走向实用化,语音识别在细化模型的设计、参数提取和优化、系统的自适应方面取得较大进展[5]。同时,人们更多地关注话者自适应、听觉模型、快速搜索识别算法以及进一步的语言模型的研究等课题[6]。此外,语音识别技术开始与其他领域相关技术进行结合,以提高识别的准确率,便于实现语音识别技术的产品化。
2 语音识别基础
2.1 语音识别概念
语音识别是将人类的声音信号转化为文字或者指令的过程[7]。语音识别以语音为研究对象,它是语音信号处理的一个重要研究方向,是模式识别的一个分支。语音识别的研究涉及微机技术、人工智能、数字信号处理、模式识别、声学、语言学和认知科学等许多学科领域,是一个多学科综合性研究领域[8]。
根据在不同限制条件下的研究任务,产生了不同的研究领域。这些领域包括:根据对说话人说话方式的要求,可分为孤立字(词)、连接词和连续语音识别系统;根据对说话人的依赖程度,可分为特定人和非特定人语音识别系统;根据词汇量的大小,可分为小词汇量、中等词汇量、大词汇量以及无限词汇量语音识别系统。
2.2 语音识别基本原理
从语音识别模型的角度讲,主流的语音识别系统理论是建立在统计模式识别基础之上的。语音识别的目标是利用语音学与语言学信息,把输入的语音特征向量序列[X=x1,x2,…,xT]转化成词序列[W=w1,w2,…,wN]并输出。基于最大后验概率的语音识别模型如下式所示:
[W=argmaxW{P(W|X)}=argmaxWP(W|X)P(W)P(X)=argmaxW{P(X|W)P(W)}=argmaxW{logP(X|W)+λlogP(W)}]
上式表明,要寻找的最可能的词序列[W],应该使[P(X|W)]与[P(W)]的乘积达到最大。其中,[P(X|W)]是特征矢量序列[X]在给定[W]条件下的条件概率,由声学模型决定。[P(W)]是[W]独立于语音特征矢量的先验概率,由语言模型决定。由于将概率取对数不影响[W]的选取,第四个等式成立。[logP(X|W)]与[logP(W)]分别表示声学得分与语言得分,且分别通过声学模型与语言模型计算得到。[λ]是平衡声学模型与语言模型的权重。从语音识别系统构成的角度讲,一个完整的语音识别系统包括特征提取、声学模型、语言模型、搜索算法等模块。语音识别系统本质上是一种多维模式识别系统,对于不同的语音识别系统,人们所采用的具体识别方法及技术不同,但其基本原理都是相同的,即将采集到的语音信号送到特征提取模块处理,将所得到的语音特征参数送入模型库模块,由声音模式匹配模块根据模型库对该段语音进行识别,最后得出识别结果[9]。
语音识别系统基本原理框图如图1所示,其中:预处理模块滤除原始语音信号中的次要信息及背景噪音等,包括抗混叠滤波、预加重、模/数转换、自动增益控制等处理过程,将语音信号数字化;特征提取模块对语音的声学参数进行分析后提取出语音特征参数,形成特征矢量序列。语音识别系统常用的特征参数有短时平均幅度、短时平均能量、线性预测编码系数、短时频谱等。特征提取和选择是构建系统的关键,对识别效果极为重要。
图1 语音识别基本原理框图
由于语音信号本质上属于非平稳信号,目前对语音信号的分析是建立在短时平稳性假设之上的。在对语音信号作短时平稳假设后,通过对语音信号进行加窗,实现短时语音片段上的特征提取。这些短时片段被称为帧,以帧为单位的特征序列构成语音识别系统的输入。由于梅尔倒谱系数及感知线性预测系数能够从人耳听觉特性的角度准确刻画语音信号,已经成为目前主流的语音特征。为补偿帧间独立性假设,人们在使用梅尔倒谱系数及感知线性预测系数时,通常加上它们的一阶、二阶差分,以引入信号特征的动态特征。
声学模型是语音识别系统中最为重要的部分之一。声学建模涉及建模单元选取、模型状态聚类、模型参数估计等很多方面。在目前的LVCSR系统中,普遍采用上下文相关的模型作为基本建模单元,以刻画连续语音的协同发音现象。在考虑了语境的影响后,声学模型的数量急剧增加,LVCSR系统通常采用状态聚类的方法压缩声学参数的数量,以简化模型的训练。在训练过程中,系统对若干次训练语音进行预处理,并通过特征提取得到特征矢量序列,然后由特征建模模块建立训练语音的参考模式库。
搜索是在指定的空间当中,按照一定的优化准则,寻找最优词序列的过程。搜索的本质是问题求解,广泛应用于语音识别、机器翻译等人工智能和模式识别的各个领域。它通过利用已掌握的知识(声学知识、语音学知识、词典知识、语言模型知识等),在状态(从高层至底层依次为词、声学模型、HMM状态)空间中找到最优的状态序列。最终的词序列是对输入的语音信号在一定准则下的一个最优描述。在识别阶段,将输入语音的特征矢量参数同训练得到的参考模板库中的模式进行相似性度量比较,将相似度最高的模式所属的类别作为识别中间候选结果输出。为了提高识别的正确率,在后处理模块中对上述得到的候选识别结果继续处理,包括通过Lattice重打分融合更高元的语言模型、通过置信度度量得到识别结果的可靠程度等。最终通过增加约束,得到更可靠的识别结果。
2.3 声学建模方法
常用的声学建模方法包含以下三种:基于模式匹配的动态时间规整法(DTW);隐马尔可夫模型法(HMM);基于人工神经网络识别法(ANN)等。
DTW 是较早的一种模式匹配的方法。它基于动态规划的思想,解决孤立词语音识别中的语音信号特征参数序列比较时长度不一的模板匹配问题。在实际应用中,DTW通过计算已预处理和分帧的语音信号与参考模板之间的相似度,再按照某种距离测度计算出模板间的相似度并选择最佳路径。
HMM是对语音信号的时间序列结构所建立的统计模型,是在马尔可夫链的基础上发展起来的,它是一种基于参数模型的统计识别方法。HMM可模仿人的言语过程,可视作一个双重随机过程:一个是用具有有限状态数的马尔可夫链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与马尔可夫链的每一个状态相关联的观测序列的随机过程[10]。
ANN以数学模型模拟神经元活动,将人工神经网络中大量神经元并行分布运算的原理、高效的学习算法以及对人的认知系统的模仿能力充分运用到语音识别领域,并结合神经网络和隐含马尔可夫模型的识别算法,克服了ANN在描述语音信号时间动态特性方面的缺点,进一步提高了语音识别的鲁棒性和准确率。其中成功的方法就是在混合模型中用ANN替代高斯混合模型估计音素或状态的后验概率。2011年,微软以深度神经网络替代多层感知机形成的混合模型系统大大提高了语音识别的准确率。
3 语音识别的应用
语音识别技术有着非常广泛的应用领域和市场前景。在语音输入控制系统中,它使得人们可以甩掉键盘,通过识别语音中的要求、请求、命令或询问来作出正确的响应,这样既可以克服人工键盘输入速度慢,极易出差错的缺点,又有利于缩短系统的反应时间,使人机交流变得简便易行,比如用于声控语音拨号系统、声控智能玩具、智能家电等领域。在智能对话查询系统中,人们通过语音命令,可以方便地从远端的数据库系统中查询与提取有关信息,享受自然、友好的数据库检索服务,例如信息网络查询、医疗服务、银行服务等。语音识别技术还可以应用于自动口语翻译,即通过将口语识别技术、机器翻译技术、语音合成技术等相结合,可将一种语言的语音输入翻译为另一种语言的语音输出,实现跨语言交流[11]。
语音识别技术在军事斗争领域里也有着极为重要的应用价值和极其广阔的应用空间。一些语音识别技术就是着眼于军事活动而研发,并在军事领域首先应用、首获成效的,军事应用对语音识别系统的识别精度、响应时间、恶劣环境下的顽健性都提出了更高的要求。目前,语音识别技术已在军事指挥和控制自动化方面得以应用。比如,将语音识别技术应用于航空飞行控制,可快速提高作战效率和减轻飞行员的工作负担,飞行员利用语音输入来代替传统的手动操作和控制各种开关和设备,以及重新改编或排列显示器上的显示信息等,可使飞行员把时间和精力集中于对攻击目标的判断和完成其他操作上来,以便更快获得信息来发挥战术优势。
4 结 语
语音识别的研究工作对于信息化社会的发展,人们生活水平的提高等方面有着深远的意义。随着计算机信息技术的不断发展,语音识别技术将取得更多重大突破,语音识别系统的研究将会更加深入,有着更加广阔的发展空间。
参考文献
[1] 马志欣,王宏,李鑫.语音识别技术综述[J].昌吉学院学报,2006(3):93?97.
[2] RABINER L R, JUANG B H. An introduction to hidden Markov models [J]. IEEE ASSP Magazine, 1986, 3(1): 4?16.
[3] GALES M, YOUNG S. The application of hidden Markov models in speech recognition [J]. Foundations and Trends in Signal Processing, 2008, 1(3): 195?304.
[4] JELINEK F. Continuous speech recognition by statistical methods [J]. Proceedings of the IEEE, 1976, 64(4): 532?556.
[5] 倪崇嘉,刘文举,徐波.汉语大词汇量连续语音识别系统研究进展[J].中文信息学报,2009,23(1):112?123.
[6] 顾亚强.非特定人语音识别关键技术研究[D].长沙:国防科学技术大学,2009.
[7] 中华人民共和国国家质量监督检验检疫总局.GB/T21023?2007 中文语音识别系统通用技术规范[S].北京:中国标准出版社,2007.
[8] 王文慧.基于ARM的嵌入式语音识别系统研究[D].天津:天津大学,2008.
[9] 何湘智.语音识别的研究与发展[J].计算机与现代化,2002(3):3?6.