前言:中文期刊网精心挑选了卷积神经网络的优点范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
卷积神经网络的优点范文1
中图分类号:TP391.41 文献标识码:A 文章编号:1672-3791(2017)04(c)-0028-02
该文采用随机Dropout卷积神经网络,笔者将此法的优点大致概况为将繁琐杂乱的前期图像处理简易化,原来的图像不可以直接输入,现在的原始图像即可实现直输功能,因其特性得到广泛研究与应用。另外,卷积神经网络在图像的处理中能够将指定的姿势、阳光的照射反应、遮避、平面移动、缩小与放大等其他形式的扭曲达到鲁棒性,从而达到良好的容错能力,进而可以发现其在自适应能力方面也非常强大。因为卷积神经网络在之前建立网络模型时,样本库为训练阶段提供的样本,数量有限,品质上也很难满足要求,致使网络权值参数不能够完成实时有效的调度与整理。
1 卷积神经网络
据调查卷积神经网络由K.Fukushima在80年代提出,那时候它被称为神经认知机,这一认知成为当时的第一个网络,后来网络算法发生了规模性变革,由LeCun为代表提出了第一个手写数字识别模型,并成功投入到商业用途中。LeNet被业界冠以卷积神经网络的代表模型,这类系统在很多方面都起到了不容小趋的作用,它多数应用于各类不同的识别图像及处理中,在这些层面上取得了重要成果。
笔者经查阅资料发现卷积神经网络其实是由两个种类组合而来,它们分别是特征提取、分类器,这种组成我们可以看到特征提取类可由一定数量的卷积层以及子采样层相互重叠组合而成,全部都连接起来的1层或者2层神经网络,就是由分类器来进行安排的。卷积神经网络中的局部区域得到的感觉、权值的参数及子采样等可以说是重要网络结构特征。
1.1 基本CNN网络结构
图1中就是最为经典的LeNet-5网络模型结构图。通过图1中我们可以获悉,该模型有输入输出层,除这两层外还有6层,其征提取可在前4层中体现,后两层体现的是分类器。
在特征提取部分,6个卷积核通过卷积,是图像经尺寸为32×32的输入而得见表1,运算过程如式(1):
(1)
式中:卷积后的图像与一个偏置组合起来,使函数得到激活,因此特征图变诞生了,通过输出得到了6个尺寸的特征图,这6个尺寸均为28×28,近而得到了第一层的卷积,以下笔者把它简要称为c1;那么c1层中的6个同尺寸图再经由下面的子采样2×2尺寸,再演变成特征图,数量还是6个,尺寸却变成了14×14,具体运算如公式(2):
通过表2我们可以使xi生成的和与采样系数0.25相乘,那么采样层的生成也就是由加上了一个偏置,从而使函数被激活形成了采样层的第1个层次,以下我们简要称为s1;这种过程我们可反复运用,从而呈现出卷积层中的第2层,可以简要称之为c2,第2层简称s2;到目前为止,我们对特征的提取告一段落。
神经网络的识别,我们可以看到它是由激活函数而形成的一个状态,这一状态是由每个单元的输出而得;那么分类器在这里起到的作用是将卷积层全部连接起来,这种通过连接而使1层与上面1层所有特征图进行了串连,简要称之为c5;因而2层得到了退变与简化效应,从而使该神经网络成为经典,简要称之为F6,向量及权值是由F6 输送,然后由点积加上偏置得到结果的有效判定。
1.2 改进的随机DropoutCNN网络
1.2.1 基本Dropout方法
神经网络泛化能力能够得到提升,是基于Dropout方法的深入学习。固定关系中存在着节点的隐含,为使权值不再依附于这种关系,上述方法可随机提取部分神经元,这一特性是通过利用Dropout在网络训练阶段中随机性而得,对于取值能够有效的存储及保护存留,这一特性在输出设定方面一定要注重为0,这些被选择的神经元随然这次被抽中应用,但并不影响下次训练的过程,并具还可以恢复之前保留的取值,那么每两个神经元同时产生作用的规避,可以通过重复下次随机选择部分神经元的过程来解决;我们通过这种方法,使网络结构在每次训练阶段中都能呈现不同变化,使一些受限制的特征,不再受到干扰,使其真正能展现自身的优点,在基于Dropout方法中,我们可以将一些神经元的一半设为0来进行输出,随机神经元的百分比可控制在50%,有效的避免了特征的过度相似与稳合。
1.2.2 随机Dropout方法
Dropout方法就是随机输出为0的设定,它将一定比例神经元作为决定的因素,其定义网络在构建模型时得到广泛采用。神经元基于随机Dropout的方法是该文的重要网络输出途径,通过设定输出为0,使其在网络中得到变。图2是随机Dropout的加入神经元连接示意图,其在图中可知两类神经元:一类是分类器的神经元,这一阶段的神经元可分榱讲悖涣硪焕嗌窬元是由输出而形成的层次。模型在首次训练的阶段会使神经元随机形成冻结状态,这一状态所占的百分比为40%、60%,我们还可以看到30%及50%的神经元可能在网络随机被冻结,那么这次冻结可以发生在模型第二次训练,那么第三次神经元的冻结可从图示中得出70%及40%,还可以通过变化用人工设置,其范围值宜为35%~65%,那么网络神经元连接次序的多样化,也因此更为突出与精进,网络模型的泛化能力也得到了跨越势的提高。
2 实验及结果分析
2.1 实验方法
卷积神经网络通过实验,通过输入层呈现一灰色图像,该图像尺寸被设定成28×28的PNG格式,这里我们以图像框架图得到双线性差值,用来处理图像及原视频中的影像,将框架图的卷积核设定为5×5的尺寸,子采样系数控制值为0.25,采用SGD迭代200次,样本数量50个进行设定,一次误差反向传播实现批量处理,进行权值调整。实验采用交叉验证留一法,前四层为特征提取层,C1-S1-C2-S2按顺序排列,6-6-12-12个数是相应特征,通过下阶段加入随机Dropout,这阶段为双层也就是两层,进行连接,连接层为全体,从而可知结果由分类得出,又从输出层输出。
2.2 实验结果分析
识别错误率可通过卷积神经网络模型,及训练过程与检测过程中可查看到的。在训练阶段中,我们可以将Dropout的网络中融入200次训练,在将没有使用该方法的网络进行相互比较分析,我可以得知,后者训练时的识别错误率稍高于前者,前者与后的相比较所得的差异不是很大,进而我们可知使用Dropout方法,对卷积神经网络在泛化能力上得到有效的提升,从而有效的防止拟合。
3 结语
笔者基于Dropout卷积神经网络,人体行为识别在视频中进行, 通过Weizmann数据集检测实验结果,随机Dropout在分类器中加入。通过实验可以得知:随机Dropout的加入,使卷积神经构建了完美网络模型,并且使其在人体行为识别中的效率赢得了大幅度的提升,近而使泛化能力可以通过此类方法得到提高,可以防止拟合。
参考文献
[1] 其它计算机理论与技术[J].电子科技文摘,2002(6).
卷积神经网络的优点范文2
【关键词】人工智能 图像识别 深度学习
1 概述
图像识别技术是人工智能研究的一个重要分支,其是以图像为基础,利用计算机对图像进行处理、分析和理解,以识别不同模式的对象的技术。目前图像识别技术的应用十分广泛,在安全领域,有人脸识别,指纹识别等;在军事领域,有地形勘察,飞行物识别等;在交通领域,有交通标志识别、车牌号识别等。图像识别技术的研究是更高级的图像理解、机器人、无人驾驶等技术的重要基础。
传统图像识别技术主要由图像处理、特征提取、分类器设计等步骤构成。通过专家设计、提取出图像特征,对图像M行识别、分类。近年来深度学习的发展,大大提高了图像识别的准确率。深度学习从大量数据中学习知识(特征),自动完成特征提取与分类任务。但是目前的深度学习技术过于依赖大数据,只有在拥有大量标记训练样本的情况下才能够取得较好的识别效果。本文认为研究如何在标记数据有限的情况下继续利用深度学习完成物体识别任务具有重要意义。这也是未来人工智能研究的重要方向之一。
2 传统图像识别技术
传统的图像识别技术包括:图像获取、预处理、特征提取、分类。在图像输入后,需要先对图像进行预处理。一幅标准灰度图像,如果每个像素的像素值用一个字节表示,灰度值级数就等于256级,每个像素可以是0~255之间的任何一个整数值。一幅没有经过压缩处理的640×480分辨率的灰度图像就需要占据300KB的存储空间。通常我们需要将图片的亮度及对比度调整合适,才能使图片更加清晰、便于观察。
许多采集到的图片带有或多或少的噪声,需要对图片的噪声进行消除。对图片噪声的消除可以使用不同的去噪方法,如中值滤波、算数平均滤波、平滑线性滤波和高斯滤波等。不同滤波器分别适用于不同情况的噪声。如椒盐噪声便适合使用中值滤波器,高斯噪声便适合使用平滑线性滤波和高斯滤波。有时候,我们需要对图像细化处理(如指纹细化,字符细化等),以便获取主要信息,减少无关信息。细化操作,可以得到由单像素点组成的图像轮廓,便于后续特征提取操作。
基本的图像特征提取包括边缘、角点等提取。一般使用不同的特征提取算子结合相应的阈值得到这些关键点。另一类在频域中进行特征提取的方法主要是通过傅里叶变换,将图像基于频率分为不同的部分,从而可以在频谱中反映出原始图像的灰度级变化,便可得到图像的轮廓、边缘。
在完成图像的预处理和特征提取之后,我们便能够对图像进行识别、分类。常用的分类器有K-近邻(KNN),支持向量机(SVM),人工神经网络(ANN)等等。K-近邻算法原理是,当一个样本的k个最相邻的样本中大部分属于某一类别时,该样本也应当属于同一类别。支持向量机是通过寻找支持向量,在特征空间确定最优分类超平面,将两类样本分开。人工神经网络模仿生物大脑中的神经网络结构,通过误差反向传播不断优化参数,从而得到较好的分类效果。
3 基于深度学习的图像识别技术
一般认为深度学习技术是由Hinton及其学生于2006年提出的,其属于人工神经网络分支。深度神经网络模仿人脑的神经机制来分析样本,并尽可能地对样本的特征进行更深度的学习。以图片为例,利用深度学习技术对样本的特征进行学习时,由低层特征到高层特征越来越抽象,越来越能表达语义概念。当样本输入后,首先对图像进行卷积与下采样操作,卷积和下采样操作是为了进行特征提取和选择。以原始像素作为输入,深度学习技术可以自动学习得到较好的特征提取器(卷积参数)。深度学习的训练过程,首先将当前层的输出作为下一层的输入,进行逐层分析,使得每一层的输入与输出差别尽可能小。其后,再联合优化,即同时优化所有层,目标是分类误差最小化。
传统的深度神经网络往往网络中的节点数太过庞大,难以训练。人们构造出卷积神经网络,以权值共享的方式减少了节点数量,从而能够加深学习的深度,使系统能学习到更抽象、更深层的特征,从而提高识别正确率。目前较成功的深度学习网络结构有AlexNet、GoogLeNet、ResNet等。
与传统识别技术相比,深度学习技术具有以下优势:
(1)无需人工设计特征,系统可以自行学习归纳出特征。
(2)识别准确度高,深度学习在图像识别方面的错误率已经低于人类平均水平,在可预见的将来,计算机将大量代替人力进行与图像识别技术有关的活动。
(3)使用简单,易于工业化,深度学习由于不需要领域的专家知识,能够快速实现并商业化,国内较知名的深度学习创业公司有专注人脸识别的Face++、研究无人车的驭势科技等。
4 存在问题与未来展望
虽然深度学习具备诸多优点,但目前来看深度学习仍有许多不足之处。首先,由于深度学习模型为非凸函数,对其的理论研究十分困难,缺乏理论保证。在对数据进行调整时,仍是简单的“试错”,缺少理论支撑。
同时,由于深度学习过于依赖数据量和计算资源。对一个新概念的学习,往往需要数百个甚至更多有标记的样本。当遇到有标记的样本难以获取或者代价太大时,深度学习就无法取得好的学习效果。并且深度学习需要十分昂贵的高性能GPU,这使得深度学习难以平民化。目前深度学习训练速度较慢,往往需要几天甚至一个月。其模型扩展性差,缺少“举一反三”的能力,样本稍加变化,系统性能便会迅速下降。目前的深度学习属于静态过程,与环境缺乏交互。
对其的解决方案目前主要有两点:
(1)针对于模型扩展性差的问题,通过引入迁移学习,研究不同任务或数据之间的知识迁移,提高模型的扩展能力、学习速度,同时降低学习成本,便于冷启动。
(2)与强化学习结合,研究在动态环境下进行深度学习,提高深度学习与环境交互的能力。
参考文献
[1]蒋树强,闵巍庆,王树徽.面向智能交互的图像识别技术综述与展望[J].计算机研究与发展,2016:113-122.
[2]张翠平,苏光大.人脸识别技术综述[J].中国图象图形学报,2000:885-894.
[3]梅园,赵波,朱之丹.基于直线曲线混合Gabor滤波器的指纹增强算法[J].计算机科学,2016.
[4]孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012:2806-2810.
[5]庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015:26-39.
[6]高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004:86-100.
卷积神经网络的优点范文3
关键词:视觉注视;移动端;数据集;行为推测
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2017)01-0254-03
Abstract: With the development of computer vision application technology, the behavior prediction of eye gaze has been widely concerned by many scholars at home and abroad, and also has important research significance in the field of biological information recognition. In the era of smart phone tablet popularity to improve human-computer interaction and accurate prediction of the mobile side of the user gaze behavior becomes particularly important. Based on the existing research on visual technology, this paper proposes a scheme to solve the gaze behavior of mobile users by using large data combined with machine learning and convolution neural network knowledge, and analyzes the importance of large-scale data sets in visual application.
Key words: visual gaze; mobile end; data set; behavior conjecture
1 概述
伴S着计算机软硬件性能和互联网技术的迅猛发展,大规模的并行计算技术突飞猛进,不断地发展使各种现有技术变得越来越成熟,同时机器学习和计算机视觉领域也都得到了飞速发展。视觉技术的发展变得越来越重要,并且可以应用到实际生活中的很多方面。人类大量的视觉信息现在可以利用计算机来辅助处理,并完成相关的一些工作。相对于生物信息识别技术这一计算机视觉领域的热点技术来说,也已广泛应用于日常生活中[1]。比如指纹识别器,人脸考勤器等平时在许多地方可以经常见到,还有居民家用的摄像头智能报警系统以及近期炒得火热的运用支付宝进行刷脸而完成的支付技术等,这些都是运用了生物信息识别技术。现实中的种种迹象已经表明运用生物信息识别的计算机技术已渐渐的渗透到人们的日常生活中并成为不可或缺的组成部分。时下发展较快也比较常见的生物特征有视网膜、指纹、人脸和人眼等。这些生物信息比如人脸具有个体差异性和自身稳定性特点,从用户的角度来看该特征具有便携和低侵入等一些优点。而人眼作为人脸中最显著的特征,又是人们获取外界信息最直接最方便的途径。都说眼是心灵的窗户,因为眼睛中蕴含着表情、意图等多种信息。因此,眼睛注视的行为预测受到了国内外众多学者的广泛关注,同时在生物信息识别领域中也具有重要的研究意义[2]。
2 注视预测问题
2.1 问题的背景
在心理、认知和用户交互研究中的注视跟踪最近已朝向移动解决方案发展,因为它们使得可以直接评估用户在自然环境中的视觉注意。 除了注意,注视还可以提供关于用户的动作和意图的信息:用户正在做什么以及接下来将做什么。然而,在自然状态下非结构化的任务中注视行为是相当复杂的,并且不能使用在受控的实验室环境中创建的模型来得到令人满意的解释。自然条件下和实验室环境有着很大的不同。为了演化在自然环境中对注视行为的推断,需要一种更加整体的方法,将从认知科学到机器学习的许多学科结合在一起[3]。
从人机交互技术到医学诊断到心理学研究再到计算机视觉,眼睛注视跟踪在许多领域都有应用。注视是外部可观察的人类视觉注意的指标,许多人试图记录它。对于眼睛视线方面的研究可以追溯到十八世纪后期。而现如今已经存在各种解决方案(其中许多是商业化的),但是所有的解决方案都具有以下一个或多个方面的问题:高成本(例如,Tobii X2-60),定制或侵入性硬件(例如,Eye Tribe,Tobii EyeX)。然而在现实中的自然条件下,这些因素对实际的应用会造成一些障碍影响,使得眼睛注视跟踪不能成为任何具有合理的相机(例如,智能手机或网络摄像头)的人应该可以使用的普及技术。如何才能使得这种技术普及并且得到应用,提出了一种解决方案。
2.2问题的提出
研究中首先要解决的就是用户的约束问题,也就是自然条件下使用过程中所受到的各种限制问题。到目前为止,基于注视数据推断用户动作的研究受到许多的限制,特别是在自然环境中。限制因素可能包括可用的商业解决方案的昂贵性,其专有性和封闭性以及缺乏实时交互能力等方面。目前的注视跟踪系统,只是尽量在移动设置中设置各种条件进行补救。商业化定制化的解决方案都有其独自的闭合性质,因此阻碍了注视跟踪算法的发展,并且使得不同方法之间的客观比较变得不可能[4]。此外,注视是一种复杂的现象,涉及认知过程的相互作用。这些过程在设置计算上的建模是非常困难的,尤其是涉及一些未知因素,使得构建实验设置成为一个很大的挑战。此外,来自跟踪实验的数据因为其商业化的原因很少共享,即使共享数据很大部分也是有其独立的实验条件。这些方面的问题都阻碍了跨学科方法在分析和利用注视数据和实验的相关研究与发展。
2.3 解决问题的研究方向
对基于注视的推断的个体贡献通常保持孤立,不能形成更大的整体以促进对注视动作行为的研究。随着这方面的技术发展和应用,最近出现了一些开源的解决方案。虽然在不同的应用和用户界面中使用注视已经相当有限,但是移动注视跟踪的新颖应用开始出现并得到了很快的发展。然而使用移动注视跟踪来推断用户动作的问题是高度多学科的,需要深入理解各个研究领域,包括人眼的功能,数学建模,计算机视觉,机器学习,信息技术,认知过程,用户交互以及心理学。任何一个研究员或甚至任何研究小组都不可能拥有所有研究领域的专家,因此需要相互的协作共同推进技术的发展[5]。
目前的研究主要是从以下几个方面进行:
1)研究移动注视跟踪的认知方面,例如增强对任务中的注视行为的理解或识别不同任务的特征和阶段;
2)开发用于从注视数据推断用户动作的计算方法,诸如应用机器学习用于行为推断,优选地实时地;
3)增强用于改善移动注视跟踪方法和性能的技术软件/硬件解决方案,并使得设备更容易访问;
4)发现注视数据在自然环境和虚拟和增强现实应用中的潜在用途,以及定义任务,其中注视可以是用户动作的有用的预测器。
3 解决方案
首先选择移动端进行研究,因为目前比较普遍的移动设备比如智能手机、平板电脑都有自己可靠的工作系统,且不需要外部附件。移动设备相对于其他平台具有以下优势:
1)使用的广泛性。据估计,到2019年,世界上超过三分之一的人口拥有智能手机,远远超过台式机/笔记本电脑用户;
2)软硬件技术升级的采用率较高。大部分的移动设备具有允许使用拥有计算复杂数据方法的实时的最新软硬件;
3)移动设备上相机的大量使用已经导致相机技术的快速开发和部署;
4)相机相对于屏幕的固定位置减少了未知参数的数量,潜在地允许开发高精度的校准跟踪应用。
3.1 注视类型分析
注视估计方法可以分为基于模型或基于外观[6]。基于模型的方法使用眼睛的几何模型,并且可以被细分为基于角膜反射和基于形状的方法。另一方面,基于形状的方法从观察到的眼睛形状观察注视方向。这些方法倾向于具有低的图像质量和可变的照明条件。基于外观的方法直接使用眼睛作为输入,并可能在低分辨率图像上工作。相比基于模型的方法,基于外观的方法被认为需要更大量的用户特定的训练数据。通过使用深度学习和大规模数据不必依赖于视觉,以实现准确的无校准注视估计。这种方案提出建立一个基于外观的数据模型,而不使用任何手工设计的功能,例如头部姿势或眼球中心位置。
3.2 技术方案
深度学习的最近成功在计算机视觉的各种领域中是显而易见的,但是它对改善眼睛跟踪性能的影响还是相当有限。因为深度学习是需要大量的数据作为支持,而视线追踪这方面的数据集还比较少,普通的研究所得到的稻菁比较有限,最大的数据集通常只是具有50个受试者左右,由于缺乏大规模数据的可用性,因此发展比较缓慢。因而提出了使用深度学习进行研究的一套方案,就是构造大规模的数据集。利用网络资源构造一个大规模的基于移动的眼动跟踪数据集,它包含来自各种背景的大量的受试者,在可变照明条件和不受限制的头部运动下记录[7]。运用现有的智能算法得到一个可以进行卷积神经网络学习端到端的注视预测的后台决策网络。不依赖任何预先存在的系统,不需要头部姿态估计或其他手动设计的特征用于预测。使用只有双眼和脸部的特征训练网络,在这个领域的性能优于现有的眼睛跟踪方法。虽然现在的决策网络在精度方面实现了很先进的性能,但是数据输入的大小和参数的数量使得难以在移动设备上实时使用。 为了解决这个问题,需要培养学习得到一个更小更快的网络,在移动设备上实现实时性能,使得精度损失进一步降低。
3.3 大规模数据集
为了达到这一方案的预测效果,首先要进行的是数据集的建立。网络上相关的研究中有许多公开的注视数据集[8]。总结对比这些相关的数据集,分析出有些早期的数据集不包含显著性的头部姿势变化或具有粗略的注视点采样密度。需要对这些数据进行筛选,使得到的数据具有随机分布特点。虽然一些现代数据集遵循类似的方法,但它们的规模(尤其是参与者的数量)相当有限。大多数现有的眼动追踪数据集已经由邀请实验室参与者的研究人员收集,这一过程导致数据缺乏变化,并且成本高且效率不高。因此需要大量的进行数据收集和筛选分析。大规模数据可以通过卷积神经网络有效地识别人脸(他们的眼睛)上的细粒度差异,从而做出准确的预测。
收集眼动跟踪数据应该注意的方面:
1)可扩展性。数据应该是自然条件下的使得用户具有灵活性;
2)可靠性。运用现有的智能移动设备真实的应用图像而非设计处理过的图像;
3)变异性。尽量使数据具有较大的变异性,使得模型更加稳健,适应各种环境下的操作。
4 结束语
文章介绍了一种针对移动设备的用户注视行为推测解决方案。首先建立一个大规模眼动跟踪数据集,收集大量的注视数据。大型数据集的重要性,以及具有大量各种数据以能够训练用于眼睛跟踪的鲁棒模型。然后,训练得到一个深层卷积神经网络,用于预测注视。通过仔细的评估,利用深度学习可以鲁棒地预测注视,达到一个较好的水平。此外,虽然眼睛跟踪已经存在了几个世纪,相信这种新方案的策略可以作为下一代眼动跟踪解决方案的关键基准。希望能通过这方面的研究,使人机交互得到更好的发展。
参考文献:
[1] 崔耀 视控人机交互系统技术研究与实现[D].西安,西安电子科技大学,2013.
[2] 迟健男, 王志良, 张闯.视线追踪[M].北京: 机械工业出版社, 2011.
[3] Alireza Fathi, Yin Li, and James M Rehg 2012 Learning to recognize daily actions using gaze In Computer VisionCECCV 2012. Springer, 314-327.
[4] Makeroni Labs 2016 Eye of Horus. https://hackaday.io/project/
6638-eye-of-horus-open-source-eye-tracking-assistance (2016) Accessed: 2016-02-26.
[5] Francisco J Parada, Dean Wyatte, Chen Yu, Brandi Emerick, and Thomas Busey,2015.Expert Eyes: Open-source, high-definition eyetracking Behavior research methods ,2015.
[6] 杨彩霞.基于近红外光源的非接触式视线跟踪技术研究 [D].山东:山东大学,2012.
卷积神经网络的优点范文4
人工神经网络作为一种智能化的方法近年来在图像数据压缩领域得到了一定的研究与应用[6]。基于人工神经网络的数据压缩主要有2个步骤:①学习训练,将数据送入输入层作为训练样本,不断调整各层间的连接权值,从而使得网络的输出均方差达到最小;②压缩编码,将数据输入到训练好的网络,压缩后的数据通过隐含层输出。DEM数据具有相关性和连续性的特点,即DEM数据反映的是地形连续变化的特征,高程剧烈变化的部分是少有的并且DEM网格中某一点的高程值可以通过邻域值用非线性函数表示,这实质上非线性函数逼近或地形曲面拟合的过程。基于以上特点,学者们将人工神经网络引入到DEM数据压缩领域,冯琦等[7]采用BP神经网络实现DEM数据压缩,该研究特色在于:①采用L-M训练算法提高单隐层网络(SHLN)运算速率[8-9];②基于DEM数据相关性特点设置相对误差精度指标实现对最优BP训练网络的选取,在减少结点数的同时获得较高的压缩比;③该方法解压过程对于计算机硬件依赖性不高,能够进行数据的离线压缩处理。根据DEM数据的连续性特征,赵鸿森等[10]提出了一种基于RBF神经网络的压缩方法,该方法将山脊线、山谷线等地形特征作为样本点训练集,能够根据地形特征自适应确定网络结构,神经网络权值是通过网格点高程值获得,可获得较高的压缩比。
基于小波变换的DEM数据压缩
1.基于DWT的DEM数据压缩
DWT(DiscreteWaveletTransform)适合于处理各种冗余度低、相关性低的非平稳信号的压缩处理,对于不稳定、相关性差的DEM数据压缩具有较好的效果。DWT对于信号的压缩是基于其他具有多分辨率分析(MRA)这一特性,即根据Mallat算法[11]原始信号能够被逐级分解为高频和低频信号,由于高频分解信号含有绝大都数信息并且幅值小,通过设定一定的比例将最小幅值的分解系数置为0,再通过小波系数重构达到信号压缩的目的。经过理论分析,原始信号经过DWT,重构信号与原始信号具有高度的一致性。事实上重构信号与原始信号的差别往往不可忽略,特别是对于DME数据的压缩,压缩后数据相对于原始数据而言存在着严重的边界畸变、失真等问题,必须加以解决。针对这一问题,CHANG[12]等将二维离散小波变换的边界问题转变为一维离散小波变换来进行处理,研究结果表明该方法大大减小了边界失真区域,在提高压缩比的同时DEM重建数据精度也得以提高。
2.基于IWT的DEM数据压缩
DWT是通过将信号分解系数直接置0的方式来进行压缩处理,重构信号与原始信号不可避免地出现误差,而基于IWT(IntegerWaveletTransform)信号压缩,由于小波分解系数通过有限精度数(FinitePrecisionNumber)来进行精确描述,因而适合于对信号进行无损压缩处理[13]。基于IWT的数据压缩具有以下特点:①压缩处理很大程度上依赖于多相矩阵因式分解的选择,而因式分解能否对压缩后图像给定一个适当的误差尺度,取决于图形迭代函数;②IWT采用提升方案,并且均为整数运算,数据处理的速率得以提高;③IWT完全可逆,既可以实现有损编码也可以实现无损编码。陈仁喜等[14]将整形小波变换用于DEM数据压缩处理,该方法首先将经过预处理的DEM数据进行整形小波变换,然后对变换系数进行阈值化处理,最后进行量化编码。该方法最大特点是实现了数据压缩比和质量以及数据质量和传输速度的很好折中,具体为:①量化方法基于SPIHT算法平面传送思想,重要信息主要集中于高位,将小波变换后的系数直接去掉后面的n个平面位,该方法在保证数据压缩质量的同时提高了压缩比;②采用基于位平面扫描的算法对量化后的数据进行压缩编码,这使得压缩后的数据具有质量渐进传输特性;③小波变换后各子带分别进行编码,在解码过程中可以不对高频子带解码,得到的恢复数据分辨率较低,这有利于对大型DEM数据进行快速检索和浏览。
3.基于SPIHT小波编码算法
EMZ(EmbeddedZerotreeWavelet)算法由Shaprio[15]于1993年提出,该算法包括嵌入式和零树,在零树结构与逐次逼近量化方法(SAQ)相结合的基础上实现嵌入式编码。该算法能充分利用小波系数特点使得输出的码流具有嵌入的优点,因而在图像处理[16-17]、生物医学[18]等领域得到广泛的应用研究。但该算法也存在着如在相互独立的零树进行编码时浪费大量字节等缺陷,研究者们也做了一些改进[19]。在EMZ算法基础上发展而来的SPIHT(SetPartitioninginHierarchicalTrees)[20]算法具有能够在保证数据压缩质量的前提下提高压缩比,能够进行优化嵌入式编码,均方根误差和计算复杂度低等优点,并且数据压缩后具有很好的渐进传输特性,目前该算法在图像压缩领域得到广泛应用。地形特征是影响DEM压缩质量的一个重要因素,平坦地区数据冗余量大而山地地势高低起伏,数据冗余则较小,但就现有的研究方法而言将这两种地形采用同样地压缩比,压缩结果不尽如人意,李毅等[21]提出了一种基于SPIHT小波的DEM自适应压缩方法,该方法特点在于:①考虑地形特征,根据地形的复杂度进行分析以确定数据压缩比,从而确保数据可视化质量;②自适应性编码,通过才用表征不同尺度的小波高频系数和地形尺度特征向量对地形复杂度进行评估,根据评估结果自适应调节编码算法。但该研究中数据压缩比是根据地形视觉效果选择,存在一定的经验性,在实际应用中很难得到较为理想的压缩比。
4.基于M进制小波的DEM数据压缩
多分辨率分析是传统二进制小波变换的基本特性,即能够获得信号在时间域和频率域局部化特征,这有利于对图像局部信息进行有效地识别和分析。当图像经过多层小波分解时,随着分解层数的增加,图像信息会出现不同程度的丢失,这成为二进制小波变换的主要缺陷。在二进制小波变换基础上发展的M进制小波变换具有如下特点:①能够对图像信号进行更加细致地分解,分解次数不受限制;②图像信息更加集中,并能够精确描述图像的频率分布;③图像重构具备较高的精度;④具有对图像信号相对狭窄的高频部分进行放大处理和对图像信号压缩的特性,这克服了正交小波分解所存在的缺陷.DME由于具有海量化数据,以及复杂的地形信息等特点一直是DEM数据压缩的难点,近年来研究者们将M进制小波变换引入DME数据压缩领域,王宇宙等[22]提出了一种基于多进制小波变换的DEM数据压缩方法,顾及DEM地形因素,将高频和低频信息分别进行编码处理是其主要特色,具体化为:①低频系数采用差分映射编码,这充分顾及地面变化的连续性以及大量数据冗余的情形,能够对低频信息进行无损的压缩编码;②并未直接舍弃系数值较小的高频小波系数,而是通过自适应对数量化表,对各个高频小波系数子块分别加以量化处理,能够获得较好的压缩效果。但该方法不足之处在于:对数量化位数是根据压缩率来进行确定,而事实上压缩率不能预先得知,从而量化位数也就无法精确得获得,基于具体地形信息的DEM数据精确压缩也就难以实现。多进制小波函数和尺度函数的构造是基于多进制小波DEM数据压缩的难点之一,对此吕希奎等[23]构造了一种具有插值性质的多进制小波函数和尺度函数,将DEM数据转变为二维图像压缩问题,能够在保持地形特征基本不变的前提下提高压缩比。但基于多进制DEM数据压缩本质上是有损压缩,细节信息的损失不可避免。#p#分页标题#e#
基于组合算法的DEM数据压缩
1.SPHIT算法与小波变换相结合的DEM数据压缩
整形小波变换(IWT)采用了提升方案(LS),避免了传统小波的卷积运算,并且计算过程完全在空间域进行,计算复杂度明显降低,便于硬件实现。因此,IWT能够对于冗余度较大的DEM数据进行有效地去相关性处理,实现对DEM数据的无损或近似无损的压缩。将IWT与新型编码方法的代表——SPIHT算法有机结合,为DEM数据压缩提供了一种有效方法。田继辉等[24]提出一种能够用于应急三维GIS的DEM数据压缩方法,该方法特点在于:①根据压缩精度要求,实现DEM数据单位转换;②对于每块DEM数据均减去其最小值,在降低了小波变换级数的同时使得SPIHT编码级数也得到降低;③通过设定一个小波系数阈值,将高于和低于该阈值的小波系数,分别进行SevenZip和SPIHT算法进行处理;④选用Int5/3实现对DEM数据压缩处理。该方法充分发挥IWT和SPIHT算法的优势,能够顾及到地形平坦和起伏较大情形下的压缩编码,研究表明该方法取得了较好的压缩效果,但对于DEM数据的边界问题并未提及,仍需要进一步加以研究。
2.基于小波变换与熵编码相结合的DEM压缩算法
该算法实现主要有3个步骤:①小波变换,即选择恰当的小波基函数对DEM数据进行小波变换;②量化,经过小波变换后数据相比原始数据而言更加集中,但其数量大小并未改变,必须采用一定的量化方法进行数据量化;量化通常有矢量和标量量化两种方法;③编码,通过将小波变换后的量化数据进行编码,将其转化为字符流。就整个小波压缩流程而言,数据经过压缩后边界失真现象的克服,数据压缩比的提高,以及在于量化和编码方法的选择是该压缩算法的难点所在。DEM数据具有不稳定、相关性差、信息熵高,并且DEM在平原地区具有较大的冗余,而在山区则冗余度较低等特点,这使得数据压缩比难以得到提高,常占强等[25]利用具有线性相位的双正交小波变换与混合熵编码相结合的方法对山区DEM数据进行压缩处理,具体来说:首先对DEM数据进行小波变换,通过选取最大分解系数的1/6作为自适应阈值并与硬阈值函数相结合,对小波分解后的高频系数进行处理,能够使得大约95﹪小波系数为0;然后将高频和低频分解系数分别采用游程编码和Huffman编码;最后再次通过游程解码和Huffman解码进行数据解压。该研究充分发挥了小波变换与编码方法各自的优势,在提高数据重建精度的同时获得了较高的压缩比,但小波阈值的选取局限于单一的情形,对多种情形的小波阈值的自适应确定规则的研究仍有待于进一步深入。
3.纹理优化技术与其他方法相结合的DEM数据压缩
纹理数据作为一种重要的场景数据,在对三维DEM数据进行渲染时一般存在两个问题:①由于采用分辨率高而且颜色丰富的纹理,从而存消耗急剧增加;②无法有处理决纹理分辨率与视距之间的关系,即相机与图的距离较近时,图形分辨率较大,相机与图形距离较大时,图形分辨率较小。Mipmap(Multi-imagepyramidmap)技术能够很好解决以上问题,该技术由Willams提出,并很快得到了广泛的研究和应用。从广义角度上分析,DME数据压缩、传输与显示是一个有机整体,同属于DEM数据压缩范畴,即广义DEM数据压缩。杨晓东等[26]结合Mipmap纹理优化技术与顶点法向量编码方法对DEM数据进行压缩处理,该研究主要实现如下功能:①数据的渐进传输和显示:通过对DEM数据进行小波变换,分别采用标量量化器和EZW对小波系数进行量化和编码;②DEM数据优化显示,采用顶点法向量的计算和编码方法并结合Mipmap纹理优化技术,能够对模型数据进行光照效果的计算。该研究突破了将DEM数据的压缩、传输以及优化显示有机结合,突破了现有的DEM数据压缩的固有模式,为该领域提供了一个较好的研究思路。
4.基于判别规则(指标)的DEM数据压缩
TIN由于采用不规则的空间分布高程采样点描述地形,在数据结构、三角网生成算法等方面相对于排列规则且结构简单的Grid数据而言,数据压缩方面难度较大。通过预先定义某一判别规则(指标)来对数据量进行适当的取舍,从而实现对DEM数据的压缩,是实现DEM数据压缩处理的一种有效方法。蔡先华等[27]提出DEM数据压缩地形描述误差(Ep)这一判别指标来实现对DEM数据压缩,该方法首先在充分考虑DEM高程采用点、地形描述以及数据压缩等误差相互影响的基础上,确定数据压缩误差限值EP0;然后对不是TIN边界的高程点产生的地形误差Ep与所给限值进行比较,剔除小于该值的高程点,从而实现DEM数据的压缩。三角网在地形起伏较大的情况下,相邻法线向量之间夹角较大,而当地形平坦时,相邻法线向量近乎平行。刘春[28]等提出一种基于TIN的DEM数据压缩方法,该方法将相邻三角形法线间的夹角作为判别依据,判别阈值步骤如下:①确定大概阈值T,采用该阈值进行TIN压缩;②计算DEM采样点高程差的方差S;③将S与压缩误差允许值进行比较,如果大于该值则适当减少阈值T,并重新计算;反之则增大阈值T并重新计算直到满足要求为止。该方法间接地顾及地形特征,并且阈值的选择是根据所给点的压缩误差指标进行迭代选择的,研究表明该方法对TIN数据压缩较为有效,但对于特殊地面模型的压缩处理仍有待于进一步研究。
结束语
卷积神经网络的优点范文5
关键词 近红外光谱;茶叶;品质测定;真伪鉴别
中图分类号 O657.3 文献标识码 A 文章编号 1007-5739(2016)04-0289-02
Recent Advance on the Application of Near-infrared Spectroscopy in Tea
NIE Yu-hong ZHOU Xiao-wei ZHANG Bei
(School of Food and Bioengineering,Zhengzhou University of Light Industry,Zhengzhou Henan 450002)
Abstract The main approaches of near infrared reflectance spectroscopy were introduced in this paper. Recent advance of near infrared reflectance spectroscopy on identification and detection of tea were presented.With the recent developments reviewed,the problems encountered were also discussed.The application prospects of near infrared reflectance spectroscopy in tea detection were analyzed.
Key words near-infrared reflectance spectroscopy;tea;determination of the quality;identification
随着社会发展和消费水平的提高,人们越来越注重身体健康,而茶叶作为一种良好的保健饮品也越来越被人们喜欢。当前对茶叶质量的检测多采用感官检验评审的方式。这种方式的弊端是评审的结果受评审场地,以及评审人员的知识水平、健康状况等因素的影响[1]。随着当前茶叶产业的迅猛发展,利用科学仪器对产业品质进行检测十分必要。目前,近红外光谱分析技术在茶叶的定性和定量检测中被广发应用[2]。
1 近红外光谱分析技术背景简介与发展现状
英国天文学家William Herschel在天文观察中发现了近红外光谱(near infrared reflectance spectroscopy,NIRS)[3]。美国材料检测协会(ASTM)将近红外光谱区定义为波长780~2 526 nm(波数为12 820~3 959/cm)的光谱区。近红外光谱具有吸收频率特征性强、受分子内外环境影响小、光谱特性更稳定的特点。近红外光谱主要反映的是有机物分子中含氢基团的倍频吸收与合频吸收。NIRS技术的优点主要有以下几个:一是能够分析的对象数量较多、涵盖门类较多。二是在分析前对样品不需要进行复杂的前处理,分析的操作简单、速度较快。三是分析不破坏样品,通过光谱扫描完成。四是对环境污染较小[4]。NIRS技术使用方便、对环境污染小、检测速度快、效率高,在农业[5]、食品工业[6]、中医药[7-10]、和石油化工[11]等领域中得到了非常广泛的应用。
日本是最早利用NIRS技术对茶叶开展研究的国家,目前已研制出专用的近红外分析仪来快速检测茶叶中的水分、全氮量、粗纤维、茶多酚、咖啡碱、氨基酸等主要成分[12]。但是由于国外的茶叶种类少,因此NIRS技术在茶叶产地、真伪鉴别等定性分析方面的研究较少。
国内NIRS技术应用于茶叶检测方面,主要集中在绿茶理化成分的测定方面,茶叶、茶汤、茶提取物中的理化成分测定,茶叶品质评价的研究等。因为我国茶叶的种类繁多,所以NIRS技术在茶叶的产地、品种及真伪鉴定等方面的研究也较为广泛。
2 近红外光谱分析方法简介
近红外光谱分析中常用的数据处理计量方法主要有以下几类。
2.1 多元线性回归法(MLR)
多元线性回归是化学计量学中最基本的分析方法[4],是分析一个随机变量与多个变量之间线性关系的统计方法。当变量Y的影响因素有多个而不止1个时,可以建立多元线性回归模型:Yi=β0+β1X1+β2X2+...+βkXk+ε。利用变量Y与X的n组样本数据,按照一定准则,可求得估值b0,b1,...,bk,建立起样本回归模型:Y=b0+b1X1+b2X2+...+bkXk+ε。
2.2 主成分分析法(PCA)
数据降维后进行多元统计分析是主成分分析的基本原理[13-15]。在研究的过程中,采用多指标变量的方法,得到的结果在一定程度上出现了重叠。主成分分析法避免了多变量测定方法测定结果容易出现重叠的弊端,将原变量进行转换,使少数几个新变量成为原变量的线性组合,新变量之间互不相关。同时,这些变量也能够尽可能多地表征出原变量的数据结构特征。
2.3 偏最小二乘法(PLS)
就目前的研究情况来看,偏最小二乘法是逐渐发展,已经成为近NIRS技术中应用最多的回归方法[16]。利用非线性迭代方法对吸光度矩阵X和浓度矩阵Y进行分解,以特征向量的相关性来建立X和Y之间的内部联系。偏最小二乘法最适合运用在多组分复杂样品的分析过程中,检测速度快、结果准确度高、预测性强、能消除一定的非线性的能力。
2.4 人工神经网络法(ANN)
人工神经网络属于非线性校正算法,是由大量简单处理单元(神经元)广泛互连而成的非线性动力学系统。它不仅结构可变,还有自学习、自适应、巨量并行性、存储分布性的特点。与偏最小二乘法方法相比,人工神经网络更加准确和抗干扰[17]。
2.5 极限学习法(ELM)
极限学习机法是从单隐含层前馈神经网络发展而来的一种新型算法。随机产生输入层与隐含层的连接权值和隐含层神经元的阈值,只需要设置隐含层神经元的个数,便可以获得唯一的最优解。
3 近红外光谱分析技术在茶叶检测方面的研究
3.1 茶叶水分含量的测定
茶叶水分含量的高低对茶叶品质的影响非常大。当水分含量小于5%时,茶叶香气变化比较小;而当水分含量高于6.5%时,则茶叶品质下降得比较快。刘辉军等[18]利用径向基函数和趋势变换法,建立了绿茶的水分检测模型,预测的相关系数达到0.933。张月玲[19]利用偏最小二乘法和9阶卷积平滑结合二阶导数法,建立绿茶的含水量模型,相关系数达到了0.99以上。王胜鹏等[20]通过交叉验证和偏最小二乘法,建立了茶鲜叶的含水量近红外光谱模型,当主成分数为7时,相关系数为0.92。
3.2 茶多酚和儿茶素含量的测定
茶叶中,茶多酚的含量为18%~36%,在人体内能够清除自由基,是茶叶中最重要的成分之一。Chen Q S等[21]利用偏最小二乘法,建立茶多酚总量的检测模型,相关系数为0.93。徐立恒等[22]利用二阶导数和偏最小二乘法,建立茶多酚模型,预测的相关系数为0.989。吴瑞梅等[23]利用GA法和偏最小二乘法,建立绿茶汤中茶多酚的模型,避开了水的强吸收峰影响,模型预测集均方根误差为0.685%,相对标准差为5.26%。
儿茶素类物质是茶多酚中最主要的活性物质,占茶叶干重的12%~24%。陈华才等[24]使用偏最小二乘法和标准归一化处理的方式,建立儿茶素类物质的预测模型,相关系数达到0.997。同时,又采用径向基函数神经网络法,优化了的茶多酚总儿茶素含量的模型,相关系数达到了0.992[25]。芦永军等[26]使用偏最小二乘法和定标波长的方式(选取6 000~5 200 /cm波数范围内的光谱数据点),建立了定标精度很高的检测模型,相关系数达到0.994 7。
3.3 咖啡碱含量的测定
咖啡因是茶叶中的重要滋味物质之一,能够刺激中枢神经,起到提神醒脑的作用。孙耀国等[27]利用偏最小二乘法,直接对完整茶叶中的咖啡碱的含量建模,相关系数达到0.92。罗一帆等[28]和Chen Q S等[29]利用相同的方法构建获咖啡碱的含量的模型,相关系数也分别达到了0.96和0.968的高精确度。
3.4 氨基酸含量的测定
茶叶中的氨基酸具有降压、拮抗由咖啡碱引起的对神经系统的兴奋等作用,其组成、含量以及其降解产物和转化产物均与茶叶的香气和滋味密切相关。徐立恒等[22]使用偏最小二乘法和定标波长的方式(选取5 000~4 000/cm波数范围内的光谱数据点),建立了炒青绿茶的氨基酸模型,相关系数达到0.99。孙耀国等[27]在优化波长范围的基础上,利用二阶导数预处理方式得到不同绿茶的氨基酸模型,相关系数达到0.99。
3.5 茶叶的种类鉴定和真伪鉴别
NIRS不但能够对茶叶进行定量分析,还能够对茶叶进行定性分析,确定茶叶的种类,实现茶叶产地、品种、生产时间等信息的精确判别。赵杰文等[30]通过多元散射校正预处理方法和定标波长的方式(选取6 500~5 300/cm波数范围内的光谱数据点),结合马氏距离识别模式鉴别了龙井、碧螺春、毛峰和铁观音这4种中国名茶,就鉴别率而言,校正集样本达到了98.75%,预测集样本达到了95%。利用NIRS技术对碧螺春[31]、西湖龙井[32-33]等茶叶进行了真伪鉴定。CHEN Q S等[34]运用NIRS技术对4个地区的烘青绿茶进行了产地鉴别,选出了最优的支持向量机模型,预测率高达到100%。
4 问题与展望
目前,NIRS技术在茶叶上已经得到比较广泛的应用,但是仍然还存在一些需要解决的问题。在NIRS技术中选取代表性样品来建模时,受到建模样品生产季节、外形、产地等因素的影响。为了保证模型的全面性和完整性,在建模过程中需要大量的样品,导致模型建立需要采集的样本数量大、成本高、地域广,给模型建立设置了难题。因为我国茶叶种类繁多,建立适合所有茶类的、精确度和准确度达到检测要求的通用性模型是十分困难的。
随着光学技术、计算机技术的快速发展,NIRS技术在茶叶品质检测、茶类产地鉴别和茶叶真假鉴定等方面还会有更大的发展前景。同时,利用NIRS技术对原料生产的过程进行在线分析和实时监测也将会是一个重要的发展方向。
5 参考文献
[1] 杨丹,刘新,王川丕,等.近红外光谱技术在茶叶及茶制品上应用[J].浙江农业科学,2012(9):1290-1294.
[2] 曹干.现代近红外光谱分析技术在农业研究中的应用[J].广州农业科学,2004(3):9-10.
[3] BLANCO M,VILLARROYA I.NIR spectroscopy:a rapid-response anal-ytical tool[J].Trends in analytical chemistry,2002,21(4):240-250.
[4] 严衍禄.近红外光谱分析技术与应用[M].北京:中国轻工业出版社,2005.
[5] SUBEDI P P,WALSH K B.Assessment of potato dry matter concentration using short-wave near-infrared spectmscopy[J].Potato Research,2009,6(52):67-77.
[6] IRUDAYARAJ J,XU F,TEWARI J.Rapid detemination of invert cane sugar adulteration in honey using FTIR spectroscopy and multivariate analysis[J].Joumal of Food science,2003,6(68):2045.
[7] 曾焕俊,韩莹.维U颠茄铝胶囊Ⅱ近红外判别模型的建立[J].中国药品标准,2011,4(12):303-306.
[8] LAASONEN M,HARMIA-PULKKINEN T,SIMARD CL,et al.Fast ide-ntification of Echinacea parpareadried roots using near-infraredspectros-copy[J].Anal Chem,2002(74):2493-2499.
[9] SERGIO H,FRASSON S,CELIO P.Identification of counterfeit drugs using near infrared spectroscopy[J].Analyst,2001(126):2218-2224.
[10] HAILEY P,DOHERTY P,TAPSELL P,et al.Automated system for the on-line monitoring of powder blending processes using near-infrared spectroscopy.Part I.System development and control[J].Journal of Phar-maceutical&Biomedical Analysis,1996,14(5):551-559.
[11] 张宇佳,徐晓轩,宋宁,等.基于近红外漫反射光谱的烃源岩生烃潜量的确定[J].光谱学与光谱分析,2011,4(12):955-959.
[12] 吉川聪一郎.用近红外光光度法进行茶叶品质评价:蒸青玉露茶和锅炒玉露茶主要成分的分析[J].[日]茶叶研究报告,1997,85(增刊1):88-89.
[13] 吴建国.作物种子品质研究中近红外光谱分析模型的创建和应用[D].杭州:浙江大学,2004.
[14] 夏柏杨,任竿.近红外光谱分析技术的一些数据处理方法的讨论[J].光谱实验室,2005,22(3):629-634.
[15] BLANCO M,COELLO J,ITURRIAGA H,et al.Calibration in non-linear near infrared reflectance spectroscopy:a comparison of several methods[J].Analytica Chimica Acta,1999,384(2):207.
[16] GELADI P,KOWALSK B R.An example of 2-block predictive partiall east-squares regression with simulated data[J].Analytica Chimica Acta,1986,185:19-32.
[17] 夏贤明,丁宁.用近红外光谱法检测绿茶中品质成分的研究[J].分析化学,1991,19(8):945-948.
[18] 刘辉军,吕进,林敏,等.基于RBF网络和NIRS的绿茶水分含量分析模型[J].中国计量学院学报,2005,16(3):88-190.
[19] 张月玲.绿茶品质相关成分的近红外定标模型的初步建立[D].杭州:浙江大学,2006.
[20] 王胜鹏,宛晓春,林茂先,等.基于水分、全氮量和粗纤维含量的茶鲜叶原料质量近红外评价方法[J].茶叶科学,2011,31(1):66-71.
[21] CHEN Q S,ZHAO J W,ZHANG H D,et al.Feasibility study on qualita-tive and quantitative analysis in tea by nearinfrared spectroscopy with multivariate calibration[J].Analytica Chimica Acta,2006,572(1):77-84.
[22] 徐立恒,吕进,林敏,等.茶叶中3类主要组分的近红外光谱分析作为茶叶质量的快速评定方法[J].理化检验:化学分册,2006(5):334-336.
[23] 吴瑞梅,岳鹏翔,赵杰文,等.特征变量筛选在近红外光谱测定绿茶汤中茶多酚的应用[J].农业机械学报,2011,12(42):154-157.
[24] 陈华才,吕进,俸春红,等.近红外光谱法测定茶多酚中总儿茶素含量[J].中国计量学院学报,2005,16(1):17-20.
[25] 陈华才,吕进,陈星旦,等.基于径向基函数网络的茶多酚总儿茶素近红外光谱检测模型的研究[J].光学精密工程,2006,14(1):58-62.
[26] 芦永军,陈华才,吕进,等.茶多酚中总儿茶素的近红外光谱分析[J].分析化学研究简报,2005,33(6):835-837.
[27] 孙耀国,林敏,吕迸.近红外光谱法测定绿茶中氨基酸、咖啡碱和茶多酚的量[J].光谱实验室,2004,21(5):940-943.
[28] 罗一帆,郭振飞,朱振宇.近红外光谱测定茶叶中茶多酚和茶多糖的人工神经网络模型研究[J].光谱学与光谱分析,2005,25(8):1230-1233.
[29] CHEN Q S,ZHAO J W,HUANG X Y,et al.Simultaneous determination of total polyphenols and caffeine contents of green tea by near-infrared reflectance spectroscopy[J].Microchemical Journal,2006,83:42-47.
[30] 赵杰文,陈全胜,张海东,等.近红外光谱分析技术在茶叶鉴别中的应用研究[J].光谱学与光谱分析,2006,26(9):1601-1604.
[31] 周健,成浩,贺巍,等.基于近红外的PLS量化模型鉴定西湖龙井真伪的研究[J].光谱学与光谱分析,2009,29(5):1251-1254.
[32] 周健,成浩,叶阳,等.滇青、青饼和普洱茶(熟饼)近红外指纹图谱分析[J].核农学报,2009,23(1):110-113.
卷积神经网络的优点范文6
为了更准确地估计散焦模糊点扩散函数的散焦半径,提出了一种基于阶跃边缘的参数估计方法。首先利用Canny算子对散焦模糊图像进行边缘检测,然后利用Hough变换方法提取边缘图像中存在的边缘直线,最后对沿直线法线方向的各像素,计算其灰度级的二阶导数,导数值中的最大值则对应模糊阶跃边缘的边界,进而计算出点扩散函数的参数。实验表明,该方法能够快速准确地计算出散焦模糊参数。
【关键词】散焦模糊 参数辨识 阶跃边缘 点扩散函数
散焦模糊是因调焦不准确而造成的图像模糊,并丢失了一些重要的高频成分,而这些高频成分恰恰蕴含着图像中最重要的信息,使得人们对图像的辨识能力下降。散焦模糊广泛存在于图像应用的各个领域,它造成的图像信息丢失,严重影响了应用效果,制约了这些领域的进一步发展。因此,对散焦模糊点扩散函数参数的估计方法进行研究有着重要的实用价值和意义。
对散焦模糊点扩散函数参数估计的研究是图像复原的一个重要研究领域,并已提出多种估计散焦模糊PSF参数的算法,这些方法大概可分为三类:(1)基于空域的参数估计。(2)基于变换域的参数估计。(3)基于迭代技术的参数估计。随着人工神经网络和遗传算法等新兴技术的出现,人们将其应用到图像处理领域,提出了基于这些知识的参数估计算法。基于以上的理论研究,本文提出了一种新的估计散焦模糊点扩散函数参数的方法。
2 散焦模糊理论分析
2.1 散焦模糊点扩散函数
通过对成像的原理和过程的分析,通常认为成像系统具有空间移不变行,因此一幅降质图像的降质过程在空间域可用如下过程来表示:
(2-1)
式中g(x,y)为降质图像,f(x,y)为原始清晰图像,h(x,y)为点扩散函数,即成像系统对点光源的响应,n(x,y)表示加性噪声,*表示二维卷积操作。在上述表达式中,通常假设噪声为高斯白噪声,尤其是在噪声不明显的情况下,可忽略。那么在上式中,点扩散函数就是惟一未知项。
在散焦模糊点扩散函数的几种模型中,由于圆盘模型只需估计出散焦半径便可计算出PSF,在计算上更容易、更简便,因此在参数估计时通常选用圆盘模型。其表达式如下所示:
(2-2)
其中,r表示散焦半径,决定了散焦模糊的程度,即是参数估计方法所需要估计的参数。
2.2 阶跃边缘
图像中的边缘对应着相邻的两个类型区域的分界线,表示一个区域的结束和另一个区域的开始。设s(y)为一条沿x轴的理想阶跃边缘,可用下式来表示:
(2-3)
系统对s(y)的响应称为边缘扩散函数。
在计算出散焦阶跃边缘区域的左右边界LI和Lr后,可根据下式计算出散焦半径r,即散焦模糊点扩散函数的参数:
(2-4)
3 散焦模糊点扩散函数参数估计算法
3.1 模糊阶跃边缘图像分析
经过散焦模糊后的阶跃边缘,其在图像中呈现为一个模糊区域,称之为模糊阶跃边缘。基于阶跃边缘的散焦模糊图像的点扩散函数参数估计,其关键是根据直线边缘确定模糊阶跃边缘的模糊区域的边界宽度,进而计算出散焦模糊点扩散函数的模糊半径。在散焦模糊图像中,阶跃边缘的模糊区域与检测到的直线边缘的关系如图1所示:
图1中,设为检测到的模糊阶跃边缘的任意一条直线,长度为;定义以为高、区间为宽的区域为阶跃边缘的支撑区域;定义以为高、区间为宽的区域为模糊阶跃边缘的支撑区域;和分别为直线到模糊阶跃边缘左侧和右侧边界的距离。
3.2 确定模糊阶跃边缘的边界
以计算图3-1中直线的右侧边界为例,介绍利用二阶导数确定边界的方法。设散焦模糊图像为f(x,y),其沿x轴方向的一阶偏导为,在离散情况下可以用差分来表示。为了处理上的方便,本文对计算出的一阶导数值执行取绝对值操作。根据阶跃边缘的散焦模糊图像的特点可知,在范围内,直线右侧沿其法线方向的灰度值的变化率即导数值会在模糊阶跃边缘区域的边界两侧出现较大的变化,因此可根据相邻导数值出现较大变化的点的位置确定其右边界。
为了找到相邻两个点的差值的最大值,可以对计算出的一阶导数值再对进行一次一阶偏导操作,即对执行对的二阶偏导操作,对计算出的导数值依然取绝对值。同理,可以用二阶导数值确定直线的左边界。
3.3 计算散焦模糊PSF的参数
在计算出散焦阶跃边缘的左右边界和后,便可根据(2-4)计算出散焦半径r,即散焦模糊点扩散函数的参数。
4 结论
本文提出了一种基于阶跃边缘的散焦参数估计方法,对于存在阶跃边缘的散焦模糊图像,能够快速准确地估计出散焦半径。该方法不但对阶跃边缘有良好的估计效果,对于轻度平滑的边缘也同样适用。该方法的优点是计算简便、时间复杂度低,比较适合于实时应用系统。