卷积神经网络的难点范例6篇

前言:中文期刊网精心挑选了卷积神经网络的难点范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

卷积神经网络的难点

卷积神经网络的难点范文1

【关键词】照相软件 人脸识别技术 计算机

人脸识别作为一项现代化科技技术,具有极大的发展空间。1964年,人脸识别(AFR)这一领域逐渐出现在人们的视野里,至于1991年至1997年,若干具有代表性的人脸识别算法诞生于世,到如今,以支持向量机为代表的统计学习理论被应用到了人脸识别中来。前人的侧重点在于对其算法的延伸探究,但就笔者而言,存在一定程度上专业知识的限制,因而根据自身的知识储备与探究能力,将人脸识别技术这一宽泛概念的探讨缩小至相对更贴近生活,且较为容易理解与研究的一个主题――对于照相机软件中人脸识别技术的探究,并由此展开对计算机人脸识别的部分性探究。

1 对于人脸识别技术的初步了解

科幻性质的故事往往以其并不符合实际的奇幻情节,模糊得描绘了现实世界未来的发展蓝图。这里不得不提及一部具有启发意义的电影――《生化危机》,电影中追踪主角行踪的卫星定位人脸识别技术,是否未来也将存在于我们的现实社会当中?由此,便联想到生活中照相软件的人脸识别是否也是通过相似的原理而执行的。

关于人脸识别,其本质上隶属于生物特征识别的一支。其余包含指纹识别,虹膜识别,DNA识别等技术。当今最为广泛运用的是指纹识别,但随之而来产生的是一定的安全性问题。例如去年热门的高考替考话题,指纹贴的出现使指纹识别的安全性受到质疑。而人脸识别仍处于一个不完全成熟的发展阶段,就目前现状来说,其所具有的不可复制性、自然性、不可察觉性,使其安全性与实用性都处于相对较高的水平。但同样,其技术难度也呈正比例增长。

通过对与计算机信息科技的学习,能够得出这样一个总结性结论:“人脸识别是通过计算机视觉的一些算法所实现的。”

前人对从不断更新的研究中得出,人脸识别的基本算法有四种:

(1)基于人脸特征点的识别算法(Feature-based recognition algorithms)。

(2)基于整幅人脸图像的识别算法(Appearance-based recognition algorithms)。

(3)基于模板的识别算法(Template-based recognition algorithms)。

(4)利用神经网络进行识别的算法(Recognition algorithms using neural network)。

当然,如今也早已存在许多其他的的算法能够支持人脸识别技术的实现。而对于该项技术的应用的范围也在逐渐扩大,门禁考勤系统、住宅安全管理、电子身份等等,都将在很大程度上的得益于其的不断发展。

让我们回到主题:照相机的人脸跟踪究竟是如何实现的呢?围绕这一问题,由浅及深,笔者将本文中的探究内容主要分为以下三个部分:

(1)图像在计算机内部的存储方式。

(2)计算机如何区分出物体与其所在背景。

(3)计算机如何定位人脸并从而实现识别功能。(注:由于照相软件只是作为一个对于人脸识别问题的切入点,单单深究照相软件会带来一定的局限性,因此二、三两点将跳过作为载体的照相软件,直接对于照相机功能背后的原理作进一步探究。)

1.1 图像在计算机内部的储存方式

计算机通过往往通过bitmap的形式来储存图像,也就是像素矩阵。

从结构上讲,计算机中储存的图像一把可以分为两大类,即矢量图和位图。矢量图通过数学公式计算获得,优点在于不会失真,但其最大的缺点是难以表现色彩层次丰富的逼真图像效果。而位图的基本思想,则是把一幅图像按照行列进行分割,所获得的点成为像素。相机所拍摄获得的照片便是以位图的形式储存的。每一幅图像均是由无数像素组成,而每一个像素对应显存中1、8、16或24位二进制数来表示颜色信息。位数决定了图像所含的最大颜色数,位数越多,图像的色彩就越丰富。

1.2 计算机如何区分出物体与其所在背景

大致的过程可以由图1所知,用相对容易理解的话来解释,计算机对于区分物体与其所在背景,首先是通过对要是别的物体提取表面特征,然后再对真实的照片提取表面特征,最终在进行匹配,配合相应的算法,这样,计算机便可以区分出物体与其所在背景。

由此所延伸的科目是计算机视觉。

正如定义所提到:计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。

通过这门科目,我们能够做到使用计算机来处理图像,并区分出目的对象。形象地说,在这门科目的辅助之下,计算机能够成为人类的第二双眼睛,对目标进行识别、跟踪和测量。

“One picture is worth ten thousand words.”图像的处理,将为人类提供巨大的便捷。

大致罗列出其处理所进行的步骤,分别是:图像获取、特征提取、检测分割、高级处理。

1.3 计算机如何定位人脸并从而实现识别功能

关于人脸的定位与识别,在很大一定程度上与区别物体与背景的技术存在着相似之处。但是人脸的定位与识别,又是更高于目标对象的识别的。这正是算法的不停更新与发展所带来的科技发展的结果。

目前比较流行的Cascade Classifier(Opencv中做人脸检测的时候的一个级联分类器)效果还是比较好的,正脸检测到的成功率能达到90%以上。

此外,在人脸局部区域特征提取时,一种叫做CNN(Convolutional Neural Network)卷积神经网络技术的运用――使用提取特征的filter对像素点进行几层处理,也为识别带来一定的便利。CNN运用到了深度学习,因此这里将拓展以下有关deep learning的概念:

deep learning的概念源于人工神经网络的研究。其三大框架为:CNN(Convolutional Neural Network,卷积神经网络),DBN(Deep Belief Network,深度置信网络),AE(AutoEncoder,自动编码机)。而目前在CV(Computer Vision的缩写,指计算机视觉)领域应用最广的是CNN。到近来也有很多人尝试用deep learning的方法来实现人脸识别,其与先前所提到的计算机区分物体和背景的原理也是相似的。

2 结论

回到最初的问题:照相机的人脸跟踪是如何实现的?综上所述,可以获得的结论是:照相机的人脸跟踪是通过计算机视觉的一些算法实现的。但这些算法在技术方面人仍然面临着一些难点,例如,在特征识别时,外界客观因素,有如,光线、着装遮挡、目标对象的姿态、脸型、样本缺乏等等尚未解决的问题。这些都使人脸识别技术尚有巨大的可发展空间。就像前段时间由推出的How Old do I Look线上脸部侦测服务,曾一度掀起热潮,可见,人们对于人脸识别技术的期望也是很高的。

那么,未来的人脸识别技术到底能够发展到何种程度呢?香港中文大学教授汤晓鸥、王晓刚及其研究团队曾在2014年6月宣布,他们研发的DeepID人脸识别技术的准确率超过99%,比肉眼识别更加精准。相信未来,计算机人脸识别技术将与我们共同成长,逐渐成熟与完善。毕业于UC Berkeley的博士贾扬清,创造了Caffe――全称Convolutional Architecture for Fast Feature Embedding,一个清晰而高效的深度学习框架,具有上手快、速度快、模块化、开放性、社区好等优点。如此不断迅捷发展的计算机技术,在这个数字化的时代,正是对未来发展很好的导向。

参考文献

[1]韦凤年.怎样写科技论文[J].河南水利,2006(09).

[2]董琳,赵怀勋.人脸识别技术的研究现状与展望[J].China Academic Journal Electronic Publishing House,2011,10.

作者简介

孙文倩(1998-),上海市人。现在上海市洋泾中学高中在读。

卷积神经网络的难点范文2

[关键词] CCD测量; 煤位测量; 聚类分析方法; Gauss-Laplachian算子

中图法分类号TP391

1 引言

井下煤仓煤位测量是井下自动作业控制的重要检测参数,能实时提供煤仓的储料情况,是煤矿井下作业自动化以及安全生产设计的重要环节。由于工作环境恶劣,井下煤仓煤位测量一直是国内外煤炭工业测量装置研究的难点,常用的测量方法有电容式煤位探测、重锤式煤位探测、核辐射式煤位探测和超声波式煤位探测系统等。运用图像处理技术实现井下煤仓煤位测量技术源自于光学三维轮廓技术。目前CCD物料料位测量的主要工作原理有:通过辅助点光源成像后的位移变化计算物料高度和通过辅助光源成像后的光斑面积变化计算物料高度两种,但这两种原理最核心的计算处理均为辅助光源成像后的光斑轮廓处理以及图像数据的标定,尤其前者所采用的基本算法是一致的。辅助光源在井下煤仓内产生光斑恶劣的情形大多为光斑灰度值较小情形,也就是煤尘的干扰较大情形,文献图像处理结果表明恶劣情形下获取比较准确的光斑直径比较困难,其光斑面积明显要比实际光斑面积小。从文献的图像预处理数据来看,在光斑灰度值较大的情况下,检测光斑的中心坐标还是相对容易,并且相对准确。本文采用的CCD测量方法也是一种基于辅助光源成像光斑中心点辨识的测量方法,能正确处理光斑灰度值较小的恶劣干扰情形,并且具冗余及校正能力,适用于井下煤仓煤位测量。

2 测量原理

根据摄像机的成像原理,两个共面交叉安装的点光源在被测物面上形成特征光点,当物料高度变化时,特征光点的两种变化值均与物料高度变化值相关:① 特征光点的像素位移值;② 特征光点间的成像点间距。式(1)表明了物料高度与特征光点的间距的线性映射关系,即物料高度与特征光点的间距成正比,比例系数仅与点光源的投射角度α、θ相关。

由于煤仓粉尘干扰比较大,并且煤块的堆积状况是随机的,恶劣情形下可能导致点光源不能形成成像光斑或者成像光斑失真,因此用双测量原理校正方式不失为一个好的选择,特征光点像素的位移值计算具有独立测量原理但又与上述测量方式共享测量器件,必然成为本文的首选校正测量方式。两点效验原理是一致的,取其中一点做分析。

假定点光源和CCD中线共面且交于一点,且CCD垂直于物面安装。假定物面1为设定的参考零点,物面2为待测高度物面,则物面高度h与其它参数的关系为:

式(5)与文献[1]中模型的区别在于h所关联的参数是相对于参考面成像点的相对位移,而非相对于CCD中心线相对位移。

3 光斑成像特点分析及提取算法

影响测量精度的主要因素在于光斑质心坐标确定,图3是典型的粉尘干扰下的成像光斑图,也是光斑质心坐标确定误差最大的干扰情形。目前已知的图像处理算法很难适用于所有的图像处理场合中,针对特定的图像特征设计针对性的图像处理算法不失为一种可行的工程设计选择。图3所示的粉尘干扰以及煤炭表明漫反射干扰的光斑图显示,煤炭表面由于漫反射形成若干随机噪声,这些随机噪声具有距离光斑中心距离相对较远以及面积较小等特征。光斑中心由于粉尘干扰光斑的灰度梯度从边缘到光斑中心均具有较大值,并且其梯度变化与粉尘的局部浓度相关,具有一定的随机性。

图像平滑的高斯函数表达式为:

(8)

高斯函数的二阶方向导数为:

(9)

原始图像f(x,y)变换后的输出图像F(x,y)的卷积分表达式为:

(10)

将pi记为灰度为i的像素点概率,ni为灰度为i的像素点个数,则在整个灰度级为N的图像中,pi 的计算式为:

4 测量模型标定以及模型参数的在线辨识

测量的准确性一方面与光斑的检测与提取相关,另一方面与模型的标定相关。式(4)与式(7)需要点光源与CCD镜头共面的假设条件,而实际安装过程中很难满足这一假设条件。因此式(4)中的参数a、b、H以及式(7)中的参数a、b需要修正以及标定。分别将式(4)与式(7)改写成最小二乘参数辨识模型,分别有式(17)、式(18)。

重心法计算质心能有效利用光斑的高斯能量分布特点,能比较有效处理粉尘干扰后的灰度值噪声,示值比较稳定。

5 测量数据及结论

系统采用的CCD像素为576*768,镜头焦距为5m,测量高度0~6000mm,图像灰度化采用逆滤波算法进行预处理,再采用聚类分析进行Gauss-Laplachian算子阈值分割,光斑中心采用质心坐标计算,模拟现场环境采取随机粉尘干扰,其测量结果如表1所示。

实验数据结果表明,粉尘干扰对测量数据有较大影响,但误差数据在可接受范围内。测量数据的准确度一方面需要模型的精确性,这一点通过测量模型的参数辨识已基本解决,另一方面需要光斑质心的确定,这需要非常准确地提取光斑的质心坐标。双辅助光源的设计、冗余测量原理的校正有助于提高测量数据的可靠性和稳定性。

[参考文献]

[1] Luca Biancardi,Giovanna Sansoni,and Franco Docchio.Adaptive Wh ole-Field Optical Profilometry: A Study of the Systematic Errors,IEEE Trans.On Instrumentation and Measurement[J],1995,44(1):36-41.

[2] 宋华,孟晓风, 一种基于CCD的物位测量方法, 仪器仪表学报[J], 2002,23(2):115-118.

[3] 潘国林,高幼年, 基于机器视觉煤仓料位测量方法的研究, 上海电力学院学报[J],2007,32(2):176-178.