计算机视觉的基本技术范例6篇

前言:中文期刊网精心挑选了计算机视觉的基本技术范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

计算机视觉的基本技术

计算机视觉的基本技术范文1

【关键词】精密测量 计算机视觉图像 关键技术

在现代城市的建设中离不开测量的运用,对于测量而言需要精确的数值来表达建筑物、地形地貌等特征及高度。在以往的测量中无法精准的进行计算及在施工中无法精准的达到设计要求。本文就计算机视觉图像精密测量进行分析,并对其关键技术做以简析。

1 概论

1.1 什么是计算机视觉图像精密测量

计算机视觉精密测量从定义上来讲是一种新型的、非接触性测量。它是集计算机视觉技术、图像处理技术及测量技术于一体的高精度测量技术,且将光学测量的技术融入当中。这样让它具备了快速、精准、智能等方面的优势及特性。这种测量方法在现代测量中被广泛使用。

1.2 计算机视觉图像精密测量的工作原理

计算机视觉图像精密测量的工作原理类似于测量仪器中的全站仪。它们具有相同的特点及特性,主要还是通过微电脑进行快速的计算处理得到使用者需要的测量数据。其原理简单分为以下几步:

(1)对被测量物体进行图像扫描,在对图像进行扫描时需注意外借环境及光线因素,特别注意光线对于仪器扫描的影响。

(2)形成比例的原始图,在对于物体进行扫描后得到与现实原状相同的图像,在个步骤与相机的拍照原理几乎相同。

(3)提取特征,通过微电子计算机对扫描形成的原始图进行特征的提取,在设置程序后,仪器会自动进行相应特征部分的关键提取。

(4)分类整理,对图像特征进行有效的分类整理,主要对于操作人员所需求的数据进行整理分类。

(5)形成数据文件,在完成以上四个步骤后微计算机会对于整理分类出的特征进行数据分析存储。对于计算机视觉图像精密测量的工作原理就进行以上分析。

1.3 主要影响

从施工测量及测绘角度分析,对于计算机视觉图像精密测量的影响在于环境的影响。其主要分为地形影响和气候影响。地形影响对于计算机视觉图像精密测量是有限的,基本对于计算机视觉图像精密测量的影响不是很大,但还是存在一定的影响。主要体现在遮挡物对于扫描成像的影响,如果扫描成像质量较差,会直接影响到对于特征物的提取及数据的准确性。还存在气候影响,气候影响的因素主要在于大风及光线影响。大风对于扫描仪器的稳定性具有一定的考验,如有稍微抖动就会出现误差不能准确的进行精密测量。光线的影响在于光照的强度上,主要还是表现在基础的成像,成像结果会直接导致数据结果的准确性。

2 计算机视觉图像精密测量下的关键技术

计算机视觉图像精密测量下的关键技术主要分为以下几种:

2.1 自动进行数据存储

在对计算机视觉图像精密测量的原理分析,参照计算机视觉图像精密测量的工作原理,对设备的质量要求很高,计算机视觉图像精密测量仪器主要还是通过计算机来进行数据的计算处理,如果遇到计算机系统老旧或处理数据量较大,会导致计算机系统崩溃,导致计算结果无法进行正常的存储。为了避免这种情况的发生,需要对于测量成果技术进行有效的存储。将测量数据成果存储在固定、安全的存储媒介中,保证数据的安全性。如果遇到计算机系统崩溃等无法正常运行的情况时,应及时将数据进行备份存储,快速还原数据。在对于前期测量数据再次进行测量或多次测量,系统会对于这些数据进行统一对比,如果出现多次测量结果有所出入,系统会进行提示。这样就可以避免数据存在较大的误差。

2.2 减小误差概率

在进行计算机视觉图像精密测量时往往会出现误差,而导致这些误差的原因主要存在于操作人员与机器系统故障,在进行操作前操作员应对于仪器进行系统性的检查,再次使用仪器中的自检系统,保证仪器的硬件与软件的正常运行,如果硬软件出现问题会导致测量精度的误差,从而影响工作的进度。人员操作也会导致误差,人员操作的误差在某些方面来说是不可避免的。这主要是对操作人员工作的熟练程度的一种考验,主要是对于仪器的架设及观测的方式。减少人员操作中的误差,就要做好人员的技术技能培训工作。让操作人员有过硬过强的操作技术,在这些基础上再建立完善的体制制度。利用多方面进行全面控制误差。

2.3 方便便携

在科学技术发展的今天我们在生活当中运用到东西逐渐在形状、外观上发生巨大的变大。近年来,对于各种仪器设备的便携性提出了很高的要求,在计算机视觉图像精密测量中对设备的外形体积要求、系统要求更为重要,其主要在于人员方便携带可在大范围及野外进行测量,不受环境等特殊情况的限制。

3 计算机视觉图像精密测量发展趋势

目前我国国民经济快速发展,我们对于精密测量的要求越来越来高,特别是近年我国科技技术的快速发展及需要,很多工程及工业方面已经超出我们所能测试的范围。在这样的前景下,我们对于计算机视觉图像精密测量的发展趋势进行一个预估,其主要发展趋势有以下几方面:

3.1 测量精度

在我们日常生活中,我们常用的长度单位基本在毫米级别,但在现在生活中,毫米级别已经不能满足工业方面的要求,如航天航空方面。所以提高测量精度也是计算机视觉图像精密测量发展趋势的重要方向,主要在于提高测量精度,在向微米级及纳米级别发展,同时提高成像图像方面的分辨率,进而达到我们预测的目的。

3.2 图像技术

计算机的普遍对于各行各业的发展都具有时代性的意义,在计算机视觉图像精密测量中运用图像技术也是非常重要的,在提高图像处理技术做以提高。同时工程方面遥感测量的技术也是对于精密测量的一种推广。

4 结束语

在科技发展的现在,测量是生活中不可缺少的一部分,测量同时也影响着我们的衣食住行,在测量技术中加入计算机视觉图像技术是对测量技术的一种革新。在融入这种技术后,我相信在未来的工业及航天事业中计算机视觉图像技g能发挥出最大限度的作用,为改变人们的生活做出杰出的贡献。

参考文献

[1]汤剑.周芳芹.杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2015,14(18):33-36.

[2]马玉真.程殿彬.范文兵,计算机视觉检测技术的发展及应用研究[J].济南大学学报,2014,18(23):222-227.

[3]李华.基于计算机视觉图像精密测量的关键技术分析[J].电脑知识与技术,2013(05):1211-1212.

计算机视觉的基本技术范文2

关键词:计算机视觉图像 精密测量 构造几何模型 信号源的接收

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)05-1211-02

新型计算机视觉图像精密测量是一种基于计算机程序设计以及图像显示的高精度的关键技术,它广泛用于测量的领域,对于测量的准确性有很好的保证。这种关键技术是几何了光学的特性,发挥了图像学的显影性,把普通的测量技术瞬间提升到了一个新的高度。在这项关键技术中包含了物理学中光的效应,图像中的传感器以及计算机中的编程软件,这还不完全,还有一些其他科学领域知识的辅助,可以说这项关键技术是一个非常有技术含量的技术,很值得学者进行研究。

1 计算机视觉图像精密测量的关键技术的具体形式

在以往的测量中,选择的测量方式还是完全采用机械的形式,但是在使用了计算机视觉图像精密测量后,完成了许多以往技术所不能达到的任务。在我们的研究中,计算机视觉图像测量的原理是通过摄像机将被处理的对象采集进行影像采集,在多个控制点的数据采集完成后,系统会自动将这些图像进行整合,得出相关的几何多变参数,再在计算机上以具体的数据显示出来,以供技术人员使用参照。

在上面所说的摄像机并不是我们通常意义上生活中使用的摄像机。它是一种可视化较强,表针比较敏感的测试仪。可以将视觉中的二维形态通过显影,记录在机械的光谱仪上,再将这种的二维图像做数学处理,有二阶矩阵转换为三阶矩阵,通过播放仪呈现出三维的影像。这时的图像变为立体化,更有层次感,效果上也有了明显的变化,这是一种显示方法。此外还有一种造价较高的仪器,我们不常使用,就是图像提取器。同样是采集控制点的数据,将数据整合在系统之内,然后对于原始的图像进行预处理,不再经过有曝光这个程序,将图像中关键点的坐标在整个内部轴面上体现出来,提取数据帧数,再运用机器的智能识别系统,对控制点的坐标进行数据分析,自动生成图形,这也可以用于精密测量。它的优点就是使用上极其的方面,基本只要架立仪器和打开开关,其他的工作机械系统都会自动的完成。使用的困难就是造价极其的高,不适合一般企业使用。在基于计算机视觉图像测量中使用上的原理如下:

1) 计算出观察控制点到计算机视觉图像测量仪器的有效距离;

2) 得出观察点到目标控制点之间的三维的运动几何参数;

3) 推断出目标控制点在整个平面上的表面特征( 大多时候要求形成立体视觉);

4) 还通过观察可以判断出目标物体的几何坐标方位。

在整个计算机视觉图像精密测量的关键技术中最关键的元件就是压力应变电阻仪,这也是传感器的一部分。压力应变电阻仪的使用方式是将应力片粘贴在控制点位上,事先在物体表面打磨平整,清理干净后,涂抹丙酮试剂,在液体完全风干后就可以黏贴应力片,通过导线的联接,形成了一小段闭合的电路,时刻让计算机视觉图像系统可以感应到并作跟踪观察。因受到来自不同方面谐波的影响后,应力片会产生一定数值的电阻,在电路中,这些电阻会转化为电流,视觉图像系统接收到了电流后就会显示在仪表盘上相应的数据,我们就可以根据仪表盘中的数据记录测量中的数据,很好的解决了原始机械在使用过程中大量的做无用功所消耗资源的现象。传感器对每个应点都进行动态的测量,将数据模转换成现实中的图像,精确的成像可以测算出控制点的位置,用计算机视觉图像精密测量结合数据方面的相关的分析,得出施工中的可行性报告分析,减低了施工中的成本,将施工的预算控制在一个合理的范围之内。

当无法观察到控制点是,计算机视觉图像精密测量可以通过接收信号或是相关的频率波段来收集数据,不会因为以往测量的环境不好,距离太远,误差太大的影响。

2 计算机视觉图像精密测量的关键技术分析

在计算机视觉图像精密测量的关键技术中解决了很多以往很难完成的任务,但是在使用过程中还是发生了很多的问题。尤其在视觉图像的选择中,无法使用高帧数的图片显示,无法将计算机视觉图像精密测量的关键技术的优点发挥出来。我们就计算机视觉图像精密测量的关键技术中常见的问题进行讨论。

2.1 降低失误的概率

在很多的数据误差中,有一部分是出现在人为的因素上面。对于机器的不熟悉和操作中的疏忽都会在一定程度上对图像的视觉感模拟带来麻烦。对于网络设备的配置上,要经常性的学习,将配置在可能的情况下设置的更加合理和使用,保证网络连接系统的安全性。为防止更多因操作带来的误差,选用系统登入的制度,用户在通过识别后进入系统,在采集数据后,确定最终数据上又相关的再次确定的标识,系统对本身有的登录服务器和路由器有相关的资料解释,记录好实用操作的时间,及时备份。

2.2 对于权限的控制

权限控制是针对测量关键所提出的一种安全保护措施,它是在使用计算机视觉图像精密测量的关键技术中对用户和用户组赋予一定的权限,可以限制用户和用户组对目录、子目录、文件、打印机和其他共享资源的浏览和更改。图像中的运行服务器在停止的情况下可以做出不应答的操作指令,立刻关闭当前不适用的界面,加快系统的运行速度,对于每天的日志文件实时监控,一旦发现问题及时解决。对于数据终端的数据可采用可三维加密的方法,定时进行安全检测等手段来进一步加强系统的安全性。如果通过了加密通道,系统可以将数据自动的保存和转换为视图模式,对于数据的审计和运行可以同时进行,这样就可以很好的保证大地测量中的图像数据安全,利用防护墙将采集中废弃的数据革除在外,避免数值之间发生紊乱的现象,进一步改善计算机视觉图像精密测量的关键技术。

2.3 开启自动建立备份系统

计算机视觉图像精密测量的关键技术的完善中会常遇到系统突然崩溃或是图像受到严重干扰导致无法转换的一系列情况,发生这种情况最大的可能性就是系统在处理多组数据后无法重新还原成进入界面。这时为保证图片转换成数字的系统数据不丢失,我们对系统进行备份。选定固定的磁盘保存数据,定期将产生的数据(转换前的图像和转换后的数值)导出,保证程序的正常运行。当系统一旦发生错误,可以尽快的恢复数据的初始状态,为测量任务的完成争取更多的时间。我们还要减少信号源周围的干扰,定期的更新系统数据库,保持数据采集的稳定性,把摄像机记录出的数据节点保存在相应的技术图纸上,用这样的方式来知道测量工作。系统备份的数据还可以用于数据的对比,重复测量后得出的数据,系统会自动也备份的数据进行比对,发现误差值在规定以外,就会做出相应的预警,这样也能在工作中降低出现误差的概率。

3 计算机视觉图像精密测量的关键技术遇到的困难和使用前景

计算机视觉图像精密测量的关键技术作为一种新兴技术在使用时间上不过十几年,其使用的程度已经无法估算。正是因为它的简单、使用、精度高以及自动化能力卓越的特点受到了测量单位的广泛青睐。在测量方面的这些可靠性和稳定性也是有目共睹的。在土木和机械测量的行业计算机视觉图像精密测量的关键技术都会有广泛和良好的使用,前景也是十分的广阔。但是不容忽视该技术也有一些弊端。这项关键技术中涵盖的学科非常的多,涉及到的知识也很全面,一旦出现了机器的故障,在维修上还是一个很大的问题,如何很好的解决计算机视觉图像技术的相关核心问题就是当下亟待解决的。

我们都知道,人的眼睛是可以受到吱声的控制,想要完成观测是十分简单的,但是在计算机视觉图像技术中,毕竟是采取摄像机取景的模式,在取得的点位有的时候不是特别的有代表性,很难将这些问题具体化、形象化。达不到我们设计时的初衷。所以在这些模型的构建中和数据的转换上必须有严格的规定和要求,切不可盲目的实施测量,每项技术操作都要按规程来实施。

上文中也谈到了,计算机视觉图像精密测量的关键技术中最主要的构建是传感器,一个合理的传感器是体统的“心脏”,我们在仪器的操作中,不能时时刻刻对传感器进行检查,甚至这种高精度的元件在检查上也并不是一件简单的事情,通过不断的研究,将传感器的等级和使用方法上进行一定的创新也是一项科研任务。

4 结束语

在测量工程发展的今天,很多的测量技术已经离不了计算机视觉图像技术的辅助,该文中详细的谈到了基于计算机视觉图像精密测量的关键技术方面的研究,对于之中可能出现的一些问题也提出了相应的解决方案。测量工程中计算机视觉图像精密测量的关键技术可以很好的解决和完善测量中遇到的一些问题,但是也暴露出了很多的问题。

将基于计算机视觉图像精密测量的关键技术引入到测量工程中来,也是加强了工程建设的信息化水平。可以预见的是,在未来使用计算机视觉图像技术建立的测量模型会得到更多、更好的应用。但作为一个长期复杂的技术工程,在这个建设过程中定会有一些困难的出现。希望通过不断的发现问题、总结经验,让计算机视觉图像精密测量的关键技术在测量中作用发挥的更好。

参考文献:

[1] 汤剑,周芳芹,杨继隆.计算机视觉图像系统的技术改造[J].机电产品开发与创新周刊,2005,14(18):33-36.

[2] 段发阶,等. 拔丝模孔形计算机视觉检测技术[J]. 光电工程时报, 1996,23(13):189-190.

计算机视觉的基本技术范文3

关键词: 计算机 视觉注意机制 计算机视觉注意模型

1.引言

随着信息技术的不断发展,数据处理量剧增,以及用户不断扩大的个性化需求,对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息,即物体选择与识别,已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展,将注意机制引入信息处理领域来解决物体识别问题,已经不再是纸上谈兵。

人类视觉系统进行视觉信息处理时,总是迅速选择少数几个显著对象进行优先处理,忽略或舍弃其他的非显著对象。进入人类视野的海量信息,通过注意选择机制进行筛选,就能使我们有选择地分配有限的视觉处理资源,保证视觉信息处理的效率,这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机系统,就成为一大任务。我们研究的主要方向是使计算机处理对象时,能够具备与人类相似的视觉选择注意能力。

2.视觉注意机制

研究视觉注意机制是个多学科交叉的问题,目前多个领域的研究人员都取得了研究成果,并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上(自下而上)的图像数据驱动的,也可以是安自顶向下(自上而下)的任务驱动的。其中,自下而上的研究主要来自图像中物体数据本身的显著性。例如,在视觉搜索实验中,显著的物体会自动跳出,如图1中的圆点通过特征对比,以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务,以及场景的快速认证结果,即我们可以“故意”去注意任何一个“不起眼”的物体,如我们可以在图书馆浩如烟海的藏书中,找到自己感兴趣的那本书。

研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点,注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动,视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动,而显式注意的中央凹随每次注意点的转移而运动。

对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制,建立视觉注意的计算模型。通过“注意点”的选择与转移,实现对复杂场景中任务的搜索与定位,最终来实现实时信息的响应处理。在计算机视觉的研究中,显式注意应用较多。

3.计算机视觉注意模型

从人的角度来看,人类视觉系统通过视觉,选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看,场景中的某些内容比其他内容更能引起观察者的注意,我们称之为视觉显著性,两者其实是从不同的角度对视觉选择注意过程的描述。

我们把引起注意的场景内容定义为注意焦点FOA(Focus of Attention)。Treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段,各种视觉特征在前注意阶段被以并行的方式提取出来,并在注意阶段以串行方式整合为视觉客体,即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上,Koch[2]进行了深入的研究,他提出注意焦点FOA的变化具有四个特征,即单焦点性:同一时刻只能存在一个FOA;缩放性:FOA的空间范围可以扩大或者缩小;焦点转移性:FOA能够由一个位置向另一个位置转移;邻近优先性:FOA转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点,即FOA转移时抑制返回最近被选择过的注视区域。在此基础上,视觉注意的研究人员提出了多种视觉注意模型。

4.视觉注意模型的研究现状

人类的视觉注意过程包括两个方面:一方面是对自下而上的初级视觉特征的加工,另一方面是由自上而下的任务的指导,两方面结合,共同完成了视觉的选择性注意。与此对应,当前的计算机视觉注意研究也分为这两个方面。

4.1自下向上的数据驱动注意模型研究及分析

在没有先验任务指导的情况下,视觉注意的目标选择主要是由场景中自下而上的数据驱动的,目标是否被关注,由它的显著性决定。现在,自下而上的注意研究主要基于Treisman的特征整合理论和Koch&Ullman的显著性模型,Itti、satoh等人均在此基础上提出了自己的研究模型,并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究,形成各个特征对应的显著图。另外,一些研究者采用基于局部或全局对比度的方法,来得到图中每个像素的显著性,进而得到显著图。

现有的自下而上的视觉注意计算模型中,Itti的显著图模型(简称Itti模型)最具代表性。该模型主要包含3个模块:特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取,将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制,选出唯一的注意目标,其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点,如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。

在动态场景之中,由于Itti模型很难满足实时性的要求,科研工作者们正在努力研究动态场景的特性,并建立相应的动态模型。如Wolfe[1]指出,影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状,等等,其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型,该模型假设当场景中存在全局运动时,视觉注意对象将极少做运动。然而,许多真实的场景并不能满足这个假设,限制了模型的适用范围。Hang等人提出了一种运动图的计算方法,并把运动图作为特征之一,与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响,但是均存在一定的局限性,对于复杂的运动场景的注意焦点计算很难取得良好的效果。

我国研究者也在Itti注意模型的基础上研究了适合动态场景中的注意模型,形成了一些理论成果。如曾志宏[2]等人提出注意焦点计算模型,郑雅羽[3]等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。

4.2自上而下的任务驱动的注意模型研究及分析

自上而下的注意即任务驱动的注意,通过目标和任务的抽象知识,在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面,Laar(1997)提出了一个用于隐式视觉注意的模型,该模型通过任务学习,将注意集中于重要的特征。Rabak[4]提出了基于注意机制的视觉感知识别模型,该模型在定义目标显著性时,通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中,并在数字识别和人脸识别的实验中取得了很好的效果。Itti提出以调节心理阈值函数的形式来控制视觉感知。

目前对自下而上的数据驱动方面的研究较多,而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关,同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作,其过程非常复杂。

5.计算机视觉注意模型研究的趋势

自底向上和自顶向下的加工是两种方向不同的信息处理机制,两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法,才能有效地实现视觉选择注意的目的。

实践证明,把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程,实现主动的视觉选择注意的目的,采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合,实现二者的优势互补是以后计算机视觉注意研究的一个趋势。

参考文献:

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌乐,林坤辉,曲延云,陈嘉威.目标跟踪的视觉注意计算模型[J].计算机工程,2008,(23).

[3]郑雅羽,田翔,陈耀武.基于时空特征融合的视觉注意模型[J].吉林大学学报,2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

计算机视觉的基本技术范文4

关键词:智能交通;计算机视觉;车辆检测;运动矢量场;时域滤波;空域滤波

中图分类号:TN911文献标识码:A文章编号:1009-3044(2012)15-3670-04

Vehicle Detection Algorithm Based on Spatial and Temporal Filtering of Motion Vector Field

SUN Li-hu, XIONG Lin, FAN Zhi-qiang, HUANG Yi, GAO Zi-feng

(College of Electronic Information Engineering, South-central University for Nationalities, Wuhan 430074,China)

Abstract:Vehicle detection system based on computer vision is the basic parts of intelligent transportation system, which is in the founda? tion of capturing video images, through effective algorithm of computer vision to realize the video of the vehicle target position detection; existing vehicle detection algorithm have high complexity and low accuracy; this paper proposed a vehicle detection algorithm based on pat? tern classification and motion vector field filtering; and this low-complexity algorithm can identify vehicles quickly; especially the proposed method has good performance when the target is small or blocked.

Key words: intelligent transportation; computer vision; vehicle detection; motion vector field; spatial filtering; temporal filtering

随着社会经济的快速发展,人们生活水平不断提高,各种汽车的保有量大幅度增加,怎样提高交通效率就显得越来越重要,目前世界各国都投入了大量的人力和物力对智能交通系统(ITS)进行研究[1]。交通监视系统是智能交通系统中的一个重要环节。近年来,基于视频检测的方法随着计算机技术,图像处理,人工智能和模式识别等技术的不断发展,在交通流检测中得到了越来越广泛的应用,相对于其它交通流量检测技术而言,它具有以下优势[2~3]:

1)视频检测可以检测较大的交通场景面积;

2)相对于其它检测方法,投资少,费用低;视频传感器等设备,例如摄像头,易于安装和调试,且对路面设施不会产生破坏;

3)使用视频检测技术可以采集到更多的交通流量参数。

动态视频目标检测技术是智能化视频分析的基础,随着计算机视觉以及视频分析技术的进一步发展,视频目标检测面临着许多新的应用,以图像分割为基础的视频目标识别检测技术在智能交通等方面有着广泛的应用。

计算机视觉的基本技术范文5

摘要:研究基于计算机视觉的实时动态手势识别技术,并利用OpenCV计算机视觉库在VS2010平台上设计一个基于该技术在多媒体教学中PPT演示控制方面的应用。首先,利用背景差分法进行手势检测,在背景更新的基础上,通过背景差分图和颜色直方图的反投影图来检测运动手势区域,可以达到较为满意的实时运动手势检测效果;其次,采用基于颜色直方图的粒子跟踪算法进行手势跟踪,基本能满足跟踪的实时性;最后,在手势识别阶段,采用基于Hu不变矩的轮廓匹配算法,得到较好的手势识别效果;使用六种手势,来实现演示文稿中的控制应用。

关键词:计算机视觉;背景差分;粒子跟踪;手势识别;Hu矩

中图分类号:TP391.41文献标识码:A

1引言

随着计算机软硬件技术的发展,人机交互已经由过去的鼠标、键盘方式逐渐向更加灵活生动的语音、姿势等新颖交互方式发展。由于基于视觉方式具有便捷和开销低等优点,因此,利用计算机视觉技术来使计算机理解用户的命令,从而做出控制动作,这一领域的研究得到越来越多的重视。其中,人的手势作为日常生活中最为广泛使用的一种交流方式;因此,国内外许多研究机构开始对手势识别技术进行研究,并已经取得了一些阶段性的成果。较早的有:Freeman和Roth等人提出的基于方向直方图的手势识别系统;国内的高文教授等人于1994年提出了一种静态复杂背景手势目标的捕获与识别。经过二三十年的发展,

人们对运动目标检测及跟踪进行了大量深入的研究:美国MIT实验室通过提取左右手质心的运动轨迹以及手势形状特征参数,结合语法规则识别40个美国手语,准确率达到97%;另外,Microsoft Korea的HyeonKyu Lee,采用HMM的阈值模型,识别9种动态手势命令,平均识别率高达98.19%;国内的任海兵提出了基于DTW的手势识别算法,该算法能准确识别12种手势。

现在,基于视觉的手势识别技术更多的是应用在娱乐、游戏方面,比如微软前段时间推出的Xbox360游戏机体的体感外设Kinect及多款相配套的体感游戏,玩家可以通过手势在游戏中进行操作和互动,使得人机互动娱乐进入了一个新纪元。与此同时,还没有比较成熟的手势识别技术应用在现代教学系统中。因此,本文的研究重点是基于视觉的实时手势识别技术在多媒体教学演示控制中的应用。在基于视觉的手势识别研究中,需要解决的问题主要有两个:一是实时检测运动手势的信息,二是识别运动手势的信息并做出响应。对运动手势检测,本文采用背景差分结合改进颜色直方图特征的运动检测方法[1];对运动手势跟踪,本文采用粒子滤波算法[2]结合改进颜色直方图信息的方法;手势识别阶段,本文采用了基于Hu不变矩特征[3]的轮廓匹配算法[4];本文研究基于计算机视觉的手势识别系统,实现了在播放控制中运用手势进行开始、翻页、退出等功能,极大的提高了课堂教学的灵活性。

2手势检测

实时视频图像中的运动手势检测所需要完成的任务是:能够快且准的检测出手势在实时图像中的主要位置,并且能将位置所在的特定区域作为后续跟踪、识别的感兴趣区域。手势检测算法的好坏,直接影响整个系统的跟踪以及识别的效果。

目前,运动目标检测[5]的算法比较常用的有三种方法:光流法、帧间差分法和背景差分法。本文考虑实现环境为固定摄像头采集实时视频图像,背景基本不动,因此采用背景差分结合改进颜色直方图信息的运动检测方法。

2.1背景差分法

本文研究中,选取摄像头启动后的前10帧图像的平均作为最初的背景图像,把以后的实时序列图像当前帧和背景图像相减,进行背景消去。可以得到,运动手势区域的像素点的差分值比较大,背景区域的像素点的差分值比较小。另外,由于真实场景中的背景会因光线等外部条件产生微小的变化,长期的误差积累会造成最后得不到理想的手势区域,因此背景需要进行实时更新,从而能及时反映当前帧的背景图像,背景更新[6]的公式如下:

背景更新操作以后,对当前帧进行背景差分,大于阈值th1的图像点即为运动手势区域的点,并将得到的运动手势区域图像进行二值化操作,公式如下:

3手势跟踪

现在常用的一些跟踪算法主要有:卡尔曼预测算法、粒子滤波算法、均值偏移算法以及Camshift跟踪算法等。考虑到卡尔曼预测算法和均值偏移算法等都是线性跟踪算法,不能很好的应对目标运动的随机性,本文采用了粒子滤波算法。

3.1粒子滤波算法原理

粒子滤波法是指通过用一组带有权值的随机样本,以及基于这些样本的估算来表示动态系统的后验概率密度。当样本很大的时候,这种估计就等同于后验概率密度。这些样本就称为“粒子”。假设在t=0时刻每个粒子都有一个解,每个解与真实解都有一定的相似度,这个相似度可以表示为权重,随着时间的增加,相似度越大的粒子权重越大,而相似度越小的粒子权重就越小,最后趋于0,从而找到真实解(如图2)。

3.2基于改进颜色直方图信息的粒子跟踪

视频图像跟踪方面,目标的运动模型主要表现为目标位置、速度随时间改变的状态转移过程,目标的观测模型主要表现为每帧图像中运动目标的特征(如颜色、轮廓等)与真实目标的相似度的似然过程。在粒子滤波算法中,运动模型可以称为粒子传播或者粒子采样,它是一种随机过程[11]。粒子在经过传播以后,状态会发生改变,但权值没有跟着改变,这就需要系统的观测模型对当前粒子的状态进行计算从而更新粒子的权值。本文的研究中,观测值由目标区域的颜色直方图决定。

基于颜色直方图信息的粒子滤波就是将图像颜色特征的相似度作为粒子滤波算法要求解的后验概率,利用巴氏距离(Bhattacharyya)来计算相似度,得到粒子的权重。巴氏系数[12]如公式(9):

4.2识别算法过程

本文研究中,首先建立手势模板库,然后通过实时提取手势帧,经过前面第2部分的结合改进颜色直方图信息的手势检测,然后再经过形态学处理之后,得到效果良好手势区域的二值图,再用轮廓提取及跟踪来得到手势的轮廓图,然后计算其7Hu矩特征,最后运用欧氏距离将其与模板库中定义的手势进行特征匹配,完成手势识别。

轮廓提取就是要掏空内部的点:如果其八个相邻的点都是黑色,则可以判定为内部点,然后删除改点。

轮廓跟踪方法:首先找出轮廓中最左下方的点作为搜索的起点,然后按照一定规则来搜索手势轮廓上的其他像素点。由于轮廓是连续的,因此每个轮廓上的点的位置都可以用其前一个点的所张的角度来表示。研究中采用如下跟踪准则,第一个点开始定义搜索方向为左上,如果左上方的点是黑点,则它也是轮廓上的点;如果不是,那么顺时针旋转,直到找到第一个黑点,即轮廓上的下一个点。继续同样的方法搜索,直到返回最初的起点,搜索结束。

下图是轮廓跟踪算法[15]的示意图,搜索方向用箭头表示。

5系统实现

本文的系统是在微软的VS2010平台上,使用C++语言进行软件开发,在图像处理相关方面是基于计算机视觉库(OpenCV)进行研究的。程序界面如下图:

左边底层区的按钮可以观察实时手势跟踪和识别效果的功能(如图4和图7)。

手势识别的结果可以定义成一个变量,不同

的识别结果对应的变量值不同,然后根据变量值调用不同的API接口函数,这样就可以实现实时手势识别技术在演示控制中的应用。本文研究在控制部分挑选了六种手势,分别控制PPT播放中的开始、退出、上下翻页、跳转首末页等功能。手势命令定义如下:手势4控制开始播放;手势3控制退出播放;手势1控制跳转首页;手势2为跳转尾页;手势10为向下翻页页;手势5控制向前翻页。对电脑中某一PPT进行实际的播放控制(列举其中4个手势的控制状态),效果如下:

1)识别手势4,开始播放:

2)识别手势10,向下翻页:

3)识别手势1,跳转到首页:

4)识别手势3,退出:

系统通过笔记本自带30W像素的摄像头,采用DirectShow技术进行实时视频的获取,图像尺寸是320*240,fps可以达到30-60帧/秒,可以很好的满足实时性的要求。

6结语

本文通过研究设计了一个基于视觉的手势识别技术在演示控制中的应用系统,可以看出背景差分结合颜色直方图的运动检测可以得到较好的手势区域效果;采用的基于颜色直方图的粒子跟踪也能基本实现实时跟踪的任务;在识别过程中,基于Hu不变矩的轮廓匹配算法具有很好的鲁棒性,可以得到较好手势识别效果;在应用阶段,使用手势来完成控制命令,基本实现了在播放控制中的应用。

同时,仍存在一些问题:对于光照和人脸微小晃动等外部因素引起的噪声,只能降低而无法消除,这对于手势跟踪与识别的效果还是有一定的影响,在应用时会产生一定的误操作。这些问题仍需继续研究,才能使得基于视觉的手势识别技术得到更成熟的应用。

参考文献

[1]吴晓阳.基于OpenCV的运动目标检测与跟踪[D].杭州:浙江大学,2008.

[2]CHO J U, JIN S H, PHAM X D. Object tracking circuit using particle filter with multiple features [C] / / SICE-ICASE: International Joint Conference. Las Vegas: IEEE, 2006: 1431-1436.

[3]甘志杰.基于Hu矩和支持向量机的静态手势识别及应用[D].青岛:青岛科技大学,2008.

[4]华斌,夏利娜.基于中值滤波和Hu矩向量的手语识别[J].计算机工程与设计,2011,32(2): 615- 618.

[5]伏思华,张小虎.基于序列图像的运动目标实时检测方法[J].光学术,2004,30(2): 215- 217.

[6]LINDEBERC T. Scale-space theory: a basic tool for analyzing structures at different scales [J]. Joumal of Applied Statistics. 1994, 21(2):224-270.

[7]于华平.视频序列中的手势检测与跟踪[D].南宁:广西大学,2010.

[8]QIN WEN, PENG QICONG. An improved particle filter algorithm based on neural network for visual tracking [C] / / International Conference on Communications, Circuits and Systems. Las Vegas: IEEE, 2007:765-768.

[9]龚翔. 基于粒子滤波的视觉跟踪算法研究[D]. 南京:南京理工大学,2009.

[10]YU JIAXIA, LIU WENJING, YANG Y. Improved particle filter algorithms based on partial systematic resambling [C]/ /IEEE International Conference on Intelligent Computing and Intelligent Systems. Las Vegas: IEEE, 2010: 483-487.

[11]朱志宇.粒子滤波算法及其应用[M].北京:北京科学出版社,2010.

[12]FAZLI S, POUR H M, BOUZARI H. Particle filter based object tracking with sift and color feature [C] / / Second International Conference on Machine Vision. Las Vegas: IEEE, 2009:89-93.

[13]侯一明,郭雷,伦向敏,等.运动背景下基于粒子滤波的目标跟踪[J].计算机工程与应用,2007,43(8): 62- 64.

计算机视觉的基本技术范文6

关键词:增强现实;视线追踪;应用

增强现实(Augmented Reality简称AR)技术是近年来的一个研究热点,有着广泛的应用前景。它是对现实世界的补充,使得虚拟物体从感官上成为周围真实环境的组成部分。与传统的虚拟现实(Virtual Reality简称VR)不同,增强现实只是实现对现实环境的增强,加深了对现实环境的感受。在实际的AR体验中,因为人的观察视线会不断地变化,AR系统需要实时的根据用户的视场重新建立位置坐标系,进行追踪。而视线追踪技术就是实时地跟踪用户头部的位置和视线方向,根据这些信息来确定虚拟物体在真实空间坐标中的位置,并将它实时地显示在显示器中的正确位置。

一、视线追踪技术及其特点

(一)视线追踪技术概述。

视线追踪也称为眼动追踪,它被认为是研究视觉信息加工的有效手段。利用专用设备来记录学习者的眼球运动(Eve-Movement,简称眼动)情况,可以作为分析学习者内部心理活动情况的依据。关于视线追踪技术的研究己有较长历史,目前它己在多个领域得到广泛应用。例如用于图片广告研究(网页评估、设计评估等)、动态分析(航空航天、体育运动、汽车、飞机驾驶等)、产品测试(可用性测试)、场景研究(商场购物、店铺装演、家居环境等)和人机交互等多个领域。此外,视线追踪在智能计算机、智能家电、虚拟现实和数字游戏等领域也有很好的应用前景。

在眼动实验研究中,当被试对视觉信息进行提取时,其注视时间、注视次数、注视点序列、眼跳距离、回视次数、瞳孔直径等通常被视为思维和心理加工的重要参数。因此,通过对被试在学习过程中的实时眼动信息进行观测,可用于分析和引导其学习的依据。眼动模式一般分为三种:注视(fixation)、眼跳(saccade)和追随运动(pursuit movement)。其中,持续一段时间、相对稳定的眼球运动称为注视;眼球快速运动时导致视觉区域的聚焦点产生变化,这种行为称为眼跳;眼睛缓慢、平滑地追踪某个缓慢运动的目标,则称为追随运动。通过分析眼动模式和相关参数,可以获得很多重要的信息。例如,眼跳速度会随着疲倦程度的增加而降低,而随着学习任务难度的增加而增加;眨眼速度和眼睛睁开程度的降低则可能意味着疲倦的加重。因此,可以据此来确定学习者的学习精神状态,或对其学习过程进行分析,从而采取相应的学习策略或干预措施。

(二)视线追踪系统的类型及其特点。

人眼的注视点主要由头的方位和眼睛视线决定。头的方位决定了人眼可能注视的范围,眼睛的视线决定了注视点的精确位置。国内外将视觉跟踪技术按照借助的媒介分为硬件和软件两种。以硬件为基础的视线跟踪的基本工作原理是利用图像处理技术,通过摄像机摄入瞳孔反射的红外线记录视线变化,达到视线追踪的目的。视线跟踪装置目前有穿戴式与非穿戴式,接触式与非接触式,如带上专用头盔、眼镜或者头部固定支架,置于头部上的摄像机,这种情形用户使用较不舒适。通过软件实现的视线跟踪方法,对用户没有干扰,首先利用摄像机获取头部、脸部或眼睛图像,再经过软件分析对视线定位与跟踪。由于不需要佩戴任何装置,用户的自由度舒适度较好。

人与计算机交互是研究人与计算机之间沟通的技术,将视线跟踪、语音识别、手势输入、感觉反馈等引入人机交互,提高了交互的自然性和高效性。视线追踪技术同样引发了人机交互系统的改革,鼠标、触控板的消失,及通过追踪人眼视线,用眼神来操作电脑、输入文字、玩游戏。

二、视线追踪技术在AR增强现实研究中的应用

(一)显示技术。

AR的简单定义就是将计算机生成的虚拟数字信息叠加到现实的生活场景中。这个“叠加”是需要通过显示设备作为中介来实现。

增强现实系统中的显示器可以分为头盔显示器(HMD)和非头盔显示设备。目前,一般的增强现实系统主要使用透视式头盔显示器。透视式头盔显示器主要由三个基本环节构成:虚拟信息显示通道、真实环境显示通道、图像融合及显示通道。其中,虚拟信息的显示原理与虚拟现实系统所用的浸没式头盔显示器基本相同;图像融合与显示通道是与用户交互的最终接口,根据其中真实环境的表现方式,可分为基于CCD摄像原理的视频透视式头盔显示器和基于光学原理的光学透视式头盔显示器两类。

光W透视技术是通过安装在设备眼前的光学透镜来呈现出真实和虚拟世界。首先计算机生成的虚拟信息经过光学系统放大后反射后进入视野,透过透镜又能直接看到现实场景,两部分的信息汇聚到人眼的视网膜上实现AR的效果。视频透视技术是借助安装在头显上的摄像头来捕捉获取外部真实环境,计算机将数字模拟信息叠加到摄像机的视频信号上,再将真实场景和虚拟场景进行融合。相比较光学透视技术,它的视角场更大,而且不受外界的强光干扰。不过一旦摄像机与用户的视点不能保持完全重合,会产生一些偏差。

(二)跟踪注册技术。

基于计算机视觉的注册技术主要是指利用计算机视觉获取真实场景的信息后,经过图像处理方面的知识来识别和跟踪定位真实场景。细分可以划为基于传统标志的注册算法和基于自然特征点无标志注册算法。基于计算机视觉的注册技术的精度较高,但是对计算量非常大,而且算法复杂,对系统的要求非常高。

为了取长补短,得到更加精确的注册结果,现在有结合两种技术的混合注册方法。通常是先由跟踪传感器大概估计位置姿态,再通过视觉法进一步精确调整定位。一般采用的复合法有视觉与电磁跟踪结合、视觉与惯导跟踪结合、视觉与GPS跟踪结合等。

三、结论

在国外,增强现实早已在医学、遥操作、制造与维修、可视化与教育培训、娱乐、军事训练等领域取得了成功应用。在国内,不少单位和个人对增强现实中的关键技术和算法进行了研究,并且以牙科医学、设备维修等许多背景得到了初步应用研究。但国内的研究目前仍多限于实验阶段,与国外的应用水平还有一定距离。

目前,随着增强现实的快速发展,出现了许多新的研究方向,如新的显示方式、照片真实感图形绘制、调节现实、基于网络的增强现实和针对户外随身增强现实系统的技术等等。其中涉及到的技术包括基于图像的绘制(IBMR)、多通道信息融合、普适计算技术、显示设备和跟踪设备的随身便携化等。随着系统性能的提高、操作过程的简化和设备成本的降低,增强现实会在越来越多的领域得到广泛应用。

参考文献:

[1]奚惠宁等.视线追踪应用技术的专利分析[J].电视技术,2013(S2)。