计算机视觉的前景范例6篇

前言:中文期刊网精心挑选了计算机视觉的前景范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

计算机视觉的前景

计算机视觉的前景范文1

关键词:动态场景;自适应预测;多特征融合;计算机视觉;运动目标

接受信息的关键手段之一就是视觉系统,随着科学技术水平的不断发展,以及计算机和信号处理理论的诞生,让机器拥有人类视觉功能已经不再是梦。对所采集视频中的运动目标进行跟踪、检测,并对其目标行为进行分析,就是运动目标分析的内容,运动目标分析是计算机视觉领域关键内容之一,其属于图像理解与图像分析的范畴。而在运动目标分析系统中,跟踪与检测运动目标则为中级和低级处理部分,是分析与理解行为的高等层分析模块的基础。检测与跟踪运动目标技术主要包括了:机器人视觉导航、军事领域、运动图像编码、交通管制、视觉监视等。

1目标检测算法

连续图像序列由视频中提取出,由前景区域与背景区域共同组成了整个画面。前景区域包含了如运动的人体、车辆等动态要素,它是指人们较为感兴趣的区域。而背景区域主要包含例如树木、建筑物等静态要素,它的像素值仅发生微弱变化或者不产生变化。在连续图像序列中,采用一系列算法分隔开背景区域和前景区域,将运动目标信息有效提取,则为运动目标检测。以静态场景为基础的运动目标检测算法包括了光流法、背景差分法、帧间查分法等,文章主要针对背景差分法进行介绍。

背景差分法通常适用于静态场景,其是将背景图像与当前帧图像进行差分,运动目标依靠阀值化进行检测,因为该算法仅能够在背景变化缓慢或者不发生变化的情况下应用,因此就有着一定的局限性。假设当前帧图像为fk(x,y),背景图像B(x,y)可通过一定的方法得出,而这时背景差分图像则为:

(1)

而假设二值化阀值为Th,二值化图像B(x,y)则为:

(2)

运动目标检测结果可通过数学形态学处理获得。

2 背景模型的实时更新

要更新背景图像可采用一阶KALMAN滤波来实现,为了克服气候变化、光照变化等外部环境变化对运动检测产生的影响,采用一阶KALMAN滤波更新背景图像公式如下:

Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

而增益因子则为:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

公式中?琢1和?琢2是权值系数;M是第k时刻二值化后目标图像中p像素的值;B为背景图像;I为当前帧图像。要想将运动目标从背景序列图像中有效分割出来,就必须要达到?琢2足够小的条件,且?琢1应等于或者大于10?琢2,若?琢1值过大,就会将算法自身的去噪特性丧失,在序列背景图像中也会存储越来越多的运动变化。

3 更新车辆目标模型

核与活动轮廓算法具有效率高、技术复杂度低等特点,它以非参数核概率密度估计理论为基础,在视频运动目标跟踪中广泛应用。彩色图像序列通过摄像机获取,人脸目标模型可以采用RGB颜色空间来进行描述。在跟踪车辆的过程中,噪声、遮挡、光照等干扰或多或少存在,因干扰因素的存在,车辆像素特征也会发生相应的微弱变化。若不对目标模型进行更新,会对跟踪精度产生影响,所以,采用的矩形模板会包括一定背景。而在实施跟踪的过程中,要对车辆目标模型进行更换。如果其过程物遮挡,当BHATTACHARYYA系数满足?籽>Tudm条件时,更新车辆目标模型,更新模型为:

(5)

公式中Tudm是模板更新阀值;qk-1是更新之前的车辆目标模型。通过视频跟踪,在近场景和远场景拍摄到的视频中,多尺度图像空间由各个帧图像构成。例如:将将书本作为跟踪对象,由远及近从书本的正上方拍摄六十帧图像,为了能使矩形框正好能够包含书本,对每帧图像张书本手工划定矩形框,并对框内图像的信息量进行统计。最后,随书本尺度的变化,给出图像信息量变化曲线。

4 计算机视觉原理

计算机视觉是一门研究怎样使机器进行观察的科学,更切确地说,就是指利用电脑和摄影机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为传送给仪器检测或更适合人眼观察的图像。计算机视觉研究相关的理论和技术作为一个科学学科,尝试创建能够从图像或者多维数据中获取信息的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个决定的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中感知的科学。

计算机视觉就是由计算机来代替大脑完成处理和解释,用各种成象系统代替视觉器官作为输入敏感手段。使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力就是计算机视觉的最终研究目标,而需要经过长期的努力才能达到这个目标。所以,在实现最终目标以前,通过努力的中期目标是建立一种视觉系统,这个系统能依靠反馈的某种程度的智能和视觉敏感完成一定的任务。例如:计算机视觉的一个重要应用领域就是自主车辆的视觉导航,但要实现自主导航的系统,却还没有条件实现象人那样能识别和理解任何环境。所以,人们通过不懈的努力,研究在高速公路上具有道路跟踪能力,有效避免与前方车辆碰撞的视觉辅助驾驶系统。人类视觉系统是有史以来,人们所知道的功能最强大和完善的视觉系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理,但并不等于计算机必须按人类视觉的方法完成视觉信息的处理。可以说,对人类视觉处理机制的研究将给计算机视觉的研究提供指导和启发,所以,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,与此同时也是一个十分重要和让人感兴趣的研究领域。这方面的研究被称为计算视觉。计算视觉可被认为是计算机视觉中的一个研究领域。计算机视觉领域的不完善性与多样性为其突出特点。

5 结束语

对视频中的运动目标进行跟踪、识别、检测,并对目标行为进行研究、分析,这就是基于视觉运动目标分析。以计算机视觉为基础,分析运动目标,包括了目标行为的理解与分析、目标跟踪、运动目标检测、预处理图像等,它是计算机视觉领域重要内容之一。理解与分析运动目标的行为,既是计算机视觉的根本目的之一,也是检测与跟踪运动目标的最终目标。从理论层考虑,理解与分析运动目标的行为可以分为人工智能理论研究与模式识别。简要阐述基于计算机视觉的运动目标分析,而所面临的是对运动目标行为的理解。

参考文献

[1]杨可,刘明军,毛欣,夏维建,刘伟,周旋,吴炜,周凯.基于计算机视觉的电缆终端表面温升分析系统[J].电视技术,2013(7).

[2]叶闯,沈益青,李豪,曹思汗,王柏祥.基于人类视觉特性(HVS)的离散小波变换(DWT)数字水印算法[J].浙江大学学报:理学版,2013(2).

[3]何青海,马本学,瞿端阳,李宏伟,王宝.基于机器视觉棉叶螨自动监测与分级方法研究[J].农机化研究,2013(4).

[4]贾挺猛,苟一,鲍官军,董茂,杨庆华.基于机器视觉的葡萄树枝骨架提取算法研究[J].机电工程,2013(4).

计算机视觉的前景范文2

关键词:印制电路板;图像处理;机器视觉;PCB裸板;自动光学检测;缺陷检测 文献标识码:A

中图分类号:TP391 文章编号:1009-2374(2016)09-0010-05 DOI:10.13535/ki.11-4406/n.2016.09.005

我国是全球第一大PCB生产基地,作为电子产品承载体的电路板,其集成度和产量不断在提高。为了保证电子产品的性能,电路板缺陷检测技术已经成为电子行业中非常关键的技术。建立在图像处理算法基础上的机器视觉检测技术与传统的人工检测技术相比,提高了缺陷检测的效率和准确度。因此,设计一种高效精准的机器视觉检测电路板缺陷的系统,具有非常重要的现实意义。评估印刷电路板质量的一个重要因素就是表观检测,PCB的表观质量对产品性能及成品使用安全有着极大的重要性。而伴随着近年来在工业生产领域崛起的计算机视觉,当前表观缺陷检测和分类识别的研究方向已经转向了利用计算机视觉技术来实现。计算机图像处理识别技术这种基于计算机视觉的检测技术成功取代了传统的PCB缺陷检测方法,在自动光学检测系统众多应用中占据了相对重要的地位,一跃成为PCB生产业表观缺陷的主要检测方法。

图1 系统框图

因此本文通过设计AOI自动光学检测系统,搭建较为简单的PCB缺陷自动检测系统的实验平台,对PCB中四类较为关键、常见的缺陷进行检测、分析、识别、判定,为研究推广PCB缺陷自动检测系统开拓应用前景,如能实现工业上的产业化检测,将有高额的经济收益。本文侧重对PCB中的四类较为关键、常见的缺陷进行检测、分析、识别、判定,并且仅搭建了较为简单的PCB缺陷自动检测系统的实验平台,即通过复杂算法对采集到的图像进行处理、配准、对比,从而得出PCB缺陷类型及对其进行标识。如图1所示。

1 硬件设计方案

PCB缺陷检测的总体系统设计方案主要是基于自动光学检测技术来搭建PCB缺陷检测系统,硬件设计是使用CNC-T程控光源高精度影像测试系统操作台,对待测电路板进行图像采集,再通过VS2010软件所编写程序处理,得出待测电路板的缺陷种类。整个系统主要分为运动控制、光源、图像采集、图像处理四个模块,分模块简要阐述了实验过程、所需设备以及软件算法,搭建了一个相对完整的系统工作平台。

图2 CNC-T程控光源影像操作台

该设备具有测量元素种类齐全、手动测量、自动对焦等多种功能,使用该设备采集图像进行二维检测,测量软体为YR-CNC,将图像储存至电脑后便由VS软件进行图像处理。实验组成如图3所示:

图3 实验系统框图

1.1 运动控制模块

本系统运动流程为:被检测的PCB在检测台上,通过步进电机XY轴运动到摄像机拍摄区域,CCD摄像机固定在工作台上方(Z轴),通过Z轴的运动实现聚焦。如图4所示:

图4 平台运动示意图

设备工作台台面尺寸为746mm×506mm,承载玻璃面尺寸为452mm×354mm,有效测量行程为400×300×200。本装置既可通过软件驱动自动采集图像,也可以通过手动控制,移动并聚焦采集待测PCB的图像。

1.2 光源模块

辅助光照――采用的是正向和背向光源这两种辅助光照。其中正光源和摄像头同侧,均位于Z轴上,正光源主要用于检测待测物体的表面特征。背光源位于检测台面下方,与正光源处于同轴反向关系,背光源能突出待测物体的轮廓特征,常用于检测物体轮廓尺寸。

图像采集:分别利用正光源突出PCB表面如走线、过孔和焊盘等主要特征,而下光源主要使PCB的轮廓尺寸和过孔产生强烈的轮廓对比。

光源:使用的是高度集中照明光源中心的LDR系列,由于该光源的伞状结构紧密排列着LED且采用了CCS独创的柔性板,使之成为LED照明系统的标准模式。照明系统如图5所示:

图5 照明系统

1.3 图像采集模块

图像采集模块是由图像采集卡、相机和镜头组成的,该模块是图像配准阶段的硬件基础。计算机采集图像的媒介就是相机,而相机按照不同原理又分为多种,常见的有CCD(Charge Coupled Device)和CMOS(Complementary Metal Oxide Semiconductor)两类。本系统采用的是CCD 1/2英寸43万像素彩色摄像头和高清晰度0.7~4.5X变焦倍率镜头,显示分辨率为0.001mm。

1.4 图像处理模块

通常获得的图像将受到工业现场环境、光照等条件的干扰,计算机所获得的图像质量多数参差不齐,图像的清晰度不一致,大大增加了PCB缺陷检测的难度,所以在利用复杂算法检测、识别PCB缺陷前要先对图像进行预处理。

本图像处理模块主要通过VS软件在OpenCV计算机视觉库的基础上,通过一系列算法对图像进行处理对比。

2 系统软件设计

2.1 OpenCV

OpenCV(Open Source Computer Vision Library)是一个跨平台的可以运行在Linux、Windows和Mac OS操作系统上的基于(开源)发行的计算机视觉库。它重量轻而高效,开放了多种接口如MATLAB、Ruby和Python等,并且在计算机视觉和图像处理中大多数通用的算法都是被允许的。OpenCV可用于开发实时图像处理、计算机视觉和模式识别方案,它提供了多种函数,实现了大量的计算机视觉算法,算法涵盖了从最基础的滤波至以高级的物体检测。OpenCV实际上是一堆C和C++语言源代码文件,许多常见的计算机视觉算法由这些源代码文件实现。如C接口函数cvCanny()实现Canny边缘检测算法。它可直接加入到我们自己的软件项目编程中,而无需去编写自己的Canny算子代码,就是没有必要重复“造轮子”。

根据OpenCV中源代码文件巨多的特点,以算法的功能为基准,将这些源文件分到多个模块中,如core、imgproc、highgui等。将每个模块中的源文件编译成一个库文件(如opencv_core.lib、opencv_imgproc.lib、opencv_highgui.lib等),用户在使用时,仅需在自己的项目中添加要用的库文件,与自己的源文件一起连接成可执行程序即可。

OpenCV计算机视觉库的出现,是为了使人们利用方便快捷的计算机视觉框架,在计算机视觉领域可以更加轻松地设计出更为复杂的应用程序。OpenCV涵盖了多种计算机视觉应用区域,如用户界面、信息安全、医学影像学、工厂产品检验、立体视觉、机器人和摄像机标定等,约有500多个函数。因为计算机视觉与机器学习是相辅相成的,所以OpenCV也开放了MLL(Machine Learning Library)机器学习库。MLL除了在视觉任务相关中使用,也可以很容易地应用到其他机器学习中。

2.2 Microsoft Visual Studio2010

Visual Studio是微软公司推出的开发环境,是同行业中目前最流行的Windows平台应用程序开发环境。Visual Studio 2010于2010年4月12日,其集成开发环境(IDE)已被重新设计和组织,变得更简单了。

Visual Studio 2010同时带来了NET Framework 4.0、Microsoft Visual Studio 2010 CTP(Community Technology Preview――CTP),并且支持开发面向Windows 7的应用程序。除了Microsoft SQL Server外,它还支持IBM DB2和Oracle数据库。目前有专业版、高级版、旗舰版、学习版和测试版五个版本。Visual Studio的用处十分广泛,不仅可被用来基于Windows平台创建Windows应用程序和Web应用程序,还可被用来创建智能设备、Office插件和Web服务等应用程序。微软的Visual Studio 2010将成为一个版本的经典,这是相当于6.0版本。该版本可以自定义开始页,新功能还包括:(1)C# 4.0中的动态类型和动态编程;(2)多显示器支持;(3)使用Visual Studio 2010的特性支持TDD;(4)支持Office;(5)Quick Search特性;(6)C++ 0x新特性;(7)IDE增强;(8)使用Visual C++ 2010创建Ribbon界面;(9)新增基于.NET平台的语言F#。本课题将基于OpenCV计算机视觉库使用Microsoft Visual Studio2010开发环境,通过编辑算法实现PCB缺陷检测。

3 图像预处理

要使用计算机对图像进行处理,所得到的连续图像就必须被转换为离散的数据集,这是因为计算机只能处理离散度数据,这一过程我们称之为图像采集。图像采集由图像采集系统实现,如图6所示。图像采集系统的三个主要模块是成像系统、采样系统和量化器。

图6

将整理出的字符图像交予识别模块来识别,被称为图像的预处理。PCB的图像预处理包括灰度化、增强、滤波、二值化、配准等,处理后的PCB输出的图像质量将得到改善,在很大程度上使得该图像特征更直观,方便计算机分析和处理。PCB的图像预处理为整个PCB缺陷检测系统的核心部件,很大程度上决定了检测的准确性。图像预处理流程如图7所示:

图7 图像预处理流程图

4 PCB缺陷检测

本文针对四种常见缺陷:断路、短路、毛刺(凸起)、缺损(凹陷)进行检测研究。在这四种缺陷中,最为严重的缺陷类型是断路和短路,它们将会使整块板子失去本来的功能;而凸起、凹陷也可能影响到PCB在使用过程中的稳定性能。如图8所示为几种常见的缺陷:

图8 常见电路板缺陷

4.1 PCB缺陷的检测方法

常用的PCB缺陷检测方法有参考法和非参考法两种。要是从概念理解和电路难易程度看,参考法明显更加具有概念直观、电路简单的优势;要是从检测所需要的条件来看,非参考法则在不需要待测PCB与标准PCB进行准确对准这一点上优于参考法。

本课题采用参考法进行PCB缺陷检测。

使用参考法对PCB缺陷进行检测的流程为:(1)确定标准的PCB图像并放入参考库;(2)通过成像设备采集待测PCB图像,进行图像预处理之后,再二值化PCB待测图像,并对其进行连通域提取;(3)然后将处理结果与标准图像进行对比,利用图像相减来判断PCB可能存在的缺陷;(4)进行分类,确定缺陷类型。

4.2 图像连通域

像素是图像中最小的单位,每个像素周围有8个邻接像素,常见的邻接关系有两种:4邻接与8邻接。4邻接一共4个点,即上下左右。包括对角线位置的点,8邻接的点一共有8个,如图9所示:

图9 领域示图

如果像素点A与B邻接,我们称A与B连通,即有如下的结论:

如果A与B连通、B与C连通,则A与C连通。在视觉上看来,点与点相互连通,形成一个区域,而不是连通的点形成不同的区域。这种相互立体的所有的点,我们称为连通区域。连通区域标记常用的方法有Two-Pass(两遍扫描法)和Seed Filling(种子填充法)两种方法,本课题主要介绍第二种。

Seed Filling来源于计算机图形学,通常应用在填充图形上。思路:以一个前景像素当作种子,而后在处于同一像素值且位置相邻的连通区域,把和种子相邻的前景像素融合到同一组像素中,结果将是获得一个像素集,即连通区域。接下来介绍使用种子填充法实现的连通区域分析法:

第一,重复扫描图像,当得到当前像素点B(x,y)=1时停止:(1)赋予B(x,y)一个label,并将像素位置作为种子,接着将所有位于该种子周围的前景像素都压入栈中;(2)将栈顶像素赋以相同的label值并弹出,接着将全部位于栈顶像素周边的前景像素都压入栈中;(3)重复(2)步骤,直到栈为空。此时,图像B中的一个像素值被标记为label的连通区域便被找到了。

第二,在扫描结束前,重复第一个步骤,由此可以获得图像B中所有的连通区域在扫描结束后。

扫描所得的连通域如图10所示:

图10 图像连通域提取

4.3 缺陷识别

缺陷识别具体特征如表1所示:

表1 缺陷特征

缺陷种类 二值图像面积 连通区域数

断路 减少 增加

短路 增加 减少

凸起 增加 不变

凹陷 减少 不变

第一,短路和断路。在出现短路缺陷时,待测图像与标准图像相比,其所包含的连通区域数将会减少。同理可得,在出现断路缺陷时,待测图像与标准图像相比,其所包含的连通区域数将会增多。因此,断路和短路缺陷便可利用比较连通区域数来判定和识别。

第二,凸起和凹陷。凸起缺陷将导致导线和导线、导线和其他导体间的间隙变小,而凹陷缺陷将导致导线和导线、导线和其他导体间的间隙变大,二者均会导致PCB使用过程中出现不稳定状态。而观察可知,这两种缺陷的连通区域相同,差别在于各自二值化面积的大小,所以可以通过计算该待测图像的连通区域面积来识别凸起、凹陷缺陷。

识别过程:将经过图像预处理的待测PCB图像与标准图像进行对比后,通过算法找出缺陷。比较二者的连通区域数,若前者大于后者,则标定该缺陷点为断路,反之则为短路;若二者连通区域数相同,则比较二值化图像面积,若前者大于后者,则标定该缺陷点为凸起,反之则为凹陷。检测流程如图11所示:

图11 PCB缺陷检测流程图

5 系统实验

本文使用CNC-T程控光源高精度影像测试系统操作台,结合VS2010软件基于OpenCV计算机视觉库的算法编程来实现PCB的缺陷检测。整体实验过程为:手动控制操作台捕捉、聚焦、采集待测PCB的图像,采集到的图像与标准图像进行对比、识别,得出缺陷种类并显示结果。

本课题一共就所研究缺陷类型,做了40组实验,通过实验结果计算正确率。如表2所示:

表2 实验结果统计

缺陷类型 实验次数 正确率

断路 10 100%

短路 10 100%

凸起 10 100%

凹陷 10 100%

针对不同电路板图中出现的同种断路类型进行检测,效果如图12a、图12b、图12c所示,可准确检测出缺陷存在。

图12

针对不同电路板图中出现的同种短路类型进行检测,效果如图13a、图13b、图13c所示,可准确检测出缺陷存在。

图13

针对不同电路板图中出现的同种凸起类型进行检测,效果如图14a、图14b、图14c所示,可准确检测出缺陷存在。

图14

针对不同电路板图中出现的同种凹陷类型进行检测,效果如图15a、图15b、图15c所示,可准确检测出缺陷存在。

图15

6 结语

PCB板面向体积越来越小、密度越来越高的方向发展。在检测产品价格方面,国外AOI检测产品价格普遍偏高,而由于经济原因,在国内PCB板生产制造商多数仍采用人工目测等传统检测方法检测。随着经济的发展,数字图像处理研究的深入,自动光学检测系统也开始频繁活跃在人们视线中,但在PCB缺陷检测方面的应用却还有待完善。因此,本论文建立在深入掌握工控系统结构并从PCB板的质量标准、图像特点、缺陷特征及检测要求的分析基础上,对以图像处理为基础的PCB缺陷检测技术进行了深入研究。由于PCB缺陷自动检测系统的研究涉及多个领域的知识,其研究过程十分耗时、繁琐,由此,本论文仅仅对PCB缺陷检测中较为常见的问题进行了较深入研究,并且仅搭建了较为简单的PCB缺陷自动检测系统的实验平台,对PCB中的四类较为关键、常见的缺陷进行检测、分析、识别、判定。虽然还未实现真正实现工业上产业化检测,但是在未来几十年中,研究推广的PCB缺陷自动检测系统将有十分良好的应用前景,也将有高额的经济收益。

参考文献

[1] 陈胜勇,刘盛,等.基于OpenCV的计算机视觉技术实现[M].北京:科学出版社,2008.

[2] Gary Bradski,Adrian Kaebler,于仕琪,等.学习OpenCV[M].北京:清华大学出版社,2009.

[3] 周长发.精通Visual C++图像处理编程(第3版)

[M].北京:电子工业出版社,2006.

[4] 党振.中国大陆PCB产业的现状与未来[J].印制电路信息,2006,32(1).

[5] 胡跃明,谭颖.自动光学检测在中国的应用现状和发展[J].微计算机信息,2006,(4).

[6] 李汉,何星,等.印刷电路板的自动光学检测系统

[J].无损检测,2004,26(6).

[7] 张利,高永英,等.PCB板检测中的定位研究[J].中国图像图形学,1999,4(8).

[8] 姚立新,张武学,等.AOI系统在PCB中的应用[J].电子工业专用备,2004,(5).

[9] 范小涛,夏雨人.一种基于图像处理的PCB检测算法研究[J].计算机工程与应用,2004,(13).

[10] 傅莉.印制电路板的发展及前景[J].电脑与电信,2010,(5).

[11] 张明轩.基于视频序列的人脸检测与跟踪算法研究[D].中北大学,2011.

[12] 张驰.基于机器视觉的智能控制与图像识别问题研究[D].兰州理工大学,2009.

[13] 谢飞.基于计算机视觉的自动光学检测关键技术与应用研究[D].南京大学,2013.

[14] 张静.PCB表观缺陷的自动光学检测理论与技术

[D].电子科技大学,2013.

[15] 俞玮.AOI技术在PCB缺陷检测中的应用研究[D].电子科技大学,2007.

计算机视觉的前景范文3

关键词:计算机视觉;背景差法;图像处理;车流量检测;二值化

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2013)19-4493-03

随着现代交通的快速发展,车辆的日益增多,合理利用道路资源成为目前一项重要课题。为了实现快速准确地检测道路中的车流量,该文提出了一种基于计算机视觉的车流量检测方法。

1 车辆前景图像的提取

对车辆进行检测的前提是提取车辆的前景图像,即在视频序列中实时地发现并提取运动目标,为之后运动目标的处理、识别、分析等算法提供数据[1]。一般情况下视频监控中背景与摄像头之间相对位置保持不变,则背景图像的大小和位置在不同帧中将保持不变,于是可以直接利用帧间同一位置像素的亮度或颜色的差别来进行变化检测,并提取目标。对于运动目标检测和提取算法,常用的有帧间差法、背景差法这两种方法。

帧间差法是利用相邻帧的图像相减得到车辆的前景图像,而背景差法是利用当前的图像减去背景图像得到车辆的前景图像。后者更加直接有效,通常能够提供最完备的特征数据,是当前静止背景下进行运动目标检测的最常用的方法[2]。具体做法:

[Dt(x,y)=ft(x,y)-f(x,y)] (1)

其中[Dt(x,y)]为提取出来的车辆前景图像;[ft(x,y)]为当前视频图像;[f(x,y)]为视频的背景图像。摄像头的位置是不变的,所以当前视频图像的背景与背景图片相同,相减后相同点的灰度值都变为零。而车辆包含的点在两幅图中的灰度值不一样,相减后不为零 [3]。实验结果如图1-图3所示。

如图所示:实时路况图像与背景图像相减后可以得到车辆前景图像。这种方法得到的车辆前景图像很完整,能够很清楚的分辨出前景车辆。但这种方法最大的缺陷就是阴影问题比较严重,与此同时,背景图像的选取也很重要。

2 车辆前景图像的处理

2.1图像二值化

摄像头拍摄到的图像一般为彩色图像,包含了丰富的信息,比如光照信息,物体表面的颜色信息等。但这些信息对运动车辆的检测作用不大,并且占用了大量的内存空间,严重影响到图像处理的速度和效率。因此,我们需要对图像进行二值化处理 [4]。

在数字图像处理中,二值图像占有非常重要的地位。二值化后的图像不再涉及像素的多级值,使处理变得简单,而且数据的处理量较小。此外,二值化后的图像能够用几何学中的概念进行分析和特征描述,具有很大的优势。为了得到理想的二值图,我们一般用值域分割的方法,即该点的灰度值大于某个值时,就将该点的灰度值置为1,而小于该值的话就将该点的灰度值置为0。

[g(x,y)=1f(x,y)≥T0f(x,y)≥T] (2)

通过设定阈值T,可以将图像进行二值化。二值化后可以很清晰地分辨出车辆信息。便于图像的后期处理。图4为二值化后的图像,该图像可以很清楚地分辨出车辆信息,但会出现有些车辆的前景图像不完整或区域不连通,这样对车辆计数有很大影响,这就需要对车辆前景图像进行完善处理。

2.2图像膨胀和填充

经过二值化后的图片,由于车辆本身各点的像素灰度值不同,其有些点的灰度值与背景图像上相应点的灰度值很接近,再经过一定阈值的二值化后,这些点的灰度值就完全为“0”[5]。这样一辆车得到得前景图像就会不完整或者区域不连通,会导致图像中目标计数的不准确。针对这个问题可以通过图像的膨胀和填充将图片变得更完整。

如图5可知,车辆的二值图像已经是一个完整的块,但图像仍然含有噪声及小物体(如青色框框出部分),计算机同样也会将其默认为车辆信息。因此我们需要将这些噪声和小物体去除掉。

2.3图像去噪

在车辆的前景图像中由于噪声的存在以及二值化阈值取得不合理会导致二值化图像中小目标的出现,从而影响计算机对车辆的识别。因此,我们需要将图像中这样的小物体去除。首先我们要区分开车辆的前景图像和小物体,我们可以从面积来识别车辆。一般小目标二值化后的面积要比车辆的面积小得多,通过设定合适的阈值,可以将小目标去除,这样就可以得到仅为车辆前景图像的二值化图[6]。如图6。

2.4车辆计数

车辆前景图像经过二值化,膨胀,填充等一系列处理之后,图像中每个车辆都有自己独立的区域,计算机就可以对图像中目标进行计数。由于每个区域的图像像素是连续的,在二值图像中表现为连通性,因此可以利用计算连通图的数量来求出目标数量。在MATLAB中利用bwlabel函数[7]可求出连通图的数量,对于图6中的车辆计数结果如图7。

虽然摄像头置高可以解决部分车辆重叠问题,但由于车辆阴影的影响还会有部分车辆会粘连在一起。由图8可知:目标块2,3,4,5这四个都是一辆车得二值化图像块,但目标块1却不是一辆车的二值化图像块。目标块1是几辆车粘连在一块了,这样就导致计算机对车辆的计数有误差。

但是从各个块得外接矩形可以明显比较出图像块1的外接矩形形状和其他四个有明显差别。根据这个差别我们可以通过外接矩形的长宽比来赋予计算机识别车辆粘连问题的能力。通过给车辆块的外接矩形的长宽比定义设定阈值,在设定的阈值范围内就表示有辆车。从而计算出粘连在一块的车的数量。下面是车辆计数结果:

图像中目标块数为5块,真实车辆块数为7辆(2辆汽车,1辆电瓶车)。

3 结束语

实验结果表明,该文方法鲁棒性好,实用价值高,能够准确地对车辆进行计数,得到实时路况信息,在只能交通领域有着广泛的应用前景。

参考文献:

[1] 章毓晋.图像理解和计算机视觉[M].北京:清华大学出版社,2000.

[2] 卢强,陈泉林,林康红,奉玲,等.智能交通监控系统中路况图像背景去除算法研究[J].电子技术应用,2001(11):35-36.

[3] 董长虹,赖志国,余啸海. Matlab图像处理与应用[M].北京:国防工业出版社,2004.

[4] 夏良正.数字图像处理[M].南京:东南大学出版社,2001.

[5] 容观澳.计算机图像处理[M].清华大学出版社,2000.

计算机视觉的前景范文4

关键词:无损检测;农产品;分级

引言:自1993年开始,我国果品总产量超过印度、巴西和美国,跃居世界首位。因此,水果的品质分析就显得更加重要。水果品质检测主要包括硬度、糖度、酸度等多种指标检测,传统的检测方法主要采用的是化学方法,测量过程复杂,等待时间长,也就降低了其实际的使用意义。无损检测技术(Nondestructive Determination Techonol ogies,简称NDT)主要指的是在不破坏或损坏被检测对象的基础上,利用农产品内部结构异常或缺陷存在所引起的对热、声、光、电、磁等反应的变化,来探测各种农产品等内部和表面缺陷,并对缺陷的类型、性质、数量、形状、位置、尺寸、分布及其变化做出判断和评价。

一、农产品无损检测技术介绍

(一)核磁共振技术

核磁共振技术(NMR)是一种探测浓缩氢质子的技术,它对农产品中的水、脂的混合团料状态下的响应变化比较敏感。自1946年美国科学家F.Bloch和E.M.Purcell发现了核磁共振现象以来,核磁共振技术在研究物质的结构方面得到了广泛应用。核磁共振能生成果实内部组织的高清晰图像,不仅可用于检测果品的压伤、虫害、成熟度,在测定苹果、香蕉的糖度等方面也具有潜在价值。对于采收成熟度直接影响品质的品种,利用核磁共振技术可大大提高收获、运输的可靠性。目前,该项技术真正用于果品的内部检测和质量评价还有很多问题有待研究,但由于其卓越的优点,将会是一种很好的果品无损检测方法。

(二)声学特征的应用

声学特性反映的是声波和农产品相互作用的基本规律,利用声学特性主要是指根据农产品在声波作用下反射特性、散射特性、吸收特性、衰减系数和声波传播速度及本身声阻抗、固有频率等的变化与农产品内部组织变化如结构、成分、物理状态等物化特性信息间的关系进行。用于检测的超声波一般为低能超声波,在被检测物中传播时不会引起其物理或化学特性的变化。低能超声测量中最常用的3个参数为:声速、声衰减系数、声阻抗。声学无损检测技术与光学、电学及其他无损检测技术相比,有适应性强、投资较低、操作简便快捷等优点,适用于在线检测,在农产品检测领域的应用前景良好。

利用农产品声学特性对其内部品质进行无损检测和分级是生物学、声学、农业物料学、电子学、计算机等学科在农产品生产和加工中的综合应用,该技术适应性强,检测灵敏度高,对人体无害,成本低廉,易实现自动化,是果品无损检测技术发展的重点领域。虽然国外学者对此技术已做了较多基础研究,但这些研究基本上是研究农产品声学特性共振频率、反射折射透射特性、吸收特性、衰减特性、传播速度、声阻抗等中的某一特性与农产品某一品质指标的关系,而对多种声学特性对农产品某一内部品质指标或多种内部品质指标的综合影响的研究报道很少,阻碍了声学检测精度的提高。

(三)近红外分析法的应用

近红外光谱分析技术(Near Infrared Spectroscopy Analysis,简称NIR)是利用样品中有代表性的有机成分在近红外光谱区域的最强吸收波长不同,以及吸收的强度与有机成分呈线性关系的原理进行定量分析。通过对已知有机成分含量的样品与其近红外光谱特征的回归分析,建立定标方程,即可对含有同一种有机成分的样品进行定量估测。

近红外线波长为800~2500 nm,近红外线照射在果实上,果实中构成糖和酸的官能基(-OH,-CH2,-NH)吸收与相应分子固有振动相一致的特定光线,近红外分光法就是利用上述特性,从被吸收的光量非破坏检测糖、酸、水分和叶绿素等成分的一种技术。该方法仅在建立标定线时破坏果实测定其化学成分,标定线做成后,只需测定样品的近红外线分光频谱,就可得到成分的预测值,还能在瞬间同时测定多个成分。

(四)X射线检测技术的应用

X射线检测技术是指利用X射线的穿透能力对果蔬品质进行检测的一种方法。X射线具有很好的穿透能力,而物质的密度大小又影响了其穿透量的多少,通过对透过穿透量多少的分析从而可以对物质的内部品质进行分析。检测时所需的X射线强度弱,所以通常称为软X射线检测技术。X射线检测技术本来是为检测一些不易拆卸分解的大型构件或机械零件的内部缺陷而开发应用的,近来已被成功地移植到农产品加工领域。

(五)机器视觉技术的应用

20世纪70年代开始,计算机视觉技术开始被应用到工业和农业之中,主要进行的是植物种类的鉴别、农产品品质检测和分级。由于图像处理技术专业的出现以及计算机成本的降低,机器视觉技术在农产品品质检测与分级领域的应用中越来越具有吸引力。

计算机视觉是以计算机和图像获取部分为工具,以图像处理技术、图像分析技术、模式识别技术、人工智能技术为依托,处理所获取的图像信号,并从图像中获取某些特定信息。计算机视觉技术无需接触特定对象便可从获取的图像中得到大量的信息,通过对这些信息的分析得到物体尺寸、表面缺陷、外观形状、表面色度等具体信息,进而实现外观质量的综合评价。

现在,用于农产品品质检测与分级的可见光快速检测主要是基于计算机视觉的检测技术,利用光学传感器或扫描摄像机摄像,综合测出果品的表面颜色、对特定光的透光率、形状和大小,并与事先贮存在计算机中的数据模型进行对比,推算出成熟度和糖分。

(六)电子鼻技术的应用

电子鼻技术是近年来兴起的一种农产品无损检测的方法,电子鼻一般由气敏传感器阵列、信号处理子系统和模式识别子系统等3大部分组成。它以特定的传感器和模式识别系统快速提供被测样品的整体信息,从而指示样品的隐含特征。与普通的化学分析仪器,如色谱仪、光谱仪等不同,电子鼻得到的不是被测样品中某种或某几种成分的定性与定量结果,而是给予样品中挥发性成分的整体信息,也称“指纹”数据。

由于在同一个仪器装置里采用了多类不同的矩阵技术,使检测更能模拟人类嗅觉神经细胞,根据气味标识和利用化学计量统计学软件对不同气味进行快速鉴别。在建立数据库的基础上,对每一样品进行数据计算和识别,可得到样品的“气味指纹图”和“气味标记”。

二、无损检测技术的应用前景

无损检测技术作为一种新兴的检测技术,在不破坏果蔬品质的基础上,对果蔬的品质进行检测和分级利用光学、电学以及电脑信息技术等的先进技术对果蔬的品质进行准确、快速的检测。随着我国人民生活水平的提高,我们对新鲜果蔬的品质要求也越来越高,无损检测技术适合加工高效率、大规模的要求,因此,这种检测方法必将在未来的农产品检测和分级中得到广泛的应用。

参考文献:

计算机视觉的前景范文5

关键词:农业机械;技术手段;应用;发展前景

我国在国际上的地位正在逐渐提高,这与我国的经济发展是分不开的,经济的发展需要基础的支持,农业就是我国的基础,我国是农业大国,农村人口基数大。随着近几年我国农业的发展,很多高新技术也被运用到农业的机械设备中,使农机设备向着智能化的方向发展,有效地提升了农业生产的整体效率。在农业的生产中使用高新技术还能够提高农业的生产效率,保证农机相关机械的正常运作。

1农业机械技术的应用分析

1.1计算机技术

这里所说的计算机技术主要指的是计算机视觉技术,这一技术最早被运用在农业机械上是在20世纪70年代中期,当时主要运用的是计算机技术中的视觉技术,利用这一技术的主要目的是可以对农产品的品质质量进行分级别检查。计算机视觉技术是以图像处理为基准,随着图像处理以及视觉模拟技术的发展,计算机视觉技术不仅可以用来检查农产品的品质,而且还可以用来对农产品进行播种、收割。虽然计算机视觉技术在我国农业技术领域的应用时间还不是很长,在实际的使用中还有很多的问题出现,但是相信随着科学技术的不断发展,计算机视觉技术必将会改变传统的农业作业模式,为现代化农业发展提供技术上的支持。

1.2网络信息技术

网络信息技术在我国农业机械上的应用是非常成功的,信息技术与地理信息系统的有机结合不仅可以为农业的生产提供高精度的监控,而且还能够对农业生产中出现病虫害的情况进行及时的检测,然后根据定位系统来进行田间作业。

1.3液压技术

液压技术主要依靠的是微电子技术和工业传感技术,在数据的采集上,运用液压技术主要完成的是能量的转换和匹配,其目的是为了让农业机械的效率能够得到进一步的提高,让机械设备的相关系统特征可以得到完善,让机械设备的可靠性能够得到提升,这也很好地符合了环境保护的相关标准要求。而大部分的农业机械都是采用内燃机作为原动力,所以很多时候都会出现工作负荷,一般情况下,我们都是通过电液控制手段来完成负载与原动力之间的匹配情况,尽可能地减少功率传输过程中出现的损失,从而提高农业机械系统的工作效率。

1.4人工智能技术

随着信息全球化的不断深入,高端技术不仅在大型的企事业单位中被运用,在农业中也得到了广泛的应用,比较有成果的就是美国利用人工智能技术研发出激光拖拉机、机械的内部导航装置,等等,这些装置可以对拖拉机的运行方向及所处位置进行实时的测定,在了解地区土地信息之后,再制定合理的土地种植方案、农药及种子的数量,等等。

2农业机械技术的发展趋势

2.1推广农业机械产品的技术发展

目前在我国的农业机械发展上,已经开始运用机电智能化技术和计算机技术,这使得农业机械化设备的科技含量有了极大的提高,不仅有效地提高了农业机械的作业效率,而且也提升了农业的生产效率。

2.2农业资源的利用率得到了提升

只有提高了农业资源的开发利用率,才能够确保农业实现可持续发展,同时也为保护生态环境奠定基础,如回收农业生产的废弃物,普及无害化的处理设备,运用无害化技术来处理废水可以有效地达到保护环境的作用。而在农业种植的过程中,使用有机肥料还可以进一步提高农业资源的利用效率。除此之外,大力发展节能型动力机械设备可以有效地避免出现资源浪费,从而提高农业资源的整体利用效率。

2.3提高农业机械产品的质量监督水平

要想提升农业的机械化水平,还要从规范设计的基本要求出发,全面提高农业产品的质量。在质量提升的过程中,还要注重农业产品的整体造型和外观,农机设备的耐久性也要经得起考验。选用与农机设备相配套的发电机及元件,能够最大程度上提高农业机械产品的质量。在农业机械设备完成安装之后,还要对其进行试运行,只有保证了设备各项指标都正常的基础上,才能够真正的投入使用,这也是提高农业机械产品可靠性的前提。

2.4加大政府的补贴力度

各级地方政府要加大农业机械的技术推广,做好农业机械的培训工作。国家还要将拖拉机、插秧机等农机具作为农具购置补贴的关键,普及农业机械知识。这样也能够更好地提高农业机械化的发展进程。

2.5确保农业机械技术的安全生产

关注安全监督管理及装备的创建工作,加大农业机械的安全投入,以便更好地满足农业机械工作安全监督管理的需求。除此之外,最重要的是,要将农业机械的安全检验工作纳入到各级县市政府的财政预算当中。

3结语

随着科学技术的飞速发展,一些高新技术正在逐渐地被运用到农业的机械设备中,这些机械设备的出现不仅提高了农业的整体生产水平,而且还进一步提升了农业的生产效率,很好地实现了农业的可持续发展。在今后的农业发展过程中,农业机械也必定是智能化的,所以要求操作人员要不断地提高自己的专业素养,全面推广农业机械新技术,只有这样才能够真正意义上实现我国农业机械的智能化。

作者:徐家亮 刘晓鹏 单位:黑龙江省克东县农机安全监理站

参考文献:

[1]陶乐然.长春星宇小区新技术应用[C]//增强自主创新能力促进吉林经济发展———启明杯•吉林省第四届科学技术学术年会论文集(下册).2006.

[2]刘蒙之.传播新技术与国家发展———一种政治经济学的观察[C]//中国传播学会成立大会暨第九次全国传播学研讨会论文集.2006.

[3]张仁江,田莉.制造业企业新技术采纳:动因、路径及障碍分析———基于T公司的纵向案例研究[C]//第六届(2011)中国管理学年会———技术与创新管理分会场论文集.2011.

[4]胡札进,姚尚斌,徐七三“.双低”储藏与四项储粮新技术的综合应用[C]//全面建设小康社会:中国科技工作者的历史责任———中国科协2003年学术年会论文集(上).2003.

[5]柳旭.浅析电视空间新技术对审美体验的影响[C]//2009中国电影电视技术学会影视技术文集.2010.

计算机视觉的前景范文6

在用常见的手势进行交流时,人们很容易就能互相理解,在经过学习之后,聋哑人或是正常人都可以运用手语进行交流。不过,想象一下,当你对计算机(或机器)做一个手势,它就能领会你的意图会是怎样的情景呢?如果计算机(或机器)看得懂手语,又意味着什么呢?姑且不管实现这样的人机交流有何深远的意义,还是先让我们来探究一下这样的可行性吧,想想看得懂手语的计算机(或机器)能有什么用途。

人机交互:从呆板到员活

人类之间的交流往往声情并茂,既采用自然语言(口语、书面语言),还广泛采用人体语言(表情、体势、手势)。与人类之间的交流相比,人机交互就显得呆板多了。以计算机的输入方式为例,人要向计算机下达指令,最常见的方式还是通过键盘输入。当然,手写输入也正为许多人所接受和喜爱,语音输入的研究也进行得热火朝天,最初单一而呆板的输入方式已经得到了扩展。然而,科学研究是永无止境的,人体语言这种简单快捷的信息交流方式得到了很多研究者的关注,他们想,能不能把这种灵活的信息交流方式也引进人机交互中呢?

于是研究人员展开了对人体语言理解的研究。人体语言的感知、人体语言与自然语言的信息融合对提高计算机的人类语言理解水平,加强人机接口的可实用性有着积极的意义。手语(手势)是人体语言的一个非常重要的组成部分,它是包含信息量最多的一种人体语言,它与语言、书面语等自然语言的表达能力相同。因而完全可以把手语作为人机交互的一种手段,它具有很强的视觉效果,生动、形象、直观。可见,将手势运用于计算机能够很好地改善人机交互的效率。

计算机怎样识别手势?

从不同的角度可以对手势进行不同的分类。分为交互性手势和操作性手势,前者手的运动表示特定的信息(如乐队指挥),靠视觉来感知,后者不表达任何信息(如弹琴);分为自主性手势和非自主性手势,后者需要与语音配合用来加强或补充某些信息(如演讲者用手势描述动作、空间结构等信息),分为离心手势和向心手势,前者直接针对说话人,有明确的交流意图,后者只是反应说话人的情绪和内心的愿望。

手势的各种组合、运动相当复杂,不过简单来看,手势主要有如下的特点:手是弹性物体,因此同一手势之间差别很大,手有大量冗余信息,由于人识别手势关键是识别手指特征,因此手掌特征是冗余的信息:手的位置是在三维空间,很难定位:手的表面是,非平滑的,容易产生阴影。

了解了手势的这些特点,就可以在手势研究中对手势做适当的分割、假设和约束。例如,可以给出如下约束:如果整个手处于运动状态,那么手指的运动和状态就不重要,如果手势主要由各手指之间的相对运动构成,那么手就应该处于静止状态。比如鼠标和笔式交互设备就是通过识别手的整体运动来完成人与计算机的交互,但它们不能识别手指的动作,其优点是仅利用软件算法就能实现,适合于一般桌面系统。只有当用鼠标或笔式交互设备的运动或方向变化来传达信息时,才可将鼠标或笔式交互设备看作手势表达工具。笔式交互设备发展很快,它提供了充分的交互信息,如压力、方向、旋转和位置信息,但现有交互主要是简单地替代鼠标。

计算机识别手势的手段主要有两种:

1.数据手套。数据手套是虚拟现实系统中广泛使用的传感设备,用户通过数据手套,能做出各种手势向系统发出命令,与虚拟世界进行各种交互操作:比如通过一只与数据手套对应的在计算机屏幕上显示的虚拟手,使用户成为虚拟世界中的一员:抓取物体,如果手套有力反馈,还能让用户感觉到物体的重量和材质等。美国在“洞穴”虚拟系统中就是利用数据手套来研制武器。数据手套的主要优点是可以测定手指的姿势和手势,但是相对而言代价较为昂贵,并且有时会给用户带来不便(如出汗)。

2.计算机视觉。即利用摄像机输人手势,其优点是不干扰用户,这是一种很有前途的技术,目前有许多研究者致力于此项工作。但在技术上存在很多困难,目前的计算机视觉技术还难以胜任手势识别和理解的任务。

目前较为实用的手势识别是基于数据手套的,因为数据手套不仅可以输入包括三维空间运动在内的较为全面的手势信息,而且比基于计算机视觉的手势在技术上要容易得多。

更好地为人服务

日本三菱电子研究实验室的研究人员已经使用低成本的视觉系统,通过手势就可以控制一台电视机。由计算机控制的美国航空航天局虚拟太空站也是采用美国Cybernet公司开发的手语识别软件,通过一部架设在顶部的摄像机来追踪指挥者的手势。当系统捕捉到挥手等手势时,就会做出相应的反应,让指挥者像航天员一样在计算机虚拟的阿尔法国际太空站上移动(确切地说是飘动)。

Cybemet公司的软件还能识别一系列的特定手势,就像工地上的工人或交通警察经常用的那种手语,通过这些手势你能够旋转在虚拟旅行中看到的三维图像,还可以向上或是向下改变你的视角。美国航空航天局正在考虑把这套系统用于真正的太空站,因为笨重的航天服和微重力环境使得鼠标和键盘都变得难以操纵。也许不久之后,航天员就能用简单的手语来控制机器人在太空中抓取物体。

手语(手势)识别系统的研究还有助于改善和提高聋哑人的生活学习和工作条件,为他们提供更好的服务。同时也可以应用于计算机辅助哑语教学、电视节目双语播放、虚拟人的研究、电影制作中的特技处理、动画的制作、医疗研究、游戏娱乐等诸多方面。另外,手语识别系统的研究涉及到教学、计算机图形学、机器人运动学、医学等多学科。因此,手语识别系统的研究非常有意义。