前言:中文期刊网精心挑选了计算机视觉的展望范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉的展望范文1
关键词:计算机;视觉检测技术;原理;应用
中图分类号:TP391.41
受到CIMS的推动和影响,诸多企业的发展趋势逐步趋向于个性化以及自动化,这种大的发展趋势间接的对我国的计算机辅助技术提出了更高的要求,计算机相关技术的发展面临着更加严峻的挑战。就现阶段分析来看,计算机辅助检测技术在现代诸多企业中得到了广泛的应用。随着柔性制造系统的不断进步与发展,驱动图像处理软件、现场总线技术的日趋成熟,检测系统的灵敏性、智能化特点愈发受到人们的关注,在这种大的发展趋势之下,计算机视觉检测技术得到了较快的发展。基于计算机视觉系统现已经广泛应用于现场监控、工况监视等诸多环境之中。
1 关于对视觉技术的相关研究
1.1 基于计算机的视觉检测技术的原理分析和探究
图像技术主要指的就是通过各种途径所实现的对图像的获取以及进一步的深入加工和处理技术。根据视觉检测技术的抽象程度以及对图像处理方式的不同,可以大致将图像的处理和加工技术划分为三个最主要的层次,这三个层次分别是图像的加工处理、图像的分析以及对于图像的理解。将这三个层次进行进一步的结合,便是图像工程。计算机视觉检测技术是一门新兴的计算机检测技术,该技术建立在对计算机视觉研究的基础之上,吸收和借鉴相关的研究成果,借助于传感器来实施三维测量,进而有效获得被测物体的空间具置信息,故而可以很好的满足当代制造业的发展需求。区别于一般的图像处理系统,计算机视觉检测技术所获取的相关数据信息更为精准和迅速,其环境适应性更强。
基于计算机的视觉检测技术注重计算理论的辅导作用,以应用为目标进行视觉技术分析。自上世纪七十年代以来,我国关于对计算机视觉检测技术的研究又取得了显著的进步,并且逐步迈入更为实质性的研究阶段,在该阶段中,逐步开始从通过从多个角度(诸如光学角度、生理学角度以及投影射影角度等等)对其成像问题加以分析。以Marr为代表的专家更是建立了一些一般性的视觉性处理模型来辅助该技术的研究。
1.2 视觉检测技术中传感器的作用
在计算机的控制下配有相关的视觉检测系统,在该视觉检测系统中,主要有三个主要方面的主要作用:第一,对于视觉传感器模型的分析以及确定;第二,进行图像数据分散与整理的相关工作;第三,CAD模型的建立。传感器的主要作用就是对测量棒材的多个截面进行分析,将所收集得到的数据经由图像采集卡采集后,传到相关的图像处理系统中,进而进一步辅助准确的模型的建立。
2 基于计算机的视觉检测技术的应用研究分析
2.1 基于计算机的视觉检测技术的发展状况研究
在研究的初步阶段,相关技术人员借助于数字化的图像处理技术,主要就是为了进一步提高所获得的数字照片的清晰度和质量要求,进而更为精准、科学、规范的对照片所提供的信息加以辨别,为航空卫星图片的读取、识别和分类做准备。在这一系列的视觉工作中,其中最为主要和常见的工作主要是包括分类、识别判读以及三维结构的构建。
基于计算机的视觉检测技术借助于对计算机视觉技术,将所获得的被观察物品的相关信息加以信号转换,并传递给图像处理系统,图像处理系统通过甄别和判断不同照片像素的分布和亮度等讯息,将其进一步转换成为数字化信号,接下来由计算机的图像系统抽出符合目标特征的信号加以运算,对下一步的设备动作加以决定和执行。
就现阶段而言,我国的计算机视觉检测技术系统在诸多领域均有所应用,最为典型的领域诸如医学的辅助诊断、机器人的感应系统、智能化的人机接口等均是建立在该技术的基础之上。借助于计算机视觉技术这一手段,可以有效提高对产品检测的效率,提高精准度,这种新型的视觉检测技术相比较于传统的人眼在流水线上的跟进,其具有显著的优越性,其获取测量结构迅速、检测结果可以直接被观察、可以进行自动识别以及定位准确和实时性的特点,这就很好的避免了由于人的一些主观性因素所导致的误差出现。
二十世纪以来,基于生物特性的计算机视觉检测技术得到了空前的发展,具体表现在人脸识别、生硬识别、指纹识别以及虹膜的识别中,形式日趋灵活和复杂多变。借助于计算机的视觉检测技术,可以有效对用户的身份进行鉴定和识别、判定用户的特殊信息等。除此之外,还可以将基于计算机的视觉识别技术逐步推广到其他领域,如海关的安全检查以及出口、入口的安全控制等领域。
2.2 基于计算机的视觉检测技术的相关应用分析
2.2.1 数码相机中所采用的图像采集技术
视觉检测技术的一个显著特点就是有效提高了生产的柔性和自动化程度,本世纪以来,数码相机凭借其高分辨率,快速成像、显像,功能丰富多变以及性价比较高的特定风靡全球,逐步取代了传统的照相机,传统的照相机主要采用的是CCD 摄像头,其主要的核心及时采集卡,显然这种采集系统已经逐步落后于时展的脚步,现已逐步被淘汰。
2.2.2 微文字识别系统的相关研发和设计
随着科学技术的不断进步与发展,大规模集成电路得到了较快的进步,基于计算机的视觉检测系统的成本得到了极大的降低,基于计算机视觉检测技术的微文字识别系统的研发也被提到了日程中来。微文字识别系统的处理芯片大多是借助于数字信号处理芯片来实现图像的识别,进而借助先进的语音合成技术将朗读变为可能。此外,为了便于使用,该系统的体积被尽可能的缩小,并且可根据美观度和实用性等设计为各种形状。
2.2.3 特殊用纸水印在线检测系统
基于计算机的视觉检测技术可以在某一特定领域代替人的主观判断,诸如水印质量的自动检测方面。区别于普通的工作人员,计算机可以实现长时间工作,对于误差范围的控制可以通过设置等实现,而且在计算机执行任务期间,所受到的客观和主观因素相对较少,这就极大程度上避免了由于人的因素所导致的失误性操作,进而有效提高了工作效率以及检测的精准度。这一优点,在水印质量标准的认定中具有十分重要的意义和作用,通过研发一定的程序和软件,可以制定出一套操作性强、权威性较高的水印清晰度量化标准。
3 基于计算机的视觉检测技术的发展展望
综合分析来看,计算机视觉检测技术现已有大约四十年的历史,作为一种新兴的检测技术,该技术的显著优越性不言而喻,该检测技术以其高精度、反应灵敏迅速、智能化、自动化等特点被广泛应用于诸多领域和行业之中,并取得了显著的成,可以说,该技术具有十分广阔的发展前景。但是,不可否认,基于计算机的视觉检测技术并不是十分的成熟,在其设计和研发过程中仍然存在着诸多不足,而且视觉检测技术是一项设计到心理、生理等多方面知识的复杂性技术,涉及领域众多,更强大功能的实现需要人类知识的不断拓展和延伸,因此,必须意识到该检测技术发展道路上的困难和挑战。
4 结束语
随着科学技术的不断进步与发展,经济的发展对于新技术的研发提出了更高的挑战,再者由于广大人民群众生活质量的不断提高,对于生活水平也有了进一步的认识和了解。基于计算机的视觉检测技术的研发和进步,无疑更好推动了高速发展的经济,不断满足了人民群众日益提高生活需求。由此来看,深入对视觉检测技术的研究和探究无疑具有十分重要的作用,笔者衷心希望,以上关于对我国基于计算机的视觉检测技术的相关探究能够被相关负责人合理的吸收和采纳,进而更好的推动科学技术的创新和进步,推动经济的不断进步与发展。
参考文献:
[1]李旭港.计算机视觉及其发展与应用[J].中国科技纵横,2010(06):42.
[2]张江明,张娟.浅谈制造业中计算机视觉检测技术的应用与发展[J].科技创新导报,2011(24):1.
计算机视觉的展望范文2
摘要:介绍了数据融合技术的基本概念和内容,分析了该技术在森林防火、森林蓄积特征的估计和更新、森林资源调查等方面的应用,提出该技术可应用于木材无损检测及精确林业。融合机器视觉、X射线等单一传感器技术检测木材及木制品,可以更准确地实时检测出木材的各种缺陷;集成GPS、GIS、RS及各种实时传感器信息,利用智能决策支持系统以及可变量技术,能够实现基于自然界生物及其赖以生存的环境资源的时空变异性的客观现实,建立基于信息流融合的精确林业系统。
多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。
一、数据融合
1.1概念的提出
1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。
1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。
Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等。
1.2基本内容
信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。
数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:
(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。
(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。
(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测。
根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:
(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。
(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。
(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等。
1.3处理模型
美国数据融合工作小组提出的数据融合处理模型,当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:
数据源。包括传感器及其相关数据(数据库和人的先验知识等)。
源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。
态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。
处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。
二、多传感器在林业中的应用
2.1在森林防火中的应用
在用MODIS(ModerateResolutionImagingSpectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1000m的热辐射通道的数据外加入空间分辨率为250m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。
2.2森林蓄积特征的估计
HampusHolmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-IIVHFSAR传感器的雷达数据进行了融合,采用KNN(knearestneighbor)方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计。
KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。
2.3用非垂直航空摄像数据融合GIS信息更新调查数据
森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。
TrevorJDavis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正。
试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。
三、数据融合在林业中的应用展望
3.1在木材检测中的应用
3.1.1木材缺陷及其影响
木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。
3.1.2单一传感器在木材检测中的应用
对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等。
随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。
新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。
美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析。
X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。
3.1.3数据融合在木材检测中的应用展望
单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷。
基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。
3.2在精确林业中的应用
美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。
目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。
南京林业大学提出了“精确林业工程系统”。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。
[参考文献]
[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.
[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.
[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.
[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.
计算机视觉的展望范文3
关键词:多源图像;融合技术;棉花;病虫害;识别诊断
中图分类号:TP391.43;S435.6 文献标识码:A 文章编号:0439-8114(2013)11-2555-03
随着城市化进程不断加快,从事农业劳作的劳动力总数急剧减少,农业生产与加工的逐步自动化是社会发展和进步的需求。特别是对于农作物病虫害监测从传统的根据农业部的病虫害监测调查规范进行调查,通过人工调查、人工记录,到微小昆虫自动计数技术、昆虫诱捕自动记录装置来对农作物病虫害进行监测,这些信息收集和数据管理都存在劳动量大、效率低、数据误差大的问题。随着计算机技术和传感器技术的快速发展,图像融合技术在军事、气象、医学、土地资源管理等方面得到了广泛的应用,而如何将图像融合技术应用在农作物病虫害中是极具有研究价值的课题。
1 棉花病虫害诊断技术研究意义及发展趋势
棉花作为主要的经济作物一直在中国和湖北省农业生产中占有重要地位,但由于品种、栽培制度、生态环境等变化及棉花生长环境日益恶化,病虫害有不断加重趋势。危害棉花的主要病害有炭疽病、黑斑病、枯萎病、黄萎病等,炭疽病在长江流域棉区的发生尤为严重,一般苗期发病率为20%~70%,严重时可达90%;黑斑病在阴湿多雨年份往往猖獗流行,给棉花生产造成毁灭性灾害;而枯萎病在棉区一直发生较多,死苗严重,造成的危害主要表现在产量降低,品质变劣方面;自上世纪80年代末枯萎病得到控制后,黄萎病上升为棉花第一病害。目前黄萎病发病面积达到全国棉田面积的50%以上,发病后棉苗减产30%~70%,有的甚至绝产,而且严重影响棉花品质。采用先进技术提高棉花病虫害有效防治及控制已迫在眉睫。
1.1 棉花病虫害诊断技术的研究意义
在进行植物保护和防治农作物病虫害的各类方法中,化学防治是投入少、见效快、收效大的有效方法,特别是针对在大生态区域内可能暴发成灾的重要病虫草害,化学防治迄今仍是最快速而有效的方法,一般可以挽回15%~30%的农作物产量损失。使用农药(各种杀菌剂、除草剂等)进行化学防治在世界各国一直占主导地位,它投入较少,防治迅速,特别是当大面积、暴发性病害发生时,只有化学防治才能取得较好的防治效果。同样,在棉花病虫害综合防治中,化学防治仍然是及时有效地控制病虫对棉花危害的最后一道把关防治措施。但长期大量使用农药不仅污染环境,而且这些农药会通过空气、水等途径进入人体,对人类的身体健康构成危害;又由于棉花病虫害症状的复杂性和模糊性,农业生产者受个体素质和人为主观因素的影响,往往不能正确合理地判断病情,导致滥用农药、化肥等引起更大的危害;此外,由于中国正步入老龄化社会,从事农业劳动的人口在减少,由劳动力不足带来的农业减产问题已日趋严重。所以,精确作物病虫害管理和机械化变量施药技术的研究和应用势在必行。为实现精确的棉花病虫害管理和变量施药,首先要能够准确地识别棉花病虫害种类及其危害程度。传统的方法主要依靠生产者或专家经验来判断病虫害原因及其危害程度,由于个体素质的差异以及其他因素的影响,往往很难做到对病虫害做出精确定量分析和判断,因而容易造成不合理的病虫害防治,也对生产管理者的农技水平要求较高。一些智能决策支持系统虽然能识别诊断棉花病虫害,但是过程复杂,不能进行实时处理。随着信息技术、光谱技术和计算机视觉技术的发展使基于生物信息的作物病虫害智能识别诊断成为可能。通过多源图像融合技术快速准确地获取棉花病虫害信息,对已发生病虫害的棉花区域根据病虫害程度实行定量喷施农药。这样既可大量节省农药,提高效率,降低成本,降低对劳动力的依赖,同时大幅度减轻农药对农业生态环境的污染,提高棉花病虫害防治水平。研究多源图像融合技术对农作物病虫害诊断具有重要的学术意义和经济价值。
1.2 棉花病虫害诊断技术发展趋势
纵观近几年国内对作物病虫害智能识别诊断的研究,目前对棉花作物病虫害识别诊断主要集中在以专家系统为代表的智能化信息技术和光谱技术上,应用计算机视觉技术对棉花作物病虫害识别的研究报道较少[1,2],而结合光谱技术和计算机视觉技术进行研究的则未见报道。目标的高分辨率和高识别率是对获取目标信息的基本要求,仅仅利用可见光范围或在近红外范围的计算机视觉技术进行作物病虫害识别诊断,其单一光谱不足以准确、全面反映作物病虫害的差异,还需利用其他生物信息对其补充和加强,以达到全面地反映作物病虫害的差异[3]。
为了实现对低探测性目标的探测和识别,必须大力发展先进的目标探测系统,而由多源传感器组成的光电成像系统是最为常见的目标探测系统。图像融合就是利用各种成像传感器得到的同一目标或同一场景的图像,综合这些不同图像的冗余信息和互补信息,以获得更为全面准确的图像描述。为此,针对湖北省主要经济作物棉花,综合利用光谱技术、计算机视觉技术及多源信息融合技术,基于多源图像信息(可见光和近红外视觉图像信息)融合棉花病害(炭疽病和黑斑病)识别诊断技术。深入研究作物在不同病虫害危害下的反射光谱特性及变化规律,确定光谱敏感波段及其特征表现,提取可以有效表征作物不同病虫害条件、不同危害程度下的计算机视觉图像的灰度、纹理、形态特征信息和近地光谱特征信息,探索基于多传感信息融合的病虫害识别诊断方法,构建病虫害智能识别系统,为精确作物病虫害管理和机械化变量施药技术提供理论基础。
2 多源图像融合技术
图像融合[4]是对多幅源自同一场景的图像进行综合,以获得更好的视觉效果和易于机器识别为目的,产生比单一信息源更为精确、更完善、更可靠的图像。多源传感器图像是由成像机理不同的多种传感器获得的图像。由于每种成像传感器都是为了适应某些特定的环境和使用范围而设计的,具有不同成像机理的多种传感器获得的图像之间存在信息的冗余性和互补性,通过对其进行融合,能够提高系统可靠性和图像信息的利用率。随着科学发展和技术进步,采集图像数据的手段不断完善,出现了各种新图像获取技术。如今图像融合技术广泛应用于图像处理、遥感、计算机视觉以及军事等领域[5]。利用图像融合技术可以准确地获取检测数据,如在医学图像分析中的超声成像、核磁共振、计算机层析、血液细胞自动分类计数、癌细胞识别等极大地提高了准确率[6,7];图像融合技术在遥感雷达卫星的发展后,已成为遥感图像处理和分析的重要研究热点,应用于土地资源调查、环境监测、地形测绘等[8]。图像融合技术应用在农业生产中,目前研究方向主要集中在对农产品的无损检测和农作物生长态势及产量评估方面。如采用互信息最佳阈值迭代优化分割法对可见光和近红外图像进行融合来对番茄成熟度进行无损检测研究[9];通过加权平均融合法对红外和可见光图像实现对苹果进行无损检测研究[10];采用蚁群算法的模糊C均值聚类图像分割算法的图像融合技术对作物几何参数进行测量。
多源传感器图像融合系统一般有3种类型:像素级融合、特征级融合和决策级融合。
2.1 像素级图像融合
像素级图像融合是通过对源图像进行预处理和空间配准,对处理后的图像采取适当的算法进行融合,得到融合图像后再进行显示和后续处理。简单的像素级融合方法主要有:像素灰度值平均或加权平均,像素灰度值选大,像素灰度值选小。简单的像素级融合方法结构简单、易于实现,但应用范围有限,融合结果不理想。故现在的融合方法多采用基于对源图像的多尺度分解。这种分解方法是一种多尺度、多分辨率的图像融合方法,是在不同尺度、不同空间分辨率、不同分解层上分别进行融合。这种融合方法能明显改进融合效果[11]。
2.2 特征级图像融合
特征级图像融合是从不同的成像传感器所获得的同一对象图像中提取一些特征,产生特征矢量,然后对这些特征矢量进行融合。特征级图像融合是中间层的图像融合,精度一般。其融合方法有基于假设前提及统计分析的方法和基于知识的方法。
2.3 决策级图像融合
决策级图像融合是最高层次的融合,是首先依据每一个成像传感器所获得的同一对象图像各自进行预处理、特征提取、识别和判决后,做出独立的决策,然后将这些独立的决策综合起来,给出最终决策。决策级图像融合适合于多类不同传感器图像的融合,但融合结果精度较差。其融合方法有多重逻辑推理方法、统计方法、信息论方法等都可用于决策层的图像融合。
特征级图像融合和决策级图像融合方法通常应用于某些特殊场合,像素级图像融合的应用更普及,融合所得图像更有利于人眼的判读、欣赏和机器识别。对于已经配准好的图像,像素级图像融合方法不需要显式地提取图像特征,在速度和鲁棒性上有明显优势。为此采取像素级图像融合方法对农作物病虫害的可见光和近红外图像进行融合处理,使其符合人类视觉特征,融合结果更有利于对图像作进一步分析、理解和识别。
3 多源图像融合技术对棉花病虫害诊断的方法
1)在特定栽培条件下,培育不同棉花病虫害的试验样本及正常的对比样本。
2)对棉花病虫害样品的叶片和冠层进行光谱分析。利用便捷式光谱仪测量叶片和冠层的光谱,寻找棉花病虫害种类的敏感光谱波段及其反射率特征,分析不同病虫害种类和病虫害程度的敏感光谱波段反射率特征的变化规律。
3)根据光谱分析结果,构建多源图像计算机视觉采集系统,采集棉花作物样本多光谱图像,用VC或MATLAB编写计算机图像处理软件对图像进行处理和特征提取。
4)对所获取的特征应用模糊特征优选、主成分分析(PCA)和独立分量分析(ICA)进行优化组合和筛选,通过各种统计方法寻求作物病症与特征对应关系。建立图像特征与病种、病虫害程度的关系模型,利用模式识别方法进行棉花病虫害种类及程度的模式识别检测试验[12]。
4 展望
棉花是中国和湖北省主要的经济作物,长期以来棉田病虫害对棉花生产带来极大危害,因此,对棉花病虫害防治方法与技术的研究至关重要。对棉花作物病虫害防治的各种方法中,传统的方法是依靠人们的经验确认病虫害的发生时间、区域、种类和发生程度等,且是进行手工或机械喷洒农药,这不仅劳动效率低,劳动成本高,而且常规施药技术会带来农药利用率低下、水资源浪费、环境污染、农药在作物及其产品中的残留导致对人类的危害等。所以,结合光谱技术和计算机技术开展棉花病虫害的识别诊断研究具有重要的学术意义和经济价值。
参考文献:
[1] 周小燕,史 岩,李道亮,等.棉花病虫害诊断专家系统的研究与设计[J].莱阳农学院学报,2005,22(1):9-11.
[2] 严智燕,廖桂平,高必达.植物病虫害防治中农业专家系统的研究进展[J].中国农学通报,2005,21(5): 415-417.
[3] YUTAKA S,TSUGUO O.Automatic diagnosis of plant disease recognition between healthy and diseased leaf[J].农业机械学会杂志,1999,61(2):119-126.
[4] 何 友,王国宏,陆大金,等.多传感器信息融合及应用[M].北京:电子工业出版社,2000.
[5] 王 宏,敬忠良,李建勋.多分辨率图像融合的研究与进展[J].控制理论与应用,2004,21(1):145-151.
[6] ZHENG Y F, ESSOCK E A, HANSEN B C.Advanced discrete wavelet transform fusion algorithm and its optimization by using the metric of image quality index[J].Optical Engineering,2005,44(3):1-12.
[7] 李秋华.基于红外图像信息融合的目标检测和识别技术研究[D].长沙:国防科学技术大学,2002.
[8] 吉 微.多源气象卫星图像融合技术应用研究[D].南京:南京信息工程大学,2009.
[9] 李明喜.基于多源图像融合的收获目标准确定位研究[D].江苏镇江:江苏大学,2008.
[10] 杨万利,沈明霞,严 君.红外图像处理技术在苹果早期淤伤检测中的应用[J].计算机工程与设计,2010(1):149-152.
计算机视觉的展望范文4
10月21日,2016英特尔中国行业峰会在珠海召开,来自医疗、金融、交通、零售、能源、教育等行业的企业代表分享了他们对于数字化变革的理解与实践。这本该是英特尔中国行业峰会的主旋律,但是实际是与会嘉宾对人工智能的话题表现出更大的热情,有点喧宾夺主的味道。
得AI者得未来
2015年底,许多机构在展望2016年度科技领域时几乎会不约而同地将人工智能列为重点方向之一。现在来看,人工智能的火爆程度让最乐观的预测者都大跌眼镜,这得归结于AlphaGo的推波助澜。
正如文章开始所说,人工智能的使命便是完成海量物联网数据的商业价值转化。根据相关预测,2021年,全球将会拥有18亿台PC,86亿台移动设备,157亿台物联网设备。而到2035年,物联网设备的数量将会超过1万亿台,相应的数据数量将会增长2400倍,从1 EB增长到2.3ZB。如何有效管理、控制和利用如此浩瀚的数据,人工智能是解决之道。
所以说,得物联网者得未来,而得人工智能者将执物联网之牛耳。只有人工智能才能为“万物互联”之后的应用问题提供最佳的解决方案。
2016英特尔中国行业峰会上,英特尔与科大讯飞公司签署合作备忘录,双方将在人工智能领域展开为期三年的基于英特尔至强处理器+英特尔至强融核处理器,以及英特尔至强处理器+FPGA为基础的机器学习/深度学习研究项目。科大讯飞联合创始人,讯飞研究院副院长王智国博士非常到位地点评了这一合作:“一直以来,我们双方都致力于人工智能技术的创新和行业的推动,一方擅长底层计算架构,一方擅长算法及应用。我们期待双方在人工智能技术上的深度合作能够推动硬件和软件的协同设计及优化,共同发现人工智能计算平台创新的解决方案,推动人工智能产业的发展,并通过这些创新的技术支持更多行业用户进行业务转型。”
作为全球最大的半导体芯片制造商,英特尔的公司定位正在悄然发生变化。如今,英特尔将自己定位为“一家致力于驱动云计算和智能互联计算的公司”。可见人工智能已经成为英特尔公司的未来战略方向之一。
人工智能对计算力资源的需求到底有多大,现在谁也无法预判,这就像是个“计算黑洞”。但有一点可以肯定,人工智能是高性能计算在现在和未来的进一步延展和进化,而这恰好是英特尔的优势所在。
对英特尔而言,进入人工智能领域是水到渠成的事情,也是技术上的自然演进。从另一个角度看,物联网和人工智能是历史摆在英特尔公司面前一次前所未有机遇,其空间和舞台远大于PC时代和互联网时代。送上门的蛋糕(要知道,当今世界90%以上的数据都是由英特尔处理器来承载的),岂能让它从嘴边溜走。
从资本到技术,从硬件到软件
基于新的公司定位,英特尔开始从资本层面进行帝国的战略布局。作为硅谷最大的企业风司,英特尔投资总裁Wendell Brooks 说“会把未来的投资聚焦于那些能够更好拓展公司业务发展的领域”,人工智能毫无疑问是重中之重。
9月宣布将收购计算机视觉创业公司Movidius,后者致力于研发低功耗的计算机视觉芯片;8月将Nervana收入囊中,后者主攻半导体、软件和AI深度学习技术;5月宣布将收购专注于计算机视觉技术开发的俄罗斯公司Itseez;4月收购意大利半导体功能性安全方案厂商Yogitech;2015年12月完成了对可编程逻辑器件厂商Altera的收购;2015年10月收购了人工智能公司Saffron Technology……
针对某一业务领域展开如此高密度地集中收购,无论是在英特尔公司历史还是整个IT行业都是十分罕见的。可见,英特尔布局人工智能的决心之大。
由于技术因素,专用领域的智能化是人工智能未来5到10年的主要应用方向,比如自动驾驶。在更远的将来,随着技术的进一步突破,通用领域的智能化有望实现。但无论是专用还是通用领域,人工智能都将围绕“基础资源-技术平台-业务应用”这三层基本架构形成生态圈。
在人工智能上,英特尔能做些什么?仅仅是提供计算平台吗?当然不是,这从英特尔的疯狂收购中也看得出。
计算机视觉的展望范文5
[关键词] 数字图像、编码编码方法
中图分类号:TN131+.4 文献标识码:A 文章编号:
1 引言
数字图像处理又称为计算机图像处理,它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。早期图像处理的目的是改善图像的质量,它以人为对象,以改善人的视觉效果为目的。图像处理中,输入的是质量低的图像,输出的是改善质量后的图像。常见的图像处理有图像数字化、图像编码、图像增强、图像复原、图像分割与图像分析等。图像编码是对图像信息进行编码,可以压缩图像的信息量,以便满足传输与存储的要求。本文主要介绍了图像编码的基本原理和技术方法。
一幅二维数字图像可以由一个二维亮度函数通过采样和量化后而得到的一个二维数组表示。这样一个二维数组的数据量通常很大,从而对存储、处理和传输都带来了许多问题,提出了许多新的要求。为此人们试图采用对图像新的表达方法以减少表示一幅图像需要的数据量,这就是图像编码所要解决的主要问题。压缩数据量的主要方法是消除冗余数据,从数学角度来讲是要将原始图像转化为从统计角度看尽可能不相关的数据集。这个转换要在图像进行存储、处理和传输之前进行,然后将压缩了的图像解压缩以重建原始图像,即通常所称的图像编码和图像解码。
2 传统编码方法
传统的编码方法可以分成两大类,预测编码方法(对应空域方法)和变换编码方法(对应频域编码方法)。预测编码方法的优点是:算法一般较简单,易于用硬件实现;缺点是:压缩比不够大,承受误码的能力较差。由于它采用的最小均方误差准则不能反映人眼的视觉心理特性,近年来已较少单独采用,而是与其他方法混合使用。另外,由于DPCM编码系统会引起斜率过载、界线繁忙、颗粒噪声和轮廓噪声,在使用中应加以考虑。变换编码方法的优点是:压缩比高、承受误码能力强;缺点是:算法较复杂。
3 现代编码方法
31 第二代图像编码方法
第二代图像编码方法[2]是针对传统编码方法中没有考虑人眼对轮廓、边缘的特殊敏感性和方向感知特性而提出的。它认为传统的第一代编码技术以信息论和数字信号处理技术为理论基础,出发点是消除图像数据的统计冗余信息,包括信息熵冗余、空间冗余和时间冗余。其编码压缩图像数据的能力已接近极限,压缩比难以提高。第二代图像编码方法充分利用人眼视觉系统的生理和心理视觉冗余特性以及信源的各种性质以期获得高压缩比,这类方法一般要对图像进行预处理,将图像数据根据视觉敏感性进行分割。
按处理方法的不同,第二代图像编码方法可分为两种典型的编码技术[3]:一种是基于分裂合并的方法,先将图像分为纹理和边缘轮廓,然后各自采用不同的方法编码;另一种是基于各向异性滤波器的方法,先对图像进行方向性滤波,得到不同方向的图像信息,再根据人眼的方向敏感性对各个通道采用特定的方法单独编码。
32 分形图像编码
分形图像编码是在分形几何理论的基础上发展起来的一种编码方法。分形理论是欧氏几何相关理论的扩展,是研究不规则图形和混沌运动的一门新科学。它描述了自然界物体的自相似性,这种自相似性可以是确定的,也可以是统计意义上的。这一理论基础决定了它只有对具备明显自相似性或统计自相似性的图像,例如海岸线、云彩、大树等才有较高的编码效率。而一般图像不具有这一特性,因此编码效率与图像性质学特性有关,而且分形图像编码方法实质上是通过消除图像的几何冗余来压缩数据的,根本没有考虑人眼视觉特性的作用。
33 基于模型的图像编码
基于模型的图像编码技术[4]是近几年发展起来的一种很有前途的编码方法。它利用了计算机视觉和计算机图形学中的方法和理论,其基本出发点是在编、解码两端分别建立起相同的模型,针对输入的图像提取模型参数,或根据模型参数重建图像。模型编码方法的核心是建模和提取模型参数,其中模型的选取、描述和建立是决定模型编码质量的关键因素。为了对图像数据建模,一般要求对输入图像要有某些先验知识。
基于模型的图像编码方法是利用先验模型来抽取图像中的主要信息,并以模型参数的形式表示它们,因此可以获得很高的压缩比。然而在模型编码方法的研究中还存在很多问题,例如:①模型法需要先验知识,不适合一般的应用;②对不同的应用所建模型是不一样的;③在线框模型中控制点的个数不易确定,还未找到有效的方法能根据图像内容来选取;④由于利用模型法压缩后复原图像的大部分是用图形学的方法产生的,因此看起来不够自然;⑤传统的误差评估准则不适合用于对模型编码的评价。
34小波图像编码
一维连续小波变换可看成原始信号和一组不同尺度的小波带通滤波器的滤波运算,从而可把信号分解到一系列频带上进行分析处理。将其离散化后即为离散小波变换。小波变换图像编码压缩[6]的核心问题是要对子带图像进行小波分解系数的量化和编码。低频子带图像包含原图像的大部分能量,即包含图像的基本特性。它在图像重构算法中起主导作用,对重建图像的质量有很大影响,因此这部分信号应精确保留。
高频子图像的系数分布符合广义高斯分布,对其系数进行粗量化编码较为有效。这也完全符合人的视觉特性,根据对人眼视觉系统的研究可知,人眼视觉灵敏度具有明显的低通特性,而且对不同方向上的敏感度也不一样,尤其是对倾斜方向的刺激不太敏感,如人眼对对角线方向子图像系数误差敏感度较低,因此可对对角线方向子图像进行粗量化高压缩。
小波变换后的能量主要集中在低频系数分量,而其他高频系数分量大多为零值,这为高倍率压缩提供了可能。通过选择合适的具有平滑特性小波基,就可消除重建图像中出现的方块效应,减小量化噪声,获得较好的重建图像质量。
小波变换图像编码压缩方法可分为如下两大类:基于传统的图像编码方法和基于分形理论的小波变换图像编码方法。
基于传统的图像编码方法[7]包括:零树小波编码、基于塔式网络矢量量化的小波变换编码、基于LBG算法的小波变换编码、基于标量量化的小波变换编码等。
由于不同分辨率级子图像之间存在着相似性,因此,利用此相似性,可提高压缩比[8]。J.M.Shapiro采用零树自嵌套编码方法,对小波分解系数进行压缩,在PSNR=27.54dB的情况下,获得压缩比为128∶1。这是最著名的一种小波变换图像编码压缩方法。该方法的优点是:与传统的DCT编码相比,它既可以克服方块效应,又可以在低比特率下获得较好的图像主观质量。缺点是:由于它对各子带采用相同的门限量化,因此不能充分利用人眼的视觉特性,限制了图像压缩比的进一步提高。对此,A.Said等人提出了改进算法。
针对分形图像编码尚存在的缺点,如编码算法的耗时、自然图像不一定具有严格的分形结构而无法达到预期的高压缩比、高压缩倍率时的方块效应等,有人提出了基于小波变换的分形编码[9]。它具有以下特点:①采用平滑小波可去除传统分形变换中存在的方块效应;②小波表示使图像的四叉树分割十分自然;③可将零树算法看成是该算法的一个特例。图像经过金字塔形离散小波变换后的系数在小波域内可组成分层树状数据结构小波树。这些跨越不同分辨率的小波树之间存在一定的相似性,可通过分形变换来描述。基于小波变换的分形压缩过程就是一个由分层树状结构的顶部开始一层层地向下预测其余系统的过程,而这个由上至下、由粗至细的预测过程是通过分形编码来实现的。基于小波变换的图像编码压缩的特点是[10]:压缩比高、压缩速度快,压缩后能保持信号与图像的特征不变,且在传递过程中就可以抗干扰。从现在的研究结果可看到,该方法已获得了较好的编码效果,是现代图像压缩技术研究的热点之一,也是十分有前途的一种方法。
4结束语
本研究介绍了图像编码的基本原理,传统的图像编码方法和几种比较新的编码方法。第二代图像编码将视觉特性引入到图像编码技术,分形图像编码是以分形几何理论为基础,基于模型的图像编码是利用了计算机视觉和计算机图形学中的理论,而小波变换图像编码则引入了小波分析理论。尽管它们理论基础不同,但它们均在不同情况下不同程度地提高了编码质量。相比之下,小波变换图像编码是一种性能更佳的图像编码方法,仅从去除冗余信息的角度而言,它的性能就远远优于其他几种编码方法。另外,将小波变换与其他的新型编码方法结合,也是小波图像编码方法的重要研究方向。
参考文献
1 万建伟,黄埔堪,周良柱,梁甸农图像编码技术的发展系统工程与电子技术,1996,5:31~38
2 张雪松,倪国强,周立伟,金伟其图像编码技术发展综述光学技术,1997,3:37~41
3 曹宁,吴琰,冯晔模型基方法在图像编码中的应用与改进河海大学学报,1997,25(6):97~102
4 陈红丽几种新型的图像编码技术淮北煤师院学报,2001,22(2):28~30
5 吴谨图像编码与小波变换图像编码武汉科技大学学报(自然科学版),2000,23(3):289~292
6 陈雷霆,吉家成,傅志中,梁福成小波图像编码与JPEG图像编码的比较研究计算机应用,2000,20(增刊):273~277
7 唐良瑞小波图像编码技术的研究北方工业大学学报,2001,13(3):9~13
计算机视觉的展望范文6
关键词:运动检测;;相邻帧差法;车辆视频
中图分类号:TP391文献标识码:A文章编号:1009-3044(2011)01-0187-02
Video-based Vehicle Motion Detection Method with
GONG Cheng-ying1,3, HE Hui2
(1.School of Electronic and Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China; 2.School of Automation and Electrical Engineering, Lanzhou Jiaotong University,Lanzhou 730070, China; 3.Department of Electronic and Information Engineering,Lanzhou Polytechnic College, Lanzhou 730070, China)
Abstract: The purpose of motion detection is to detect moving objects in surveillance video quickly and accurately.This article introduces a common motion detection method,using library, achieve a vehicle motion detection methods with frame difference methods.The use of image intensity Absolute difference is greater than the threshold for detection to take,as a result,the method can quickly detect the moving objects in video sequences.
Key words: motion detection; ; frame difference; vehicle video
在车辆的运动视频分析中,运动目标的检测是研究的热点问题之一,它直接影响车辆运动分析和跟踪的精度。交通场景中的任何可察觉的运动都会体现在场景图像流的变化上 ,检测出运动目标的变化,就可以分析出其运动特性。基于视频的车辆运动检测的首要任务就是从视频图像序列中提取运动目标,过滤掉无用的静止信息,为随后的要进行的运动目标分析和跟踪等奠定基础[1]。对于如何从视频中提取运动目标,有许多研究者进行了大量的研究工作,针对不同的环境,得到了多种适合不同情况的方法,但是由于环境中存在各种复杂因素(如天气的变化、背景运动、阴影等),运动目标的检测是一项比较困难的问题。
1 常见运动检测方法
目前常用的运动目标检测方法有三种:背景差法、相邻帧差法和光流法[2]。
1.1 帧差法
相邻帧差法是将运动图像序列中相邻的两帧或三帧图像相减 ,判断所得图像灰度差的绝对值是否大于所取阈值 ,以确定监控场景有无物体运动。这种检测法一般不能完整提取出所有相关的特征像素点 ,但它对光照等场景变化不太敏感 ,能够适应动态环境 ,而且运算简单 ,检测速度快 ,适用于实时性要求较高的监控环境。因此作为一种快速地判别是否有目标入侵算法基本原形常被应用。
1.2 背景差法
通过背景建模,利用相邻序列图像估计视频中不变的背景,背景差法是将输入图像与背景模型进行比较,通过判定灰度等特征的变化,或用直方图等统计信息的变化来判断是否有异常情况发生。在背景已知的情况下,背景差法是一种有效的运动目标检测方法,但是它易受光线、天气等外界条件的影响。
1.3 光流法
光流是空间运动物体被观测面上的像素点运动产生的瞬时速度场,包含了物体3D表面结构和动态行为的重要信息。当场景中有独立的运动目标时,通过光流分析可以确定运动目标的数目、运动速度、目标距离、和目标的表面结构,光流法的优点是能够检测独立运动的对象,不需要预先知道场景的任何信息 ,并且可用于摄像机运动的情况 ,但是由于噪声、 多光源、 阴影、 透明性和遮挡性等原因 ,使得计算出的光流场分布不是十分可靠和精确;而且 ,多数光流法计算复杂、耗时多 ,除非有特殊的硬件支持 ,否则很难实现实时检测。
2 基于的运动检测
2.1 简介
是一个用C#实现的开源框架,利用该框架,可以方便地对计算机视觉、机器学习、图像处理、遗传算法等领域的进行辅助研究,是一个不断完善和发展的计算机视觉和图像处理库,目前的最新版本是2.1.4[3]。
2.2 检测方法原理
在序列图像中,通过逐像素比较可直接求取前后两帧图像之间的差别,假定照明等环境条件在多帧图像间基本不变化,那么差图像的不为零处标明该处的像素发生了移动。换句话说,对时间上相邻的两幅图像求差可以将图像中运动目标的位置和形状变化突现出来,处理流程如图1所示。
设在相邻时刻ti和ti+1采集到帧,f(x,y,ti)和f(x,y,ti+1),
(1)
(2)
(1)、(2)式中bi(x,y)和bi+1(x,y)为i与i+1时刻的图像背景,m(x,y)和m(x+Δx,y+Δy)分别为两时刻的运动目标,ni(x,y)与ni+1(x,y)分别是序列在i与i+1时刻的噪声[4]。
可得ti+1时刻与ti时刻的差图像:
(3)
(3)式中,m(x+Δx,y+Δy)-m(x,y)为运动目标引起的图像变化,bi+1(x,y)-bi(x,y)是背景差, ni+1(x,y)-ni(x,y)为残留噪声。根据噪声的统计特性,可以用高斯分布对噪声分布进行比较好的描述。从而进一步确定Tg为灰度阈值,当差图像大于阈值时,认为有运动事件发生。
(4)[5]
(4)式中,Tg为灰度阈值,用来确定ti+1时刻与ti时刻图像的灰度是否存在比较明显的差异。差图像为0的像素对应在前后两时刻间没有发生变化的地方;差图像为1的像素对应两图像间发生变化的地方,通常是由于运动目标的运动而产生的。
2.3 检测方法改进
实际情况中,由于随机噪声的影响,没有发生像素移动的地方也会出现差图像不为0的情况,为把噪声的影响和像素的移动区分开来,可对差图像取较大的阈值。对于慢速运动的目标而言,根据帧差法运动检测的特点,可以采取加大帧间时间差的方法,以检测出足够的运动信息。
3 实验
实验用的主机配置是Intel Core Duo CPU P8700@2.53GHz,2G内存,视频采集设备为USB2.0摄像头Webcam,位置固定;程序在Microsoft Visual Studio 2008下以 库为基础实现,主要用到了的AForge.Vision.Motion库,该库包含了基本的运动检测和处理算法类,通过实例化这些类,可以很容易的实现视频中运动目标的检测,这里用到的基本类有:
MotionDetector类:运动目标检测的封装类,执行各种运动检测和处理算法。
TwoFramesDifferenceDetector类:用来实现帧差法运动检测的算法类,默认的阈值Tg为15,也可以在的源码中进行更改。
MotionAreaHighlighting类:将检测到得运动区域进行高亮显示的运动处理类。
VideoSourcePlayer控件:视频播放控件,通过VideoSource属性初始化并使用Start()方法播放视频,通过NewFrame 事件进行新帧显示前的处理。
……
// 定义运动目标检测实例
MotionDetector detector = new MotionDetector(
new TwoFramesDifferenceDetector( ),
new MotionAreaHighlighting( ) );
……
//帧差法 运动检测
detector.MotionDetectionAlgorthm = new TwoFramesDifferenceDetector( );
……
// 高亮显示运动目标
detector.MotionProcessingAlgorithm = new MotionAreaHighlighting( ) ;[6]
……
图2为检测前的运动视频,图3是对车辆运动视频进行检测的结果,并对运动目标进行了高亮显示,从而达到了运动检测的基本目的,利用AForge的视频运动库,方便的实现基于帧差法的视频检测,AForge的视频运动库也提供了其他运动检测的类,如背景差减运动检测类等。
4 结语
本文利用类库,基于帧差法对车辆运动目标进行实时检测,实验结果证明,利用可以很方便的实现运动目标的基本检测功能,当然,基于C#的库也存在一些问题,如占用系统资源较大,算法库还不够完备等, 库是开放源码并不断发展的,在车辆运动检测的研究过程中也可以对AForge的算法进行改进,对于更进一步的问题将在后续工作中继续研究。
参考文献:
[1] 代科学,李国辉,涂丹,等.监控视频运动目标检测减背景技术的研究现状和展望[J].中国图象图形学报,2006(7):919-920.
[2] 章毓晋.图像工程(中册)[M].北京:清华大学出版社,2005:349-354.
[3] Andrew ::Framework[EB/OL].(2010-03-02)[2010-12-20]..
[4] 张睿萍.基于运动检测的视频监控系统[J].计算机与现代化,2008(10):27-29.