前言:中文期刊网精心挑选了计算机视觉的用途范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉的用途范文1
关键词:农业;采摘;机械手
采摘机械手涉及机械设计技术、计算机技术、电子控制技术、智能识别技术、传感器技术等领域,通过微机原理技术、精准机械定位系统技术及计算机视觉技术的融合,在农业果实采摘、农业果树生长质量及提高生产效率等方面进行全方位的精准定位控制,以实现采摘功能,是目前一种有效采摘果实的方式。20世纪80年代末,机械手被广泛应用于汽车工业、航天航空和农产品加工,计算机视觉技术开始应用于机械手,目前较多采用中国大恒的DH-HV3100FC数字摄像及中国大恒的DH-VT123双通道彩采集卡构成双目立体视觉系统,根据建立数学模型、利用MATLAB软件辅助进行图像处理、利用微机及单片机系统技术编写出GUI界面控制2个摄像头实现同步拍摄,在农业采摘及其生产效率等方面,取得了丰硕的成果。
我国对采摘机械手在农业方面应用的研究起步于20世纪90年代中期。以精准农业智能采摘机械手研制为代表,中国科学院及中国农业大学等代表高校,对农业采摘方面的研究调查、国外采摘机械手技术应用情况分析调查,及对机械手技术应用基础研究,引进美国、日本的采摘机械手设备,开始了自动采摘设备系统的研制,为农业果实采摘及生产效率的提高提供了全方位的技术支持。周云山和李强等人研究的蘑菇采摘机器人处于是国内领先水平;西北农林科技大学对苹果采摘机器人手臂控制进行了研究,为之后采摘机械手在农业方面的发展奠定了基础。采摘机械手在农业部门的应用始于20世纪90年代末期,当时机械手在农业领域没有达到实用化,受到农业领域环境、劳动强度、作业质量的影响,在采摘方面只进行人工作业,劳动强度大且效率低下,因此在农业部门要求下,开始着手研究采摘机械手。20多年来,采摘机械手在农业领域应用越来越广泛,国内研发完成大量采摘机械手相关基础性试验工作,在农业果实采摘方面取得巨大的进展。
1采摘机械手机械结构设计
最初,我国研制的采摘果实设备机械基本都很笨重,一部分的工序速度较慢,导致生产效率低下,且影响果树的再生长。设计合适的机械结构,能有效提高生产效率及果实的采摘率。而且可以保证农业果实质量,从而提高果实在国内外市场的价格竞争优势。设计巧妙的机械手结构表现在:(1)根据农业田间地形基本特征,结合执行末端功能,设计出适合的农业采摘机械臂。(2)利用3D扫描仪,对果实数学建模和轮廓造型进行拟合实验及分析,设计出以数据信息和模型为基础的适用较多农业果实采摘勺子型剪切执行末端。如图2所示:
2农业采摘系统应用
最初,农业果实采摘只能依靠人的视觉去判别及人工去采摘,导致个人主观因素而对采摘效率的影响,采摘机械手是提高农业自动采摘效率的有效途径。现代由于智能化的发展,计算机视觉系统、精准的定位系统及合适的机械结构成为自动采摘方面用途广泛。以图像处理与智能识别技术为基础,通过纹理特征提取、形状特征提取、颜色特征提取、数学建模及小波分析算法等特点要求,选择相应的数学算法、数学模型、信号滤波处理方法。例如:美国佛罗里达大学研究员研制了柑橘采摘末端执行器,其依置于末端执行器的内部的1个CCD摄像机和超声波传感器来探测水果的位置;JohanBaeten和SvenBoedrij等人研制了苹果采摘机器人末端执行器,其硅树脂管里装有微型摄像头,用于获取末端执行器正前方苹果图像。综上所述:实现农业果实自动化采摘离不开机械手的应用,同时也说明了国内外学者在采摘机械手方面研究取得巨大的进步,为农业果实采摘方面提供了技术支持,为实现农业自动采摘等方面奠定了基础。
参考文献
1杨文亮.苹果采摘机器人机械手结构设计与分析.江苏大学,2009(6)
计算机视觉的用途范文2
【关键词】: 图像处理质量检测应用
中图分类号:TP751 文献标识码:A 文章编号:
【正文】:
前言:
数字图像处理在20世纪60年代前后形成的一门学科。早期阶段,图像处理是为了提高图像的质量,把人作为对象,使人的视觉效果有所改善。通常用的方法大多是图像增强、图像分割、边缘提取、形态学分析、图像压缩编码等。从20世纪80年代以后,计算机图像处理技术到了纺织测试阶段,从半成品到成品的检验,从机织物、针织物到非织造布的检验,还有模拟控制产品质量,都能借助图像处理技术来实现。从全世界看来,图像处理起初运用于纺织工业来分析地毯的磨损状况,此后在纺织材料的测试领域中的运用范围越来越广。一般的纺织测试措施大多利用手感及目测法,受人为影响比较大,准确率低。但应用图像处理技术能减少主观因素干扰,客观评价纺织品的外观及内在质量,是增大劳动生产率、确保产品质量的重要措施。所以,研究计算机图像处理在纺织测试阶段中的运用有十分关键的意义。
一 计算机图像处理在纺织上的应用
从世界全局看来,计算机图像处理技术在纺织材料测试领域中的应用范围越来越宽,不管是对纤维、纱线或者织物的检测,全是为了符合消费者对产品质量的需求。与此同时,因为现代纺织技术的高速发展和进步,使纺织生产企业都对纺织加工期间的中间产品—纱线的质量提出了更高的标准,纱线质量已经是纺织企业生产的核心课题。所以,应用计算机图像处理技术对纱线外观质量展开客观、精准的检测是非常有必要的。
二 图像处理在纱线外观质量检测上的新发展
纱线的外观质量是纱线质量的主要指标。对于纺织行业来说,纱条的粗细均匀度测试是控制及提高纺织品质量的主要内容之一。纱线的细度均匀度,不但在一定程度上决定纺织品的外观和内在质量,况且还对纺织生产期间的稳定造成很大的影响。所以,准确评定纱线的细度均匀度是业界研究的一个主要课题,并具有很大的经济效益。
1 传统的纱线外观质量检测方法
当前传统的测量纱线不匀率的措施,一般应用目光检测法及乌斯特均匀度仪法。
①目光检验法
目光检验法换句话说是用一摇黑板机把被测纱线均匀地绕在一块180mm×250mm×2mm的黑板上,纱线的缠绕方向和黑板长度方向平行,检测者用黑板及标准样本展开对比,依规定指标对条干均匀度品级展开评定。此种方法可以非常系统地表现纱线条干的优劣,然而此法受人为因素干扰,有随意性,欠缺客观性,重复性差等劣势。
②电容式条干均匀度仪检验法
电容式条干均匀度仪是经由测试纱线横截面积的纤维根数,进而测定纱线的直径。仪器的测试部分是平行金属平板构成的电容器,它利用电容转换机理,在不同体积的试样以特定的速度到达电容器后,极板的电容量将出现变化,这样能获得棉纱线密度的不匀率。此法不但克服了目光检验法由于受人为因素而干扰结果准确性这一缺点,然而这种方法受环境影响比较严重,同一纱线所处环境的温湿度不一样会引起检测结果的差异变大;除此之外,运用电容式条干仪测得的纱线质量不匀率和织物表面质量的相关性不足,不能准确地预测布面质量。
2 利用图像处理技术对纱线均匀度的检测
当前,由于计算机技术在纺织测试领域运用的深入,应用图像处理技术对纱线外观质量展开检测是当前的研究热点也是发展趋势。应用图像处理技术对纱线条干均匀度展开检测不但能客观准确地评定纱线的等级,在检测期间还不受环境的干扰。另外,应用图像处理的方法还能正确地模拟出纱线最后成布面的状况。下面描述当前应用图像处理技术对纱线外观质量展开测试的最新方法。
①利用图像式纱线条干仪测试纱线均匀度
应用图像处理技术研制出的图像式纱线条干仪能克服一般的乌斯特均匀度仪所带的一些严重缺点,发展前景是非宽广。其测试机理是测试纱线不匀率的乌斯特仪III由以前应用电容式传感测试,改为应用光电式方法展开纱线不匀率测试。该仪器可以测定纱线结构性数据,每次扫描纱线达到2 mm精度。并且用三维计算机模拟系统能够模拟机织和针织物,如此一来能防止织造小样因品质不良而出现的时间浪费及成本代价。
②利用图像形态法测试纱线均匀度
图像形态法是说把收集到的纱线黑板图像通过图像预处理、图像二值化、自相关法、数学形态学的处理,获得一幅能够评级的图像。应用该方法对纱线均匀度展开测试能够对纱线的外观质量展开客观评定。具体实施方案是对扫描的纱线黑板图像文件展开解码,然后对解码后的图像再预处理,在这预处理主要有纱线断裂处需进行弥补,充填纱线内部的空隙,切除那些会导致疵点误判的毛羽和去除孤立点;之后应用自有关法来计算纱条的平均直径,参考得到的平均直径能够确定下面进行的腐蚀以及膨胀的结构元;最后应用数学形态学中的腐蚀及膨胀处理,使纱线黑板图像只剩下了疵点和正常纱线,这些疵点主要是粗节和棉结,如此一来就能根据留下的疵点进行评级。
③利用图像纹理分析测试纱线均匀度
图像纹理分析测试纱线均匀度通常是应用图像处理及模式识别技术对黑板图像的均匀度展开自动分析判别,使黑板的分级能自动执行。第一步把黑板图像由CCD摄入,其分辨率通常为512×512,如果直接提取其的特征的话,其运算会是非常巨大的,所以在不干扰图像质量的条件下,一定对图像进行数据压缩。然后再进行灰度变换,特征提取。在这图像的灰度值和纹理是紧密相关的,当其中的灰度变化偏大时,其区域特征是纹理。我们利用灰度共生矩阵对图像的纹理特征进行分析。从分析出来的黑板图像上能得到出,周期不均匀图有斜线和波纹状况,正常图仅在纱线的缠绕方向有间隙条纹,况且两者的图像粗糙度也不一样,两者的特征值也有很大差别,所以能用特征来区分周期不均匀图以及正常图,还能对正常图展开判级。
④利用计算机视觉技术测试纱线均匀度
计算机视觉分析系统是指将光学以及计算机图像处理技术相结合,利用小波分析、傅立叶分析等应用数学的知识,对扫描仪、CCD摄像仪等当时收集到的纱线图像展开图像处理,获得直观的纱线细度不匀。其详细的流程是先对纱线图像采集,然后通过A/D转换器变为数字量,输入计算机中去,对图像行使图像平滑、图像分割等预处理,获得一幅清晰的图像,再对图像进行特征提取及识别,最后构建标准样照图像数据库及标准样照的图像分析数据库,还有被测黑板的图像和数据分析数据库,进行评级。
美国劳森公司的EIB光电式纱线外观检测分析仪是应用计算机视觉技术对纱线展开均匀度检测的。这种最新的仪器装配有一个数字计算机控制的摄像机用来记录纱线外观轮廓,最小015 mm的疵点也可以被检测到,该软件用纱线外观信息出现的图像和统计数据,来衡量纱线疵点对织物外观的干扰,能自动给纱线定级,然而其测试不受相对湿度、温度、颜色及纤维介电系数等因素的干扰,和传统黑板评级比较,除去了了人为因素的误差,还能应用计算机模拟技术来评估织物外观,有利于优化纱线的最终用途,所以该仪器毫无疑问具有一定的实用价值。
【结语】:由于计算机越来越低的成本和性能的逐渐提高,以及计算机图像处理技术具有快速、准确、高可靠性及稳定性等优点,图像处理技术在纺织行业的发展前景会十分广阔。我们能够推测,不久由于计算机检测技术日益成熟和进步,它将越来越广泛地运用于自动化检测的过程,因为市场的需要,图像处理在工业中广泛应用的局面将会出现。
【参考文献】:[1]陈勇,温演庆,朱谱新.计算机图像处理技术应用于纺织检测[J].纺织科技进展,2006,(6):7-10.
计算机视觉的用途范文3
关键词 陶瓷砖;质量检验检测;放射性
中图分类号TU5 文献标识码A 文章编号 1674-6708(2011)47-0172-02
0 引言
陶瓷砖是一类用途普遍的建筑装饰材料,其应用广泛。陶瓷砖主要是由页岩或者粘土等在其表面涂上颜色不同釉料而加工成的。坯料的原料的颜色、质地、硬度、辐射水平等都会存在一些差异,一般以页岩为坯料比以粘土为坯料在放射性方面要高。釉料所用的锆化合物氧化锆和锆英砂,以及白色釉料中的锆英砂均有一定的放射性。在瓷砖的坯体表面喷涂釉料会引入了放射性物质,所以瓷砖放射性要比一般的建材高,而放射性是目前建筑材料所监测的重要指标。
1 普通观测
质量较好的陶瓷砖没有翘角、豉突、凹凸等缺损,面平边直,边长误差小, 厚薄均匀超过。釉面细腻、亮丽、整齐、光洁、均匀、平滑、色泽一致。有光泽釉的晶莹亮泽,没有光釉的舒适、柔和。将陶瓷砖拼放一起,于光线下察看,质量好的产品其色差较小,产品间的色调也基本一致。瓷砖的规格可以用卡尺进行测量,质量好的产品规格偏差较小,铺砌后产品整齐,砖缝平直,装饰效果较好。砖面用肉眼观察,产品面平边直。产品变形较小,利于施工,铺砌后砖面美观。质量好的陶瓷砖图案、色泽清晰、花纹,工艺逼真细腻精致。以左手的拇指、中指和食指夹住瓷砖的一角,轻轻地垂下,以右手食指轻敲陶瓷砖的中下部,若声音悦耳、清亮则为上品。陶瓷砖以韧性强、不易碎、硬底良好为上品。残片断裂是细密或者疏松,颜色是否一致,是否含颗粒以残片的棱角互划,是脆硬还是软,是否留下划痕或者散落为粉末。若为前者则为上品。
2 视觉检测
视觉检测系统是目前新兴的一种陶瓷砖质量方法,一般是通过CCD等光学元件对瓷砖进行视觉扫描,然后将测定的数据输入计算机,计算机通过某些预设的陶瓷砖标准进行相关的检测,如边角、花色、瓷砖釉质的均一程度等做一个视觉上的综合评估。此方案把一般化的瓷砖检测自动化、科学化,是目前比较先进的瓷砖检测方案之一。
3 放射性检测
测量建筑材料放射性是测量核素40K 、232Th 和226Ra比活度来计算内、外的照射指数,我国将建筑材料的放射性分为A、B、C三类。其中:A 类:IRa≤1.0;Iγ≤1.0其使用范围不受任何限制;B 类:IRa≤1.3;Iγ≤1.9不适于民用建筑的内饰面,而可用于民用建筑的外饰面以及其他建筑物的内外饰面;C 类:但凡不满足A,B 类的都属此类。
测量陶瓷砖的放射性时需要用到γ 谱仪,使用γ 谱仪前,需要把陶瓷砖样品研成细颗粒。
3.1试验条以及件样品的制备
选取多种类型品牌的瓷砖,作为放射性检测的样品。将试验用样品于颚式破碎机上破碎制成其粒径约为0.6mm的粗料。然后用粉磨机将所得到的粗料通过140目左右的筛网进行筛分,得到的细粉料要进行充分混匀,然后将其称重放入样品盒密封备用。
可以采用低本底多道γ谱仪以及高纯锗探测器,一般对60Co的分辨率不低于1.67keV,对Ti晶体等的探测效率大概为34%左右,而一般仪器的道数为8 000道左右,其测量的不确定度为4.9%、样品在测量时要置于仪器内腔的铅屏蔽室中,外壳厚度约为100mm左右的铅板,中间是4mm左右的铜层,而内层是4mm的左右的玻璃。仪器一般都兼具数据采集、处理和分析等的功能。测定样品时还需要国家级的标准物质,样品测定盒必须与标准物盒在几何形态上是一致的,一般都要为相同体积和形状的马林杯,在装样体积方面要尽量保持与标准物的体积一致。
3.2测量方法
利用相关软件编辑一个文件夹,然后从核素的库中选择某种核素输入相应的参数如Bq 、质量、不确定度以及初始标定时间和日期等,然后进行保存。
3.3能量刻度
预热并且设置γ谱仪,以便令谱仪处于常规的工作状态,然后选取标准核素刻度的γ 谱仪的能量响应,其能量刻度的范围一般应设为40keV~1 800keV。随后将标准源放于仪器探测器上,在软件的操作界面下获得g 谱。一般测量的时间要大于1 500s。然后利用系统软件读取测定峰的相应参数,显示刻度好的核素的标准曲线,最后保存即可。
3.4效率刻度
选取同时含已知活度的3种核素40K 232Th和266Ra核素的标准物质来进行效率刻度的标定。将标准样品放于仪器的探测器上,在系统软件界面下获得g谱。测量的时间应大于1 500s。然后利用系统软件读取测定峰的相应参数,显示刻度好的核素的标准曲线,最后保存即可。
3.5测定结果与分析
所有测定结果将由γ谱仪自动完成,样品与标准样的差异也可由系统软件自动生成。
4 讨论
随着科学技术的进步,越来越先进的建筑材料检测设备不断被应用,例如本文中所提及的放射性检测设备、计算机视觉监测系统等。这些设备的应用将突破传统意义上的肉眼检测。然而,仪器的检测是按照程序进行的,其测定也仅仅只包括某个方面,如放射性检测设备只能检测瓷砖的放射性,而对于其质地、美观程度等无法给出确切定义,所以在陶瓷砖的质量检测中应该把先进的技术同传统的如测定吸水率等结合起来运用,才能综合、正确合理地对陶瓷砖质量进行评估。
参考文献
[1]李庆利,郭彩玲,张向红.陶瓷砖表面质量视觉检测系统研究[J].陶瓷学报,2011(1).
[2]顾丽琴,邱佳韵.景德镇陶瓷区域品牌激活的SWOT量化分析[J].江苏商论,2011(2).
[3]李庆利,郭彩玲,张向红.陶瓷砖表面质量视觉检测系统研究[J].陶瓷学报,2011(1).
计算机视觉的用途范文4
关键字:计算机视觉; 公路标识线; 图像分割; 数学形态学; 识别
1.引言
20世纪80年代,伴随着与机器人技术密切相关的计算机、电子、通信技术的飞速发展,智能车辆进入了深入、系统、大规模研究阶段并且取得了突破性的发展[1,2],如国外的有德国的VaMP车辆系统[3]、美国的NavLab系统[4,5]等,国内的有清华大学的THMR-V[6]、吉林大学最新研制的JLUIV-IV等。在智能车辆导航技术方面,计算机视觉系统与初期的地下埋电缆的方式以及道路中间铺设磁块导航的方式等相比有着价格低廉,用途多样,结构简单,能方便与其他传感器进行数据融合等特点,所以有着广泛的应用前景。智能车辆导航的第一步是道路的检测与识别。高速公路运输的高效率、大运量、低成本等优势使研究智能车辆面向高速公路的道路的检测与识别算法很有必要。道路识别就是分析智能车辆的预瞄图像,检测出车辆相对于车道的偏差,并将偏差信息送给车辆系统,从而实现汽车“防偏安全行驶”。本文描述的一种对预瞄图像进行图像分割、数学形态学滤波、轮廓提取,改进的区域填充等识别出道路标识线的算法,实验表明具有良好的实时性、可靠性。
本文所用的图像处理方法并不需要考虑图像降质的原因,只将图像中感兴趣的特征能有选择地突出,衰减其不需要的特征。为了减少运算时间我们首先将图像由24位的RGB格式转为256色的灰度图像,整个实验的处理流程如图1所示,下面分别阐述各部分的原理。
2.1 图像分割f (x,y)
图像分割是对图像进一步分析、识别的前提,分割的准确性将直接影响后续处理技术的有效性。图像分割的方法有多种,比如阈值分割,区域分裂与合并以及区域生长等。本文选用的是阈值分割,阈值分割时最常用的一种图像分割技术,其特点是操作简单,基本原理是通过设定不同的特征阈值,把图像像素点分为若干类。设初始图像为f (x,y),按照一定的准则在f (x,y)中找到特征值T,将图像分割为两个部分――前景或者背景,分割后的图像为:若取b0=0(黑),b1=1(白)即为我们通常所说的图像二值化。然而T的选择将直接影响分割的准确性以及由此产生的图像描述、分析的正确性。确定T的方法有多种,比如直方图变化法,Otsu法,迭代阈值算法等。本文主要研究并实现了迭代阈值法[7],算法步骤为:
2.2 数学形态学
腐蚀是一种最基本的数学形态运算,其作用是消除物体边界点,使边界向内部收缩过程,可以把小于结构元素的物体去除。这样选取不同大小的结构元素,就可以去除不同大小的物体。每当在目标图像中找到一个与结构元素相同的子图像时,就把该子图像中结构元素的原点位置对应的那个像素位置标注出来,目标图像上被标注出来的所有像素组成的集合,即为腐蚀运算的结果。其实质就是在目标图像中标出那些与结构元素相同的自图像的原点位置的像素。设a为目标图像,b为结构元素,则目标图像a被结构元素b腐蚀的数学表达式为:
其中,x表示集合平移的位移量, 是腐蚀运算的运算符。
膨胀是数学形态学的另一种基本运算。膨胀的作用与腐蚀刚好相反,其作用是是对二值化物体边界点进行扩充,将与物体接触的所有背景点合并到该物体中,使边界向外部扩张的过程。如果两个物体之间的距离比较近,则膨胀运算可能会把两个物体连通到一起,膨胀对填补图像分割后物体中的空洞很有用。其实质就是先对结构元素b做关于其原点的反射得到反射集合bv,然后在目标图像a上将bv平移x,则那些bv平移后与目标图像a至少有一个非零公共元素相交时,对应的原点位置所组成的集合就是膨胀运算的结果。
设a为目标图像,b为结构元素,则目标图像a被结构元素b膨胀的数学表达式为:
其中,x表示集合平移的位移量, 是膨胀运算的运算符。
开运算也是数学形态学中的一种基本运算,使用同一个结构元素对目标图像先进行腐蚀运算,再进行膨胀运算的过程。原图经过开运算后,能够去除孤立的小点、毛刺和小的连通区域,去除小物体,平滑大物体的边界,同时并不明显改变面积。设a为目标图像,b为结构元素,则结构元素b对目标图像a的开运算数学表达式为:
2.3 轮廓提取与边界跟踪
轮廓提取的目的是获取目标区域的外部轮廓特征,为形状分析和目标识别做准备。二值图像的轮廓提取算法很简单,就是掏空目标区域的内部点。假设图像的目标像素是白色,背景像素是黑色,则如果图像中的某个像素为黑色,且它的8个邻点都是黑色时,表明该点是内部点,否则是边界点。将判断出的内部像素置为背景色,对所有内部像素执行操作便可完成图像轮廓的提取。所谓的边界跟踪就是依次记录下边界上的各个像素,是按照某种顺序依次找出物体上的其余像素,直到又回到起始点,完成整条边界的跟踪。本文按照从左到右,从上到下的顺序扫描图像,找到目标物体最左边的边界点P0,显然,这个点的左侧及上侧都不可能存在边界点,因此不妨从左下方向逆时针开始探查,如左下方的点是黑点,直接跟踪至此边界点,否则探查方向逆时针45度,直至找到第一个黑点为止,跟踪至此边界点。找到边界点后,在当前探查方向的基础上顺时针回转90度,继续用上述方法搜索下一个边界点,直到探查又回到初始过程的边界点P0,则可完成整条边界的跟踪[8]。
2.4 种子区域填充
种子区域填充就是在已有的边界内取一点,从改点开始填充整个边界包围的区域,取得该点就是“种子”。对于4连通的边界,其围成的内部区域是8连通的,而8连通的边界围成的内部区域却是4连通的。其算法概要如下:
种子的选取时种子区域填充的关键所在,一般的情况下是将种子点选在图像的中间或通过人工选择种子点,这些都不能满足智能车辆的要求。由于本文研究的是高速公路的道路识别,因其道路平坦,障碍物少等原因,我们可以通过先验知识将车载摄像头的角度调制到一定角度以减少我们不感兴趣的区域。本文通过研究与实验发现将种子点设置为高度的1/2,宽度的1/5能达到本文的要求。具体效果在实验分析可见。
3.实验结果与分析
在进行图像分割后可以获得道路的二值图。图2针对此二值图依次进行数学形态学滤波,轮廓提取与边界跟踪,种子区域填充,开运算去除噪声。下面是每步运行完的效果图以及最终的道路标志线识别图。
4.结论
本文对车载摄像系统采集的图像进行图像分割、数学形态学滤波、轮廓提取,改进的区域填充等算法识别出道路标识线,通过调节车载摄像机的角度获取感兴趣区域,减少图像处理时间和提高道路识别的可靠性。实验表明,该算法在弯道和直道的道路标志线的识别具有良好的实时性、可靠性。
参考文献
[1] Figueiredo L, Jesus I,Machado, J A T_ Towards the development of intelligent transportation systems [C].Intelligent Transportation Systems, Proceedings IEEE, 2001:1206-1211.
[2] 杨东凯,吴令培,张其善. 智能交通系统(工TS)的发展及其模型化研究[J]. 北京航空航天大学学报,2000,26(1): 22-25.
[3] Dickmanns E D, etc. The Seeing Passenger Car‘VaMoRs-P’[C]. Proceedings 1994 IEEE Symposia on Intelligent Vehicle. IEEE Press Piscataway, N J, 1994:68-73.
[4] Jochem T M, Balu}a S. A Massively Parallel Road Follower[C] .Computer Architectures for Machine Perception, 1993:2-12.
[5] Thorpe C, Hebert M H, etc. Vision and Navigation for the Carnegie- Mellon Navlab [J]. IEEE Transaction on Pattern and Machine Intelligence. 1988, PAMI-10(3):362-373.
[6] ,徐光. 视觉导航的多尺度全方位时空图像综合理解[J]. 清华大学学报(自然科学版),1997.37(3): 12-15.
计算机视觉的用途范文5
随着宽带网和智能手机的普及,世界已进入“读图”时代,图片不仅仅停留在“看”的层面,而进入到“读”和“用”的阶段。所谓“读图”、“用图”,就是对图片内容进行检索与挖掘。目前的潮流,就是用计算机图像识别技术自动“读图”,提取用户所需要的信息。比如2011年,美国第一大报U.S. Today 用图像识别在橄榄球 Super Bowl 决赛报道文章上播放录像 ,同年,澳洲主要银行之一 CommonWealth 银行用图像识别把虚拟3D模型叠加于房产广告手册上 。亮风台(上海)信息科技有限公司(以下简称“亮风台”)就是应运这个“读图”时代而产生的。
亮风台成立于2012年,虽然成立时间不长,但其厚积薄发,致力于成为图像识别和增强现实领域的互联网高科技领头企业。公司拥有具备自主知识产权的图像识别和增强现实核心技术,专注于相关技术研究与应用,提供广告营销、教育出版、娱乐、电商、旅游等行业解决方案。
亮风台的联合创始人廖春元是图像识别、增强现实和人机交互领域的专家。早年,毕业于清华大学计算机系,之后赴美留学,获得博士学位。2008年至2012年,他在富士施乐硅谷Palo Alto研究院任正研究员,是该院迄今唯一在工作前四年内就三次获得年度杰出成就奖的华人科学家。期间他主持的多个研究项目获得世界范围内同行的高度评价,并在国际计算机协会ACM主办的ACM IUI和ACM Multimedia两个业内顶级会议上分别获得最佳论文和最佳论文入围奖。2012年,廖春元放弃国外的优厚待遇,回国联合唐荣兴、王迅和韩磊等联合创立了亮风台,海讯图像识别也就此诞生。说起最初归国创业的动因,廖春元笑称,一切为了理想。
记者:能说说“亮风台”的由来吗?当初为公司取名字的时候有何构想?
廖春元:亮风台是我们家乡一座山的名字。我和亮风台的联合创始人唐荣兴、王迅和韩磊都是高中同学。当时我们经常组织活动去爬山。亮风台海拔有三千多米,我们必须在山上过夜,虽然夜晚的山林很冷很黑,但第二天却可以看到很美的云海日出。公司的核心技术――海讯图像识别的英语译名HiScene的出处也来自这里,HiScene意为Highland Scene (高地风景),意为只有爬到高处,才能看到最美的风景,我们希望图像识别技术可以为用户带来如美丽风景一般的美好体验。HiScene代表了“高度”、“视野”和“团队”三方面的理念。公司虽然成立的时间不长,但我们的核心团队成员由世界级计算机视觉、机器学习和人机交互领域科学家、国内顶尖移动开发团队以及传媒专家组成。亮风台推出的“HiScene海讯”图像识别解决方案应用平台,致力于把技术和商业相结合,以“识别图像价值,超越媒介体验”为目标,目前已经在新媒体、电子商务、广电视讯等领域为合作伙伴提供快捷接入、扩展丰富的图像识别整体应用解决方案。
记者:图像识别在国内还属于比较新鲜的事物,能否介绍一下图像识别技术?
廖春元:所谓图像识别技术,简单的来说,就是计算机通过对图像进行特定处理,理解其内容,从而找到用户所需要的信息。这些信息可能是一段文字,也可能是一段视频。公司的图像识别技术是基于HiScene互联新媒体管理平台实现的,这个管理平台是我们技术的关键所在,能识别的图像内容有多少,取决于这个后台数据库有多大。只要用户上传图片,系统就会自动将图片与后台数据库中的图片做对比,选出相似度最高的,然后自动回复相关信息。以图书为例,用户对着图书封面的任何一个区域拍照,然后通过我们的App或微信公共账号上传至云端,就可以识别出所拍图书的相关信息,如背景资料、相关介绍、版本等。我将图像识别技术称为“天”与“地”的连结纽带,“天”是在云端的多媒体数据库,“地”是线下媒体或实际的物体,而图像识别将两者很好地结合在了一起。
海讯图像识别技术的技术优势在于,首先我们有可以处理百万级以上的海量数据图片库,而且拥有高识别率。HiScene自有的技术可以在像素级别提取图片特征,用多种方法去除噪声,并用领域知识加以验证,多管齐下,提高识别率。对测试集识别正确率为 99%以上。另外,在手机本地优化以后,可以实现对图片进行实时处理,在手机上识别速度可以达到每秒10帧以上。最后,我们专门对移动设备进行优化:支持手机用户的各种操作姿势,比如不同角度、距离、光照条件,实现自然的用户交互体验。
记者:提取相关数据,使用户获得所需要的信息,这些都让人联想到现在很火的二维码识别技术,您认为图像识别技术与二维码相比,有哪些优势?
廖春元:二维码技术必须事先将每条待识别的信息制作成黑白相间的方块格子,你可以想象,在一张海报或是一本书上,有很多可识别区域的话,二维码的做法是在每一个可识别区域做一个二维码,这样会破坏原图的美感;另外,任何可以识别的物体必须加上二维码,这使得可被识别的物体具有很大的局限性。而海讯图像识别只需要一张没有做过任何特殊处理图片就能完成。我们的技术是基于最原始的数据,提取图片的特征,然后快速地在将数据库里的图片一一比对,最后将匹配图片的相关信息发送给用户。我们的图像识别技术识别力强,允许周边有物体遮挡物,并且识别面广,即使是早年发行的电影海报、图书或CD,只要在我们的数据库中有过注册,就能够被识别。
记者:图像识别是一个渗透性很强的技术,可以应用于很多领域,那么公司目前与哪些企业合作,发挥图像识别技术在该领域的作用?
廖春元:图像识别确实用途很广,可以被用于教育、广告、营销、会展、娱乐等各个领域。首先,我们利用海讯图像识别技术,提供移动AR新媒体解决方案,所谓AR,即Augmented Reality,意为增强现实,它通过突破性的多媒体展示方式,连结线上线下媒体。
公司与炫动传媒(以制作和发行《喜洋洋和灰太狼》闻名的国内儿童动漫龙头企业)结成战略合作伙伴,跟它旗下的《哈哈画报》等杂志合作开发创新的互动杂志。《哈哈画报》是一份集“视、听、闻”等多感官阅读的互动儿童读物。我们通过图像识别技术,将平面杂志与视频、动画、游戏结合在一起,提供全新的儿童娱乐和教育体验。孩子们只需下载 “哈哈探宝器”App,在有探索标示的页面移动摄像头,摄像头一旦移动到与所识别内容相匹配的画面上,手机就会播放相关多媒体动画。这种把对小孩子知识的灌输模拟成新奇探索的寓教于乐方式,对孩子来说更容易被接受。除了平面媒体之外,我们还与炫动传媒合作开发互动电视节目。只要孩子们在炫动卡通频道上酷地带节目播放期间,通过专用App扫描台标签到,就证明他这个时候确实是坐在电视机前,然后可以参与抽奖。
同时,公司还与政府合作,配合宣传。例如今年“五四”青年节前后,公司为共青团上海市委做了一个名叫“文明家族”的App,只需通过App扫描他们的宣传画,就可以播放相关文明公约的宣传视频。
另外,我们为知名艺术院校的教授设计了个性化名片,只要扫描名片上的指定logo,就能展现3D立体动画,并全面展示它在空间中的位置。这个应用可以被运用在房产宣传册和其他产品的营销当中,这种将虚实叠加在一起的方式,增强了现实效果。
除了为第三方提供图像识别解决方案,我们还拥有自己的产品,如“海讯识图”App和微信图像识别机器人――“图答应”。特别是“图答应”,将图像识别技术与方兴未艾的微信公共账户结合起来,能对用户上传的图片进行及时的回复,大大扩展了微信公共账号目前仅对关键字进行回复的功能,可以让商家很快开展更具交互性的网络营销。比如我们给宜家家居的微信账号装上了“图答应”之后,用户只需拍摄照片上传至宜家微信公共账号,即可获得家具安装视频。化妆品牌可以让用户拍新推产品的照片,参加抽奖活动,引导用户对品牌的关注。鉴于微信平台的数亿庞大用户数,图答应的应用前景极具想象空间。
无论是解决方案、“图答应”还是“海讯识图”App,其核心都是HiScene互联新媒体管理平台,关键技术和算法都融于其中,我们只是以此把它包装成不同的产品而已。
记者:目前,亮风台运营得很不错,前期推广也获得了一定的成功,那么您对于公司下一步的发展有什么规划?
廖春元:公司下一步发展的关键是继续完善HiScene互联新媒体管理平台,不断丰富平台的数据,随着云计算日益成熟,算法不断发展,以前难以处理的数据变得容易。
另外,公司希望通过宣传,让更多的用户知道和了解望风台和海讯图像识别。公司目前正和一些行业龙头,诸如安卓手机制造商合作,探讨如何将图像识别技术置入他们的摄像头。可以想见,将来的安卓手机摄像头不仅有摄影摄像的功能,还有识别功能,不需要下载图像识别App,只需这样打开摄像头的图像识别模式,就可以识别任何在管理平台注册过的商品或平媒。
计算机视觉的用途范文6
关键词:无线传感网络;人脸识别;智能家居;IPv6
中图分类号:P315.69 文献标识码:B 文章编号:2095-1302(2015)06-00-04
0 引 言
近年来互联网在各个领域得到了空前的发展,人们对信息资源的开发和利用进入了一个全新阶段。作为计算机网络的祖父 ARPANET 和其后继的 Internet 标准网络层协议IP的前形式(IPv4)已捉襟见肘:IP 地址资源越来越紧张,路由表越来越庞大,路由速度越来越慢等。虽然各方面都在研究一些补救方法,如用地址翻译(NAT)来缓解IP地址的紧张,用无类域间路由选择(CIDR)来改善路由性能等,但这些方法只能令IPv4得到一些喘息的余地并不能完全解决其先天的不足,很明显IPv4己来日不多。因此,互联网开始进入IPv6的新时代,其中的典型应用就是物联网,物联网应用覆盖了智慧农业、智能环保、智能建筑、智能交通等领域,提供“无所不在的连接和在线服务”,包括在线监测、定位追溯、报警联动、指挥调度、远程维保等。
家庭安防系统广泛应用于家庭住宅预防盗窃、抢劫以及紧急救助、烟火报警、防剪线报警、煤气泄漏报警、保险柜防盗报警等,甚至有些企事业单位也可以使用例如货物仓库防盗报警,防盗报警,金融部门防抢防盗报警,机密档案防盗,商店商场物品仓库防盗报警,住宅小区商住楼联网防盗报警,汽车停车库防盗报警等。随着人们生活品质的提高,智能家居越来越成为人们生活不可缺少的部分。
1 基于IPv6的无线传感网络模块
1.1 IPv6协议栈的裁减
无线传感网络由于其成本低廉、扩展性好、容错性强、适应性优等特点得到了飞速发展。IPv6的安全性强、支持的服务类型多、地址空间大,拥有良好的发展前景。本文研究将IPv6作为无线传感网络的底层协议,但是受到嵌入式传感节点存储器的限制,IPv6不能直接运行。但是,6LowPAN技术的出现使得IPv6在无线传感网络环境中的运用成为可能。
6LowPAN实际上就是一个适配层,它的下层协议使用的是IEEE 802.15.4,但上层协议是IPv6。它实现的是IPv6与IEEE 802.15.4的一个联接功能,相当于对IP协议和IEEE 802.15.4协议进行重组。由上层IPv6协议 、LowPAN适配层、下层IEEE 802.15.4协议组成了裁减过后的“轻量级”IPv6协议。IP协议与6LowPan协议的对比如图1所示。
图1 6LowPAN协议与IP协议的对比
6LowPAN网络可以在本网络域内正常运行,但是一个完整的网络必须是一个能够与外界联接的网络,为了与外界IP网络进行通信就要有边缘路由器。6LowPAN边缘路由器是存在于整个网络域边缘的路由器,它负责沟通外界IP网络与内部6LowPAN网络域,相当于“翻译”,将IP协议与6LowPAN协议相互转换,因此,对于这两个协议来说,协议的格式是彼此透明的。边缘路由器的功能如下:
(1)处理6LowPAN的头部压缩;
(2)发现周围邻居并建立邻居关系;
(3)将6LowPAN协议与IP协议互相转换实现通信;
(4)对传感节点收集到的不需要上传到IP网络的数据进行处理;
(5)将传感节点收集到的实时参数以及传感网络的运行状况上传到系统数据库。
边缘路由器的存在使得6LowPAN网络域能够与IP网络正常通信,才能将传感节点收集到的实时数据上传到互联网数据库,被外界所感知并根据相应规则进行自动调控或者及时通知管理人员采取适当措施。由于边缘路由器的存在,使得6LowPAN不再是一个单独的网络域,而是延伸为IP网络的一部分,这正是在传感网络的基础上实现农产品溯源的基础。
1.2 数据的上传
根据IP网络与无线传感网络的区别在于将整个系统分为两个模块,所以数据的传输可分为两段。在传感节点感知到信息后,会将信息沿着6LowPAN网络传输到边缘路由器,一部分数据会被路由器马上处理,另外一部分在经过协议转换,得到能被外界IP网络识别的数据并沿着互联网上传到某端,然后被处理,同时,信息会被数据库分类、汇总。这样就保证了传感网络的运行状况能及时上传,无用信息被丢弃,减少了系统的工作负担,提高了工作效率。从整体来看,实现重要数据从传感节点到数据库及网络的端到端联接,极大地简化了系统工作过程,如图2所示。
图2 传感节点感知信息上传过程示意图
边缘路由器的使用,充分利用了轻量级IPv6协议栈传输信息量大、安全性好、扩展性强的优势,对数据的智能处理以及网络域内外的协议转换弱化了传感网络以及IP网络的界限,使得传感节点在真正意义上接入互联网,传感器网络不再是一个独立的网络系统,而是融入至现有互联网系统中,真正将IPv6与传感网络相结合,体现了物联网的概念。
2 传感节点的分类以及工作流程
传感网络是由多种不同用途的传感器构成的,由于传感节点价格低廉、维护代价小、能够很好地适应不同环境的特点,使得传感网络能够遍布整个室内环境,更加精确地感知室内环境参数,便于自动作出应答或者及时反馈给管理人员。
(1)温度数据:分布于房间各部位的温度传感器能够实时采集房间内温度,并将数据采集上传到后台数据库,通过终端能够将过去收集到的温度信息展示,这样,人们就可以了解到自己所处的环境温度,并且选择自己偏爱的温度范围,作为智能调节室内温度的依据。
(2)光强数据:分布于必要的门禁系统以及可选择的室内房间的门内光强传感器采集的光照强度。在主人离开的命令下达之后,光强传感器开始工作,并在一定的光强范围内工作,为了提高精度,每个门设置了3个光照传感器,当接收到的光强数据超过一定的阈值之后,根据以下步骤进行工作:
①判断是否三个光照传感器都超过阈值,如果是,则执行②,否则执行⑥;
②判断是否是装有门禁系统的门出现故障,如果是,则执行(3),否则执行⑤;
③判断打开门的人是否经过授权,不是则执行④,否则执行⑦;
④将信息发送给主人,并提示危害程度为高;
⑤将信息发送给主人,并提示危害程度为低;
⑥系统故障,则记录信息,但不发送数据;
⑦系统工作正常,记录来人信息。
(3)灰尘数据:分布于地面和墙壁上的灰尘传感器能够将空气中以及地面的尘度实时监控,在检测到所处空间的尘度超过设置的阈值后,记录空间位置;当所处空间内有一定数目的节点反馈尘度超标时,相应的除尘装置就会开始工作,并且会实时查看尘度反馈情况,当所有节点提示正常工作时,那么除尘装置就会停止。
(4)烟雾数据:分布于厨房以及易发生火灾的各个地点,能够及时准确的感知空气中的烟雾信息是否超过阈值,以便判断室内是否真的发生火灾。在确认发生火灾后,能够根据烟雾浓度分布不同,大概确定着火地点。在采取应急措施的同时能够及时反馈给主人以及物业管理员。
(5)视频数据:考虑到视频数据的传输复杂性以及存储庞大性,并不是所有的视频信息都会被长时间存储。并且在正常情况下不会被传输给主人,只有在发生突发事件的情况下,根据情况的紧急性将视频信息传输给主人,以便采取更加准确、人性化的策略,避免了偶然事件的误报可能。
3 GSM通信模块
系统上电初始化各个模块以及传感器和手机号码设定完毕后,系统进入 GSM 模块初始化阶段,之后整个系统初始化设定完毕。系统进入布防状态。只有系统进入布防状态后才进入控制检测,否则布防信号无效,控制系统不检测其状态。只有设防信号有效后,系统才处于不断检测控制系统状态和接收用户短信的状态之中,若控制系统检测到有非法入侵信号时,就会发送报警短信给用户手机,可设定只发送一次短信,并且发送本地报警信号,持续 10 秒。 当用户手机发送固定格式的短信给系统时,控制系统接收并判断,然后根据判断结果给予相应回复,以实现手机用户和系统的互动操作。图3所示是GSM通信模块的工作流程图。
图3 GSM通信模块工作流程
4 门禁识别系统
4.1 人脸识别技术的现状
目前主要的基于人脸进行识别的算法包括:基于 PCA 的人脸识别算法、基于 Fisher线性判别的人脸识别算法以及基于 LBP 特征的人脸识别算法,这些算法在识别率、计算时间、数据存储量及可扩展性方面各有优劣。
OpenCV 是一个开源的可以跨平台运行的计算机视觉库,包含了许多图像处理和计算机视觉方面的通用算法。
本文在OpenCV的基础上设计并实现了一种人脸识别系统。本系统根据工作过程大致分为三个模块,包括采集图像装置、服务器和客户端。采集装置在采集成功图像后传给链接的服务器,服务器调用Opencv处理之后将处理结果通过客户端展现。根据事先录入的数据进行判断,这仅仅对授权用户开放。
与传统的Adaboost人脸检测算法不同,本系统需要的是一个正脸分类器,这就要求集中所有正样本为正面人脸,负样本需要包含非正脸的所有情况。经过测试发现,如果训练样本选择不当会导致检测算法严重失效,最终误检。例如,在复杂背景下将“非人脸”检测为“人脸”的情况;将偏转角度较大的人脸误检为正面人脸的情况。这些误检情况会对后续人脸识别产生很大的影响,从而影响系统最终结果的准确性。
4.2 双重检测算法
本系统采用 OpenCV 来实现双重检测算法。即首先采用 AdaBoost 人脸检测算法对采集图像进行检测,提取“人脸”图像区域,然后对检测到的“人脸”区域进行双眼定位,并对双眼特征进行判别。
人脸检测主要包含两个模块:训练和识别。
(1)训练模块
训练模块是由OpenCV自带的HaarTraining程序完成的。训练之前,需要采集大量的正负样本。正样本要求是正面的人脸图像,选取时需要考虑到样本的多样性(人脸表情变化、戴眼镜与不戴眼镜、光照明暗不同等),所有正样本需要裁剪为同一尺寸,然后将图片放入“positive”文件夹;负样本即为非人脸图像,要求有一定的代表性,样本数量大(一般负样本的总数要达到正样本的三倍以上),样本图片不能重复,而且彼此之间应有较大差异,然后将图片放入“negative”文件夹。此外,要求负样本采用灰度图,提高样本训练的速度。
然后创建样本文件。负样本是由背景描述文件“bg.txt”来描述,该文件通过自己手动创建,文件中每一行对应一个负样本图片的路径。由于采用 HaarTraining 训练时输入的正样本是 vec 文件,所以需要使用OpenCV自带的opencv_createsample.exe程序将准备好的正样本转换为vec文件。
(2)识别模块
首先获取摄像头视频,并对视频中的每一帧图像进行检测分析。本系统采用双重检测算法来实现人脸检测,其流程如图4所示。首先加载待检测图像,并对其进行预处理,包括灰度化、高斯滤波、直方图均衡化等。然后加载训练好的正面人脸分类器,并通过函数将其转换为OpenCV 内部格式 CvHaarClassifierCascade。再将待检测图像以及级联分类器一同传给OpenCV 目标检测函数 cvHaarDetectObject(),函数执行完返回一个检测到的人脸集合。如果集合为空,则判断无人脸存在,返回继续加载检测图像进行检测,如果不为空,则进行下一步的双眼检测。
图4 双重检测算法流程
由于本文采用的人脸分类器为正脸分类器,所以通过上述检测得到的人脸为“正脸”。 一般正面人脸都会存在双眼,所以对检测到的“正脸”再次进行双眼检测,排除前一轮检测的误检错误。双眼检测过程同人脸检测相同,只是加载的分类器不同。函数执行完返回一个检测到的双眼集合。如果集合为空,则判断该“正脸”为误检,程序返回并继续加载检测图像进行检测,如果不为空,则通过函数返回的双眼坐标进行下一步的双眼特征判断。如果不满足既定的基本准则,则判断获取的“双眼”为误检,进而判断该“正脸”为误检,返回继续加载检测图像进行检测,如果满足所有准则,则判断该“正脸”为系统所需正脸。最后分析一般正面人脸的双眼位置与比例关系,并根据获取的双眼坐标与距离,在原图像上截取正面人脸区域。将提取的正脸保存到本地文件夹,并将其传递给识别模块进行识别处理。一轮检测完后,程序将返回并继续加载检测图像进行检测。
5 结 语
在新型无线传感网络基础上实现的智能家居安防系统,由于将IPv6安全性高和无线传感网络便携性好、维护成本低、适应强的特点结合起来,具有广阔的应用前景。在此基础上实现的智能家居安防系统正在对当前以人力管理为主的存在许多安全漏洞的物业管理产业造成极大冲击,更加人性化的是,人们可以根据自己的需要定制能够满足个人需求的智能安防措施。为了更加准确地捕获室内各项参数,本系统在布置大量传感节点的同时,对系统做了冗余措施,即只有当同一区域内超过一定数量的同类型节点提示同样信息时才采取应答措施,这就避免了偶然因素。同时,根据安全事件的紧急程度采取不同等级的应对措施,如通知管理人员、报警等。门禁系统的使用,使得人们的生活更加智能化,并且通过改进的检测算法,使识别准确率大大提高;门禁系统内传感器的使用,使得非法入侵行为能够在第一时间被发现,避免了不必要的损失。GSM模块的添加使得系统更加人性化,异常信息能够被及时传递,采取更人性化、灵活的措施。视频模块的添加使得室内图像被感知并且记录下来,只有在出现紧急情况,并且在主人发出请求的前提下,短暂的视频片段才会被传输。
随着互联网的不断发展,人们的生活更加智能化、网络化,无线传感网络的推广,尤其是廉价、适应性强的传感节点的大量部署,使得多种安全所需的参数能够被准确及时地感知,相应的安全策略也能够在事故发生之后在极短时间内被采取,极大地减少了损失发生的可能性。这是物业管理的发展趋势,也是网络的再次延伸。
参考文献
[1] 边肇棋,张学工.模式识别(第二版) [M].北京:清华大学出版社, 2000.
[2] 赵伟达.人脸检测中相关特征的研究[D].上海:上海交通大学,2007.
[3] 尹洪涛,付平,孟升卫.基于局部特征融合的人脸识别[J]. 测试技术学报, 2006,20(6):539- 542.
[4] 艾海舟,肖习攀,徐光佑.人脸检测与检索[J]. 计算机学报,2003,26(7):874-881.
[5] 黄爱民,安向京,骆力.数字图像处理与分析基础[M]. 北京: 中国水利水电出版社,2005.
[6] 余永权.智能家居网络的架构、功能及发展[J].电子世界,2002(5):4-5.