前言:中文期刊网精心挑选了计算机视觉行业研究范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉行业研究范文1
[关键词] 物流企业; 自动化; 算法
[中图分类号] F252; TP39 [文献标识码] A [文章编号] 1673 - 0194(2013)06- 0058- 03
0 引 言
随着物流业被列入我国十大行业振兴计划,物流业已经成为我国经济发展的不可缺少的重要组成部分。物流业是我国经济运行的基础,是推动国民经济发展的重要支柱性产业之一。随着国家持续加强和改善宏观调控政策,物流业发展环境和条件不断改善,物流业保持了较快的增长速度。但由于中国物流业起步较晚,存在物流成本较高、管理落后等问题,离一体化、信息化的物流业还有一定差距。中国物流业只有应用现代物流的理念,采用先进的信息技术与运作方式,才能应对拥有技术、资金和管理优势的外国企业的竞争。实现传统物流业向现代物流业的转变,也是物流业自身结构调整和产业升级的需要,是整个国民经济发展的必然要求。我国经济要集约式发展,必然需要推进现代物流。现代物流的根本宗旨是降低物流成本、提高物流效率、满足客户需求,其中信息化是现代物流的核心。随着信息技术的不断更新和物流企业自身的发展,使得新兴的信息业务与传统物流业务之间相互介入,模糊了新兴信息技术及业务与传统物流业务的界限,从而模糊了物流业的产业属性和产业界限, 即发生了产业融合现象。产业融合是由于技术进步和放松管制的原因,发生在产业边界和交叉处的技术融合,在经过不同产业或行业之间的业务、组织、管理和市场的资源整合后,改变了原有产业产品和市场需求的特征,导致产业的企业之间竞争合作关系发生改变,从而最终造成产业界限的模糊化甚至重划产业界限。
产业融合促进了传统产业创新, 进而推进产业结构优化与产业发展,即产生创新性优化效应。物流信息化的重要性已经引起国内很多学者的重视,并纷纷提出相应的观点和建议。马健(2005)认为物流企业将在建立呼叫中心、应用系统领域和网络计算机领域出现信息化融合的趋势,并提出物流企业应采取的战略。邓小瑜(2011)等从技术融合、产品融合、业务融合、产业衍生4个层面阐述了物流业如何进行信息化建设。物流业与信息业的融合包含通过融合信息技术提高来增强企业竞争力和将信息业务增加到物流服务中形成新的业务2个方面。
视频摄像头在日常生活中非常普遍,但是利用率较低,大部分监控系统都是提供视频数据的线性存储,成为事后证据查找的有效手段。近年来,随着计算机视觉的发展,很多学者开始研究视频理解,尤其是针对视频信息检测与识别技术,建立有效的算法,实现底层图像处理技术与高层视频内容分析之间的关联,从而推动了计算机视觉在物流领域的应用,提高物流企业的竞争力。
1 计算机视觉的相关知识
1.1 计算机视觉的概念
20世纪80年代初,Marr从信息处理的角度,提出了第一个比较完善的计算机系统视觉框架。计算机视觉是指利用计算机模拟人眼的视觉功能,对图片或视频进行采集、加工、处理和识别,从中提取三维景物的形态和运动信息,解决物流、工业、商业等领域产品图像自动检测识别问题,提高检测识别效率和自动化程度。计算机视觉自动识别技术作为一门交叉学科,近年来受到各相关行业的高度重视。计算机视觉的处理流程为:摄像机图像采集图像处理计算机帧存储、图像识别控制逻辑显示器显示。
1.2 亮度要求
基于计算机视觉的硬件环境中,亮度是非常重要的因素。在计算机视觉中亮度的作用是突出物体的重要特征或使物体本身可见,而弱化物体其他不需要的特征或物体所处的背景。如果物体太亮或太暗,都会影响对物体的处理。
彩色物体反射光谱的某些部分,吸收其他部分。因此开发人员可以利用这个特点来提高某些物体的可视度。开发人员可以利用颜色之间的对比增强某种颜色或抑制其相反的颜色。例如,如果一个红色的物体在一个绿色背景中则应该加强红色,这时可使用红色照明。这样红色的物体会显得明亮,同时会变暗绿色的对象。
LED是目前用于计算机视觉的主要照明技术,相比白炽灯、日光灯等使用时间短、亮度逐渐减弱的特点,LED灯的寿命超过100万小时,而且耗电小,产生热量少。
1.3 计算机和摄像机的接口
常用的计算机和摄像机接口包括IEEE 1394、Ethernet、USB2.0 and Gigabit Ethernet等。
1.4 RGB介绍
RGB 颜色空间是实际应用最多的一个颜色空间,在使用计算机进行图像处理时,数字图像一般用RGB 空间存储和表示,分3个通道:红(Red)、绿(Green)和蓝(Blue),分别反映了颜色在某个通道的亮度值。3种原色光不同比例混合即使得人得到不同颜色的感知,这就是RGB颜色空间的由来。RGB 空间中每种颜色都能用三维空间中的一个点来表示。
2 计算机视觉在物流领域的优势
随着物流业的迅速发展,计算机视觉在条形码识别、运动物流跟踪方面逐渐得到应用。与传统方法相比,计算机视觉应用在物流领域的优势为以下方面。
2.1 灵活、低成本
物流系统中一般采用传感器来收集相关信息,但是传感器的位置是固定的,如果需要多方位的信息,必须同时需要多个传感器才能完成。利用计算机视觉摄像机和计算机来完成,只需要通过程序的设置和一台摄像机就可实现多方位信息的收集。
2.2 高效、准确
在一些人眼难以满足要求的场合,或不适于人工工作的环境下,用计算机视觉来代替人工视觉可以提高生产效率、信息的准确率。
3 计算机视觉在流水线中多方位跟踪计数的算法
物流企业在流水线产品的计数方法目前主要采用传感器,而利用摄像机所提供的视频信息可以实现多方位的跟踪。计算机视觉是一个集成系统,图像分析的时间有限,算法必须简单有效。本文采用的物流流水线视频图像如图1所示。图中红色矩形表示流水线中传输的物品,绿色区域为流水线中的物品处理区域。
系统会在视频图像中设计①、②、③、④四个计数区域,在物品进行相关处理前进行计数。计数方法为将每帧图像变为黑白图,图像中的红色变为白色,其余都变为黑色。当每幅图像中的红线部分中的白色像素超过一定阈值时,认为物体撞线,如图2所示,这时确定有需要计数的物品通过,可以开始计数。
3.1 主要算法
3.2 算法的运行结果
OpenCV是Intel公司开发的开源计算机视觉库。它提供了几百个C/C++函数,实现了计算机视觉领域中大部分最常用的算法。利用Intel开发的开源视觉库Intel OpenCV和VC6.0将上述算法转换为对应的源代码,可实现4个区域的物品计数。
3.3 算法的评价
该算法利用计算机视觉技术实现了物流流水线上的多方位计数,提高物流企业的信息化水平,节约了资金。算法简单,运行速度快,完全可以满足物流企业的实际需求。
4 结论与建议
本文所提出的算法实现了计算机视觉技术在物流企业的应用,为信息产业和物流业的融合提供了新的思路。但信息产业与物流产业的融合并不意味着引入信息技术后物流业的竞争力一定能提高。Berry(1995)指出了企业可以从6个方面来利用技术手段来提高竞争力,根据Berry的建议和我国物流业的实际情况,本文认为从以下几个方面来考虑如何通过与信息技术的融合提高物流企业的竞争力。
4.1 要有一个战略性的全局行动纲领
技术只是一种手段,使用技术的目的是为了企业发展服务,应符合全局发展的需要。因此物流企业高层管理者应该参与技术战略的制定,保证技术战略与全局战略一致,并有CIO(首席信息官)监控具体执行情况。而不应该盲目使用一些新技术或进行信息改革,造成企业不必要的损失。
4.2 解决主要问题
物流业作为服务行业其最终目的是为客户服务,使用信息技术的有效性应建立在为客户解决实际问题的基础上。因此信息产业与物流业的融合应体现在为客户提供更多的便利,或提供增值服务的基础上。
4.3 使用物流公共信息平台和建立物流信息系统,保证系统有效运转
通过现代物流公共信息平台的建设,企业可以及时获得需求信息,政府可获得物流业相关的调控和管理的宏观信息,实现互联互通。通过企业流程再造,利用含有CRM(客户关系管理)等模块的ERP系统,采用EDI(电子数据交换系统)、GPS、条形码、无线射频技术等先进技术,建立真正适应企业发展的符合现有服务模式的管理信息系统。
4.4 创新型物流人才的引进和培养
物流企业在自身提高业务流程和信息化水平的同时,还应注重创新型人才的引进和培养,特别是有国际大型物流企业管理和技术经验的复合型人才。
主要参考文献
[1] L Leonard,Berry. On Great Service:A Framework for Action[M]. New York NY:The Free Press,1995.
计算机视觉行业研究范文2
关键词:计算机视觉分析;微小尺寸;精密校正;阈值;图像分割
中图分类号:TP274.4
计算机视觉分析理论是基于精密模式识别和人工智能程序化校验技能进行综合整编的方法,利用光学信息对真实物理结构的实时反映,配合人机协调手段进行二维图像的呈现。在工件表面进行质量检测和图片制备要素分析的系统环节中,阐述物体在空间环境之间的关系样式,争取三维场景的科学搭建。集合要素内容包括边缘、线条和曲面的配备,建立以工业部件为中心的坐标体系,并适当运用不同符号表现模式实现必要三维结构和空间关系的调整,促进精密仪器细节检验工作质量的不断提高。
1 计算机视觉检测技术的相关理论研究
1.1 技术原理分析
渗透性计算机辅助支持结构的视觉鉴定技术在被测实体中的图像显示支持功能基础形势上进行质量状况的把控,这其实就是根据既定的偏差标准实现规模物件的逐个排查。细致的检测工作在深度零件的诱导性特征和完整性配件的支持下,对整体完好效果的几何制备模型进行测量[1]。近阶段的视觉规范系统利用电耦合器件和摄像机进行主题元素的捕捉,并利用计算机内部程序的数字信号转化工具实现图像的并行处理。采用目标图像的特殊坐标记录,利用灰度分布图内的多种综合功能处理系统改善的要务。常规视觉下的检测过程相对比较繁琐,主要是将被检测物体放置于照明效果相对均匀的可控制背景环境中,联结CCD技术和图像卡实现被测部件和数字图像的共性要素融合,保证计算机自动化处理程序的录入。当然,这类研究系统是需要利用相关软体进行放大的,其主要必备功能就是进行图像的预处理、识别和有效分析,将整个过程内部的实际结果数值,包括被测部件的自身缺陷、尺寸等进行整理。
1.2 计算机视觉微小尺寸精密检测工业应用技术的现状
在科学设计信息内容和工业加工制备要领集成化对待的环节中,通常不会直接进行部件表面的接触,一般运用计算机程序下的扫描认知和图像即时呈现功能进行快速的比对检测,整体信号抗干扰能力较强,因此在现代工业生产技术领域内部广受好评。电子工业是在建立计算机视觉分析工艺之后表现最为活跃的行业类型,在此基础上衍生的印刷电板路和集成电路芯片就是利用标准模型的整改,实现规模工序的紧密排列。目前,时下流行的汽车生产、纺织、商品包装等也逐渐向这类手段靠拢,全面改善了现代化工业制备的应用效果。
2 应用视觉微小尺寸分析技术内部拓展机能的补充
灰度图像的主要分割方法包括灰度阈值校正、边缘检测制备等手段。
2.1 灰度阈值校正
这是区域分割方法中一种常见的手段,主要配合多个或单个阈值将图像自身的灰度级别划分为几个项目组,对相同像素的单位数据进行整编。根据实效范围进行分类,包括局部和全局阈值探究两种手段,全局规模下的阈值分析方法就是利用整幅图的灰度直方分布图进行内部最优阈值分割,包括单阈值和多阈值两种形式;同时还可以将初始分析的图像进行子元素的拆解,之后利用单个子图像的既定阈值范围进行最优化分割[2]。分割的基本原理公式为:
其中,合理阈值的选取是非常重要的,目前阈值确定的手段主要包括直方图双峰对照法和最大类间方差累积法等。这种利用灰度阈值实现精准质量的划分手段,计算执行工作相对比较简单,并且实际工作效率水平较高,即便是实际需要分割的物体与图像背景对比深度较强也可以收放自如,但唯一的缺点就是缺少对空间信息的掌控,涉及亮度不足的图像问题,这种阈值分割技术的施工质量往往不会太高。
2.2 边缘检测制备工序
图像内部元素的分割其实就是进行部件边界效益的提取,而边缘检测制备工序则是利用像元及邻域的整体状态进行物体边界相关结构的搭建。边缘检测分割制备技术具体包括并行和串行两种模式,并行手法是运用梯度信息的提取实现不同类别算子的整理;串行边界分割原理则是根据适当强度标准和相似走向的两个边缘端点位置实现连接,主要代表算法包括启发式智能搜索手段等。这种串行算法较并行边界积累统计原则来说具有更强的抗干扰能力,但实际的边缘检测同样不能完好地维持连续效果,需要利用其余技术内容进行边缘制备技巧的修复。
(1)原始图像 (2)Robert算子边缘检测 (3)Sobel算子边缘检测
(4)Prewitt算子边缘检测 (5)Kirsch算子边缘检测 (6)Gauss-Laplace算子检测
图1 微小双联齿轮边缘检测
3 视觉检测系统的创新性改进
根据以上现状问题,创新式视觉整改校验系统利用照明光源、摄像机和图像采集卡等结构实现计算机输出结果质量的补充。其主要运行过程如下:利用被测部件在均匀照明背景的全面优化控制基础,实现物体结构的全面清晰呈现,使用摄像机对相关图像信号进行梳理并转化为电荷信号,配合相关的图像资源采集卡进行部件数字化图像的格式转化;计算机内部软体操作程序将得到的数字图像进行处理和识别,并将最终结果数据输出,实现现代工业技术整体质量规模控制的既定要求。
系统硬件在实现部件转化图像信息的环节中,连接检测机理下的连续软件规划和照明光源等相关设备进行图像适当分辨率的调整,维持图像较为清晰的对比效果。全面控制获取数字图像的时间,抵抗不良因素的干扰影响,维持内部成本经济规模的合理控制,促进科技应用和可持续发展经济战略双重价值标准的同步进展。其中,光源设备的选择必须落实到部件既定的几何形状条件下,利用相关性能参数进行实际工作要求的提供,包括光源位置、亮度、寿命特性等因素的堆积,常用的可见光源包括水银灯、荧光灯等,但这类光源使用寿命有限,因此现下多配用LED光源进行快捷反应、小功耗标准的补充,并且长期使用后的照明效果比较稳定[3]。而摄像机等结构主要还是校正参数的表达方式,进行图像合理分辨率的整改,促进图像采集数字化协调功能的发展,提高系统工作速度等。
4 结束语
计算机视觉检测系统在进行一定部件性能评比的活动中有着很高的贡献,不仅配合硬件的照明、参数制备要领制备功能,同时促进数字化图像对比的速度,使得工业生产环节中的部件检查工序得到大范围整改,满足可持续发展战略规模的视觉意义,促进现代智能化分析处理技术的全面覆盖。
参考文献:
[1]陆春梅.基于数字图像处理技术的接杆激光环焊焊缝视觉检测系统研究[D].上海交通大学,2008.
[2]罗敏.基于机器视觉的黑片缺陷检测图像边缘提取算法研究[D].沈阳理工大学,2010.
计算机视觉行业研究范文3
【关键词】机器视觉;应用研究
机器视觉是一门涉及人工智能、计算机科学、图像处理、模式识别、神经生物学、心理物理学等诸多领域的交叉学科。机器视觉主要利用计算机来模拟人或再现与人类视觉有关的某些智能行为,从客观事物的图像中提取信息进行处理,并加以理解,最终用于实际检测和控制。随着现代计算机技术、现场总线技术与大规模集成电路技术的飞速发展,机器视觉技术也日臻成熟,已经广泛应用在国民经济发展的各行业。
1.机器视觉系统组成
一个典型的机器视觉应用系统包括图像捕捉、光源系统、图像数字化模块、数字图像处理模块、智能判断决策模块和机械控制执行模块,如图1所示。首先采用CCD摄像机获得被测目标的图像信号,然后通过A/D转换成数字信号传送给专用的图像处理系统,根据像素分布、亮度和色彩等信息,进行各种运算来抽取目标的特征,然后再根据预设的判别标准输出判断结果,去控制驱动执行机构进行相应处理。
总之,随着机器视觉技术自身的成熟和发展,可以预计它将在现代和未来制造企业中得到越来越广泛的应用。
2.机器视觉技术的应用
在国外,机器视觉的应用主要体现在半导体及电子行业,其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路;SMT表面贴装;电子生产加工设备;机器视觉系统还在质量检测的各个方面已经得到了广泛的应用,并且其产品在应用中占据着举足轻重的地位。
而在中国,以上行业本身就属于新兴的领域,再加之机器视觉产品技术的普及不够,导致机器视觉在以上各行业的应用几乎空白。目前随着我国随着配套基础建设的完善,技术、资金的积累,各行各业对采用图像和机器视觉技术的工业自动化、智能化需求开始广泛出现,国内有关大中专院校、研究所和企业近两年在图像和机器视觉技术领域进行了积极思索和大胆的尝试,逐步开始了工业现场和其它领域的应用。
(1)工业中的应用
虽然机器视觉技术从20世纪80年代才开始起步,但由于其突出的优点,在各种工业领域被广泛应用,特别是近几年发展十分迅速,国内外的成果也是层出不穷。
在国外,机器视觉技术广泛应用于机器零部件的装配、非接触测量、产品质量检测、在线过程控制、数控机床加工、过程监控等领域。英国ROVER汽车公司800系列汽车车身轮廓尺寸精度的100%在线检测,是机器视觉系统用于工业检测中的一个较为典型的例子,该系统由62个测量单元组成,每个测量单元包括一台激光器和一个CCD摄像机,用以检测车身外壳上288个测量点。汽车车身置于测量框架下,通过软件校准车身的精确位置。测量单元的校准将会影响检测精度,因而受到特别重视。每个激光器/摄像机单元均在离线状态下经过校准。同时还有一个在离线状态下用三坐标测量机校准过的校准装置,可对摄像顶进行在线校准。检测系统以每40秒检测一个车身的速度,检测三种类型的车身。系统将检测结果与人、从CAD模型中撮出来的合格尺寸相比较,测量精度为±0。1mm。ROVER的质量检测人员用该系统来判别关键部分的尺寸一致性,如车身整体外型、门、玻璃窗口等。实践证明,该系统是成功的,并将用于ROVER公司其它系列汽车的车身检测。
机器视觉在国内的应用主要集中于检测与定位等几个方面,这样的工业产品占据了中国市场的绝大部分。机器视觉在工业检测中的应用最为常见的是对各种机械零件的几何尺寸进行测量,在半导体及电子行业,国内高等院校和科研单位也研究出基于机器视觉的管脚尺寸自动检测装置。此外,机器视觉还被用于对于如刀具等工业设备的检测和数控机床的加工。在很多工业领域存在着高精度定位的问题,如钻床数控系统钻头定位、金属板材数控加工轨迹坐标定位等。目前机器视觉技术由于其高精度的优点在这方面得到广泛的应用。华中科技大学在金属板材数控加工中利用机器视觉技术对加工轨迹坐标定位。提出一种基于机器视觉的非接触式加工轨迹坐标定位方法,完成了金属板材数字化成形中支撑模型的非接触式高精度快速定位。湖南大学进行了钻头视觉定位研究,在视觉定位中采用间接定位方式,间接实现钻头刃磨初始状态的定位。中国计量学院等单位进行了基于机器视觉的PCB数控钻机定位研究。大量的实践证明采用机器视觉系统进行定位并且综合运用数控伺服传动技术以及各种先进控制技术能够有效实现精确定位。利用机器视觉系统节约了大量的人力和物力,降低了产品生产成本。
(2)农业中的应用
计算机视觉技术在农业上的应用研究,起始于20世纪70年代末期,主要应用于植物种类的鉴别、农产品品质检测与分级等。随着计算机软硬件技术、图形图像处理技术的迅猛发展,它在农业上的应用研究有了较大的突破,在农业领域的生产前、生产中、收获时和产后的各个环节中,均可以利用计算机视觉技术来实现这些农业生产的视觉化。计算机视觉在产前的应用主要是检验种子质量;在产中的应用包括田间杂草识别、植物生长信息的监测、病虫害的监视和营养胁迫诊断等方面;在农作物收获时的应用主要体现在农业机器人的研制与开发上;在产后的应用包括水果分级和农产品的加工等。在农田作业机械上,机器视觉技术被不断的开发和应用。农药的粗放式喷洒正是农业生产中效率最低、污染最严重的环节。利用机器视觉技术可以实现农药的精量喷洒,近年来,机器视觉技术在播种机械方面的应用主要是检测播种质量;在自动收获机等农田自动作业机械上,更需要依靠机器视觉系统来确定作物行与机械的相对位置,以控制自动作业机械在作物行间自动行进,
机器视觉技术在农业生产上的应用可提高生产的自动化水平,解放劳动力,具有良好的应用前景。同时还应看到,由于农业对象的特点,机器视觉理论和技术的局限性以及硬件条件的限制,机器视觉技术在农业生产的应用距离实用和普及还有相当长的距离。相信随着相关技术的发展,很多问题会得到好的解决,机器视觉技术在农业生产中的应用会极大地加快农业现代化的进程。
(3)医学上的应用
随着药品和医疗器械安全性问题重要性的不断提升,越来越多的生产厂商将机器视觉技术引入实际生产中来,以达到提高生产效率,加强产品品质保障的目的。同样,在医疗系统中机器视觉也得到了越来越多的应用。
机器视觉科技医药领域的应用主要分为医学与药物两部分。机器视觉技术在医学疾病诊断方面的应用主要体现在两个方面:一是对(X射线成像、显微图片、B超、CT、MRI)图像增强、标记、渲染处理,主要利用数字图像处理技术、信息融合技术对X射线透视图、核磁共振图像、CT图像进行适当叠加,然后进行综合分析协助医生诊断;二是利用专家知识和3D重构对物体三维信息与运动参数进行分析并给出形象准确的解释,如诊断与手术等。机器视觉技术的应用不仅节省了人力,而且大大提高了准确率和效率。在药物方面,机器视觉系统对药用瓶的缺陷检测,也包括了药用玻璃瓶范畴,也就是说机器视觉也涉及到了医药领域,其主要检测包括尺寸检测、瓶身外观缺陷检测、瓶肩部缺陷检测、瓶口检测等。除此之外,对药剂杂质的检测、对医学用具质量的检测、对药物外包装泄露的检测等等都在保障着药物的质量安全,保障着人们的生命健康。
(4)交通领域的应用
随着计算机的普及和相关软件的不断更新升级,机器视觉技术在交通领域所发挥的作用愈为重要。机器视觉技术在交通领域的应用范围较广,主要包括视频检测系统、智能车辆的安全保障系统、车牌识别和交通指挥等。
视觉技术应用于视频检测时,视频检测系统的目标就是用数字图像处理和计算机视觉技术,通过分析交通图像序列来对车辆、行人等交通目标的运动进行检测、定位、识别和跟踪,
并对目标的交通行为进行分析、理解和判断,从而完成各种交通流数据的采集、交通事件的检测,并尽快进行相应处理。视频的交通事件和参数检测系统有高度的网络化和智能化,可实现远程监控和设置。视觉技术应用于智能车辆安全保障系统,主要用于路径识别与跟踪、障碍物识别、驾驶员状态监测、驾驶员视觉增强等。德国UBM大学Dick-manns教授领导的智能车辆研究小组一直致力于动态机器视觉领域的研究,研制的EMS-Vision视觉可较好地模拟人眼功能。车牌识别技术(VLPR)是计算机视觉和模式识别技术在现代智能交通系统中的一项重要研究课题,是实现交通管理智能化的重要环节。随着图像处理技术的日趋成熟,更多算法的融入综合,使得车牌识别技术逐渐成熟。单一算法很难达到良好的识别效果,只有多种方法结合,才能实现车牌识别的高效性和准确性。过去的10多年里,有些国家已经成功开发了一些基于视觉的道路识别和跟踪系统。其中,具有代表性的系统有:LOIS系统、GOLD系统、RALPH系统、SCARF系统和ALVINN系统等。
机器视觉技术在交通各领域都发挥着越来越重要的不可替代的作用。在取得较大成绩的同时仍有不足。其一应尽快开发出具有高性价比的实用化的激光距离成像系统,能够获取高质量的原始图片至关重要;其二,处理各种交通事件的及时性决定了所有的图像处理的速度应尽可能的快,目前的各种算法都各有优劣,如何能在最短的时间内完成图像的识别工作成为我们下一步要努力的方向。
3.发展趋势
在机器视觉赖以普及发展的诸多因素中,有技术层面的,也有商业层面的,但制造业的需求是决定性的。制造业的发展,带来了对机器视觉需求的提升;也决定了机器视觉将由过去单纯的采集、分析、传递数据,判断动作,逐渐朝着开放性的方向发展,这一趋势也预示着机器视觉将与自动化更进一步的融合。未来,中国机器视觉发展主要表现为以下一些特性:
(l)随着产业化的发展对机器视觉的需求将呈上升趋势。
(2)统一开放的标准是机器视觉发展的原动力。
(3)基于嵌入式的产品将取代板卡产品。
(4)标准化一体化解决方案是机器视觉发展的必经之路。
(5)机器视觉系统价格持续下降、功能逐渐增多。
4.结语
机器视觉技术经过20年的发展,已成为一门新兴的综合技术,在社会诸多领域得到广泛应用。大大提高了装备的智能化、自动化水平,提高了装备的使用效率、可靠性等性能。随着新技术、新理论在机器视觉系统中的应用,机器视觉将在国民经济的各个领域发挥更大的作用。
参考文献
[1]李福建,张元培.机器视觉系统组成研究[J].自动化博览,2004(2):61-63.
[2]范祥,卢道华,王佳.机器视觉在工业领域中的研究应用[J].现代制造工程,2007(6):129-133.
[3]张萍,朱政红.机器视觉技术及其在机械制造自动化中的应用[J].合肥工业大学学报(自然科学版),2007, 30(10):1292-1295.
[4]马彦平.计算机视觉技术在农业生产中的应用与展望[J].中国农业资源与区划,2009,30(4):21-27.
[5]饶秀勤.基于机器视觉的水果品质实时检测与分级生产线的关键技术研究[博士学位论文].杭州:浙江大学,2007.
[6]冯新宇,庞艳辉.车牌识别技术实现方法初探[J].交通科技与经济,200712:50-511.
[7]徐琨,贺昱曜,王夏黎.基于背景模型的运动车辆检测算法究[J].微计算机信息,2007,4-1:120-1211.
计算机视觉行业研究范文4
[关键词]变电站工作区;安全监控;智能视频监控
中图分类号:TM63;TM769 文献标识码:A 文章编号:1009-914X(2016)13-0321-01
1. 引言
在变电站中,完成各类作业的主体之一是人员,因人在完成各类作业时需要在变电站内不断运动,因此在变电站工作现场安全区域监控中人的行为监控是重点之一。
目前在变电站工作现场安全管理方面存在以下问题:
1)部分工作人员自觉性不高,导致习惯性违章屡禁不止。如跨越护栏进入带电区域的现象、不正确佩戴安全帽、不正确穿着工作服、不按照安规要求搬运工具、登高不佩戴安全带、监护人离岗等违章行为时有发生。
2)当有监督管理人员在现场监管时,极少部分工作人员对监督管理人员要求、提醒及规章制度不屑一顾,对作业现场安全隐患麻痹大意,因此很有可能在不经意间导致事故发生,威胁人员生命安全,威胁电网运行安全。
目前,随着计算机技术及视觉监控系统的不断发展,变电站工作现场安全监控系统开始得到应用。特别对于无人值守变电站工作现场的安全监控问题,对作业人员擅自穿、跨越安全围栏或超越安全警戒线进行警告监测,纠正违规违章行为,防止因现场监控不到位引发的误操作、误入工作现场等恶性事故的发生,对提升电力作业现场安全管理水平有重要意义。因此,需要探寻全新的安全监管手段,实现作业现场高效监管,提高监管水平,降低作业安全风险。
2. 发展现状
(1) 安全系统工程
安全系统工程是以信息论、控制论等为基础,专门研究如何用安全工程、系统工程、可靠性工程的原理和方法,对研究对象中的风险进行辨识、评价、控制和消除,以实现系统及其全过程安全的科学技术。
安全系统工程产生于20世纪60年代初期美英等工业发达国家。美国、英国、日本等公司相继发表了火灾爆炸指数评价法、埃德蒙德评价法、化工企业六步骤安全评价法等多种评价方法,用于化学企业安全评价。以此同时,许多系统安全分析方法和评价方法在电子、航空、铁路、汽车、冶金等行业得到了应用。
我国安全系统工程的研究、开发是从20世纪70年代末开始的。天津东方化工厂应用安全系统工程成功地解决了高度危险企业的安全生产问题,为我国各个领域学习、应用安全系统工程起了带头作用。其后,机械、冶金、航空、交通运输、核电等行业的企业广泛借鉴引用国外的系统安全分析方法,对现有系统进行分析和评价,取得了良好的应用效果。
(2) 变电站安全管理方法
近年来,变电站工作现场安全管理实行“安全第一、预防为主、综合治理”的安全工作方针,加强基础管理,狠抓现场管控,检修现场安全措施管理方面主要有工作票制度、运行人员操作票制度和现场作业危险点分析预控卡以及继保人员使用的二次工作安全措施票,把安全意识、制度约束、作业行为落实到现场安全管理全过程,使设备常规监督、状态检修、跟踪预控等各项措施实现无缝渗透。目前,变电站检修现场安全措施管理存在以下问题:一是作业现场失去安全监护违章作业。二是作业人员素质不高,责任心不强。三是擅自扩大工作范围。四是对作业人员的安全教育及交底不足、不到位。五是现场监督工作不到位。
(3) 安全监控方法
计算机智能视频监控是计算机视觉领域一个新兴的应用方向和备受关注的前沿课题。伴随网络技术和数字视频技术的飞速发展,监控技术正向着智能化、网络化方向不断前进。监控系统功能日益强大,但是依然需要工作人员不间断地分析监视场景内的活动,日夜值守,工作量繁重。因此计算机视觉和应用研究学者适时提出新一代监控―视频监控的概念。视频监控在不需要人为干预情况下,利用计算机视觉和视频分析的方法对摄像机拍录的图像序列进行自动分析,实现对动态场景中目标的定位、识别和跟踪,并在此基础上分析和判断目标的行为,从而既能完成日常管理又能在异常情况发生时及时做出反应。计算机视频监控系统不仅符合信息产业的未来发展趋势,而且代表了监控行业的未来发展方向,蕴藏着巨大的商机和经济效益,受到学术界、产业界和管理部门的高度重视。
目前,对计算机视频监控的研究与应用方兴未艾。计算机视频监控是利用计算机视觉和图像处理的方法对图像序列进行运动检测、运动目标分类、运动目标跟踪以及对监视场景中目标行为的理解与描述。其中,运动检测、目标分类、目标跟踪属于视觉中的低级和中级处理部分,而行为理解和描述则属于高级处理。运动检测、运动目标分类与跟踪是视频监控中研究较多的三个问题;而行为理解与描述则是近年来被广泛关注的研究热点,它是指对目标的运动模式进行分析和识别,并用自然语言等加以描述。
3. 理论依据
(1) 安全系统工程
对于变电站安全监控系统而言,它是安全系统工程学在变电站安全中的具体应用,其主要目的是通过对变电站工作人员和设备工作安全相关的监控对象某个或某一类属性的检测、监控、分析评价,及时发现其属性在变电站运营过程中状态的变化情况。如果出现设备故障隐患、人员异常行为等危机安全的现象,提醒相关人员及时采取有针对性的措施,对监控对象进行处置、维修和养护,以保证变电站处于良好的运行状态,从而保证电力系统稳定安全地工作。
(2) 安全监控技术
目前,智能视频监控技术应用于变电站工作现场安全监控管理中。计算机视觉的研究目的是利用计算机代替人眼及大脑对于景物环境进行感知、解释和理解。如果把摄像机看作人的眼睛,而智能视觉监控系统则可以看作人的大脑。智能视觉监控系统能够识别不同的物体,发现监控画面中的异常情况,并能够以最快和最佳的方式发出警报和提供有用信息,从而能够更加有效的协助安全人员处理危机,并最大限度的降低误报和漏报现象。一般而言,智能视觉监控的主要研究内容包括目标检测与分类、目标跟踪、目标匹配额、目标定位、目标识别和行为理解(行为分析、语义描述)等。
4. 应用情况
从国外的应用情况来看,智能视频监控技术具有两种应用模式:一是与传统的模拟视频监控系统结合使用,二是基于网络的全数字化智能视频监控系统。目前,我国的从事智能视频监控系统的公司一般都是与国际上比较好的智能视频领域的公司合作。2005年5月,北京兆维泰奇科技有限公司与瑞士Visio Wave公司合作基于网络智能化的安防监控解决方案。2007年3月,深圳贝尔信科技与以色列IOimage公司建立合作伙伴关系并成为中国区产品总与技术支持中心,推出了 bellsent系列产品,已成功在机场、油田、博物馆、铁路干线、仓库等地方成功应用。
5. 结语
视频监控系统未来发展会越来越智能化,在有效采集信息的基础上,智能视频监控系统比普通的网络视频监控系统具备更强大的图像处理能力和智能因素,其能感知和理解的信息包括人脸(用户身份)、人和物的行为、人员流动、人和物的消失出现、人群聚集状态、人体疲劳状态、烟雾产生和蔓延等,所有需要用到这些信息的应用领域,都有可能成为智能视频分析的用武之地。变电站工作现场安全监控系统使用智能监控技术,实现对变电站工作现场的全自动化管控,对人身安全和设备安全以及对提高整个网络的安全水平都有重要意义。
计算机视觉行业研究范文5
关键词: 机器视觉; 图像检测; 航空轮胎; 表面质量
中图分类号: TP 23文献标识码: A
引言近年来,随着生产工艺飞速发展,人们开始关注产品的外观质量,比如印刷品、包装、工艺品等以外观质量为重要附加价值的产品,又比如航空轮胎等表面缺陷会直接影响到使用效果甚至会给使用者的生命财产安全带来无可挽回的损失的产品。众所周知,机器视觉已经发展成为重要的工业生产加工手段之一,在中国成为全球重要的制造中心之一的背景下,中国成为继美国、欧洲和日本后的全球第四大机器视觉市场,同时也是最具发展潜力的市场。一方面外国企业积极入驻中国带来了巨大的视觉系统需求,另一方面国内企业不断扩大生产规模,加大了对视觉系统的需求,以航空轮胎为例,未来十年,国家将在大飞机项目中投入500~600亿资金,大飞机项目的发展,必将会带动航空轮胎行业大规模的发展,对航空轮胎的质量要求也会更加严格。1国内外相关技术研究国外对机器视觉技术的研究,由于开展的比较早,而且具有资金、技术以及硬件方面的优势,已经走在了国内的前面。国外的机器视觉系统的应用领域涉及到了社会生产的各个方面,有原始的在线监视,也有外观检测以及动作、行为控制,许多工业加工成套生产设备都集成了机器视觉系统,成为加工生产线的标配,比如印刷生产线上的机器视觉质量控制系统,又比如汽车制造业中的移动三坐标测量系统[1]。由于经济和技术原因,国内绝大多数图像处理技术公司都以国外产品为主,没有或者很少涉足拥有自主知识产权的机器视觉在线检测设备,对视觉技术的开发应用停留在比较低端的小系统集成上,对需要进行大数据量的实时在线检测的研究很少,也很少有成功案例。但是,随着国内经济发展和技术手段不断提高,对产品质量检测要求就更高,对在线检测设备的需求也就更大,具有巨大的市场潜力。计算机、摄像机等电子技术的飞速发展大大提高了机器视觉系统的硬件水平,同时图像处理理论和算法的快速发展也给机器视觉系统提供了强大的软件支持。但是,仍然伴随着一些问题,主要有以下两点:光学仪器第35卷
第3期谢,等:机器视觉在轮胎检测领域的应用研究
(1)算法的精确性提高伴随着计算量的成倍增加,处理时间就成为了实时检测的软肋;(2)硬件的分辨率提高了,图像的分辨率、精度也随之提高了,但是数据量计算量都因此成倍增加。因此,如何保证检测的实时性和准确性,是机器视觉系统在工业应用中需要解决的核心问题。2视觉检测核心技术
2.1机器视觉图像处理技术机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是指通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。有大量的文献和著作给与介绍和讨论,其中比较著名的马颂德的《计算机视觉》介绍了计算机视觉的算法和理论,以及Richard Hartley的《Multiple View Geometry in Computer Vision》介绍了在计算机视觉中的几何理论和方法[2]。机器视觉中的图像处理方法,主要包括图像增强、数据编码和传输、平滑、边缘锐化、分割、特征抽取、图像识别与理解等内容。经过这些处理后,输出图像的质量得到相当程度的改善,既优化了图像的视觉效果,又便于处理器对图像进行分析、处理和识别[3]。机器视觉理论应用于现代检测领域,是上世纪末本世纪初计算机视觉的一个新的研究方向。它使用计算机视觉的理论方法来识别物体的关键点,经过分析处理以后,转换成坐标数据,然后产生检测数据。国内已有学者把机器视觉技术运用于检测领域[4]。但是在轮胎检测领域,机器视觉技术的应用还仅仅停留在理论之上,还没有可实际应用的商品化的设备,更不用说结合机器视觉和嵌入式两种技术的便携式检测仪了。
2.2嵌入式技术嵌入式系统一般指非PC系统,有计算机功能但又不称之为计算机的设备或器材。它是以应用为中心,软硬件可裁减的,适应对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。嵌入式系统几乎包括了生活中的所有电器设备,如掌上PDA、移动计算设备、电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、工业自动化仪表与医疗仪器等。嵌入式系统有以下几大优点[56]:(1)嵌入式系统通常是面向特定应用的,它通常都具有低功耗、体积小,集成度高等特点;(2)嵌入式系统和具体应用有机地结合在一起,它的升级换代也是和具体产品同步进行的,因此嵌入式系统产品一旦进入市场,就具有较长的生命周期;(3)由于空间和各种资源相对不足,嵌入式系统的硬件和软件都必须设计,量体裁衣、去除冗余,力争在同样的硅片面积上实现更高的性能,这样才能在具体应用中对处理器的选择更具有竞争力。本研究选取嵌入式系统中的DSP(数字信号处理器)来进行开发,具体型号为TI公司的TMS320。它具有很高的编译效率和执行速度,在信号处理方面具有优势,它的特点如下:(1)程序和数据具有独立的存储空间,有着各自独立的程序总线与数据总线,可以同时对数据和程序进行寻址,大大提高了数据处理能力;(2)由于广泛采用了流水线操作,减少了指令的执行时间,可以同时运行8条指令;(3)与一般计算机不同,乘法(除法)不由加法和移位实现,它具有硬件乘法器,乘法运算可以在一个指令周期内完成;(4)指令周期降到了1.67 ns。随着工作频率进一步提高,指令周期将进一步缩短;(5)拥有自己独特的专门为数字信号处理而设计的指令系统;(6)相比传统的处理芯片,它还具有体积小、功耗小、使用方便、实时处理迅速、处理数据量大、处理精度高、性能价格比高等许多优点。3轮胎检测系统构成
3.1研究目标机器视觉用于产品表面缺陷检测需要面对以下主要问题:(1)数据处理量非常庞大;(2)如何快读匹配图像;(3)如何快速实现缺陷分割并剔除伪缺陷;(4)如何选取缺陷特征,用以实现缺陷识别。以具体产品为例,相对其他轮胎产品,航空轮胎对质量检测的要求较为严格,只要航空轮胎的检测技术到位,其他轮胎产品也基本可以检测。以航空轮胎的缺陷检测为例,根据GB/T 9747-2008《航空轮胎试验方法》、GB/T 13652-2004 《航空轮胎表面质量》和GB 15323-1994 《航空轮胎内胎》等标准的要求,研究表面缺陷在线检测的图像处理方案;开发一套基于机器视觉的产品表面缺陷的在线检测设备,同时根据GB/T 13653-2004 《航空轮胎X射线检测方法》所述,配合X射线发射仪,利用一对一的服务器/客户机构架的机器视觉对标准中所描述的航空轮胎的一系列缺陷,如断层、气泡和裂口等进行高精度、高实时性、高连续性以及非接触式的在线缺陷检测。具体技术指标:(1)能检测出最小直径0.3 mm的轮胎内部缺陷(即横向纵向最小均为0.3 mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率要求大于90%;(2)对缺陷部位进行定量和定位分析:读出缺陷的尺寸(误差0.5 mm),测出缺陷距离轮胎表面的深度,决定缺陷在轮胎内部的位置;(3)在线检测设备的检测检测速度与X射线管旋转速度同步,X射线管旋转一周即完成一个轮胎一个圆周的缺陷检测。
3.2研究内容和技术路线
3.2.1确定机器视觉检测系统的基本框架在数据量大时,采用一个处理器搭配一台摄像机的一对一方式。在产品表面检测中,由于航空轮胎的圆周面比较大,数据量也就比较大,通常采用的机器视觉单摄像机方式,很难满足圆周面检测分辨率高、数据量大的要求,而多台摄像机能满足分辨率和数据量的要求,却又相应带来实时性差的问题。若采用多台摄像机的方式,就需要配备多套成像系统,一套成像系统造价在10万元左右,基于成本和计算数据量的考虑,本研究选用一对一方式,利用分时运动克服单台摄像机采集数据量不足的缺点。具体来说,就是在经典的服务器/客户端模式架构的基础上设计一种基于机器视觉的系统结构以实现轮胎圆周面产品表面缺陷的在线检测,该结构主要由四部分组成:服务器(嵌入式系统)、客户端(图像处理子系统)、信号模块(PLC)、输出单元。系统框架如图1所示。每隔一定的时间(系统初步设定为5 s),服务器通过PLC控制步进电机驱动轮胎做圆周转动,每转过一个固定角度(系统定为120°),服务器就调动客户端完成此区域内相对独立的视觉检测任务,一次间隔只检测轮胎的三分之一(120/360),经过3个时间间隔,客户端即完成了整个轮胎360°的全面检测,然后利用拼接原理把各部分拼接起来,统一到一个坐标系下。拼接测量的关键是利用重叠区计算出各次测量时基准的不同,然后消除不同,统一在一个坐标系下。拼接测量的方法可以直接计算出被测轮胎的全面信息。为了保证服务器和客户端之间图像检测数据可靠、实时的交互,本研究采用千兆以太网的方式传输数据。作为整个检测系统的管理控制单元和人机交互接口,服务器不仅要完成检测任务的调度,还要可以设定检测参数,接收和实时显示客户端上传的图像数据和处理结果(缺陷等),并将信息存入数据库中。此外,服务器还接收PLC传来的位置检测信号,用于与客户端的同步,并且根据检测结果中的位置信号,对执行机构发出动作信号,标记并剔除有缺陷的产品。在客户端处理核心中安装有图像采集卡,接收服务器设置的参数和任务调度,控制采集卡和摄像机完成图像实时采集,利用图像处理算法处理和分析图像数据,将最终得到的缺陷位置和分类信息上传给服务器,保存缺陷图像以备查。
3.2.2设计编写表面缺陷检测的图像处理方案在表面缺陷检测中,根据图像数据的特点,本研究提出以下图像处理过程:缺陷分割、特征提取及缺陷分类。首先是缺陷分割:在表面缺陷检测的时候,利用图像处理算法,处理采集到的产品表面图像,将缺陷从复杂的背景图像中分离出来。接着是特征提取:提取缺陷后,对缺陷的各种标识性属性进行提取,主要是几何特征和灰度统计特征,以保证后续的缺陷分类和识别。几何特征指的是轮廓特征,比如长度、形状、面积、重心等。灰度统计特征指的是分布位置、统计值、均方差等等。还有缺陷分类:本研究采用改进的BP算法[7]对网络进行训练,构建神经网络分类器来实现轮胎缺陷分类,为了提高检测系统对伪缺陷的适应性,本研究将部分伪缺陷也作为网络输出并对其进行训练。由于图像处理中需要运用大量的计算机内存处理算法,为避免编程中出现内存泄露进而造成计算机内存资源流失的现象,决定采用对内存进行托管的C#语言进行编程。
3.2.3服务器和客户机系统之间的同步服务器/客户端模式架构的机器视觉系统具有独立性和并行性的特点,它不得不面临的一个重要问题是如何解决服务器和图像处理子系统之间的同步问题,包括摄像机同步采集、数据同步处理和轮胎运动同步控制等。本研究利用摄像机本身的外同步特性,采用对摄像机提供统一的线扫描触发信号保证摄像机采集同步。机器视觉系统基本组成模块见图2。
4结论实际测量结果证明,应用视觉检测方法可以较好地解决传统测量方法中时间长、工作量大、测量效率低的问题。该方法能够充分利用现代计算机技术的优势,设备简单、易用,克服了传统测量仪器的许多误差来源,具有快速、准确、非接触测量的优点。在实验室中初步完成了实验系统的核心部分(如图3所示),与传统的测量方法相比,原先需要15 min的测量时间,现在只需要15~30 s就可完成,操作也更加简单便捷。该系统可检测出最小直径0.3 mm的轮胎内部缺陷(即横向纵向最小均为0.3 mm)并能对缺陷进行分类识别,主要包括结构类、气泡类和夹杂物类,对缺陷的检出率为96%。
参考文献:
[1]彭向前.产品表面缺陷在线检测方法研究及系统实现[D].武汉:华中科技大学,2008.
[2]ZHANG Z.Determining the Epipolar geometry and its uncertainty[J].A Review Int Journal on Computer Vision,1998,27(2):161-195.
[3]章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.
[4]朱方文.基于LAP方法的机器人灵巧手控制[D].上海:上海大学,2006.
[5]张嘉琪.基于嵌入式系统图像处理平台的万寿菊水分状态检测系统的研究[D].重庆:西南大学,2009.
计算机视觉行业研究范文6
关键词:图像处理 OpenCV C C++
中图分类号:TP31 文献标识码:A 文章编号:1672-3791(2016)10(a)-0007-02
图像识别技术已经应用到生活中的许多方面。文字识别系统,直接把图片上的文字扫描成文本文档格式。人脸识别技术已经用到了智能手机之中,现在的手机解锁可以直接使用人脸识别。指文图像识别的应用更为广泛,如办理身份证、入学考试、驾照等用来确认身份。百度、Google、苹果等公司研究的无人驾驶汽车,将该技术用于对障碍物、路标、行人及其他车辆的判断。道路交通监控系统中,系统自动检索违规车辆,并对车辆的车牌等信息进行识别。通过车牌提取、图像预处理、特征提取、车牌字符识别等技术,识别车辆牌号,目前,字母和数字的识别率可达96%,汉字的识别率可达95% [1-2]。所有的这些都用到了图像识别功能,要编写图像识别程序使用OpenCV是一个不错的选择。
1 OpenCV简介
OpenCV是Intel公司于1999年推出的一种面向图像处理的开源计算机视觉库,其中,OpenCV是Open Source Computer Vision Library的缩写,如今由Willow Garage提供支持,其中包括了3个版本OpenCV1、OpenCV2、OpenCV3,除了OpenCV1现在很少使用外,其他两个版本已经有了很多改进的版本。OpenCV有开源的函数库,可以满足不同领域的图像处理需求,使用时以函数调用的形式提供给用户,也可以对其代码进行改进,便于用户实验教学或程序开发使用。
2 OpenCV的特点
(1)开源。OpenCV是一个开源的图像处理函数库,无论是商业应用,还是做科学研究,完全是免费的,与Linux类似它的源代码也是公开的,这样程序的安全性就得到保障,OpenCV的函数库是用C语言和C++语言进行编写的,源代码可读性比较高,发现其中不足之可以自行进行修改,避免编译后的可执行文件出现漏洞。
(2)跨平台。OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉库,可以运行在Windows、Linux、Mac OS和嵌入式等操作系统上[3]。
(3)应用领域广。OpenCV图像处理可以使用到多个领域当中,包括生物医学、工业、军事安防、机器视觉、航空航天等。目前已知OpenCV编程系统在航空航天定位、卫星地图绘制、工厂大规模生产视觉检测等方面得到了广泛的应用,同时对于无人飞行器的视觉捕捉技术也有极大的帮助[4]。
(4)支持多种语言进行开发。OpenCV中包括了多种编程语言的接口,其中支持的编程语言包括C、C++、C#、Java、Python等。
3 OpenCV与图像处理应用软件
在计算机学习中也会学到一些其他的图像处理软件,如Photo Shop、Windows画图工具等在计算机中使用的图像处理工具。在手机中有一个比较流行的软件,在拍好照片后可以对个人照片进行智能美化,这些软件都是应用软件缺少编程需要的接口,这些软件处理图像后只是给出结果,无法取到程序处理所需要的中间参数,只能局限于最后的结果展示,如果只是单纯的图像制作, Photo Shop类的图像处理工具已经足够了。但是对于图像识别、机器视觉等,需要对图像内容做出判断,用类似于Photo Shop这样的图像处理软件就无法完成了,因为无法集成到所编写的程序当中。OpenCV是一个图像处理函数库,其中包涵了对于计算机操作系统和计算机语言编译平台支持的API接口以及源码库,可以在编写的程序中去处理图像,不但可以得到图像处理后的结果,还可以对图像中间的处理过程进行控制,可以对图像中的内容用自己编写的程序代码进行判定,实现识别操作。
4 学习OpenCV的基础
C和C++语言在工科类专业中一般设置必修课程,C语言常作为一门基础的编程语言来教,有的学生觉得C比较容易,有的学生感觉比较难,这个取决于每个人对计算机语言的理解能力与对计算机语言的兴趣,C和C++的区别在于C++增加了类,支持面向对象编程。新版OpenCV函数库是基于C++的,打开源代码的文件夹可以看到许多以.cpp结尾的C++代码文件,所以对于C和C++的掌握情况直接关系到对OpenCV的学习。
5 OpenCV的运行环境
在学习每种计算机语言之前都要对每种计算机语言的IDE(Integrated Development Environment,集成开发环境)进行安装和配置,集成开发环境不只是用来编辑程序代码,还包括了对代码的编译、调试与运行等。如Java语言,在Windows操作系统中Java语言最简单的编辑环境是记事本,对于Java的编译与运行需要用到命令窗调用所安装JDK(Java Development Kit,Java开发包)中的编译程序与运行环境,如果是集成的IDE,如Eclipse、MyEclipse等,点击IDE上的运行或是调试按钮,就可以在IDE中的结果输出窗口上直接查看运行结果。OpenCV是用C和C++语言所编写的图像处理函数库,它没有自己独立的IDE,所以它需要借助其他编程语言的IDE进行编写和调用,如Microsoft Visual Studio、QT Creator等。
配置开发环境是学习OpenCV中重要的一步,但是这个过程相对于初学者来说有些复杂。首先,要从网上下载并安装计算机语言的开发环境,如微软的Visual Studio、QT集成开发环境等。其次,下载并安装OpenCV的安装包,安装OpenCV是一个解压的过程。下一步,就是对开发环境的配置,其中要对系统变量、包含目录、附加依赖项进行配置。然后进行调试运行。在对开发环境配置时,为保证OpenCV库与本地开发环境兼容性更好,最好使用CMaker(Cross Platform Make)在本地环境中对OpenCV源代码重新编译。
6 OpenCV中的Hello World
在学习C或是java语言时,常常会有一个重要的标志就是‘Hello World!’,标志着系统配置完成并且整个IDE环境运行正常,编译系统成功的编译了所写的代码,并且在操作系统中执行成功。OpenCV中这个标志有所不同,它的‘Hello World!’是在IDE中写好代码后,调用OpenCV中的函数打开一幅代码中指定的图片并显示到新建的窗口中,标志着IDE中的参数是正确的,这是进行图像操作的重要一步。
7 OpenCV图像像素操作
对于数值的计算是第一步一般输出一个结果,在学任何一门计算机语言时会有一个很好的例子“计算器”,那图像如何去表示?其实图像是多个结果的一个集合,就像在C语言中打出星号所组成的菱形,每一个星号可以比喻成一个图像中的像素点。对于图像处理过程中常常见到的有3种:第一种,RGB图像,彩色的图像,每个像素点由3个数值表示。第二种,灰度图像,像以前的黑白电视机,每个像素点由一个数值就可以表示。第三种,二值图像,每个像素点由一个数值表示。在OpenCV中有多种方法可以对图像进行操作,其中比较方便的就是利用cv::Mat类,对图像进行打开、显示、修改和保存,这也是进行图像操作的重要一步。
8 OpenCV的文档
大家在OpenCV官网提供的文档中可以得到更多帮助。在OpenCV的文档中包括了对组件结构的介绍,了解OpenCV的组件结构对学习OpenCV是十分有利的,该介绍包括了一系列的动态或静态库,如矩阵数组的定义、图像处理模块包含的内容、视频分析所需要的算法、基本的多视觉算法、外部特征的检测类、物体的检测类、UI类的使用、图像算法的硬件加速等,在编写代码时可以查找其类中对象所包含成员和方法。一些OpenCV图书所带的光盘中或互联网上网友提供的图像处理代码,由于编程使用的操作系统或编译环境不同,有些代码会包含未知的头文件或者缺少头文件,代码本身并没有错误,但总是编译出错,了解了这些知识后在编程时,有利于定位在程序中所引用的文件所属的位置,从而有效地处理文件引用出现的问题。
无论对什么样的物体进行识别,图像识别过程基本是不变的,包括:图像预处理、图像分割,特征提取、判断匹配、输出结果。图像预处理中会用到图像的灰度化、图像的二值化、去除图像的噪声等算法。特征提取中会用到图像变换、图像边缘检测等算法。判断匹配中用到直方图、投影等算法。图像分割有3种:基于阈值的分割、基于区域分割、基于边缘的分割[5]。在OpenCV的文档中都详细提供了基本算法类的定义与方法,通过OpenCV的代码库中的基本算法类或几个基本算法类的组合可以实现以上所列算法的所有功能。
9 结语
据统计,一个人获取的信息大约有75%来自视觉 [6]。在工业4.0的时代里机器也需要有自己的视觉系统,基于图像处理的机器视觉在人工智能领域会得到更广泛的应用,如:无人驾驶汽车、智能机器人、智能安防系统等。OpenCV是一个进入这些行业的重要工具之一,图像处理的学习过程是一个循序渐进的过程,希望学习者在OpenCV的基础上提高对于图像处理的认识及对图像处理的技术水平。
参考文献
[1] 姚楠,耿奇.基于MATLAB GUI 的车牌自动识别系统设计[J].软件,2016,37(3):44-46.
[2] 李珊珊,刘纯.基于FPGA 车牌识别系统的设计与实现[J].软件,2012,33(3):72-74.
[3] (加)Robert Laganière,著.OpenCV计算机视觉编程攻略[M].2版.相银初,译.北京:人民邮电出版社,2015.
[4] 陈雪娇.基于OpenCV的计算机视觉技术研究[J].电脑知识与技术,2015(30):137-138,141.