计算机视觉基础及应用范例6篇

前言:中文期刊网精心挑选了计算机视觉基础及应用范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

计算机视觉基础及应用

计算机视觉基础及应用范文1

关键词:计算机视觉;课程创新;教学改革

中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)20-0118-02

计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。

一、计算机视觉课程的特点

近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。

二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别

1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。

2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。

三、高校计算机视觉课程教学的创新策略

1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授Richard Szeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。

2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。

3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。

四、结语

在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。

参考文献:

[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).

[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).

[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).

[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).

[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).

[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).

计算机视觉基础及应用范文2

1.1自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。

2.1计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。MertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3计算机视觉技术在检测食品中微生物含量的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3检测性能受环境制约

计算机视觉基础及应用范文3

关键词:计算机图形学;计算机视觉;可视化技术

中图分类号:TM862 文献标识码:A 文章编号:1671-2064(2017)01-0054-02

计算机图形学、计算机视觉以及可视化技术三者均是计算机领域重要组成部分,要做好计算机知识,就要先学好计算机图形学,但计算机图形学学习相对枯燥,尤其是算法教学难以理解,为解决这一问题,计算机视觉与可视化技术被应用到计算机图形学中。可见,三者之间存在一定的联系,因此,有必要对计算机图形学、计算机视觉以及可视化技术展开研究。

1 计算机图形学概述

1.1 计算机图形学目的

所谓的计算机图形学实际上就是怎样利用计算机表示图形,并利用计算机完成图形计算与处理,而这一过程的实现需要得到相关算法的支持。学习计算机图形学的目的是利用计算机技术为人们呈现既带有美感又不缺真实的图形(如下图1所示),为实现这一目标,就需要按照图形的要求创设合适的场景,并在一些光照模型的作用下,做好光照效果设计,在这一过程中需要计算机图形学能够与其他计算机技术相配合。经过计算机图形学出来的图像,多会以数字图像的方式展示出来,总的来说,计算机图形学与图像处理之间存在着一定的联系[1]。计算机图形学的涉及范围相对宽泛,不仅有图形硬件设计,还包括动画制作,虚拟现实等多个部分。此外,计算机图形学在动画制作中的应用频率也很高,如45分钟一集的动画影片中,85%的画面都需要用算机图形学来完成,由此可见,计算机图形学的应用频率极高,并在动画制作中发挥着不可替代的作用。因此,应重视计算机图形学的应用。

1.2 计算机图形学应用

随着计算机图形学的发展,它被应用到各个领域中,并发挥着重要作用。首先,在计算机辅助设计与制造中的应用,这是计算机图形学应用最多的领域,在计算机图形学被应用以后,不仅可以设计出更精准的图形,还能做好人机交互设计,强化修改能力。计算机图形学还被应用到三维形体重建中,利用该技术可以将原理的二维信息转化为三维信息,如在某次工程图纸设计中就应用了计算机图形学,经过一系列的处理以后,三维形体逐渐形成,最终实现了重建。其次,在医学领域中的应用。计算机图形学在医学领域中的应用多以计算可视化的形式展示出来,如在脑部手术中,医生为看清患处真实情况,经常需要利用在可视化技术的作用下将复杂的数据转化为图像,这时就体现了计算机图形学在其中的应用[2]。再者,在计算机动画中的应用,人们看到的动画影片就是计算机图形学作用的结果,以动画人物的行走为例,为保证动画人物的行走与自然人不存在过大差异,就需要应用大量的计算机技术,并在计算机图形学的作用下完成设计。最后,在计算机艺术中的应用。计算机图形学在计算机艺术中也有广泛应用,它不仅可以用于艺术制作,很多场景都是通过计算机图形学来完成的,现阶段,一些人正在利用计算机图形学创设人体模拟系统,其目的是让已故人士再次出现在荧屏上,这一目标的实现就需要得到计算机图形学的支持。

2 计算机视觉技术

2.1 计算机视觉技术含义

所谓的计算机视觉技术,实际上就是用计算机取代人眼做识别、跟踪以及测量等,同时也兼顾图形处理,其目的是让图像在计算机被处理以后更适于识别。对于计算机视觉技术来说,意在实现人工智能,主要是从图像与多维数据等方面实现人工智能系统设计[3]。计算机视觉是一种在相关理论与模型基础上发展起来的视觉系统,其主要构成部分有以下几种:

(1)程序控制,这一点主要体现在机器人设计上;(2)事件检测,多体现在图像监测上;(3)信息组织,主要体现在图像数据库等方面。计算机视觉三个阶段如图2所示,通过观察图1可以发现,计算机视觉存在于图像处理始终,从早期处理直到后期结束都存在,最终实现了3D描述,可见,计算机视觉具有十分重要的作用[4]。

2.2 计算机视觉技术的应用

现阶段,现代社会已经进入信息化时代,计算机技术也被应用到各个领域,并发挥着重要作用。计算机视觉的应用促使计算机实现了智能化,在该技术的支持下,计算机可以像人一样透过视觉看待世界万物,且具有良好的适应能力,但这一目标的实现还需要很长时间,需要一系列的努力才能实现。现阶段,计算机视觉应用最多的就是车辆视觉导航,然而,这种导航还没有实现完全自主导航,这也是需要进一步研究的地方。计算机视觉技术的适应性较好,特别适合在工业领域应用,即便是存在电子在干扰或温度变化较大的地方都能很好的运行,其整体效果也不会受到影响,再者,计算机视觉技术的嵌入性较好,成本相对较低,尤其适合在PC方案中使用,同时,具有一定的非接触能力,能够获取大量信息,且不受距离限制,总的来说,计算机视觉技术总体效果较好,适合利用在各种工业环境中应用,因此,应重视计算机视觉技术的应用[5]。同时计算机视觉还被应用到移动机器人设计中,主要是利用小波模板展示人体形态,然后做图像扫描,这样就可以顺利完成小波变换,进而了解到人的存在。同样,将计算机视觉应用到机器人设计上,可以自动检测出正在行动的人或车辆,而无法检测到静止的人,之所以会出现这样情况,主要是由于其中采用率步态分析法。

3 可视化技术

3.1 可视化技术含义

可视化技术是一种综合了计算机图形学与图像处理于一体的技术,它可以将复杂的数据转化为图像并在屏幕上展示出来。在可视化技术中,融合了以上两种技术的特点,并在多个领域都有应用,随着可视化技术的应用,不仅有效实现了数据表示,还强化了数据处理能力,更对数据决策分析有一定作用[6]。现阶段,虚拟现实技术已经成为可视化技术主要发展方向。

3.2 可视化技术的应用

首先,在计算机图形学教学中的应用,计算机图形学相对枯燥,相关知识也很抽象,不便于学生理解,在计算机图形学中最重要的部分是曲线曲面,而这些曲线曲面多是与数学模型有关,具有一定的抽象性,学生理解难度较大,以往教师只能通过一系列的公式演算帮助学生理解,尽管这样依然难以让学生掌握曲线变化情况,学生依旧无法正确理解。为减少这种情况的发生,可视化技术被应用到计算机图形学教学中,教师将抽象的知识用动画的形式展示出来,学生只要观看动画,拖动一定的控制点就可以了解到曲线变化情况,这样一来不仅增加了教学趣味性,学生也可以随意变动曲线,让复杂的知识变得简单,深化学生对计算机图形学知识的深度理解,同时,利用可视化技术在一定条件下,还可以完成代码编译,如在Actoin ScriPt中做编译,这样也可以增强学生的理解能力[7]。

其次,在医学领域中的应用。医学领域对于可视化技术的应用主要体现在放射治疗与矫正手术上。通过可视化技术可以屏幕上看到手术整个过程,并将原来细节部位放大,手术医生观察的更加细致,手术成功几率也会大幅度提升,患者生命也能得到保证(如图3所示)。如在对某名患者进行身体检查的过程中需要应用到可视化技术,由于通过检查会获得大量数据,而这些数据又相对复杂,但在可视化技术下就可以通过图表、曲线图或立柱图的方式展示出来,经过可视化技术的作用,了解到患者的血糖为5.6mmol/L,医生可以根这一数据做出诊断,而不必再分析这些数据。据不完全统计,80%的医疗检查工作都是需要利用可视化技术。

地质勘探是我国最重要的工作之一,由于多数矿藏都深埋地下,即便使用探测仪受多种因素影响也无法了解到实际矿藏情况,这就需要应用到可视化技术,在可视化技术的作用下,相关工作人员可以了解到地下有无矿藏,如果存在矿藏,相关工作人员也可以了解到矿藏所在位置与实际储备量,进而为矿藏开采奠定基础。如在地质勘探中,相关工作人员利用可视化技术做地形图整理,然后从中提取地形数据,再用CATIA做导入,这样就可以完成地形模型创建,这样就完成了三维地质模型创建工作,同时在相关工作台的影响下,还可以完成地形数据导入,进而生成一定的地形云点,如果其中存在错误,可视化技术也可以将其中的错误内容删除,这些都是可视化技术所带来的好处[8]。由此可见,可视化技术已经成为地质勘探中不缺少的技术。

最后,在气象预报中的应用(如图4所示)。利用可视化技术能够将数据转化为图像,通过观察图像就可以了解到云层变化情况,同时也能了解到实际风力大小与风走向等,气象预报人员就可以根据图像做出精准分析,需要了解气象变化的人也能了解到现实情况,如果气象条件恶劣,相关工作人员也可以及时做出工作调整,减少危险事件的发生。据不完全统计,可视化技术在气象预报中的应用频率高达100%,由此挽回的经济损失高达13.2亿元,可见,可视化技术在气象预报中的应用十分有必要,因此,应重视可视化技术在气象预报中的应用。

4 结语

通过以上研究得知,计算机图形学、计算机视觉以及可视化技术三者各具特色,三者间也存在一定的关系,尤其是可视化技术综合了前两者的特点,并融合了其他技术,在很多领域中都有应用。可视化技术是现阶段应用最多的一种技术,在计算机图形学教学中也有应用,并发挥着不可替代的作用。本文分析了计算机图形学、计算机视觉以及可视化技术的含义与应用,希望能为相关人士带来有效参考,正确利用这些技术。

参考文献:

[1]陈敏雅,金旭东.浅谈计算机图形学与图形图像处理技术[J].长春理工大学学报,2011(01):138-139+146.

[2]柳海兰.浅谈计算机图形学的发展及应用[J].电脑知识与技术,2010(33):9551-9552.

[3]滑瑞朋.计算机图形学的应用及研究[J].山西科技,2012(05):37-38+45.

[4]刘涛,仲晓春,孙成明,郭文善,陈瑛瑛,孙娟.基于计算机视觉的水稻叶部病害识别研究[J].中国农业科学,2014(04):664-674.

[5]关然,徐向民,罗雅愉,苗捷,裘索.基于计算机视觉的手势检测识别技术[J].计算机应用与软件,2013(01):155-159+164.

[6]许志杰,王晶,刘颖,范九伦.计算机视觉核心技术现状与展望[J].西安邮电学院学报,2012(06):1-8.

计算机视觉基础及应用范文4

以下为报告详细内容:

计算机视觉行业规模将进一步扩大

iiMedia Research(艾媒咨询)数据显示,2016年中国人工智能产业规模已突破100亿元,以43.3%的增长率高速增长,预计2017年产业规模将以51.2%的增长率达到152.1亿元,并于2019年增长至344.3亿元。

艾媒咨询分析师认为,中国人工智能产业起步相对较晚,随着科技、制造等业界巨头公司的布局深入,人工智能产业的规模将进一步扩大。计算机视觉作为人工智能的子领域,其发展和应用也很大程度受到人工智能核心技术的影响。未来,作为人工智能子领域的计算机视觉产业规模也会相应扩大。

计算机视觉用户市场有待挖掘

iiMedia Research(艾媒咨询)数据显示,2017上半年网民对于计算机视觉行业整体了解程度还不深,智能识别贴图应用以63.8%的了解比例名列各领域之首,其余领域网民了解比例均未超过五成。艾媒咨询分析师认为,计算机视觉行业作为新兴行业,其概念还未深入大众群体,大众对于其作用了解程度不深,未来计算机视觉行业用户市场开发潜力较大。

计算机视觉整体渗透率低

iiMedia Research(艾媒咨询)数据显示,2017上半年网民中,有四成用户使用过图搜索功能。还有六成用户仍未使用过图搜索功能。图搜在技术计算机视觉领域中已经发展比较成熟,然而在网民种的渗透率仍不高。艾媒咨询分析师认为,计算机视觉作为新兴技术,其投入实际应用时间较短,且技术依托的平台种类和数量都较少,用户市场培养还需时间。

图搜功能获用户认可

iiMedia Research(艾媒咨询)数据显示,在对2017上半年使用过“图搜”功能的网民准确率感知调研中,将近七成的用户对“图搜”功能的准确率给予肯定。“图搜”技术已经较为成熟,正在逐渐将便利带到用户生活中,未来随着“图搜”功能进一步在各应用中扩张,其区别于传统搜索的优势将会更明显被用户感知。

2017上半年网民图搜索场景分布

iiMedia Research(艾媒咨询)数据显示,2017上半年图搜网民中,69.6%的用户在搜索引擎中使用图搜功能,网购场景下使用图搜功能的用户占比53.5%。艾媒咨询分析师认为,搜索引擎直接应用了图搜功能,发展较早,故用户基础较扎实,其余领域中,网购图搜变现能力最强,是厂商优先合作的重点领域。

边看边买用户市场潜力较大

iiMedia Research(艾媒咨询)数据显示,2017上半年边看边买网民渗透率仅有11.9%,而在未尝试过人群中,有意愿进行尝试的人群超过六成。艾媒咨询分析师认为,明星经济拉动下,同款销售具有宣传效应加成。边看边买技术一方面可以加强视频门户的变现能力,一方面作为流量入口能够为电商平台导入流量,且对于消费者来说,智能匹配同款可以减少其搜索筛选的时间成本,未来市场有较大发展潜力。

实名制机器认证部分取代人工 未来规模看涨

iiMedia Research(艾媒咨询)数据显示,2017上半年机器实名制认证网民渗透率为43.6%,有超一半用户未使用过机器实名制认证功能。随着计算机视觉技术发展,在广州、上海等城市已经开始使用机器实名制认证部分或全部代替人工认证,以减少人工成本,释放劳动密集产业用工压力。艾媒咨询分析师认为,随着时间检验和技术进一步成熟,机器实名制会进一步向中小城市渗透,未来网点铺设规模有望进一步扩大。

机器认证效率获用户认可

iiMedia Research(艾媒咨询)数据显示,2017上半年使用过机器实名制认证的网民中,82.6%的用户表示机器实名制认证加快了验证流程。艾媒咨询分析师认为,计算机视觉精准快速无主观性的特点和实名制认证流程要求相匹配,在技术比较成熟的情况下,能够提高验证效率,缓解铁路站点因人工验证慢导致的拥挤、乘客等候过久等现象。此技术在中国各铁路站点会慢慢渗透,应用规模有望扩大。

个人信息泄露成为用户刷脸支付最大顾虑

iiMedia Research(艾媒咨询)数据显示,2017上半年了解刷脸支付的网民中,59.0%认为个人信息泄露是刷脸支付最大隐患。识别不准确和使用渠道不畅通分别以57.6%和41.9%位列第二和第三名。

艾媒咨询分析师认为,作为个人信息比较敏感的金融支付领域,用户对于信息安全重视度相较其他领域更高,而2017年初315晚会对刷脸支付泄露个人信息隐患的点名,无疑为刷脸支付规模扩张设置障碍,加强用户信息保障能力,获取用户对于技术安全的信任是刷脸支付未来重点发力方向。另外,由于计算机视觉概念未在大众群体中普及,其规模化需依托场景搭建,故使用渠道畅通也可以助力加快行业规模化进程。

精确性+场景化:C端市场打开方式

iiMedia Research(艾媒咨询)数据显示,2017上半年中国网民对于计算机视觉行业的愿景分布中,准确率更高以64.3%的关注度成为用户最期待改进方向,使用更加方便和保障信息安全也是用户重点关注问题。艾媒咨询分析师认为,行业发展初期,用户对概念理解程度不高,易产生“不易”使用的印象而不愿进行尝试,未来商家可尝试提供装备完全的硬件设备和解决方案,并尝试丰富使用场景,让计算机视觉更易被广泛网民接受。

计算机视觉在生活化场景中的使用最被C端用户期待

计算机视觉基础及应用范文5

关键词: 计算机 视觉注意机制 计算机视觉注意模型

1.引言

随着信息技术的不断发展,数据处理量剧增,以及用户不断扩大的个性化需求,对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息,即物体选择与识别,已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展,将注意机制引入信息处理领域来解决物体识别问题,已经不再是纸上谈兵。

人类视觉系统进行视觉信息处理时,总是迅速选择少数几个显著对象进行优先处理,忽略或舍弃其他的非显著对象。进入人类视野的海量信息,通过注意选择机制进行筛选,就能使我们有选择地分配有限的视觉处理资源,保证视觉信息处理的效率,这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机系统,就成为一大任务。我们研究的主要方向是使计算机处理对象时,能够具备与人类相似的视觉选择注意能力。

2.视觉注意机制

研究视觉注意机制是个多学科交叉的问题,目前多个领域的研究人员都取得了研究成果,并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上(自下而上)的图像数据驱动的,也可以是安自顶向下(自上而下)的任务驱动的。其中,自下而上的研究主要来自图像中物体数据本身的显著性。例如,在视觉搜索实验中,显著的物体会自动跳出,如图1中的圆点通过特征对比,以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务,以及场景的快速认证结果,即我们可以“故意”去注意任何一个“不起眼”的物体,如我们可以在图书馆浩如烟海的藏书中,找到自己感兴趣的那本书。

研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点,注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动,视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动,而显式注意的中央凹随每次注意点的转移而运动。

对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制,建立视觉注意的计算模型。通过“注意点”的选择与转移,实现对复杂场景中任务的搜索与定位,最终来实现实时信息的响应处理。在计算机视觉的研究中,显式注意应用较多。

3.计算机视觉注意模型

从人的角度来看,人类视觉系统通过视觉,选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看,场景中的某些内容比其他内容更能引起观察者的注意,我们称之为视觉显著性,两者其实是从不同的角度对视觉选择注意过程的描述。

我们把引起注意的场景内容定义为注意焦点FOA(Focus of Attention)。Treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段,各种视觉特征在前注意阶段被以并行的方式提取出来,并在注意阶段以串行方式整合为视觉客体,即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上,Koch[2]进行了深入的研究,他提出注意焦点FOA的变化具有四个特征,即单焦点性:同一时刻只能存在一个FOA;缩放性:FOA的空间范围可以扩大或者缩小;焦点转移性:FOA能够由一个位置向另一个位置转移;邻近优先性:FOA转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点,即FOA转移时抑制返回最近被选择过的注视区域。在此基础上,视觉注意的研究人员提出了多种视觉注意模型。

4.视觉注意模型的研究现状

人类的视觉注意过程包括两个方面:一方面是对自下而上的初级视觉特征的加工,另一方面是由自上而下的任务的指导,两方面结合,共同完成了视觉的选择性注意。与此对应,当前的计算机视觉注意研究也分为这两个方面。

4.1自下向上的数据驱动注意模型研究及分析

在没有先验任务指导的情况下,视觉注意的目标选择主要是由场景中自下而上的数据驱动的,目标是否被关注,由它的显著性决定。现在,自下而上的注意研究主要基于Treisman的特征整合理论和Koch&Ullman的显著性模型,Itti、satoh等人均在此基础上提出了自己的研究模型,并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究,形成各个特征对应的显著图。另外,一些研究者采用基于局部或全局对比度的方法,来得到图中每个像素的显著性,进而得到显著图。

现有的自下而上的视觉注意计算模型中,Itti的显著图模型(简称Itti模型)最具代表性。该模型主要包含3个模块:特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取,将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制,选出唯一的注意目标,其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点,如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。

在动态场景之中,由于Itti模型很难满足实时性的要求,科研工作者们正在努力研究动态场景的特性,并建立相应的动态模型。如Wolfe[1]指出,影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状,等等,其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型,该模型假设当场景中存在全局运动时,视觉注意对象将极少做运动。然而,许多真实的场景并不能满足这个假设,限制了模型的适用范围。Hang等人提出了一种运动图的计算方法,并把运动图作为特征之一,与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响,但是均存在一定的局限性,对于复杂的运动场景的注意焦点计算很难取得良好的效果。

我国研究者也在Itti注意模型的基础上研究了适合动态场景中的注意模型,形成了一些理论成果。如曾志宏[2]等人提出注意焦点计算模型,郑雅羽[3]等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。

4.2自上而下的任务驱动的注意模型研究及分析

自上而下的注意即任务驱动的注意,通过目标和任务的抽象知识,在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面,Laar(1997)提出了一个用于隐式视觉注意的模型,该模型通过任务学习,将注意集中于重要的特征。Rabak[4]提出了基于注意机制的视觉感知识别模型,该模型在定义目标显著性时,通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中,并在数字识别和人脸识别的实验中取得了很好的效果。Itti提出以调节心理阈值函数的形式来控制视觉感知。

目前对自下而上的数据驱动方面的研究较多,而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关,同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作,其过程非常复杂。

5.计算机视觉注意模型研究的趋势

自底向上和自顶向下的加工是两种方向不同的信息处理机制,两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法,才能有效地实现视觉选择注意的目的。

实践证明,把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程,实现主动的视觉选择注意的目的,采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合,实现二者的优势互补是以后计算机视觉注意研究的一个趋势。

参考文献:

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌乐,林坤辉,曲延云,陈嘉威.目标跟踪的视觉注意计算模型[J].计算机工程,2008,(23).

[3]郑雅羽,田翔,陈耀武.基于时空特征融合的视觉注意模型[J].吉林大学学报,2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

计算机视觉基础及应用范文6

关键词关键词:OpenCV;人脸检测;微笑检测;JNI

DOIDOI:10.11907/rjdk.162330

中图分类号:TP319文献标识码:A文章编号文章编号:16727800(2017)001011502

随着人工智能技术的发展,机器学习、计算机视觉等领域也逐渐成为计算机科学中的热点问题,人脸检测便是计算机视觉中的一个分支。OpenCV作为一个开源的视觉库,提供了不少关于人脸检测的模型与处理接口,而大部分接口与算法均采用C/C++语言编写。Java虽有其跨平台的巨大优势,但是这种特性也给Java带来了局限性,在调用动态数据库文件时存在不便。因此,通过JNI工具,可以利用C/C++语言的特性弥补Java的不足[13]。

1相关技术原理

1.1JNI技术分析

JNI(Java Native Interface)提供了若干API 实现Java与其它语言的通信(主要是C/C++)。从Java 1.1开始,JNI标准成为Java平台的一部分,它允许Java和其它语言编写的代码进行交互。然而使用Java与本地已编译的代码交互,通常会丧失平台可移植性[45]。

通常遇到以下几种情况需要使用JNI:①所开发的程序需要用到其它平台属性,但在Java的标准库中不支持此属性;②程序对于运行效率要求较高,因此希望能用较低级的语言(如C/C++)来实现;③Java已经拥有实现需要的程序和库,希望C/C++对其直接进行调用[67]。

1.2JNI技术架构

JNI允许运行在Java虚拟机上的应用程序调用其它语言(如C/C++语言)来编写需要的方法或类库,也能将Java虚拟机嵌入到本地应用程序中。

图1是JNI在本地应用程序与Java应用之间各自扮演的角色图。从图中可以看出,JNI作为Java与C/C++函悼庵间的桥梁,可以实现Java代码与C/C++库函数当中本地代码之间的交互。然而JNI没有改变Java语言的属性,只是让Java语言拥有一种能够对外调用的形式[89]。

1.3OpenCV介绍

OpenCV(Open Source Computer Vision Library)是一个基于BSD许可发行的跨平台计算机视觉库。它轻量而且高效,由C函数与C++类构成,同时提供了Python、Java等语言的接口,可实现图像处理和计算机视觉方面的很多通用算法。OpenCV中对于人脸的检测方法是基于处理成的灰度图像的弱特征检测方法。该方法建立在Haar特征[10]检测方法基础上,可以获得检测人脸的实时处理速度。

OpenCV中也提供了训练分类器[1112]的程序及方法来检测特征。使用者可以将此方法应用于一些项目中的二次开发,比如双目视觉的三维重构、物体识别,协助机器人完成复杂任务,以及在智能监控中的人脸检测、智能交通中的行人检测等。

2开发工具选择

选用的工具是eclipse,Java版本为JDK1.7,C++使用的是VS2010。另外PC端需要具备内置或外置摄像头,PC机配置为Inter Core i5-3230M CPU 2.6GHz。

3实现过程

从图2中编写JNI代码的大致步骤可以看出Java需要将字节码文件通过javah生成头文件,再与C代码共同生成动态链接库,进而与Java中的代码进行交互。

3.4人脸检测实验结果