前言:中文期刊网精心挑选了计算机视觉特点范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉特点范文1
关键词:计算机视觉;课程创新;教学改革
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2016)20-0118-02
计算机视觉课程是人工智能学科的分支学科,对互联网技术的发展有着重要的推进作用。随着时代的飞速变迁,越来越多的学生对这一领域产生了浓厚的兴趣,计算机视觉课程在信息专业中也开始占据重要的地位。如何让学生对这门课程保持长久的兴趣,如何培养学生的专业能力和实践能力,是当前高校应该考虑的问题。经过近几年的教学实践后,很多高校已经逐步确定了通过实际应用培养学生兴趣的教学方法,在满足学生对计算机视觉应用需求的同时,加深了学生对理论知识的理解,这已经成为了当前高校计算机视觉课程教学的重要模式。
一、计算机视觉课程的特点
近年来,随着计算机网络的飞速发展,计算机视觉的应用也越来越广泛,成为了信息相关专业学生的一门必修课。计算机视觉课程涉及众多领域,包括人工智能与模式识别、应用数学等,其覆盖范围广,综合性较强。具体来说,计算机视觉课程有以下几个特点:一是内容广泛,理论抽象。计算机视觉是一门新技术,随着时代的变迁,互联网新技术的更新日新月异,这就使得课程内容的更新过快,内容广泛,教师很难在第一时间向学生输送所有的课程知识。二是计算机视觉课程涉及多个学科领域,并且所涉及的领域知识内容复杂,表达抽象,这对学生的学习来说是一个较大的障碍。三是实践性强。计算机视觉课程的知识内容来源于各种专业不同的领域,操作性极强,学生只有在具有一定的工程项目综合能力后,才能进行计算机视觉应用和操作。
二、计算机视觉与计算机图形学、数字图像处理之间的联系和区别
1.计算机视觉与计算机图形学的联系与区别。计算机视觉一般输入的都是图像或图像序列,其输入资料主要来自usb摄像头或是相机。经过处理后,计算机视觉输出的是对图像序列和图像对应的对真实世界的一种理解,在这一方面,计算机视觉有识别车牌、人脸的作用。而计算机图形学则是一种对虚拟场景的描述。它一般是由多个多边性数组组成,每个多边性有三个顶点,输出的是二维像素数组。在增强现实的应用中,人们不仅需要用计算机视觉来提高对物体识别和姿态获取的效率,还需要用到计算机图形学对虚拟三维物体的叠加方法。
2.计算机视觉与数字图像处理的联系和区别。首先,计算机视觉与数字图像处理之间的联系在于数字图像处理是计算机视觉处理的基础,而计算机视觉的研究成果也可以作为数字处理的素材。其次,计算机视觉与数字图像处理之间的区别在于图形是一种纯数字化、矢量的单位,而图像则不仅包括图形,有时还包括来自现实世界的信号,并且图形的处理不是一种简单的堆积,计算机视觉的处理要从图像中找到一些统计数据和信息,并做进一步的数据分析。
三、高校计算机视觉课程教学的创新策略
1.以工程应用为导向的课程内容。鉴于学习本课程的学生在毕业之后多数会进入相关工程企业或者研究院工作,因此,在对学生进行培养时,高校一方面要考虑到学生的知识接受度,另一方面要设置以工程应用为导向的课程内容,帮助学生更好的进入企业或研究院开展工作。高校在进行计算机视觉课程教学创新时,首先要创新课程教材,摒弃以往枯燥的理论书籍,多选取一些实践性和应用性强的教材。考虑到国内教材的滞后性和学生基础的薄弱性,高校应该选择以下两本书作为学生的专用教材:一本是我国著名教授贾云得编纂的《机器学习》,这部教材深刻体现了时展的教学要求,书中不仅详细讲述了计算机视觉中的一些基本知识,包括计算机视觉的基本概念、算法及其应用,还有一些经典的数字图像处理方法和视觉应用分析,对学生了解基础知识和实践内容有着重要的意义;另外一本是国内外十分推崇的计算机视觉著作,它是美国教授Richard Szeliski教授的作品。该书在2010年出版,获得了众多业界人士的好评。Richard Szeliski教授是华盛顿大学的兼职教授,也是微软研究院交互视觉与多媒体的主任,他对计算机视觉的发展和未来走向十分清楚,也深刻了解产业界和大学需要什么样的计算机视觉课程教材。因此,这本教材面向应用,与当今最新的科技成果紧密相连,综合论述了计算机视觉在各个领域的发展,展示了计算机视觉的最新研究成果和未来的发展趋势。此外,本书中还有详细的国外研究案例和更加深入的应用案例,适合学生开展探究性学习。两本教材都是遵循以工程应用为导向的原则,对学生开放性思维的培养有着重要的意义。
2.面向科技最新成果的课程定位。计算机视觉是一门新技术,科技创新是其发展的原动力,因此,高校在进行课程安排时,应该将当今计算机视觉领域的重要的科技成果作为计算机课程的基本教学内容。要想以科技最新成果定位计算机视觉课程,高校要做到以下两个方面:(1)选取涵盖最新成果的教材。考虑到不同学生的数字图像处理基础不一的问题,学校可以在课程中补充一些有关数字图像处理的基础内容。在选择教材内容时,计算机视觉课程的内容应该包括数字图像处理、视觉学习和模式识别这三大部分。数字图像处理是视觉课程的基础内容,主要向学生介绍数字图像处理和计算机视觉所涉及的一些基础知识,包括图像的分割和检测、图像滤波的处理等。数字图像处理是整个计算机课程学习的重要基础内容,其课时可占总课时的二分之一。其次,视觉部分是近几年来计算机视觉的最新科技成果,内容主要包括摄像机的几何设定和计算机摄影机的序列处理等。作为最前沿的科技领域,视觉部分将会是该课程后期的重点内容,与实践作业紧密结合。而模式识别则更多的是新技术的一种工程应用,学生会更多的涉及到实践操作,更好的培养学生的实践能力。(2)强化学生自学和调研能力。课程调研和实践是信息专业学生强化能力的重要方法之一,高校可以在课程项目中引入新技术的探究,在使课程在具有基础性、研究性的同时,具有一定的前沿性,还能让学生在第一时间了解到最新的科技成果和互联网应用技术。在课程调研和实践中,高校必须要强化学生的自学和调研能力,在调研时给每一个小组安排一位高年级研究生作为指导,每组学生独立完成任务,高年级研究生只做引导和辅助的作用。学生在自我设置调研程序,查找资料,理解和熟悉相关程序的时候,能够更加掌握最新科技成果的内容,同时还提高了学生的自学能力和团队协作能力。
3.工程实践化的教学形式。工程项目综合能力是信息专业的学生必须具备的素质之一,因此在计算机视觉课程的教学过程中,培养学生的工程实践能力是教学目标之一。高校可以采取以下两种方法:(1)选取适当的工程实例。对于信息专业的学生而言,计算机视觉课程各个独立的算法和方法较多,彼此没有过多的联系。这对学生来说过于抽象,不易理解,因此教师不应当仅仅限于知识的传授,还应该选取一些适当的工程实例,将知识体系串联在一起,加深学会对教学内容的理解,从而达到良好的教学效果。例如,在教学过程中,教师可以着重介绍手机制造的例子。手机是现在学生十分熟悉的产品,用手机举例更加贴近学生的生活,教师可以详细介绍手机键盘和主板的制造过程,并在这一过程中将所学的算法和理论融合进去,加深学生对知识的理解。其次,教师在手机讲解时,还可以引导学生思考类似的产品制造,从而引出数码相机的制造原理,和学生一起探讨其制造算法。这种做法不仅可以帮助学生学习,还可以让学生拓宽思路,发散思维,不断创新计算机视觉领域。(2)选择合适的实际应用。计算机视觉课程是一门实践性和操作性极强的学科,因此,为了学生更好的学习,教师要将理论工程实践化,选择合适的实际应用来提高学生的实践能力。教师可以安排学生进入手机制造厂房,给学生上一堂别开生面的实践课,详细介绍每个制造流程,并向学生不断抛出与课程有关的问题,引发学生的思考,比如选择什么样的模板匹配法可以更为简单。学生在不断的解答和提问中,对学科知识的了解也会逐步加深。其次,高校可以建立专门的实训基地,学生可以在基地里实践操作,将理论转化为实物,亲自尝试做出模型,这种做法可以极大地提高学生的实践能力,使学生更快的将理论转化为实际。
四、结语
在新形势下,高校应不断创新计算机视觉课程的教学模式,并以此展开教学活动,培养学生的实践能力和创新精神。将工程应用和科技最新成果结合的教学模式,有利于解决理论和实践相脱节的问题,在增强学生学习兴趣、提高学生独立分析能力的同时,还使学生接触了国际最新的研究成果,拓宽了学生的思路,这对学生未来的发展有着重要的意义。
参考文献:
[1]郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践[J].理工高教研究,2010,(05).
[2]伦向敏,侯一民.高校《计算机视觉》课程辅助教学系统的研究[J].教育教学论坛,2012,(18).
[3]陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式[J].当地教育理论和实践,2013,(07).
[4]杨晨.视觉传达设计专业插画设计课程创新与实践人才培养机制探究[J].艺术科技,2015,(05).
[5]蒋辰.基于数字媒体环境的视觉传达设计专业综合实验课程改革探证[J].文艺生活:中旬刊,2015,(07).
[6]张胜利.视觉传达设计专业中色彩风景写生课程多元立体化教学模式的构建[J].美术教育研究,2015,(08).
计算机视觉特点范文2
1.1自动化程度高
计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。
1.2实现无损检测
由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。
1.3稳定的检测精度
设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。
2计算机视觉技术在食品检测中的应用
20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚20多年,但是发展很快。
2.1计算机视觉技术在果蔬分级中的应用研究
计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图象处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco.J[15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。
2.2计算机视觉技术在禽蛋检测中的应用研究
禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。MertensK等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。
2.3计算机视觉技术在检测食品中微生物含量的应用研究
计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar.B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有,对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征和微生物数量进行识别,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。
2.4计算机视觉技术在其他食品产业中的应用研究
里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。GokmenV等[33-34]通过对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率的关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等[35]人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等[36]人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。
3展望
新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。
3.1检测指标有限
计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大[37]。例如,Davenel等[38]通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花萼和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer[39-40]等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。
3.2兼容性差
计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是,同一套系统和设备很难用于其它种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等[41]利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等[42]利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。
3.3检测性能受环境制约
计算机视觉特点范文3
关键词:视觉原理;计算机视觉艺术;数字媒体;应用
利用计算机所具有的视觉艺术,大众仅仅利用需要实施身体动作来直接性的操作以及控制,根本就不需要学习就能够启动以及进行一定的操作,这样更加方便老年人以及儿童的实际操作。在数字媒体当中,应该对计算机视觉艺术进行充分利用,更加方便人们的实际操作,同时还能够保证其更好的感受艺术方面所具有的魅力,让群众在足够放松的时刻能够对创作者的实际思想以及意图进行充分的了解以及掌握,对艺术价值进行充分发挥,进而来有效提升艺术人文的实际价值。
1对计算机视觉原理进行分析
通常来讲,计算机视觉还称为机械视觉,属于是机械来对人类视觉进行一定的模仿的光学识别系统,利用光学系统、感应器、光源等来实现物体定位、动作的追踪以及视线的判断等相关的功能。一般情况下,工程技术所运用的基本都是计算机视觉,当有着一定的环境以及模式时,计算机视觉在进行持续性的工作时,能够有效保证持续工作有着非常高的正确性以及准确性,还能够对人工不可以完成的任务进行很好的完成。当计算机视觉在进行实际的工作过程中,最为基本的条件是先对映像进行处理,之后输入模拟讯号,对数字影像进行一定的处理以及分析。实际的工作流程是:影像在摄入之后,应该对其进行一定的强化,除去噪声,之后对图像特征进行一定的压缩以及获取。在对数据库样本进行一定的对比之后,对程序进行有效的分析以及判断,做出有效的指令。
2对数字媒体当中计算机视觉艺术的实际应用进行分析
2.1艺术与计算机进行一定的融合时,应该对动画、声音以及图像等因素进行有效结合,在对艺术语言表现形式进行丰富的同时,应该提高作品的感染力
在有些结合视觉艺术以及数字媒体时,应该保证在对画面进行观看时,应该有效的欣赏画面,还可以有效的感受到声色等。利用高度仿真的听觉、触觉以及视觉,保证大众在进行玩游戏时,可以对虚拟世界进行真实的感受,还能够利用动作以及肢体语言等来和计算机实现有效的交流。保证大众不是对电影单独的进行欣赏,还应该更好的参与到其中,体会艺术的表演。
2.2在数字媒体当中运用计算机视觉艺术能够对艺术的实际表达形式进行有效的丰富
随着交互技术的逐渐成熟以及发展,让该技术得到了有效的拓展以及广泛的运用。运用交互技术,应该让人们不受到被动的欣赏,应该积极的参与到视觉艺术当中,保证大众的积极参与以及做出判断,同能够利用各种选择来呈现出过程以及解决,对观众的兴趣进行充分的调动,进而来有效提高大众的参与积极性。
2.3在电子游戏当中,运用计算机视觉艺术,应该在相对比较大型的电子游戏当中进行计算机视觉技术的运用
在实际的游戏过程当中,大部分的玩家基本上不再是仅仅运用键盘以及鼠标来实施游戏,大部分都是利用身体行动来移动。通常情况下,机器利用摄像机部来对玩家的具体身体动作进行一定的捕捉,玩家能够与机器相连接的手枪进行有效的操作,射中屏幕当中的对象。同时,手机上的相对比较小型的电子游戏,仅仅需要手指来滑动屏幕,就能够实现实物的运动以及跳跃等,进而来躲避障碍。除此之外,仅仅需要稍微的倾斜一些收集,就能够实现人物两侧的奔跑,同时还能够保证声光效果,实现互动,具有非常大的震撼力,会在很大程度上促进大众参与的积极性。
2.4分析数字媒体中计算机视觉技术的应用,保证数字媒体技术有效表现艺术
同时在实用艺术以及纯艺术当中,也会运用到数字媒体,该技术能够让相对比较单纯的个人视觉实现有效的创造,同时还能够把艺术箱社会性视觉产品进行转化,并得到一定的经济效益。同时,大众能够通过剪切以及拷贝等相关的方式来有效获取视觉技术,之后有效的转化艺术资源,有效奠定了创作视觉艺术的基础。现阶段,大众对于个性化以及独特性有着逐渐提高的需求,在对相对比较独特的视觉技术进行追求时,在一定程度上提高了评价视觉作品的标准。在数字媒体当中运用计算机视觉技术,会在很大程度上提高大众对美的享受,保证大众能够充分感受到舒适以及愉快的感觉,同时还能够得到审美方面的评价,在该过程当中,不能够参杂任何的因素,应该让计算机视觉因素仅仅对视觉美感以及视觉形式进行充分的追求,可以有效体现艺术的本质。同时,数字媒体有着美方面的品格,有效结合计算机视觉艺术,保证数字媒体艺术的美以及真。这个实际的运用过程能够有效提升审美方面的机制,更好的领悟视觉艺术当中所存在的美。
3结语
综上所述,在数字媒体当中,计算机视觉技术的运用,应该有效结合图像、动画、声音以及文本等多个因素,在对语言表现的具体形式进行一定的丰富时,应该让作品具有更大的感染力。除此之外,还应该保证视觉技术有何足够的光声效果,利用一定的互动,会具有非常大的震撼能力,积极促进大众的参与程度。还可以在很大程度上满足大众对于美方面的追求,进而对其所具有的艺术价值进行充分发挥,有效提升艺术所具有的人文价值。
参考文献
[1]刘晓,王会霞.计算机视觉艺术在数字媒体领域的应用研究[J].互联网天地,2015,07:21-24.
[2]丛婧.浅谈计算机视觉艺术在数字媒体的应用[J].电子制作,2013,18:75.
计算机视觉特点范文4
电力系统是我国国名经济的基石。电力系统是由发电、变电、输电、配电和用电等环节组成的电能生产与消费系统。现代社会需要的是安全可靠经济的电能。电力系统主要由发电输电变电配电及用电等5部分组成。电力系统是一个具有复杂的大系统由于用户的不断增加的需求,电网对于技术的要求水平也提出了越来越高的要求。
1 电力系统自动化的发展趋势总的发展趋势的特点研究
1.1 电力系统自动化的图形化特点
因为电力系统联网工程的正式启动,电力系统的调度管理、数据计算分析呈现出传输路径的交叉性,信息更新越来越高速这样的几种特点。在计算机技术和通信技术的快速发展下,电力系统技术整合也在蓬勃发展着。电力系统信息数据处理上已经不再使用传统的处理方式,而是使用图形化处理这样的新技术,这样看到图形,电力系统管理者就能了解电力系统的变化发展趋势,也就能对未来电力系统软件开发带来丝丝先机。
1.2 电力系统自动化的远程化特点
过去电力系统的硬件平台大部分是计算机,外加使用扩展测控法对接口电路工作开展监测。此类的设计有很多的优势,这种类型的设计的周期很长,扩展性也很好。但是这样的设计方式也具有着高成本、大体积、大功耗以及灵动性差的多种缺点。现在,正是有着网络技术的不断更新和电子技术的不断进步,远动终端设备已经变为越来越接近最优化、智能化和小型化、协调化。因此,建立在此基础之上的电力系统也具备了远程化的特点,使电力系统自动化在控制系统方面的发展更加贴近智能化。
1.3 电力系统自动化的分布化特点
发电率范围在几十兆瓦至几千瓦之间并且模型较小的发电单元,它的地点处于用户周围还有有高效和可靠特点的称为电力系统自动化技术分布化。分布式发电主要包括以液体或气体为燃料的内燃机、太阳能发电、微型燃气轮机和风力发电等等的其他一些发电方式。这种发电技术具有很好的灵活性,能够给与用户各不相同的感受。还能为边远商业区域提供可靠的电力资源,让他们使用具有再生特点的资源进行多次发电,这样的电能还具有稳定度高的特点,是具有分度化的特色。极端及技术、新材料技术和电力电子技术都要作为支柱技术被在其中使用。
2 电力系统与新技术的结合
2.1 与智能计算机的结合
计算机视觉技术就是与智能计算机的结合之一。使用计算机视觉技术能够方便的获得多种图像信息。在电力系统中应用计算机视觉技术。目前,计算/!/机视觉技术使用在电力系统中的作用是修改遥控系统在此同时提高它的性能。这主要表现在使用在线监测和开展无人操作或者环境监视,红外图像监测是电力设备在线监测常用方法中效果最好的。它既有这使用方便,又有着精准度较高的特点。红外图像识别方面主要就是使用计算机视觉技术,这样能取得较好的效果。计算机视觉技术的工作原理是在科学获取电力设备实时红外图像和电力设备正常工作时图像后,将两者开展对比。如果出现不正常。也就因此能够证明电力设备出现问题。第开展无人操作或者环境监视是使用微波双鉴探测器进行协助,将差分图像以及流光法一起使用对移动物体开展监测。如果出现不正常现象,那么系统就可以识别出来,并且警告我们。因为计算机视觉技术还处于起步阶段,其存在一定的不足之处。虽然计算机视觉技术发展迅速,但计算机视觉技术发展的并不完善,因为图像识别自身的复杂性的原因,所以现阶段还不能实现完全的无人操作。正是因为有着这些原因,在大多数情况下,计算机视觉技术只能够作为一种辅助技术。
2.2 与微机保护系统的结合
在电力系统自动化技术发展速度过快并且伴随着相关微机设备应用范围越来越普遍的情况下。人们越来越严格的要求微机保护系统。更简单的说,也就是原有的电力系统自动化技术当中的微机保护系统已经无法满足社会发展的需要。人们需要的微机保护系统应该具备更加牢靠与稳定的可以对通信进行保护的能力。这样才能够达到人们希望人机互动的效果。这样的系统在对硬件提高出高要求的同时也对软件业产生了更加具体的要求。例如,我国在上世纪末将第一套微机线路保护设备投入使用,并且该设备因为性能占据极大的优势从而获得世界各国用户的普遍认可。
在继电保护设备中,我们更加需要完善的问题就是设备的实时性。设备的实时性直接关乎电网的安全稳定,它直接受到其影响。假如设备实时性出现缺陷,会给电力系统带来难以补救损失的可能性。现阶段在我国电力系统中应用的嵌入式系统通常来说主要为C/C++语言。这是因为该系统不仅灵活性高并且可移植性也很强。同时该系统还使用了能够随时改变的模块化,目的在于处理好各种存在可能性会产生的问题但是却又不能够进行更换的难题。在提供便利的同时也能够尽最大的努力满足用户各种要求。
计算机视觉特点范文5
【关键词】摄影测量;计算机视觉;数字化
科技迅速发展,摄影测量技术经过多次改革,到目前已经进入数字化的摄影测量技术阶段,这个新技术对整个摄影测量专业理论知识教学、科学研究和企业生产都有重要的影响,这些影响不仅仅是表现在表面,它已经使摄影测量的概念和涉及到的专业的知识都有影响。从测绘学科的角度来说,数字测量技术已经从传统的摄影测量技术发展到现在新型数字化测量技术,简便快捷;从摄影测量学科来说,数字摄影测量技术已经从经典的摄影测量转化到现在与计算机相结合的高科技技术。数字测量技术既给人们带来机遇,又给技术人员带来挑战,但是其在发展中还存在很多问题。作为新时代的我们,应努力抓住机遇,勇敢的面对挑战,提高自身的知识储备量和技术,使自己能在快速发展的经济市场中站住脚步。
一、摄影测量发展现状
由于摄影测量生产的转型,影像扫描仪已被大量地应用,全国扫描仪数量已超过100台。同时航空摄影机(如RC30)也在加速引进。应用于航空摄影过程中的GPS/IMU系统也已引进,Z/I公司的数字航空摄影机DMC已开始在中国应用。与此同时,高分辨率的遥感影像以及其定位参数(RPC)文件的应用,只要极少量的外业控制点,就能迅速生成正射影像图,它已在城市、土地的变迁、规划中得到愈来愈广泛的应用。航空激光扫描Lidar也愈来愈成熟。
由于新一代传感器、定位系统的迅速发展与应用,以及数字摄影测量工作站的发展及其大规模的推广,这样对摄影测量自身发展提出一个非常严峻而又现实的问题:摄影测量向何处去,除了摄影测量与新一代遥感传感器、GIS、GPS 更进一步地结合外, 摄影测量自身从理论到实际将如何发展,还有没有发展前景,在国际上同样对摄影测量发展提出了疑虑,美国Ohio大学Schenk教授在其著作“数字摄影测量学”的序言中指出:摄影测量与猫一样,他们有一个共同的特点,他们都有几次生命,摄影测量的终结已经被多次预测。但是他对此问题作了明确的回答:数字摄影测量是一门相对年轻的、并且迅速发展的学科。它的许多基本概念与方法来自影像处理与计算机视觉。但是不管它们对它的影响有多强烈, 数字摄影测量还是一门有自己特色的学科。
二、数字摄影测量给学科带来的机遇与挑战
摄影测量与遥感是一门“从影像重建被摄物体表面”的学科,摄影测量侧重于重建物体的几何表面,并进行“量测”;而遥感则侧重于重建物体的物理表面,恢复问题表面的物理属性。因此,从本质而言, 摄影测量与遥感是研究影像的获取、理解、加工、处理的科学与技术,使人们更容易直观地理解与应用有关信息。从测绘学科的角度来理解,摄影测量是一门“量测的学科”,著名的摄影测量学者HeIva (1995)就认为“摄影测量的范畴是量测”;而从信息科学和计算机视觉科学来看,它是从影像来重建三维表面模型的科学与技术―计算机立体视觉。但是,人们一般并没有将摄影测量与计算机立体视觉联系在一起。这是由于摄影测量在上世纪摄影技术出现不久就被学者发现其测量功能,并被使用,而计算机立体视觉实在新世纪环境下创造并被使用的,因此摄影测量的历史要比计算机立体视觉的历史长得多,并早已成为测绘产业的重要组成部分;而且,长期以来,摄影测量是依赖于精密的光学机械仪器,特别是在模拟摄影测量时代, 摄影测量以模拟摄影测量仪器为代表, 与计算机没有任何联系。我们必须清楚地认识到,摄影测量发展到今天,已经超越了传统摄影测量的范畴,它已经不属于摄影测量工作者“独家所有”。这是摄影测量工作者面临的最严峻的挑战。
同时,数字摄影测量也为我们带来了发展机遇。在模拟摄影测量时代, 摄影测量的教学、科研以及生产的组织与流程,一切均以模拟摄影测量仪器的制造者为中心。摄影测量仪器的理论、结构,各种控制器、仪器的定向理论与操作方法,变换光束测图的理论等,均以相应的仪器为中心。进人了解析摄影测量时代,由于计算机引人了摄影测量,大大地拓宽了摄影测量教学、科研的领域,这也提供给学者们更多的研究方向。
三、数字近景摄影测量――摄影测量发展的崭新领域
到目前为止数字摄影测量的发展,无论在理论上还是在实际上,,主要还是围绕着利用航空(航天)摄影测量测绘地形图展开的,而对于数字近景(地面)摄影测量的研究甚少。同时随着数码相机的广泛应用,价格愈来愈低廉。数码相机在测量中的应用将是摄影测量发展的必然趋势。
在此领域数字近景摄影测量与计算机视觉有着天然的密切联系,因为计算机视觉的研究目标是使计算机具有通过2维图像认知3维环境信息的能力,这种能力将不仅使机器感知3维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储, 识别与理解,两者之间有很多相似之处,但两者间又有明显的差异。不论差异大小,不可否认的是,数字近景摄影测量已成为数字摄影测量发展的必然趋势。
四、结束语
数字摄影测量在目前还是一个较为年轻的学科,主要采用计算机技术,将获取到到信息数字化,通过计算机进行测绘和分析,提取出对人们有用的信息,这一改变,使数字摄影测量很快被企业所接受并得到快速发展。总而言之,数字摄影测量技术的出现不能仅视为简单的科学进步而已,应该透过现象看本质,深刻认识到他已经从概念开始改变,并影响到科学研究领域,正在逐渐改变企业的生产产品水平。面对这些情况,我们应该努力提高自己的理论知识储备量,提升专业素养,及时抓住一闪而过的机会,迎接各种挑战,在激烈的竞争不断进步。
参考文献
[1] 李利,马颂德. 从2维轮廓线重构3维二次曲面形状[J].计算机学报,1996,19(6):401.
[2] 马颂德,张正友.计算机视觉-计算理论与算法基础[J].北京:科学出版社1998.
计算机视觉特点范文6
关键词:目标跟踪;CAMSHIFT算法;OpenCV;颜色直方图
中图分类号:TP391文献标识码:B文章编号:1004373X(2008)2012803
Moving Object Tracking Method and Implement Based on OpenCV
LI Zhenwei1,2,CHEN Chong1,2,ZHAO You1
(1.Changchun Observatory,National Astronomical Observatories,Chinese Academy of Sciences,Changchun,130117,China;
2.Graduate School,Chinese Academy of Sciences,Beijing,100049,China)
Abstract:CAMSHIFT is an object tracking algorithm based onthe color histogram.In the process of object tracking,CAMSHIFT operates on a color back-projection image produced from object histogram model in current frame and finds the location and size of the current frame by adaptively adjusting the size and the location of the searching windows according to the tracking results of the previous frame in the video.On the basis of introducing OpenCV(an Intel open source computer vision library),through CAMSHIFT algorithm,the paper realizes moving object tracking and resolves some problems including distractor and occlusion by other objects.Experimental results show good performances,superiority and feasibility of the algorithm.
Keywords:object tracking;CAMSHIFT algorithm;OpenCV;color histogram
目标跟踪是计算机视觉的一个重要分支,日益广泛应用于科学技术、国防安全、航空、医药卫生以及国民经济等领域。实现目标跟踪的关键在于完整地分割目标、合理提取特征和准确地识别目标,同时,要考虑算法实现的时间,以保证实时性。当视频图像中被跟踪目标发生姿态变化,存在旋转或部分遮挡时,简单的灰度模板或者Hausdorff距离匹配一般很难达到实时跟踪目标的要求,出现误匹配或者跟踪丢失的情况,而且跟踪效率较低。
Gary R.Bradski提出的CAMSHIFT[1](Continuously Adaptive Mean Shift)算法是以颜色直方图为目标模式的目标跟踪算法,可以有效地解决目标变形和部分遮挡的问题,而且运算效率很高。该文首先详细介绍CAMSHIFT算法,并结合Intel公司开发的开源OpenCV计算机视觉库,实现了运动目标跟踪,并验证了CAMSHIFT算法的有效性以及展现OpenCV计算机视觉库的灵活性和优越性。
1 CAMSHIFT算法
由于RGB颜色空间对光照亮度变化比较敏感[2],为了减少光照亮度变化对跟踪效果的影响,CAMSHIFT算法将图像由RGB颜色空间转化到HSV(Hue,Saturation,Value)颜色空间再进行后续处理。
图1是CAMSHIFT算法流程。首先选择大小为S的初始搜索窗口,然后对该窗口中每一个像素点的H通道上采样,得到运动目标的色调(Hue)直方图,再将该直方图保存下来作为搜索目标的颜色直方图模型。在目标跟踪过程中,对摄像头当前帧图像的每一个像素,通过查询目标的颜色直方图模型,可以得到该像素为目标像素的概率。经上述预处理,视频中每一帧图像都转化为目标颜色概率分布图,也称为目标颜色投影图。在一般情况下,将投影图转化为8位的灰度投影图,概率为1的像素值设为255,概率为0的像素值为0,其他像素也转换为相应的灰度值。
图1中虚线部分是CAMSHIFT算法的核心。设点(x,y)为搜索窗口中的像素位置,I(x,y)是投影图中(x,y)处的像素值。为此,定义搜索窗口的零阶矩M00和一阶矩M01,M10分别如下:
M00=∑x∑yI(x,y)
M01=∑x∑yyI(x,y)
M10=∑x∑yxI(x,y)
图1 CAMSHIFT算法跟踪流程
该搜索窗口的质心位置为:
(xc,yc)=(M10/M00,M01/M00)
计算跟踪目标的方向和尺寸:
二阶矩:
M20=∑x∑yx2I(x,y)
M02=∑x∑yy2I(x,y)
M11=∑x∑yxyI(x,y)
令:
a =M20 /M00 -x2c,b=2(M11/M00-xcyc),
c =M02 /M00 -y2c
目标长轴的方向角为:
θ=12tan-1(ba-c)
图像中目标的长轴和短轴的长度计算公式:
l=(a+c)+b2+(a-c)22,
w=(a+c)-b2+(a-c)22
然后,根据零阶矩M00调整搜索窗口的大小,并将搜索窗口的中心移动到质心,如果移动距离大于预先设定的固定阈值,则重新计算调整后的窗口质心,进行新一轮的窗口位置和尺寸调整,直到窗口中心与质心间的距离小于预设的固定阈值,或者循环运算的次数达到某一最大值,认为收敛条件满足,进入下一帧图像进行心的目标搜索。在下一帧图像中,利用上一帧图像中最终得到的窗口质心位置和S=2M00256来设置新的搜索窗口位置和尺寸。CAMSHIFT跟踪算法在视频单帧内与帧间都根据上一步得到的M00自适应地调整搜索窗口的大小,因而可以适应跟踪目标动态变形的情况。
2 计算机视觉类库OpenCV简介
开放源代码的计算机视觉类库OpenCV( Intel@ Open Source Computer Vision Library)由英特尔公司位于俄罗斯的研究实验室所开发,它是一套可免费获得的、由一些C函数和C++类所组成的库,用来实现一些常用的图像处理及计算机视觉算法。
OpenCV主要用于对图像进行一些高级处理,比如说特征检测与跟踪、运动分析、目标分割与识别以及3D重建等。
与其他计算机视觉工具相比,OpenCV的优越性如表1所示:
表1 图像处理、计算机视觉工具比较(IPL,openCV,IPP,visDSK与 Matlab)
开发工具开发单位应用领域免费情况源码公开与否备注
IPLIntel图像处理Free不公开已被并入到IPP
OpenCVIntel图像处理、计算机视觉Free公开基于Intel芯片代码优化
IPPIntel集成开发环境库(图像处理、信号处理等)Not free不公开基于Intel芯片代码优化
VisDSKMircrosoft图像处理Free公开无优化
MatlabMathWorks多学科、多种工作平台Not free不公开速度慢,不宜编译成可执行文件
OpenCV是Intel公司开发的图像处理和计算机视觉函数库,它有以下特点:
(1) 开放C及C++源码;
(2)基于Intel处理器指令集开发的优化代码;
(3)统一的结构和功能定义;
(4)强大的图像和矩阵运算能力;
(5)方便灵活的用户接口;
(6) 同时支持MS-Windows,Linux平台;
(7) 在速度上OpenCV还有Intel 公司的mmx和ssl优化。
2.1 OpenCV的数据结构
OpenCV设计一些基本数据类型,基本的数据类型包括:图像类的IplImage,矩阵类的CvMat,可变集合类的CvSeq,CvSet,CvGraph以及用于多维柱状图的混合类CvHistogram。辅助数据类型包括:用于表示二维点坐标的CvPoint,用于表示图像宽和高的CvSize等。
2.2 OpenCV的函数体系
OpenCV中每个函数的命名都以“cv”开始,然后是该函数的行为及目标。例如用来创建图像的函数“cvCreateImage”,载入图像的函数“cvLoadImage”。OpenCV是为图像处理及计算机视觉在实际工程中的应用而设计的一个类库,其中所有的函数都由于其在实际应用中所实现的不同的功能而分属不同的类型,主要的函数类型有:
(1) 基本的图像处理与分析函数。
这个类型的函数主要用于实现一些基本的图像处理与分析功能,例如图像平滑函数cvSmooth,Sobel算子cvSobe,l Canny边缘分割函数cvCanny等。
(2) 结构分析函数。
包括有轮廓处理函数,几何学函数以及平面细分函数。
(3) 运动分析与目标跟踪函数。
包括有用于运动分析与目标跟踪的函数,例如背景重建函数cvAcc,用光流法或动态轮廓模型来实现目标跟踪的函数cvCalcOpticalFlowBM和cvSnakeImage以及卡尔曼滤波函数CvKalman等。
(4) 摄像机标定和3D重建函数。
包括有用于摄像机标定,姿态估计以及从两个摄像机进行3D相似重构的函数。
(5) GUI与视频处理函数。
包括有高级图形用户接口highGUI用以实现对图像的载入、显示及保存等基本操作以及用以实现视频输入输出及处理的函数。
3 CAMSHIFT算法实现
在OpenCV库中,CvCamShiftTracker类就是用来实现CAMSHIFT算法的,使得进行二次开发变得很简单。该函数为:
int cvCamShift( const CvArr* prob_image,CvRect window,CvTermCriteria criteria,CvConnectedComp* comp,CvBox2D* box=NULL );
prob_image:目标直方图的反向投影
window:初始搜索窗口
criteria:确定窗口搜索停止的准则
comp:生成的结构,包含收敛的搜索窗口坐标 (comprect 字段) 与窗口内部所有像素点的和 (comparea 字段).
box:目标的带边界盒子。如果非 NULL,则包含目标的尺寸和方向。
利用该函数,在VC6.0开发环境下,就容易实现CAMSHIFT算法跟踪运动物体,图2是程序界面:
图2 CAMSHIFT跟踪界面
4 实验结果与分析
在本实验中,用一个摄像头来跟踪一运动物体,下面图3~图6一系列图像是采用CAMSHIFT算法跟踪运动物体部分图像。
图3 摄像头拍到的场景
图4 手动选中的目标物体
图5 物体快速移动时跟踪目标
图6 物体发生旋转、变形时跟踪目标物体
由此可见,基于颜色直方图的CAMSHIFT算法可以有效地解决目标变形和旋转问题,而且运算效率很高,可以实时跟踪运动目标。
5 结 语
本文在详细分析CAMSHIFT算法原理的基础上,采用Intel公司开发的OpenCV视觉库,在VC6.0开发环境下,实现了运动目标实时跟踪,解决了目标旋转、变形、部分遮挡问题。同时,可以看到,在开源库OpenCV的基础上,根据自己所开发应用程序所要实现的功能选择所需的库函数,能够大大减少在计算机视觉领域中的开发时间和精力,缩短程序开发的周期。
参考文献
[1]Bradski G puter Video Face Tracking for Use in a Perceptual User Interface[J].Intel Technology Journal,1998,2:214-219.
[2]Boye M.The Effects of Caputre Conditions on the CAMSHIFT Face Tracker[R].Alberta,Canada:Department of Computer Science,University of Calgary,2001.
[3]Comaniciu D,Ramesh V,Meer R.Real-time Tracking of Non-rigid Objects Using Meanshift[A].Proceeding of the IEEE Conference on Computer Vision and Pattern Recognition[C].Dublin,Ireland,2000,2:142-149.
[4]张宏志,张金换,黄世霖,等.基于Camshift的目标跟踪算法[J].Computer Engineering and Design,2006,27(11):2 012-2 014.
[5]刘雪,常发亮,王华杰.基于改进Camshift算法的视频对象跟踪方法[J].微计算机信息,2007(21):297-298,305.
[6]孙鑫,余安平.VC++深入详解[M].北京:电子工业出版社,2006.
[7]刘瑞祯,于仕琪.OpenCV教程基础篇[M].北京:北京航空航天大学出版社,2007.
[8]Intel Open Source Computer Vision Library Reference Manual[EB/OL]./research/mrl/research/opencv/.
[9]/hunnish.
[10]/group/OpenCV.
作者简介 李振伟 男,1983年出生,河南安阳人,硕士研究生。研究方向为视频运动目标跟踪。
陈 硕士研究生。