前言:中文期刊网精心挑选了计算机视觉研究的目的范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉研究的目的范文1
(广东农工商职业技术学院,广州 510663)
(Guangdong AIB Polytechnic College,Guangzhou 510663,China)
摘要: 本文就计算机视觉的理论框架进行阐述,对计算机视觉理论框架存在的问题进行分析,提出计算机视觉理论框架的新发展,以确保通过计算机视觉获得的景物信息更加完整。
Abstract: This paper expounds the theory framework of computer vision, analyzes the problems of theory framework of computer vision, and puts forward new development of the theory framework of computer vision to ensure that the scene information obtained through computer vision is more complete.
关键词 : 计算机视觉;理论框架;问题;新发展
Key words: computer vision;theory framework;problems;new development
中图分类号:TP391.4 文献标识码:A
文章编号:1006-4311(2015)02-0209-02
0 引言
在计算机系统中,计算机视觉是通过模拟人类视觉,从而对不同事物进行相关描述,以获得更全面的信息。随着计算机视觉在文字识别、漫步机器人和导航中的成功应用,计算机视觉的理论框架研究显得越来越重要,对于促进我国计算机应用技术水平不断提升具有重要意义。
1 计算机视觉的理论框架
随着计算机视觉的不断研究和总结,从二维景物图像发展到三维景物图像,计算机视觉的理论框架主要有如下三个:
1.1 计算视觉理论框架 在七十年代中期,有关研究人员提出了第一个计算机视觉理论框架,即计算视觉理论,将视觉过程看作是信息处理过程,并将信息处理过程分为三个不同的层次,它们分别是计算理论层次、数据结构层次和硬件实现层次,从而对计算机视觉进行全面分析。根据相关数据和资料显示,视觉是对图像的位置、形状和特征等进行描述,因此,计算理论层成为了研究的重点,进而将视觉过程看作是从二维图像信息中对图像进行重塑,从而将三维物体的形状、位置和空间等反映出来,最终形成三维图像。由此可见,早期的视觉处理是从输入的二维图像中获得二维要素图,即图像中强度变化较强时的位置和几何分布情况、结构等;中期的视觉处理是从二维要素图中获得二点五维图,即以观察者为中心,对表面的法向、深度和不连续的轮廓等进行观测。虽然二点五维包含的深度信息比二维要多,但还不是真正意义上的三维表示,而仅仅是有多个相对独立的视觉模块组成的,在相关研究中被称作是“shape from X”模型,将运动视觉、立体视觉等融入到其中;后期视觉处理是指从二点五维图中获取物体的三维描述,从而将场景中的物体识别处理,确定物体的确切位置和姿态。
1.2 基于知识的视觉理论框架 在计算机视觉理论中,基于知识的视觉理论框架,是围绕感知特征群集来进行相关研究的,从而通过人类感知的经验来描述目标,最终确定物体在场景中的真正位置、形态等。相关研究人员认为,基于知识的视觉理论可以通过知识的引导来直接完成三维重建,以将相对应观察方向保持不变动二维特征称作是非偶然性聚类,而人体中视觉识别发挥重要作用的一种感知组织,通过对非偶然性聚类的检测,可以有效辨别出目标。因此,首先是利用感知组织来提取图像中相对于观察方向大范围变化,并且保持不变的分组和结构等;然后,利用概率排队的方法来进行模型匹配,从而缩小检测空间;最后,通过对观察点的未知求解和寻找模型参数对应关系,使三维模型的投影和图像得到最合适的匹配,最终完成三维重建。
1.3 主动视觉理论框架 第三种计算机视觉理论框架是中东视觉理论矿坑,是根据人类视觉的主动性特征提出的。由于人类视觉会根据自己的意识选择视野范围内所看见的事物的主次,从而移动身体、转向或者改变视角,因此,人们的视觉过程是与所在环境交互感知和动作的过程。在计算机视觉理论框架的主动视觉框架中,视觉行为不需要三维物体的相关精确信息,就可以完成物体重建。主动视觉系统根据所需的物体对象特征、分析结果和当前要求等,通过控制摄像机的相关操作,如取向、位置、焦距等,就可以完成相关处理任务和信息交换。与此同时,主动视觉还可以用改变摄像机的参数和处理摄像后的数据等,使图像的时间、空间和分辨率等发生变化,从而增强图像的感知效果。
2 计算机视觉理论框架存在的问题
现展中,计算机视觉理论框架的提出,是计算机视觉领域研究的重要突破,而在这个发展过程中,存在着如下一些问题,影响计算机视觉理论框架的更完善构建。由于视觉过程是成像过程的逆过程,存在着混合、投影、噪音和畸变等干扰因素,使图像三维重建存在不稳定性和不确定性,因此,从一幅景象到多幅景象的重建存在很多困难,使三维图像的准确性和通用性大大降低。并且,计算视觉理论认为输入是被动的,整个视觉过程自下而上不存在反馈,处理目的没有发生任何改变,因此,对物体的确切位置和形状有一定要求。另外,有关学者提出计算机视觉理论框架没有充分运用知识,对知识表达没有给以高度重视,从而忽略知识推理和知识库的构建,没有对空间约束和场景假设进行充分考虑,从而使场景假设受到局限。并且,没有进行多次的分析和试验,致使计算机视觉理论框架构建存在很多问题。
基于知识的理论框架忽略了计算视觉理论的重要性,认为人类视觉和重建无关,然而,在进行物体尺寸判断、物体距离估算等情况时,光靠识别是不够的,必须要依靠三维重建,才能将物体的确切位置、形状等准确地描述出来。
主动视觉理论没有排除三维重建,通过改变摄像机的参数和角度等,来改变物体空间、时间和分辨率的感知效果,从而对图像出来过程进行相关约束,使很多不稳定和不合适的问题得到有效解决,最终完成三维重建。运用主动视觉理论框架,可以大大降低问题的难度,但主动视觉理论框架仍存在缺乏高层知识指导的问题,导致主动视觉框架还不够完整,使计算机视觉理论框架构建受到一定影响。
3 计算机视觉理论框架构建的新发展
在计算机视觉理论框架的构建过程中,计算视觉理论比较系统地解释了从二维图中获取三维物体形态的方法和可能性,而基于知识的实际理论和主动视觉理论则对计算视觉理论进行了补充和进一步提升。因此,计算机视觉理论框架的新发展,可以以计算视觉理论为主,将基于知识的视觉理论和主动视觉理论结合到一起,从而使计算机视觉系统框架变得更加完善。
在实际应用过程中,将早期视觉处理分为图像分割、图像预处理和二维模式识别等,以对二维图像进行滤波降噪和图像增强等,因此,不需要知识引导和控制视觉目的。在图像分割、二维图像模式识别、中期处理、后期处理和三维模式识别的过程中,没有知识引导和模型匹配,最终得出的图像效果会更好、更完整。在早期视觉处理和后期视觉处理中,二维模式和三维模式的识别,需要根据物体的实际情况来确定,由于特征、模型等各不一样,所以,二维物体和三维物体的描述方式也各不相同。由于二维信息的质量会影响三维信息的效果,因此,在计算机视觉中,二维信息应当给以高度重视。而模型库和视觉目的的应用,为计算机视觉理论框架构建提供了更多的信息。由此可见,在计算机视觉系统中,通过视觉目的来进行物体形象、位置等的输出判断,同时,运用视觉目的可以对图像分割和二维模式识别、中期视觉处理、后期视觉处理和三维模式识别等进行有效控制,最终使三维重建的图像信息更加完整。
4 结束语
随着高科技信息技术的不断推广,计算机视觉理论框架的研究已经成为目前重点关注对象之一,虽然取得了一定的成绩,但计算机视觉理论框架构建还不够完善。因此,计算机视觉理论框架未来的发展,需要对计算实际理论、基于知识的视觉理论和主动视觉理论进行更深层次的研究,将理论和实践应用紧密结合在一起,从而使计算机视觉理论框架研究的成果可以更加辉煌。
参考文献:
[1]尹宏鹏.基于计算机视觉的运动目标跟踪算法研究[D].重庆大学,2009.
计算机视觉研究的目的范文2
【关键词】农产品 计算机视觉技术 品质检测
农产品品质检测工作中除了采取人工检测法以外,还可以采取半自动或自动检测法,如在水果分级检测工作中的质量分级检测法、光电分选法以及大小分级法等。然而农产品品质会受到自然生长环境或人为因素等方面的影响,农产品的色泽、大小及形状等并不相同,无法采取单一指标进行检测。因此充分应用计算机视觉技术,对农产品的品质进行检测,极为重要。
1 计算机视觉技术
计算机视觉技术又被称为机器视觉技术,指的是通过人类设计,在计算机环境下,达到再现或模拟人类视觉相关的职能行为的一种技术,包括了印刷和手写文字的识别技术,图像模式识别技术,物体三维表面形状识别技术、距离识别以及速度感知等技术。该技术是诸多学科的结合与交叉,涉及到数学、生理学、信息处理、物理学、光学以及计算机等多种学科。探究计算机视觉技术的目的在于实验人类视觉的再现及延伸,即再现高等动物的视觉系统,并对物体形状以及类别进行识别。
此外,计算机视觉技术处理的原始资料多是图像,所以该技术和图像处理以及模拟识别等有着紧密的联系。现阶段,计算机视觉技术在诸多领域有着较为广泛的运用,包括了医学辅助诊断、资源调查、卫星图像解释、军事指导、灾害监测、气象以及工业产品的外观筛选及检测等。同时研究该技术在农业工程领域中的应用,也成为了热门话题。
2 在农产品品质检测中,计算机视觉技术的具体应用
笔者在查阅相关文献资料的基础上,探究在农产品品质检测工作中,计算机视觉技术在产品表面缺陷以及损伤识别工作中的具体应用;果形识别工作中的具体应用;农产品尺寸以及面积检测工作中的具体应用。
2.1 在产品表面缺陷以及损伤识别工作中的具体应用
在对农产品进行分级的过程中,依然存在着一大问题,即农产品表面缺损以及损伤识别。而早在1984年就已经出现了采取线扫描和模拟摄像机针对苹果表面损伤进行检测的实验报道,实验结果显示,采取数据技术能够检测出苹果表面损伤,其检测结果完全能够达到人工分级的精度。与此同时,还出现了一种机器视觉系统,该系统将不规则的图像信息与正常的图像信息区分开来,在去除蔬菜内的杂物以及检测农产品的污点等方面能够取得较好的应用效果。此外,在1989年,国外出现了一种全新的计算方法,即运用红外线扫描摄像机,处理苹果表面的灰度图像,既能够确定苹果表面的损伤面积,还能够区分不同损伤区。然而还技术是以机械装置的设定为基础,需要消耗2s的时间,对一个苹果进行检测,苹果表面缺陷分级精度以及损伤分级进度并不高。
我国在1997年,出现了运用计算机图像处理技术对苹果损坏自动化检测的试验研究,该试验结果显示,该技术的损坏检出率较高,能够规避果梗区以及花萼区对于坏损区域识别的具体影响,且该检测技术的鲁棒性较强。
2.2 在果形识别工作中的具体应用
果形识别是影响水果质量的重要因素之一,对于水果品质检测有着重大意义。当水果成熟后,水果的外形将会发生巨大的改变,且无法采取数学方法进行鉴别,采取其他方式进行果形识别极为重要。
在1981年,有研究人员就针对形状识别中的图像特征进行了探讨,提倡采取结构分析法以及外形轮廓曲线检测法,针对水果外形进行识别。并在1985年,以数字图像分析技术以及模式识别技术为依据,针对番茄定向、番茄形状、表面缺陷以及尺寸进行分类的特殊算法,运用灰度梯度曲线,明确番茄表面缺陷以及花萼位置等。而我国则在2000年,按照果实形状分析,通过连续性指标、半径指标、连续指标对称性、半径指标对称性等特征参数,表示果形,并首次采取参数形状分析法。
2.3 在农产品尺寸以及面积检测工作中的具体应用
农产品分级中,以农产品外形尺寸为依据。在1987年,国外就已经开始研究机械视觉技术在牡蛎肉分级以及尺寸检测工作中的具体应用。并在1992年,针对人工检测以及机器视觉检测进行进行了对比分析,试验结果显示,和人工检测技术相比,采取视觉检测技术,能够提高检测的精确度,减少检测消耗时间;同时在评价以及推广种质资源中,准确的测量以及详细的记录种质形态的指标,有着极为重要的意义。为了能够精确、快速地计算出玉米种质尺度,在1995年,有研究人员就提出了自动化选择技术,该技术在处理玉米种质图像中,其辨别精度极高。
而我国在2002年,有研究人员就针对水果品质进行动态、实时监测的智能化分级生产线进行了研究,该生产线,首先通过水果输送翻转系统,利用滚筒式输送翻转装置,将水果往前输送,在输送过程中,以水平轴为中心,保证水果表面能够被系统检测到,以此获得图像信息。然后利用计算机视觉识别系统,对水果等级进行判断,明确图像信息。该系统具备了视觉识别功能。最终通过分级系统,完成水果分级工作。
3 结语
在二十世纪七十年代以后,计算机视觉技术就已经得到了较为迅速的发展,在我国,该技术在农产品品质检测中的具体应用也得到了人们的高度关注,同时也取得了一定的成效。计算机视觉技术作为人眼的延伸技术之一,其具备了人脑功能,运用该技术代替以往的人工操作技术,已经成为了农产品品质检测工作的必然发展趋势。
参考文献
[1]朱从容.计算机视觉技术在水产养殖中的应用[J].浙江海洋学院学报(自然科学版),2008,10(04):191-192.
[2]王勃,徐静.计算机视觉技术在苹果叶片营养诊断上的应用[J].农机化研究,2008,(03):887-888.
[3]李朝东,崔国贤,盛畅,等.计算机视觉技术在农业领域的应用[J].农机化研究,2009,10(12):667-668.
作者简介
陈超(1995-),男,福建省福州市人。现为北京交通大学在校学生。研究方向为电子科学与技术。
计算机视觉研究的目的范文3
关键词 模式分析 计算机视觉 教学改革
中图分类号:G643.2 文献标识码:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析与智能计算研究所师资团队是江苏省“青蓝工程”创新团队,主要研究领域包括智能数据分析、图像处理和机器视觉等方向,承担研究生和本科生的模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程的教学任务。以往的教学过程中虽然积累了丰富的教学经验,但当前新知识不断涌现、新技术发展迅猛,对模式分析与视觉处理课程群的知识体系、实践体系改进提出了新的挑战。
近年来,国内外高校在该类课程教学上,已涌现出众多新理念、新方法。Coursera联合创始人Andrew Ng推出的机器学习课程,开启了教育领域的MOOC时代,引领了教育教学方法的新革命。①深圳大学、②江苏科技大学③分别进行了基于CDIO工程教育理念的计算机视觉课程教学改革实践,实现多层次项目设计的教学模式改革,讲座式、讨论式、实践式教学方法的探索。国防科技大学④在计算机视觉课程中引入研讨式教学模式,通过案例教学、小组研讨的方式来替代传统的教学方式。华中科技大学⑤从教学内容国际化、教学方式国际化、教学成果国际化三个方面开展了计算机视觉课程的国际化建设。另外,也有高校进行了图像工程课程群建设,⑥基于图像分析与计算机视觉应用课程结合的项目协同创新能力培养实践。⑦
在分析上述国内外高校该类课程改革的基础上,我们重点以模式分析与视觉处理课程群的实践教学体系改革为切入点,优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
2 模式分析与视觉处理课程群特点
模式分析与视觉处理课程群涵盖了模式识别、机器学习、数据挖掘、数字图像处理、计算机视觉等多门课程。该类课程存在以下特点。
(1)该类课程属于多学科交叉,涉及的知识面既广又深。由于该方向涉及计算机科学与技术、应用数学、自动化、电子科学与技术、信息工程等多学科内容,而学生在大学本科阶段很难学习和了解如此多的知识模块,这对研究生阶段学习来说,具有相当大的挑战。同时,对于每个知识模块,所要求的数学基础较高,理论具有相当的深度,理解和掌握不容易。
(2)该类课程既重视扎实的基础理论,也强调良好的工程实践能力。该类课程的基础理论教学一直受到各高校的重视。随着近年来产业界的迅猛发展,计算机视觉应用层出不穷,对学生的工程实践也提出了更高要求,需要能够在系统层次上有整体认知,同时要能对各功能模块进行优化,提升系统的整体性能。
(3)该类课程所面向的选修学生面广。该类课程既是多学科交叉,也面向计算机应用、电子科学与技术、自动化、应用数学等不同研究方向、不同水平层次的研究生开设。这对课堂教学和实验实践也带来更大挑战。
3 模式分析与视觉处理课程群改革举措
针对上述分析的课程群特点,我们重点以实践体系改革为突破口,通过优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式等举措,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。
3.1 师资队伍结构优化
为了学生能够适应模式分析与视觉处理产业的快速发展,在课程群建设过程中更强调学生的工程实践和创新能力培养。这首先对师资队伍结构提出了新的要求。
近年来,课程教学团队引进海内外具有深厚理论功底和较强工程能力的高水平师资4名,大大充实了机器学习、数据挖掘、图像处理等课程的教学力量。对于现有教师队伍,鼓励教师跟产业一线企业广泛合作,目前已与华为、中兴等企业在视频检索、智能交通视觉处理等方面开展了实质合作。这些来源于产业界的高质量课题对科研和教学起到了良好的促进作用。
与此同时,通过研究生工作站、企业短期实习等渠道,鼓励企业高级研发人员参与到学生实践能力培养环节中,将实际项目进行适当切分或提炼,实现该类课程实践环节的模块化、专题化训练。
综上,通过引培并举,优化校内师资队伍结构;通过校企合作,积极吸引企业师资参与。良好的师资队伍为该类课程的实践体系改革提供了有力支撑。
3.2 课程群知识体系梳理与授课模式改革
模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程既有一定的逻辑关系,也存在相互交叉的混杂关系。一般认为,模式识别、机器学习是模式分析与视觉处理领域的基础理论课程,数据挖掘是建立在模式识别、机器学习和数据库基础上的应用类课程,智能信息检索则是数据挖掘基础上更为具体的应用实现。数字图像处理为计算机视觉课程提供了基础支撑,计算机视觉则是在综合利用模式识别、机器学习、数字图像处理、数据挖掘等知识模块基础上面向应用的系统实现。但是,这些课程也存在着知识点的交叉或重复。例如,模式识别和机器学习中都有贝叶斯参数估计、支持向量机模型等知识点,但视角和侧重点有所不同;图像处理、计算机视觉中都有颜色模型、成像模型等知识点,也同时存在与模式识别、机器学习交叉的知识点。
我们针对来自不同研究领域的学生群体,对该课程群的知识点进行系统梳理,既避免知识点的重复讲授,也防止重要知识点的缺漏。课程教师集体讨论,形成每门课程的核心知识集,和针对不同研究领域的选讲知识集。学生在学习课程时,在掌握核心知识集的基础上,结合自己的研究方向选择相关的选讲知识集学习。
在课程教材和参考书的选择上,注重挑选国际上有影响力的教材。例如,模式识别的参考书为Richard O. Duda等人编著的Pattern Classification;机器学习的参考书为Tom M. Mitchell编著的Machine Learning和Christopher M. Bishop编著的Pattern Recognition and Machine Learning;数据挖掘的参考书为Jiawei Han等人编著的Data Mining:Concepts and Techniques;数字图像处理的参考书为K. R. Castleman编著的Digital Image Processing;计算机视觉的参考书为D. A. Foryth编著的Computer Vision: A Modern Approach和Richard Szeliski编著的Computer Vision: Alogrithms and Applications。这些教材已被国内外著名大学普遍采用。同时,每门课程都提供相关的国内外顶级会议和期刊的列表,供学生课后追踪研究领域的热点问题。
在课堂授课环节上,注意采用灵活多样的授课方式。对于核心基础知识模块,以教师讲授为主,同时提供国内外该类课程的热门MOOC网址给学生参考。对于选讲知识模块,鼓励学生事先结合各自研究方向有目的自学,在学生报告的基础上进行课堂讨论方式进行。充分发挥学生学习的主体作用,也便于教师了解学生的水平和学习状况。
除此以外,不定期邀请国内外著名学者来校做学术报告,让学生充分了解该研究领域的最新前沿动态,并就热点问题进行专题讨论。
3.3 课程群实践体系完善与考核方式改革
工程实践和创新能力的培养是该课程群改革的重要目标。我们在上述师资队伍结构优化、课程群知识体系梳理与授课模式改革的基础上,着力进行课程群实践体系的改革与完善。我们通过多层次菜单式的实验项目选择、项目牵引的创新能力训练、学生综合研究能力的全面考查等方面来实现。
首先,整合和优化课程群实践内容,实现多层次菜单式灵活选择。根据各研究领域的要求进行灵活搭配,根据学生个体的能力与水平选择适当规模和难度的实践内容,通过课程内的基础实验、课程间的综合实验、课程群的创新实验来选择和组合,如图1所示。
图1 多层次菜单式实验内容示意图
基础型实验内容主要是各课程核心知识点的实验验证,主要包括模式识别,机器学习,数据挖掘,图像处理与分析,计算机视觉等课程的实验。要求选课学生对这些基础实验必做,打下良好的研究基础。
综合探索型实验在基础型实验基础上,既有单门课程内总的综合实验,也有课程间知识的综合应用。主要分为两大块,包括模式分析与机器学习方向的综合实验,以及图像处理与机器视觉方向的综合实验。实验目的主要是针对这两大块方向重点知识的综合分析和比较,能够熟练掌握和灵活应用。例如模式分析、机器学习、数据挖掘等方向都用到的线性判别分析、支持向量机、均值聚类等内容;图像处理与机器视觉中的图像特征抽取、视觉系统选型、目标检测、特定平台的算法优化等内容。学生可根据各自研究方向有目的的选择两块综合实验的大部分内容。
在综合型实验基础上,该课程群通过若干创新型实验来检验学生理论知识掌握程度和实践方法应用能力,为后续的研究课题开展打下良好的科研素养。主要内容包括人脸识别、二维条码识别、车辆属性识别、智能视觉监控、以及企业来源的关键技术等。这些项目实践既涉及用到图像处理与机器视觉的内容,也涉及模式分析与机器学习方向的知识。并且需要学生在综合运用相关知识的基础上有创新能力。
其次,重视各类项目牵引的创新能力训练。一方面,鼓励教师从国家自然科学基金、企业合作项目等研究中提炼出问题规模和难度适中的训练项目,作为课程群的综合能力训练项目。另一方面,鼓励学生参加挑战杯、全国研究生智慧城市技术与创意设计大赛等各类具有挑战性的竞赛项目,以赛代练,提升学生的工程实践和创新能力。同时,也鼓励学生利用百度、微软等相关研究领域的企业实习机会,参与产品一线的工程实践能力训练。
再次,注重考核环节,实现科研素养和实践能力的全面考查。只有严格、公平、公正的考核,才能保证实验实践的质量和水平,才能提升学生的科研素养和实践能力。我们主要在手段、方式方法上进行了改进。在题目选择上,根据学生个体水平和研究领域要求的差异,在选题上有适当的难易区分度,让每位学生都有锻炼和提升的机会;在考核方式上,采用结题书面报告来检验学术论文的写作能力,采用程序演示检验系统的设计与实现水平,采用上台汇报的方式检验学生的表达能力,多管齐下全面检查学生的综合科研素养;在考核成绩评定上,采用现场教师和学生共同评分的方式,公平合理;最后,通过网站展示、发表学术小论文、专利、软件著作权等方式展示和公开优秀成果,激发学生的学习热情,并由此形成积累,有利于学生实验实践氛围的传承。
4 结语
本文在分析国内外高校模式分析与视觉处理类课程群改革现状的基础上,以学生国际化视野、理论联系实际、工程实践和创新能力全面提升为目标,重点开展了师资队伍结构优化、课程群知识体系梳理、课程授课模式改革、课程群实践体系完善和实践考核模式改革等工作,取得了良好的效果,并为校内其他课程群的教学改革作为示范推广。
注释
① https:///learn/machine-learning/
② 郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践.理工高教研究,2010.29(5):98-100,148.
③ 史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践.计算机教育,2013.9:40-43.
④ 陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式.当代教育理论与实践,2013.5(7):112-114.
⑤ 王岳环,桑农,高常鑫.计算机视觉课程的国际化教学模式.计算机教育,2014.19:101-103.
计算机视觉研究的目的范文4
关键词:计算机视觉;智能交通;监控系统
中图分类号:TP277
近些年来,随着我国人民生活水平提高,使私家车辆的数目急剧增长,并且车辆的增长速度远远超出市政建设的力度。这样的事实导致城市交通拥堵、违规通车、车祸增加,所以迫切的要求加快市政建设,实施高效率的交通监控措施,基于计算机视觉的智能交通监控系统也由此得到了相应的广泛的发展和应用。那么,计算机视觉技术下的智能交通监管系统究竟应该如何设计与实现呢?
1 计算机视觉下的智能交通监控系统
1.1 计算机视觉技术
计算机视觉技术即利用各种图像摄录设备将通过对视觉目标进行识别、跟踪、测量并将由此获取的视觉信息传输至计算机并进而利用图像技术进行视觉信息处理以达到进一步进行智能化处理的视觉处理技术。
1.2 智能交通系统(ITS)
智能交通系统(ITS)是指通过现代化的网络信息技术、自动控制技术等有效综合手段在一定范围内建立的全方位发挥作用的交通运输综合管理和控制系统。作为交通运输管理体系的一场新的革命,近年来,由此技术进一步开发形成的监控系统已经在各个道路的关键路口、路段和其他交通繁忙地域普遍建立,为交通运输管理提供了自动化、智能化的信息收集和处理等多方面的服务。但是,随着城市建设的迅猛发展和人流、车流量的猛增,更加智能化的交通管理系统的开发和利用显然也成为了当务之急。
2 计算机视觉下的智能交通监管系统的建立
正是基于新的发展需要,我们有必要把计算机视觉和智能交通监控系统进一步结合起来,首先通过计算机视觉分别对各个道路的关键路口、路段和其他交通繁忙地域等相应位置实时进行交通信息采集,然后,通过信息传输系统、或者进行处理后存入服务器并将处理过的实时交通信息及时传输到监控指挥系统,以实现对于各个道路的关键路口、路段和其他交通繁忙地域的实时监控和管理。由此,显然就需要设计以下各个子系统并共同构建为一个完整的体系。
计算机视觉下的智能交通监管系统
实时交通信息收集系统
监控指挥系统
高质量信息存储传输系统
图1 计算机视觉下的智能交通监管系统工作程序示意图
3 智能交通监控系统的实现
计算机视觉下的智能交通监管系统实现的第一步是通过实时交通信息收集系统实时进行交通信息采集,即通过对于运动物体的分割,在图像找出有意义的部分,抽出运动目标的特征,进而通过连续画面间的变化判断目标的运动状况。在这一系统运行中,首先可以“摄像头读入”的初始视频,使用相应的算法提取“背景”,然后通过原图与背景运算形成相应的“前景”,由此即可进一步通过矩形框的使用来达到“运动目标检测”与信息采录的目的。
图2 视觉监控系统原理图
3.1 系统功能实现
对运动物体的检测主要有光流法以及差分法两种方法,由于光流法比较复杂和耗时,实时检测很难实现,因而,现有实时交通信息收集系统一般通过差分法的应用来进行开发和实现。
3.1.1 帧间差分法
帧间差分法对运动目标进行分割处理过程中使用较多也最为简单实用的一种方法,其基本原理就是通过在连续的图像序列中两个或三个相邻帧间采用基于像素的帧间差分并且阈值化来提取图像的运动区域,进而通过逐象素比较获取前后两帧图像之间的差别来判断运动物体的移动状况。在实际操作中,一般可以假设用于获取序列图像的视频设备为静止物体,设视频中连续两帧的图像为It(x,y)和It+1(x,y),然后通过对连续两帧的图像相应的像素进行比较,利用Dt(x,y)=It+1 (x,y)-It(x,y)这一方程求出相应的阈值来检测出运动物体的移动状况:
Mt(x,y)=
当然,必须注意的是,由于帧间差分法所得到的差分图像在现实中并非由理想封闭的轮廓区域组成的,因而,运动目标的轮廓自然也就往往是局部的、不连续的,且其误差往往随着运动物体速度的增大而增大,因而,这一方法并不适于对于高速运动目标的有效检测。
3.1.2 背景差分法
与帧间差分法不同,背景差分法则是利用当前图像与背景图像的差分来检测物体运动状况一种方法。其基本原理是在可控制环境下,通过对于运动背景的固定假设,设待检测运动物体的图像为I(x,y),背景图像为B(x,y),通过输入图像与背景模型进行比较,利用D(x,y)=I(x,y)-B(x,y)这一方程求得到图像中的各像素的变化信息,进而检测运动物体的移动状况:
Mt(x,y)=
当然,在实际运用中,背景差分法的关键,是要建立一个背景模型,并更新模型。
3.2 程序功能的实现
本程序功能实现所主要使用的是OpenCV函数。OpenCV能够实现对图像数据的操作,包括分配、释放、复制、设置和转换数据,以及对摄像头的定标、对运动的分析等。在函数实现上,用到了Cv图像处理的连接部件函数,运动分析与对象跟踪中的背景统计量的累积相关函数等相关的函数。本系统就是运用图3介绍使用到的函数名及其功能和使用格式等来实现对视频流的运动车辆的轮廓检测的。
图3 寻找轮廓程序主要算法流程
实验证明,本系统能够较好地实现对视频流的运动目标的轮廓检测和对象跟踪,并能实时更新背景,车辆跟踪正确率在95%以上,虽然存在着轮廓检测正确率稍差的缺点,但其主要原因是由于摄像头所处的角度和运动目标靠近程度的影响,从根本上并不影响对于运动目标的实际检测。
4 结束语
加快城镇化进程是我国发展的大趋势,在这一趋势下,城市病的治理当然可以离不开现代化的科学技术。但是,必须注意的是,无论多么先进的管理系统,最终都只有通过人的行为才能够发挥有效的作用,在这个意义上,设计与使用先进的交通监控系统固然是解决交通问题的技术条件,但是,交通问题的解决,最终还必须依赖于人的素质的全面提高。
参考文献:
[1]戴俊乔.城市道路交通视频监控系统架构和性能的研究[J].科技与创新,2014(06).
[2]张伟龙,李刚,王雨翔.基于计算机视觉的智能交通监控系统[J].小型微型计算机系统,2014(07).
[3]庞其富.浅谈城市轨道交通视频监控系统设计方案[J].通讯世界,2014(01).
计算机视觉研究的目的范文5
电力系统是我国国名经济的基石。电力系统是由发电、变电、输电、配电和用电等环节组成的电能生产与消费系统。现代社会需要的是安全可靠经济的电能。电力系统主要由发电输电变电配电及用电等5部分组成。电力系统是一个具有复杂的大系统由于用户的不断增加的需求,电网对于技术的要求水平也提出了越来越高的要求。
1 电力系统自动化的发展趋势总的发展趋势的特点研究
1.1 电力系统自动化的图形化特点
因为电力系统联网工程的正式启动,电力系统的调度管理、数据计算分析呈现出传输路径的交叉性,信息更新越来越高速这样的几种特点。在计算机技术和通信技术的快速发展下,电力系统技术整合也在蓬勃发展着。电力系统信息数据处理上已经不再使用传统的处理方式,而是使用图形化处理这样的新技术,这样看到图形,电力系统管理者就能了解电力系统的变化发展趋势,也就能对未来电力系统软件开发带来丝丝先机。
1.2 电力系统自动化的远程化特点
过去电力系统的硬件平台大部分是计算机,外加使用扩展测控法对接口电路工作开展监测。此类的设计有很多的优势,这种类型的设计的周期很长,扩展性也很好。但是这样的设计方式也具有着高成本、大体积、大功耗以及灵动性差的多种缺点。现在,正是有着网络技术的不断更新和电子技术的不断进步,远动终端设备已经变为越来越接近最优化、智能化和小型化、协调化。因此,建立在此基础之上的电力系统也具备了远程化的特点,使电力系统自动化在控制系统方面的发展更加贴近智能化。
1.3 电力系统自动化的分布化特点
发电率范围在几十兆瓦至几千瓦之间并且模型较小的发电单元,它的地点处于用户周围还有有高效和可靠特点的称为电力系统自动化技术分布化。分布式发电主要包括以液体或气体为燃料的内燃机、太阳能发电、微型燃气轮机和风力发电等等的其他一些发电方式。这种发电技术具有很好的灵活性,能够给与用户各不相同的感受。还能为边远商业区域提供可靠的电力资源,让他们使用具有再生特点的资源进行多次发电,这样的电能还具有稳定度高的特点,是具有分度化的特色。极端及技术、新材料技术和电力电子技术都要作为支柱技术被在其中使用。
2 电力系统与新技术的结合
2.1 与智能计算机的结合
计算机视觉技术就是与智能计算机的结合之一。使用计算机视觉技术能够方便的获得多种图像信息。在电力系统中应用计算机视觉技术。目前,计算/!/机视觉技术使用在电力系统中的作用是修改遥控系统在此同时提高它的性能。这主要表现在使用在线监测和开展无人操作或者环境监视,红外图像监测是电力设备在线监测常用方法中效果最好的。它既有这使用方便,又有着精准度较高的特点。红外图像识别方面主要就是使用计算机视觉技术,这样能取得较好的效果。计算机视觉技术的工作原理是在科学获取电力设备实时红外图像和电力设备正常工作时图像后,将两者开展对比。如果出现不正常。也就因此能够证明电力设备出现问题。第开展无人操作或者环境监视是使用微波双鉴探测器进行协助,将差分图像以及流光法一起使用对移动物体开展监测。如果出现不正常现象,那么系统就可以识别出来,并且警告我们。因为计算机视觉技术还处于起步阶段,其存在一定的不足之处。虽然计算机视觉技术发展迅速,但计算机视觉技术发展的并不完善,因为图像识别自身的复杂性的原因,所以现阶段还不能实现完全的无人操作。正是因为有着这些原因,在大多数情况下,计算机视觉技术只能够作为一种辅助技术。
2.2 与微机保护系统的结合
在电力系统自动化技术发展速度过快并且伴随着相关微机设备应用范围越来越普遍的情况下。人们越来越严格的要求微机保护系统。更简单的说,也就是原有的电力系统自动化技术当中的微机保护系统已经无法满足社会发展的需要。人们需要的微机保护系统应该具备更加牢靠与稳定的可以对通信进行保护的能力。这样才能够达到人们希望人机互动的效果。这样的系统在对硬件提高出高要求的同时也对软件业产生了更加具体的要求。例如,我国在上世纪末将第一套微机线路保护设备投入使用,并且该设备因为性能占据极大的优势从而获得世界各国用户的普遍认可。
在继电保护设备中,我们更加需要完善的问题就是设备的实时性。设备的实时性直接关乎电网的安全稳定,它直接受到其影响。假如设备实时性出现缺陷,会给电力系统带来难以补救损失的可能性。现阶段在我国电力系统中应用的嵌入式系统通常来说主要为C/C++语言。这是因为该系统不仅灵活性高并且可移植性也很强。同时该系统还使用了能够随时改变的模块化,目的在于处理好各种存在可能性会产生的问题但是却又不能够进行更换的难题。在提供便利的同时也能够尽最大的努力满足用户各种要求。
计算机视觉研究的目的范文6
关键词:工业电视 智能视频监控 煤矿
中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2012)01-0026-02
Abstract: Traditional industrial TV monitoring perform poor accuracy of the alarm, intelligent video surveillance remedy these deficiencies from a large extent. In this paper, we analyzed intelligent video surveillance technology. For special coal mine safe production environment, using intelligent video surveillance technology in the production of Coal Mine Safety Monitoring System for intelligent video linkage has been proposed. The system is able to raise the alarm in a large extent, the accuracy for the coal mine production safety to provide more reliable protection.
Keywords: industrial TV intelligent video surveillance Coal Mine
1、背景
煤矿工业电视监控系统主要用于煤矿安全生产重要环节、场所和部门的电视监控,可以将各个监控点的图像采集后传输到中心监控室并实时显示在监视器上。通过本系统,地面监控人员能直观的监视和记录井下工作现场的安全生产情况,及时发现各监控点的违章作业情况,防患以未然,为煤矿的安全生产保驾护航。
2、智能视频监控技术
智能视频监控是将计算机视觉技术引入到视频监控中而产生的,目前,智能视频监控已经成为计算机视觉中一个重要的研究领域,图1给出了智能视频监控系统的一般流程,从监控摄像头开始,包括运动对象提取、对象描述、对象跟踪、对象识别和对象的行为分析,最后进行预警或报警。
智能视频监控技术主要包括对视频图像序列自动地进行运动对象的提取、描述、跟踪、识别和行为分析等方面的内容。如果把摄像机看作人的眼睛,而智能视频系统或设备则可以看作人的大脑。智能视频监控技术就是借助计算机强大的数据处理功能,对视频画面中的海量数据进行高速分析,过滤掉监控者不关心的信息,仅仅为监控者提供有用的关键信息。智能视频监控以数字化、网络化视频监控为基础,但又有别于一般的网络化视频监控,它是一种更高端的视频监控应用。智能视频监控系统能够识别不同的物体,发现监控画面中的异常情况,并能够以最快和最佳的方式发出警报和提供有用信息,从而能够更加有效的协助安全人员处理危机,并最大限度的降低误报和漏报现象。其最终目的就是要使计算机能够分析、描述和理解视频画面中的内容。智能视频监控涉及到计算机视觉、图像视频处理和人工智能领域中的众多核心技术,是一个非常具有挑战性的困难问题。
3、系统构成
煤矿安全生产智能视频联动监控系统是一个基于行为判别技术应用和视频系统应用集成技术的先进的煤矿管理系统,能够把现在煤矿各个相对独立的前端摄像头整合为一个具有统一管理的摄像头传感器系统。实时获取煤矿安全相关数据,通过视频分析功能智能的转向事件发生地;强大的联动功能,智能视频分析与辅助决策能力,能够有效遏制重大事故的发生;操作简单,界面友好,让决策者能够尽快根据事件现场环境快速进行决策指挥,工作环境更加健康;可以有效提高煤矿生产与安全管理效率。
4、视频监控信号采集与显示系统
4.1 井下监控与传输
井下摄像头采用经过国家本安认证的矿用防爆光纤摄像机,并适应井下的低照度的光学条件。同时要采用无火花的阻燃光纤传输技术,保证系统在井底的安全运行。
4.2 地面监控部分
地面监控部分由于每个监控点监控范围较大而且需要日夜监控功能,所以采用带云台且适应低照度情况的进口全方位一体化摄像机,为保证煤矿恶劣条件下的可靠性与售后服务便利性,地面均采用同轴电缆接入调度室和绞车房。
4.3 控制室部分
控制室部分包括:10路高清晰大屏幕彩色监控墙;电视墙中间为大屏幕液晶显示器,即可做监视屏也可以显示电脑数据和信息;视频矩阵;视频分配器;视频光端机;视频服务器;控制台等;LED电子显示屏等。
绞车房室部分包括:2路高清晰彩色监视器(19英寸);
控制系统包括图像处理系统、视频切换矩阵、主控制计算机等。主控计算机通过控制软件,将连接在此网络中指定IP计算机画面传送到主控计算机。图像处理系统采用WINDOWS 操作平台及窗口式跨物理界面处理技术,可显示多窗口计算机信号及视频信号,并可接入局域网络及国际互联网。图像控制系统可构成"虚屏",实现2×1跨屏操作,电脑图文与视频图象可任意开窗显示,窗口大小和位置任意,可跨屏显示多路网络信号或视频信号,监控信号中任何一路视频及所有计算机显示窗口可在大屏幕上任意放大、缩小、拖动、叠加显示。
5、结语
在煤矿上建立智能视频联动监控系统能够解决传统工业电视监控系统因为一些固有因素的限制而带来的许多问题,缩短突发事件响应时间,提高报警系统的精确度,为煤矿企业的安全生产提供保障。
参考文献
[1]马颂德,张正友.计算机视觉.北京科学出版社,1998.
[2]方帅.计算机智能视频监控系统关键技术研究.沈阳:东北大学,2005.
[3]Collins R., et al. A System for video surveillance and monitoring:VSAM final report. Carnegie Mellon University:Technical Report CMU,2000.