计算机视觉理论范例6篇

前言:中文期刊网精心挑选了计算机视觉理论范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

计算机视觉理论

计算机视觉理论范文1

关键词:水利部门 预算管理 解决措施

水利是国民经济的大动脉,其发展如何直接影响国民经济的发展前景,而水利部门预算管理更是影响水利事业单位投资的合理性和高效性、是否符合民生经济的发展要求,因此本文从水利部门预算管理存在的问题及解决措施展开讨论。

一、水利部门预算管理的重要性

凡事预则立,不预则废。预算是水利事业财务工作中的不可或缺的关键,通过资源整合确立资源分配的合理性,针对水利事业实际需要做出详尽的计划,给高层管理者的各种决策提供强而有力的支持。鉴于水利单位即可以是公益化的事业单位,又可以是经营性企业的特殊性,为了避免产权不清,事权不楚的局面,在财务管理中水利部门预算管理工作就显得尤为重要;另外,近年来水利事业发展如破竹之势,投入的资金也逐年增长,因此对水利部门预算管理工作也提出了更高的要求,确保预算的准确性和合理性,促进水利事业在新环境下稳定发展。

我国于2015年1月1日正式实施新的《中华人民共和国预算法》,由此可以看出,国内对预算法的重视程度,在新法的实施过程中,水利单位要根据新《预算法》的规定来完善水利部门预算管理模式。

二、水利部门预算管理存在的问题

(一)水利部门预算管理体系缺乏科学性

在实际的工作中,水利部门做预算时绝大部分是根据上半年的财务数据为基础来制定本年度的预算统计,并没有结合近期的实际情况作为参考。同时,在编制水利部门预算中各部门之间的配合度不够,部门之间缺乏沟通导致部门目标和水利单位的整体目标无法有效的结合起来,因此不能科学、合理的规划整个水利单位的资金分配问题。同时,编制过程中仅重视预算表中的数字,却从不在乎数字的来源和类别,预算明细不详尽,支出情况含糊不清,一旦单位发生不常见的支出事项,抑或是新增什么项目,常常会使水利单位陷入内部资金短缺的窘境。

(二)水利部门预算管理缺乏执行力度

水利单位往往忽视预算在执行管理中的监督管理问题,误以为年度预算已经做好,资金问题就万事大吉。殊不知,编制预算仅仅是一个开始,后续还要对资金的分配和使用、支出明细等费用做合理审批和分析,及时分析和调整预算中不合理的部分。同时,水利单位对资金使用效果的跟踪调查做的也不够细致,“重分配,轻审查”的情况严重。水利部门预算管理工作缺乏有效的激励惩罚体系导致无法有效的对预算进行控制和监督,久而久之,资金占有、挪用情况时有发生,预算执行力度缺失导致水利单位无法有效的调整预算,无法准确调整、分析预算中计划与实际产生的差距,长期以往,单位内部的成本很难得到控制。

(三)预算管理与部门之间缺乏联系

水利部门预算管理是联系水利各部门工作职责和服务社会的载体,水利单位通过预算管理可以实现以水利单位各个部门的工作职责服务社会的终极目标,所以说,各个部门的工作职责很重要。但在实际中,预算管理工作缺乏各部门之间的配合,各部门之间工作职责很难归结在一起为社会服务,特别是部门目标和单位目标都达不到统一,在制定预算工作中没有必要的沟通和利益衔接。水利部门预算管理的工作人员只是注重本年度的预算是否超出既定指标,反而不清楚自身的职责是全水利单位的整体预算目标,缺乏预算战略目标的基础,甚至有人不理解什么战略目标,纸上谈兵的预算管理仅仅注重短期的目标是否得以实现,长期的企业目标却无人问津,导致短期目标与长期目标脱节,难以达到预算的真实目的。

(四)水利部门预算的绩效考评效果不明显

绩效考评的结果还需要灵活的结合水利部门预算管理的实践,合理有效的运用到预算编制中去,才可以实现水利部门预算管理的良性循环。预算管理工作的绩效考评体系不完善、考核方式不规范、制定的评价指标不合乎情理直接削减了各部门之间管理人员对预算工作的积极性,极大影响了水利部门预算管理工作的效率。如果水利单位仅仅将绩效考评作为相关结果作档案资料而不对预算中支出资金做任何深思熟虑的判断,对绩效考评的结果难以产生实行性的束缚力,直接影响水利部门预算的准确性和成效。

三、水利部门预算管理存在问题的解决措施

(一)增强水利部门预算管理的科学性

预算管理要充分听取各个水利部门的意见,广泛的收集预算资料,充分调研、合理预算,并在水利的实际工作中通过不断完善、及时修改,使水利部门预算更加符合实情,确保预算准确性。同时,在预算管理工作中,水利单位要根据上年度的预算计划,综合分析预算的执行情况,充分掌握水利单位当年的业务活动和财政收支情况,分析去年预算工作中的失误点,结合实际情况来合理编制本年度的预算工作。从水利单位的长期目标来说,一定要以战略目标为预算管理的根本目标。换句话说,水利部门预算管理要针对水利建设的内部和外部两部分环境进行系统的科学分析、合理的严谨论证制定出符合经济市场的水利发展战略目标。

(二)增强水利预算管理的监管力度

预算管理的工作同样要注重执行和管理的监管力度。所以,水利单位的当务之急就是要建立完善的水利部门预算管理监管体系,不断修订水利部门预算管理的规章制度,建立完善的预算效果奖惩制度,遵循科学的预算管理流程。对水利单位的资金使用严格把关,对使用效益合理评价,重点监管水利部门预算的执行力,严格按照预算的计划来分配资金,同时,预算中什么地方该花、什么地方不该花、什么地方可以少花、什么地方必须多花等问题,要做到心中有数,预算还要有所体现。严格把关各项费用的支出情况,保证单位内的各项开支,坚决杜绝挥霍浪费情况发生,对资金的使用实行全方位的多人监管保证。一句话总结,水利部门预算管理必须建立在一个公平公正、管理公开透明、多人监督管理的分位,在执行预算中,充分发挥水利资金的使用效率。

(三)加强各部门之间全面预算管理的工作

首先,要提高水利单位加强预算管理的认知度,使各个部门的负责人高度重视预算工作的编制。单位上下必须全员参与,从人员、组织、技术上予以大力的支持,全面开展水利部门预算管理的工作来提升水利单位经营管理能力和竞争力,以水利部门预算管理做为提高单位自身效益的长期任务。然后,水利单位要成立财务部门内部独立的预算管理机构,组织水利单位内部各个部门的技术人员全员参与。最后,通过水利单位各个部门的通力合作,达到全员都能积极主动的参与预算在编制、执行、监督管理和反馈的全部过程,严格按照预算计划来分配水利单位资金的分配,避免单位内部无正当理由随意更改资金用途的情况发生,以此来保障水利单位资金配置的合理性、有效性和安全性。

(四)完善水利部门预算的绩效考评体系

根据2015年1月1日的《预算法》规定,各级预算应当遵循统筹兼顾、勤俭节约、量力而行、讲求绩效和收支平衡。讲求绩效就是通过绩效考核机制充分调动起员工对预算的工作热忱和积极性。绩效考评体系是水利单位检验员工预算工作完成情况的考核程序。首先,要建立完整完善的绩效考评制度,考评制度一定秉着公平、公正、公开的透明原则;水利单位要制定科学合理的绩效考评程序,并建立相应的奖惩措施,对于工作中做得出色的员工予以奖励以资鼓励,对于工作中犯过重大过错的也要接受相应的处分;最后还要根据水利建设不同项目的不同特征,制定不同的奖励对象和奖励时机,选择最优的奖励组合方式来鼓舞员工的士气,从而,顺利推进水利部门预算管理工作,实现水利单位的预算管理目标和战略目标。

虽然实施的新《预算法》已经非常完善,但是水利企业再实际工作中的预算管理仍然问题重重,本文对此进行分析和探究,也对目前水利部门对应的《预算法》有了更全面的认识:当前不仅需要科学完善的预算管理体系,还要建立科学合理的绩效指标来推动国内水利部门预算管理工作的有效性。总体而言,水利部门预算管理的工作还需继续完善,解决问题的方法也有很多,希望本文能抛砖引玉,获取各位专业学者对此领域的关注度来探讨有关解决水利部门预算管理问题的最优方案。

参考文献:

[1]周珊辉.预算管理在政府财政中的重要性[J].财经界(学术版),2012(11):10

计算机视觉理论范文2

关键词:数字摄影测量 计算机视觉 多目立体视觉 影像匹配

引言

摄影测量学是一门古老的学科,若从1839年摄影术的发明算起,摄影测量学已有170多年的历史,而被普遍认为摄影测量学真正起点的是1851―1859年“交会摄影测量”的提出。在这漫长的发展过程中,摄影测量学经历了模拟法、解析法和数字化三个阶段。模拟摄影测量和解析摄影测量分别是以立体摄影测量的发明和计算机的发明为标志,因此很大程度上,计算机的发展决定了摄影测量学的发展。在解析摄影测量中,计算机用于大规模的空中三角测量、区域网平差、数字测图,还用于计算共线方程,在解析测图仪中起着控制相片盘的实时运动,交会空间点位的作用。而出现在数字摄影测量阶段的数字摄影测量工作站(digital photogrammetry workstation,DPW)就是一台计算机+各种功能的摄影测量软件。如果说从模拟摄影测量到解析摄影测量的发展是一次技术的进步,那么从解析摄影测量到数字摄影测量的发展则是一场技术的革命。数字摄影测量与模拟、解析摄影测量的最大区别在于:它处理的是数字影像而不再是模拟相片,更为重要的是它开始并将不断深入地利用计算机替代作业员的眼睛。[1-2]毫无疑问,摄影测量进入数字摄影测量时代已经与计算机视觉紧密联系在一起了[2]。

计算机视觉是一个相对年轻而又发展迅速的领域。其目标是使计算机具有通过二维图像认知三维环境信息的能力,这种能力将不仅使机器能感知三维环境中物体的几何信息,包括它的形状、位置、姿态、运动等,而且能对它们进行描述、存储、识别与理解[3]。数字摄影测量具有类似的目标,也面临着相同的基本问题。数字摄影测量学涉及多个学科,如图像处理、模式识别以及计算机图形学等。由于它与计算机视觉的联系十分紧密,有些专家将其看做是计算机视觉的分支。

数字摄影测量的发展已经借鉴了许多计算机视觉的研究成果[4]。数字摄影测量发展导致了实时摄影测量的出现,所谓实时摄影测量是指利用多台CCD数字摄影机对目标进行影像获取,并直接输入计算机系统中,在实时软件的帮助下,立刻获得和提取需要的信息,并用来控制对目标的操作[1]。在立体观测的过程中,其主要利用计算机视觉方法实现计算机代替人眼。随着数码相机技术的发展和应用,数字近景摄影测量已经成为必然趋势。近景摄影测量是利用近距离摄影取得的影像信息,研究物体大小形状和时空位置的一门新技术,它是一种基于数字信息和数字影像技术的数据获取手段。量测型的计算机视觉与数字近景摄影测量的学科交叉将会在计算机视觉中形成一个新的分支――摄影测量的计算机视觉,但是它不应仅仅局限于地学信息[2]。

1. 计算机视觉与数字摄影测量的差异

1.1 目的不同导致二者的坐标系和基本公式不同

摄影测量的基本任务是严格建立相片获取瞬间所存在的像点与对应物点之间的几何关系,最终实现利用摄影片上的影像信息测制各种比例尺地形图,建立地形数据库,为各种地理信息系统建立或更新提供基础数据。因此,它是在测绘领域内发展起来的一门学科。

而计算机视觉领域的突出特点是其多样性与不完善性。计算机视觉的主要任务是通过对采集的图片或视频进行处理以获得相应场景的三维信息,因此直到计算机的性能提高到足以处理大规模数据时它才得到正式的关注和发展,而这些发展往往起源于其他不同领域的需要。比如在一些不适合于人工作业的危险工作环境或人工视觉难以满足要求的场合,常用计算机来替代人工视觉。

由于摄影测量是测绘地形图的重要手段之一,为了测绘某一地区而摄影的所有影像,必须建立统一的坐标系。而计算机视觉是研究怎样用计算机模拟人的眼睛,因此它是以眼睛(摄影机中心)与光轴构成的坐标系为准。因此,摄影测量与计算机视觉目的不同,导致它们对物体与影像之间关系的描述也不同。

1.2 二者处理流程不同

2. 可用于数字摄影测量领域的计算机视觉理论――立体视觉

2.1 立体视觉

立体视觉是计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点之一,在20多年的发展过程中,逐渐形成了自己的方法和理论。立体视觉的基本原理是从两个(或多个)视点观察同一景物,以获取在不同视角下的感知图像,通过三角测量原理计算像像素间的位置偏差(即视差)来获取景物的三维信息,这一过程与人类视觉的立体感知过程是类似的。一个完整的立体视觉系统通常可分为图像获取、摄像机定标、特征提取、影像匹配、深度确定及内插等6个大部分[5]。其中影像匹配是立体视觉中最重要也是最困难的问题,也是计算机视觉和数字摄影测量的核心问题。

2.2 影像匹配

立体视觉的最终目的是为了恢复景物可视表面的完整信息。当空间三维场景被投影为二维图像时,同一景物在不同视点下的图像会有很大不同,而且场景中的诸多因素,如光照条件,景物几何形状和物理特性、噪声干扰和畸变以及摄像机特性等,都被综合成单一的图像中的灰度值。因此,要准确地对包含了如此之多不利因素的图像进行无歧义的匹配,显然是十分困难的。

在摄影测量中最基本的过程之一就是在两幅或者更多幅的重叠影像中识别并定位同名点,以产生立体影像。在模拟摄影测量和解析摄影测量中,同名点的识别是通过人工操作方式完成的;而在数字摄影测量中则利用计算机代替人工解决同名点识别的问题,即采用影像匹配的方法。

2.3 多目立体视觉

根据单张相片只能确定地面某个点的方向,不能确定地面点的三维空间位置,而有了立体像对则可构成与地面相似的立体模型,解求地面点的空间位置。双目立体视觉由不同位置的两台或者一台摄像机(CCD)经过移动或旋转拍摄同一幅场景,就像人有了两只眼睛,才能看三维立体景观一样,然后通过计算空间点在两幅图像中的视差,获得该点的三维坐标值。现在的数字摄影测量中的立体像对技术通常是在一条基线上进行的,但是由于采用计算机匹配替代人眼测定影像同名像对时存在大量的误匹配,使自动匹配的结果很不可靠。其存在的问题主要是,对存在特殊结构的景物,如平坦、缺乏纹理细节、周期性的重复特征等易产生假匹配;在摄像机基线距离增大时,遮挡严重,能重建的空间点减少。为了解决这些问题,降低双目匹配的难度,自1986年以来出现了三目立体视觉系统,即采用3个摄像机同时摄取空间景物,通过利用第三目图像提供的信息来消除匹配的歧义性[5]。采用“多目立体视觉技术”可以利用摄影测量的空中三角测量原理,对多度重叠点进行“多方向的前方交会”,既能较有效地解决随机的误匹配问题,同时又能增加交会角,提高高程测量的精度[2]。这项技术的应用,将很大程度地解决自动匹配结果的不可靠性,提高数字摄影测量系统的准确性。

计算机视觉理论范文3

关键词:图像处理 计算机视觉 立体视觉

在实际工程实践中,由于受现场条件和测试技术本身的限制,结构动位移的测试往往存在一定的困难和挑战,这也使动位移并未成为结构动力性能评估中一个常见的评估指标。结构动位移响应是直接反映结构在动力荷载作用下安全性和整体性的重要参考指标。随着工程结构或构件建造得越来越柔和复杂结构模型试验研究的发展,如大跨度桥梁、高层建筑、索结构等的现场测试以及结构振动台试验、风洞试验等,结构动位移的测试显得尤为重要。

计算机视觉是研究计算机模拟生物外显或宏观视觉功能的科学与技术,是一个发展十分迅速的研究领域,其研究手段涉及甚广,如图像处理、机器视觉、医学图像分析、模式识别、计算机图形学、人工智能等。当计算机通过视觉传感器(比如相机或摄像机等)试图分析三维空间的物体时通常只能给出二维图像,通过计算机分析和处理图像信息,可以重构实物的三维几何信息,包括其形状、位置、姿态、运动等。因此,通过计算机视觉技术实现结构动位移的测量是可行的。上世纪八十年代中期以来,随着计算机软、硬件技术的不断发展,在土木工程领域,国内外很多学者尝试将计算机视觉技术用于结构的几何测试,包括结构的位移(静、动位移)、裂缝、表观外形等。Aw和Koo采用数码照相机来进行预设目标的坐标测量,经过基于计算机视觉理论的光束法优化后,其测试精度为2.24mm。Nieder?st和Maas利用数码摄像机来测试混凝土梁在脱水收缩过程中的变形情况,其在相机视场为80cm时测试精度可达0.03mm。相类似地将计算机视觉技术用于结构特性的测量例子还有很多,比如混凝土管片变形检测,梁破坏试验中的变形测量,远距离桥梁变形测量,轨道梁破损状况的检测等。相比于结构静态几何特性的测试,结构动态特性的测试应用相对不多。Olaszek利用摄像机来摄录桥梁的振动情况,并以计算机视觉技术进行结构动位移重构分析,得出的动位移测试精度为1mm左右。Yoshida等采用立体视觉技术来测试一块薄板的三维振动特性。

一、单相机标定

二、基于立体视觉的两相机立体标定

三、图像点跟踪

图像点跟踪是基于立体视觉的结构位移测试手段中的重要环节。在图像(或视频)分析过程中,点跟踪的精度会直接影响位移测试的最终结果。在实际测试中,本文采用两个黑方格组成的目标模板粘贴在所测结构的表面,方格尺寸均为30×30mm,两方格的交叉角点作为图像分析的跟踪点。

四、三维点重构

计算机视觉理论范文4

【关键词】计算机视觉 运动目标 跟踪算法

在计算机等现代科学技术尚未出现以前,人们在获取外界信息时往往主要依赖视觉,而在我国计算机技术水平不断发展提升的背景之下,计算机视觉技术的出现使得人类肉眼视觉得到了进一步的发展延伸,尤其是在各种传感器技术的帮助之下,使得人们能够对保持运动状态的目标进行实时跟踪,从而准确掌握目标的具体形态属性。在此背景之下,本文将运动目标设定为运动的人脸,通过探究基于计算机视觉的运动目标跟踪算法,希望能够为相关研究人员提供相关参考和帮助。

1 Kalman filter目标跟踪算法的简要概述

Kalman filter目标跟踪算法是当前众多跟踪算法当中使用范围较广、使用频率比较集中的一种跟踪算法,这一算法最早可以追溯至上个世纪六十年代,人们通过将滤波理论与状态空间模型相集合,从而得到的一种递推估计的算法也就是卡尔曼滤波理论。其通过利用上一时刻获取的预估值以及当下获取的实际观测值,在信号与噪声状态空间模型当中不断更新状态变量,进而顺利完成估计预测并获得当前时刻估计预测值。经过不断的发展,在计算机图像处理以及其他运动目标跟踪当中经常会使用Kalman filter算法。如果在k时刻系统下的状态向量用xk表示,那么在t0时刻下初始化的状态预测方程为;在tk时刻下更新系统状态的具体方程为

,其中Hk、Zk分别表示测量矩阵m×n维以及转移矩阵n×n维的状态向量。但在跟踪计算机视觉运动目标譬如说视频目标时,由于相邻的两帧视频图像本身时间间隔非常短,因此目标在这一时间内难以发生明显的运动状态变化,此时我们可以通过将此间隔时间设定为单位时间,同时目标在单位时间内一直保持匀速运动状态,这时我们可以得到一个状态转移矩阵且

,定义系统观测矩阵即为

,定义噪声Wk以及Vk协方差矩阵则可以分别用

和表示。

如果在滤波器在经过若干次卡尔曼滤波后仍然能够恢复至原始状态,则其具有较好的稳定性,但如果在进行运动目标跟踪实验的过程当中,对于处于运动状态的被跟踪目标,一旦出现遮挡行为则将在第一时间内暂停估计参数,并将这一参数估计值直接代入到状态方程当中,使得运动目标无论是否被遮挡均可以对其进行精确跟踪。

2 基于计算机视觉的运动目标跟踪算法

2.1 建立颜色概率模型

颜色囊括了诸多的信息量光柱点,尤其是在人类的视觉世界从本质上来说也是一种用过感知自然界色彩以及明暗变化的世界,因此人们可以通过使用三基色原理获得RGB颜色空间。考虑到颜色与计算机视觉场景当中各个场景和目标之间有着紧密的关系,同时不同于目标的大小、形态等其他视觉特征,颜色特征鲜少会受到包括观察视角等在内各因素的干扰影响,从某种角度上来说基于颜色特征的运动目标具有较好的稳定性。为了能够保障目标跟踪既稳定又迅速,需要选择合适的颜色特征,否则将极有可能导致出现跟踪失败。在这一环节当中人们通常使用的是RGB颜色空间以及HSI颜色空间,但由于二者均具有一定的局限性,因此本文在对人脸特征尤其是颜色特征进行选取时,选择了rgI颜色直方图的方法,在解决两N颜色空间自身缺陷的同时,尽量避免目标人脸运动位置以及尺寸等变化因素对目标追踪造成的干扰影响。在rgI颜色直方图当中

,,,L=r+g+I其中R、G、B就是RGB颜色空间当中的三原色,r、g、I有着相同的取值范围即在0到1之间。保持间隔相等的情况下划分L值即可得到rgI颜色直方图。虽然rgI颜色直方图与物体相对应,但如果目标只是位置以及尺寸等出现变化,rgI颜色直方图并不会受到任何实质性影响,因此在理想情况下,利用rgI颜色直方图能够对视频图像中不同运动位置以及不同尺寸的人脸进行目标追踪。

2.2 跟踪算法

运动目标的不断变化将会使得模板图像随之发生相应变化,因此需要不断更新模板图像才能够有效完成对运动目标的连续跟踪,本文在对运动目标的实际运动范围进行预测过程中选择使用卡尔曼滤波,之后利用rgI颜色直方图在预测运动范围之内搜索和匹配相应目标,从而通过此举获得与目标模板有着最小欧式距离的区域,在此过程当中存在一个特定阈值T,如果两者的欧氏距离在进行相减时差值没有超过这个特定阈值,那么此时该区域就是运动目标所在的实际位置,利用在这一区域当中的rgI颜色直方图并将其充当下一帧运动目标的匹配模板,在不断重复的过程中模板能够实现不间断地更新。由于相邻的两帧视频图像之间,时间间隔并不长,因此目标人脸在极短的时间间隔当中基本上不会出现突然变化,此时我们可以认为运动目标人脸的运动连续性比较强,此时利用公式

可以进行欧式距离的计算并用以衡量匹配的模板。其中匹配区域和模板的rgI颜色直方图分别用l和l'表示,而rgI颜色直方图中的维数则用n进行表示。根据相关视频图像显示,通过不断更新模板确实可以对目标运动人脸进行实时跟踪显示。

3 结束语

总而言之,本文通过选择当前比较常见的目标跟踪算法即Kalman filter算法,利用卡尔曼滤波以及rgI颜色直方图完成对运动人脸的跟踪。事实证明,Kalman filter算法确实能够在对各目标之间的干扰进行明确区分的基础之上,准确描述运动人脸目标,从而较好地跟踪运动目标,但由于人脸之间本身存在一定的相似性,因此本文只是对理想状态下的运动人脸进行跟踪实验,日后还需要对计算机视觉技术和Kalman filter算法进行进一步优化以妥善解决多人脸目标以及相似性问题。

参考文献

[1]郑薇.基于双目视觉的运动目标跟踪算法研究及应用[D].哈尔滨:哈尔滨工程大学,2014.

[2]李慧霞,李临生,闫庆森,周景文.基于Mean Shift算法的目标跟踪综述[J].计算机与现代化,2017(01):65-70.

[3]李寰宇,毕笃彦,杨源,查宇飞,覃兵,张立朝.基于计算机视觉的运动目标跟踪算法研究[J].电子与信息学报,2015(09):2033-2039.

[4]陈曦,殷华博.基于计算机视觉运动目标跟踪技术分析[J].无线电工程,2014(06):22-24+39.

计算机视觉理论范文5

关键词 计算机视觉;摄像机定标方法;应用特点;线性关系;参照物

中图分类号:TP391 文献标识码:A 文章编号:1671—7597(2013)022-067-3

计算机视觉中的摄像机定标方法总得来说可以分为两类——传统的摄像机定标法和摄像机自定标法。为了能够使所获取的场景更加自然,计算机视觉系统可以通过运用摄像机定标方法,加之合理安排摄像机和计算机这两种成像装置,来对二维的图像信息进行虚拟空间的三维建模,进而控制整个摄像效果。这其中摄像及内部的一些参数起到了很大的作用,最初在计算机视觉中都是采用的传统摄像机定标方法,但是这种方法存在着一定的局限性。这种定标方法在摄像机随意运动和未知场景的安排下很难进行有效的标定。随着计算机视觉中的摄像机定标方法的不断进步和发展,以及摄像机自定标方法的诞生,使得这项技术逐渐获得了相对广泛的应用。

1 计算机视觉中与摄像机定标解析

计算机视觉的基本任务是采集一定数量的图片或视频资料并进行处理,以此来获得相应场景环境下的的三维信息。而这些三维信息与图像、视频对应点的相互关系需要通过摄像机的几何模型来决定,经过计算分析得出这些几何模型参数的过程即为摄像机定标。如此看来,计算机视觉与摄像机定标的关系密不可分,目前可知,计算机视觉与摄像机定标的结合已经运用到相关领域,如高速公路上的车辆自主导航,部分医学图像的处理,电脑中脸孔或指纹识别等。但是由于所使用的目标人群相对较窄,以及摄像机定标方法的相对局限,使得计算机视觉的摄像机定标无法广泛的运用到各个行业领域。正因如此,才加大了对计算机中摄像机定标方法的研究的必要性。下面就来对摄像机定标的两种方法进行简要的探讨。

2 传统的摄影机定标方法及应用特点

传统的摄像机定标方法主要是在相应的摄像机模型下面,通过对一系列的数学公式进行变换计算和改进优化,然后对标定的具体参照物进行科学的图像处理,最终来获取摄像机模型的主要外部参数和内部参数。但是,由于不同的标的参照物与不同的算法思路的限制,传统的摄像机定标方法也各不相同,其大致可分为以下三种:三维型——3D立体靶标定标法、平面型——2D平面靶标定标法以及以径向约束为基准的定标法。

2.1 基于3D立体靶标的摄像机定标

这种基于3D立体靶标的摄像机定标方法就是在摄像机的前面安置一个具有3D效果的立体靶标装置,然后将靶标上面的任何一个点都拿出来作为i这个参照物的特征点。在计算机视觉系统的作用下,将每一个靶标上面的特征点在整个三维坐标系中进行精确的制作测定。与此同时,摄像机首先在拍摄过程中获取靶标上面的特征点影像信息,然后对平面图像坐标系和立体空间坐标系二者的内外部数据参数排列出非线性方程,找出方程中系数矩阵的非线性关系,最后通过数学算法中的线性变换法来对整个透视系数矩阵中的每一个元素进行求解。通常在这种定标方法的应用过程中,计算机视觉系统都会忽略摄相机镜头在拍摄时的非线性畸变,将透视变幻矩阵中的相关元素定义为未知数,继而在整个定标过程确定有效的三维控制点和相应的图像点。在装置3D立体靶标后,整个摄像机定标就能够根据靶标上特征点的图像坐标和世界坐标,在数学变幻算法的应用下,计算出摄像机的内部参数和外部参数。

这种3D立体靶标的摄像机定标方法不仅能够优化定标物的获取方法,而且能够适应程序功能的改进,并且较高的精度,因而得到了广泛的应用,但是这种定标方法通常比较繁琐。

2.2 基于2D平面靶标的摄像机定标

基于2D平面靶标的摄像机定标方法在传统摄像机定标方法分类中属于一种新型的定标方法,又名张正友定标法。这种定标法具有灵活适用的特点,也是对传统摄像机定标方法的一种简化。在定标过程中首先是要在两个以上的不同方位对一个平面靶标进行摄相机拍摄,整个拍摄过程中2D平面靶标和摄相机镜头都能够自由地进行移动,而且要保持整个摄像机的内部参数一直固定。通常在基于2D平面靶标的摄像机定标法的应用中,我们都需要先假定这个靶标在三维空间坐标系中的竖轴为0,然后为了求出摄像机内外参数的优化解,要建立相应的线性模型,通过对线性模型的线性分析来计算出优化解,最后,运用最大似然法排列参数之间的非线性关系来求出其非线性解。在整个定标流程中,必须对摄像机的镜头畸变的目标函数进行综合考虑,才能够计算出摄像机的外部和内部参数。

这种方法既具有较高的精确性,又不需要很昂贵的定标成本,因此在计算机视觉系统中很为实用。但是,这种方法在进行整个摄像机内外参数的线性分析时,因为特征图像上面的直线在透视之后依然是直线,在进行图像处理的过程中,会引入一定的误差。因此,在很多具有广角镜头的摄像机定标上会出现因为镜头畸变而引起的较大误差。

2.3 基于径向约束的摄像机定标

基于径向约束的摄像机定标就是通常所说的两步法标定方法。这种方法通常是先利用径向一致约束对超定性的线性方程进行最小二乘法求解,这样就能够将除了摄像机光轴方向平移外的其他的摄像机参数,然后对摄相机镜头存在和不存在透镜畸变的情况下分别进行其他摄像机参数的求解。这种方法的计算量较为适中,而且精度也比较高,适用于摄像机的精密测量。然而,两步法对于整个定标设备的要求也高,对于简单的摄像机标定而言不易采用。

总的来说,基于径向约束的摄像机定标的精准是通过设备的复杂和精确来获得的,因此具有针对性的应用特点。

3 摄像机自定标方法及其应用特点

摄像机自定标方法是指在摄像机在移动时,周围环境中的图像会形成一定的对应关系,通过这种对应关系来对摄像机进行定标的方法,这种方法无需依赖参照物。摄像机自定标方法主要有以下四种:基于主动视觉的自定标法、基于Kruppa方程的自定标方法、分层逐步定标法以及基于二次曲面的自定标方法等。这些方法相较于传统的摄像机定标方法来说有了很大的改进和提高,下面就进行简要的探讨。

3.1 基于主动视觉的自定标法

目前,在摄像机自定标方法中的应用最为普遍的方法便是基于主动视觉的自定标法。这种方法主要是能够通过对摄像机在移动过程中的对环境中的多幅图像进行标定,进而建立对应关系来求出标定参数,由此可见,整个标定过程不需要精密的标定物,如此一来就能够使得标定问题简单化。主动视觉系统是这种标定方法的核心技术,就是摄像机在拍摄过程中被固定在了一个能够得到精确控制的移动平台上,并且这个平台的相关参数能够通过计算机进行精确的读出,在整个拍摄过程中摄像机只需要通过一定的特殊运动来获取多幅图像信息,然后在结合摄像机运动的具体参数和图像的参数来确定整个摄像机的内部和外部参数,达到摄像机定标的效果。其中基于主动视觉的自定标法的代表方法就是马颂德提出的控制摄像机的两组三正交平移运动的标定方法。后来,李华、杨长江等人对这种方法进行了改进和优化,提出了基于四组平面正交和五组平面正交运动的标定方法,并能够利用获取图像中的机电信息来对摄像机的参数进行线性表定。

这种方法算法简便,能够获得整个参数的线性解,但是这种方法对整个摄像机的运动平台要求很高,因此要求必须具有精确控制的能力。

3.2 基于Kruppa方程的自定标方法

基于Kruppa方程的自定标方法主要是在整个摄像机自定标过程中导入了Kruppa方程,并对该方程进行直接求解,从而得到整个摄像机的具体参数的方法。基于Kruppa方程的自定标方法在应用时利用了极线变幻和二次曲线像的概念对Kruppa进行推导,直接进行求解。

这种标定方法不需要对整个图像的序列进行射影重建,通常是对两个图像之间的信息建立一个方程,相较于逐步分层标定方法而言,基于Kruppa方程的自定标方法能够将某些很难做到所有图像整合到一个统一的射影框架中的情况更加具有优势,但是这种方法还是存在着一定的局限性,它无法保证在无穷远处的平面能够保持所有图像在确定的摄影平面中还具有一致性的效果。当整个摄像机拍摄的图像的序列较长的时候,基于Kruppa方程的自定标方法就显得很不稳定,继而不能够很好地算出整个摄像机的内外参数,对定标造成了一定的影响。

3.3 分层逐步定标法

分层逐步定标法是摄像机自定标方法中的一个研究热点,在摄像机自定标的实际应用中以及逐步取代了可以直接求解的基于Kruppa方程的自定标方法。分层逐步定标法在应用过程中首先需要对整个拍摄的图像序列进行摄影重建,这点和基于Kruppa方程的自定标方法一样,然后利用绝对二次曲面加以约束,最后在确定出无穷远处平面方程中的仿射参数以及摄像机内部的参数。分层逐步定标法的应用特点是必须建立在射影定标的基础之上,利用某一幅图形作为特征基准点进行射影对其,将整个摄像机自定标的未知数的数量减少,再运用数学算法中的非线性优化算法来进行未知数的求解。

这种方法的不知自出就是在进行非线性优化算法时,初值是通过事前的预估得到的,不能够保证这个方程的收敛性。由于在射影重建时,选择的基准图像不同,整个摄像机自定标的结果也会存在差异。

3.4 基于二次曲面的自定标方法

基于二次曲面的自定标方法和基于Kruppa方程的自定标方法在本质上答题一致,这两种方法都是利用了绝对二次曲面在欧式变幻算法的计算下维持的不变性进行的。最早将二次曲面的概念引入到计算机视觉系统中摄像机自定标方法的是Triggs,他在这种定标方法上作出了可行性的研究,最后形成了基于二次曲面的自定标方法。

在输入了多幅的图像并且在进行统一的射影重建的状态下,基于二次曲面的自定标方法会比基于Kruppa方程的自定标方法更加适用一些,原因就是基于二次曲面的自定标方法包含了绝对二次曲面和无穷远处平面的所有信息,进而能够办证整个图像在无穷远处平面的一致性。

4 传统摄像机定标方法与自定标方法优缺点分析

从上文可知,对于传统摄像机定标方法应该取其精华,去其糟粕;对于摄像机自定标方法,在吸取传统摄像机定标方法的优点的同时,应该加强自身的精度要求。总而言之,两种摄像机定标方法各自存在利弊,如何改进才是正确的研究方向。

4.1 传统的摄像机定标方法弊端

传统的摄像机定标方法通过实践证明,在理论上和实际运用上十分有用的,但仍有不少地方需要进一步改进,以下为它目前存在的问题所在:1)摄像机所拍摄的图像或视频存在一定噪声。在实际数据计算分析中,这种噪音无论大小,都会对内部参数的实际解造成大的干扰,并且使实际解与由约束关系所求得的解之间有着相当大的差异。因此,怎样才能够提高解的鲁棒性、减少解之间的差异性成为了传统摄像机定标亟待解决的1问题;2)线性模型所得的优化解并非全局的。由上可知,摄像机定标的实际过程便是获得实际参数的过程,即使用各种不同的优化计算方法,来获得相应的非线性方程的一组解,但实际上,以此所获得的优化解并非全局的。因此,如何变化或者提高线性方程的解答方法也很重要;3)摄像机定标参数的不确定性。一般来讲,摄像机定标参数的不确定性决定着计算参数的可信程度,同时,其对三维重建有着影响,进一步来讲,摄像机定标的不确定性也决定着约束关系的不确定性传播。因此,这个问题也需要深入进一步研究。

总之,传统摄像机的定标方法依然存在着许多无法忽视的弊端和需要解决的问题,深入研究并尽快解决这些问题,应该是传统摄像机的定标方法今后的大的研究方向。

4.2 摄像机自定标方法相关问题

目前普遍认为,摄像机自定标方法实现随时随地的校准摄像机模型参数,与传统的摄像机定标方法相比显得更为灵活先进。摄像机自定标方法无需参照物,仅仅从图像或视频的相关点中得到它们之间的约束关系,从而通过相应的分析,计算出摄像机模型的参数.这种定标方法看似毫无缺点,但自定标的精度与传统的摄像机定标方法相比,还是存在者一定的缺点,以下便是对其缺点的归纳总结:部分摄像机自定标方法所求得的解不够稳定。例如:在图像或视频存在一定噪声的情况下,实际的解与理论的解有着相当差异,或者所求得的解并不唯一。因此,解的不稳定性和精度不够的情况,不仅是传统摄像机定标方法的缺点,也是自定标方法的一个问题,提高解的精度及稳定性,是自定标研究的一个重要方向。实际上,在现在的解决方案中,各种优化算法是最常用最普遍的方法,但是,在多解的情况下,优化算法也无法能够保证得出全局的最优解。由此看来,这个问题是计算机是绝种摄像机定标方法普遍存在的关键性问题。

5 结束语

随着计算机视觉系统的不断发展,摄像机定标技术也呈现了进步的状态。综上所述,计算机视觉中的摄像机定标方法主要有传统的摄像机定标法和摄像机自定标法,对这两类的定标方法进行深入的研究能够为全面认识和了解摄像机定标方法起到很好的帮助作用。计算机视觉中的摄像机定标方法在今后的发展过程中应该得到更多的研究,但其所存在的不足和弊端也理应得到研究人员的重视。在这个多元化信息化的世界里,计算机视觉中的摄像机定标技术若能够根据现有的条件,适应如今的环境,选择合适的方法,对一些还存在局限性的环节取得更好地突破,则能够将整个定标技术提升一个高度。相信随着未来计算机视觉系统的不断扩展和不断完善,摄像机定标技术的应用范围也会越来越广阔。

参考文献

[1]宋雪峰,杨明,王宏.用于摄像机标定的网格状纹理的检测方法[A].2001年中国智能自动化会议论文集(下册)[C].2001.

[2]谭跃钢,吴正平.一种新的基于双目视模型的三维重建方法[A].中国仪器仪表学会第三届青年学术会议论文集(上)[C].2001.

[3]刘健勤,鲍光淑.面向数据采掘的自适应图象分割技术[A].中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C].1998.

[4]洪俊田,陶剑锋,李刚,桂预风,徐晓英.基于灰色关联的数字图像去噪研究[J].武汉理工大学学报(交通科学与工程版),2006,04.

[5]赵江涛,周仁斌,刘宝源.基于线结构激光三维扫描系统的摄像机标定方法研究[A].2010振动与噪声测试峰会论文集[C].2010.

[6]王鹏,王红平.基于网格图像的双线性插值畸变校正的方法研究[A].科技创新与节能减排——吉林省第五届科学技术学术年会论文集(上册)[C].2008.

[7]程建璞,项辉宇,于修洪.基于OpenCV的视觉测量技术中摄像机标定方法[J].北京工商大学学报(自然科学版),2010,01.

[8]赵越,江南.一种基于3D矩形靶标的摄像机标定算法及其实现[A].第九届全国信息获取与处理学术会议论文集Ⅰ[C].2011.

计算机视觉理论范文6

关键词:序贯相似性检测算法 图像匹配 计算机视觉

中图分类号:TN911 文献标识码:A 文章编号:1672-3791(2013)06(c)-0205-01

图像匹配最早是70年代美国从事飞行器辅助导航系统,武器投射系统的制导等应用研究中提出的。国内外学者对匹配辅助导航技术进行深入研究,使其在民用领域的应用越来越广泛[1,2]。计算机视觉计算主要分为低层处理、中层处理和高层处理,而在低层进行数字化差异检测、中层进行参数化相似分析,高层处理完成图像的识别、解释和描述等任务,都需要图像匹配技术[3]。序贯相似性检测算法(SSDA)能够快速地丢弃非匹配点,减少非匹配点的计算量,从而提高匹配的速度,算法简单,易于实现。

1 序贯相似性检测算法

序贯相似性检测算法的基本思想是基于对误差的积累进行分析。在进行图像匹配时,通常非匹配点处的误差ε会随着运算点数的增加而迅速增长,很快超过某一门限,而对于匹配点处,误差的增长要缓慢得多。这样对于大多数非匹配点,只需要分析前几项,而只有匹配点附近的点才需要计算整个循环,这样就大大地减少了匹配的运算量。

设源图像S的大小为J×K,模板图T的大小为M×N(其中M≤J,N≤K),模板覆盖的区域子图为,(p,q)为模板左上角像素点在图像S中的坐标,S中的待匹配区域是以点(p,q),(p,q+M-1),(p+N-1,q),(p+N-1,q+M-1)组成的区域。相对于参考点位置为(m,n)点的匹配误差定义为:

其中k=1,2,…r。将累计误差值与预定阈值进行比较,当累加值超过设定阈值Tk时,就停止累加计算,并记下累加次数k。计算下一个待匹配点处的误差,若累计误差小于预定阈值,则继续计算此处的误差,直到>Tk或k=r,记下k值。对不同的待匹配点进行上述匹配计算,最后取最大k值对应的待匹配点位置,即为要找的匹配点。

2 实验结果与分析

图1显示了基准图与实时图像,图1(a)为基准图像,大小为256×256,图1(b)为实时图,大小为65×65。图1(c)找到了实时图像在基准图中的位置。

由图1可以看出,SSDA算法能够良好地进行匹配。而通过对匹配时间的计算可以看出,SSDA算法的运行时间相对较短,效率较高。

参考文献

[1] GONG H C.Development of terrain contour matching algorithm for the aided inertial navigation using radial basis functions [J].Journal of Astron Space Science,1998,15(1):229-234.