前言:中文期刊网精心挑选了计算机视觉的基本概念范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉的基本概念范文1
关键词 计算机图形学 第三方演示 课程群 分组实践
Abstract At present, computer graphics has become an important part of undergraduate computer education, and it is also plays an important role to cultivate innovative talents to adapt to the information age. Based on the teaching of computer graphics course by the author as an example, analyzes the existing problems in the teaching of computer graphics, and put forward improvement ideas from three aspects: according to the different needs of students utilizing the third party demonstration teaching and cross curriculum interpretation, introducing course group to replace single course, employing group practice examination instead of individual, and other forms to improve the quality of teaching.
Keywords computer graphics; third party demonstration; course group; group practic
计算机图形学是一门介绍显示、生成和处理计算机图形的原理和方法的课程。它在计算机总体教学体系中属内容综合性较强且发展迅速的方向之一。该课程既有具体的图形软硬件实现,又有抽象的理论和算法,旨在为学生从事相关工作打下坚实基础。学生须以高等数学和线性代数的基本理论和较熟练的程序设计能力作为本课程学习的基础。课程的难点在于计算机图形学研究范围广,与其他学科交叉性强,且知识不断更新变化。在教学实施过程中,难点是理解和掌握相应的基础理论和算法,以及利用计算机图形学相关工具进行图形学实际问题的解决。
本课程对学生的培养学生围绕以下三个方面展开: (1)建立对计算机图形学的基本认识,理解图形的表示与数据结构、曲线曲面的基本概念。(2)理解并掌握基本图形的生成算法,并能对现有的算法进行改进,理解图形的变换和裁减算法。 (3)面向算机图形的程序设计能力,以底层图形生成算法为核心构建应用程序。相应的考查方式由理论授课、上机实习和课外作业三个单元构成。从近年的授课实践和考试情况分析,该教学内容难度设置合理,深入浅出且相互承接成为体系,学生总体反馈良好。但也存在一些矛盾和问题。以下将对几个问题进行重点阐述与思考,并提出课程改革思路。
1 计算机图形学与计算机辅助设计衔接问题
笔者所在院校是具有航空航天背景的工科院校,“CAD计算机辅助设计”是飞行器设计、机械设计与制造等多学科的重要课程。相关学科学生期望通过对计算机图形学知识的深入理解,促进CAD设计工具诸如Catia、Solidwork和Rhino等先进工具的运用能力。然而,目前的计算机图形学课程的教学和考察环节倚重低层算法讲解与基于OPENGL等的程序设计,除综述外并未具体引入CAD相关内容。产生的问题是,一方面,飞行器设计及机械设计与制造等专业的学生由于程序设计能力不足,难以驾驭较复杂的程序设计任务,在学习过程中心理压力较大;另一方面,由于授课均为教师为计算机相关专业背景,该课程的讲授并未衔接CAD相关技术,学生难以构建二者之间的联系。
解决方案:
本质上,该问题是由于选课学生的学习动机和基础不同造成的。以单一的教学和考查方式难以兼顾这类面向具体应用的学习需求。在教学方法上,采用第三方案例教学法和交叉讲解法相结合以解决此问题。具体的,将CAD等应用场合以具体案例形式讲解,授课教师邀请飞行器、机械设计相关教研组研究生以4~6学时的讲台演示的形式呈现CAD工具完整设计过程。授课教师则以交叉讲解方式为学生讲解运用到的计算机图形学知识点,同时与学生交互式的问答和探讨。在考查形式上,考虑到不同的学习动机和基础,采用多样化实践环节考查。计算机专业学生以OPENGL程序设计为考点,而外专业学生以CAD等面向应用的实践工具为考点,以兼顾各专业的学习需求。
2 计算机图形学与计算机视觉相结合的问题
当前,虚拟现实技术(VR)和人工智能技术(AI)两个最重要最热门的研究领域。虚拟现实的基础理论支撑是计算机图形学,例如三维场景的生成与显示。而人工智能的一个重要应用场景是计算机视觉,例如基于图像智能识别的自动驾驶技术和场景理解技术。很多学生对以计算机视觉为代表的人工智能技术怀有浓厚兴趣,同时,学生又难以区分计算机图形学和计算机视觉的关系。同时,二者在近年来的研究中呈现相互融合的趋势。如基于三维立体视觉的机器人与场景实时定位与重建。如何在计算机图形学课程中,很好地体现两门课程的不同,避免学生的混淆,拓展学生的知识面,都是具有现实意义的课题。
解决方案:
实际上,计算机图形学和计算机视觉可不失一般性的概括为互逆的关系:计算机图形学是由概念设计到模型生成,最终绘制图形图像的过程;而计算机视觉则是从原始图像中再加工并分析理解、以产生新图像(如二维到三维)或输出语义信息(如图像自动标注与理解、目标检测与识别)。将计算机图形学纳入“视觉处理课程群”框架,使学生首先掌握课程群中各课程的侧重点,着重理解图形学在课程群中的作用。精心选取2~3个计算机视觉和图形学交叉的当前主流研究方向,展开概念层面的演示讲解,不深究具体算法,着重阐述两种技术的相互依赖关系并对比二者的区别。相关领域的演示还包括增强现实、人机交互、计算机辅助诊断等等。鼓励学生自主学习,最终使学生在做中学、用中学,提高独立分析新问题和综合运用知识解决问题的能力。
3 如何平衡算法讲解和程序应用技能
计算机图形学涉及的算法多,核心算法是该课程的必讲内容,在算法细节的讲解过程中学生容易产生畏难厌学情绪,注意教学方法以调动学生的兴趣尤为重要。另一方面,对学生的考察方式最终是通过编程实践完成。学生在编程实践中常常遇到大量调试问题,同时要阅读大量文档以了解OPENGL接口函数的调用方法,这个过程占用了很大工作量。
解决方案:
在理论教学部分,着重讲清计算机图形学原理和概念、全面解析经典算法思想。课程强调对理论核心思想的阐述,用通俗易懂的语言,条例清晰的逻辑,进行简明透彻的阐述,附以直观、形象的动态演示系统,力图使学生在较短的时间内、有效地掌握基本理论。分析图形学各种经典算法的原理、可行性及几何复杂性,尽可能多地比较算法之间的思想差异,分别指出它们的优缺点和应用场合,并促进学生思考如何在保证算法的准确性、可靠性的前提下,提高算法的效率。同时注重接近国际前沿的研究内容,注重讲授经典知识和最新进展相结合,以激发学生的学习兴趣,提高课堂效率和活跃度,力争以较少的课时阐述计算机图形学的基本原理、基本方法,加大实践环节比重。通过往年学生完成的优秀课程作业作品的展示,激发学生的创造热情。改革实践环节的考查方式,以项目小组形式取代对个体的考查。原则上每组3~5人,自由组合。在课程结束前,采用小组现场演示讲解的方式,展示小组成员通过编程实践环节完成的一个项目。学生在项目小M中锻炼了团队协作能力,降低了个人工作强度,同时互相学习和督促的氛围使课程作业的质量得以大幅提高。以基础实验――目标性重建实验――自主性训练的层次化实践框架模式,逐步培养学生自主研究,独立解决问题、分析问题,确定解决方案的能力,树立正确的科学研究习惯,培养学生的科学研究能力。
总之,合理设计实践教学案例,进一步实现课程体系和实践内容的统一,建立一个多层次、立体化的实践教学体系,注重学生的参与性与实践性,引导和鼓励学生进行创新实践和课外研学。改革考核方式和考试形式,加大实践环节在成绩中的比重,强化实践能力培养,寓教于乐的同时引导学生追求卓越。此外,计算机图形学技术是发展非常快的一个研究及应用领域,且对编程要求较高,应注重实验室机房投入更新必要硬件,并保障软件编程环境的正常运行。
L鼙疚氖苤泄┦亢蠡YBA15035,江苏省教改项目JGLX13_008资助
参考文献
[1] 孙家广,胡事民.计算机图形学基础教程.北京:清华大学出版社,2005.2.
[2] 唐荣锡,汪嘉业,彭群生等.计算机图形学教程(修订版).北京:科学出版社,2000.
[3] LIU Hailan.On development and application of computer graphics[J].Computer Knowledge and Technology,2010(3):9551-9552.
[4] 娄凤伟.创造性思维与计算机基础教学[J].教育探索,2002.
计算机视觉的基本概念范文2
论文关键词:数据融合 传感器 无损检测 精确林业 应用
论文摘要:介绍了数据融合技术的基本概念和内容,分析了该技术在森林防火、森林蓄积特征的估计和更新、森林资源调查等方面的应用,提出该技术可应用于木材无损检测及精确林业。融合机器视觉、X射线等单一传感器技术检测木材及木制品,可以更准确地实时检测出木材的各种缺陷;集成GPS、GIS、RS及各种实时传感器信息,利用智能决策支持系统以及可变量技术,能够实现基于自然界生物及其赖以生存的环境资源的时空变异性的客观现实,建立基于信息流融合的精确林业系统。
多传感器融合系统由于具有较高的可靠性和鲁棒性,较宽的时间和空间的观测范围,较强的数据可信度和分辨能力,已广泛应用于军事、工业、农业、航天、交通管制、机器人、海洋监视和管理、目标跟踪和惯性导航等领域[1,2]。笔者在分析数据融合技术概念和内容的基础上,对该技术在林业工程中的应用及前景进行了综述。
1 数据融合
1.1 概念的提出
1973年,数据融合技术在美国国防部资助开发的声纳信号理解系统中得到了最早的体现。70年代末,在公开的技术文献中开始出现基于多系统的信息整合意义的融合技术。1984年美国国防部数据融合小组(DFS)定义数据融合为:“对多源的数据和信息进行多方的关联、相关和综合处理,以更好地进行定位与估计,并完全能对态势及带来的威胁进行实时评估”。
1998年1月,Buchroithner和Wald重新定义了数据融合:“数据融合是一种规范框架,这个框架里人们阐明如何使用特定的手段和工具来整合来自不同渠道的数据,以获得实际需要的信息”。
Wald定义的数据融合的概念原理中,强调以质量作为数据融合的明确目标,这正是很多关于数据融合的文献中忽略但又是非常重要的方面。这里的“质量”指经过数据融合后获得的信息对用户而言较融合前具有更高的满意度,如可改善分类精度,获得更有效、更相关的信息,甚至可更好地用于开发项目的资金、人力资源等[3]。
1.2 基本内容
信息融合是生物系统所具备的一个基本功能,人类本能地将各感官获得的信息与先验知识进行综合,对周围环境和发生的事件做出估计和判断。当运用各种现代信息处理方法,通过计算机实现这一功能时,就形成了数据融合技术。
数据融合就是充分利用多传感器资源,通过对这些多传感器及观测信息的合理支配和使用,把多传感器在空间或时间上的冗余或互补信息依据某些准则进行组合,以获得被测对象的一致性解释或描述。数据融合的内容主要包括:
(1)数据关联。确定来自多传感器的数据反映的是否是同源目标。
(2)多传感器ID/轨迹估计。假设多传感器的报告反映的是同源目标,对这些数据进行综合,改进对该目标的估计,或对整个当前或未来情况的估计。
(3)采集管理。给定传感器环境的一种认识状态,通过分配多个信息捕获和处理源,最大限度地发挥其性能,从而使其操作成本降到最低。传感器的数据融合功能主要包括多传感器的目标探测、数据关联、跟踪与识别、情况评估和预测[4]。
根据融合系统所处理的信息层次,目前常将信息融合系统划分为3个层次:
(l)数据层融合。直接将各传感器的原始数据进行关联后,送入融合中心,完成对被测对象的综合评价。其优点是保持了尽可能多的原始信号信息,但是该种融合处理的信息量大、速度慢、实时性差,通常只用于数据之间配准精度较高的图像处理。
(2)特征层融合。从原始数据中提取特征,进行数据关联和归一化等处理后,送入融合中心进行分析与综合,完成对被测对象的综合评价。这种融合既保留了足够数量的原始信息,又实现了一定的数据压缩,有利于实时处理,而且由于在特征提取方面有许多成果可以借鉴,所以特征层融合是目前应用较多的一种技术。但是该技术在复杂环境中的稳健性和系统的容错性与可靠性有待进一步改善。
(3)决策层融合。首先每一传感器分别独立地完成特征提取和决策等任务,然后进行关联,再送入融合中心处理。这种方法的实质是根据一定的准则和每个决策的可信度做出最优的决策。其优点是数据通讯量小、实时性好,可以处理非同步信息,能有效地融合不同类型的信息。而且在一个或几个传感器失效时,系统仍能继续工作,具有良好的容错性,系统可靠性高,因此是目前信息融合研究的一个热点。但是这种技术也有不足,如原始信息的损失、被测对象的时变特征、先验知识的获取困难,以及知识库的巨量特性等[5,6]。
1.3 处理模型
美国数据融合工作小组提出的数据融合处理模型[7],当时仅应用于军事方面,但该模型对人们理解数据融合的基本概念有重要意义。模型每个模块的基本功能如下:
数据源。包括传感器及其相关数据(数据库和人的先验知识等)。
源数据预处理。进行数据的预筛选和数据分配,以减轻融合中心的计算负担,有时需要为融合中心提供最重要的数据。目标评估。融合目标的位置、速度、身份等参数,以达到对这些参数的精确表达。主要包括数据配准、跟踪和数据关联、辨识。
态势评估。根据当前的环境推断出检测目标与事件之间的关系,以判断检测目标的意图。威胁评估。结合当前的态势判断对方的威胁程度和敌我双方的攻击能力等,这一过程应同时考虑当前的政治环境和对敌策略等因素,所以较为困难。
处理过程评估。监视系统的性能,辨识改善性能所需的数据,进行传感器资源的合理配置。人机接口。提供人与计算机间的交互功能,如人工操作员的指导和评价、多媒体功能等。
2 多传感器在林业中的应用
2.1 在森林防火中的应用
在用MODIS(Moderate Resolution Imaging Spectroradiometer)数据测定森林火点时的20、22、23波段的传感器辐射值已达饱和状态,用一般图像增强处理方法探测燃烧区火点的结果不理想。余启刚运用数据融合技术,在空间分辨率为1 000 m的热辐射通道的数据外加入空间分辨率为250 m的可见光通道的数据,较好地进行了不同空间分辨率信息的数据融合,大大提高了对火点位置的判断准确度[8]。为进一步提高卫星光谱图像数据分析的准确性与可靠性,利用原有森林防火用的林区红外探测器网,将其与卫星光谱图像数据融合,可以使计算机获得GPS接收机输出的有关信息通过与RS实现高效互补性融合,从而弥补卫星图谱不理想的缺失区数据信息,大大提高燃烧区火点信息准确度和敏感性。
2.2 森林蓄积特征的估计
Hampus Holmstrom等在瑞典南部的试验区将SPOT-4×S卫星数据和CARABAS-II VHFSAR传感器的雷达数据进行了融合,采用KNN(k nearest neighbor )方法对森林的蓄积特征(林分蓄积、树种组成与年龄)进行了估计[9]。
KNN方法就是采用目标样地邻近k个(k=10)最近样地的加权来估计目标样地的森林特征。研究者应用卫星光谱数据、雷达数据融合技术对试验区的不同林分的蓄积特征进行估计,并对三种不同的数据方法进行误差分析。试验表明,融合后的数据作出的估计比单一的卫星数据或雷达数据的精度高且稳定性好。
2.3 用非垂直航空摄像数据融合GIS信息更新调查数据
森林资源调查是掌握森林资源现状与变化的调查方法,一般以地面调查的方法为主,我国5年复查一次。由于森林资源调查的工作量巨大,且要花费大量的人力、物力和资金。国内外许多学者都在探索航空、航天的遥感调查与估计方法。
Trevor J Davis等2002年提出采用非垂直的航空摄影数据融合对应的GIS数据信息实现森林调查数据的快速更新,认为对森林资源整体而言,仅某些特殊地区的资源数据需要更新。在直升飞机侧面装上可视的数字摄像装置,利用GPS对测点进行定位,对特殊地区的摄像进行拍摄,同时与对应的GIS数据进行融合,做出资源变化的估计或影像的修正[10]。
试验表明,融合后的数据可以同高分辨率矫正图像相比,该方法花费少,精度高,能充分利用影像的可视性,应用于偏远、地形复杂、不易操作、成本高的区域,同时可避免遥感图像受云层遮盖。
3 数据融合在林业中的应用展望
3.1 在木材检测中的应用
3.1.1 木材缺陷及其影响
木材是天然生长的有机体,生长过程中不可避免地有尖削度、弯曲度、节子等生长缺陷,这些缺陷极大地影响了木材及其制品的优良特性,以及木材的使用率、强度、外观质量,并限制了其应用领域。在传统木制品生产过程中,主要依靠人的肉眼来识别木材缺陷,而木材板材表面缺陷在大小、形状和色泽上都有较大的差异,且受木材纹理的影响,识别起来非常困难,劳动强度大,效率低,同时由于熟练程度、标准掌握等人为因素,可能造成较大的误差。另外在集成材加工中,板材缺陷的非双面识别严重影响了生产线的生产节拍。因此必须开发一种能够对板材双面缺陷进行在线识别和自动剔除技术,以解决集成材加工中节子人工识别误差大、难以实现双面识别、剔除机械调整时间长等问题。
3.1.2 单一传感器在木材检测中的应用
对木材及人造板进行无损检测的方法很多,如超声波、微波、射线、机械应力、震动、冲击应力波、快速傅立叶变换分析等检测方法[11,12]。超声技术在木材工业中的应用研究主要集中在研究声波与木材种类、木材结构和性能之间的关系、木材结构及缺陷分析、胶的固化过程分析等[13]。
随着计算机视觉技术的发展,人们也将视觉传感器应用于木材检测中。新西兰科学家用视频传感器研究和测量了纸浆中的纤维横切面的宽度、厚度、壁面积、壁厚度、腔比率、壁比率等,同时准确地测量单个纤维和全部纤维的几何尺寸及其变化趋势,能够区分不同纸浆类型,测定木材纤维材料加固结合力,并动态地观察木材纤维在材料中的结合机理。
新西兰的基于视觉传感器的板材缺陷识别的软件已经产业化,该软件利用数码相机或激光扫描仪采集板材的图像,自动识别板材节子和缺陷的位置,控制板材的加工。该软件还具有进行原木三维模型真实再现的计算机视觉识别功能,利用激光扫描仪自动采集原木的三维几何数据。
美国林产品实验室利用计算机视觉技术对木材刨花的尺寸大小进行分级,确定各种刨花在板中的比例和刨花的排列方向;日本京都大学基于视觉传感器进行了定向刨花板内刨花定向程度的检测,从而可以通过调整定向铺装设备优化刨花的排列方向来提高定向刨花板的强度。
在制材加工过程中,利用计算机视觉技术在线实时检测原木的形状及尺寸,选择最佳下锯方法,提高原木的出材率。同时可对锯材的质量进行分级,实现木材的优化使用;在胶合板的生产过程中,利用计算机视觉技术在线实时检测单板上的各种缺陷,实现单板的智能和自动剪切,并可测量在剪切过程中的单板破损率,对单板进行分等分级,实现自动化生产过程。Wengert等在综合了大量的板材分类经验的基础上,建立了板材分级分类的计算机视觉专家系统。在国内这方面的研究较少,王金满等用计算机视觉技术对刨花板施胶效果进行了定量分析[14]。
X射线对木材及木质复合材料的性能检测已得到了广泛的应用,目前该技术主要应用于对木材密度、含水率、纤维素相对结晶度和结晶区大小、纤维的化学结构和性质等进行检测,并对木材内部的各种缺陷进行检测。
3.1.3 数据融合在木材检测中的应用展望
单一传感器在木材工业中已得到了一定程度的应用,但各种单项技术在应用上存在一定的局限性。如视觉传感器不能检测到有些与木材具有相同颜色的节子,有时会把木板上的脏物或油脂当成节子,造成误判,有时也会受到木材的种类或粗糙度和湿度的影响,此外,这种技术只能检测部分表面缺陷,而无法检测到内部缺陷;超声、微波、核磁共振和X射线技术均能测量密度及内部特征,但是它们不能测定木材的颜色和瑕疵,因为这些缺陷的密度往往同木板相同。因此,一个理想的检测系统应该集成各种传感技术,才能准确、可靠地检测到木材的缺陷[15,16]。
基于多传感器(机器视觉及X射线等)数据融合技术的木材及木制品表面缺陷检测,可以集成多个传统单项技术,更可靠、准确地实时检测出木材表面的各种缺陷,为实现木材分级自动化、智能化奠定基础,同时为集裁除锯、自动调整、自动裁除节子等为一身的新型视频识别集成材双面节子数控自动剔除成套设备提供技术支持。
3.2 在精确林业中的应用
美国华盛顿大学研究人员开展了树形自动分析、林业作业规划等研究工作;Auburn大学的生物系统工程系和USDA南方林业实验站与有关公司合作开展用GPS和其他传感器研究林业机器系统的性能和生产效率。
目前单项的GPS、RS、GIS正从“自动化孤岛”形式应用于林业生产向集成技术转变。林业生产系统作为一个多组分的复杂系统,是由能量流动、物质循环、信息流动所推动的具有一定的结构和功能的复合体,各组分间的关系和结合方式影响系统整体的结构和功能。因此应该在计算机集成系统框架下,有效地融合GPS、GIS、RS等数据,解决这些信息在空间和时间上的质的差异及空间数据类型的多样性,如地理统计数据、栅格数据、点数据等。利用智能DSS(决策支持系统)以及VRT(可变量技术)等,使林业生产成为一个高效、柔性和开放的体系,从而实现林业生产的标准化、规范化、开放性,建立基于信息流融合的精确林业系统。
南京林业大学提出了“精确林业工程系统”[17]。研究包括精确林业工程系统的领域体系结构、随时空变化的数据采集处理与融合技术、精确控制林业生产的智能决策支持系统、可变量控制技术等,实现基于自然界生物及其所赖以生存的环境资源的时空变异性的客观现实,以最小资源投入、最小环境危害和最大产出效益为目标,建立关于林业管理系统战略思想的精确林业微观管理系统。
[参考文献]
[1]高翔,王勇.数据融合技术综述[J].计算机控制与测量,2002,10(11):706-709.
[2]龚元明,萧德云,王俊杰.多传感器数据融合技术(上)[J].冶金自动化,2002(4):4-7.
[3]钱永兰,杨邦杰,雷廷武.数据融合及其在农情遥感监测中的应用与展望[J].农业工程学报,2004,20(4):286-290.
[4]高德平,黄雪梅.多传感器和数据融合(一)[J].红外与激光工程,1999,28(1):1-4.
[5]王耀南,李树涛.多传感器信息融合及其应用综述[J].控制与决策,2001,16(5):518-52.
[6]许 军,罗飞路,张耀辉.多传感器信息融合技术在无损检测中的应用研究[J].无损检测,2000,22(8):342-344.
[7] White F E. Data fusion lexicon:Data fusion subpanel of the joint directors of laboratories technical panel for C3[R].San Diego,1991.
[8]余启刚.数据融合技术在“3S”森林防火中的应用[J].森林工程,2003,19(4):5-6.
[9] Hampus Holmstrom, Johan E S Fransson. Combining remotely sensed optical and radar data in KNN-estimation of forest[J]. Forest Science, 2003, 49(3): 409-418.
[10] Trevor J Davis, Brian Klinkenberg, Peter Keller C. Updating inventory: Using oblique videogrammetry & data fusion[J].Journalof Forestry, 2002, 100(2):45-50.
[11]杨春梅,胡万义,白 帆,等.木材缺陷检测理论及方法的发展[J].林业机械与木工设备,2004,32(3):8-10.
[12]胡英成,顾继友,王逢瑚.木材及人造板物理力学性能无损检测技术研究的发展与展望[J].世界林业研究,2002,15(4):39-46.
[13]肖忠平,卢晓宁,陆继圣.木质材料X射线与超声检测技术研究的发展与展望[J].木材加工机械,2004,15(1):25-27.
[14]王金满,周秀荣.刨花板施胶效果计算机视觉分析方法[J].东北林业大学学报,1994,22(3):25-26.
[15] Klinkhachorn P. Prototyping an automated lumber processing system[J]. Forest Products Journal, 1993 (2): 11-18.
计算机视觉的基本概念范文3
1、虚拟现实技术发展历史
虚拟技术的发展历程大致可以分为以下三个阶段:1970年代以前为第一阶段,1980年代初到1980年代中期为第二个阶段,1980年代末期至今为第三个阶段。
1973年Myron Krurger提出了“artificial reality”,这是虚拟现实技术的早期词语表达。
1980年代初期到1980年代中期,此阶段开始形成虚拟现实技术的基本概念,在此期间先后出现的典型系统有DARPA开的SIMNET虚拟战场系统,M.McGreevy等开发的虚拟环境视觉显示器,WPAFB开发的VCASS飞行系统仿真器。
1980年代至今,虚拟现实技术日趋完善。1992年Sense8公司开发了“WTK”开发包,为VR技术提供更高层次上的应用;1994年3月首次正式提出VRML这个名字,后来又出现了大量的VR建模语言,如X3D,Java3D等;1994年Burdea G出版了虚拟现实技术一书,书中使用3I(Imagination、Interaction、Immersion)概括VR的三个基本特征。
G306;TP333;TP309
1.1 手势识别
手势是一种自然,直观,易于学习的人机交互手段。以人手直接作为计算机的输入设备,人机间的通讯将不再需要中间的媒体,用户可以简单的定义一种适当的手势来对周围的机器进行控制。手势研究分为手势合成和手势识别,前者属于计算机图形学问题,后者属于模式识别问题。手势识别技术分为基于数据手套和基于计算机视觉两大类。
以人手直接作为输入手段与其他输入方法相比较,具有自然性、简洁性和丰富性,直接性的特点,因此用计算机来识别手势提供了一个更自然的人机接口。但是由于其难度较大,目前的研究结果尚不能实用化。
手势识别的方法有:模拟匹配技术,神经网络技术,统计分析技术。数据手套的识别目前较多采用神经网络的方法。由于神经网络可以用静态的和动态的输入,和适合用快速交互的方式定义传递特征、还可以根据用户个人情况调整网络的权值,使手势识别程序能适应不同的用户。存在的不足是手势识别网络依赖于设备。当使用不同的手套设备时,要改变网络的拓扑结构,并重新训练网络得到新的权值。
1.2 国内外放任机器人专利申请分析
在专利申请方面,到目前为止,国内申请量325件,国外申请233件。
虽然国内数据手套的研究起步较晚,但是发展很迅速,进入二十一世纪以后,申请量猛增。这与国家过关计划,国家863高技术发展规划、国家973重点基础研究发展规划和国家自然科学基金会等都把VR列入了重点资助范围是密不可分的。
对于中国以外的国家和地区,其申请量比较可以看出美国的专利申请量远超其他国家和地区,占到了36%,美国在数据手套方面的发展位列世界前茅,其次是韩国和日本,分别位列申请量第2和第3。
2、数据手套发展及专利审查
2.1、驱动安装位置(外骨架式 内置式)
根据驱动安装位置,数据手套可以分为外骨架式和内置式两种,外骨架式数据手套驱动器安装在手背上,内置式数据手套则是将驱动器安置在手上。外骨架式重量大,运动空间自由,可对手指的多关节输出反馈力,内置式结构简单,重量轻,但是手指的运动空间受到一定的限制。
由于外置式与内置式数据手套的优缺点,内置式数据手套的申请量极少,大多为外置式数据手套的申请。例如W.industries limited于1992年4月20日提交的申请(公开号WO92/18925A1),其中请求保护的是一种外骨架式穿戴式数据手套。
苏茂于2011年5月13日提交的申请(公开号CN202045638U)请求保护一种外构架式数据手套,针对现有数据手套价格昂贵,系统复杂,维护困难等缺点,提出了一种外置传感器检测关节运动的方法,通过对外部构架进行优化在各个关节基座间采用独特的连接方式,并对各关节测量点巧妙布局,降低或消除了检测机构对操作者手指运动的阻碍和影响,令操作者在使用数据手套时,其五个手指的运动还能保持最大成都的灵活或轻巧。
哈尔滨大学于2008年12月30日提出的申请(公开号CN101450484A)请求保护一种外骨骼数据手套,其具有指尖位置跟随和指尖双向力反馈功能,能够协调控制被控机械手的位置,并能受控从手手指的受力状况进行两个方向的精确反馈。结构轻巧,结合外骨骼机构的优势,伸长范围大,巧妙的选择传感器使系统的集成化程度高,便于携带,动态响应快,操作简便,承载力大,力反馈进度高,真实感强,工作可靠。
2.2 驱动方式
2.2.1电驱动
哈尔滨工业大学于2008年12月30日提出了一项专利申请(申请号CN200810209842),其中请求保护一种具有指尖位置跟随和指尖双向力反馈功能的外骨骼手指,解决现有力反馈数据手套存在的需与人手手指指节配合才能运动;不能实现双向主动驱动;结构臃肿,集成度低;力反馈时,不能很好的区分“接触”和“非接触”模式。摩擦问题突出,不利于控制的缺陷。电机驱动系统的输出端与可伸长外骨骼机构的输入端相连接,可伸长外骨骼机构的输出端与指尖力反馈装置和位置跟随装置连接,组成一个模块化的力反馈手指,能根据从手工作在自由空间或者约束空间进而实现对操作者手指运动的位置跟随或者力反馈,以增强虚拟现实或遥操作的临场感。
2.2.2气动
西南大学于2011年12月31日提出了一项专利申请(申请号:CN201110458610),其中请求保护一种虚拟现实系统,包括手臂模拟装置和力反馈数据手套装置,其中力反馈数据手套系统包括:手套,手套内壁设置有气囊,气囊通过导管与气泵相接,与气泵相接的控制器控制气泵的充气与放气。其可以实时显示手臂的运动情况,并且通过控制手套内气囊的充气和排气,来对使用者的手部进行压迫,易于实现,成本较低。
2.3 数据手套发展路线
纵观数据手套的发展,其主要涉及对数据手套结构,驱动方式和测量方式的改进,而其中测量方式和驱动方式的改进是重点,测量方式和驱动方式的改进与结构上的改进是强耦合的,前两者的改进一般必然涉及到结构的改进。
通过专利分析后,统计得到国内外在驱动和测量方面的申请量变化,其中大量申请涉及到测量方式的改进,至于驱动方式的改进则申请量很少。
3 结语
近年来,虚拟现实、多媒体和可视化对计算机系统的人机交互提出自然、高效、三维和非精确的要求,推动着人机交互界面向多通道用户界面的方向发展,使用户在视觉和听觉上能感受到真实的三维效果,同时又能和系统进行自然、高效的交互。数据手套作为主要部件之一,在虚拟现实领域发挥了巨大作用。
对数据手套的专利审查而言,通过熟悉把握专利技术的分布、所处的发展阶段以及重要申请人等信息,使得审查员可以快速的把握专利申请的技术高度,以便准确寻找对比文件,从而保证审查质量。
参考文献
[1] 崔杏园 等,虚拟现实及其演变发展[J],机械工程师,2006年第2期,22-24.
[2] 赵沁平 等,DEVENT中的虚拟现实技术[J],系统仿真学报,第12卷第4期,2000年7月,296-299.
计算机视觉的基本概念范文4
关键词:图像处理技术;深度学习;教学探讨
中图分类号:G642.3 文献标志码:A 文章编号:1674-9324(2016)09-0115-02
引言
图像处理是电子信息、计算机类专业的重要课程[1],是一门涉及多领域的交叉学科,是模式识别、计算机视觉、数字视频、视频通讯、多媒体技术等学科的基础。在图像处理技术课程的教学中,不但要让学生掌握其基本概念和原理,还要让学生尽可能理解和掌握图像处理在当前时代应用的最新发展。图像处理所讲授的理论和实验过程较复杂[2,3],如何让学生能灵活应用这些知识,是课程学习的难点。
在高度信息化的知识经济时代背景下,深度学习已经引起高校教师的普遍重视[4],深度学习特别是“如何促进深度学习”也成了当前学习研究的重要内容。本文结合电子信息学科的特点和多年的教学经验,引入深度学习框架,对图像处理技术课程的教学模式与实践模式进行了探讨。
一、图像处理课程特点
图像处理有相关课程、基础课程较多,实践性强,发展快、应用领域不断扩展,新方法内容抽象,要求数学基础高等特点。随着安防系统中图像处理技术的广泛应用,智能手机中的拍照功能越来越强,以及指纹识别、人脸检测等功能在智能手机中的引入,图像处理技术在生活中已经无处不在了。图像处理技术涉及的相关课程有模式识别、数字视频、计算机视觉、多媒体技术等。基于随机场MFS的方法、基于图论的方法、基于偏微分方程的方法在图像增强、分割等各个方面的应用,这些方法要求数学基础高,给教学带来了难度。
理论和实践的结合是本课程的关键,注重基础理论和技术的教学,以及加强学生实践能力和课题研究能力的培养是本课程的主要教学目的。由于涉及课程较多,只有在相关的模式识别、数字视频等课程学习完后,才能进一步的开展实践。这些工作需要在课程设计、毕业设计等实践环节中才能开展。
二、走向深度学习
深度学习是指在理解学习的基础上,学习者能够批判性地学习新的思想和事实,将其融入原有的认知结构中,并将已有的知识迁移到新的问题中,做出决策并解决问题的学习。它是一种主动的、探究式的、理解性的学习方式,将其引入图像处理课程的教学实践中,可以让学生进行理解性的学习,深层次的加工各门相关课程的信息,进行主动的知识建构和知识转化,灵活应用知识来解决实际问题。反思是贯穿于整个学习活动过程的一个重要环节,其主要目标是通过对学习过程及结果的调控来促进问题解决,是促进深度学习的重要策略之一。针对课程构造了一个较为复杂、完整的深度学习框架,参考这个框架,本文构造一个简化的深度学习策略,主要过程为:a.基础知识学习;b.问题提出;c.反思、知识建构或转化;d.知识应用、解决问题。
“基础知识学习”是一般教学过程都具备的前期学习过程,为后面的深度学习提供基础;“问题提出”是结果应用实践,给出学生们感兴趣的问题,引起对学习的注意;“反思、知识建构或转化”是深度学习的关键环节,通过对知识的建构,促进对各个相关知识的综合理解、转化,完善基本技能;“知识应用、解决问题”体现深度学习的高阶特性,将知识、技能进行综合联接。
深度学习的一个重要特点是灵活的知识应用。图像处理是门实践性很强的课程,需要通过解决实际问题,促进学生对知识的深刻理解,把知识灵活运用,促进深度学习的开展。图像处理要求的知识面较广,新技术、新方法很多,受到学生基础知识限制,不能在短短的课堂上讲述所有的方法。针对本科生的教学过程,不仅在课堂教学中引入深度学习,在相关的课程、实践环节中都体现图像处理技术的具体应用,每个环节中根据实际情况,引入深度学习过程模式。让学生能真正学会自己动手解决问题,提高学习的兴趣和主动性。
三、课堂教学中的深度学习
在课堂教学过程中,可以根据“问题―反思―生成”模式来开展教学活动,即通过创设问题情境、制造认知冲突来引导学生进行反思探究、知识建构及问题解决。部分教学知识点的深度学习教学模式设计如下。
(一)图像增强教学中的应用
“问题―反思―生成”模式设计对应如下:
“噪声对图像的影响―产生原因―低通滤波器设计(平滑模版)”。
教学过程中,首先联系电路分析、数字信号处理等课程提出问题:
1.“图像噪声和电路噪声的相同点”。
2.“电路中用RC电路去除噪声,数字信号中如何模拟这一过程”等。
在反思环节中,引导学生明白,噪声在时域上的体现是快速变换的信号,在图像中是随着空间间隔快速变换的光的强度;RC电路的本质是利用电容的充、放电过程,减缓信号的变化,达到去除噪声的目标。
在生成环节中,引导学生结合数字信号处理中的FIR数字低通滤波器,采用简单的邻域加权平均,减弱信号的变化量,达到平滑噪声目的。不同加权系数,构成了不同的平滑模版。
(二)车牌识别教学中应用
车牌识别是图像处理中结合实践常见的一个应用例子,包含图像预处理、车牌检测、二值化、字符分割、字符识别等多个子过程,每个子过程都可以利用“问题―反思―生成”的深度学习模式来开展教学活动。
例如在字符识别子过程中,首先提到的问题是“计算机如何做识别”,这个问题比较有难度,在“反思”阶段只能引导学生通过比较两幅数字图像的每个像素值,也就是模版匹配的方法,到达识别的目的。这样在“生成”阶段可以利用相关法进行匹配,完成识别过程的任务。
四、将科研思想、深度学习方法运用到实践科研过程中
课堂学习,以老师讲授为主,没有体现学生的主动性。在相应的实验课上,以及后续的课程设计、毕业设计环节,引入深度学习,结合老师的一些科研课题,让学生主动思考,增强学生的主动性。在这阶段的实践中结合深度学习,以问题为中心,让学生通过查阅资料和及时的交流讨论自主的解决问题,这样培养了学生初步开始科研活动的能力。
(一)课程实验中,引入深度学习,合理设计实验方案
图像处理课程实验方案设计中,结合生活中的实际问题,实现photoshop、美图等软件中的部分相应算法,实验素材采用学生自己生活中的照片。让学生自己寻找想解决的问题,通过反思、分析,灵活运用相关知识,解决问题。这样达到提高学生学习兴趣、增强学习主动性的目的。
(二)课程设计过程中设计简单的应用题目
课程实验中,由于时间短,只能对课本上的部分算法进行实现,不能进行更多的综合反思。课程设计是一个持续数周的实践过程,在这过程中,设计些简单的应用题目,让学生有充足的时间反思,为后续的毕业设计做准备。
(三)本科毕业设计阶段,提炼综合题目
教师可以从科研课题和开发项目中,提炼出一些关键问题,并结合当前学生感兴趣或觉得有前途的工具平台,作为本科生毕业设计的题目。临近毕业了,学生们在找工作过程中已经接触了较多的社会,他们选择课程设计经常带着较强的倾向性,选择通常受到以后工作的需求、媒体上宣传等因素影响较重。近年来,随着智能手机的普及,社会上对Android环境下的编程工程师需求较多,学生们对这方面的知识需求也较迫切,而课程的设置却难以跟上这些需求。毕业设计中如果可以补充学生的知识需求,无疑可以大大提高学生们的兴趣。
将教师图像处理方面的科研与学生需求结合,提出“Android平台下的人脸检测”、“Android平台下的字符识别”、“二维码的检测与提取”、“Android平台下视频运动目标检测与跟踪”等题目,这些题目的成果可以运行在学生手机上,提高了学生的兴趣和成就感。
五、总结
针对数字图像处理课程的特点,结合多年的教学体会,在课堂教学、实践等环节引入深度学习,对一些教学过程进行了探讨。通过深度学习模式,激发学生的学习兴趣,培养学生的动手能力,促进学生对知识的深刻理解,灵活掌握知识运用,提高学生的学习兴趣,增强创新能力。教学改革是一项长期任务,如何更有效地改善教学效果,还需要在教学实践中不断的探索。
参考文献:
[1]张永梅,马礼,何丽.图像处理技术课程教学探讨与实践[J].计算机时代,2014,(10):76-77.
[2]李金萍,陆玲,刘自强,徐玮.数字图像处理课程实验教学改革探索[J].科技视界,2012,(7):23-24.
计算机视觉的基本概念范文5
关键词:人工智能;专家系统;Prolog;面向人工智能
中图分类号:G642 文献标识码:A
1 引言
人工智能(AI)是计算机科学的一个重要分支,同时也是计算机科学与技术专业的核心课程之一。本课程在介绍人工智能的基本概念、基本方法的基础上,主要是研究如何用计算机来模拟人类智能,即如何用计算机实现诸如问题求解、规划推理、模式识别、知识工程、自然语言处理、机器学习等只有人类才具备的“智能”,本课程重点阐述这些方法的一般性原理和基本思想,使得计算机能更好地为人类服务。
2 人工智能课程体系
人工智能主要研究传统人工智能的知识表示方法,其中包括状态空间法、问题归约法、谓词逻辑法、语义网络法、框架表示、剧本表示等;搜索推理技术主要包括盲目搜索、启发式搜索、消解原理、规则演绎算法和产生式系统等。
人工智能的研究课题主要包括计算机视觉、规划与行动、多Agent系统、语音识别、自动语言理解、专家系统和机器学习等。这些研究论题的基础是通用和专用的知识表示和推理机制、问题求解和搜索算法,以及计算智能技术等。
经过笔者调研发现,目前在本科高校绝大部分将“人工智能”课程性质设为专业选修课或专业必修课,而在高职院校相关专业基本上不开设此课程,但是在具体实践教学过程中发现,在其它专业课程的教学过程中也会与人工智能理论或技术相结合,比如数据库技术、信息系统安全方面等领域,当讲到相关课程,同时会结合人工智能的理论,授课过程中发现大部分同学对该课程很有兴趣。
本课程在我校计算机科学与工程学院作为一门专业选修课开设,总学时数为:60(其中理论学时为36,实验学时为24),随着计算机技术的不断更新发展,人工智能的应用领域也变得越来越广,因此,人工智能(AI)这个学科已不再陌生,很多学生对其充满兴趣和好奇,所以在选课人数上远远超过其他选修课的人数,另外结合我校的实际情况,部分理论或实验又可以与农学、生命科学系等其它专业结合起来而应用。
3 人工智能理论教学实践
多年以来,人工智能获得很大的发展,已经引起众多学科和不同专业背景学者们的日益重视,成为一门广泛的交叉和前沿科学,但是直到目前为止人工智能至今仍尚无统一的定义,要给人工智能下一个准确、科学和严谨的定义尚有困难,其现有的一些定义多数是立足于各自的专业而定义的,存在片面性。
同时“人工智能”是一门交叉性的学科,其主要涉及到了控制论、语言学、信息论、神经生理学、心理学、数学、哲学等许多学科,所以该学科具有知识点多、涉及面广、内容抽象、不易理解、理论性强,与此同时需要学生具备较好的数学基础和较强的逻辑思维推理能力等特点,从而形成在教学实践中老师讲得吃力、学生听得吃力的局面。尽管在多年的研究和教学过程中笔者已积累了一些经验,但是对于如何把握好这门课程的特点,激发学生的学习兴趣和热情,帮助学生更好的理解和应用这门课程,目前仍然有很多问题需要研究和解决。
针对“人工智能”课程相关内容比较抽象,公式推导比较繁琐等特点,教师除了具有完善的教学大纲、合理的教学计划以及合适的教材外,还应该根据学校的实际硬件条件尽可能地选择多媒体教学手段来辅助教学,因此在实践教学中,笔者经常会配合教学内容,充分利用计算机、投影仪以及互联网的优势,结合多种教学方法与手段去组织整个教学过程。例如:在讲述搜索推理技术时,使用一些小的演示软件,将相关推理技术的理论通过动画的形式一步一步演示出来;而在讲专家系统相关理论知识时,尤其是各种类型的专家系统,利用互联网上的一些在线视频资源为例,给同学进行详细讲解,通过具体的案例来进行专项知识点的讲解及实现与应用;在自动规划这一章,给同学们选择演示发达国家目前研制的各种类型机器人,通过这些形象生动、行为举止高仿真的机器人来给学生讲理论,这样学生通过亲自观看视频资源,不仅可以拓宽知识面及视野,同时也可以及时地了解国际及国内机器人的发展水平及差距,不断纠正自己的错误观点并更新自己新的专业认识;另一个方面也可以同时激发学生们的学习兴趣热情和积极性,俗话说:“兴趣是学生最好的老师!”这一点在课堂实践教学中得到验证,得到广大同学的认可和赞同,整个教学课堂不再那么单调枯燥乏味,基本可以达到在娱乐轻松的氛围中学习专业知识,同时再整个教学过程中,师生互动机会增多,学生不再是被动地接受知识。
4 实验教学实践
4.1 客观存在问题
本校开设“人工智能”课程,主要是面向计算机专业的大学三年级的同学,同时作为一门专业选修课而设,理论课程为36学时,而实验学时24学时;与此同时经过对其它兄弟院校的调研发现,很多高校虽然也是设为专业选修课,但建议学生们都去学习这门新学科,从而为今后的专业知识及具体应用打下一定的基础;当然在调研中也发现,部分本科高校虽然开设了“人工智能”课程,但是仅是纯粹理论教学,从一定角度来讲,理论原理是前沿,但是由于太过于抽象,而且空洞、难以理解,多数同学反映学习效果并不理想,有关具体理论部分的具体实现仍然不解。
本科高校一般都严格按照培养方案进行科学设置,同时各个学校根据本校人才培养方案分配各门课程的学时。由于现在我国的教育提倡注重对学生动手能力的培养,培养综合型、应用型人才,因此笔者再结合实践教学经验及对学生的调研,发现“人工智能”课程除了要进行理论方面的讲解外,还应注重实验教学。此外,在高职院校的培养方案中,侧重加强学生的动手能力的培养,也建议将此课程列为开设的范围之内,而在实验学时上可以安排相对多的实验学时,在了解“人工智能”理论的前提基础之上,主要进行相关理论的具体应用与实现,通过这样的教学安排,可以提高学生的实践动手编程能力,例如图1,专家系统的知识库、工作存储器及界面的设计与实现。
计算机视觉的基本概念范文6
【关键词】 图像配准 互信息 粒子群优化算法 烟花算法
引言
图像配准是图像处理应用方面的一个基本问题,主要目的是将不同传感器、不同角度、不同时间或不同拍摄条件下获取的同一场景的两幅或者多幅图像进行对准、叠加(主要是几何意义上的),在很多领域有着广泛的应用,如计算机视觉、医学诊断与辅助治疗、遥感影像、三维建模、图像拼接等。通常情况下图像配准过程可分为3部分,首先确定参考图像和配准图像的变换方式,其次确定图像配准的相似性测度方式即相似性测度函数,最后确定对图像配准参数求解的优化算法。现有的图像配准方法主要分为基于特征的图像配准和基于灰度的图像配准。前者虽然计算简单且算法效率高,但是特征点的选取对配准精度和配准结果的影响很大,且特征点的正确选取较为困难。 而后者主要取决于图像的灰度统计特征,无需进行图像预处理且配准精度高,所以广泛应用于图像配准中。
一、标准的PSO算法
粒子群算法(PSO)是kennedy和Eberhart于1995年提出的一种基于群智能的随机优化算法。这类算法的仿生基点是:群集动物(如蚂蚁、鸟、鱼等)通过群聚而有效的觅食和逃避追捕。在这类群体的动物中,每个个体的行为是建立在群体行为的基础之上的,即在整个群体中信息是共享的,而且在个体之间存在着信息的交换与协作。粒子群算法就是以模拟鸟的群集智能为特征,以求解连续变量优化问题为背景的一种优化算法。
在粒子群算法,每个粒子代表所求解的优化问题中的一个可行解,它的适应度值由目标函数来确定,每个粒子都有自己的飞行速度,整个粒子群会共享最优解信息且跟随个体极值和全局极值进行移动,不断调整自己的位置和速度,直到最终发现最优解。
其中,pbesti(t)表示进化到t代时粒子i的个体最优位置;gbest(t)表示进化到第t代时整个粒子群的最优位置。
在公式(1)中粒子群算法的速度更新由三部分组成,第一部分成为粒子的先前速度,第二部分称为“认知(cognition)”部分,表明粒子个体的认知能力,来源于粒子自身的经验和思考,加速因子c1可以调节粒子飞向自身最好位置的飞行步长,第三部分称为粒子的“社会(social)”部分,表明粒子间的信息共享和相互作用,加速因子c2可以调节粒子向群体最优位置的飞行步长。
二、烟花算法
烟花算法通过模拟燃放的烟花在空中爆炸的这种行为建立相应的数学模型,通过引入随机因素和选择策略形成一种并行爆炸式搜索方式,进而发展成为能够求解复杂优化问题最优解的全局概率搜索方法。
烟花算法由四部分组成:爆炸算子、变异算子、映射策略、选择策略组成。
烟花算法具有局部搜索能力和全局搜索能力自调节机制。烟花算法中每个烟花的爆炸半径和爆炸火花数是不同的,适应度值差的烟花的爆炸半径较大,使其具有更大的“探索能力”―――勘探性。适应度值好的烟花的爆炸半径较小,使其能够在该位置
周围具有更大的“挖掘能力”―――开采性。此外,高斯变异火花的引入可以进一步增加种群的多样性。
三、互信息测度
互信息是信息理论汇总的一个基本概念,通常用于描述两个系统间的统计相关性,或者是一个系统中所包含的另一个系统信息的多少,它可以用熵来描述。互信息可用于图像配准的理论依据是:如果两幅图像已经配准,则它们的互信息达到极大值。
四、粒子群优化算法的改进
通过对标准粒子群算法的分析可以发现粒子群优化算法中存在如下问题:首先,参数控制范围太过笼统,针对不同的问题,如何选择合适的参数来达到最优化的效果。其次,粒子容易早熟,粒子的^早收敛会使函数陷入局部最优不能得到配准参数的全局最优值。本文对粒子群算法的改进思想是:首先将粒子群初始化,在进化过程中将根据粒子的收敛性动态调整惯性权重系数,因为当惯性权重w较小时,粒子群算法类似于局部搜索算法具有很强的局部开发能力;当惯性权重w较大时,粒子群算法类似于全局搜索算法,具有很强的全局搜索能力可以探索更广阔的搜索区域,但它的收敛速度更慢,根据以上情况我们可以动态调整粒子群的惯性权重,使得在粒子群飞行的前期,w值较大,在粒子群飞行的后期w值较小,公式如下:
wi为当前粒子i的惯性权重,ai为粒子的适应度函数值,amax为粒子群当前最大适应度函数值,t为当前的跌倒次数,tmax为最大迭代次数;由于粒子群是从随机解出发寻找最优解,且存在早熟的可能不能保证每次均能找到最优解,此时我们需要定义一个粒子群适应度的理论最优值Fbest和适应度的标准差S,当S=0时,若全局适应度全局最优值gbest=Fbest,我们可知粒子得到全局最优解,若gbest
我们引入烟花算法中的高斯变异算子改变粒子的多样性,公式如下
xij=xij+(xbj-xij)・e (10)
其中,e为一个高斯分布的随机变量,其均值为0,方差为1;xbj为当前烟花种群中适应度最优的烟花在第j维上的位置信息。xij为当前烟花i在第j维上的位置信息。此时算法的具体步骤如下。
1、输入参考图像和配准图像,初始化粒子群的位置和速度。
2、根据公式(5)计算粒子的适应度。
3、根据公式(3)和(4)更新粒子的个体极值和全局极值。
4、根据公式(9),更新粒子的惯性权重w
5、根据公式(1)和(2)更新粒子的速度和位置。
6、判断终止。计算群体适应度标准差 S。并根据适应度理论最优值Fbest判断粒子群是否达到全局最优,若达到则终止;若未达到则进行下一步。
7、根据公式(10),更新粒子的位置。返回步骤(2)继续运行。
五、实验结果及分析
在本次算法的实验中,参考图像大小均为为256×256,分别使用标准粒子群优化算法,本文的混合优化算法和文献[5]算法M行处理。实验数据如表1;配准前后的3组图像如图1。
从表1中可以看出:由于粒子群初始解的随机性,标准的PSO算法和文献[5]的算法在图像配准中均会陷入局部极值,虽然这两种算法运算速度快,但是图像配准的精确度不够高,而且配准的平均误差比较大,本文中的算法虽然比其它两种算法相比耗时较长,但是该算法配准的精度高,对图像配准有不错的效果。
六、 结论
本文提出的基于互信息的PSO-FWA算法的图像配准方法,在配准过程中人工干预少,且只依赖图像的灰度统计信息,避免了图像预分割和特征提取等操作,大大提高了图像的配准效率。而且经过实验证明,该算法可极大的避免函数陷入局部最优值,保证了较高的配准精度,在图像配准方面有很好的效果,具有较好的实用性和实际应用价值。
参 考 文 献
[1] 张银蒲,基于互信息的图像配准技术的研究[J].核电子学与探测技术,2012,32(5):562-568
[2] 陈显毅,图像配准技术及其MATLAB 编程实现[M].北京: 电子工业出版社, 2009.