前言:中文期刊网精心挑选了计算机视觉前沿方向范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉前沿方向范文1
想必当时的包括新一代Surface, Windows管理工具、微软 Office、混合云架构和SQL Server在内的众多全新产品和服务,已经让你眼花缭乱。或许你也知道,不论我们身处哪个年代,如果少了IT创新和转型,都难以取得实质性的发展和成功。
如果你在遗憾,没能前往芝加哥参加微软首届Ignite大会,了解最前沿的开发工具、最先进的IT架构、最高效的开发技术,云在当下又有哪些不同的故事?移动生态又将沿着什么样的趋势发展?如今,微软Ignite在中国的首秀,你的疑问、困惑,都将在Microsoft Ignite China中找到答案。
火热主题 干货分享
来到中国的首届Microsoft Ignite China微软技术大会,是以国内当下最为火热的“技术创新助力互联网+时代”为主题。为期三天的 Microsoft Ignite China 微软技术大会,将是金秋十月国内最为重量级的技术大会,从 2015年10 月 26 日至 28 日众多 IT 专家共聚一堂,共同讨论云基础架构及管理、生产力、大数据及物联网、统一通讯和移动应用。这里有的是最接地气的实在干货分享,在这个大数据、云计算、移动、社交等创新技术相互融合、颠覆的时代,Microsoft Ignite China 微软技术大会将与你一起实实在在地分享最前沿的技术趋势,最接地气的技术变化。本次大会将是唯一面向IT决策者、IT专业人员、企业开发人员的微软顶级技术大会。此次盛会上,微软将展示自身对于未来科技的理解,并且将在现场演示微软最新的产品、技术、解决方案。
业界专家分享见解
每一场完美的会议,都少不了业界专家们的独到解读。
或许大家还记得,在主席访美期间,为演示微软全新技术的微软全球执行副总裁沈向洋。如今他将亲临 Microsoft Ignite China 微软技术大会现场,为大家亲自讲解微软在新技术及未来趋势方面的创造发现。
沈向洋作为科技界计算机视觉和图形学研究的世界级专家,是美国电气电子工程协会院士(IEEE Fellow)、国际计算机协会院士(ACM Fellow),曾任国际计算视觉期刊编委会成员, 2007 年计算机视觉国际会议议程主席。目前,沈向洋已经发表了 100 多篇计算机视觉、计算机图形学、图形识别、统计学习和机器人科学方面的相关论文,拥有 50 多项科学技术专利。
与此同时,作为微软全面负责制定和实施大中华地区的业务运营及整体战略,公司资深副总裁及大中华区董事长兼首席执行官贺乐赋(Ralph Haupter)也将在 Microsoft Ignite China 微软技术大会上向大家介绍微软在华策略等信息。
贺乐赋已经在微软工作了十年,此前曾担任微软德国总经理。贺乐赋还曾在巴黎主管微软在欧洲、中东和非洲地区的合作伙伴业务,并担任微软中小企业解决方案与合作伙伴事业部西欧区总经理。作为中美互联网的桥梁,微软在中国将持续推动互联网科技的不断创新和发展,并且与企业和技术开发者共同合作,让技术成就不凡。
作为市场营销及运营者,微软大中华区副总裁严治庆将会向参会人员介绍,微软大中华区产品推广、市场营销等战略的制定与执行。技术的革新需要真正的落地,才能在市场上发挥更加重要的作用。2011 年起,严治庆先生担任微软 Microsoft Azure 事业部中国区总经理,全面负责 Microsoft Azure 公有云平台落地中国的整体规划和实施,使微软真正成为首个将全球公有云带入中国并率先投入商业运营的跨国企业。在国内拥有大量的全球顶尖互联网、云计算、大数据等方面的技术人才,更好的市场推广能够帮助这些人到更加合适的切入契机,相信严治庆分享的微软经验,将帮助与会者在市场上发掘更多机会。
真实世界中的软件团队开发,由于互联网与移动应用的市场特性,正经受史无前例的挑战。如果你想知道当下全球规模的DevOps 的转型、实践与反思,就更不能错过Microsoft Ignite China。针对这个以技术为核心的主题,Microsoft Ignite China 微软技术大会还将邀请来自微软开发平台事业部的全球资深副总裁潘正磊,为大家介绍在技术开发过程中的新感受。众所周知,微软全球研发团队的敏捷转型已经是知名的成功案例之一,从盒装软件开发迈向云计算服务运维的过程中,微软本身也掌握了宝贵的DevOps实践经验。1992 年加入微软之后,潘正磊曾任微软服务器和开发平台事业部的 Visual Studio 商业应用总经理,管理中美两地的一线研发团队。她还负责 .Net 平台的工作,是 Visual Studio 开发工具产品开发与开源的推手。
此外,微软全球 Office 产品总经理 Jared Spataro, 微软Windows BG高级产品总监Craig Dewar 等资深技术专家,以及来自国内知名的企业家、创业先锋和技术大牛都会同与会者分享最前沿的技术趋势。
参与 Microsoft Ignite China 微软技术大会,您可零距离聆听十二大精彩课程主题中的一百余场与微软最新技术相关的重量级课程,率先体验到微软最新技术及最新解决方案的实践分享。现场还将有 Delphi 和 C# 之父安德斯・海尔斯伯格(Anders Hejlsberg),微软全球 Office 产品总经理 Jared Spataro等众多资深技术大咖们,以及来自国内知名业内人士共同探讨最前沿的技术成就。
“互联网+”时代的到来,大数据、云计算、移动、社交等创新技术正在快速地碰撞、融合。技术在我们的生活、工作中起到愈发重要的作用,各行各业都在积极拥抱技术变化。与此同时,IT 技术的快速革新,也为 IT 人员与企业提出了全新的挑战。面对这样的挑战,IT从业人员需要不断学习、创新,以增强业务竞争力。正如微软CEO萨提亚・纳德拉所说:“这是一个‘移动为先,云为先’的世界,这个世界观不仅关乎我们在IT变革中所处的位置,更重要的是指明了技术的前景和发展方向,这也是我们身处IT行业的非凡意义所在。”
Microsoft Ignite China 微软技术大会将为各界人士提供一个全新的视角,帮大家抓住更多的科技机会,创造更具挑战的未来。
计算机视觉前沿方向范文2
关键词:时空拓扑特征;稀疏表达;行为识别
0引言
随着信息与物联网技术的发展,计算正渗透和影响生活的各个方面,根据传感器数据来识别和理解行为将成为未来“以人为中心的计算”中的关键[1],其中基于视觉的人体行为识别与理解尤为重要。它涉及人体的检测跟踪、行为特征提取与识别等核心问题,是近年科研机构、权威期刊和计算机会议备受关注的前沿方向[2],在商业、公共安全和军事等领域有广泛的应用前景[3],因此研究人体行为的特征提取和分类准则具有非常大的理论和现实意义。
计算机视觉前沿方向范文3
据张璐回忆,那时的美国投资圈充满了对中国创业者的好奇,虽然言语中有试探和质疑:中国企业怎么样?能不能与他们合作?负债率是不是很高?张璐耐心地给他们解释中国人经商的方式,也给一些初入美国市场的中国资本提供了不少帮助。
张璐是谁?福布斯公布的2017年30位30岁以下俊杰榜单上,张璐不仅被评为风险投资领域的30位青年人物之一,还被评为该领域的荣誉主题人物。这被视为中国新生代的投资人已经进入美国主流投资圈。
投资生鲜电商看中技术驱动
生鲜电商GrubMarket是张璐早期投资的一家由华人创业者建立的美国企业。张璐接受《中国经济周刊》记者专访时表示,投资生鲜电商“并不是我们主要的投资方向,但创始人Mike确实是很难得一见的创始人”,当年投GrubMarket主要是看中这家企业技术驱动做得很好。具体而言,在B2C市场上,GrubMarket采用订阅制,引导用户在周日前统一下单,再集中配送。举个例子,用户有了购买意愿后,GrubMarket会收集这些订单,并向农场以批发方式订货。农场收到整体订单后,再把新鲜产品运送给GrubMarket,由他们来递送。消费者下单后,一到三天的r间内就可以收到农场的新鲜产品。这样一来,在消费者端,收到的是农场的新鲜产品,价格上比实体有机超市低不少,最高折扣达到50%;在农场端,收获的是可靠且不用自己配送的大额订单。有些小农场,正是因为有了GrubMarket才能保持盈利;而对GrubMarket来说,采用这种方式既节省了物流成本与建仓成本,又增加了利润空间。
“现在的创业者跟10年前完全不一样,他们从一开始就会考虑全球化布局。基金的作用不仅是资本投资,同时也可以帮助创业者搭建桥梁和纽带。我是我们团队里唯一能说中文的,所以也就更多地充当了这样一个桥梁和纽带的角色。”张璐告诉记者,“许多在美华人有长期在美国大型科技公司工作的经验,这意味着在管理人才、完善产品、钻研顶尖技术等多个方面,他们已经对这个‘客场’非常熟悉了。比如,从GrubMarket完全符合美国市场需求的商业模式和运营手段来看,很少会有人能想到它背后的创始人是一个中国人。”
在投资人的帮助下,这家美国生鲜电商GrubMarket成为2015年美国YC孵化器春季轮次中发展最快的创业项目。目前,Grubmarket的月收入已经达到500万美元,并且在B轮获得2000万美元融资。
人工智能,硅谷基金投这四类
现年28岁的张璐毕业于斯坦福大学材料科学工程学院,并获得硕士学位。在创办NewGen Capital之前,张璐曾经创立了一家医疗设备公司Acetone Inc.并成功退出,随后又在美国主流基金Fenox Venture Capital担任投资合伙人,此后创立了风投机构NewGen Capital。
截至目前,张璐所创建的NewGen Capital旗下管理两只美元基金,其投资项目的后续融资总数达到1.8亿美元。NewGen Capital一期基金投资项目的估值增长达到了6.5倍。除GrubMarket外,张璐还帮助乳腺癌检测机构POC Medical System获得2100万美元的后续融资。
对于正处在热度中的人工智能领域,张璐表示,有4个方向值得投资,其一是机器学习,其二是计算机视觉,其三是自然语言处理语音交互,其四是工业机器人。
“机器学习之所以排在首位,是因为它是一个技术基础。在未来,机器学习将成为任何行业都能应用的一项技术。”张璐表示,很多硅谷的大公司已经开始布局。例如,微软有内部开源的机器学习平台 CNTK,已经吸引了许多开发者的关注,汇集了更多好的应用场景。谷歌有希望成为这个行业标准制定者的野心,除了有AlphaGo,它也有一个开源平台 Tensor Flow,传播范围很广。在美国之外,中国对AlphaGo博弈过程关注度最高,说明国内对于新兴技术的热情很高。国内有很多人关注的领域是智能医疗,而机器学习开发出的平台可以对接在相应的应用场景里,产生的效益是巨大的。
谈到计算机视觉,张璐认为前景广阔,因为它应用场景广泛,还可应用到无人驾驶、安防等领域,同时这个领域也需要更多的资本注入帮助寻找最合适的应用场景。
未来语音识别也会带来技术革新。张璐指出,在这个方面,中国在中文的语音识别技术方面具有巨大的机会和优势,特别是在移动互联网方面。语音识别能力的提升,将促使人们围绕语音界面来重新设计移动产品,从而推动物联网的革命,比如汽车、家用设备(TV、冰箱等)、可穿戴设备等均可使用语音作为人与机器的沟通交互界面。
计算机视觉前沿方向范文4
关键词:自然计算;图像分割;混合算法;蚁群算法;粒子群算法;化学反应算法
中图分类号:TN911 文献标识码:A 文章编号:1009-3044(2013)32-7319-02
自然界不只为人类提供了丰富的物质能源,还是人类社会智能化发展的源泉。人类对自然智能的最早学习和利用是仿生学,研究生物体的结构、功能和工作原理,并应用于工程技术。随着科技的发展,人工智能诞生,形成了计算机科学的新领域,它主要是利用人工机器模仿人的智能。自然计算理论的出现将人类对自然智能的研究推向了更广阔的领域,自然计算是继传统人工智能之后出现的一种全新的思维与智能计算模式,开辟了智能科学新的前沿。
1 自然计算
自然计算(Nature Computation,NC)是一种表示由自然启发的计算[1]的一般性术语,是仿生学和人工智能的进一步发展。一般而言,自然计算是指以自然界中物种进化原理、生物生存方式、物理化学现象、人类社会等自然中存在的一切事物作为可能的研究对象,通过研究它们的运作模式,分析其中所蕴含的丰富的信息处理机制,抽取计算模型,设计算法,并探索应用领域加以应用[2]。计算是自然的一种固有机制,是智能的基础。自然计算的特征就是比喻性地使用自然系统潜在的概念、原理和机制。通过研究自然现象,建立计算模型,应用于工程技术,进而服务于社会,这是自然计算的宗旨。
由于自然计算的本质是模仿自然界信息处理机制抽象出计算模型,其研究涉及现代自然科学的多个领域及近百种算法与计算框架,并且不断有新的算法和计算机制涌现。为了明确自然计算算法研究范畴和学科内涵,需要对其进行分类。根据各自然计算算法基于的不同的学科知识基础,可以将自然计算算法分为四类:基于物理学的自然计算算法、基于化学的自然计算算法、基于生物学的自然计算算法、基于人文社会学的自然计算算法。基于物理学的自然计算算法有:模拟退火算法(Simulated Annealing,SA)、量子计算(Quantum Computation,QC)、混沌优化、晶体生长算法(Crystal-Growth-Inspired algorithms,CGI)等。基于化学的自然计算算法有:化学反应优化(Chemical Reaction Optimization)。基于生物学的自然计算算法(一般称为仿生智能计算算法)又分为基于生物个体的算法(遗传算法、人工神经网络、免疫计算、内分泌计算、DNA计算、膜计算)和基于生物种群的算法(蚁群算法、粒子群算法、蜂群算法、人工鱼群算法等)。基于人文社会学的自然计算算法有文化算法、社会认知算法、Memetic计算、情感计算等。这些领域均以自然界中有益的信息处理机制为研究对象,具有模仿自然界的特点,通常具有自学习、自组织和自适应的特征,能够为传统算法难以解决的各类复杂问题提供新的解决方向,具有很好的应用前景。
2 图像分割
人类通过听觉、触觉、味觉、嗅觉和视觉感知周围事物。图像信息是视觉感知的主要内容,图像信息直观丰富,但人们往往只对其中的部分信息感兴趣,这些信息代表了人们观察图像的目标,这些目标通常占据一定的区域,并且在某些特性上(如灰度、轮廓、颜色、纹理等)和周围的图像有差别。图像分割就是把图像分成具有不同特性的区域并提取出感兴趣目标的技术和过程。图像分割是图像识别和图像理解前提和基础,图像分割质量的高低直接影响图像处理的效果。但没有一种通用的方法可以适用于所有的图像分割任务。图像分割是图像分析和计算机视觉中的经典难题。
3 基于自然计算算法的图像分割
3.1 可行性分析与研究意义
图像分割的性能易受多种因素影响,如图像的物理视觉特性、空间结构特性、纹理等,因此尚无普适的图像分割算法。为了提高图像分割算法的性能和普适性,在原有算法中融入新理论是图像分割发展的必然趋势。由于图像分割实质上是一个组合优化问题,而自然计算算法在解决组合优化问题时有超越传统计算方法的性能,基于自然计算算法的图像分割技术成为图像分割领域的研究热点。自然计算算法与图像分割相辅相成,自然计算算法提供了图像分割的新思路,图像分割拓展了自然计算算法的应用领域。
3.2 国内外研究现状
自然计算涉及算法较多,下面仅对蚁群算法、粒子群算法、化学反应算法在图像分割中的研究现状作代表性的阐述。
蚁群算法具有离散性和并行性特点,因而适用于数字图像处理。近年来,许多国内外研究者将蚁群算法应用于图像分割、特征提取、图像匹配、纹理分析等取得了丰富的研究成果。在图像分割领域,国内最初是韩艳芳和施鹏飞[3]从模糊聚类角度出发,综合考虑像素的灰度、梯度及邻域特性进行特征提取,将蚁群算法成功应用于图像分割。之后,研究者们尝试将蚁群算法与其他理论工具结合进行图像分割,常用的理论工具有Snake模型(主动轮廓模型)、遗传算法、混沌优化、形态学、Gabor滤波器、支持向量机、小波变换、最大熵、分水岭算法、模糊聚类等;并尝试应用于不同类型图像的分割,如台风、道路、磁共振脑部图像、红外图像、MRI图像等。
和蚁群算法类似,粒子群算法应用于图像分割时,也常与其他的理论工具结合,以提高算法的效率和图像分割的效果。常结合的理论工具有:模糊熵、交叉熵、量子计算、Otsu、粗糙集、模糊聚类等;应用的图像分割类型有:红外图像、燃气轮叶片、农业超绿图像、遥感图像、医学图像等。
化学反应优化算法2010年才被提出,很多研究都处于起步阶段,在图像分割领域的研究还需探索。郑肇葆等[4]通过分析化学反应优化算法生成生成物的过程与图像分割求最优解的过程具有相似性,建立了图像分割与CRO的对应关系,并进一步阐述了化学反应算法应用于图形分割的具体过程。这为化学反应优化应用于图像分割提供了有益的借鉴。
值得关注的是,将自然计算算法与Otsu法结合是一个可行而有效的图像分割方法。2007年唐英干等提出了基于粒子群和二维Otsu方法的快速图像分割方法[5],针对二维Otsu方法计算量大的问题,用粒子群算法来搜索最优二维阈值向量。每个粒子代表一个可行的二维阈值向量,通过粒子间的协作来获得最优阈值。实验证明该方法优于传统一维Otsu法和二维Otsu法。2009年谭枫等提出了基于文化算法和二维Otsu法的快速图像分割算法[6]。利用文化算法的全局寻优能力,对图像的二维最大类间方差进行优化,通过文化算法的种群空间和信念空间的相互协作来获取二维Otsu的最佳二维阈值向量。2009年潘等提出了二维Otsu图像分割的人工鱼群算法[7],将群智能中的人工鱼群算法应用到阂值分割算法中。实验证明了该算法不仅能够对图像进行更准确的分割,而且收敛的速度更快。2012年梁建慧等提出了将人工蜂群算法应用于图像分割[8],对待分割的图像进行灰度形态学中的闭操作预处理,以抑制图像噪声,把图像阈值看成人工蜂群算法中的蜜蜂,利用二维Otsu法设计人工蜂群算法的适应度函数;通过采蜜蜂、侦察蜂和观察蜂的分工协作和信息共享,逐代逼近最佳阈值。以上算法都是用自然计算算法对二维Otsu法进行改进。三维Otsu法运算量更大,但分割效果更好,对其进行性能优化更有理论和应用研究价值,事实上,粒子群算法与之融合是可行的,该文的第三章有详细阐述。化学反应算法作为一个新的自然计算算法,将其与Otsu法结合进行图像分割也是一种有益的尝试,在本文的第四章有相关介绍。
3.3 研究趋势
混合自然计算算法(或称为自然计算算法的融合)是目前算法研究的热点,并已应用于多个领域,但在图像分割中的应用研究较少,是未来研究的方向。混合自然计算算法就是将一种自然计算算法或其它优化技术应用于另一种自然计算算法中,以进一步提高算法的性能,如提高全局搜索能力、增强收敛速度与精度等。一般地,融合的方式分为三种:一是,利用其它优化技术对算法中的参数作优化选择;二是,在算法中引入其它算法的算子;三是,与其它算法分工进行问题的混合求解。
已有的混合算法有:混合蚁群粒子群算法、混合粒子群蜂群算法、混合粒子群与量子计算、混合粒子群与文化算法、混合粒子群与蛙跳算法、混合文化算法与鱼群算法,混合蚁群与遗传算法等。为提高算法的局部搜索能力,粒子群算法可与一些搜索技术结合,如,模拟退火、序贯二次规划、单纯形法、牛顿法、禁忌搜索、爬山法、差分进化算法、小波变异等。混合进化算法和粒子群算法的方法有:采用进化计算中的选择操作的建立混合粒子群优化模型,将进化算法中的繁殖和子种群的概念引入粒子群优化算法,对粒子位置和速度进行交叉操作,引入高斯变异,或使用了变异、选择和繁殖多种操作等。
混合蚁群与粒子群的算法混合策略有两个思考方向:一是,以蚁群算法为主、粒子群算法为辅进行图像分割,即用粒子群算法优化蚁群算法的图像分割性能;二是,以粒子群算法为主、蚁群算法为辅进行图像分割,即用蚁群算法优化粒子群算法的图像分割性能。混合蚁群与粒子群的算法已经用于解决如下问题:最优聚丙烯熔融指数预报、多目标数据关联、复杂系统模型参数的优化估计、单目标和多目标跟踪、移动机器人动态路径规划等。蚂蚁算法与粒子群算法结合可以求解离散优化问题。
4 结论
图像分割是图像分析和计算机视觉中的经典难题,为了提高图像分割算法的性能和普适性,在原有算法中融入新理论是图像分割发展的必然趋势。自然计算算法提供了图像分割的新思路。自然计算涉及算法较多,以蚁群算法、粒子群算法、化学反应算法为例,它们应用在图像分割中已取得了较好的图像分割效果。混合自然计算算法是目前算法研究的热点,并已应用于多个领域,但在图像分割中的应用研究较少,是未来研究的方向。
参考文献:
[1] Shadbolt N (2004) Nature-inspired computing. IEEE Intell Syst 19(1):23
[2] 吴启迪,康琦,汪镭,等. 自然计算导论. 上海:上海科学技术出版社,2011.
[3] 韩彦芳, 施鹏飞. 基于蚁群算法的图像分割方法[J]. 计算机工程与应用, 2004,(18):5-7.
[4] 郑肇葆,郑宏. 化学反应优化(CRO)图像分割的研究与分析[J]. 武汉大学学报(信息科学版),2012,(10).
[5] 唐英干,刘冬,关新平.基于粒子群和二维Otsu方法的快速图像分割[J].控制与决策, 2007(2): 84-87.
[6] 谭枫,杨莘元. 基于文化算法和二维Otsu方法的快速图像分割[J]. 深圳大学学报(理工版), 2009(1): 56-60.
计算机视觉前沿方向范文5
由于数码图像的普及,以及图像处理和信息提取等技术的快速发展,使人们对图像本身有了更高的要求,并且图像在越来越多的司法或其它鉴定场合成为关键证物,如何在纷乱复杂的图像中去伪存真,提取更完备更正确信息成为了当前数字图像研究中的一个热点。图像取证正是在这个背景下应运而生。
2.图像取证技术的研究意义
自进入二十一世纪以来,随着个人电脑和其他数码设备的大规模普及,图像几乎成了人们每天都能接触到的东西,成为了人们生活中有意或无意都会留下的一个参照物,所以其中包含的巨量的信息是我们取之不尽用之不竭的资源。在司法或其它鉴定领域,只要我们能合理的利用图像直接或间接包含的信息,我们就能获取我们能够想了解的任何一个方面,所以,对图像取证技术的研究具有重大现实意义。只要拥有优越的图像取证方法,我们就能够从图像中看出端倪,进而获取方方面面我们可能用到的信息,为进一步的司法举证或者其他鉴定工作打下良好基础,同时在这个信息时代中借助高科技提供充足的线索,使鉴定人员能够事半功倍的还原现场,大幅度的提升判断速度和工作效率。
3.图像取证技术的分类
人们应用图像取证技术去解决问题的追求主要有以下五个方面:
一是原始证据图像品质达不到需求,需要对图像进行各种优化处理来对图像中的细节信息进行分辨,以便更加细致的对照。在现实生活中,我们经常会遇到数码设备由于光线、环境以及设备自身性能的问题而得到的不清晰的图像,导致图像中的关键目标无法进行分辨,这类图像亟需一种有效的优化方法来区分其中的关键目标,以便为司法或者其他鉴定工作服务;
二是图像资料数量巨大,人们需要更加智能的技术来对图像中感兴趣的信息进行快速检索。当前的软硬件条件下各式各样的图像信息数量庞大,尤其是各种监控设备的广泛应用使得图像数量规模变得更加令人叹为观止,有统计显示,对于一段时长6小时的监控录像,有时甚至需要使用其时长60%以上的工作时间才能完成取证工作,所以人们在这些纷繁复杂的图像信息中寻觅自己关注的特定信息步履维艰,非常需要一种有效的针对图像内容的检索方法来快速的识别自己感兴趣的图像;
三是随着各种图像处理技术的发展和图像处理工具大规模应用,图像变得越来越容易被篡改和伪造,网络上的PS风气日益流行,并且这种修改是肉眼无法觉察的,使得我们在这些真假难辨的图像面前如坠云雾,更有甚者,一些图片伪造者别有用心,希望借其“作品”扰乱视听,歪曲事实,如大名鼎鼎的“华南虎”事件,这类问题造成诸多方面的负面影响,导致政府公信力或者公众判断力下降,破坏社会的安定团结,造成许多恶劣后果。另外许多拥有严格版权的图像也有被侵权之忧,人们需要一种有效的区分图片真伪和来源的方法;
四是图像资料中隐含的间接信息的提取,比如图像中物体的速度或者景深等三维信息,这些都是图像所能提供的间接信息,我们可以根据图像的成像原理,来对其间接信息进行分析和提取,检测图像中目标的位置或速度,来实现一些极具现实意义的应用,比如汽车超速检测等;
五是在有足够的线索时将其他信息转换为图像信息,比如模拟画像和合成照片等参考物证,这些应用是另一个意义上的图像取证。
以上五个方面的应用是建立在当前的硬件应用环境之上的,可概括为增强取证、图像篡改检测、图像间接信息提取、图像内容智能检索、基于信息的图像构建五个方面,对图像取证技术的研究能够在目前这个环境下为人们提供充足的证据,以便对某一事物进行全方位的考察。
4.主要研究方法与现状
本文论述的图像取证问题范围涵盖图像,下面对这图像取证五个方面问题的研究方法与现状分别进行介绍。
4.1 图像增强
从信号图像出现开始,人们便致力于改善图像显示效果,最早的图像增强可追溯到1921年美国和欧洲进行海底电缆通信时,为了改善模拟信号图像的还原效果,研究人员将图像的灰度等级从5个增加到了15个,大大改善了图像复原的效果。到了20世纪60年代,第一台可以进行数字图像处理的计算机研制成功,人们开始用几何校正和灰度变换等方法进行图像增强,到了70年代初,研究者已经将图像增强技术应用到医学图像、地球遥感监测和天文学图像等领域,80年代之后,硬件的快速发展让人们有更充足的图像增强算法来进行选择,进入90年代之后,图像增强技术更广泛的应用到人们的生活和生产等领域,研究者们开始尝试将这些算法嵌入到数码设备中。
目前国内外关于图像增强方法主要有基于空域的方法、基于变换域的方法和基于机器学习或贝叶斯统计的方法等。其中基于空域的方法主要是从子图像乃至像素级别对图像进行直方图均衡[1—2]、线性对比度调整、反锐化掩膜、自适应优化[3]等处理,前两者主要对图像亮度对比度进行优化,后两者主要针对图像边缘细节进行优化。基于变换域的方法包括傅里叶(Fourier)变换、小波(Wavelet)变换、曲波(Curvelet)、脊波(Redgelet)和轮廓波(Contourlet)变换、离散余弦(Discrete Cosine Transform)变换等,其原理是将图像变换到其他空间,然后利用此空间对信号处理的优势进行处理,然后再将此空间里的信号重构为空域图像的形式,以实现优化处理。
较之空域图像增强方法不同,变换域增强方法有其独到的优势。基于空域的图像增强方法往往针对性较强,如直方图均衡方法主要针对图像的对比度进行优化增强,自适应优化和反锐化掩膜主要将图像的边缘细节进行效果提升,而变换域方法有时候能够取得一举多得的效果。
随着数学理论的发展,又出现了许多新的图像增强方法,其中最具代表性的有基于数学形态学的方法、基于模糊数学的方法、基于人工智能的方法和基于偏微分方程的方法等。
4.2 图像篡改伪造检测
自1814年第一张照片问世之后不久,便出现了对照片的修改和加工,1865年著名摄影家Mathew Brady拍摄的一张照片在后期人为的增加了一个人物,从此之后,各种出于政治或者其他目的的图像篡改便流行开来,大部分都是通过拼接手段对照片中的人物或者物品进行增加或者移除,进入数码时代之后,图像篡改变的更加简单易行,随着数码技术和工具的普及,对图像是否为篡改和伪造的甄别成为了计算机领域又一个前沿课题,由于图像篡改检测涉及到司法、舆论、政府公信力和传媒等多方面的利害关系,当前学术界开始对图像篡改检测投入更多的精力进行研究。
Shih—fu chang等人通过研究CCD失真校正、非线性伽马校正、色彩插值、白平衡和传感器噪声等对图像生成的影响,并对这些影响形成的特征进行检测,从而对图像的来源和图像是否拼接进行鉴定。Hany Farid等人利用小波分解和高阶统计建模等方法来对图像素材(包括数码照片、扫描图像和计算机生成图像)进行盲检测,根据来源不同的图像具有各异的高阶统计的特性,结合机器学习和数据挖掘技术,来进行来源检测。Hany Farid和A.Popescu还根据DCT系数直方图中的类采样效应来进行二次压缩检测,并且通过EM算法(Expectation/Maximization)进行数字图像重采样检测。J.Fridrich等人利用数码相机的模式噪声来作为检测标准来判断相机,进行相机识别。马里兰大学的吴旻利用对图像不同块之间DCT系数的相关性、信噪比进行统计和双谱分析的方法,对图像的空域滤波、压缩、重采样、亮度调整等篡改操作进行检测。
在图像防伪方面,数字水印技术是当前研究的热点,并且在国内外的研究中取得了初步的进展。数字图像篡改取证的研究近年来受到了世界上各国研究机构和研究者的重视,在许多国际重要期刊与国际会议上,图像盲取证越来越多的成为一个重要专题,IEEE、Springer都为图像盲取证设置了独立的期刊,数字图像取证科学的前沿性和重要性由此凸显出来,一些图像相关厂商也在其产品中增加关于图像篡改取证的模块,图像处理工具大亨Adobe正准备在其招牌产品Photoshop中增加图像防伪外挂程序,来进行图像真伪和篡改的识别。
数字图像真伪甄别涉及到图像处理分析技术、数理统计、模式识别、数据挖掘、成像原理、计算机视觉等方面的知识,是一项比较复杂的系统工程。
4.3 图像间接信息的提取
成像的过程是将三维景物通过光学系统变换到二维平面上的过程,按照感光媒介不同可分为传统成像系统和现代成像系统,其代表分别为化学胶片和CCD(或CMOS)。在成像的过程中,拍摄目标所包含的各种相关信息也被悉数记录,在计算技术发达的今天,国内外研究者寄希望于将包含在图像中的这些蛛丝马迹加以综合运用,以便获取许多我们以前只有通过物理测量或人工识别才可以获取的信息,这些应用在现代被归类为机器视觉。
机器视觉主要通过将观察对象进行数字化,根据人类的判别规则来对观察目标进行判别,或者逆用成像原理来获取观察目标的物理数据,从而实现对数字化图像信息进行自动化的识别,这些需要识别的信息主要包括被拍摄目标与相机之间的距离、目标运动速度、图像中包含的文字乃至人物等等,对图像中的这些信息进行精确识别一直都是机器视觉领域的研究重点和难点。在现代的生产生活中,机器视觉已经越来越多的被应用到实际,完成一些重复性和机械性的识别工作,以弥补人眼长时间连续进行机械性识别易产生疲劳和不稳定的不足,减轻人类的劳动强度,在一些智能机器人中,也置入了机器视觉模块,以便判断周围环境,为高级人工智能程序提供输入信息。
1987年,Pentland首先提出了图像模糊程度与物体距离之间的关系,并将离焦图像的点扩散函数近似为类高斯函数来进行计算。1988年,Subbarao和Gurumoorthy等人取消了对点扩散函数的限制,利用线扩散函数的扩散参数来代表物体与镜头之间的距离,只需点扩散函数具有圆对称性就可以。1999年,Schechner和Kiryati采用灵敏分析的方法来使用圆柱形点扩散函数估计测距误差和不同频率成分的关系,使离焦测距算法在精度上有了更高的提升。
国内外也有许多学者根据图像中运动模糊位移来测算物体的相对运动速度,Cannon等利用频域中的零值条纹在理论上证明从匀速直线运动模糊图像中估计运动方向和相对运动尺度的可行性,但并没有给出自动鉴别的方法。
在三维重建方面,目前的主要做法是找到图像的被动线索和主动线索,然后根据同一场景的多个角度的图像来进行参数化建模。
4.4 图像内容智能检索
基于图像内容的检索是计算机领域拥有战略意义的新课题,由于其潜在应用价值极大,所以国内外对于这方面的研究都比较重视,从九十年代至今,已经有许多趋近成熟的系统问世。
国际商用公司(IBM)率先研发出第一个图像内容检索系统QBIC,其后麻省理工学院(MIT)也凭借其人才优势研发出了PhotoBook图像检索系统。美国哥伦比亚大学也开发出了VisualSeek,这类系统主要针对如何选择合适的全局特征来描述图像中的内容。为了解决图像内容检索算法实用性比较差的问题,后来的研究者提出了Image Retrieval算法,各国科学家沿着这一方向又研发出了Netra、BlobWorld、SLMPLIcity等系统。
华裔科学家黄煦涛首先将相关反馈技术应用于图像检索,以减少机器低层特征与人类高层语义之间的差异,提高检索结果的针对性。
4.5 基于信息构建图像
在计算机模拟画像方面,早期公安部组织研发了PZY—110型人像组合仪,不过未能在全国推广普及。九十年代由公安部和清华大学开发的自动模拟画像系统通过了专家鉴定。2001年中国刑警学院的赵成文教授的“警星CCK—Ⅲ人像模拟组合系统”开发成功,并达到了国际先进水平。
在颅骨面貌复原方面,我国的吉林大学和意大利都灵大学都采用了首先人工堆颅骨外观修正,再对颅骨各个面的二维图像进行采样并建模。
加拿大哥伦比亚大学的Imager Lab采用参数化人脸模型的办法来进行建模,Giuseppe等人采用CT切片的叠加来进行三维网格建模,取得了较好的复原效果。
5.总结
数字图像取证技术由于起步较晚,尚未形成系统的理论体系和研究模型。本文对图像取证技术及其研究内容做了综述,并总结了图像取证技术五个方面当前的国内外研究方法与现状。图像取证技术是在当前硬件环境下发展起来的一个新兴领域,它包括到图像质量优化、图像真伪鉴别、图像间接信息提取、图像内容智能检索、基于信息构建图像等方面,涉及到信号与信号处理、成像原理、计算机视觉、数学形态学、统计学乃至密码学等领域,是人们从繁杂的图像信息中搜索有价值线索的利器,是与现实生活息息相关的一个研究方向,对于司法取证、图像信息智能过滤和提取、敏感图像真伪鉴别等有很大应用价值,极具现实意义。
参考文献
[1]刘国军,唐降龙,黄剑华等.基于模糊小波的图像对比度增强算法[J].电子学报,2005,33(4):643—646.
[2]A.C.Popescu and H.Farid.Exposing Digital Forgeries by Detecting Duplicated Image Regions[M].Technical Report,TR2004—515,Dartmouth College,Computer Science,2004.
计算机视觉前沿方向范文6
[关键词]虚拟现实 增强现实 混合现实 教学应用
教育体制转变是改革开放30年来的伟大成果,通过国际交流与合作来打破地区封锁和僵局。新技术的广泛应用是科技教育的重要手段和方法。运用虚拟现实、增强现实和混合现实技术在教育领域中的应用,进行“虚拟实践”,是一个重要课题。
因互联网的不断发展而逐渐兴起的仿真教育在我国教育体系中扮演着越来越重要的角色。在以主要面对计算机屏幕形式进行学习的网络教育中,学习者对可视化知识学习的三维性、交互性、动态性和真实性提出了较高的要求。综合多种现代化教育手段,服务于教学过程。
在高等院校的教学方面,可以运用增强现实和混合现实的很多技术来寓教于乐。提高学生对学习的兴趣。运用增强现实技术和混合现实技术的思想和成果。
一、虚拟实践的技术内容
1.虚拟现实技术
虚拟现实技术是虚拟三维空间的一种技术。如我们熟知的好莱乌电影,我们看到的电影画面如星球大战中火爆的画面,虚拟的外星生物,太空情景等,就是虚拟现实技术的杰作,在此之前,虚拟世界与现实世界是基本完全分割的。我们认为虚拟现实的进一步发展,就是混合现实了,混合现实将真实的环境和虚拟的物体叠加到了同一个画面或空间同时存在。在早期,这些画面都是在电影生成的后期添加上去的,需要一定的制作时间,人们只能在回放的影像中以旁观者的角色去感受它。而今,虚拟现实技术正从贵族化走向平实,从试验室走入我们的生活。如果说二十一世纪影响人类社会生活的最伟大的革命是数字化技术的推广,那么最伟大的数字化技术成果就是虚拟现实。这一技术正在深刻地影响和改变着我们的生活,从此我们的生活展现了两个截然不同的世界:一个是我们所处的现实世界;另一个是基于计算机仿真的虚拟世界。两种世界的不断交织,闪现着人类智慧和创造力的火花。探索虚拟世界的奥秘成了我们学习和工作的一部分。
2.混合现实
混合现实又称扩展现实和增强现实。拥有2D/3D显示器和手势交互系统(gesture interaction)的“混合现实”工作站指示角度范围可达100°。通过触摸屏与3D显示,用户可以像感觉到一个真实的物体一样,还可以通过打手势来控制桌面电脑,再也不需要键盘与鼠标了,而且,当你触摸虚拟的物像时,还可以通过一个反馈装置来传回触觉感受,就好像在现实生活中发生的情况一样。该工作站主要包括一个由两个大LCD显示器构成的特级立体视频放映屏,一组多维立体视频手跟踪仪和三个小的桌面电脑,而这些设备都是集成在一个工作台上的。
3.增强现实技术
增强现实技术的研究与应用是一个典型的交叉学科的高技术领域,涉及了计算机图形学、并行处理、计算机视觉、人机交互技术、传感技术及人工智能等多种技术,不断发展相结合的产物,并广泛应用于工程设计、医疗、军亭、教育、娱乐、旅游等领域。增强现实技术通过跟踪用户在真实场景中所处的位置,将计算机生成的图形图像以及声音等信息“叠加”在用户感知的真实世界之上,利用这些辅助信息增强用户对真实场景的感知能力,是目前国际计算机界的前沿研究课题之一。
美国巴特尔研究所在一项研究报告中列出10个2020年最具战略意义的技术趋势,这些趋势将决定着未来一个时期的社会发展特征,其中排名第10位的便是增强现实技术。
国内研究AR系统的单位有北京理工大学、国防科技大学、西安石油学院、电子科技大学、华中科技大学、上海大学等,国外研究AR系统的单位有德国SIEMENS AG、美国哥伦比亚大学、澳大利亚Vienna大学、日本Nara协会等,这些单位已经在AR系统的摄像机校正算法、AR头盔显示器的设计、硬件平台的应用、视觉跟踪技术等方面取得了一定的成果。
二、在教学方面的应用
在高等院校的教学方面,可以运用增强现实和混合现实的很多技术来寓教于乐。增强学生对学习的兴趣。
1.三维电子书
三维电子书看上去,和普通的书籍没有不同,同样有图片和文字。当读者戴着头盔显示器在观看书页时,你可以看到立体的物体,沉浸在书中所描绘的立体虚拟世界中,以微型虚拟的替身形式与其他读者一起畅游。魔法书是非常有趣的。
2.互动投影
比如在桌面、墙面、橱窗等公共场所通过触摸屏或运用其他高科技手段来互动学习。
3.在课堂教学过程中,增强现实的应用的前景更加广泛。综合运用影视、课件及网络等多种手段,进行可视化教学。
三、虚拟实践在今后的教育发展中的应用
1.虚拟现实技术为我们提供了一种全新的实践方式,即“虚拟实践”。
它为人们认识世界提供了新的途径和方法。由于虚拟现实技术是动态的,不断发展的。从最初的VRML(虚拟现实建模语言)到当今百花齐放的X3D技术,令人目不暇接。但所谓万变不离其宗,VRML作为经典的编程语言是当今所有最先进的虚拟现实技术的本源。传统的三维动画和视频因文件量大、交互性和动态性弱的缺点使网络教育不得不寻求新的媒体技术。桌面虚拟现实技术以其良好的三维性、灵活的交互性以及对硬件资源要求的简易性等优点备受网络教育的亲睐,成为解决可视化知识学习的又一重要媒体技术。
2.增强现实魔法书
使读者可以看到立体的物体,沉浸在书中所描绘的立体虚拟世界中,以微型虚拟的替身形式与其他读者一起畅游。在课堂教学过程中,魔法书是非常有趣的。增强现实的应用前景十分广泛,可以综合运用影视、课件及网络等多种手段,进行可视化教学。