前言:中文期刊网精心挑选了计算机视觉发展报告范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉发展报告范文1
关键词:计算机视觉;教学应用;教学改革
计算机视觉是人工智能学科中的一门重要课程。随着相关应用在多个领域中的出现,越来越多的学生开始对这门课产生了浓厚的兴趣。如何让学生能够在整个课程中保持盎然的兴趣,并为有志于深入研究计算机视觉的学生指明方向,成为我们教师首先应注重的问题。
在实际的教学工作中,通过不断摸索总结,我们认为,以实际应用引导学生的学习兴趣,既满足了学生想了解计算机视觉实际应用的需求,又加深了学生对于算法的理解,把算法放在一个实际应用中,学生可以理解怎么用,为什么这么用。在这样的目标导引下,我们从选择教材开始,准备教学内容(包括合理的应用实例的选择)、制作PPT、探索教学方法,形成了目前以实际应用为主导的创新教学体系,非常受学生欢迎。在此,我们对这期间遇到的问题,解决方法、心得体会做一个总结和思考,希望能对同行有些许参考作用。
1选择教材
在我们这个专业,每年的上研率基本都保持在50%左右。在本专业的研究生阶段,也开设了双语教学的计算机视觉课程。另外,毕业后选择参加工作的同学也基本都进入和本专业非常相关的一些单位,所从事的工作,都是和在学校学习的知识密切相关。
因此,如何让这门课程的教学既兼顾本科毕业就参加工作的那部分同学,又兼顾继续深造的学生的需求,也是在这门课程讲授的过程中,需要特别注意的一个问题。对于本科毕业就要参加工作的同学而言,需要“广度”,需要了解计算机视觉这门课在各个领域中的应用,在实际中接触到相关的项目或工作时,能够知道去哪里可以找到自己需要的参考资料;而对于要进一步深造的同学而言,则需要一定的“深度”,为研究生阶段的研究打下基础。
全盘考虑到这些学生毕业之后的去向,我们选择了两本教材。一本是贾云得教授编著,科学出版社于 2000年出版的《机器学习》[2],这是一部顺应了时代与教学发展要求的教材,对计算机视觉中的基本概念、基本算法、基本算法的应用、经典应用进行了由浅入深的介绍。内容涵盖了所有经典的数字图像处理与机器视觉方法,也对一些已经得到非常好实际应用的方法,如光流法等作了简要介绍。另外还选择了一本英文原版的计算机视觉的经典著作,Ramesh Jain 教授等所著的《Machine Vision》[3],机械工业出版社于2003年出版。这是国内外非常推崇的一本计算机视觉著作,该教材条理清晰,深入浅出,对计算机视觉的基本原理、算法、应用的介绍非常详尽。
在教学中,我们采用了英文的PPT,但主要用的教材是贾云得教授的《机器视觉》,这样中英文对照讲解,一方面加深学生对教学内容的理解,另一方面也为学生今后阅读专业的英文论了相应准备。
2教学内容和工程实例的选取
2.1选取教学内容
本课程之前,大学二年级的本科生已开设数字图像处理课程,但所讲的基本原理和算法都非常浅显,所以在教学内容的安排上,分为两大部分:数字图像处理部分和视觉部分。数字信号处理部分主要讲解在视觉部分会用到的一些基本算法,为后面进入计算机视觉部分打基础。这部分约占总课时的1/3。视觉部分的课时也分为两部分:算法讲解与实例讲解。在算法讲解部分,对计算机视觉的基本算法、经典算法都做了深入浅出的讲解。实例部分则选择了经典的工业应用,让学生能够对所学算法进一步加以理解。
2.2选取适当的工程实例
就计算机视觉的教学内容而言,各个孤立的算法和方法对本科生来讲,有些抽象不好理解。如果在教学上仅仅通过老师在课堂上的讲解,很难让学生深入地理解相关的教学内容,而选择一个触手可及且简单好理解的工程实例往往就会达到意想不到的教学结果,学生可以把课堂上所学的枯燥理论与现实中活生生的事物联系起来,从而加深对教学内容的理解。
通过反复比对、反复论证,我们选择了在讲解基本原理和算法之后,在课程结束前,专门留出课时讲解手机制造这个例子。手机现在是人手一部,是这些年青学子再熟悉不过的事物了,通过对手机主板、手机键盘的制造过程的讲解,把所学的算法都融合进来,学生在觉得有趣的同时,不知不觉就加深了对所学算法的理解。
另外,在教学的过程中,我们还不断穿插其他学生耳熟能详的实例,如数码相机原理中的一些算法的讲解,我们和学生一起探讨应该怎么选择数码相机。再有,滤波器算法、在课堂上对Photoshop功能的演示,与所学算法关联起来,学生都很容易理解接受。
3教学点滴
3.1点睛之笔
在第一节课的讲述中,我们的重点不在于Marr理论,而是告诉学生:
人工智能就是要让计算机像人一样,能够会听、会看……
我们这门课程就是要让计算机“会看”,要像人一样会看。进而展示给学生一些我们精心挑选的图片,让学生自己判断,是不是自己的眼睛“骗了”自己,人眼和计算机看到的到底有什么不一样。
每次讲到这里,学生都会进行热烈的讨论,每个人都有不同的看法,每个人都有自己的坚持,不知不觉中,对这门课就产生了浓厚的兴趣,有了继续深入学习下去的愿望。在课堂讨论的最后,比较人眼对图片的判断以及计算机的判断后,让学生自己总结归纳,我们这门课到底要研究些什么,都有可能应用在哪些方面,然后对争议比较大的提议一一探讨。每到这个时候,大家的积极性就都被激发出来,在不断的争论与思想碰撞中找出正确的结论。
3.2拿身边的事物说“事”
计算机视觉课程的前半部分,多涉及到图像处理的一些常见算法。在讲授各种各样的滤波器和算子时,并没有针对各个滤波器和算子摆出一堆示例图片,让学生比较滤波前后的差异,从而很生硬地理解滤波器与算子的功能。取而代之的,我们首先以现在人手一台的数码相机为例提出问题,你为什么要选择你手里的这台数码相机?当初选这个品牌和型号时,你的考虑是什么?历年学生的回答几乎都是看网上测评,或者在网上看别人怎么说。这时列出我们收集到的各个品牌相机的测评报告,列出它们的优缺点,然后引导学生去思考,例如这个品牌的相机的缺点是照片发灰,不是很鲜亮,而另一个品牌的相机则绿的特别绿,红的特别红,为什么?那么有可能是哪部分的算法不够完善,为什么?
通过如此简单的对比,学生的积极性被完全激发。原来,数码相机这个几乎人人都有,大家都熟悉的“玩具”竟然和自己在课堂上学到的知识这么密切相关。
再有,就是利用学生们都熟悉的PS(Photoshop),演示现在所谓的“完美证件照”是怎么来的。为什么可以把疙疙瘩瘩的脸部皮肤变得光滑?在PS中,你就是点了一下鼠标,其实在后台,是加入了一个滤波器进行了滤波。各种这样的演示,学生都非常喜闻乐见。因为他们突然发现,原来那些事物,和我自己接触到这些看似枯燥的理论之间,还有这么深刻的联系。
还有一个很受学生欢迎的例子就是对于“鼓形失真”的讲解。我们的老师每次讲到这里,都不会简单告诉学生“鼓形失真”发生的原因是什么,应该怎么解决?老师都会问学生,明星为什么都一窝蜂去减肥?现在的女明星为什么都要去弄个“锥子脸”?课堂上就会出现一个小,男同学和女同学的看法各异,彼此之间开始争论不休。此时再趁热打铁地问学生,如果拿着相机,离自己的鼻子一公分,会拍出什么样的效果?有学生开始拿出手机对着自己和别人开拍,有的学生开始头头是道地分析。每到这种学生都开始热烈讨论的时候,就可以适时引导学生往正确的方向去,让他们自己找到正确的分析解决方法,往往这个时候,学生都会颇有成就感,对于问题的理解也会特别的深刻。
3.3选择合适的实际应用
在所有理论讲解结束后,我们会留出2~4次课讲述计算机视觉在工业上的应用。这些年来,对于手机制造这样一个工业应用,非常受学生欢迎。正如“数码相机”这个例子一样,现在学生都是人手一部手机,是大家再熟悉不过的东西。这个例子涉及到了在前面理论讲述中的大部分算法,如二值图像的处理、模板匹配、高斯滤波器等。学生通过对这个工业应用的理解,更进一步加深了对算法的理解。
以讲解手机键盘的制造过程为例,向学生提出和前面所讲内容相关的问题,引导学生自发思考,如为什么选择模板匹配法,而不是采用其他更复杂更精确的方法等等。每到这个时候,课堂气氛总是分外热烈,学生各抒己见,在不断争论中,更进一步加深对课本上枯燥理论的认识。
在这里需要注意的问题是一定要一步一步提出问题,循循善诱,引导学生一层一层地深入思考。如果问题的答案过于“深藏不露”,则有可能触发学生的抵触情绪,无法继续深入地思考。
4结语
通过多年的教学摸索,我们认为,在计算机视觉课程的讲述中,以实际应用引导学生这样的教学方法非常可取,而且也收到了很好的效果。另外,除了制定好的教学大纲,并选择合适的教材外,根据学校现在的时间情况,我们选择了多媒体手段辅助教学,充分利用Matlab和大屏幕投影等方方面面的优势,结合多种方法进行教学,对讲好计算机视觉这门课,非常有益。
参考文献:
[1] 林尧瑞,马少萍. 人工智能导论[M]. 北京:清华大学出版社,1989.
[2] 贾云得. 机器视觉[M]. 北京:科学出版社,2000.
[3] Ramesh Jain. Machine Vision[M]. 北京:机械工业出版社,2003.
[4] 蔡自兴. 智能控制原理与应用[M]. 北京:清华大学出版社,2007.
Innovation in the Course of Computer Vision
HAN Hong, JIAO Li-cheng
(School of Electronic Engineering, Xidian University, Xi’an 710071, China)
计算机视觉发展报告范文2
3月17日,阿里巴巴宣布成立VR实验室,瞄准的是VR购物。同时,它会联合旗下的阿里影业、阿里音乐、优酷土豆,制作VR内容。而今年下半年,腾讯将基于PC端和移动端的两款VR头部显示器。
根据美国风险投资数据公司CB Insights的数据,2017年第一季度,AR/VR领域的投资项目超过80个,同比增长60%。报告还披露了Facebook和苹果分别为其A/VR工作招聘了一千多名员工。
所谓VR,就是通过计算机技术为用户模拟出逼近现实的虚拟环境。其沉浸式体验和交互方式带来的新的娱乐方式,吸引了从硬件技术到内容生产和分发的多个公司。除了阿里巴巴、腾讯、Facebook和苹果,HTC、三星、索尼等公司都在这个领域展开业务。
目前,这个行业的人才供应远低于需求。人力资源平台领英去年的一份针对全球范围内VR人才的报告显示,在领英的人才库里,有18%的人才需求来自VR行业,仅次于美国,但合适的VR人才只有2%。
熬过资本的冬天并存活下来的公司变得更加务实,而且开发了更多样化的应用场景―除了去年的影视、游戏产业,今年它们还进入到了医疗行业、制造业、零售业等新领域。
如果你对VR行业感兴趣或者看好它的前景,我们将告诉你这个领域正在找哪些人、薪水怎么样,以及怎样可以加入。
AVRO备的核心职位主要有3种
VR硬件的核心技术很复杂,涉及算法、光学、系统开发、交互、图形图像等多个领域,核心职位围绕的都是这些方向。它们也多是HTC、三星等硬件公司的VR业务范围。
算法工程师
这是VR领域最基础的职位。VR的功能是通过一副眼镜,让人既看到人眼看不到的东西,又能在虚拟空间中移动,还能对虚拟景象形成真实感,因此需要一套算法把这些感官上的功能都实现。通常,算法工程师关注的是如何解决某一类特定问题或实现某一特定功能。在VR领域,这一职位主要需要懂计算机视觉、空间定位、交互技术、图形图像等算法。
计算机视觉主要是指以摄像头代替人眼识别目标和提取特征,工程师需要探索最新的算法以及技术的可行性,负责视觉和图像的处理;空间定位指的是通过VR设备使用者能确定自己在空间中的位置,高精度的空间定位可以为用户带来更好的沉浸感并降低眩晕程度;接下来,交互算法工程师负责手势识别、视线估计、动作捕捉、追踪等相关计算机视觉算法的研发,研究实际空间中的动作如何延伸到虚拟空间中;然后是图形图像的处理,它要求在满足性能的前提下提高画质,用更快的速度和更少的资源去画像。
光学和人体工学工程师
光学要解决的是让VR设备的镜片在保证沉浸感和清晰度的同时,尽可能加大视场角,让人在佩戴VR设备时看得更清晰;人体工学关注的则是人在佩戴VR眼镜时的舒适度,设备是否透气、不漏光、足够轻盈等。目前消费级的VR产品在这方面仍处于初级阶段,如何让人更舒适持久地使用VR设备,是行业发展的瓶颈之 一。系统架构师
与成熟的智能手机、智能手表的开发系统不同,VR的系统架构到目前为止并没有行业标准,面对陌生的领域,系统架构师需要驾驭和设计整个系统,负责VR头部显示器及整个主机设备的集成。
BVR产业链上的工作还有这些
要实现VR体验,只有一部VR硬件设备可不够,可以观看的内容、节目效果,以及应用场景的开发,这些需要硬件公司以外的公司参与,Facebook等公司涉及的主要是这部分内容。
3D引擎开发和3D美术
3D引擎开发人员主要负责VR场景的搭建―戴上VR眼镜后你看到的“新世界”,就是所谓的VR场景。市场上主流的开发引擎有两种,一种是可以快速开发的Unity3D引擎,一种是可以制作恢弘场景和细致光效的虚幻4引擎,这种引擎在游戏开发中常使用。
3D美术人员则需要制作3D美术素材,将素材置入场景后,再配合引擎程序员优化游戏的性能。
内容制作
你知道,无论电影还是游戏,当你想要通过VR眼镜获得这些娱乐的时候,它们除了像一般的电影和游戏产品那样需要脚本,还需要影视制作人员使用360度全景视频的拍摄技术去拍摄和剪辑,这是二者在内容制作方法上的不同之处。
销售运营、产品经理
不同于刚起步的人工智能,VR已经迈入产业化阶段,公司除了需要尖端技术人员,对市场销售、平台运营方面的人才同样有需求。要求与其他领域大同小异,都是负责开拓市场和客户,增加产品的销售范围等。因VR企业希望快速打开市场,销售人才目前高居中国VR领域人才需求的第二位,高于全球水平。
产品经理的职责也很共通,负责其他VR公司与本公司部门的配合,制定和推进合作项目,把控整体合作项目的时间,并对最终合作质量负责。
常规开发
和任何智能硬件一样,VR也需要内置一套系统,其中包括App Store一样的平台以及应用软件,这部分工作与传统互联网、手机行业的开发工作相似,即在实现VR设备的智能化的同时,保证软件在不同平台间能流畅交互。
C要进入这个行业,需要你有这些能力和资历
技术岗位硕博优先
VR行业的岗位主要指向三个方面:硬件、软件和内容制作。
硬件领域涉及到计算机、光学、电子、机械、生物学、自动化等方向。软件需要计算机图形学、程序设计、数据结构、操作系统、算法设计与分析等相关背景。这两个方面对工科背景的人才需求更大。VR内容包括游戏、影视等,需要3D美术、拍摄方面的学术背景。
由于VR产业相对细分,产业上游硬件、软件开发的岗位会以硕士、博士学历优先,因为硕士和博士在学术领域的研究方向更为明确,企业在筛选简历时更容易适配岗位。
“如果毕业论文方向是图形图像、计算机视觉,就会非常抢手,不仅是VR行业,在人工智能领域也会受到欢迎。”科锐国际高科技行业总监田丹说。
VR行业的核心技术岗位中,招人要求最高的是算法工程师,这也是最难招聘的岗位。学历必须是硕士以上,同时是模式识别、信号处理等科班出身。另外,对深度学习和机器学习有了解是加分项。
至于市场销售、平台运营甚至内容领域的人才,这个行业对学历背景要求不高,更看中经验、人脉以及办事的灵活度。毕竟,新兴行业最需要资源嫁接能力。
应届生也有机会,尤其是海归
打开招聘网站,VR技术岗位的招聘一般以最少一年工作经验起步,往上的话,有的职位要求3到5年的工作经验,有的甚至要求10年以上的经验。这个门槛主要是因为VR技术虽然还不怎么成熟,但它是高集成性产品,需要在算法、架构、光学和人体工学等成熟技能的基础上再提出应用上的高要求。
但应届毕业生并非完全没有机会。对国内的VR公司来说,开放应届毕业生招募主要有两种情况。一是已经在行业里挖到技术领域的大牛,需要为其配备团队,因此会招聘一定比例的应届毕业生。二是产品经理这类岗位入门门槛不高,公司也愿意花时间培养。
相较而言,海归会比较受到这个行业的欢迎。微鲸VR人力资源总监Tony在为3D场景交互岗位招聘时发现,国内很少有这方面的专业人才,但德国的3D场景交互领域向硅谷输送了不少人。他后来意识到,这是因为德国的高校有对口专业,所以即使是刚毕业的应届生,Tony也会第一时间把对方请到公司来。
再说到内容领域,VR内容领域要制作哪些内容并没有明确标准。毕竟,还没有人敢下结论说:VR只能用来做什么、不能做什么。这个行业眼下正是需要创意和研究拍摄方式的时候。
D这些领域,跨行到VR更容易
游戏
游戏是VR最早被应用的场景之一。虽然VR游戏一度遇冷,但从长远角度看,从游戏行业跳到VR行业尝试新的游戏形态未尝不可。擅长技术的话,可以继续走Unity3D开发、3D建模和3D美术的路。即使有大量游戏公司仍在观望,但VR游戏带来的体验感确实是电脑、手机无法取代的。这也是HTC Vive、PS VR、Oculus等公司目前大量需求的产品。
互联网和半导体
互联网和半导体是VR行业人才来源的两大核心区域。VR行业缺少的系统架构人才在微软、IBM、AMD、英特尔或者高通都能找到。
工业设计
截至目前,用户对于VR硬件设施的体验普遍是抱怨“长久佩戴时头显过重,舒适感不够”。这就需要人体工程学领域的人才来改进产品,他们一般会从设计领域找人,尤其是工业设计。
影视
影视行业从业者主动跳到VR行业的比例相对更高。“他们对整个行业的理解和感知更多,当他们意识到有新的拍摄方式可以尝试,主动投身的人就会更多。”Tony说。他以微鲸一位制片人为例,对方在电视台累积了多年经验,有自己的工作室,同时还在高校任教,最终选择进入VR领域就是想尝试不一样的东西。
E哪些公司在寻找人才?
初创公司
新技术面前,全球企业处于同一起跑线。以技术为核心的初创公司为了站稳脚跟,同样在该领域争夺人才。暴风魔镜、蚁视、大朋、微鲸等国内VR厂商熬过资本严冬,对招聘也有了更高需求。“初级岗位不难招,要招就招核心算法,特别是如果我们想超越海外同行,招人就更重要。”大朋VR合伙人兼首席战略官章立说。
大公司
虽然无论是Facebook,还是HTC、索尼,都没有将技术研发落地中国,但巨头们为了造势,频频联合产业链上下游合作,发起各类联盟,为开发者提供诸多便利,这从另一个角度为从业者带来了更多机会。
Fa c e b o o k今年4月宣布建立首个增强现实(Augmented Reality,AR)平台,同时VR社交平台Facebook Spaces的Beta版;微软于5月10日宣布将开放Windows Mixed Reality开发者套件预购。5月18日,Google也宣布要在今年年底推出Daydream VR一体机,其首批合作伙伴是HTC和联想。
还有苹果,在6月6日的WWDC大会上,苹果宣布Mac将支持HTC Vive,开发者可在MacBook上使用SteamVR平台。同时,AR方面推出开发套件ARKit。
从这些大公司的策略中也能看出,VR已经不仅是它们手中的一张牌,混合现实(Mixed Reality,MR)、AR以及人工智能日后都将联合起来。
F这行的薪水到底怎么样?
去年5月,拉勾网了一份《VR/AR行业薪酬报告》,报告显示,技术职位在过去几年始终是核心诉求职位,即使岗位需求在2016年有所下降,也在总体岗位中占比50.5%。同时,市场方面的人才需求明显提高,2016年占比12.3%,两年间增长了一倍。
根据报告,在VR行业,无论是技术、产品还是市场、运营等岗位,薪酬水平皆高于互联网领域。去年5月,全行业技术岗位月平均薪资为1.35万元,而VR/AR行业技术岗位的月平均薪资达到了1.85万元。即使是最弱势的职能部门,薪资也高于行业平均值7100元,达到8300元/月。
Tony证实了这一现象。物以稀为贵,VR行业里技术岗薪水最高,而在技术岗里,算法工程师的薪酬排名第一。算法工程师如具备硕博学历,年薪一般在30万元至60万元,3D引擎开发人才的年薪也在30万元至40万元。这还不包括公司为留住人才发放的期权和奖金。非技术职位的薪水也会比原行业略高,但总体上相差不大。
科锐国际在《2017年薪酬指南》中也指出,在新技术领域里,计算机视觉、深度学习方向薪酬涨幅最快。人才储备主要在几家跨国公司和顶级高校,VR行业的人才薪酬已经在高点,人才流动的吸引力更多来自职位前景。不过若遇到急缺位,跳槽涨幅可能高达50%以上甚至100%,比如算法类的岗位就是如此。
G进这行前,你得有点心理准备
如果你有兴趣进入这个新兴行业试一试,章立和Tony提醒你:
计算机视觉发展报告范文3
对于中国而言,人工智能的发展更是一个历史性的战略机遇,对于缓解未来人口老龄化压力、应对可持续发展挑战、以及促进经济结构转型升级至关重要。
那么目前,人工智能在中国的发展条件如何,中国距离成为真正的人工智能强国还有多远?7月13日,《中国人工智能发展报告2018》在清华大学主楼接待厅。
报 告中称,目前中国人工智能的发展已经具备非常优越的条件,然而要成为真正的人工智能强国,中国还任重道远。中国在论文总量和高被引论文数量上都排在世界第 一,但中国在人才总量,以及杰出人才占比偏低。在产业上,中国的人工智能企业数量排在全球第二,不过,中国人工智能领域的投融资占到了全球的60%,成为全球最“吸金”的国家。
报 告指出,中国必须加强基础研究,优化科研环境,培养和吸引顶尖的人才,在人工智能的新基础领域实现突破,保证人工智能发展的根基稳固。同时,要大力鼓励产 学研合作,让企业成为人工智能创新的主导力量。积极参与到人工智能全球治理机制的构建中,在人工智能未来的技术发展、风险防范、道理伦理规范制定等领域发 挥中国独特的作用。
这份报告由清华大学中国科技政策研究中心、清华公共管理学院政府文献中心、北京赛时科技有限公司、科睿唯安、中国信息通信研究院和北京字节跳动科技有限公司联合。
论文总量世界第一,杰出人才占比偏低
报告中称,在论文产出上,中国人工智能论文总量和高被引论文数量都是世界第一。中国在人工智能领域论文的全球占比从1997年4.26%增长至2017年的27.68%,遥遥领先其他国家。
高校是人工智能论文产出的绝对主力,在全球论文产出百强机构中,87家为高校。中国顶尖高校的人工智能论文产出在全球范围内都表现十分出众。
不仅如此,中国的高被引论文呈现出快速增长的趋势,并在2013年超过美国成为世界第一。
但在全球企业论文产出排行中,中国只有国家电网公司的排名进入全球20。
从学科分布看,计算机科学、工程和自动控制系统是人工智能论文分布最多的学科。国际合作对人工智能论文产出的影响十分明显,高水平论文中国通过国际合作而发表的占比高达42.64%。
专利申请上中国专利数量略微领先美国和日本。中国已经成为全球人工智能专利布局最多的国家,数量略微领先于美国和日本,三国占全球总体专利公开数量的74%。
全球专利申请主要集中在语音识别、图像识别、机器人、以及机器学习等细分方向。中国人工智能专利持有数量前30名的机构中,科研院所与大学和企业的表现相当,技术发明数量分别占比52%和48%。
企业中的主要专利权人表现差异巨大,但中国国家电网近五年的人工智能相关技术发展迅速,在国内布局专利技术量远高于其他专利权人,而且在全球企业排名中位列第四。
中国的专利技术领域集中在数据处理系统和数字信息传输等,其中图像处理分析的相关专利占总发明件数的16%。电力工程也已成为中国人工智能专利布局的重要领域。
虽然在论文总量和高被引用论文数量上中国排名领先,但在人才投入上,中国表现并不突出。
根据该报告,截至2017年,中国的人工智能人才拥有量达到18232人,占世界总量8.9%,仅次于美国(13.9%)。高校和科研机构是人工智能人才的主要载体,清华大学和中国科学院系统成为全球国际人工智能人才投入量最大的机构。
然而,按高H因子衡量的中国杰出人才只有977人,不及美国的五分之一,排名世界第六。企业人才投入量相对较少,高强度人才投入的企业集中在美国,中国仅有华为">华为一家企业进入全球前20。
中国人工智能人才集中在东部和中部,但个别西部城市如西安和成都也表现十分突出。国际人工智能人才集中在机器学习、数据挖掘和模式识别等领域,而中国的人工智能人才研究领域比较分散。
中国人工智能企业数量全球第二,但投融资规模最大
报告称,中国人工智能企业数量从2012年开始迅速增长,截至2018年6月,中国人工智能企业数量已达到1011家,位列世界第二,但与美国的差距还非常明显(2028家)。
中国人工智能企业高度集中在北京、上海和广东。在全球人工智能企业最多的20个城市中,北京以395家企业位列第一,上海、深圳和杭州也名列其中。中国人工智能企业应用技术分布主要集中在语音、视觉和自然语言处理这三个技术,而基础硬件的占比很小。
风险投资上,从2013到2018年第一季,中国人工智能领域的投融资占到全球的60%,成为全球最“吸金”的国家。但从投融资笔数来看,美国仍是人工智能领域创投最为活跃的国家。
在国内,北京的融资金额和融资笔数都遥遥领先其他地区,上海和广东的人工智能投资也很活跃。从2014年开始,国内人工智能投融资活动的早期投资的占比逐渐下降,投资活动日趋理性,但A轮融资还是占主导地位。
中 国人工智能市场增长迅速,计算机视觉市场规模最大。2017年中国人工智能市场规模达到237亿元,同比增长67%。计算机视觉、语音、自然语言处理的市 场规模分别占34.9%、24.8%、21%,而硬件和算法的市场规模合计不足20%。预计2018年中国人工智能市场增速将达到75%。
计算机视觉发展报告范文4
(大连东软信息学院电子工程系,辽宁大连116023)
摘要:智能科学与技术概论课程是智能科学与技术专业重要的必修基础课,对整个专业课程体系有概括性的引导作用,对学生深入学习后续课程有很大帮助。文章从智能科学与技术概论课程的教学实际出发,提出该课程的整体课程规划,并根据学生的学习情况验证其适用性。
关键词 :智能科学;专业基础必修课;课程规划
基金项目:2012年辽宁省普通高等学校本科工程人才培养模式改革试点项目(G2201249)。
第一作者简介:林宝尉,男,讲师,研究方向为计算机视觉、模式识别,linbaowei@neusoft.edu.cn。
0 引言
智能科学与技术概论课程是智能科学与技术专业的必修基础课。学生通过学习基础课,能够了解整个专业的知识构成、体系结构以及发展方向,便于将来学习必修专业课,包括模式识别、人工智能、智能机器人等课程。在这个过程中,如何让学生顺利地过渡到更高层次的专业课学习中,如何提高其学习兴趣,如何帮助学生深入了解各门专业课之间的层次关系,都是该专业设置过程中需要考虑的问题。智能科学与技术概论的规划起到了承上启下的作用。虽然专业导引课也从全局对该专业的情况进行了介绍,但其内容以学生职业引导、兴趣培养为主,对专业课程的设置并无过多展开。因此,智能科学与技术概论课程的设置十分必要。
1 课程规划设置
1.1 能力指标
课程将学生的能力体系分为5个部分:技术知识与推理能力、开发式思维与创新、个人职业能力、态度与习惯、时间构思设计实现和社会贡献,与其对应的二级、三级及详细指标见表1。每个能力指标平均对应4个学时,共32个学时。
1.2 讲授方式
(1)精讲多练。通过讲解智能科学的相关内容并结合相关实验,让学生掌握智能科学的基础知识,提高其学习兴趣,为后续课程的学习打下良好基础。
(2)以项目为导向组织教学,通过案例教学,将构思、设计、实施和运行引入教学过程中。
(3)鼓励学生自主学习,加强基本职业能力的训练。教学过程中注意互动和引导,运用讲授教学、练习教学、实验教学、案例教学等多种教学方法完成教学任务。
(4)教学实施过程中,提供丰富的教学资源,如多媒体课件、案例、网络资源、优秀学生作品和外文技术资料等。
(5)对学生进行多方面考核与评价。结合课程实施过程,从知识掌握、能力水平、态度表现等方面,对学生进行全方位的考核。
1.3 讲授内容
该课程讲授内容分为3个单元,具体内容如下。
单元一:智能科学导论,主要涉及智能科学与技术的目标界定、学科分类、涉及范围、学科定位、人类认知以及学科简史等知识点。该单元将在2个学时中完成,并要求学生课外学习2个学时。
单元二:学科基础理论知识,主要涉及机器系统、视觉感知、高级语言编程等知识点。该单元主要介绍支撑学科的相关课程,并在实践课中使用高级语言编写简单系统。该单元共10个课时,其中包括4个实践课时。
单元三:专业课介绍,主要涉及数字图像处理介绍、模式识别介绍、计算机视觉介绍、智能机器人介绍等相关必修专业课的入门介绍,并在每次课程结束后配合实践编程、工具使用、机器人搭建等实践环节提高学生的学习兴趣,使其全面认识后续专业学习。该单元共20个学时,其中包括12个实践课时。
1.4 实验设置
实验课程共16个学时,包括4次实验,详细内容如下。
实验一:数字图像处理实验。使用课程中讲授的Matlab语言,实现数字图像的傅里叶变换、边缘检测功能。该实验共4个课时,配合单元一以及单元二的部分知识点,使学生基本掌握Matlab编程语言,并理解数字图像处理的基本知识。
实验二:模式识别机器学习实验。该实验利用高级程序语言,实现数据的SVM算法以及KMeans算法,让学生理解模式识别以及机器学习等知识。该实验共4个学时。
实验三:计算机视觉实验。使用图像拼接、3D场景重建等相关专业工具,实现二维图片的3D重现。该实验共4个学时。
实验四:机器人实验。学生在机器人实验室,实际动手组装博创模块化机器人,并编程实现机器人运动调试。该实验共4个学时,实验地点为模块化机器人实验室。
1.5 结课考试
在教学的各个环节,教师从出勤情况、日常表现、作业、实验、结课项目及结课报告的完成情况对学生进行全方位的考核,其中结课项目、调查报告及实验作业占最终成绩的90%。结课项目为小组项目,4个学生为一个小组完成系统的设计、编写、调试等步骤,并组织5名教师对每个小组进行答辩考核。
2 问题及改进
学校于2012年申请创办智能科学与技术专业。该专业培养学生掌握计算机基础、电子电路、控制方法、智能信息处理与识别等基本知识,使其具备信息处理、自动控制、人工智能系统开发等基本能力。智能科学与技术概论课程在大二下学期开设,共32学时,其中理论教学16学时,实践教学16学时。通过理论教学和实践教学,学生了解了智能科学的基础理论知识,掌握该专业核心专业课的关系,认识相关后续课程,并能够使用简单的算法和工具,为日后深入学习专业课打下良好基础。
2.1 教材选择
由于本专业办学时间较短,没有足够的针对智能科学与技术概论的教材可供选择。现阶段使用较多的教材为《智能科学与技术导论》以及《智能科学》。《智能科学与技术导论》是钟义信主编、北京邮电大学出版社出版的、适合智能专业大一新生使用的专业教材,对整个专业有详细的介绍,适合作为新生的专业导引课程,安排16个学时较为合适,并不适于我校智能科学与技术概论课程的要求。《智能科学》是史忠植主编、清华大学出版社出版的专业教材,该教材对整个智能专业的重要内容都有涉及,系统地介绍了智能科学的概念和方法,吸收了脑科学、认知科学、人工智能、数理逻辑、社会思维学、系统理论、科学方法论和哲学等方面的研究成果,适合高年级学生使用,安排64个学时较为合适,也不适于我校情况。
鉴于上述原因,我们设计该课程时,前半部分理论知识介绍使用了《智能科学与技术导论》,后半部分专业课程介绍使用自制课件。经过2轮的教学实践以后,我们将根据教材使用情况编写自用的讲义教材。
2.2 内容设计
该课程内容会介绍智能专业的重要专业课,但要在32学时内完成所有专业课程的介绍,并保证该课程内容不与专业导引课以及智能信息处理导引课冲突,难度很大,因此选择最合适的讲授内容,对于该课程的授课效果非常重要。
在授课过程中我们发现,学生对简单的数字图像处理、计算机视觉的流行应用以及动手要求强的机器人课程兴趣较大,但对数学推导要求较高的模式识别、机器学习等课程接受程度较低。该课程的教学目的是让学生了解相关课程的意义、历史、发展等知识,所以,建议加大实验动手课程的课时比例,让学生多使用相关知识、算法和应用,尽量避开复杂的数学推导。
2.3 资源配置
学校的智能科学与技术专业创建于电子工程系,依托电子系的软硬件实验室,培养学生的软硬件知识储备,提高学生的实际动手能力。其中,软件算法将配合嵌入式设备进行硬件集成,并指导学生设计具有智能算法应用的硬件设备。教学过程中将使用校实验室中的模式识别嵌入式开发板、博创模块化机器人平台以及Turtlebot智能机器人平台。该课程在实际讲授时,理论课以及算法相关实验在大班进行,硬件实践课程在小班进行,能取得较好的授课效果。
3 实施效果
在该课程设计内容的指导下,智能科学与技术概论已经完成了2轮的课程教学,并在课程结束后组织学生填写调查问卷。题目分两类,第一类包括课程目标是否清晰、该课程能否提起学生对该专业课的学习兴趣、该课程的实验设计能否有效提高学生的动手能力,以及该课程的内容相关设计是否优秀。统计结果如图1所示。除极个别学生外,大多数学生都选择了符合以及完全符合,说明该课程设计可以满足教学要求。第二类问题总结学生在课程中获取的知识能力,包括编程调试、理论知识应用、信息获取、技术文档写作、自主学习、分析问题、解决问题等,为多选题。从图2可以看出,学生对各项能力的认可率均超过50%,其中信息获取、分析问题等能力的认可率接近80%,说明该课程设计基本满足教学目标。
4 结语
智能科学与技术概论对智能专业学生的深入学习起到了重要的引导作用。我们根据自身的实际情况出发,设计出适合该专业学生的课程设计安排。经过两轮的实施效果证明,该课程的设计方式比较适合学生。随着课程的持续,我们将不断解决存在的问题,并编写适合我校学生使用的教材。
参考文献:
[1]钟义信,智能科学技术导论[M].北京:北京邮电大学出版社,2007.
[2] Edward FC,Johan M,Soren O.重新认识工程教育:国际CDIO培养模式与方法[M].顾佩华,沈民奋,陆小华,译.北京:高等教育出版社,2009.
计算机视觉发展报告范文5
自动驾驶技术不仅改变了汽车在人类生活中扮演的角色,同时也为出行安全提供了更有利的保障。然而,无人驾驶到底还要多久才能真正上路?3年、5年还是30年?最近,Mobileye给出了答案,它将这个日期精确地确定到了2019年。
Mobileye是一家总部位于以色列,主要致力于汽车工业计算机视觉算法和驾驶辅助系统的芯片技术研究的科技公司。它成立于1999年,目前拥有200余名员工,分布在以色列、美国、德国、日本、西班牙、中国等地。
Mobileye产品的优势在于,作为一家“术业专攻”的公司,通过十几年的数据积累,开发出了一套优质的视觉处理算法。很多业内人士把谷歌看做是Mobileye的主要竞争者,但两家公司采取的是完全不同的技术解决方案,而目前凭借相对精密的驾驶辅助系统以及广阔的市场前景,在向无人驾驶汽车过渡的阶段,Mobileye的产品似乎更有竞争力。
从2007年开始,Mobileye的驾驶辅助系统芯片EyeQ(视觉处理芯片)就被安装到汽车中,到2012年EyeQ芯片全球部署规模突破100万。截至目前,全球有330万辆汽车安装了EyeQ芯片。通过过去10年和全世界大部分汽车厂商的合作,Mobileye积累了千百万英里不同环境、不同气候、不同道路状况横跨43个国家的驾驶场景。
Mobileye的视觉处理器系统级芯片EyeQ系列产品使用了公司开发的独特算法,全部由意法半导体公司位于法国的一家工厂生产供应。Mobileye的EyeQ芯片封装了一套完整的ADAS系统,具备包括自动紧急制动(AEB)、车道偏离预警(LDW)以及行人碰撞预警(PCW)等必要的驾驶辅助功能。沃尔沃、通用、宝马、现代、沃尔沃客车、雷诺卡车等生产的部分车型中,均使用了Mobileye的EyeQ芯片。
与此同时,对于Mobileye给出的2019年实现无人驾驶的时间点也得到了证实。目前Mobileye已经与两家保密车企达成协议,将在2019年为后者提供全自动驾驶汽车系统。Mobileye主席姐首席技术官阿姆农・沙书亚指出,大众、宝马和通用将购买2018年生产的系统,该系统可使车辆在高速上自动行驶。而2019年协议则是使车辆在任何道路上都可实现自动驾驶。沙书亚认为2019年协议是一项真正的项目,将是汽车行业的转折点。
计算机视觉发展报告范文6
【关键词】车牌识别;机器视觉;研究
0 引言
机器视觉是应用本科电子信息类的一门重要选修课,该课程涉及图像处理、计算机视觉、信号处理、模式识别和人工智能等多个领域内容。机器视觉从二维信息处理的角度研究了信息的认知、表征、处理的方法和理论,涉及的理论抽象、复杂且算法众多[1]。传统的教学方法,教师只是对照教材按部就班讲解教材中的内容,学生只是被动学习,没有实践的内容,而且所学内容比较杂乱,不能灵活应用所学的方法去解决实际的一些问题,因此该种教学方法严重束缚了学生学习主动性,制约学生的各种能力的发展,与现代社会人才培养模式极不符合,为此,急需一种新的教学模式。
项目驱动教学法是一种适应新形势下教学模式,该模式与传统的教学模式相反,从教师为中心转到学生为中心,通过项目激发学生的学习兴趣,做到了“做中学”[2-4]。项目驱动教学法虽然将教转到学,但其忽略了教师的教和项目的整体。为了弥补项目驱动教学中的一些不足,本文有效结合教师的导和项目的整体,提出了一个基于项目为核心的机器视觉应用本科课程项目。在课程中,教师可以有效引导学生主动学习图像处理、图像描述和分类学习理论的基础知识和基本技能,培养学生灵活运用相关知识解决实际问题的能力。由于机器视觉这门课程设在电子信息类大四的第一学期,这学期的学生有一个很大的特点,就是面临着找工作,急需要一些实践经验,为了提高学生的就业能力,需要选择一个有效的项目提升就业能力。项目选择既要考虑项目的难度,又要考虑课程所涉及的具体内容,本文从这两方面提出了基于现实中视频序列中车牌识别来进行项目开发,这个项目难度中等,涉及到内容主要有图像处理、模式识别的内容,这些内容是解决车牌检测和识别系统的关键。
1 车牌识别项目
车牌识别在智能交通中地位越来越突出,在港口,停车场、车辆监管方面得到了广泛的应用,涉及到了多门学科的内容,主要包括图像处理、模式识别、计算机视觉河应用数学等。车牌识别主要包含以下几个模块:车牌采集、车牌定位、车牌分割和车牌识别模模块,在每个模块中涉及到了许多相关的理论[5-6],如图1所示。本项目正好满足该门课程的相关内容,项目从教教学计划,每周的工作及成绩评估进行分析。
1.1 教学计划
经过为期8周的项目学习,可以完整地完成一个项目的开发,学到机器视觉的相关理论知识和技能。整个项目主要包含3个2个小时理论讲座和每周的1个小时的讨论会议,完成给定的项目的开发。项目开发一般有四个阶段:理论学习阶段,数据采集和预处理阶段、数据处理阶段和完善项目阶段。理论学习阶段主要是学习项目所需的理论知识和开发所要注意的内容;数据采集和预处理阶段主要是采集所需数据,完成一些数值预处理;数据处理阶段就是按照要求处理数据,完善项目阶段就是要求学生按照要求完善项目开发。这几个阶段按照时间不同分布于不同的周次完成。
第1周到2周是理论学习阶段,对于车牌识别项目来说就是要学习车牌的采集、定位、图像的预处理(如图像校正,图象增强和边缘检测等操作),字符分割(垂直投影分割,连通区域分割和模板分割),字符识别(神经网络、模板匹配和支持向量机)的理论。
第3周是数据采集和图像预处理,这两周主要是完成数据采集和图像数据的预处理,包括图像的平滑,图像的校正和边缘检测。
第4周到7周完成车牌的定位、分割和字符识别。
第8周完成项目的开发
1.2 每周工作
在项目开发阶段,每周的1个小时师生讨论会。讨论过程中,每个团队选出一名学生简短介绍自己团队一周来的工作,这些工作包括技术实现、结果,还有遇到的问题,须用PPT 展示自己团队的成果,接着教师进行点评,给出每个团队的一些建议和疑难问题分析,以及一些特别复杂的算法(如梯度方向直方图、支持向量机和神经网络等)的讲解。最后,接着用10-20分钟的时间布置下周的开发内容和疑难问题解答。
1.3 成绩评估
对于项目的评估,主要按照开发阶段和笔试成绩确定,开发的四个阶段占总分的30%,小组的口头报告占10%,10%小组的互评成绩,剩下的是笔试成绩。每个阶段团队都要上交一份10页以上的项目报告和部分源代码,每个阶段任务根据学生采用的方法的复杂性和创意性给分。在每周的讨论会议上,每个团队给给出相同时间口头报告,还有5分钟的讨论时间,要求每个成员都必须参与讨论,教师根据口头报告的内容和学生参与讨论的程度给出成绩。每个团队把自己项目开发的报告和结果互评,取互评的平均成绩作互评的成绩。除了项目实践成绩以外,还需要掌握了一些机器视觉的相关理论知识,这也避免学生忽略理论的学习,其中也让学生既理解开发所需的技术,也需要理解其对应的理论。
1.4 学生反馈
课程结束后,学生要求填写一份匿名的项目评估表,根据表的内容填写自己的见解。评估收集后,根据重视的程度,大约70%的学生认为相关理论讲座比较重视,大约82%的学生比较重视每周的口头报告,但也有一些学生抱怨时间不够,完不成项目训练。绝大部分学生认为每周的口头报告这种交流方式很好,可以相互交流,找到自己的不足,解决自己的疑难问题,完善自己的程序开发。
2 结论
本文提出了一种基于项目为核心的机器视觉应用本科课程项目,在该项目中,学生不仅可以学到了分析问题、解决实际问题的能力,而且也增大了就业的机会。课程结束后,每个团队都能开发出一套采用不同方法的车牌识别系统,虽然难易度不同,但都能识别视视频中的车牌。项目开始阶段,有些学生为了解决开发过程中面临的问题,自己主动去学习相关理论知识,这些知识不仅来自课本,而且也来自大量的相关的专业文献,也激发他们创新能力,得到了比预期好的成果。
【参考文献】
[1]史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO 教学改革实践[J].计算机教育,2013(9):40-43.
[2]王洪才.论大学创新教学的三要素[J].复旦教育论坛,2012,10(4):41-45.
[3]李成学,杨大柱.任务驱动教学法在电子技术实验课中的应用[J].中外教育研究,2011,1(1):79-80.
[4]施琴,陈军,孙娣全,卢娟,许凤慧.项目驱动教学法在电子技术实验课程中的应用研究[J].工业与信息化教育,2013,8:66-69.