计算机视觉的主要技术范例6篇

前言:中文期刊网精心挑选了计算机视觉的主要技术范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

计算机视觉的主要技术

计算机视觉的主要技术范文1

关键词:计算机视觉技术;食品工业;分级;图像处理

中图分类号: TS207 文献标识码:A

随着微型个人计算机应用的越来越广泛,以及计算机在综合学科中应用的深入研究,现如今在工农业、军事国防、医学卫生等众多领域的使用和研究方面计算机视觉技术都起到了至关重要的作用,为了节省人力、降低成本、减少误差,该项技术在食品企业、科研院所、检测机构中的应用更加普遍。如今,在农产品药物残留检测、水果重量分级、等级筛选、质量监管等方面计算机视觉技术有众多应用。

1 计算机视觉技术概述

计算机视觉技术是利用计算机、摄像机、图像卡以及相关处理技术来模拟人的视觉,用以识别、感知和认识我们生活的世界[1]。该技术是模拟识别人工智能、心理物理学、图像处理、计算机科学及神经生物学等多领域的综合学科。计算机视觉技术用摄像机模拟人眼,用计算机模拟大脑,用计算机程序和算法来模拟人对事物的认识和思考,替代人类完成程序为其设定的工作。该技术由多个相关的图像处理系统组成,主要包括光源提供系统、图像提取系统、计算机数据运算系统等。原理是:首先通过摄像机获得所需要的图像信息,然后利用信号转换将获得的图像信息转变为数字图像以便计算机正确识别[2]。随着科学技术的发展,计算机技术在各个领域得到广泛应用,计算机视觉技术不仅在代替人类视觉上取得了重大成就,而且在很多具体工作方便超越了人的视觉功能。计算机视觉计算有如此快速的发展,是因为与人类的视觉相比该技术具有以下显著优势[3]。

1.1 自动化程度高

计算机视觉可以实现对农产品的多个外形和内在品质指标进行同时检测分析,可以进行整体识别、增强对目标识别的准确性。

1.2 实现无损检测

由于计算机视觉技术对农产品的识别是通过扫描、摄像,而不需要直接接触,可以减少对所检测食品的伤害。

1.3 稳定的检测精度

设计的运行程序确定后,计算机视觉技术的识别功能就会具有统一的识别标准,具有稳定的检测精度,避免了人工识别和检测时主观因素所造成的差异。

2 计算机视觉技术在食品检测中的应用

20世纪70年代初,学者开始研究计算机视觉技术在食品工业中的应用,近几十年电子技术得到快速发展,计算机视觉技术也越来越成熟。国内外学者在研究计算机视觉技术在食品工业中的应用方面主要集中在该技术对果蔬的外部形态(如形状、重量、外观损伤、色泽等)的识别、内部无损检测等方面。国内有关计算机视觉技术在食品业中的应用研究起始于90年代,比国外发达国家晚多达20a,但是发展很快。

2.1 计算机视觉技术在果蔬分级中的应用研究

计算机视觉技术在食品检测中的应用研究相当广泛,从外部直径、成熟度的检测到内部腐烂程度的检测都有研究。韩伟等[4]采用分割水果的拍摄图像和新的计算机算法计算水果的半径,进而得出果蔬的最大直径。研究表明,该算法不仅降低了计算量而且提高了计算精度,此方法用于水果分级的误差不超过2mm,高于国际水果分级标准所规定的5mm分类标准差,可在工业生产中很好应用。李庆中[5]也利用图像的缺陷分割算法研究了计算机视觉技术在苹果检测与分级中的应用,结果表明此算法能快速、有效地分割出苹果的表面缺陷。孙洪胜等[6]以苹果色泽特征比率的变化规律为理论基础,结合模糊聚类知识利用计算机视觉技术来检测苹果缺陷域,检测不仅快速而且结果精确。刘禾等[7]通过研究认为苹果的表面缺陷可以利用计算机视觉技术进行检测,计算机视觉技术还可以将苹果按照检测结果进行分级,把检测过的苹果分成裂果、刺伤果、碰伤果和虫伤果等类别。梨的果梗是否存在是梨类分级的重要特征之一,应义斌等[8]通过计算机视觉技术、图像处理技术、傅立叶描述子的方法来描述和识别果形以及有无果柄,其识别率达到90%。杨秀坤等[9]综合运用计算机视觉技术、遗传算法、多层前馈神经网络系统,实现了具有精确度高、灵活性强和速度快等优点的苹果成熟度自动判别。陈育彦等[10]采用半导体激光技术、计算机视觉技术和图像分析技术相结合的方法检测苹果表面的机械损伤和果实内部的腐烂情况,初步验证了计算机视觉技术检测苹果表面的损伤和内部腐烂是可行的。冯斌等[11]通过计算机视觉技术对水果图像的边缘进行检测,然后确定水果的大小用以水果分级。试验表明,该方法比传统的检测方法速度快、准确率高,适用于计算机视觉的实时检测。朱伟[12]在模糊颜色的基础上,分析西红柿损伤部分和完好部分模糊颜色的差别,用分割方法对西红柿的缺陷进行分割,结果显示准确率高达96%。曹乐平等[13]人研究了温州蜜柑的果皮颜色与果实可滴定酸含量以及糖分含量之间的相关性,然而根据相关性,样品检测的正确识别率分别只有约74%和67%。刘刚等[14]从垂直和水平两个方向获取苹果的图像,并通过计算机自动分析图像数据,对苹果的外径、体积、以及圆形度等参数进行处理,与人工检测相比,计算机视觉技术具有检测效率高,检测标准统一性好等优点。Blasco. J [15]通过计算机视觉技术分析柑橘果皮的缺陷,进而对其在线分级,正确率约为95%。赵广华等[16]人综合计算机视觉识别系统、输送转换系统、输送翻转系统、差速匀果系统和分选系统,研制出一款适于实时监测、品质动态的智能分级系统,能够很好地实现苹果分级。王江枫等[17]建立了芒果重量与摄影图像的相互关系,应用计算机视觉技术检测桂香芒果和紫花芒果的重量和果面损伤,按重量分级其准确率均为92%,按果面损伤分级的准确率分别为76%和80%。

2.2 计算机视觉技术在禽蛋检测中的应用研究

禽蛋企业在生产过程中,产品的分级、品质检测主要采用人工方法,不仅需要大量的物力人力,而且存在劳动强度大、人为误差大、工作效率低等缺点,计算机视觉技术可以很好的解决这类产品工业生产中存在的困扰。欧阳静怡等[18]利用计算机视觉技术来检测鸡蛋蛋壳裂纹,利用摄像机获取鸡蛋图像后,采用fisher、同态滤波和BET算法等优化后的图像处理技术,获得裂纹形状并判断,试验结果表明,计算机视觉技术对鸡蛋蛋壳裂纹的检测准确率高达98%。汪俊德等[19]以计算机视觉技术为基础,设计出一套双黄鸡蛋检测系统。该系统获取蛋黄指数、蛋黄特征和蛋形尺寸等特征,和设计的数学模型对比来实现双黄鸡蛋的检测和识别,检测准确率高达95%。郑丽敏等[20]人通过高分辨率的数字摄像头获取鸡蛋图像,根据图像特征建立数学模型来预测鸡蛋的新鲜度和贮藏期,结果表明,计算机视觉技术对鸡蛋的新鲜度、贮藏期进行预测的结果准确率为94%。潘磊庆等[21]通过计算机视觉技术和声学响应信息技术相结合的方法检测裂纹鸡蛋,其检测准确率达到98%。Mertens K等[22]人基于计算机视觉技术研发了鸡蛋的分级检测系统,该系统识别带污渍鸡蛋的正确率高达99%。

2.3 计算机视觉技术在检测食品中微生物含量中的应用研究

计算机技术和图像处理技术在综合学科中的应用得到快速发展,在微生物快速检测中的应用也越来越多,主要是针对微生物微菌落的处理。食品工业中计算机视觉技术在微生物检测方面的研究和应用以研究单个细胞为主,并在个体细胞的研究上取得了一定的进展。殷涌光等[23]以颜色特征分辨技术为基础,设计了一套应用计算机视觉技术快速定量检测食品中大肠杆菌的系统,该系统检测结果与传统方法的检测结果具有很好的相关性,但与传统方法相比,可以节省5d时间,检测时间在18h以内,并且能够有效提高产品品质。Lawless等[24]人等时间段测定培养基上的细胞密度,然后通过计算机技术建立时间和细胞密度之间的动态关联,利用该关联可以预测和自动检测微生物的生长情况,如通过计算机控制自动定量采集检测对象,然后分析菌落的边缘形态,根据菌落的边缘形态计算机可以显示被检测菌落的具置,并且根据动态关联计算机视觉系统可以同时处理多个不同的样品。郭培源等[25]人对计算机视觉技术用于猪肉的分级进行了研究,结果显示计算机视觉技术在识别猪肉表面微生物数量上与国标方法检测的结果显著相关,该技术可以有效地计算微生物的数量。Bayraktar. B等[26]人采用计算机视觉技术、光散射技术(BARDOT)和模式识别技术相结合的方法来快速检测李斯特菌,在获取该菌菌落中的形态特征有对图像进行分析处理达到对该菌的分类识别。殷涌光等[27]人综合利用计算机视觉、活体染色、人工神经网络、图像处理等技术,用分辨率为520万像素的数字摄像机拍摄细菌内部的染色效果,并结合新的图像处理算法,对细菌形态学的8个特征参数进行检测,检测结果与传统检测结果显著相关(相关系数R=0.9987),和传统检测方法相比该方法具有操作简单、快速、结果准确、适合现场快速检测等特点。鲁静[28]和刘侃[29]利用显微镜和图像采集仪器,获取乳制品的扫描图像,然后微生物的图像特征,识别出微生物数量,并以此作为衡量乳制品质量是否达标的依据,并对产品进行分级。

2.4计算机视觉技术在其他食品产业中的应用研究

里红杰等[30]通过提取贝类和虾类等海产品的形状、尺寸、纹理、颜色等外形特征,对照数学模型,采用数字图像处理技术、计算机识别技术实现了对贝类和虾类等海产品的无损检测和自动化分类、分级和质量评估,并通过实例详细阐述了该技术的实现方法,证实了此项技术的有效性。计算机视觉技术还可以检验玉米粒形和玉米种子质量、识别玉米品种和玉米田间杂草[31]。晁德起等[32]通过x射线照射获取毛叶枣的透视图像后,运用计算机视觉技术对图像进行分析评估,毛叶枣可食率的评估结果与运用物理方法测得的结果平均误差仅为1.47%,因此得出结论:计算机视觉技术可以应用于毛叶枣的自动分级。Gokmen,V等通用对薯片制作过程中图像像素的变化来研究薯片的褐变率,通过分析特色参数来研究薯片中丙烯酰胺的含量和褐变率也关系,结果显示两项参数相关性为0.989,从而可以应用计算机视觉技术来预测加热食品中丙烯酰胺的含量,该方法可以在加热食品行业中得到广泛应用。韩仲志等人拍摄和扫描11类花生籽粒,每类100颗不同等级的花生籽粒的正反面图像,利用计算机视觉技术对花生内部和外部采集图像,并通过图像对其外在品质和内在品质进行分析,并建立相应的数学模型,该技术在对待检样品进行分级检测时的正确率高达92%。另外,郭培源等人以国家标准为依据,通过数字摄像技术获取猪肉的细菌菌斑面积、脂肪细胞数、颜色特征值以及氨气等品质指标来实现猪肉新鲜程度的分级辨认。

3 展望

新技术的研究与应用必然伴随着坎坷,从70年代初计算机视觉技术在食品工业中进行应用开始,就遇到了很多问题。计算机视觉技术在食品工业中的研究及应用主要存在以下几方面的问题。

3.1 检测指标有限

计算机视觉技术在检测食品单一指标或者以一个指标作为分级标准进行分级时具有理想效果,但以同一食品的多个指标共同作为分级标准进行检测分级,则分级结果误差较大。例如,Davenel等通过计算机视觉对苹果的大小、重量、外观损伤进行分析,但研究结果显示,系统会把花粤和果梗标记为缺陷,还由于苹果表面碰压伤等缺陷情况复杂,造成分级误差很大,分级正确率只有69%。Nozer等以计算机视觉为主要技术手段,获取水果的图像,进而通过分析图像来确定水果的形状、大小、颜色和重量,并进行分级,其正确率仅为85.1%。

3.2 兼容性差

计算机视觉技术针对单一种类的果蔬分级检测效果显著,但是同一套系统和设备很难用于其他种类的果蔬,甚至同一种类不同品种的农产品也很难公用一套计算机视觉设备。Reyerzwiggelaar等利用计算机视觉检查杏和桃的损伤程度,发现其检测桃子的准确率显著高于杏的。Majumdar.S等利用计算机视觉技术区分不同种类的麦粒,小麦、燕麦、大麦的识别正确率有明显差异。

3.3 检测性能受环境制约

现阶段的计算机视觉技术和配套的数学模型适用于简单的环境,在复杂环境下工作时会产生较大的误差。Plebe等利用计算机视觉技术对果树上的水果进行识别定位,但研究发现由于光照条件以及周边环境的影响,水果的识别和定位精度不高,不能满足实际生产的需要。

综上所述,可看出国内外学者对计算机视觉技术在食品工业中的应用进行了大量的研究,有些研究从单一方面入手,有些研究综合了多个学科,在研究和应用的过程中,取得了较大的经济效益,也遇到了很多问题,在新的形势下,计算机视觉技术和数码拍摄、图像处理、人工神经网络,数学模型建设、微生物快速计量等高新技术相融合的综合技术逐渐成为了各个领域学者的研究热点,以计算机视觉为基础的综合技术也将在食品工业中发挥更加重要的作用。

参考文献

[1] 宁纪锋,龙满生,何东健.农业领域中的计算机视觉研究[J].计算机与农业,2001(01):1-3.

[2] 李峥.基于计算机视觉的蔬菜颜色检测系统研究[D].吉林:吉林大学,2004.

[3] 曾爱群.基于计算机视觉与神经网络的芒果等级分类研究[D].桂林:桂林工学院,2008.

[4] 韩伟,曾庆山.基于计算机视觉的水果直径检测方法的研究[J].中国农机化,2011(05):25-29.

[5] 李庆中.苹果自动分级中计算机视觉信息快速获取与处理技术的研究[D].北京:中国农业大学,2000.

[6] 孙洪胜,李宇鹏,王成,等.基于计算机视觉的苹果在线高效检测与分级系统[J].仪表技术与传感器,2011(06):62-65.

[7] 刘禾,汀慰华.水果果形判别人工神经网络专家系统的研究[J].农业工程学报,1996,12(0l):171-176.

[8] 应义斌,景寒松,马俊福.用计算机视觉进行黄花梨果梗识别的新方法[J].农业工程学报,1998,14(02):221-225.

[9] 杨秀坤,陈晓光,马成林,等.用遗传神经网络方法进行苹果颜色白动检测的研究[J].农业工程学报,1997,13(02):193-176.

[10] 陈育彦,屠康,柴丽月,等.基于激光图像分析的苹果表面损伤和内部腐烂检测[J].农业机械学报,2009,40(07):133-137.

[11] 冯斌,汪憋华.基于计算机视觉的水果大小检测方法[J].农业机械学报,2003,34(01):73-75.

[12] 朱伟,曹其新.基于模糊彩色聚类方法的西红柿缺陷分割[J].农业工程学报,2003,19(03):133-136.

[13] 曹乐平,温芝元,沈陆明.基于色调分形维数的柑橘糖度和有效酸度检测[J].农业机械学报,2009,41(03):143-148.

[14] 刘刚,王立香,柳兆君.基于计算机视觉的苹果质量检测[J].安徽农业科学,2012,40(08):5014-5016.

[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.

[16] 赵广华,飞,陆奎荣,等.智能化苹果品质实时分选系统[J].中国科技信息.

[17] 王江枫,罗锡文,洪添胜,等.计算机视觉技术在芒果重量及果面坏损检测中的应用[J].农业工程学报,1998(12):186-189.

[18] 欧阳静怡,刘木华.基于计算机视觉的鸡蛋裂纹检测方法研究[J].农机化研究,2012(03):91-93.

[19] 汪俊德,郑丽敏,徐桂云,等.基于计算机视觉技术的双黄鸡蛋检测系统研究[J].农机化研究,2012(09):195-199.

[20] 郑丽敏,杨旭,徐桂云,等.基于计算机视觉的鸡蛋新鲜度无损检测[J].农业工程学报,2009,25(03):335-339.

[21] 潘磊庆,屠康,詹歌,等.基于计算机视觉和声学响应信息融合的鸡蛋裂纹检测[J].农业工程学报,2010,26(11):332-337.

[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.

[23] 殷涌光,丁筠.基于计算机视觉的食品中大肠杆菌快速定量检测[J].吉林大学学报(工学版),2009,39(02):344-348.

[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.

[25] 郭培源,毕松,袁芳.猪肉新鲜度智能检测分级系统研究[J].食品科学,2010,31(15):68-72.

[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.

[27] 殷涌光,丁筠.基于计算机视觉的蔬菜中活菌总数的快速检测[J].农业工程学报,2009,25(07):249-254.

[28] 鲁静.乳品微生物自动检测系统的设计[J].湖北第二师范学院学报,2010,27(08):115-117.

[29] 刘侃.鲜奶含菌量快速检测系统[D].华中科技大学,2008.

[30] 里红杰,陶学恒,于晓强.计算机视觉技术在海产品质量评估中的应用[J].食品与机械,2012,28(04):154-156.

计算机视觉的主要技术范文2

以下为报告详细内容:

2017年计算机视觉技术在更多的领域有所落地应用,自动驾驶领域、高考、政务等领域更多的场景开始应用计算机视觉技术。艾媒咨询分析师认为,计算机视觉行业技术是核心基础,随着技术成熟度提高,未来将有更多的场景能够应用计算机视觉技术,计算机视觉企业应在强化技术打造的前提下,发掘更多新的应用领域,提高商业落地应用。

2017年人脸识别技术在智能手机终端应用开始普及。9月苹果新品会上,iPhone X宣布引入Face ID高精度人脸识别技术,引来人们高度关注。而除了iPhone X,华为、小米、OPPO、vivo等手机厂商都推出了带人脸识别功能的智能手机。艾媒咨询分析师认为,计算机视觉领域内人脸识别功能可应用场景广泛,商业化落地能力强,除了计算机视觉创业企业,互联网巨头和硬件巨头企业也纷纷关注布局人脸识别领域。但目前人脸识别技术仍然存在一定缺陷,艾媒大数据舆情管控系统数据显示,“手机人脸识别”热词言值数据为48.5,整体舆情偏负向。现阶段人脸识别技术在智能手机终端上的应用仍处于起步发展阶段,技术和安全性仍有待提高,未来随着各计算机视觉企业加强技术研发,人脸识别技术有望进一步改善,成为智能手机标配。

iiMedia Research(艾媒咨询)数据显示,2017年中国计算机视觉市场规模为68亿元,预计2020年市场规模达到780亿元,年均复合增长率达125.5%。艾媒咨询分析师认为,人们安全和效率需求不断提升,计算机视觉技术在各行业应用能有效满足人们需求,市场发展空间巨大。国家政策对人工智能行业的支持也为计算机视觉的发展提供了有利的环境。随着计算机视觉技术日渐成熟,企业商业化落地能力不断提高,未来计算机视觉市场规模将迎来突破性发展。

iiMedia Research(艾媒咨询)数据显示,商汤科技以24.3%的企业知名度排名各计算机视觉企业首位,旷视科技与云从科技则分别以23.1%以及21.7%的知名度分列二三位。艾媒咨询分析师认为,商汤科技计算机视觉技术及算法能力在行业内较为出色,同时在安防、金融、商业、手机端等多个领域均有商业落地应用,在企业认知和品牌推广方面具有优势。

iiMedia Research(艾媒咨询)显示,61.7%的受访网民通过手机APP应用接触计算机视觉应用,另外有50.9%的受访网民接触途径为通过智能手机终端。艾媒咨询分析师认为,计算机视觉企业主要服务B端用户及政府机构,相比于其他途径,移动端更适合应用计算机视觉技术的产品推广。计算机视觉技术日趋成熟,在移动终端和APP上均有落地应用,也进一步为计算机视觉企业在大众中奠定基础。未来企业可通过线上渠道开发挖掘C端用户市场。

iiMedia Research(艾媒咨询)显示,半数受访网民认为智能手机及APP加入人脸识别技术功能方便了二者的使用,另有48.8%的受访网民认为人脸识别技术在手机及APP上的应用是未来技术发展的趋势。艾媒咨询分析师认为,人脸识别技术在手机及APP端的应用满足人们智能化和便捷化的需求,随着越来越多的手机及APP产品加入人脸识别功能,未来其普及和认可程度将得到进一步提高。

iiMedia Research(艾媒咨询)显示,41.8%的受访网民表示未来愿意使用人脸识别技术进行手机及APP解锁,同时有41.4%的受访网民虽持观望态度,但愿意尝试。此外,47.4%的受访网民认为人脸识别将取代其他手机及APP解锁技术成为未来主流。艾媒咨询分析师认为,近期智能手机纷纷应用人脸识别技术解锁推动该功能技术的普及,便捷性的优势使该功能技术前景受看好。但目前人脸识别解锁技术的准确性仍然受到质疑,随着未来技术进一步成熟,该技术有望成为智能手机设备标配。

iiMedia Research(艾媒咨询)显示,33.9%的受访网民曾使用过人证比对功能进行业务办理。在使用过该功能的人群中,54.6%认为其方便了业务办理,提供了效率,且有47.3%该部分人群认为其识别准确程度高。艾媒咨询分析师认为,政府、银行等机构业务办理效率以往常遭诟病,人证识别技术的应用提高了办事效率,在提高人们满意度的同时,加强了计算机视觉技术的认可度。未来计算机视觉技术在政府、银行等机构的落地应用将进一步扩展,但其中涉及到个人信息保护等问题需要企业及相关机构合力解决。

iiMedia Research(艾媒咨询)显示,34.1%的受访网民认为公安办案为最有必要应用人脸识别技术的安防情景。而关于网民对人脸识别技术在安防监控领域应用看法调查中,56.1%的受访网民认为其能有力保护人们人身财产安全。艾媒咨询分析师认为,计算机视觉技术,尤其是人脸识别技术在安防领域应用意义重大,在刑侦破案、身份认证、公共安全保护等情景具有重要应用价值。未来安防领域将成为计算机视觉技术重点应用领域,而安防的重要性也对相关企业技术实力有严格的要求,未来安防领域市场或由少数技术实力较强的企业占据。

商汤科技是专注计算机视觉与深度学习原创技术的人工智能创业企业,拥有强大的技术能力和人才资源储备支撑发展。商汤科技在计算机视觉领域综合实力较强,获资本方青睐,B轮融资4.1亿美元,同时与国内外知名企业展开合作。艾媒咨询分析师认为,商汤科技在商业营收上同样处于行业领先水平,但其本质专注于技术发展,强大的技术基础能较好支撑商汤科技在上层应用场景的扩展。商汤科技在技术驱动商业应用的同时,积累商业应用经验,提高企业知名度,拓展应用至更多领域。

艾媒咨询分析师认为,商业化落地能力欠缺是目前计算机视觉行业大部分企业的痛点,商汤科技在商业落地应用方面处于行业领先位置。这一方面源于商汤科技技术能力往专业化发展,以专业技术和研发基础实现场景差异化应用。另一方面,纯计算机视觉技术或算法由于其专业性,需求方在使用时需要具备专业能力,而商汤科技技术产品往标准化方向打造,打包成行业解决方案,能适应更多企业使用需求,也有利于商汤科技技术进一步落地应用。未来坚持技术为基础,继续提高商业落地能力,商汤科技有望继续保持良好发展态势。

旷视科技成立于2011年,2017年10月完成巨额C轮融资,专注于人脸识别、图像识别和深度学习技术自主研发和商业化落地,深耕于金融安全、城市安防、商业物联、工业机器人等领域,同时打造人工智能开放云平台。艾媒咨询分析师认为,旷视科技利用云平台为开发者提供技术支撑,有利于计算机视觉技术进一步结合产品运营,同时可以收集海量图片数据,通过进行深度学习,旷视科技图像识别技术又能进一步得到提升,有利于其强化自身核心技术能力。

艾媒咨询分析师认为,人脸识别技术对于金融行业业务办理及风控等流程具有重要应用价值,旷视科技在人脸识别技术上的优势也助其有效开展金融领域的服务应用。未来随着旷视科技利用云开放平台相关图片数据进行深度学习强化人脸识别技术,以及在金融领域积累的渠道资源,其有望在金融领域继续强化技术服务,成为该领域市场有力的竞争者。

艾媒咨询分析师认为,自动驾驶为人工智能和汽车行业未来发展方向,计算机视觉技术在自动驾驶汽车实现路况感知、高精度定位等方面发挥重要作用,自动驾驶为计算机视觉技术未来重要应用领域。图森未来的计算机视觉技术和算法在自动驾驶领域实现专业化发展,未来有望在此细分领域成长为领先企业。

2017-2018中国计算机视觉行业发展趋势

需求驱使计算机视觉行业发展潜力巨大应用场景拓展渗透各行业

艾媒咨询分析师认为,人们对生活安全以及生产效率追求两大需求的提升,决定计算机视觉行业具有巨大发展空间。而计算机视觉技术场景应用具有广泛性,有望发展成为下一个智能时代的标配。目前计算机视觉技术主要应用在B端领域,短期内行业发展趋势也是集中于B端领域。未来随着技术成熟,计算机视觉有望拓展更多新的应用场景,实现场景落地,渗透至各行各业,形成AI+,开拓更多C端业务。此外,计算机视觉技术可以跟其他技术,如AR、VR、无人驾驶等结合发展,创造新的应用领域。

技术应用由点及面行业解决方案及软硬件结合成商业产品出路

对于计算机视觉技术使用者来说,由于技术的学习应用需要花费较多时间和精力,硬件产品及行业解决方案往往更受青睐。未来计算机视觉企业需要将软硬件结合,如打造嵌入式芯片等。此外,计算机视觉企业应将技术应用由点及面,将技术应用发展成针对各行业的解决方案。未来市场将出现更多基于计算机视觉技术应用的行业解决方案和软硬一体化产品,只有打造方便用户使用的商业产品,才能有效适应其需求,帮助计算机视觉企业迅速占领行业市场,在市场竞争中取得领先优势。

计算机视觉行业发展对企业综合实力要求高

艾媒咨询分析师认为,计算机视觉行业巨大的发展前景决定其具有高成长性特点,未来将涌现更多人工智能领域优秀企业。但行业发展同时伴随高风险性,行业竞争需要比拼企业技术算法能力、资金能力、以及人才资源,同时考验企业能否实现技术迅速落地,对企业综合实力要求高,综合实力不具备优势的企业在行业内将难以生存。

计算机视觉的主要技术范文3

关键词:计算机视觉技术 铁路检测 应用

中图分类号:TP391 文献标识码:A 文章编号:1007-3973(2012)002-075-03

1 前言

自1825年世界第一条铁路在英国出现以来,铁路已经成为人们不可或缺的交通工具,越来越多的人在使用铁路出行,由于近年来铁路事故频频发生,促使了计算机视觉技术在铁路检测上的广泛使用并大力发展。

传统的铁路检测一直是靠人工和静态检测,这种检测缺乏实时性和准确性,并且效率低下,根本无法满足铁路的发展。这就要求研究一种新的检测方法来适应环境的发展,人们就试图将计算机视觉技术应用于铁路检测上,并取得了很好的效果。将计算机视觉技术应用在铁路检测上显著提高了铁路检测的实时性、准确性,有效的减轻了人工检测中工作条件恶劣,工作量大等缺点。它能在列车行驶的过程中就能对铁路和列车状况进行检测,并及时的做出预警,防止安全事故的发生。目前有关铁路检测主要集中在铁路信号检测、轨道检测、接触网检测、电力机车检测及站台环境监测等五个方面。

2 计算机视觉技术

计算机视觉,也称机器视觉。它是利用一个代替人眼的图像传感器获取物体的图像,将图像转换成数字图像,并利用计算机模拟人的判别准则去理解和识别图像,达到分析图像和作出结论的目的。

计算机视觉是多学科的交叉和结合,涉及到数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域。计算机视觉已有多年的发展历程。随着计算机、控制理论、模式识别、人工智能和生物技术的发展,计算机视觉在机器人、工业检测、物体识别的应用越来越广,研究方向也从二维到三维,从串行到并行,从直接依赖于输入信号的低层处理到依赖于特征、结构、关系和知识的高层处理。

一般的计算机视觉系统是有CCD(电荷耦合器件)摄像机、装备有图像采集板的计算机、光照系统以及专用图像处理软件等组成。CCD摄像机将所要研究的对象和背景以图像的形式记录下来,这其实是一个光电传感器,将光学信号转成电信号,图像采集板把采集的电信号转为数字信号,即数字化,一般情况下在摄取图像时都需要一个照明系统提供光照,然后再用专用的图像处理软件对图像进行处理,输出分析结果。

3 计算机视觉技术在铁路信号中的应用

铁路信号灯和现在的交通公路上的红绿灯是一个功能,但铁路和公路不同,铁路有限定的道路,列车必须在限定的股道上行驶,所以一旦与其他车辆相遇的话根本没有办法避让,如果发生车祸将会对国家和人民的生命和财产造成严重的损失,因此列车必须严格按照信号灯的指示行驶。

铁路信号灯识别主要是利用了信号灯在不同情况下会发出特定色彩光的特点。文献[1]在HSV空间中对S分量图像边缘检测和膨胀等,结合各种信号灯色调H分量的取值范围得到信号灯区域,然后多次腐蚀直到消除孤立点得到信号灯的边缘,最后填充信号灯区域,从而实现了信号灯的识别。在文献[2]也与此类似。文献[3]将彩色图像由RGB模式转化为HSI模式,用彩色特征聚类分析法来对图像进行分割,文中提出了基于颜色和形状相结合的复杂环境中目标检测与识别方法,用Hough变化来提取目标边界,从而提取出特定目标,而后得到指示灯区域所有像素的H,S统计值确定信号灯的颜色。在文献[4]提出一种基于改进的Hough变化的吊车信号灯识别算法。Roberto将摄取的图片转换到HIS颜色空间,用基于形状特征和模板匹配的方法探测到相关的铁路标志而放弃无关的基础设施。

为了部分消除因为光照条件、背景和拍摄角度对目标识别的影响,文献[5]提出使用一种利用sift特征的方法,它首先建立已知样本模型的特征集,然后将视频流每帧灰度图像的sift特征与之比较,从而实现对目标的检测或跟踪。实验表明该方法不仅能避免目标的错误识别,而且也明显优于基于边缘检测的算法,在识别准确率上达到了90%。

4 计算机视觉技术在轨道检测中的应用

随着世界铁路运营速度的不断提高,列车在行驶时对轨道的撞击、摩擦加剧,这就会造成轨道的变形、零件松动、磨损乃至缺失等,这些都会对列车的安全性造成严重影响,极有可能会造成铁路安全事故的发生。因此轨道设备具备良好的状态是铁路运输安全的重要保证。

随着电子技术和检测技术的发展,轨道检测技术也经历了翻天覆地的变化,其中也有不少研究机构将计算机视觉技术应用于轨道检测上,且取得了若干有效的检测方法。

轨道表面缺陷对列车行驶的质量和铁路系统的安全性会造成严重的影响,文献[7]提出了一种轨道表面缺陷检测的实时视觉检测系统。利用跟踪提取算法分割出轨道的灰度图像,然后用局部归一化法增强轨道图像的对比度,最后用基于投影轮廓的缺陷定位法检测缺陷。该算法对噪声有较强的鲁棒性和计算速度快,在一定程度上克服了光照不均和轨道表面反射性质不同对图像的影响,但对局部归一化过程中参数的选择有待进一步研究,以使该系统有更强的鲁棒性。该系统在216km/h速度下能进行实时检测,但随着检测速度的提高检测的准确度会明显下降且缺乏实时性。

文献[8]利用一排结构光视觉传感器,将钢轨轮廓的大圆周和小圆周的中心作为检查点。首先结构光视觉传感器拍摄铁轨侧面并且将其标记 在参考坐标帧中,最后通过比较测量的钢轨轮廓与参考轮廓的比较计算出铁轨磨损程度。该方法简单快速精确且不需要特殊的图像处理设备,在列车较高速度时仍然能达到良好效果。

5 计算机视觉技术在接触网检测中的应用

接触网是沿铁路线上空架设的向电力机车供电的特殊形式的输电线路。其由接触悬挂、支持装置、定位装置、支柱与基础几部分组成。它是轨道交通的主要组成部分,主要为机车提供动力,接触网的连接件由于受外界因素的影响容易产生过热现象,严重时会导致供电中断,引发列车停运事故。

我国的计算机视觉技术的接触网检测系统是基于德国相关技术而建立起来的,目前基于计算机视觉技术的接触网磨耗检测主要有两种方案:(1)基于镜面反射,激光照射接触线,线性CCD照相机捕获反射图像;(2)基于漫反射原理和CMOS(互补金属氧化物半导体)照相机。由于长期的频繁摩擦,接触网与受电弓接触部分很少被空气氧化,所以用光进行照射时该部分光反射率明显高于其他部分,因此这也为计算机视觉技术用于接触网检测提供了可能。

基于机器视觉的接触网检测系统主要是建立在图像识别和图像处理等视觉技术基础之上的,检测的内容涵盖接触网的所有基本几何参数。随着铁路的发展,原有的检测系统已经暴露出了一些问题,已无法满足需求,所以研究人员在系统硬件设备不变的情况下提出了许多改进的算法,如文献[9]针对现行的接触网定位器倾斜度检测方法效率低下、精确度不高的缺点,提出了一种基于计算机视觉的接触网定位器倾斜度自动测量装置,应用图像分割、剔除干扰线、图像细化等算法,对采集的图像进行处理,然后利用改进的霍夫(Hough)变换检测细化后的图像,对相邻的特征像素点进行聚类并感知编组,最后用随机Hough变换使感知编组后的每条线段更接近直线,进而计算装置中定位器的倾斜度,实验证明该算法精度高、速度快。

6 计算机视觉技术在电力机车检测中的应用

在列车的行进过程中,机车车轮与钢轨接触面不断发生摩擦,也就是轮缘与踏面的摩擦。从而会造成踏面的擦伤或剥离,而剥离会严重影响列车运行的安全性和平稳性以及轨道设施的使用寿命,因此需要对轮缘进行定期的检测和维修。

传统的检测方法需要人工逐项检测,存在费时费力、工作量大、工作环境差、效率低等缺点,所以人们就提出了一种基于计算机视觉技术的检测技术,该技术是一种非接触式检测方法,它能检测出所有关于火车轮缘轮廓的几何参数,从而计算出火车轮缘的磨损情况。这种检测方法检测速度快、准确率高且大大减轻了劳动强度,在实验中取得了满意的效果,并且在实际检测中也得到了广泛的应用。

文献[10]中研发设计了一种利用CCD成像测量技术、图像处理理论和计算机控制等相关技术,提出了一种非接触式的在线测量系统。采用二元多项式方法对由于硬件装置引起的误差的图像进行几何校正,用统计均值法对图像进行分割,从而求出车轮踏面的各项参数,通过在实验室对标准物进行测试实验而得到的测量数据结果进行分析而得出。此系统能够完成对火车轮对几何参数的测量,并且可得到相对准确的测量结果。

为了解决检测轮缘高度和宽度存在精度难以保证及稳定性不高的问题,文献[11]提出了一种基于三角法测量的在线监测系统,该系统由CCD高速摄像机和结构光发射器完成数据的采集,然后利用三角测量原理导出测量模型和计算模型,根据轮缘高度和宽度的定义完成对高度和宽度的测量,最终对轮缘磨损程度进行量化,实验表明该算法测量精度高,结果稳定可靠。

7 计算机视觉技术在站台环境监测中的应用

近年来铁路交通事业发展迅速,铁路客流量也不断增大,如中国每年的春运期间都有上亿人次通过火车返乡,各种危害乘客安全的事故也时有发生,因此世界各国特别是中国站台监控就显得越来越重要,目前的站台监控主要是依靠安装在各个角落的闭路电视或专业技术人员,这不仅需要专业技术知识还需要大量的人力物力。随着计算机、图像处理等技术的快速发展,对站台的自动监控也逐渐成为发展趋势。

近年来人们做了许多关于站台人群检测的研究,这些研究大都使用铁路站台中的闭路电视(CCTV)系统,在现代的CCTV系统中基本上使用的是数字化图像,在人群监测过程中大量使用了数字图像处理技术,如边缘检测、细化、像素计算等,通过图像的处理可以轻易的得到想要的结果。

文献[12]仍采用原有的CCTV监控系统拍摄的灰度图像作为处理对象,利用基于视觉的经过最小二乘法和全局搜索的混合算法训练的工业的额神经网络来估算站台的拥挤程度,该系统在实际的运行中获得了较高的精确度,虽然不能计算人数但却能实时的预测人群的密度。

文献[13]所设计的系统就较为复杂,它利用多台摄像头对站台进行检测。首先判断站台上列车的四种状态,如:没有列车、有列车、列车正在出站、列车正在入站等,然后对物体或行人检测及跟踪,最后对所检测的结果综合分析,做出合理的预警或警告。

8 计算机视觉技术在铁路检测上的发展趋势

随着计算机视觉技术的铁路检测中的应用越来越广泛和深入,并且随着计算机视觉技术等关键技术的不断发展,计算机视觉技术在铁路检测上应用发挥更大的作用,它就目前而言在铁路检测的应用上仍然存在技术难题需要研究:

计算机视觉的主要技术范文4

关键词:动态场景;自适应预测;多特征融合;计算机视觉;运动目标

接受信息的关键手段之一就是视觉系统,随着科学技术水平的不断发展,以及计算机和信号处理理论的诞生,让机器拥有人类视觉功能已经不再是梦。对所采集视频中的运动目标进行跟踪、检测,并对其目标行为进行分析,就是运动目标分析的内容,运动目标分析是计算机视觉领域关键内容之一,其属于图像理解与图像分析的范畴。而在运动目标分析系统中,跟踪与检测运动目标则为中级和低级处理部分,是分析与理解行为的高等层分析模块的基础。检测与跟踪运动目标技术主要包括了:机器人视觉导航、军事领域、运动图像编码、交通管制、视觉监视等。

1目标检测算法

连续图像序列由视频中提取出,由前景区域与背景区域共同组成了整个画面。前景区域包含了如运动的人体、车辆等动态要素,它是指人们较为感兴趣的区域。而背景区域主要包含例如树木、建筑物等静态要素,它的像素值仅发生微弱变化或者不产生变化。在连续图像序列中,采用一系列算法分隔开背景区域和前景区域,将运动目标信息有效提取,则为运动目标检测。以静态场景为基础的运动目标检测算法包括了光流法、背景差分法、帧间查分法等,文章主要针对背景差分法进行介绍。

背景差分法通常适用于静态场景,其是将背景图像与当前帧图像进行差分,运动目标依靠阀值化进行检测,因为该算法仅能够在背景变化缓慢或者不发生变化的情况下应用,因此就有着一定的局限性。假设当前帧图像为fk(x,y),背景图像B(x,y)可通过一定的方法得出,而这时背景差分图像则为:

(1)

而假设二值化阀值为Th,二值化图像B(x,y)则为:

(2)

运动目标检测结果可通过数学形态学处理获得。

2 背景模型的实时更新

要更新背景图像可采用一阶KALMAN滤波来实现,为了克服气候变化、光照变化等外部环境变化对运动检测产生的影响,采用一阶KALMAN滤波更新背景图像公式如下:

Bk+1(p)=Bk(p)+g(Ik(p)-Bk(p)) (3)

而增益因子则为:g=?琢1(1-Mk(p))+?琢2Mk(p) (4)

公式中?琢1和?琢2是权值系数;M是第k时刻二值化后目标图像中p像素的值;B为背景图像;I为当前帧图像。要想将运动目标从背景序列图像中有效分割出来,就必须要达到?琢2足够小的条件,且?琢1应等于或者大于10?琢2,若?琢1值过大,就会将算法自身的去噪特性丧失,在序列背景图像中也会存储越来越多的运动变化。

3 更新车辆目标模型

核与活动轮廓算法具有效率高、技术复杂度低等特点,它以非参数核概率密度估计理论为基础,在视频运动目标跟踪中广泛应用。彩色图像序列通过摄像机获取,人脸目标模型可以采用RGB颜色空间来进行描述。在跟踪车辆的过程中,噪声、遮挡、光照等干扰或多或少存在,因干扰因素的存在,车辆像素特征也会发生相应的微弱变化。若不对目标模型进行更新,会对跟踪精度产生影响,所以,采用的矩形模板会包括一定背景。而在实施跟踪的过程中,要对车辆目标模型进行更换。如果其过程物遮挡,当BHATTACHARYYA系数满足?籽>Tudm条件时,更新车辆目标模型,更新模型为:

(5)

公式中Tudm是模板更新阀值;qk-1是更新之前的车辆目标模型。通过视频跟踪,在近场景和远场景拍摄到的视频中,多尺度图像空间由各个帧图像构成。例如:将将书本作为跟踪对象,由远及近从书本的正上方拍摄六十帧图像,为了能使矩形框正好能够包含书本,对每帧图像张书本手工划定矩形框,并对框内图像的信息量进行统计。最后,随书本尺度的变化,给出图像信息量变化曲线。

4 计算机视觉原理

计算机视觉是一门研究怎样使机器进行观察的科学,更切确地说,就是指利用电脑和摄影机代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,用电脑处理成为传送给仪器检测或更适合人眼观察的图像。计算机视觉研究相关的理论和技术作为一个科学学科,尝试创建能够从图像或者多维数据中获取信息的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个决定的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中感知的科学。

计算机视觉就是由计算机来代替大脑完成处理和解释,用各种成象系统代替视觉器官作为输入敏感手段。使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力就是计算机视觉的最终研究目标,而需要经过长期的努力才能达到这个目标。所以,在实现最终目标以前,通过努力的中期目标是建立一种视觉系统,这个系统能依靠反馈的某种程度的智能和视觉敏感完成一定的任务。例如:计算机视觉的一个重要应用领域就是自主车辆的视觉导航,但要实现自主导航的系统,却还没有条件实现象人那样能识别和理解任何环境。所以,人们通过不懈的努力,研究在高速公路上具有道路跟踪能力,有效避免与前方车辆碰撞的视觉辅助驾驶系统。人类视觉系统是有史以来,人们所知道的功能最强大和完善的视觉系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理,但并不等于计算机必须按人类视觉的方法完成视觉信息的处理。可以说,对人类视觉处理机制的研究将给计算机视觉的研究提供指导和启发,所以,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,与此同时也是一个十分重要和让人感兴趣的研究领域。这方面的研究被称为计算视觉。计算视觉可被认为是计算机视觉中的一个研究领域。计算机视觉领域的不完善性与多样性为其突出特点。

5 结束语

对视频中的运动目标进行跟踪、识别、检测,并对目标行为进行研究、分析,这就是基于视觉运动目标分析。以计算机视觉为基础,分析运动目标,包括了目标行为的理解与分析、目标跟踪、运动目标检测、预处理图像等,它是计算机视觉领域重要内容之一。理解与分析运动目标的行为,既是计算机视觉的根本目的之一,也是检测与跟踪运动目标的最终目标。从理论层考虑,理解与分析运动目标的行为可以分为人工智能理论研究与模式识别。简要阐述基于计算机视觉的运动目标分析,而所面临的是对运动目标行为的理解。

参考文献

[1]杨可,刘明军,毛欣,夏维建,刘伟,周旋,吴炜,周凯.基于计算机视觉的电缆终端表面温升分析系统[J].电视技术,2013(7).

[2]叶闯,沈益青,李豪,曹思汗,王柏祥.基于人类视觉特性(HVS)的离散小波变换(DWT)数字水印算法[J].浙江大学学报:理学版,2013(2).

[3]何青海,马本学,瞿端阳,李宏伟,王宝.基于机器视觉棉叶螨自动监测与分级方法研究[J].农机化研究,2013(4).

[4]贾挺猛,苟一,鲍官军,董茂,杨庆华.基于机器视觉的葡萄树枝骨架提取算法研究[J].机电工程,2013(4).

计算机视觉的主要技术范文5

关键词:计算机;交通监管系统;视觉

中图分类号:TP277

近年来,道路交通安全问题因公路交通事业的快速发展而受到越来多关注。据2002年世界银行统计,全球平均每年死于道路交通事故高达117万人。而在中国,据2008年公安部交通管理局公布的数据显示,全国道路交通事故多达265204起,死亡人数为73484人。

全国道路交通事故防御工作随公路里程、机动车保有量、道路交通流量、驾驶人数的增加成递增趋势。而通过必要的技术手段构建交通安全保障机制,降低交通事故是重中之重。若要好的为基础的交通违规行为检测技术的不断更新,市场上已出现了自动检测与记录的商业化产品,能实时记录出闯红灯、违规超车、违规停车、超速、逆行等违规行为。然而,我国高速交通监控体系仍比较落后,大多在交叉路口设置电子警察系统以此检测车辆闯红灯的违规行为。交通管理部门并不能对出现违规行为的车辆进行及时的交通管制和处理,概括来说管理与检测仍处于管理误区与盲目状态。针对该现象,文本研究了基于计算机的交通监管系统设计与实现。

1 智能交通管理系统简介

ITS系统,该系统综合先进的现代计算机网络技术、信息电子通讯技术、现代信息技术以及自动控制技术等,并将其在整个交通运输管理体系进行有效的运用,为此建立起一种实时、有效、准确、范围广的全方位发挥作用的交通运输控制体系和综合管理系统。近几年人流、车流随着城市发展而猛增,交通职能部门对更加智能的交通管理系统的需求越来越急迫。所以,ITS成为21世纪地面交通管理、运输科技、运营的主要研究方向,带领着交通运输一场伟大的变革。北美、西欧、日本自上世纪80年代末就开始竞相发展智能运输系统,并制定相应的开发计划加以实施,而发展中国家也开始对ITS系统的全面研究与开发。

2 认识基于计算机视觉的智能交通监控系统

2.1 计算机视觉技术

所谓计算机视觉,理解为使用可替代人眼的高清摄影机设备或其他现代高清电子影像摄录装备进行观察,实现对目标的追踪定位、图像识别、模拟数据测量等,并对采集的视觉数据信息送达远端计算机服务器,通过计算机服务器的信号图形图像处理技术对视频数据信息进行进一步加工,实现三维重现现实情景的计算机观察呈现技术。

2.2 智能交通监测系统

通过使用现有的、先进的计算机智能化、视觉化、信息化科技对国内各大路况交通运输实施监测,为工作于交通运输人员呈现数据信息的自动化采集、分析、处理等的智能化服务,且该交通管理系统存在一定自作能力和指挥能力,即为智能交通系统。随着道路、车辆的飞速发展,人民生活水平及国民生产总值的不断提高,智能交通系统,在国内外受到越来越多的青睐。近几年,各道路关键路段、路口随着道路监控机制的普遍建立,也都基本完成了视频监控。

2.3 基于计算机视觉的智能交通监控机制

根据前面2.1对计算机视觉技术和2.2对智能化交通监控系统概念的解析与理解,可总结出以计算机视觉为基础的智能化交通监控机制,其是通过现代高端计算机对视觉信息收集、提取、处理、分析等技术,实现对城市道路交通信息的实时监控、视频数据的收集、信息分析处理,并对城市交通状况使用智能交通机制状况,并通过视频影像引导车辆行驶,以此降低或避免各种各样交通事故发生的智能化交通监控机制。

3 构建以计算机视觉为基础的智能交通监控机制及配套措施

3.1 基于计算机视觉的智能交通监控机制的构建

监控指挥系统、实时交通信息收集系统、高质量信息传输系统是基于计算机视觉的智能交通监控的三大系统。实时交通信息收集系统由多套信息收集装置组成,通过这些信息采集装置实时监控不同位置交通现状。实时交通信息收集系统不仅能进行路段监控与实时交通信息采集的工作,还能将收集数据信息,经由高质量信息传输系统实施输送,或在服务器中存储已处理的信息;一个中央数据库与一个中央服务器是高质量信息存储传输系统核心部分,其中中央数据库对获取到的实时交通路况信息进行存储。而为了便于工作者能通过界面对中央数据库实施提取、查询、查看等操作,因此该界面就由中央服务器来提供,此外该服务器还能将已处理的实时路况数据通过高质量的传输系统输送到监控指挥机制,达到对各路段的交通进行管制、部署及指挥的目的。

3.2 专业技术人员的储备

以计算机视觉技术为基础的智能交通监控机制是一个庞大的系统,具有突出点的优点,该系统集自动化、信息化、智能化为一体,只有专业的技术人才才能使该系统高效工作,因此开展培训储备相关技术人员至关重要。实时交通信息借助于先进的高清装置的正常采集工作,所以储备一批针对高清装置安装、检测、调试及故障修复的技术人员极为重要。现代基于计算机视觉的智能交通监控机制虽然本身具有一定的图形图像分析及处理能力,然而有些工作人是永远被替代的,所以培养储备一批专业的图形图像处理技术人员也是重要的。储备服务器维护技术工,每天以计算机视觉技术为基础的智能交通监控机制都会获取大量的监控信息数据,然而只有大型的服务器才能存储这些数据,可想而知一旦服务器瘫痪就会引发整个机制的崩溃,造成严重的后果,因此专业服务器维护工作者的储备与培养也尤为重要。基于计算机视觉技术的智能交通监控机制并不能取代交通指挥员,其仅是用来采集实时交通信息的系统,仅为了协助交通指挥员监管及疏导城市交通,因此要求储备一批高素质、高质量的交通指挥员也极为必要。

3.3 交通知识的宣传

大城市的交通问题,并不是依靠单纯的开发先进的计算机视觉智能交通监控系统就能处理解决,也不是单单要求市政建设增加公交数量、增铺几条公路或增开通几条地铁就能解决的,以上这些仅是辅助方法。关键在于开展交通知识的宣传与教育工作,强化驾驶员的素质,倡导不酒驾、不逆行、不超速、限号行驶等,自觉遵守道路交通规则,提倡公交地铁出行,减少私家车辆行驶,齐心协力共同打造和谐的交通环境。

3.4 获取政府支持

市政建设的主要问题之一即是交通问题,政府的支持是万万不可缺失的。由于构建以计算机视觉技术为基础的智能交通管制机制,涉及面广,包括道路勘测、先进装置的引进、专业技术人员的储备、装备组织安装与调试、后期维护等等多方面,这些都需要投入大量的人力、财力、物力,而对于任何一个单位、部门或几个市政部门来说都无法独自承担,由此可知政府的大力支持是必不可少的,以政府的力量为媒介,将各部门进行协调、协作,只有这样才能构建成较健全的交通监控体系。

4 结束语

道路交通杂、乱是国内城市交通最突出的特点之一,对于我国的交通事业来说进行行人识别势在必行。而我国对于行人识别的研究仍处于起步阶段,还较落后。且基于计算机的交通监管系统设计较为复杂,涵盖点较多,因此本文仅对设计进行简要介绍,希望达到抛砖引玉的效果。

参考文献:

[1]康晓丽.无线网络技术在交通管理中的应用[J].科技情报开发与经济,2011(21).

[2]钟振,赖顺桥,肖熠琳,张沛强.RFID车辆智能管理系统[J].机电工程技术,2011(02).

[3]文军.视频监控系统软件现状与技术分析[J].金卡工程,2007(08).

[4]张玉风.简述视频监控系统的发展历程[J].铁道通信信号工程技术,2006(06).

[5]马伏花,朱青.基于射频识别技术的车辆自动识别系统的实现[J].中国仪器仪表,2006(11).

计算机视觉的主要技术范文6

关键词 模式分析 计算机视觉 教学改革

中图分类号:G643.2 文献标识码:A DOI:10.16400/ki.kjdkz.2016.03.015

Research and Practice on Course Group of Pattern Analysis and

Visual Processing for Graduated Students

SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi

(College of Computer Science and Technology, Nanjing University of

Aeronautics and Astronautics, Nanjing, Jiangsu 210016)

Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.

Key words pattern analysis; computer vision; teaching reform

1 背景

我校模式分析与智能计算研究所师资团队是江苏省“青蓝工程”创新团队,主要研究领域包括智能数据分析、图像处理和机器视觉等方向,承担研究生和本科生的模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程的教学任务。以往的教学过程中虽然积累了丰富的教学经验,但当前新知识不断涌现、新技术发展迅猛,对模式分析与视觉处理课程群的知识体系、实践体系改进提出了新的挑战。

近年来,国内外高校在该类课程教学上,已涌现出众多新理念、新方法。Coursera联合创始人Andrew Ng推出的机器学习课程,开启了教育领域的MOOC时代,引领了教育教学方法的新革命。①深圳大学、②江苏科技大学③分别进行了基于CDIO工程教育理念的计算机视觉课程教学改革实践,实现多层次项目设计的教学模式改革,讲座式、讨论式、实践式教学方法的探索。国防科技大学④在计算机视觉课程中引入研讨式教学模式,通过案例教学、小组研讨的方式来替代传统的教学方式。华中科技大学⑤从教学内容国际化、教学方式国际化、教学成果国际化三个方面开展了计算机视觉课程的国际化建设。另外,也有高校进行了图像工程课程群建设,⑥基于图像分析与计算机视觉应用课程结合的项目协同创新能力培养实践。⑦

在分析上述国内外高校该类课程改革的基础上,我们重点以模式分析与视觉处理课程群的实践教学体系改革为切入点,优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。

2 模式分析与视觉处理课程群特点

模式分析与视觉处理课程群涵盖了模式识别、机器学习、数据挖掘、数字图像处理、计算机视觉等多门课程。该类课程存在以下特点。

(1)该类课程属于多学科交叉,涉及的知识面既广又深。由于该方向涉及计算机科学与技术、应用数学、自动化、电子科学与技术、信息工程等多学科内容,而学生在大学本科阶段很难学习和了解如此多的知识模块,这对研究生阶段学习来说,具有相当大的挑战。同时,对于每个知识模块,所要求的数学基础较高,理论具有相当的深度,理解和掌握不容易。

(2)该类课程既重视扎实的基础理论,也强调良好的工程实践能力。该类课程的基础理论教学一直受到各高校的重视。随着近年来产业界的迅猛发展,计算机视觉应用层出不穷,对学生的工程实践也提出了更高要求,需要能够在系统层次上有整体认知,同时要能对各功能模块进行优化,提升系统的整体性能。

(3)该类课程所面向的选修学生面广。该类课程既是多学科交叉,也面向计算机应用、电子科学与技术、自动化、应用数学等不同研究方向、不同水平层次的研究生开设。这对课堂教学和实验实践也带来更大挑战。

3 模式分析与视觉处理课程群改革举措

针对上述分析的课程群特点,我们重点以实践体系改革为突破口,通过优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式等举措,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。

3.1 师资队伍结构优化

为了学生能够适应模式分析与视觉处理产业的快速发展,在课程群建设过程中更强调学生的工程实践和创新能力培养。这首先对师资队伍结构提出了新的要求。

近年来,课程教学团队引进海内外具有深厚理论功底和较强工程能力的高水平师资4名,大大充实了机器学习、数据挖掘、图像处理等课程的教学力量。对于现有教师队伍,鼓励教师跟产业一线企业广泛合作,目前已与华为、中兴等企业在视频检索、智能交通视觉处理等方面开展了实质合作。这些来源于产业界的高质量课题对科研和教学起到了良好的促进作用。

与此同时,通过研究生工作站、企业短期实习等渠道,鼓励企业高级研发人员参与到学生实践能力培养环节中,将实际项目进行适当切分或提炼,实现该类课程实践环节的模块化、专题化训练。

综上,通过引培并举,优化校内师资队伍结构;通过校企合作,积极吸引企业师资参与。良好的师资队伍为该类课程的实践体系改革提供了有力支撑。

3.2 课程群知识体系梳理与授课模式改革

模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程既有一定的逻辑关系,也存在相互交叉的混杂关系。一般认为,模式识别、机器学习是模式分析与视觉处理领域的基础理论课程,数据挖掘是建立在模式识别、机器学习和数据库基础上的应用类课程,智能信息检索则是数据挖掘基础上更为具体的应用实现。数字图像处理为计算机视觉课程提供了基础支撑,计算机视觉则是在综合利用模式识别、机器学习、数字图像处理、数据挖掘等知识模块基础上面向应用的系统实现。但是,这些课程也存在着知识点的交叉或重复。例如,模式识别和机器学习中都有贝叶斯参数估计、支持向量机模型等知识点,但视角和侧重点有所不同;图像处理、计算机视觉中都有颜色模型、成像模型等知识点,也同时存在与模式识别、机器学习交叉的知识点。

我们针对来自不同研究领域的学生群体,对该课程群的知识点进行系统梳理,既避免知识点的重复讲授,也防止重要知识点的缺漏。课程教师集体讨论,形成每门课程的核心知识集,和针对不同研究领域的选讲知识集。学生在学习课程时,在掌握核心知识集的基础上,结合自己的研究方向选择相关的选讲知识集学习。

在课程教材和参考书的选择上,注重挑选国际上有影响力的教材。例如,模式识别的参考书为Richard O. Duda等人编著的Pattern Classification;机器学习的参考书为Tom M. Mitchell编著的Machine Learning和Christopher M. Bishop编著的Pattern Recognition and Machine Learning;数据挖掘的参考书为Jiawei Han等人编著的Data Mining:Concepts and Techniques;数字图像处理的参考书为K. R. Castleman编著的Digital Image Processing;计算机视觉的参考书为D. A. Foryth编著的Computer Vision: A Modern Approach和Richard Szeliski编著的Computer Vision: Alogrithms and Applications。这些教材已被国内外著名大学普遍采用。同时,每门课程都提供相关的国内外顶级会议和期刊的列表,供学生课后追踪研究领域的热点问题。

在课堂授课环节上,注意采用灵活多样的授课方式。对于核心基础知识模块,以教师讲授为主,同时提供国内外该类课程的热门MOOC网址给学生参考。对于选讲知识模块,鼓励学生事先结合各自研究方向有目的自学,在学生报告的基础上进行课堂讨论方式进行。充分发挥学生学习的主体作用,也便于教师了解学生的水平和学习状况。

除此以外,不定期邀请国内外著名学者来校做学术报告,让学生充分了解该研究领域的最新前沿动态,并就热点问题进行专题讨论。

3.3 课程群实践体系完善与考核方式改革

工程实践和创新能力的培养是该课程群改革的重要目标。我们在上述师资队伍结构优化、课程群知识体系梳理与授课模式改革的基础上,着力进行课程群实践体系的改革与完善。我们通过多层次菜单式的实验项目选择、项目牵引的创新能力训练、学生综合研究能力的全面考查等方面来实现。

首先,整合和优化课程群实践内容,实现多层次菜单式灵活选择。根据各研究领域的要求进行灵活搭配,根据学生个体的能力与水平选择适当规模和难度的实践内容,通过课程内的基础实验、课程间的综合实验、课程群的创新实验来选择和组合,如图1所示。

图1 多层次菜单式实验内容示意图

基础型实验内容主要是各课程核心知识点的实验验证,主要包括模式识别,机器学习,数据挖掘,图像处理与分析,计算机视觉等课程的实验。要求选课学生对这些基础实验必做,打下良好的研究基础。

综合探索型实验在基础型实验基础上,既有单门课程内总的综合实验,也有课程间知识的综合应用。主要分为两大块,包括模式分析与机器学习方向的综合实验,以及图像处理与机器视觉方向的综合实验。实验目的主要是针对这两大块方向重点知识的综合分析和比较,能够熟练掌握和灵活应用。例如模式分析、机器学习、数据挖掘等方向都用到的线性判别分析、支持向量机、均值聚类等内容;图像处理与机器视觉中的图像特征抽取、视觉系统选型、目标检测、特定平台的算法优化等内容。学生可根据各自研究方向有目的的选择两块综合实验的大部分内容。

在综合型实验基础上,该课程群通过若干创新型实验来检验学生理论知识掌握程度和实践方法应用能力,为后续的研究课题开展打下良好的科研素养。主要内容包括人脸识别、二维条码识别、车辆属性识别、智能视觉监控、以及企业来源的关键技术等。这些项目实践既涉及用到图像处理与机器视觉的内容,也涉及模式分析与机器学习方向的知识。并且需要学生在综合运用相关知识的基础上有创新能力。

其次,重视各类项目牵引的创新能力训练。一方面,鼓励教师从国家自然科学基金、企业合作项目等研究中提炼出问题规模和难度适中的训练项目,作为课程群的综合能力训练项目。另一方面,鼓励学生参加挑战杯、全国研究生智慧城市技术与创意设计大赛等各类具有挑战性的竞赛项目,以赛代练,提升学生的工程实践和创新能力。同时,也鼓励学生利用百度、微软等相关研究领域的企业实习机会,参与产品一线的工程实践能力训练。

再次,注重考核环节,实现科研素养和实践能力的全面考查。只有严格、公平、公正的考核,才能保证实验实践的质量和水平,才能提升学生的科研素养和实践能力。我们主要在手段、方式方法上进行了改进。在题目选择上,根据学生个体水平和研究领域要求的差异,在选题上有适当的难易区分度,让每位学生都有锻炼和提升的机会;在考核方式上,采用结题书面报告来检验学术论文的写作能力,采用程序演示检验系统的设计与实现水平,采用上台汇报的方式检验学生的表达能力,多管齐下全面检查学生的综合科研素养;在考核成绩评定上,采用现场教师和学生共同评分的方式,公平合理;最后,通过网站展示、发表学术小论文、专利、软件著作权等方式展示和公开优秀成果,激发学生的学习热情,并由此形成积累,有利于学生实验实践氛围的传承。

4 结语

本文在分析国内外高校模式分析与视觉处理类课程群改革现状的基础上,以学生国际化视野、理论联系实际、工程实践和创新能力全面提升为目标,重点开展了师资队伍结构优化、课程群知识体系梳理、课程授课模式改革、课程群实践体系完善和实践考核模式改革等工作,取得了良好的效果,并为校内其他课程群的教学改革作为示范推广。

注释

① https:///learn/machine-learning/

② 郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践.理工高教研究,2010.29(5):98-100,148.

③ 史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践.计算机教育,2013.9:40-43.

④ 陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式.当代教育理论与实践,2013.5(7):112-114.

⑤ 王岳环,桑农,高常鑫.计算机视觉课程的国际化教学模式.计算机教育,2014.19:101-103.