计算机视觉的应用方向范例6篇

前言:中文期刊网精心挑选了计算机视觉的应用方向范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

计算机视觉的应用方向

计算机视觉的应用方向范文1

随着计算机技术以及图像处理技术的快速发展,计算机视觉技术作为一种新兴的技术,其被广泛应用在军事、医学、工业以及农业等领域[1]。一般而言,计算机及视觉技术应用在农业的生产前、生产中以及生产后等各个环节,其主要就是鉴别植物种类,分级和检测农产品的品质。计算机视觉相较于人类视觉而言,其具有更多的优点,能够有效提高农业的生产率,实现农业生产与管理的智能化和自动化,促进农业的可持续发展。

一、计算机视觉技术概述

计算机视觉主要是指利用计算机来对图像进行分析,从而控制某种动作或者获取某描述景物的数据,是人工智能与模式识别的重要领域。计算机视觉兴起于20世纪70年代,其涉及的学科范围较为广泛,包括视觉学、CCD技术、自动化、人工智能、模式识别、数字图像处理以及计算机等。就目前而言,计算机视觉技术主要以图像处理技术为核心,是通过计算机视觉模拟人眼,并利用光谱对作物进行近距离拍摄,运用数字图像处理以及人工智能等技术,对图像信息进行分析和研究。计算机视觉技术主要步骤包括采集图像、分割图像、预处理、特征提取、处理和分析提取的特征等[2]。

二、农业机械中计算机视觉技术的应用分析

一般而言,农业机械中计算机视觉技术的应用,主要表现在以下三个方面:一是田间作业机械中的应用;二是农产品加工机械中的应用;三是农产品分选机械中的应用。

(一)田间作业机械中的应用

在田间作业机械中,计算机视觉技术的应用较晚。近年来,由于环境保护政策的提出,在农田作业的播种、植保以及施肥机械中的应用越来越广泛。在田间作业的过程中应用计算机视觉技术时,主要应用在苗木嫁接、田间锄草、农药喷洒、施肥以及播种等方面[3]。为了有效识别杂草,对除草剂进行精确喷洒,相关研究人员分析了美国中西部地区常见的大豆、玉米以及杂草二值图像的形态学特征,发现植物长出后14~23天内能够有效区别双子叶和单子叶的效果,准确率最高达到90%。在1998年开发出Detectspary除草剂喷洒器,其能够有效识别杂草,在休耕季节时,其相较于播撒而言,能够减少19%~60%的除草剂用量。在农业生产中,农药的粗放式喷洒是污染严重,效率低下的环节,为了有效改变这种现状,Giler D.K.等研制出能够精量喷雾成行作物的装置。该系统主要是利用机器视觉导向系统,使喷头能够与每行作物上方进行对准,并结合作物的宽度,对喷头进行自动调节,确保作物的宽度与雾滴分布宽度具有一致性,从而有效节省农药。一般而言,该系统能够促使药量减少66%,提高雾滴沉降效率和施药效率,减少农药对环境产生的影响。

(二)农产品加工机械中的应用

随着信息技术以及计算机技术的快速发展,计算机视觉技术被广泛应用在农产品加工的自动化中。如Jia P等提出了图像处理算法,该算法主要是以鲇鱼水平方向与主轴的形心位置和夹角为依据,检测鲇鱼的方位以及背鳍、腹鳍、头、尾的位置,从而确定最佳的下刀位置。此外,我国的黄星奕等人在研究胚芽米的生产过程时,在不经过染色的情况下,对胚芽米的颜色特性等进行分析,得出胚芽米颜色特征的参数为饱和度S。同时利用计算机视觉系统,自动无损检测胚芽精米的留胚率,其结果与人工评定的结果大体一致。

(三)农产品分选机械中的应用

在分级和鉴定农产品的品质时,可以利用计算机视觉技术对其进行无损检测。一般计算机视觉技术不需对测定对象进行接触,可以直接利用农产品的表面图像,分级和评估其质量,其具有标准统一、识别率高一级效率高等优势。计算机视觉技术在检测农产品时,主要集中在谷物、蔬菜以及水果等方面。Chtioui Y等人提出了结合Rough sets理论,利用计算机视觉技术对蚕豆品质的方法进行评价。该理论通过不同的离散方法对石头、异类蚕豆、过小、破损以及合格等进行有效区分,并利用影色图像,对其特征参数进行分类,最终分类的结果相比于统计分类结果,两者具有较好的一致性。

计算机视觉的应用方向范文2

关键词 模式分析 计算机视觉 教学改革

中图分类号:G643.2 文献标识码:A DOI:10.16400/ki.kjdkz.2016.03.015

Research and Practice on Course Group of Pattern Analysis and

Visual Processing for Graduated Students

SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi

(College of Computer Science and Technology, Nanjing University of

Aeronautics and Astronautics, Nanjing, Jiangsu 210016)

Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.

Key words pattern analysis; computer vision; teaching reform

1 背景

我校模式分析与智能计算研究所师资团队是江苏省“青蓝工程”创新团队,主要研究领域包括智能数据分析、图像处理和机器视觉等方向,承担研究生和本科生的模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程的教学任务。以往的教学过程中虽然积累了丰富的教学经验,但当前新知识不断涌现、新技术发展迅猛,对模式分析与视觉处理课程群的知识体系、实践体系改进提出了新的挑战。

近年来,国内外高校在该类课程教学上,已涌现出众多新理念、新方法。Coursera联合创始人Andrew Ng推出的机器学习课程,开启了教育领域的MOOC时代,引领了教育教学方法的新革命。①深圳大学、②江苏科技大学③分别进行了基于CDIO工程教育理念的计算机视觉课程教学改革实践,实现多层次项目设计的教学模式改革,讲座式、讨论式、实践式教学方法的探索。国防科技大学④在计算机视觉课程中引入研讨式教学模式,通过案例教学、小组研讨的方式来替代传统的教学方式。华中科技大学⑤从教学内容国际化、教学方式国际化、教学成果国际化三个方面开展了计算机视觉课程的国际化建设。另外,也有高校进行了图像工程课程群建设,⑥基于图像分析与计算机视觉应用课程结合的项目协同创新能力培养实践。⑦

在分析上述国内外高校该类课程改革的基础上,我们重点以模式分析与视觉处理课程群的实践教学体系改革为切入点,优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。

2 模式分析与视觉处理课程群特点

模式分析与视觉处理课程群涵盖了模式识别、机器学习、数据挖掘、数字图像处理、计算机视觉等多门课程。该类课程存在以下特点。

(1)该类课程属于多学科交叉,涉及的知识面既广又深。由于该方向涉及计算机科学与技术、应用数学、自动化、电子科学与技术、信息工程等多学科内容,而学生在大学本科阶段很难学习和了解如此多的知识模块,这对研究生阶段学习来说,具有相当大的挑战。同时,对于每个知识模块,所要求的数学基础较高,理论具有相当的深度,理解和掌握不容易。

(2)该类课程既重视扎实的基础理论,也强调良好的工程实践能力。该类课程的基础理论教学一直受到各高校的重视。随着近年来产业界的迅猛发展,计算机视觉应用层出不穷,对学生的工程实践也提出了更高要求,需要能够在系统层次上有整体认知,同时要能对各功能模块进行优化,提升系统的整体性能。

(3)该类课程所面向的选修学生面广。该类课程既是多学科交叉,也面向计算机应用、电子科学与技术、自动化、应用数学等不同研究方向、不同水平层次的研究生开设。这对课堂教学和实验实践也带来更大挑战。

3 模式分析与视觉处理课程群改革举措

针对上述分析的课程群特点,我们重点以实践体系改革为突破口,通过优化师资队伍结构,梳理课程群知识体系,优化课程授课模式,完善课程群实践体系,改革实践考核模式等举措,实现学生国际化视野、理论联系实际、工程实践和创新能力全面提升的目标。

3.1 师资队伍结构优化

为了学生能够适应模式分析与视觉处理产业的快速发展,在课程群建设过程中更强调学生的工程实践和创新能力培养。这首先对师资队伍结构提出了新的要求。

近年来,课程教学团队引进海内外具有深厚理论功底和较强工程能力的高水平师资4名,大大充实了机器学习、数据挖掘、图像处理等课程的教学力量。对于现有教师队伍,鼓励教师跟产业一线企业广泛合作,目前已与华为、中兴等企业在视频检索、智能交通视觉处理等方面开展了实质合作。这些来源于产业界的高质量课题对科研和教学起到了良好的促进作用。

与此同时,通过研究生工作站、企业短期实习等渠道,鼓励企业高级研发人员参与到学生实践能力培养环节中,将实际项目进行适当切分或提炼,实现该类课程实践环节的模块化、专题化训练。

综上,通过引培并举,优化校内师资队伍结构;通过校企合作,积极吸引企业师资参与。良好的师资队伍为该类课程的实践体系改革提供了有力支撑。

3.2 课程群知识体系梳理与授课模式改革

模式识别、机器学习、数据挖掘、智能信息检索、数字图像处理、计算机视觉等课程既有一定的逻辑关系,也存在相互交叉的混杂关系。一般认为,模式识别、机器学习是模式分析与视觉处理领域的基础理论课程,数据挖掘是建立在模式识别、机器学习和数据库基础上的应用类课程,智能信息检索则是数据挖掘基础上更为具体的应用实现。数字图像处理为计算机视觉课程提供了基础支撑,计算机视觉则是在综合利用模式识别、机器学习、数字图像处理、数据挖掘等知识模块基础上面向应用的系统实现。但是,这些课程也存在着知识点的交叉或重复。例如,模式识别和机器学习中都有贝叶斯参数估计、支持向量机模型等知识点,但视角和侧重点有所不同;图像处理、计算机视觉中都有颜色模型、成像模型等知识点,也同时存在与模式识别、机器学习交叉的知识点。

我们针对来自不同研究领域的学生群体,对该课程群的知识点进行系统梳理,既避免知识点的重复讲授,也防止重要知识点的缺漏。课程教师集体讨论,形成每门课程的核心知识集,和针对不同研究领域的选讲知识集。学生在学习课程时,在掌握核心知识集的基础上,结合自己的研究方向选择相关的选讲知识集学习。

在课程教材和参考书的选择上,注重挑选国际上有影响力的教材。例如,模式识别的参考书为Richard O. Duda等人编著的Pattern Classification;机器学习的参考书为Tom M. Mitchell编著的Machine Learning和Christopher M. Bishop编著的Pattern Recognition and Machine Learning;数据挖掘的参考书为Jiawei Han等人编著的Data Mining:Concepts and Techniques;数字图像处理的参考书为K. R. Castleman编著的Digital Image Processing;计算机视觉的参考书为D. A. Foryth编著的Computer Vision: A Modern Approach和Richard Szeliski编著的Computer Vision: Alogrithms and Applications。这些教材已被国内外著名大学普遍采用。同时,每门课程都提供相关的国内外顶级会议和期刊的列表,供学生课后追踪研究领域的热点问题。

在课堂授课环节上,注意采用灵活多样的授课方式。对于核心基础知识模块,以教师讲授为主,同时提供国内外该类课程的热门MOOC网址给学生参考。对于选讲知识模块,鼓励学生事先结合各自研究方向有目的自学,在学生报告的基础上进行课堂讨论方式进行。充分发挥学生学习的主体作用,也便于教师了解学生的水平和学习状况。

除此以外,不定期邀请国内外著名学者来校做学术报告,让学生充分了解该研究领域的最新前沿动态,并就热点问题进行专题讨论。

3.3 课程群实践体系完善与考核方式改革

工程实践和创新能力的培养是该课程群改革的重要目标。我们在上述师资队伍结构优化、课程群知识体系梳理与授课模式改革的基础上,着力进行课程群实践体系的改革与完善。我们通过多层次菜单式的实验项目选择、项目牵引的创新能力训练、学生综合研究能力的全面考查等方面来实现。

首先,整合和优化课程群实践内容,实现多层次菜单式灵活选择。根据各研究领域的要求进行灵活搭配,根据学生个体的能力与水平选择适当规模和难度的实践内容,通过课程内的基础实验、课程间的综合实验、课程群的创新实验来选择和组合,如图1所示。

图1 多层次菜单式实验内容示意图

基础型实验内容主要是各课程核心知识点的实验验证,主要包括模式识别,机器学习,数据挖掘,图像处理与分析,计算机视觉等课程的实验。要求选课学生对这些基础实验必做,打下良好的研究基础。

综合探索型实验在基础型实验基础上,既有单门课程内总的综合实验,也有课程间知识的综合应用。主要分为两大块,包括模式分析与机器学习方向的综合实验,以及图像处理与机器视觉方向的综合实验。实验目的主要是针对这两大块方向重点知识的综合分析和比较,能够熟练掌握和灵活应用。例如模式分析、机器学习、数据挖掘等方向都用到的线性判别分析、支持向量机、均值聚类等内容;图像处理与机器视觉中的图像特征抽取、视觉系统选型、目标检测、特定平台的算法优化等内容。学生可根据各自研究方向有目的的选择两块综合实验的大部分内容。

在综合型实验基础上,该课程群通过若干创新型实验来检验学生理论知识掌握程度和实践方法应用能力,为后续的研究课题开展打下良好的科研素养。主要内容包括人脸识别、二维条码识别、车辆属性识别、智能视觉监控、以及企业来源的关键技术等。这些项目实践既涉及用到图像处理与机器视觉的内容,也涉及模式分析与机器学习方向的知识。并且需要学生在综合运用相关知识的基础上有创新能力。

其次,重视各类项目牵引的创新能力训练。一方面,鼓励教师从国家自然科学基金、企业合作项目等研究中提炼出问题规模和难度适中的训练项目,作为课程群的综合能力训练项目。另一方面,鼓励学生参加挑战杯、全国研究生智慧城市技术与创意设计大赛等各类具有挑战性的竞赛项目,以赛代练,提升学生的工程实践和创新能力。同时,也鼓励学生利用百度、微软等相关研究领域的企业实习机会,参与产品一线的工程实践能力训练。

再次,注重考核环节,实现科研素养和实践能力的全面考查。只有严格、公平、公正的考核,才能保证实验实践的质量和水平,才能提升学生的科研素养和实践能力。我们主要在手段、方式方法上进行了改进。在题目选择上,根据学生个体水平和研究领域要求的差异,在选题上有适当的难易区分度,让每位学生都有锻炼和提升的机会;在考核方式上,采用结题书面报告来检验学术论文的写作能力,采用程序演示检验系统的设计与实现水平,采用上台汇报的方式检验学生的表达能力,多管齐下全面检查学生的综合科研素养;在考核成绩评定上,采用现场教师和学生共同评分的方式,公平合理;最后,通过网站展示、发表学术小论文、专利、软件著作权等方式展示和公开优秀成果,激发学生的学习热情,并由此形成积累,有利于学生实验实践氛围的传承。

4 结语

本文在分析国内外高校模式分析与视觉处理类课程群改革现状的基础上,以学生国际化视野、理论联系实际、工程实践和创新能力全面提升为目标,重点开展了师资队伍结构优化、课程群知识体系梳理、课程授课模式改革、课程群实践体系完善和实践考核模式改革等工作,取得了良好的效果,并为校内其他课程群的教学改革作为示范推广。

注释

① https:///learn/machine-learning/

② 郭小勤,曹广忠.计算机视觉课程的CDIO教学改革实践.理工高教研究,2010.29(5):98-100,148.

③ 史金龙,白素琴,庞林斌,钱强.研究生机器视觉课程的CDIO教学改革实践.计算机教育,2013.9:40-43.

④ 陈芳林,刘亚东,沈辉.在《计算机视觉》课程中引入研讨式教学模式.当代教育理论与实践,2013.5(7):112-114.

⑤ 王岳环,桑农,高常鑫.计算机视觉课程的国际化教学模式.计算机教育,2014.19:101-103.

计算机视觉的应用方向范文3

关键词:计算机视觉技术 铁路检测 应用

中图分类号:TP391 文献标识码:A 文章编号:1007-3973(2012)002-075-03

1 前言

自1825年世界第一条铁路在英国出现以来,铁路已经成为人们不可或缺的交通工具,越来越多的人在使用铁路出行,由于近年来铁路事故频频发生,促使了计算机视觉技术在铁路检测上的广泛使用并大力发展。

传统的铁路检测一直是靠人工和静态检测,这种检测缺乏实时性和准确性,并且效率低下,根本无法满足铁路的发展。这就要求研究一种新的检测方法来适应环境的发展,人们就试图将计算机视觉技术应用于铁路检测上,并取得了很好的效果。将计算机视觉技术应用在铁路检测上显著提高了铁路检测的实时性、准确性,有效的减轻了人工检测中工作条件恶劣,工作量大等缺点。它能在列车行驶的过程中就能对铁路和列车状况进行检测,并及时的做出预警,防止安全事故的发生。目前有关铁路检测主要集中在铁路信号检测、轨道检测、接触网检测、电力机车检测及站台环境监测等五个方面。

2 计算机视觉技术

计算机视觉,也称机器视觉。它是利用一个代替人眼的图像传感器获取物体的图像,将图像转换成数字图像,并利用计算机模拟人的判别准则去理解和识别图像,达到分析图像和作出结论的目的。

计算机视觉是多学科的交叉和结合,涉及到数学、光学、人工智能、神经生物学、心理物理学、计算机科学、图像处理、图像理解、模式识别等多个领域。计算机视觉已有多年的发展历程。随着计算机、控制理论、模式识别、人工智能和生物技术的发展,计算机视觉在机器人、工业检测、物体识别的应用越来越广,研究方向也从二维到三维,从串行到并行,从直接依赖于输入信号的低层处理到依赖于特征、结构、关系和知识的高层处理。

一般的计算机视觉系统是有CCD(电荷耦合器件)摄像机、装备有图像采集板的计算机、光照系统以及专用图像处理软件等组成。CCD摄像机将所要研究的对象和背景以图像的形式记录下来,这其实是一个光电传感器,将光学信号转成电信号,图像采集板把采集的电信号转为数字信号,即数字化,一般情况下在摄取图像时都需要一个照明系统提供光照,然后再用专用的图像处理软件对图像进行处理,输出分析结果。

3 计算机视觉技术在铁路信号中的应用

铁路信号灯和现在的交通公路上的红绿灯是一个功能,但铁路和公路不同,铁路有限定的道路,列车必须在限定的股道上行驶,所以一旦与其他车辆相遇的话根本没有办法避让,如果发生车祸将会对国家和人民的生命和财产造成严重的损失,因此列车必须严格按照信号灯的指示行驶。

铁路信号灯识别主要是利用了信号灯在不同情况下会发出特定色彩光的特点。文献[1]在HSV空间中对S分量图像边缘检测和膨胀等,结合各种信号灯色调H分量的取值范围得到信号灯区域,然后多次腐蚀直到消除孤立点得到信号灯的边缘,最后填充信号灯区域,从而实现了信号灯的识别。在文献[2]也与此类似。文献[3]将彩色图像由RGB模式转化为HSI模式,用彩色特征聚类分析法来对图像进行分割,文中提出了基于颜色和形状相结合的复杂环境中目标检测与识别方法,用Hough变化来提取目标边界,从而提取出特定目标,而后得到指示灯区域所有像素的H,S统计值确定信号灯的颜色。在文献[4]提出一种基于改进的Hough变化的吊车信号灯识别算法。Roberto将摄取的图片转换到HIS颜色空间,用基于形状特征和模板匹配的方法探测到相关的铁路标志而放弃无关的基础设施。

为了部分消除因为光照条件、背景和拍摄角度对目标识别的影响,文献[5]提出使用一种利用sift特征的方法,它首先建立已知样本模型的特征集,然后将视频流每帧灰度图像的sift特征与之比较,从而实现对目标的检测或跟踪。实验表明该方法不仅能避免目标的错误识别,而且也明显优于基于边缘检测的算法,在识别准确率上达到了90%。

4 计算机视觉技术在轨道检测中的应用

随着世界铁路运营速度的不断提高,列车在行驶时对轨道的撞击、摩擦加剧,这就会造成轨道的变形、零件松动、磨损乃至缺失等,这些都会对列车的安全性造成严重影响,极有可能会造成铁路安全事故的发生。因此轨道设备具备良好的状态是铁路运输安全的重要保证。

随着电子技术和检测技术的发展,轨道检测技术也经历了翻天覆地的变化,其中也有不少研究机构将计算机视觉技术应用于轨道检测上,且取得了若干有效的检测方法。

轨道表面缺陷对列车行驶的质量和铁路系统的安全性会造成严重的影响,文献[7]提出了一种轨道表面缺陷检测的实时视觉检测系统。利用跟踪提取算法分割出轨道的灰度图像,然后用局部归一化法增强轨道图像的对比度,最后用基于投影轮廓的缺陷定位法检测缺陷。该算法对噪声有较强的鲁棒性和计算速度快,在一定程度上克服了光照不均和轨道表面反射性质不同对图像的影响,但对局部归一化过程中参数的选择有待进一步研究,以使该系统有更强的鲁棒性。该系统在216km/h速度下能进行实时检测,但随着检测速度的提高检测的准确度会明显下降且缺乏实时性。

文献[8]利用一排结构光视觉传感器,将钢轨轮廓的大圆周和小圆周的中心作为检查点。首先结构光视觉传感器拍摄铁轨侧面并且将其标记 在参考坐标帧中,最后通过比较测量的钢轨轮廓与参考轮廓的比较计算出铁轨磨损程度。该方法简单快速精确且不需要特殊的图像处理设备,在列车较高速度时仍然能达到良好效果。

5 计算机视觉技术在接触网检测中的应用

接触网是沿铁路线上空架设的向电力机车供电的特殊形式的输电线路。其由接触悬挂、支持装置、定位装置、支柱与基础几部分组成。它是轨道交通的主要组成部分,主要为机车提供动力,接触网的连接件由于受外界因素的影响容易产生过热现象,严重时会导致供电中断,引发列车停运事故。

我国的计算机视觉技术的接触网检测系统是基于德国相关技术而建立起来的,目前基于计算机视觉技术的接触网磨耗检测主要有两种方案:(1)基于镜面反射,激光照射接触线,线性CCD照相机捕获反射图像;(2)基于漫反射原理和CMOS(互补金属氧化物半导体)照相机。由于长期的频繁摩擦,接触网与受电弓接触部分很少被空气氧化,所以用光进行照射时该部分光反射率明显高于其他部分,因此这也为计算机视觉技术用于接触网检测提供了可能。

基于机器视觉的接触网检测系统主要是建立在图像识别和图像处理等视觉技术基础之上的,检测的内容涵盖接触网的所有基本几何参数。随着铁路的发展,原有的检测系统已经暴露出了一些问题,已无法满足需求,所以研究人员在系统硬件设备不变的情况下提出了许多改进的算法,如文献[9]针对现行的接触网定位器倾斜度检测方法效率低下、精确度不高的缺点,提出了一种基于计算机视觉的接触网定位器倾斜度自动测量装置,应用图像分割、剔除干扰线、图像细化等算法,对采集的图像进行处理,然后利用改进的霍夫(Hough)变换检测细化后的图像,对相邻的特征像素点进行聚类并感知编组,最后用随机Hough变换使感知编组后的每条线段更接近直线,进而计算装置中定位器的倾斜度,实验证明该算法精度高、速度快。

6 计算机视觉技术在电力机车检测中的应用

在列车的行进过程中,机车车轮与钢轨接触面不断发生摩擦,也就是轮缘与踏面的摩擦。从而会造成踏面的擦伤或剥离,而剥离会严重影响列车运行的安全性和平稳性以及轨道设施的使用寿命,因此需要对轮缘进行定期的检测和维修。

传统的检测方法需要人工逐项检测,存在费时费力、工作量大、工作环境差、效率低等缺点,所以人们就提出了一种基于计算机视觉技术的检测技术,该技术是一种非接触式检测方法,它能检测出所有关于火车轮缘轮廓的几何参数,从而计算出火车轮缘的磨损情况。这种检测方法检测速度快、准确率高且大大减轻了劳动强度,在实验中取得了满意的效果,并且在实际检测中也得到了广泛的应用。

文献[10]中研发设计了一种利用CCD成像测量技术、图像处理理论和计算机控制等相关技术,提出了一种非接触式的在线测量系统。采用二元多项式方法对由于硬件装置引起的误差的图像进行几何校正,用统计均值法对图像进行分割,从而求出车轮踏面的各项参数,通过在实验室对标准物进行测试实验而得到的测量数据结果进行分析而得出。此系统能够完成对火车轮对几何参数的测量,并且可得到相对准确的测量结果。

为了解决检测轮缘高度和宽度存在精度难以保证及稳定性不高的问题,文献[11]提出了一种基于三角法测量的在线监测系统,该系统由CCD高速摄像机和结构光发射器完成数据的采集,然后利用三角测量原理导出测量模型和计算模型,根据轮缘高度和宽度的定义完成对高度和宽度的测量,最终对轮缘磨损程度进行量化,实验表明该算法测量精度高,结果稳定可靠。

7 计算机视觉技术在站台环境监测中的应用

近年来铁路交通事业发展迅速,铁路客流量也不断增大,如中国每年的春运期间都有上亿人次通过火车返乡,各种危害乘客安全的事故也时有发生,因此世界各国特别是中国站台监控就显得越来越重要,目前的站台监控主要是依靠安装在各个角落的闭路电视或专业技术人员,这不仅需要专业技术知识还需要大量的人力物力。随着计算机、图像处理等技术的快速发展,对站台的自动监控也逐渐成为发展趋势。

近年来人们做了许多关于站台人群检测的研究,这些研究大都使用铁路站台中的闭路电视(CCTV)系统,在现代的CCTV系统中基本上使用的是数字化图像,在人群监测过程中大量使用了数字图像处理技术,如边缘检测、细化、像素计算等,通过图像的处理可以轻易的得到想要的结果。

文献[12]仍采用原有的CCTV监控系统拍摄的灰度图像作为处理对象,利用基于视觉的经过最小二乘法和全局搜索的混合算法训练的工业的额神经网络来估算站台的拥挤程度,该系统在实际的运行中获得了较高的精确度,虽然不能计算人数但却能实时的预测人群的密度。

文献[13]所设计的系统就较为复杂,它利用多台摄像头对站台进行检测。首先判断站台上列车的四种状态,如:没有列车、有列车、列车正在出站、列车正在入站等,然后对物体或行人检测及跟踪,最后对所检测的结果综合分析,做出合理的预警或警告。

8 计算机视觉技术在铁路检测上的发展趋势

随着计算机视觉技术的铁路检测中的应用越来越广泛和深入,并且随着计算机视觉技术等关键技术的不断发展,计算机视觉技术在铁路检测上应用发挥更大的作用,它就目前而言在铁路检测的应用上仍然存在技术难题需要研究:

计算机视觉的应用方向范文4

关键词:计算机视觉;课堂考勤;深度学习;MCV架构

前言

随着国家标准《智慧校园总体框架》(Smartcampusoverallframework)的,智慧校园的规划与设计成为了校园建设的重点项目[1]。而课堂考勤作为学校教学管理、学生评价的重要组成部分,随着物联网技术、人工智能和移动通信技术的水平的提高与发展,更应该向着智能化、准确化的方向发展[2]。本文研究了的当前应用的课堂考勤方式,并做了进一步的分析,最终根据社会技术的革新与发展[3],提出了一种基于计算机视觉的实时课堂考勤系统的设计。我们的主要工作是搭建了整个系统框架,包括数据库系统、服务器、计算机视觉模型、网络通信、图像采集系统、客户端和网络通信系统。

1课堂考勤方式现状

目前校园中主要的课堂考勤方式存在为两种,分别是传统的考勤方式和生物识别的考勤方式。如图1所示,其中传统的考勤方式包括点名考勤和通过校园卡进行考勤,点名考勤的方式仍然是高校中最常用的考勤手段,因它不受场地的限制,可以根据点名册直接核对现场的学生信息,但这种方式存在的缺点就是花费时间,影响上课效率,为此有些教师不进行点名,因此影响了考勤的效果。校园卡考勤解决了点名占用课堂时间的问题,但这种方式具有学生代考勤的漏洞,因为学生可以拿着别人的校园卡进行考勤。生物识别的考勤方式包括指纹考勤和人脸识别考勤,这些方式有效解决了传统考勤方式代考勤的弊端,但这种方式受设备硬件的影响,识别能力太慢,尤其是在下课后学生较多,考勤签退时容易发生拥挤等现象,具有安全隐患[4]。因此,为解决当前考勤方式存在的一些弊端,本文设计了一种基于计算机视觉的实时课堂考勤系统。

2系统设计基础

2.1系统开发环境

本文设计的实时课堂考勤系统主要是使用Python开发语言,Python是目前最流行开发语言之一,主要应用于Web服务设计、大数据、人工智能等领域,它的主要优点是开发效率高、可扩展性强、跨平台和具有可移植性等,满足了本文系统的设计要求。另外,在开发过程还用到了基于Python的第三方软件开发包,包括Flask用于搭建系统的Web服务器;PyQt5用于搭建系统的客户端;OpenCV用于系统中对图像视频的处理;Tensoflow用于开发计算机视觉模型,搭建深度学习模型,完成人脸检测和识别任务;Mysqlclient用于管理、访问、查询和更新Mysql数据库。

2.2系统开发框架

本文设计的实时课堂考勤系统通信基于Web应用,因此选择一个合适的服务架构有利于提高系统的开发和部署效率。目前较流行的Web应用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)两种架构。本文使用了基于Python和Flask搭建的MVC架构[5],该架构如图2所示,主要包括模型层、视图层和控制器。使用该框架的优点是可将视图层和业务逻辑层进行分离开发,提高开发效率,方便系统的部署、维护和管理。

3系统设计方式

3.1系统总结构设计

本文设计的实时课堂考勤系统的总体结构如图3所示。根据MVC构架的设计,我们将该系统分为了模型层、控制器层和视图层,另外还包括网络通信设备。

3.2模型层设计

模型层主要是关系型数据库模,MySQL是目前使用最多的关系型数据库系统,也是学校管理系统使用最多的数据系统,为了更好地与学校管理系统兼容,我们选择了MySQL数据库,数据表之间的关系如图4所示。

3.3控制器层设计

控制器层主要包括服务器应用软件和计算机视觉模型,服务器应用软件的功能包括系统通信配置、数据业务处理和系统各模块间的调度。计算机视觉模型是实时课堂考勤系统的核心模块,基于深度学习卷积神经网络实现[6],主要作用是进行人脸检测和识别两个部分,计算机视觉模型的工作流程如图5所示。在人脸检测阶段使用VGG16检测器作为主干网络,为提高模型的检测准确率,通过引入注意力模型和多尺度特征融合对网络进行了优化,有效地从输入图片中提取人脸位置信息,得到人脸图像。在人脸识别阶段首先使用FaceNe人脸识别网络提取人脸图像的特征图,然后通过决策树算法与待检测的人脸特征进行匹配,从而识别图片中的学生信息。

3.4视图层设计

本文设计的实时考勤系统的模型层主要包括图像采集系统和客户端。目前各学校教室内都安装有监控设备,因此为节约成本和安装消耗,图像采集系统使用教室内的监控设备作为图像采集系统,负责采集教室现场图片。客户端设计首先在本系统中采用应用程序接口,然后在教学管理系统中设计图形化用户界面,通过应用程序接口调用本系统的功能,从而减少资源浪费,方便维护和管理。

4实时考勤功能的实现

实时考勤功能的实现方式如图6所示,首先系统启动后,用户可以随时更新考勤信息,比如在数据库中创建新的考勤表等。接着系统会自动读取考勤表的信息,比如课程所在教室、上课时间。然后启动考勤程序,进行签到、签退操作,并将考勤数据保存到考勤数据表中。整个系统启动完成后可以自动运行,直到关闭系统,而且可以实时进行课堂考勤。

计算机视觉的应用方向范文5

关键词:机器学习;模式识别;计算机视觉;机场管制;民航安全

引言

安全管理是我们民用航空管理中的一个非常重要的问题,一直以来都受到整个行业的高度重视。机器学习作为人工智能技术的分支,已经在短短的几年时间内渗透到我们身边的各行各业,为之提供了大量的便利并极大的节省了人力及物力资源。由此我们推测,将机器学习及其相关技术应用到民航安全管理体系中,也将起到卓越的成效。本文便是对机器学习在民航安全管理的应用领域进行探索和分析。

1 机器学习介绍

1.1 定义

利用计算机对给定的数据进行分析并从中获取规律是机器学习的首要研究目标,这些数据我们称作观测样本,所学习到的规律我们称之为模型。通过这些规律模型,可以对未来将要出现的数据进行预测。

图1即机器学习的简单示例。机器学习的第一步即是选择一个规律模型,定义为决策函数f(x,?兹),该函数中的参数?兹并不确定。第二步则是通过机器学习的算法寻找出一个最适合的参数?兹?鄢,这个过程叫做训练过程。经过以上两个步骤,我们就可以使用f(x,?兹)模型对输入的x进行结果预测。

1.2 应用场景

我们所描述的机器学习,不仅仅是针对一些已经经过结构化处理的信息,还应当包含图像、音频在内的数字化数据。从范围上讲,它类似于模式识别、统计学习、数据挖掘,正是由于机器学习与这些不同领域的结合,从而形成了它在计算机视觉、自然语言处理、语音识别这些交叉学科中的研究优势。

2 民航安全管理

2.1 安全管理系统简介

民用航空中比较传统的思想认为没有危险就表示安全,然而现代的安全管理思想并不这样认为。现代的安全管理思想把安全当做一种状态,同时也是识别危险和管理风险的一个过程。由此可见,我们的安全管理系统(safety management system简称:SMS)必须是一个完整的、正规的、自顶向下的和有条不紊的综合安全管理系统。

2.2 我国的民航安全管理系统现状

分阶段发展的策略是在改革开放以来我国的民航业实施的总方针[1],并且已取得显著成效:第一阶段,通过逐渐放松进入市场的时机,让民航走上企业化发展的道路;第二阶段,在民航业内部实施全面的制度改革,为进入市场化进行机制创造条件,同时大步跨入市场化经营时期;第三阶段,抓紧时机进行民航的行业重组,这一项改革已经取得了重大突破。虽然分阶段的策略成绩斐然,然而就目前来看,我国民航业的安全管理信息化进程依旧相对落后。

3 机器学习在安全管理体系中的应用

3.1 模式识别与机场管制

模式识别是工业业界提出的概念,而机器学习主要来自于计算机学术领域,在本质上二者没有区别。机场管制也称航空管制,航空流控 航路流控 等,指的是由于起降航班班次集中,飞机按关门先后顺序排队起飞,或者由于天气、军事、目的地机场问题等原因,塔台对飞机起飞时间进行管制。机场管制的目的是保证航空安全,以及保障飞机的飞行秩序。

通过机器学习的模式识别技术,安全管理系统可以对机场终端区域的所有飞行器进行实时监控,分析处理一次雷达、二次雷达及自动相关监视系统(ADS-B)等监视设备传回的包括飞行器高度、位置、运行状态以及气象信息在内的各种大规模数据,并在异常情况出现时,或者在异常情况即将出现之前(取决于机器学习算法的数据预测功能),向塔台管制员提供预警服务,避免各种特情的发生。

3.2 计算机视觉与机场安全

人脸识别[2]是计算机视觉领域的一个非常重要的研究方向。传统的人脸识别技术在实际应用中已经非常广泛,但是从性能的角度来看,依然存在诸多问题,最重要的是,从安全的角度考虑亦存在诸多漏洞。现在已经证明出现的针对传统人脸识别的黑客技术,已经屡见不鲜。而通过机器学习改进后的人脸识别技术[3],不仅可以解决安全问题,并且十分有利于人脸识别精度的改善和人脸识别速度的提高。将优化后的人脸识别系统应用到机场的安检流程中,可以大大提高安检人员的工作效率,同样降低人工工作的强度。

同样的,计算机视觉及图像处理技术还可应用于机场场面安全管理。比如,随着通用航空的发展,无人机的数量快速增加,由于其制造成本低操作简单等特性,越来越多的单位和个人开始使用无人机从事私人的业务。这些没有规范管理的无人机,在缺乏地空空域管理的情况下,很容易就能够飞行进入机场的管制区,形成巨大的安全隐患。利用计算机视觉进行远距离摄像实时监控,有望很好的解决这个安全问题。

3.3 其他应用领域

除此之外,机器学习的各种算法模型,包括贝叶斯模型(Bayesian)、人工神经网络(Artificial Neural Networks)、深度学习(Deep Learning)、组合方法(Ensemble Methods)、回归(Regression)等等,均可根据各自的特性,应用于民航安全系统:数据预测特性可以应用于航空气象数据的分析与预测中,用以提前为管制人员提供尽可能准确的气象预报数据;语音识别及文本分析特性,可以应用于管制员与飞行员的陆空通话过程中,不仅可以监控陆空通话的内容,同时可以对参与人员的疲劳程度进行研判;大规模数据中的异常数据监测,可以应用行器设备及地面设备的维修与保障中。

4 结束语

近年来,以机器学习技术推动的人工智能已渗透到几乎所有的工业领域。而机器学习的应用场景,也就是它的应用领域,也恰好与我们信息化安全建设的方方面面都有诸多重合。对于我们民航,确切的说,对于我们民航的安全管理系统,尽早引入并应用机器学习相关技术,将会极大的改善系统的工作效率并提高安全保障的成效。

参考文献

[1]李洋.我国民航安全管理系统研究[D].中国海洋大学,2013.

计算机视觉的应用方向范文6

关键词:计算机视觉;手势交互;肤色模型;静态识别

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2016)35-0193-02

1 研究背景

随着信息化的高速发展,人们的生活也进入了网络时代。大数据,云计算也进入了人们的生活,其标志性的现象就是各类智能终端设备的不断涌现,它使人机交互的方式正发生着深层次改变。人机交互的方式正在从传统的鼠标搭配键盘的方式往触控、语音交互、动作识别等技术为主导的更自然的方式转变。其中语音与计算机视觉尤为突出,它使计算机变得更加的灵性化。而这两者中计算机视觉又更能够传情表意,它能够“看”明白用户的肢体语言或者表情。国内外的自然交互研究涉及了人脸识别、眼神识别、表情识别、手势识别、肢体语言识别等。手势识别作为一种人类普遍使用的交流方式,应用在计算机交互上能给人一种直观和自然的感觉。这种自然的输入方式把人们从传统的与输入设备接触交互方式中解放出来,使人们与计算机交互更加的轻松愉悦。

计算机视觉是让计算机可以替代人眼的技术。更进一步说,就是利用视频采集设备和电脑代替人眼对指定的目标进行识别,并进一步做出计算。其中,手势识别技术是计算机视觉的一个的重要的研究方向,它是一种常用并且合理的人机交互方式。随着计算机视觉,包括图像处理技术以及人工智能等技术,特别是虚拟现实技术的迅速发展,手势识别的实现更加成为可能。由于客观环境的多变及人手和手势的多样性,如何在限制较少的条件准确识别手势并能保证其精度、效率以及稳定性是研究的关键。

手势识别按照手势输入设备分类,可以分为基于数据手套的手势识别和基于视X的手势识别。基于视觉的手势识别中,最常见的手势分类是将手势分为静态手势和动态手势。静态手势是一种较简单的手势,当用户做出一个固定和静止的动作时计算机将其处理后识别出来。动态手势相对要复杂一些,它可以看做是由一系列的静态手势组成的序列。如果将静态手势和动态手势组合,将可以形成语义很丰富的手势系统。

1目前人机交互的不足

人与计算机之间的交互方式是人机交互研究的核心。从现在的姿势交互和语音交互往前追溯,有触摸交互、手写交互、鼠标和键盘交互。姿势交互又细分为手势交互、表情交互、身体姿势交互。

传统的输入设备有很多的不足之处。鼠标和键盘,由于它们的使用需要接触,在某些环境下使用不方便。用户在车站、餐厅、购物商场等场景下要与计算机交互时,使用传统交互方式十分的不便。而且在公共场合下,接触性的使用会有很大的卫生问题。不仅需要占用很大的空间,同时也会有设备损耗的问题。

手写交互和触摸交互改善了传统的机械性输入,它们是更符合人类的使用习惯的。但是它们任然要求用户要与设备接触,这不免会在接触设备的过程中损坏到设备。所以同样有着易损耗等问题。

基于视觉的手势交互很好克服了上述交互方式的不足之处。手势交互是不需要接触的,没有损耗问题,也不会有接触带来的卫生问题。手势交互有符合人类动作习惯和直观自然的优点,使其成为了下一代自然交互方式研究的焦点。

2目前国内外手势识别状况

基于视觉的手势识别不需要昂贵的设备,仅仅需要摄像头和PC机器就够了。其廉价的输入设备会使其将来应用范围十分广泛。手势识别在计算机视觉的研究中是热点。国内外都有很多的学者在不断研究。这些研究在手势的分割、跟踪、识别和应用中有很多的进展。

国外对基于视觉的手势识别的研究工作起步很早。L.H.Howe等人使用肤色阈值和帧相减的技术实现了手的检测和分割。J.Zaletel等人提出了静态手势特征的方法,这种方法是用于提取手指的位置的。它先计算出掌心的位置,然后将掌心的位置作为极坐标的原点,将手掌的轮廓映射到这个极坐标,然后利用极坐标上的局部最大值来提取手指的位置。Huang使用3D神经网络创建的手势识别系统实现了15个不同手势的识别[1]。

在技术的应用上面,从上世纪九十年代开始,国外的科学家就开始不断研究手势识别技术,并且研制出一些实体来进行试验,例如:可以模仿人进行手势操作的机器人;电视控制的传感系统,无需遥控,利用手势识别左右上下进行对电视的遥控;体感游戏,更是完美的利用手势识别,在信息交互中完全释放出手势识别的优势。

我国相对于国外的研究起步要晚,但是目前也取得了很大的研究成果。朱建伟[1]使用两个摄像头正交放置,实现了三维手势的识别,并实现了使用手势实现对照片的浏览。孙玉[3]使用Hu矩特征手势识别和CamShift算法对手势跟踪,实现了手势对Word的输入和操作。

3意义

本文主要研究基于视觉的手势识别技术和对这种技术的应用。目标跟踪识别是计算机视觉领域中的关键技术,多应用于人机交互。手势识别必将使人与机器之间的沟通变得智能化、信息化,与传统的输入设备相比,手势操作则显得直观和自然,更符合人类习惯。

手势识别作为新型的人机交互技术,手势识别技术越来越广泛应用到各个行业。体感游戏首先成熟使用的,改变了传统的手持物体操作。更加互动,真实。使得人与游戏美妙结合,身临其境。

手势识别还可以用于手语识别。手语是聋哑人使用的语言,是聋哑人与正常人交流的平台。在医疗领域中,具有语言交流障碍的患者,可以通过手势识别,在预设好系统中,自助挂号,表达病情。更加体现人性化。综上所述,手势识别技术越来越被研发人员重视,在日常生活中涉及的领域也越来越多,研究价值也越来越突出。这项技术也将被广泛的普及推广到人们生活中的方方面面。

4结束语

基于计算机视觉的识别的功能还可以不断拓展,可以实现摄像头检测人与电脑的距离(当计算机识别出人坐在计算机前时显示器显示,当人离开的时候关闭显示器,达到节约电能的作用)等等。手势识别还可以应用于虚拟键盘,使用一个投影的键盘,然后通过摄像头识别手在虚拟键盘上的相关操作。可以用在智慧医疗中,解决传统的诊疗挂号方式。从根本上寻找解决病人就医难的状况的合理方案将健康的养生知识传播到更远更广。

参考文献:

[1] Guan Ran and Xu Xiangmin, A Computer Vision-Based Gesture Detectio And Recognition Technique[J]. Computer Applications and Software.2013,30(1):155-164.