前言:中文期刊网精心挑选了计算机视觉的主要任务范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
计算机视觉的主要任务范文1
关键词:高速铁路 路基 沉降 沉降观测 预测模型
中图分类号:U215
文献标识码:A
文章编号:1007-3973(2012)005-037-02
1 前言
铁路路基暴露在室外,加之我国地域广阔,地形、地质、水文、气候等情况复杂:路基边坡和坡脚受坡面雨水冲刷、日晒雨淋将引起土的干湿循环、气温变化将引起土的冻融变化、河水对边坡或坡脚处地基不断的冲刷和淘刷等,使路基常年处于升降动态循环之中,路基附加应力受其很大影响。路基填料级配不良、排水失效、过渡段碎石级配失效或不养生、路基横向碾压、填料含水率超标等将引起路基沉降。铁路两旁新修建的建筑物尤其是特大型建筑也会对路基产生影响,所以铁路路基沉降在一定意义上讲不可避免。但过大的变形沉降将直接影响旅客舒适度以及行车安全,所以必须对高速铁路路基沉降加以防治。本文着重介绍高速铁路路基沉降观测及预测技术。
2 高速铁路路基沉降测量控制要求
只有做好高速铁路路基沉降测量工作,才能保证沉降控制工作的顺利完成,为接下来的工作提供数据资料。所以工程技术人员要采用科学正确的方法,高效的完成测设工作,要保证测量精度要求,利用配套计算机对所有观测值进行严密平差,保证整个控制精度完全能够符合国家工程测量技术规范和工程设计要求。
2.1 设备要求
高速铁路沉降观测要求高精度,为了精确测量路基的沉降情况,一般规定测量的误差应小于变形值的1/10—1/20。采用一般仪器,会受到周围环境的影响而导致误差过大,所以对观测仪器的精度要求极高。观测时应优选受环境影响小的仪器,比如精密水准仪。
2.2 观测人员要求
高速铁路沉降观测要求高精度,工程技术人员应该有较高的职业技术水平和职业道德。观测人员应该专业、准时、高效的完成测量任务,对观测数据认真负责,坚决杜绝补测或修改数据等恶劣行为。
2.3 实际观测的具体要求
观测前,要对观测地点的地形、地貌、地质、水文以及气候等情况加以调查,联系实际情况选择最适宜的观测方法,既要保证观测的高效,又要保持正精度的要求。
2.4 观测点的选取
高速铁路沉降观测精度高,所以对观测点的选取要求也很高,在保证方便观测的前提下,选择合适的观测点,最好是视野开阔,地势平坦的稳定位置。
2.5 观测周期及观测时间
施工阶段,应随施工进度及时进行。观测次数与时间间隔应视地基与加荷情况而定。在观测过程中,如有路基附近荷载突然增减、长时间连续降雨等情况,均应及时增加观测次数。若路基发生大量沉降、不均匀沉降或严重裂纹时,应该立即进行逐日甚至一天数次的连续观测。
3 路基沉降预测模型的应用
对高速铁路路基沉降进行预测传统的方法有三种:(1)采用分层总和法计算最终沉降量,利用简化固结公式计算固结度,然后推算沉降的发展规律与趋势。(2)根据固结理论,结合室内试验获得土的各种本构模型,利用有限元方法预测最终沉降量以及其发展规律。(3)基于前期沉降量实测资料来建立沉降量与时间关系数学模型的预测方法。
3.1 曲线拟合法
曲线拟合,就是通过实验获得有限对测试数据(xi, yi),利用这些数据来求取近似函数y=f(x)。式中x为输出量,y为被测物理量。即通过分析实测资料与时间的关系,建立适当的沉降与时间的函数关系,进而推测沉降的发展规律。曲线拟合法是将沉降近似看做按照某种规律变化的过程,对实际测量的沉降数据进行拟合,建立某种相适应的曲线模型,采取适宜的优化方法,反推出计算公式所需的参数,在运用于后期的沉降预测。此方法参数较少并且易于确定,所以应用广泛。工程中常用的曲线拟合法包括:双曲线法、星野法、指数曲线法、三点法、沉降速率法、Asaoka法、S形成长曲线模型。
3.2 灰色系统理论
灰色系统理论是20世纪80年代,由中国华中理工大学邓聚龙教授首先提出并创立的一门新兴学科,它是基于数学理论的系统工程学科。灰色系统理论,是一种研究少数据、贫信息不确定性问题的新方法。灰色系统理论以“部分信息已知,部分信息未知”的“小样本”、“贫信息”不确定性系统为研究对象,主要通过对“部分”已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述和有效监控。
3.3 人工神经网络
人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。利用人工神经网络理论建立预测路基沉降的BP模型和Elman模型,两种模型在预测路基沉降时,不需要建立任何土工模型,只要采集训练网络的样本就可以比较精确的预测路基沉降。
3.4 遗传算法
遗传算法是由美国的J.Holland教授1975年首先提出,是一类借鉴生物界的进化规律(适者生存,优胜劣汰遗传机制)演化而来的随机化搜索方法。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。
路基沉降预测模型的建立对于高速铁路沉降预测与控制至关重要。适宜的预测模型可以很好地预测路基沉降的发展趋势,对于工程施工以及线路运营阶段的管理都有指导作用。通过路基沉降预测模型与实测数据,推算最终沉降量,若预测沉降超限,应及时采取相应的工程措施。
4 一种新的沉降测量方法:计算机视觉测量技术
计算机视觉测量技术是近年来测量领域中迅速发展起来的崭新技术,它是以现代光学为基础,融合计算机技术、激光技术、图像处理与分析技术等现代科学技术为一体,组成光电一体化的综合测量系统。视觉测量技术的检测仪器设备能够实现智能化、数字化、小型化、网络化和多功能化,具有精度高、非接触、在线检测、实时分析与控制、连续工作等特点。计算机视觉也称为机器视觉,是指利用计算机对采集的图像或者视频进行处理,从而代替人眼的视觉功能,实现对客观世界的三维场景的感知、识别和理解的技术。计算机视觉使用计算机及相关设备对生物视觉进行模拟。其主要任务是通过对采集的图像或视频进行处理,以获得相应场景的三维信息。计算机视觉使用的理论方法主要基于几何、概率、运动学计算和三维重构等视觉计算机理论,其基础包括摄影几何学、刚体运动学、概率论与随机过程、人工智能等理论。运用计算机视觉测量技术,可以实现高速铁路沉降的远程自动化观测,方便、快捷、实时性强,即可以保证测量的精度,又减轻了工程技术人员的负担,是一项有待发展的新兴测量技术。
5 结论
综上所述,高速铁路路基沉降对于工程建设、旅客舒适度、运营安全有着致命影响,所以路基沉降观测是必须采取的。采用正确的观测方法,严格按照基本要求和规范观测,建立正确的陈建预测模型,保证路基沉降在标准的允许范围之内是高速铁路建设的关键。随着新兴技术的发展,沉降观测及防治措施必定越来越多,越来越精确,我国的高速铁路事业也必将更上一层楼。
参考文献:
[1] 仝校涛.试论高速铁路路基沉降控制方法[J].黑龙江科技信息,2011,(27).
[2] 李春光.高铁路基沉降分析及控制[J].建筑科技与管理,2011,(3).
[3] 易思蓉.铁道工程(第二版)[M].中国铁道出版社,2009.
计算机视觉的主要任务范文2
关键词:交通事件 视频检测 监控 算法
中图分类号:C913.32 文献标识码:A 文章编号:
美国加州Jet Propulsion 实验室于1978年使用视频技术来检测车辆的运行,标志着视频检测技术的开始。视频检测技术以数字图像为基础,内容涉及数字图像处理、模式识别、计算机视觉、人工智能等诸多领域和学科。它的主要任务是实现对交通事件的自动快速检测,提供准确的路况信息,与传统的检测技术相比视频检测具有检测区域大、检测参数多、安装维护无干扰、实施灵活、可视性先进性好等特点,普遍应用于交通监控系统,实现了管理者对交通情况的可视化管理。
视频检测技术介绍
视频检测技术在传统的电视监控系统基础上将计算机视觉引入到交通信息检测之中,通过计算机从数字图像中提取出高级交通信息,实现对交通事件,如逆行事件、慢性事件、超速事件、变道事件、行人检测、违章停车事件等的自动快速检测。其工作流程图如图1.1所示:
检测算法流程:确定检测区域;建立背景模型;确认目标:对检测区域进行确认, 判断是目标或背景;目标分割(检测):通过识别出图像中符合目标特征的像素,将待识别的目标从背景中分离出来;目标跟踪:依据提取出的特征匹配前后帧中的目标;目标分类:指依据几何外形、纹理特征等对不同类型的目标进行分类;后处理:根据应用需求确定交通事件等。该算法实现了对交通事件的自动快速检测,为ITS的实施提供真实准确、及时的信息。
二、视频检测技术在交通事件检测中的应用
2.1 违章停车检测
检测原理:通过对摄像机拍摄到的图像序列进行分析,检测场景中的运动目标并进行目标提取与检测,进一步对目标运动参数进行估计。
检测算法流程:利用所采集的视频,提取出背景图像。将当前图像灰度后与背景图像进行背景差分,对背景差分后的图像进行OTSU阈值分割,通过背景差分得到运动目标区域,并对其进行标记,如连续500帧内车辆未发生明显的移动,则判断该车辆处于静止状态,否则说明有违章车辆经过,给出车辆违章停车信号,启动报警系统,同时将当前全景视频图像进行保存。这种基于视频检测技术的违章停车检测算法,检测全面、使用方便、实时性强、更具说服力,漏检率和检测时间也比较理想。
2.2 行人检测
检测原理:对图像识别和分割后的目标图像进行特征提取,包括目标区域的面积、长宽比、速度,从而便于图像分类(或图像识别)。
检测算法流程:在背景提取和二值化图像的前提下对目标区域进行连通标记,得到最小外接矩形面积M。通过对目标外接矩形的面积与长宽比的计算以及目标区域的速度来进一步确定目标的类型。行人的二值化面积比车辆的二值化面积小,行人的长宽比较大,车辆的外接矩形的长宽比更接近1,车辆的行驶速度比行人约大4—6倍。该算法能快速确定目标类型,从而对行人事件和停车事件加以区别。
2.3 车速检测
检测原理:目标在图像中的行驶速度即像素速度,并非是实际路面中以米为单位的距离,但它与实际路面距离有一定的对应关系。实际测量中采用通过查找距离映射表的方法,通过对视频图像的标定建立图像像素坐标和实际路面的对应关系,查找两帧图像中的车辆位置点在路面中的实际距离便可知道车辆在一定时间内移动的实际距离,此时就获得连车辆在实际路面的行驶速度。
检测算法流程:获取目标区域,得到车尾点位置信息,确定跟踪区域,找出代目标车辆特征值,在映射表中查找这些特征点在实际路面上的实际距离,最后用最小二乘法拟合车辆速度。
该算法具有可行性和适应性,快速的检测出车辆运行速度,维护道路的正常通行秩序。
2.4 车流量检测
检测原理:为了加快计算速度,通常只需截取一定宽度、高度,包含判别所需的足够信息的检测带,根据检测带内车辆信息的变化规律进行计数。
检测算法流程:对检测带中的像素进行处理、判别。用‘1’表示检测带内相应位置无车辆变化的信息,用‘0’表示检测带内相应位置无车辆变化的信息,则带内车辆变化的信息就完全可以用帧的数据流表示。例如:00011111000000001111100000,再用检测带内车辆信息的变化规律进行计数。如果用当前帧的数据流减去上一帧的数据流则只可能出现4种情况和3种结果:①上一帧某位置没有车,当前帧对应位置也没有车:0减0,结果为0;②上一帧某位置有车,当前帧对应位置也有车:1减1,结果为0;③上一帧某位置没有车,当前帧对应位置有车:1减0 ,结果为1;④上一帧某位置有车,当前帧对应位置没有车:0减1 ,结果为-1 。显然,结果为‘1’,表示有新的车辆到来;;结果为‘- 1’,表示车辆已离开。利用该结果就可以方便地进行车辆的计数。该算法运算量小,可是DSP实现高速实时采集、处理图像,且不受车速限制。
视频交通检测关键技术研究展望
由于视频检测技术受环境影响大,算法复杂,且相对不太成熟,在未来的发展中会致力于复杂背景下运动目标的检测、跟踪、分类;背景技术的更新;障碍物、运动车辆遮挡问题;彩色信息的提取;同一个图像中多种目标识别与特征提取;基于二维图图像的三维信息的提取等方面。
结语
目前,视频检测技术已广泛应用于交通视频监控系统。实时在线的检测道路交通秩序、状态,对停车、拥堵等异常状态立即报警,最大程度的避免二次事故发生,减轻交通监管人员的工作强度。随着智能交通的不断进步,视频检测技术也将运用于抛落物检测,火灾检测,人脸识别等,为环境保护、人类生活、工业交通的发展作出巨大贡献。
参考文献:
[1] 何楠楠. 智能监控中高效运动目标检测方法研究[J]. 自然科学报,2009,(4).
计算机视觉的主要任务范文3
关键词:图像情感;情感计算;情感表示
中图分类号:TP391.4
1 引言
随着社交网络的快速发展和广泛使用,例如Twitter(https://),Flickr(https://),YouTube(https://)和新浪微博(http://),人们倾向于将自己的所见所闻、兴趣爱好等以文本、图像和视频等多媒体的形式上传至网络来呈现和分享其观点和情感。因此,即会导致文本、图像和视频等多媒体内容的规模正以显示指数级态势发生着爆炸式增长,而针对这些多媒体内容的处理及理解需求则日趋显著与突出。相对于底层视觉特征层,人们只能够感知和理解图像、视频的高层语义层,包括认知层和情感层。以往对视觉内容分析的工作主要集中在理解图像、视频的感知层,即描述图像、视频的真实内容,如物体检测与识别。然而,公众对数字摄影技术的关注热衷及对视觉内容情感表达的强烈需求,使得对图像、视频最高语义层―情感层的分析已然具有高度重要的研究和应用价值。
对多媒体内容情感层的分析属于情感计算的一部分。情感计算的概念是由麻省理工学院媒体实验室的Picard教授于1995年首次提出的,而于1997年专著《Affective Computing》则正式出版问世[1]。书中给出了情感计算的定义,即情感计算是指与情感相关、来源于情感或能够对情感施加影响的计算,包含3个部分:情感识别、情感发生和情感表达[1]。
基于此,根据需要处理的多媒体数据类型,对多媒体情感层的分析可以分为4种:基于文本的情感分析[2]、基于音频的情感分析[3-5、基于图像的情感分析[6-7]以及基于视频的情感分析[8-11]。其中,基于文本和音频的情感分析比较成熟,图像情感分析中人脸表情识别的研究也相对成熟,而关于普通图像和视频情感分析的研究相对来说,却仍显不足。对图像情感识别的研究最初源始于人脸表情R别,因为人脸检测和人脸识别的研究相对成熟,心理学对人脸表情的分类也已建立有清晰脉络,此外更有大量的研究机构也成功建立了表情识别的数据库[12-14]。
受到情感鸿沟和人类情感感知与评估的主观性等基础现实的制约,普通图像的情感分析进展缓慢。不仅如此,图像情感计算的发展还将需要心理学、艺术学、计算机视觉、模式识别、图像处理、人工智能等领域的共同支持,众多领域学科的交叉使得图像情感计算成为一个富有挑战性的研究课题。本文对图像情感计算的发展研究现状进行了全面论述和分析。
1 情感的定义与描述
人类具有很强的情感感知和表达的能力,但是由于情感的复杂性和抽象性,人们很难将情感从概念上实现具体化和清晰化。心理学、生理学领域的科学家们早在18世纪就开启了专门情感研究,并且推出了诸多情感理论来解释情感是如何源起于产生的,如1872年的Darwin三原则理论[15]、1884年的James-Lange理论[16]、1927年的Cannon-Bard 理论[17]和1991年的Lazarus理论[18]。但是迄今为止,科学家们也仍未提出一个准确、全面且可得到一致认可的情感定义。
心理学中与情感相关的词汇有emotion、affect、sentiment、mood、affective、emotional等,类似的中文词汇有情感、感情、情绪、情感的、感情的等。心理学上认为情感、情绪与感情是3个严格不同的概念[1,19-20],但计算机学科对此区分并不严格区分,一般只是笼统将其称为情感。wikipedia上给出了一种情感的模糊定义,“情感是对一系列主观认知经验的通称,是多种感觉、思想和行为综合产生的心理和生理状态”。心理学领域主要有2种方式来描述情感:离散情感状态(CES)和维度情感空间(DES),或称为范畴观和维度观[1,19-20] 。
1.1 离散情感状态
持范畴观的心理学家将情感分成相互独立的范畴,而且在外部表现、生理唤醒模式上都存在一定的差异。近年来,持范畴观的研究人员根据生物进化理论把情感分为基本情感和复合情感。不同的心理学家对基本情感的分类差异很大,从2类到几十类也各有不等,具体的分类方法可以参照文献[1,19-20]。研究中更具代表性的成果主要有:Ekman把情感分为6类,即高兴、愤怒、厌恶、恐惧、悲伤、惊奇[21];Izzard 用因素分析方法,提出11种基本情绪,即兴趣、惊奇、痛苦、厌恶、愉快、愤怒、恐惧、悲伤、害羞、轻蔑和自罪感[22];Mikels 通过严格的心理学实验,把情感分为8 类,即表示积极情感的娱乐、敬畏、满意、刺激,表示消极情感的生气、厌恶、害怕和悲伤[23];Plutchik提出了一套情感的演化理论,认为情感有8种基本类型,但是每种情感又有3种不同的愉悦度(valence),即把情感分为24类[24]。还有一种模型是将情感分成积极和消极2类,或者积极、消极和中性三类。目前对表情识别的分类多是基于Ekman 的分类,而对图像情感分类则以Mikels 的分类为主。
复合情感是由基本情感的不同组合派生出来的,可随着个体认知的成熟而烟花发展,并随着文化的不同而发生变化。Izzard认为复合情感有3类:基本情感的混合、基本情感和内驱力的集合、基本情感与认知的结合[22]。
用CES来描述和测量情感的优势可分述为:
1)符合人们的直觉和常识,容易被人们理解和标注,有利于情感计算的成果在现实生活中推广和应用;
2)有利于智能系统在识别情感后,进一步推理与之相联系的特定心理功能和可能的原因,而后做出适当的反映。
但也需明确认识到CES的缺点,具体表述为:
1)哪些情感状态或基本情感是必要的,目前研究者对此没有统一的认识;
2)CES是对情感的定性描述,无法用量化的数字表达主观的情感体验,且其对情感的描述能力也比较有限。
1.2 维度情感空间
持维度观的研究人员认为情感具有基本维度和两极性,所有的维度构成一个笛卡尔空间,DES就将情感描述为该空间中的点,理论上该空间的情感描述能力是无限的,即能够涵盖所有的情感状态。各种不同的维度情感空间可以参照[1][19][20]。常见的维度情感空间大多是3D的,如natural-temporal-energetic[25]、valence-arousal-control[26]、activity-weight-heat[27]等。比较典型的是愉悦度-激活度-优势度空间(valence-arousal-control space,VAC,有些时候也称为pleasure-arousal-dominance space,PAD)[26]。其中,愉悦度表示个体情感状态的正负特性,激活度表示个体的神经生理激活水平,优势度表示个体对情景和他人的控制状态。具体的VAC三维情感空间如图1 (a)所示[28],从图中不难看出,优势度维度的取值范围很小,而且只有当愉悦度呈现高峰值时才会有用。因此可以说,优势度在描述情感过程中仅能发挥有限的的作用。大多数计算机学者用DES 描述情感时都不曾考虑优势度,以愉悦度-激活度空间为主。但也并非所有的愉悦度和激活度的组合都能构成情感,能构成人们常见的情感状态的愉悦度和激活度的组合范围如图1 (b)所示[28]。
用DES来描述和测量情感具有鲜明优势,具体可论述为:
1)描述能力强,理论上能描述所有的情感类别;
2)易于对情感进行量化,以精确的数值来描述情感,解决了CES 情感标签的模糊性问题,也一并消除了自感的描述问题。
但DES也存在一定的缺陷,分析可得如下结论:
1)不易于人们直观的理解,给定DES的维度值,普通人无法识别出应该归属为哪种情感;
2)测试人员对DES的打分有一定的难度,由此导致较大的偏差。
2 图像情感计算的问题描述
所谓图像情感计算,是指计算机从图像中分析并提取情感特征,使用模式识别与机器学习的方法对其执行计算,进而理解人的情感。根据情感的描述方式,图像情感计算可以分为三大任务:情感分类、情感回归和情感图像检索。
一个图像情感计算系统通常包括如下3部分:
1)图像预处理。 由于输入图像在尺寸、光照、颜色空间等方面存在很大的差异,在进行特征提取之前往往需要进行预处理。比如,把图像尺寸调整到统一大小,把颜色空间转换到同一空间等。在图像情感计算过程中,预处理虽然不是一个专门的研究热点,但却会对算法的性能产生很大的影响。
2)情感特征提取/选择。 特征提取与选择是图像情感计算过程中的重要组成部分,直接决定了算法最终的性能。该步骤的主要任务是提取或者选择一些特征,并且使得其在类内具有很大的相似性而在类间具有很大的差异性。一般而言,用于图像情感计算的特征可以分为底层特征、中层特征和高层特征。
3)模型设计。 模型设计是指根据图像情感计算的任务来设计合适的模型,并以提取的特征作为输入,通过W习的方法来获得相应的输出。情感分类是一个多类分类问题,可以直接采用多类分类器,或者转换成多个二值分类。情感回归是一个回归问题,研究针对的是维度情感模型。情感图像检索对应的是如下检索问题,即给定输入图像,查找与之表达相似情感的图像。针对不同问题,可以采用的学习模型也将各有不同。
3 图像情感计算的研究现状与分析
本节对图像情感计算的研究现状进行总结与分析。首先从不同的分类角度综合归纳了当前可高效用于图像情感计算的技术特征,然后简要介绍常用的机器学习方法,最后对已有方法存在的主要问题进行分析并给出可能的解决方案。
3.1 用于图像情感计算的特征
如何提取与情感紧密相关的特征是情感识别的关键问题。根据所提特征的通用性(generality),可将已有的特征分为2类:通用特征和专用特征。根据所提特征的层次(level),可将已有的特征分为3类:底层特征、中层特征和高层特征。
进一步地,所谓通用特征是指计算机视觉里普遍适用的特征,设计这些特征的目的并不是为了用于情感识别,而是其他的视觉任务,如物体检测。Yanulevskaya所使用的Wiccest特征和Gabor特征就是典型的通用特征[29]。而专用特征则是针对情感识别这一特定任务而设计的能够表达不同情感的特征,比如常见的颜色、纹理等底层特征。
目前,绝大多数的情感特征提取工作都是基于艺术元素的,如颜色、纹理、形状、线条等。针对每一种类的艺术元素,研究者们又设计了为数可观的不同描述方法。关于艺术元素及常用特征的典型描述可见于如下:
1)颜色(color)有3个基本的属性:色调、强度和饱和度。常用于描述颜色的特征除了这3个基本属性的平均值,还有colorfulness、area statistics[30-31]等。
2)灰度值(value)描述颜色的亮度或暗度。常用的特征有lightness、darkness[30-31]等。
3)线条(line)是在某物体表面的连续的标记。主要有2种:强调线和非强调线。强调线,又称轮廓线,勾勒出了一个物体的轮廓或边缘,而非强调线则用于描述那些轮廓和边缘未可堪称重要的作品。不同的线条给人不同的感觉,如水平线代表平静,给人轻松的感觉,垂直线代表强度与稳定,对角线代表紧张,曲线则表示运动。通常用于描述线条的特征有通过霍夫变换计算的静止和动态线条的数量和长度[30]。
4)纹理(texture)用于描述物体的表面质量(surface quality),有的艺术家使用平滑的纹理,也有的人喜欢用粗糙的纹理。常用的有基于小波的特征、Tamura特征、灰度共生矩阵[30]以及LBP特征。
5)形状(shape)是平的,具有2个维度:高度和宽度。Lu等人使用圆度(roundness)、角度(angularity)、简单性(simplicity)和复杂性(complexity)来描述形状[32]。
(6)形式(form)具有3个维度,即高度、宽度和深度,因此形式具有体积。
(7)空间(space)指物体之间、上面、下面或物体内部的距离或面积。
除了目前常规通用的底层表达,也有部分工作开始提取中层或高层的特征。Machajdik和Hanbury[30]提取了包括Level of Detail、Low Depth of Field、Dynamics和Rule of Thirds在内的构图(composition)作为中层特征,同时也发掘包括人脸、皮肤在内的图像内容(content)作为高层特征。Solli和Lenz使用每个兴趣点周围的情感直方图特征和情感包(bag-of-emotion)特征来对图像进行分类[27]。Irie等人提取基于情感的音频-视觉词组包(bag of affective audio-visual words) 的中层特征以及隐主题驱动模型来对视频进行分类[33]。
3.2 常用的机器学习方法
图像情感分类一般可建模为标准的模式分类问题,常用的分类器都可以用来解决此问题。根据建模过程,其中的有监督学习即可以分为生成式学习和判别式学习。相应地,判别式学习就是直接对给定特征条件下标签的条件概率进行建模,或者直接学习一个从特征到标签的映射,如Logistic回归和支持向量机(SVM)等。生成式学习则分别对类别先验和似然进行建模,而后再利用Bayes法则来计算后验概率,如高斯判别分析和Naive Bayes。当处理多类分类时不仅可以直接采用多类分类器,也可以转换成多个二值分类问题,常规策略有“一对一”分类和“一对多”分类。多种分类器可用来实施图像情感的分类,其中进入使用流行的主要有Naive Bayes[30]、Logistic回归[34]、 SVM[32,35-36]和稀疏表示等。
一般情况下,图像情感回归建模为标准的回归预测问题,即使用回归器对维度情感模型中各个维度的情感值进行估计。常用的回归模型有线性回归、支持向量回归(SVR)和流形核回归(manifold kernel regression)等。当前有关图像情感回归的研究仍属少见,已知的只有使用SVR对VA模型所表示的情感尝试,并实现了回归[32,35]。
目前,已知的用于图像情感检索的方法主要有SVM[36]和多图学习[37]等。
3.3 现有方法存在的主要问题及可能的解决方案
3.3.1 所提取的底层特征与图像情感之间存在语义鸿沟
目前的图像情感识别方法主要仍是基于学习的方法,因此学习时所使用的特征决定了最终学习的分类器或回归预测器性能的优劣。而时下绝大多数工作所提取的特征主要是基于艺术元素的底层特征,这就使得“情感鸿沟”极为显著,学习所得的分类器的分类准确率较为低下,回归预测器的预测结果误差较大。基于此,如何进一步缩小这一鸿沟,即改进特征与情感类别或情感得分之间的映射关系,即已成为气候工作的研究重点。
3.3.2 ]有从脑科学、心理学及艺术学等学科的研究成果中得到启发
情感表达是一个多学科交叉的研究方向,现有的从计算机的角度进行情感表达的工作大多都未曾引入脑科学、心理学及艺术学等产生的丰硕研究成果,这极大地限制了图像情感表达领域的发展、推进和完善。
在进行艺术作品创作时,艺术家不仅仅需要使用艺术元素,而且还要研究艺术原理,即把艺术元素进行组织与排列以产生特定语义与情感的各类规则。因此,使用艺术原理作为描述情感的中层特征,可能会对情感识别产生一定的帮助。
3.3.3 没有考虑个性化的情感识别
目前绝大多数的情感识别工作对情感的处理都是基于期望情感的[38-39],即图像拍摄者或电影制作者创作作品时希望读者产生怎样的情感,或者基于大众化情感,即大多数人所产生的类同式情感。这样做虽然便于研究,但却不符合实际情况,因为人的情感具有宽泛的主观性,例如喜欢看恐怖片的人可能觉得这部影片并不恐怖。也就是说,不同人对同一图像的情感反应是不同的,即情感评价是因人而异的,而且同一个人在不同时刻对同一图像的情感反应也有可能出现不同,即情感评价是因时而异的。因此,课题重点就是需要研究每个人的真实情感。
要想解决上述问题,就需要为每个人都建立一个数据库。人工标记显然费时、费力,不过,把社交媒体中人们对图像的评价作为对图像情感的理解将不失为是一种近便且准确的方法。同时,还可以进一步考虑对社交媒体中情感的传播和影响进行建模,即人们某时刻对图像情感的理解可能受当时朋友情感的影响。
如果说只考虑期望情感将太过泛化,那么个性化的情感识别却可能过于特殊,并且为之产生的计算复杂度还会很高。因此,介于期望情感和个性化情感之间的群体情感就可能会是一个合理的适用性解决方案。所谓群体情感,是指具有相同教育背景、生活环境和社会文化的人对同一幅图像所产生的情感是相似的。
3.3.4 高层语义和情感的理解相互制约
人们产生情感,是由特定的知识背景与特定的语义所共同决定的。那么,考虑基于语义的图像情感识别就应该更具备克星的真实性。但是,对图像语义的研究本身即是一个尚未解决的疑难课题,这将使得运用语义进行情感识别还存在很大的困难。如果图像语义分析技术达到了一定的技术水平后,图像情感识别也必将获得根本性解决。
3.3.5 目前用于情感表_测试的数据库规模很小
现有已公布的图像情感数据库规模很小,大型的仅在2 000左右,小型的仅有200,这也限制了图像情感表达的迅速发展,首要就是无法运用统计的思想和理论来发现其中的一些规则。而与此同时,社交网络即给出了一种可能的应对方案,如何利用社交网络上的大规模数据提高图像情感的识别率,挖掘图像情感之间的相互关系则需要研究学界的更大关注与投入。
3.3.6 没有适用于图像情感识别的理想学习策略
语音情感识别之所以发展得比较迅速,即是因为得到了与语音表达的机制相关的混合高斯模型和人工神经网络的有效技术支撑。但是目前适用于图像情感识别的学习策略或分类方法却仍显匮乏,而这又需要脑科学和机器学习等交叉领域研究的进化、提升与发展。
4 结束语
研究图像情感计算,实现对图像情感语义的分析对认知心理学、行为科学、计算机视觉、多媒体技术和人工智能领域的理论和技术发展均有促进作用。在过去的十几年内,已有较多的相关工作获得发表、并进入实践。但是,图像情感计算的研究仍然处在初级阶段,仍有众多问题未获解决。本文在分析研究现状的基础上,总结出了现有方法存在的问题以及可能的解决方案,为后续研究提供了参考。
参 考 文 献
[1] Picard R W. Affective computing[M]. London, England: MIT Press, 1997.
[2] PANG B, LEE L. Opinion mining and sentiment analysis[J]. Information Retrieval, 2008, 2 (1/2): 1-135.
[3] YANG Y H, CHEN H H. Machine recognition of music emotion: A review[J]. ACM Transactions on Intelligent Systems and Technology, 2012, 3 (3): 40.
[4] RODA A, CANAZZA S, De POLI G. Clustering affective qualities of classical music: beyond the valence-arousal plane[J]. IEEE Transactions on Affective Computing, 2014, 5 (4): 364-376.
[5] ZHAO S, YAO H, WANG F, et al. Emotion based image musicalization[C] //Proceedings of IEEE International Conference on Multimedia and Expo Workshops. Chengdu, China: IEEE, 2014: 1-6.
[6] WANG W, HE Q. A survey on emotional semantic image retrieval[C] //Proceedings of IEEE International Conference on Image Processing. San Diego, California, USA: IEEE, 2008:117-120.
[7] JOSHI D, DATTA R, FEDOROVSKAYA E, et al. Aesthetics and emotions in images[J]. IEEE Signal Processing Magazine, 2011, 28 (5): 94-115.
[8] WANG S, JI Q. Video affective content analysis: a survey of state of the art methods[J]. IEEE Transactions on Affective Computing, 2015, 6 (4): 410-430.
[9] ZHAO S, YAO H, SUN X, et al. Flexible presentation of videos based on affective content analysis[C] //Proceedings of International Conference on Multimedia Modeling. Huangshan, China: Springer, 2013: 368-379.
[10] ZHAO S, YAO H, SUN X, et al. Video Indexing and Recommendation Based on Affective Analysis of Viewers[C] //Proceedings of ACM International Conference on Multimedia. Scottsdale, AZ, USA: ACM, 2011: 1473-1476.
[11] ZHAO S, YAO H, SUN X. Video classification and recommendation based on affective analysis of viewers[J]. Neurocomputing 119: 101-110, 2013.
[12] WANG S, LIU Z, LV S, et al. A natural visible and infrared facial expression database for expression recognition and emotion inference[J]. IEEE Transactions on Multimedia, 2010, 12 (7): 682-691.
[13] LUCEY P, COHN J F, KANADE T, et al. The extended Cohn-Kanade dataset (CK+): A complete dataset for action unit and emotion-specified expression[C] //Proceedings of IEEE Conference on Computer Vision and Pattern Recognition Workshops. San Francisco, CA, USA: IEEE, 2010: 94-101.
[14] YIN L, WEI X, SUN Y, et al. A 3D facial expression database for facial behavior research[C] //Proceedings of IEEE International Conference on Automatic face and gesture recognition. Southampton, UK: IEEE, 2006: 211-216.
[15] DARWIN C, EKMAN P, PRODGER P. The expression of the emotions in man and animals[M]. New York, USA: Oxford University Press, 1872/1998.
[16] JAMES W. What is an emotion?[J] Mind, 1884(34):188-205.
[17] CANNON W B. The James-Lange theory of emotions: A critical examination and analternative theory[J]. The American Journal of Psychology, 1927, 39 (1/4): 106-124.
[18] LAZARUS R S. Progress on a cognitive-motivational-relational theory of emotion[J]. American psychologist, 1991, 46 (8): 819.
[19] 王志良. 人工情感[M]. 北京: C械工业出版社, 2009.
[20] 陈俊杰. 图像情感语义分析技术[M]. 北京: 电子工业出版社, 2011.
[21] EKMAN P. An argument for basic emotions[J]. Cognition & emotion, 1992, 6 (3/4): 169-200.
[22] IZARD C E. Basic emotions, relations among emotions, and emotion-cognition relations[J]. Psychology Review, 1992, 99: 561-565.
[23] MIKELS J A, FREDRICKSON B L, LARKIN G R, et al. Emotional category data on images from the International Affective Picture System[J]. Behavior research methods, 2005, 37 (4): 626-630.
[24] PLUTCHIK R. Emotion: A psychoevolutionary synthesis[M]. New York, USA: Harpercollins College Division, 1980.
[25] BENINI S, CANINI L, LEONARDI R. A connotative space for supporting movie affective recommendation[J]. IEEE Transactions on Multimedia, 2011, 13 (6): 1356-1370.
[26] RUSSELL J A, MEHRABIAN A. Evidence for a three-factor theory of emotions[J]. Journal of research in Personality, 1977, 11 (3): 273-294.
[27] SOLLI M, LENZ R. Color based bags-of-emotions[C] //Proceedings of International Conference on Computer Analysis of Images and Patterns. M¨unster, Germany:Springer, 2009: 573-580.
[28] Dietz R, Lang A. Affective agents: Effects of agent affect on arousal, attention, liking and learning[C]//Proceedings of International Cognitive Technology Conference. San Francisco, CA, USA: Springer, 1999.
[29] YANULEVSKAYA V, Van GEMERT J, ROTH K, et al. Emotional valence categorization using holistic image feature[C] //Proceedings of IEEE International Conference on Image Processing. San Diego, California, USA: IEEE, 2008: 101-104.
[30] MACHAJDIK J, HANBURY A. Affective image classi?cation using features inspired by psychology and art theory[C] //Proceedings of ACM International Conference on Multimedia. Firenze, Italy: ACM, 2010: 83-92.
[31] WANG W N, YU Y L, JIANG S M. Image retrieval by emotional semantics: A study of emotional space and feature extraction[C] //Proceedings of IEEE International Conference on Systems, Man and Cybernetics. Taipei, Taiwan: IEEE, 2006: 3534-3539.
[32] LU X, SURYANARAYAN P, ADAMS J R B, et al. On Shape and the Computability of Emotions[C] //Proceedings of ACM International Conference on Multimedia. Nara, Japan: ACM, 2012:229-238.
[33] IRIE G, SATOU T, KOJIMA A, et al. Affective audio-visual words and latent topic driving model for realizing movie affective scene classification[J]. IEEE Transactions on Multimedia, 2010, 12 (6): 523-535.
[34] BORTH D, JI R, CHEN T, et al. Large-scale visual sentiment ontology and detectors using adjective noun pairs[C] //Proceedings of ACM International Conference on Multimedia. Barcelona, Spain: ACM, 2013: 223-232.
[35] ZHAO S, GAO Y, JIANG X, et al. Exploring Principles-of-Art Features for Image Emotion Recognition[C]//Proceedings of ACM International Conference on Multimedia. Orlando, FL, USA: ACM, 2014: 47-56.
[36] WU Q, ZHOU C,WANG C. Content-based affective image classification and retrieval using support vector machines[C] //Proceedings of International Conference on Affective Computing and Intelligent Interaction, Beijing, China: Springer, 2005:239-247.
[37] ZHAO S, YAO H, YANG Y, Zhang Y. Affective Image Retrieval via Multi-Graph Learning[C]//Proceedings of ACM International Conference on Multimedia. Orlando, FL, USA: ACM, 2014: 1025-1028.
[38] HANJALIC A. Extracting moods from pictures and sounds: Towards truly personalized TV[J]. IEEE Signal Processing Magazine, 2006, 23 (2): 90-100.
[39] HANJALIC A, XU L Q. Affective video content representation and modeling[J]. IEEE Transactions on Multimedia, 2005, 7 (1): 143-154.
[40] ZHAO S, YAO H, JIANG X, et al. Predicting discrete probability distribution of image emotions[C] //Proceedings of IEEE International Conference on Image Processing. Quebec, QC, Canada: IEEE, 2015: 2459-2463.
计算机视觉的主要任务范文4
关键词:测绘;工程技术;浅析
中图分类号:K826.16文献标识码:A文章编号:
随着数字化测绘技术的提高,GIS技术的不断成熟、GPS技术在各行各业的广泛应用,
现代工程测量必将朝着测量数字工程化的方向发展。大力开展数字化测绘技术的应用与研究将是测绘单位提升自身竞争实力和创造经济效益的首要任务。
1 测绘工程的概念
测绘是采集、量测、处理、分析、解释、描述、利用和评价与地理和空间分布有关数据的一门科学、工艺、技术和经济实体,具有基础性、前期性和公益性的特点。测绘产品是反映地表上的自然、人工要素及其在地理空间的位置和属性信息的,而这些信息是社会发展和经济建设的各行各业需要利用和必须依赖的基础。而工程测绘是把工程地区各种地面物体的位置和形状,以及地面的起伏状态,用各种图例符号,依照规定的比例尺测绘成地形图,或者用数字表示出来,为工程建设的规划设计提供必要的图纸和资料。要测绘的地球表面形态以及地物地貌虽然复杂多样,但其形状和大小均可看作是由一些特征点的平面位置和高程所决定的。测绘工程的主要任务有控制测量,线路测绘、施工放样、数据处理等工作。
2 测绘工程的特点及发展趋势
2.1 现代测绘工程的特点
现代测绘工程的主要特点概括起来就是“六化”和“十六字”。“六化”即测量内外业作业的一体化、数据获取及处理的自动化、测量过程控制和系统行为的智能化、测量成果和产品的数字化、测量信息管理的可视化、信息共享和传播的网络化。“十六字”是精确、快速、可靠、实时(动态)、遥测(遥控、遥传)、集成、简便、安全。组织测绘工作应遵循的原则是“从整体到局部”、“先控制后碎部”,这样可以减少误差的累积,保证测图的精度,提高测图的质量,可以分幅或分区测绘,加快测图进度。
2.2 现代测绘工程的发展趋势
现代测绘工程的发展趋势:①.测量机器人为代表的智能和自动化系统的广泛应用;②.基于知识和数据挖掘的工程信息系统;③.从土木工程测量和三维工业测量到人体医学测量
;④.多传感器的集成和混合系统;⑤. GPS、GIS、RS、TPS和激光扫描系统等多S技术集成与融合;⑥.大面积空间数据的快速采集和处理;⑦.精密数据处理和海量数据处理方面的数学物理建模;⑧.信息服务的网络化和可视化。
3 数字化技术在原图处理中的应用
3.1 原图数字化处理
在建立各种GIS系统时,需要对原有地图进行数字化处理,对于原始地图,若其现势性、精度和比例尺能满足要求,就可以利用数字化仪对其进行数字化处理工作。当前主要有手扶跟踪数字化和扫描矢量化、GPS数据输入三种方法,手扶跟踪数字化需要的仪器为计算机,数字化仪及相关软件,是较早的一种数字化输入方法,输入速度较慢,劳动强度也较大。扫描矢量化是通过扫描仪输入扫描图像,然后通过矢量跟踪,确定实体的空间位置。随着扫描仪的普及和矢量化软件的不断升级,其作业方法越来越趋于自动化,它是一种省时,高效的数据输入方法。GPS输入是依据GPS工具能确定地球表面图形精确位置,由于它测定的是三维空间位置的数字,因此不需作任何转换,可直接输入数据库,目前主要是应用PTK(Real Tine Kinematics-实时动态)技术,它是在GPS基础上发展起来的,能够实时提供流动站在指定坐标系中的三维定位结果,并在一定范围内达到厘米级精度的一种新的GPS定位测量方式,通过将1台GPS接收机安装在已知点上对GPS卫星进行观测,将采集的载波相位观测量调制到基准站电台的载波上,再通过基准站电台发射出去;流动站在对GPS卫星进行观测并采集载波相位观测量的同时,也接收由基准站电台发射的信号,经解调等到基准站的载波相位观测量,流动站的GPS接收机再利用OTF(运动中求解整周模糊度)技术由基准站的载波相位观测量和流动站的载波相位观测量来求解整周模糊度,最后求出厘米级精度流动站的位置。应用这种测量方法测量可以不布设各级控制点、界址点、地形点、地物点的坐标,利用测图软件可以在野外一次生成电子地图。同时,也可以根据已有的数据成果快速地进行施工放样。而实际应用得较多的主要是数字扫描矢量化软件,针对大比例尺地形图,大多数扫描矢量化软件能自动提取多边形信息,高效、便捷、保真的对地图进行数字化处理。下面简单介绍MAPCAD软件的原图数字化处理作业流程。
3.2 数字化原图作业流程
由于MAPCAD软件扫描矢量化输入方法具有图像清晰、编辑方便、操作方便,快捷键易于掌握,文件格式易于转换等特点一般外设精度都能满足,所以地形图的精度主要取决于人工跟踪精度和输出设备精度,而人工跟踪精度主要取决于作业人员的技能掌握熟练程度和工作态度,所以必须在加强培训作业人员基本技能,掌握作图以及测绘知识,要求工作人员严格按矢量化方案作业,确保图件的精度和质量高于国家现行数字化测图规范所规定的数字化精度和质量。在工程测量实践中,要做好地形图外业测点与数字化图缩放相结合、符号图层的划分子图、线形符号库的设计等工作保证满足工作进度的同时又节约项目经费,设计出的数字地图简单易用、美观整洁、易于使用地形图的工作人员判读。
4 数字化绘图
4.1 数字化绘图的特点
大比例尺地形图和工程图的测绘是传统工程测量的重要内容,数字化绘图克服了手工绘图存在的许多弊端,如工作量大,作业艰苦,作业程序复杂,烦琐的内业数据处理和绘图工作,成图周期长,产品单一等缺点,符合现代飞速发展的工程需要。目前,数字化成图技术主要有内外业一体化和电子平板两种模式。内外业一体化是一种外业分工明确、便于人员分配,从而具有较高的成图效率。作业人员,外业工效大大提高,时间缩短,直接生产成本大幅度下降。劳动强度:小数字化成图的过程,减轻了作业人员的劳动强度,使生产周期大大缩短,能及时满足用户的要求。便于保存管理及更新方便:数字化产品既可以存储在软盘上,也可以通过绘图仪绘在所需的图纸上,线条、线划粗细均匀,注记、字体工整,图面整齐、美观。且便于修改,能更好地保证图形的现势性和不变形性,避免重复测绘造成的浪费,增加地形图的实用性和用户的广泛性。
4.2 外业数据的采集
在采集数据时,数据采集人员要准确应用地物代码,在图纸上标绘明确,自己清楚,简单易懂,为内业下一步编图成图打下基础,以免在内业成图时出现错误。
4.3 绘制内业数据处理
无论是工程进程各阶段的测量工作,还是不同工程的测量工作,都需要根据误差分析和测量平差理论选择适当的测量手段,在允许的误差内,对测量成果进行处理和分析。
5 工程测量中的数字摄影测量技术
数字摄影测量是基于数字影像与摄影测量的基本原理,应用计算机技术、数字影像处理、影像匹配、模式识别等多学科的理论与方法就摄影测量本身而言,从测绘的角度上来看数字摄影测量还是利用影像来进行测绘的科学与技术;而从信息科学和计算机视觉科学的角度来看,它是利用影像重建三维表面模型的科学与技术,也就是在“室内”重建地形的三维表面模型,然后在模型上进行测绘,从本质上来说,它与原来的摄影测量没有区别。因而,在数字摄影测量系统中,整个的生产流程与作业方式,和传统的摄影测量差别似乎不大,但是它给传统的摄影测量带来了重大的变革。
6 结束语
测绘事业的跨越式发展,已成为国家重要的基础地理信息产业,其服务领域也已渗透到社会的方方面面。它为国家建设和管理提供与地理位置有关的各种专题性和综合性的基础信息,其成果是进行环境监测、农业建设、交通、水利等大型工程建设、城乡规划建设、重大灾害监测预报和科学研究以及国防建设等必不可少的基础资料。
参考文献:
计算机视觉的主要任务范文5
论文摘要:舒尔曼提出的“学科教学知识”推动了教育研究与实践的向前发展。高校《通信原理》课程学科教学的知识结构与内容框架主要包括通信原理课程教学模式等七个方面,对《通信原理》课程教学策略的知识应用进行论述,具有较强的理论和现实意义。
一、教师的学科教学知识
在20世纪80年代的西方教师专业化运动中,美国斯坦福大学的shulman教授,针对当时在对教师的资格认证中,将教师的教学能力简单理解为教师具备的学科知识和教学知识的问题,指出对教师知识的分析是推动我们对教师行为分析的最主要的因素,提出了“学科教学知识”(pedagogicalcontentknowledge/pck,也有人译为教育学内容知识、教学学科知识、教学专业知能、学科内容教学知识等)这一重要概念。舒尔曼认为,学科教学知识是学科知识和教育学知识的特殊混合体,是教师对学科知识独特的专业理解,为教师所特有,是“教师对如何帮助学生理解具体学科内容而做出的理解”。学科教学知识使教师学会如何组织和呈现具体学科的主题、问题、结果,使之与学习者多样的兴趣与能力相适应,从而组织教学。学科教学知识的提出,为教师的专业化发展提供了理论基础。
学科教学知识是教师在教学中将特定的学科教学内容加工转化而形成的能为学生接受的知识。wWW.133229.cOM学科教学知识的形成需要教师对学科知识、教学知识、学生知识、情景知识等进行整合,并对教学经验不断归纳、总结与调整。因此,学科教学知识具有实践性、情景性和个体性。学科教学知识的形成揭示了教师教学能力发展的复杂过程,使对教师教学能力的研究更为深人与科学。
舒尔曼提出的“学科教学知识”概念引起了学者们对与教师教学实践相关知识的重视,学者们进行了大量的论述与研究,“学科教学知识”理论成为教师教育、课堂教学行为分析、科学教育等学科教育研究的重要内容与基础框架。后经过修改和补充,舒尔曼又进一步阐释了学科教学知识的框架。以此为基础,学者根据自己的理解,提出了学科教学知识的内涵;尽管不同的学者有不同的见解,但大同小异,基本上都认为学科教学知识包括:教师教育信念、学科知识、教育学知识、关于学生的知识、教学情境知识等几个方面。
二、《通信原理》课程教师的学科教学知识
现代社会是信息社会,电子与通信类专业从而也成为极为热门的专业。在电子与通信类专业的课程结构中,《通信原理》是极为重要的专业基础课程。此课程的主要任务在于研究通信系统中的基本概念和基本原理,让学生掌握通信系统的基本组成、理论原理、实现方法和系统性能,能够在后续课程的学习和工作中灵活应用,并激发他们对通信学科方面的学习兴趣和热情,使他们有足够的自信和能力来适应这一日新月异的领域。该课程内容涉及随机过程、复变函数与积分变换、信息论、信号与系统、数字信号处理等多方面的知识。高等教育是人才培养的主渠道,而教师则是决定学校教育质量的关键。在创新人才教育的大背景下,有必要对《通信原理》课程教师的知识结构框架进行分析、研究。
对于教师学科教学知识框架,除理论研究之外,也要进行实证研究,如调查分析、测量、比较等;而教师知识结构必然会涉及学科和专业。以往的研究多涉及基础教育领域的教师;近年来,高等教育专业的教师学科教学知识也开始受到重视。笔者在理论分析、听课、亲历教学的基础上,提出了高校《通信原理》课程教师的学科教学知识框架。高校《通信原理》课程教师的学科教学知识应该包括如下主要内容:
(一)《通信原理》课程教学模式知识
《通信原理》课程教学方法因课程中具体内容的性质而有所不同,常用的教学模式有:仿专家思考模式,是要求学生像通信专家一样思考,强调学术严谨,以传授专业知识为主的教学模式。概念转换模式,是通过使学生产生情景上的冲突,改变学生原有的概念,帮助他们建立通信科学概念的模式。探究模式,包括一般意义上的探究和以学习共同体为中心、分工负责、利用实验室条件进行研究的“小组合作学习”或“合作探究”模式。基于项目或课题的教学模式,即以“导向”性的问题为中心,围绕一个主题组织概念、原理,指导学生通过实验和调查得出解决方案等。
在熟悉《通信原理》课程教学模式的基础上,应根据本科和高职专科的《通信原理》课程教学目标的不同和学生基础的不同,采用不同的课程教学模式。根据作者的经验,本科教学中适合采用仿专家思考模式、概念转换模式、探究模式;高职专科教学中,则宜运用基于项目或课题的教学模式和探究模式。这些模式在教学中还需要灵活交替使用。不论采用何种教学模式,《通信原理》课程的教师都应当具备体现《通信原理》课程特点的教学策略。笔者在教学中大量使用了理论教学与实验、实习相结合,以及案例教学的策略。
(二)通信专业课程专业培养目标和教学目标知识
通信专业的培养目标是:培养一批具有坚实的理论基础、很强的创新意识和动手能力的人才,主要培养德智体全面发展、基础扎实、知识面宽、素质高、富有创新意识、在通信领域内获得专业训练的高级技术人才,以适应国家加速信息化发展对人才的需要。专业是以通信技术为主,结合计算机应用的宽口径专业。根据教学目标,我们应该重点围绕通信系统设计、智能信息处理、无线通信及测控、现代交换技术、光通信技术、计算机视觉与图像处理等展开教学应用型人才的培养。
只有从总体上理解了通信专业课程专业培养目标和教学目标,才能在课程教学中处理好《通信原理》和其他课程的关系,达到预期的专业培养目标。为此,我们需要根据创新人才教育的大思路,从高等教育特点和各学校具体条件出发,结合各个专业的特点,加强专业理论教学、实验教学、实践教学活动。
(三)《通信原理》课程目标与内容知识
为了适应新世纪的需要,《通信原理》课程的培养目标是:培养具有厚基础、宽口径、高素质、强能力,特别是具有工程实践能力和创新能力的科技人才。通过本课程的学习,使学生获得必要的信息通信与传输方面的基础理论知识和基本技能,为后续专业课程的学习打下扎实的理论基础和动手能力;使学生在模拟和数字通信方面建立清晰的系统概念,掌握通信系统的一般分析方法,并具备一定的通信系统设计能力;使学生了解通信技术的最新发展方向,从而把握通信学科发展脉络,激发学生的主动性与创新性,提高学生的综合素质和创新能力,为培养能够解决挑战性问题的新一代工程师打下坚实的基础。
《通信原理》课程内容具体包括:通信的概念、通信系统基本组成、数字通信系统、信道简介;信息嫡的基本概念;awgn信道下香农信道容量理论;信号的频域分析方法,自相关函数与功率谱密度,互相关函数与互谱密度;hillbert变换,解析信号,等效基带分析;随机信号与平稳随机信号,窄带平稳随机信号,高斯白噪声过程;模拟调制;模拟信号的数字化;高斯白噪声信道中的数字传输;带限awgn信道下的数字传输等。对这些内容的深入了解和精深掌握是做好《通信原理》课程教学的前提条件。
除了对这些基础知识的牢固掌握以外,教师还应该对通信的研究史和发现史、学科研究与开发最新进展,特别是光电子通信有较多的了解,并在教学中适当进行最新研究与开发成果介绍。
(四)学生对本专业知识的理解能力知识
通信专业教师应该了解学生对具体专业知识的理解能力,包括学生学习需要和学习困难的知识。所谓学生学习需要的知识指的是学生在学习某个通信原理课程内容之前必备的专业知识和技能。学生的学科理解能力是影响教学效果的重要原因。只有深人了解学生学习《通信原理》课程需要哪些预备知识、难点是哪些等,才能有的放矢,提高学生学习的积极性,提高教学效果。学生学习《通信原理》课程时,较难理解和接受的知识包括通信的抽象概念、随机过程概念、信息熵、hillbert变换,教师教学中应该努力让学生掌握这些方面的内容。
(五)通信安全意识
通信安全涉及国家、单位,以及个人的通信秘密保障,关乎国家、社会征集、经济、军事等各方面的安全。现有的《通信原理》课程教材都不涉及通信安全教育,这是一个很大的缺陷。《通信原理》课程教师不仅自己应该具有一定的通信安全知识和相关思考,更应该将其渗透于《通信原理》课程的教学之中。
三、《通信原理》课程学科教学知识的运用
《通信原理》课程教师应该具备上述学科教学知识,并能熟练地运用于教学实践活动中。作者在自己的教学实践中对《通信原理》课程学科教学知识进行了灵活运用。下面对其中的教学策略知识的运用举例说明如下:
(一)学科知识传授方面,教学重点放在数字通信系统部分
《通信原理》内容包括通信的基本理论、模拟调制、数字传输、编码技术几个大部分。由于现代通信的发展方向是数字通信,因此,教学重点在数字通信系统部分。在课程的开始阶段,让学生准确把握数字通信系统的组成、各模块的功能,使得学生能够把本课程的内容有机地组合起来,在学习具体知识点时能明确它们在通信系统中所起的作用,收到“既见树木,又见森林”的效果。《通信原理》是一门理论和实践并重的课程,在理论教学方面,要让学生掌握通信系统的基本组成、理论原理、分析方法。为了提高教学效果,在课堂上采用设问思考和逆向思考提问等教学方法,启发学生思考、诱发学生的思维、激起学生的求知欲望。在教学过程中注重考虑学生的学习方法和接受能力,在备课时,采用换位思考方法,感受学生的困惑,考虑讲解的技巧,以在最短的时间内收到最佳的教学效果。同时根据不同的教学内容和教学对象,注意将学生自学和精讲重点、难点结合起来。在每章及每小节结束时,注意进行课程总结,让学生及时巩固所学内容,便于继续学习新的内容。
(二)通过介绍新技术进展,提高学生学习的兴趣
《通信原理》是通信专业的基础课程,涉及的最新技术不多,而本院电子信息与科学技术专业通信方面的后续课程也不多。而且,在中国的高等教育中,工科教育的一个较明显的缺陷是最新科研与开发成果很难及时在教材中体现,用什么教材讲什么内容的传统也使得最新科研与开发成果很难在教师的授课过程中被包括进来。通信的发展日新月异,新技术层出不穷,如何在有限的课时里让学生掌握通信基本理论的同时,尽量了解更多关于通信方面的新理论和新技术是教学中需要解决的问题之一。作者在教学中采用课内附带介绍最新进展的形式来实现。例如,在讲解基本内容的同时,附带介绍了移动通信的发展状况、移动通信中常用多址方式、3g技术及其现状等内容,既能提高学生的学习兴趣,开拓其视野,也能为他们将来从事这方面的研究和开发指明方向。
(三)通过cai和仿真辅助教学,加深对理论的理解
大量使用多媒体进行教学,并在课件设计上注意突破简单的演示型模式,体现知识的建构过程,重视知识要点的剖析,提高学生主体的参与程度;在课堂讲解上,注意将重点内容在黑板上列出,避免让学生有看电影的感觉,同时便于学生理解掌握原理,从而弥补了传统教学和多媒体教学各自的不足;同时,利用仿真软件对通信系统进行仿真观察,提高了学生对理论的理解能力,培养了学生的系统观念。
(四)加强教学实践,巩固所学内容
《通信原理》是一门实验性很强的课程,为了帮助学生巩固所学的内容,加深理解,笔者在教学中采用两种方法来进行教学实践。其一,精心设计实验,利用本系现有的实验设备,设计实验内容;其二,利用matlab仿真软件,编写仿真程序,采用课堂演示的方法。比如,通过仿真实现多种解调方式的误码率曲线,可以让学生们直观地了解它们的性能差异,体会“面对面”交流的乐趣。而编程基础比较好的同学可以开发一个简单的数字通信系统,重点让学生练习使用信源编码信道及接收机的仿真实现等。这样,既提高了学生的编程能力,也加深了其对整个通信系统的理解。