视觉计算理论范例6篇

前言:中文期刊网精心挑选了视觉计算理论范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

视觉计算理论

视觉计算理论范文1

摘 要 预算管理是医院财务管理工作的重要内容之一。从公立医院内部环境看,预算是医院年度财务收支计划,是全体员工努力工作的目标,但目前医院全面预算管理状况仍不理想。本文分析了医院全面预算管理存在的问题并探讨了相应的解决对策。

关键词 医院 预算管理 现状 对策

一、预算管理的概念及作用

预算管理是医院根据事业发展目标和工作任务,对未来一定期间内经营活动的规模、结构进行预测,编制数字形式的事业发展计划,以指导和控制经营活动达到医院事业发展目标的内部控制活动或过程的总称。著名管理学教授戴维·奥利认为,全面预算管理是为数不多的能把组织所有关键问题融于同一体系的管理控制方法之一。预算是高绩效的管理工具,为实现内部管理及控制机制,其在数据科学加工的基础上与医院治理结构相适应,涉及医院内部各个管理层次的权利和责任安排,具有全局性。通过全面预算管理可以统一经营理念,明确奋斗目标,激发管理动力,确保医院核心竞争能力的提升。

二、医院全面预算管理现状

随着部门预算改革的不断深入,预算的完整性、公开性、公平性、效率性特点日益突出。新《医院财务制度》于2010年12月28日公布,其在第二章中明确提出医院要建立健全全面预算管理体系,为医院实施全面预算管理提供了制度性指南。然而在实际工作中,全面预算管理的实施效果尚不够理想,医院在实施过程中还存在一些亟待克服的问题。

(一)预算管理缺乏全员参与意识

部分医院高级管理层认为编制全面预算是财务部门的职责, 临床、医技科室和职能部门科室并没有参与到编制过程中,科室工作计划与医院预算没有直接关系,预算编制结果缺乏全员认同感。而全面预算编制目的则主要为了申请财政补助和完成上级主管部门布置的预算任务,没有将预算管理提升为医院综合的、全局性的管理行为,预算管理在医院经营管理中得不到高度重视。

(二)高级管理层全面预算管理意识淡薄

目前,部分医院高级管理人员由医疗专业人员转入,缺乏相应的财务及经营管理知识,实际工作中主观随意性很大,常常不根据预算统筹安排日常财务工作。由此造成医院财务管理缺乏计划性,有限的资金得不到充分利用,资源得不到合理配置,预算执行没有反馈及考评措施,经营管理显得混乱无序。

(三)预算编制方法不科学

全面预算编制的方法主要有固定预算、弹性预算、滚动预算、零基预算和概率预算等。部分医院为简化预算,往往只选择最简单的方法进行编制,但由于各种预算方法均存在一定缺陷,只用单一编制方法编制预算会致使预算编制的科学性和实用性大打折扣。如目前大部分医院基本上采用“基数法”编制预算, 即根据去年的基数加本年增减因数来确定年度的预算收支规模,这样编制出来的预算往往会成为空头支票。

(四)预算执行过程中财务管理职能弱化

目前部分医院预算约束力弱化,财务会计人员缺乏对预算的刚性监督机制。财务部门对经费的管理常常是事后核算,对经费收支的考核也只停留在表面平衡上,在预算执行过程中缺乏合理、有效的控制、分析和调整。预算事前无论证,事后无评价,造成资金使用效率低下。

三、医院预算管理改进对策

(一)全面搜集信息,保障预算编制结果的真实性

一套较完善的预算方案建立在对医院整体业务内容的全面理解、综合预期基础上。因此,在组织架构确立的条件下,预算编制的基础是信息搜集。预算编制者不仅要掌握财务数字信息还要掌握非财务信息,例如院内及院外环境信息等,以此保证预算编制所需数据的精确性及编制结果的科学性、合理性、真实性、可行性。

(二)全员参与预算编制,调动全体员工的积极性

预算管理不是数据的简单罗列,而是一种与医院治理结构相适应,涉及医院内部各个管理层次的权利和责任安排;是一种全过程、全方位、全员性的管理。临床、医技科室和职能部门科室管理人员在科室中既是学科带头人,又是科室管理者,在医院管理结构中处于承上启下的中间环节,肩负着科室和医院发展建设的双重重任。可以确切的说,预算编制没有科室的参与就会成为无本之木,空中楼阁。如果预算编制的成果得不到全体员工的认同,就难以适应复杂多变的医疗经营环境。高级管理层应当合理梳理预算编制流程,让广大员工了解医院的发展目标,以此调动员工的工作积极性。

(三)建立预算管理组织架构

全面预算管理作为一种管理控制系统, 需要有相应的组织架构才能得以顺利实施。健全预算管理组织体系是保证全面预算控制有效运行的基础。预算组织架构包括:预算管理委员会、预算编制机构、预算编制与协调、预算监控与协调、预算反馈组织等。其中预算管理委员会是预算的综合审定机构,是医院内部全面预算管理的最高权力机构。预算编制机构由财务部门领导,负责预算的编制、审定、协调、调整和反馈。 预算执行组织是预算执行过程中的责任单位, 医院内部的预算执行组织是指各临床医技科室、职能部门等各责任中心。预算管理组织架构能在医院预算管理过程中有效地积聚新的资源,同时协调好部门与部门之间的关系,人员与任务间的关系,使管理的各个层次明确自己应有的权力和应承担的责任,保证预算的有效执行。

(四)加强培训,提高预算管理人员专业素养

预算管理人员的专业素养必须与全面预算管理的要求相适应,医院管理层应充分认识到提高全面预算管理人员水平的必要性和重要性。应对单位财会人员现状开展调研,制定具体的培训计划,采取“走出去、拉进来”的形式,有针对性地开展多种形式的培训活动,不断提高单位会计人员的全面预算管理水平,使医院全面预算管理实施更加有效。

视觉计算理论范文2

随着计算机技术以及图像处理技术的快速发展,计算机视觉技术作为一种新兴的技术,其被广泛应用在军事、医学、工业以及农业等领域[1]。一般而言,计算机及视觉技术应用在农业的生产前、生产中以及生产后等各个环节,其主要就是鉴别植物种类,分级和检测农产品的品质。计算机视觉相较于人类视觉而言,其具有更多的优点,能够有效提高农业的生产率,实现农业生产与管理的智能化和自动化,促进农业的可持续发展。

一、计算机视觉技术概述

计算机视觉主要是指利用计算机来对图像进行分析,从而控制某种动作或者获取某描述景物的数据,是人工智能与模式识别的重要领域。计算机视觉兴起于20世纪70年代,其涉及的学科范围较为广泛,包括视觉学、CCD技术、自动化、人工智能、模式识别、数字图像处理以及计算机等。就目前而言,计算机视觉技术主要以图像处理技术为核心,是通过计算机视觉模拟人眼,并利用光谱对作物进行近距离拍摄,运用数字图像处理以及人工智能等技术,对图像信息进行分析和研究。计算机视觉技术主要步骤包括采集图像、分割图像、预处理、特征提取、处理和分析提取的特征等[2]。

二、农业机械中计算机视觉技术的应用分析

一般而言,农业机械中计算机视觉技术的应用,主要表现在以下三个方面:一是田间作业机械中的应用;二是农产品加工机械中的应用;三是农产品分选机械中的应用。

(一)田间作业机械中的应用

在田间作业机械中,计算机视觉技术的应用较晚。近年来,由于环境保护政策的提出,在农田作业的播种、植保以及施肥机械中的应用越来越广泛。在田间作业的过程中应用计算机视觉技术时,主要应用在苗木嫁接、田间锄草、农药喷洒、施肥以及播种等方面[3]。为了有效识别杂草,对除草剂进行精确喷洒,相关研究人员分析了美国中西部地区常见的大豆、玉米以及杂草二值图像的形态学特征,发现植物长出后14~23天内能够有效区别双子叶和单子叶的效果,准确率最高达到90%。在1998年开发出Detectspary除草剂喷洒器,其能够有效识别杂草,在休耕季节时,其相较于播撒而言,能够减少19%~60%的除草剂用量。在农业生产中,农药的粗放式喷洒是污染严重,效率低下的环节,为了有效改变这种现状,Giler D.K.等研制出能够精量喷雾成行作物的装置。该系统主要是利用机器视觉导向系统,使喷头能够与每行作物上方进行对准,并结合作物的宽度,对喷头进行自动调节,确保作物的宽度与雾滴分布宽度具有一致性,从而有效节省农药。一般而言,该系统能够促使药量减少66%,提高雾滴沉降效率和施药效率,减少农药对环境产生的影响。

(二)农产品加工机械中的应用

随着信息技术以及计算机技术的快速发展,计算机视觉技术被广泛应用在农产品加工的自动化中。如Jia P等提出了图像处理算法,该算法主要是以鲇鱼水平方向与主轴的形心位置和夹角为依据,检测鲇鱼的方位以及背鳍、腹鳍、头、尾的位置,从而确定最佳的下刀位置。此外,我国的黄星奕等人在研究胚芽米的生产过程时,在不经过染色的情况下,对胚芽米的颜色特性等进行分析,得出胚芽米颜色特征的参数为饱和度S。同时利用计算机视觉系统,自动无损检测胚芽精米的留胚率,其结果与人工评定的结果大体一致。

(三)农产品分选机械中的应用

在分级和鉴定农产品的品质时,可以利用计算机视觉技术对其进行无损检测。一般计算机视觉技术不需对测定对象进行接触,可以直接利用农产品的表面图像,分级和评估其质量,其具有标准统一、识别率高一级效率高等优势。计算机视觉技术在检测农产品时,主要集中在谷物、蔬菜以及水果等方面。Chtioui Y等人提出了结合Rough sets理论,利用计算机视觉技术对蚕豆品质的方法进行评价。该理论通过不同的离散方法对石头、异类蚕豆、过小、破损以及合格等进行有效区分,并利用影色图像,对其特征参数进行分类,最终分类的结果相比于统计分类结果,两者具有较好的一致性。

视觉计算理论范文3

关键词 表象计算模型;视觉表象;体育技术教学;数字化;策略

中图分类号TP30 文献标识码A 文章编号 1674-6708(2011)34-0160-02

0 引言

人在完成某种作业或解决某些问题时,主要依赖于视觉表象操作或表象过程[1],体育动作技术学习与一般文化知识学习过程不同,需要一定的视觉表象来唤起和调节学习者的行为方式,它以运动感知觉和视觉感知觉的材料为基础形成的,通过运动视觉表象和运动动觉表象反映技术动作在一定的时间、空间和力量上的基本特征,支配自己肢体,通过随意运动再现动作的形象,在此基础上通过身体练习最终形成运动技能[2]。有学者指出:形成正确的视觉表象是掌握运动技能的重要基础[3]。认知心理学自20世纪50年代中期兴起以来,在信息加工过程的研究中,注重表象、注意、问题解决等因素的研究,提倡以学生为主的教学理念,将动机培养理论、建构主义理论等诸多认知心理学理论广泛应用到教学领域中。同时,随着计算机技术的迅猛发展,多媒体教学作为一种新的教学模式,改变了过去单纯的积累传授知识、记忆巩固知识的模仿式教学范式,强调从人机交互、协作学习等角度出发,给学生充分自由,让学生发挥个性潜能、自主创新、主动建构,通过提供交互性、直观性、生动性的教与学的环境,增加学生学习的积极性和兴趣。但是,目前的体育技术教学多媒体课件主要从动机培养理论、建构主义理论等角度出发进行课件设计,注重陈述性知识对学习者学习效果的影响,却忽略了学习者在学习体育技术这一特殊知识(即程序性知识)过程中表象加工过程对其学习效果的影响。因此,本文将以Kosslyn的表象计算模型理论为指导,提出既符合学生认知过程,又具有交互性、直观性和生动性的体育技术教学设计策略,为多媒体信息技术教学设计提供一个科学、有益的探索。

1 Kosslyn的表象计算模型理论

Kosslyn等人以信息加工理论为基础,并结合神经解剖学、神经生理学、神经心理学以及计算学方面的研究成果,提出了表象计算模型理论,它是建立在高水平视觉加工基础之上的。Kosslyn的表象计算理论就是一个以系统方式进行信息转换的“黑箱”,就是要通过对所要解决问题以及解决这些问题的条件的分析来提供一种运算,它强调的是执行运算过程中所采用的精确步骤。Kosslyn的表象计算模型理论具有以下特征:首先,视觉表象在一个叫做“视觉缓冲器”的结构中得到显示[4],它是在一种具有空间功能的特殊的空间载体,视觉表象在空间载体上的大小决定了客体表征的清晰程度。其次,空间载体的最高分辨率部分即中心部分,能够描述客体的位置、方位、大小等各种空间关系。第三,视觉表象从长时记忆中提取表象文件和命题文件,在各种加工子系统的参与下,在短时记忆中生成已有表象。许多加工过程均使用表象文件、命题文件以及空间载体去生成、解释和转换表象。第四,由于视觉表象出现于视觉短时记忆中,而且其容量有限,所以视觉表象一旦在空间载体上生成,极易衰退[4]。

2 体育技术教学课件的设计策略

2.1 目标信息量适中策略

目标信息量适中策略是指在呈现完整运动技术信息时,要突出其基本特征的表象信息,删除细节的表象信息,使呈现目标的信息量由大变小,因为目标信息量过大会溢出空间载体的有限范围,使目标不能表象在具有最高分辨率的中央区域。因此,目标信息量大小适中有助于学生把注意集中于所学的动作环节上,避免由于给初学者呈现过多的信息,造成部分表象信息丢失,影响学生正确的动节表象的形成。例如,根据空间载体存载表征目标的特点,在制作单杠短振屈伸上动作技术教学课件时要采用两种呈现方式:

1)首先呈现动作技术特征结构。要识别一个客体,人必须区分出客体的特征特性,忽略掉无关刺激的变化。在制作课件时,可以采用Flas只呈现短振屈伸上的出浪、收腿等技术环节,给学习者建立一个基本的动作特征和拓扑关系表象,不呈现动作细节,以减少这些信息对空间载体的占用,使呈现目标信息量由大变小,使其不会溢出空间载体表征的有限范围,利于形成视觉表象;

2)其次增加动作细节信息量的呈现。当基本特征表象建立后,应当及时呈现由于动作变形或隐藏而忽略的客体的细节部分。用Flas或视频放大屈伸上动作技术的时机和方向、动作姿态、动作方向、用力时机等关键技术和动作细节,突出局部,使不易观察到的细节部分放大,增加视觉摄入的信息量,丰富已经形成的视觉表象。

2.2 目标信息呈现多维化策略

目标信息呈现多维化策略是指通过对客体的大小、方位和位置关系信息的呈现,将学习者所观察到的二维视觉物体结构整合成贮存于空间载体中的具有三维物体结构特性的心理表征,调节学习者的实际操作能力。Shepard等的心理旋转实验证明,表象可以表征物体的三维结构,而不仅是图形的二维特征。例如,在蛙泳技术教学课件设计中应从3个方面进行目标信息呈现。

1)空间关系呈现。可以识别客体的形状即客体是什么。可以从正、背、侧三个不同的角度分别进行视频呈现,突出蛙泳动作技术在正、背、侧三个方向上呈现出不同的信息,学习者通过建立类别关系表征来捕捉蛙泳技术的一般特征。可以更有效地阐明躯干、手、臂各相邻部分间的空间关系;

2)拓扑关系呈现。可以表明客体的那些部分是彼此相联接的,哪些部分是彼此包容的。应用多媒体渐变技术,从完整蛙泳动作技术呈现渐变到蛙泳腿或蛙泳手局部动作技术后再还原到完整蛙泳动作技术的呈现;将蛙泳腿和蛙泳手等局部动作技术同步呈现进行比较,突出整体与局部、局部与局部之间的大小关系以及配合时机。

2.3 表象与命题表征结合策略

Kosslyn认为长时记忆中包含表象文件和命题文件两种数据结构形式[4]。表象文件包含表象怎样在空间载体中被进行表征的信息(即说明目标是什么),表象文件可以表征整个物体或者一个物体的各个部分,尤其是一些表象文件规范了一个描述物体基本形状的框架表象。命题文件可以表征物体的各种特征以及这些特征与他的一个基础部分之间的关系。许多加工过程均使用表象文件、命题文件以及空间载体去生成、解释和转换表象。例如在五步助跑掷标枪动作技术教学课件设计过程中,目标的呈现方式如下:

1)先以视频或三维动画的方式呈现五步助跑掷标枪动作技术的动作要领、技术细节、动作过程,提高学习者对信息的接收量,通过表象表征方式给学习者建立一个五步助跑掷标枪的基本动作技术框架表象;

2)再以视频、语言、文字等多元化信息相结合的方式呈现。把“五步助跑掷标枪”这一动作技术制作成多个慢镜头画面、静帧画面或三维动画,配以简练的语言讲解、字幕提示等进行展示与模拟,使学生能够看清投掷步、引枪、最后用力的动作细节。通过表象表征和命题表征相结合的方式来呈现五步助跑掷标枪动作有利于学生把握重点技术,化解练习难点,形成完整的动作技术视觉表象。

3 结论

本文根据Kosslyn的表象计算模型理论,以表象加工过程和存载视觉表象的空间载体的特点为依据,以多媒体技术提供的交互性、直观性、生动性的教与学的环境为基础,结合体育技术教学直观性、示范性和操作性的特点,从认知心理学角度出发,将表象理论应用到多媒体课件设计中,提出了:1)呈现目标信息量大小适中;2)目标信息呈现多维化;3)表象与命题结合;4)强化视觉表象,避免表象衰退等体育技术教学多媒体课件设计策略和相应的目标信息呈现方式,以期为多媒体课件的开发与设计提供理论依据。

参考文献

[1]王,汪安圣.认知心理学[M].北京:北京大学出版社,1992:237-238.

[2]马启伟.体育心理学[M].北京:高等教育出版社,1996:138-139.

视觉计算理论范文4

关键词: 计算机 视觉注意机制 计算机视觉注意模型

1.引言

随着信息技术的不断发展,数据处理量剧增,以及用户不断扩大的个性化需求,对计算机信息处理能力提出了越来越高的要求。如何在场景中快速准确地找到与任务相关的局部信息,即物体选择与识别,已经成为计算机信息处理领域的一个研究热点。随着在心理学领域注意机制研究的不断发展,将注意机制引入信息处理领域来解决物体识别问题,已经不再是纸上谈兵。

人类视觉系统进行视觉信息处理时,总是迅速选择少数几个显著对象进行优先处理,忽略或舍弃其他的非显著对象。进入人类视野的海量信息,通过注意选择机制进行筛选,就能使我们有选择地分配有限的视觉处理资源,保证视觉信息处理的效率,这就是视觉选择注意机制的原理。依据人类视觉选择注意的基本原理,开发能够进行智能图像信息处理的计算机系统,就成为一大任务。我们研究的主要方向是使计算机处理对象时,能够具备与人类相似的视觉选择注意能力。

2.视觉注意机制

研究视觉注意机制是个多学科交叉的问题,目前多个领域的研究人员都取得了研究成果,并且对视觉注意的理论都形成了一些共识。目前普遍认为注意既可以是按自底向上(自下而上)的图像数据驱动的,也可以是安自顶向下(自上而下)的任务驱动的。其中,自下而上的研究主要来自图像中物体数据本身的显著性。例如,在视觉搜索实验中,显著的物体会自动跳出,如图1中的圆点通过特征对比,以形状跳出的形式获得注意。自上而下的引导主要来自当前的视觉任务,以及场景的快速认证结果,即我们可以“故意”去注意任何一个“不起眼”的物体,如我们可以在图书馆浩如烟海的藏书中,找到自己感兴趣的那本书。

研究视觉注意机制的重要方法是研究眼睛在搜索目标时的表现。显著图中的各目标在竞争中吸引注意点,注意点在各个注意目标间转移。根据注意点转移时是否伴随眼动,视觉注意也分为隐式注意和显式注意。隐式注意的中央凹不会随着注意点的转移而移动,而显式注意的中央凹随每次注意点的转移而运动。

对视觉注意机制的研究为计算机视觉的发展提供了可能。计算机视觉借鉴人类视觉的注意机制,建立视觉注意的计算模型。通过“注意点”的选择与转移,实现对复杂场景中任务的搜索与定位,最终来实现实时信息的响应处理。在计算机视觉的研究中,显式注意应用较多。

3.计算机视觉注意模型

从人的角度来看,人类视觉系统通过视觉,选择注意在复杂的场景中迅速将注意力集中在少数几个显著的视觉对象上。从场景的角度来看,场景中的某些内容比其他内容更能引起观察者的注意,我们称之为视觉显著性,两者其实是从不同的角度对视觉选择注意过程的描述。

我们把引起注意的场景内容定义为注意焦点FOA(Focus of Attention)。Treisman的特征整合理论中将视觉信息处理过程划分为前注意和注意两个阶段,各种视觉特征在前注意阶段被以并行的方式提取出来,并在注意阶段以串行方式整合为视觉客体,即注意的特征和客体是通过不同方式进行的。在注意焦点的选择和转移上,Koch[2]进行了深入的研究,他提出注意焦点FOA的变化具有四个特征,即单焦点性:同一时刻只能存在一个FOA;缩放性:FOA的空间范围可以扩大或者缩小;焦点转移性:FOA能够由一个位置向另一个位置转移;邻近优先性:FOA转移时倾向于选择与当前注视内容接近的位置。同时注意焦点具有抑制返回的特点,即FOA转移时抑制返回最近被选择过的注视区域。在此基础上,视觉注意的研究人员提出了多种视觉注意模型。

4.视觉注意模型的研究现状

人类的视觉注意过程包括两个方面:一方面是对自下而上的初级视觉特征的加工,另一方面是由自上而下的任务的指导,两方面结合,共同完成了视觉的选择性注意。与此对应,当前的计算机视觉注意研究也分为这两个方面。

4.1自下向上的数据驱动注意模型研究及分析

在没有先验任务指导的情况下,视觉注意的目标选择主要是由场景中自下而上的数据驱动的,目标是否被关注,由它的显著性决定。现在,自下而上的注意研究主要基于Treisman的特征整合理论和Koch&Ullman的显著性模型,Itti、satoh等人均在此基础上提出了自己的研究模型,并做了一些模型的改进研究。自下而上的研究方法通过对输入图像提取颜色、朝向、亮度等方面的基本视觉特征的研究,形成各个特征对应的显著图。另外,一些研究者采用基于局部或全局对比度的方法,来得到图中每个像素的显著性,进而得到显著图。

现有的自下而上的视觉注意计算模型中,Itti的显著图模型(简称Itti模型)最具代表性。该模型主要包含3个模块:特征提取、显著图生成和注意焦点转移。模型通过初级特征的提取,将多种特征、多种尺度的视觉空间通过中央―周边算子得到的各个特征的显著性图合成一幅显著图。显著图中的各个目标通过胜者为王的竞争机制,选出唯一的注意目标,其中注意焦点的转移用的是禁止返回机制。但该模型也有一些缺点,如显著区与目标区域有偏差、计算量较大、运行时间较长、动态场景中实时处理不平等。

在动态场景之中,由于Itti模型很难满足实时性的要求,科研工作者们正在努力研究动态场景的特性,并建立相应的动态模型。如Wolfe[1]指出,影响前注意的特征包括颜色、方向、曲率、尺寸、运动、深度特征、微调支距、光泽、形状,等等,其中又以运动特征最为敏感。而You等采用了一种空间域特征和时间域特征相结合的视觉注意模型,该模型假设当场景中存在全局运动时,视觉注意对象将极少做运动。然而,许多真实的场景并不能满足这个假设,限制了模型的适用范围。Hang等人提出了一种运动图的计算方法,并把运动图作为特征之一,与颜色、亮度、方向等特征结合。这些研究关注了运动特征对视觉的影响,但是均存在一定的局限性,对于复杂的运动场景的注意焦点计算很难取得良好的效果。

我国研究者也在Itti注意模型的基础上研究了适合动态场景中的注意模型,形成了一些理论成果。如曾志宏[2]等人提出注意焦点计算模型,郑雅羽[3]等提出基于时空特征融合的视觉注意计算模型。这些模型都能较好地提取动态场景下的视觉目标。

4.2自上而下的任务驱动的注意模型研究及分析

自上而下的注意即任务驱动的注意,通过目标和任务的抽象知识,在一定程度上指导注意焦点的选择。在自上而下注意模型的研究方面,Laar(1997)提出了一个用于隐式视觉注意的模型,该模型通过任务学习,将注意集中于重要的特征。Rabak[4]提出了基于注意机制的视觉感知识别模型,该模型在定义目标显著性时,通过语义分析对其他三个自下向上的视觉控制参数项进行线性组合。Salah将可观测马尔科夫模型引入到模拟任务驱动的注意模型研究中,并在数字识别和人脸识别的实验中取得了很好的效果。Itti提出以调节心理阈值函数的形式来控制视觉感知。

目前对自下而上的数据驱动方面的研究较多,而对自下而上的任务驱动方面研究较少。因为任务驱动的注意与人的主观意识有关,同时受到场景的全局特征影响。自上而下的注意涉及记忆、控制等多个模块的分工协作,其过程非常复杂。

5.计算机视觉注意模型研究的趋势

自底向上和自顶向下的加工是两种方向不同的信息处理机制,两者的结合形成了统一的视知觉系统。人类的视觉信息处理系统只有遵循这样的方法,才能有效地实现视觉选择注意的目的。

实践证明,把自底向上和自顶向下的研究相分离的研究方法并不能很好地解决计算机的视觉注意过程。要想使计算机能够准确模拟人类的视觉注意过程,实现主动的视觉选择注意的目的,采用两种研究方法相结合的形式势在必行。自底向上的视觉注意计算往往离不开与自顶向下的有机结合,实现二者的优势互补是以后计算机视觉注意研究的一个趋势。

参考文献:

[1]Wolf J M,Cave K R.Deploying visual attention:the guided search model.In:Troscianko T,Blake A,eds.AI and the Eye.Chichester,UK:Wiley press,1990.

[2]曾志宏,周昌乐,林坤辉,曲延云,陈嘉威.目标跟踪的视觉注意计算模型[J].计算机工程,2008,(23).

[3]郑雅羽,田翔,陈耀武.基于时空特征融合的视觉注意模型[J].吉林大学学报,2009,(11).

[4]Rabak I A,Gusakova V I,Golovan A V,et al.A model of attention-guided vision perception and recognition.Vision Research,1998,38.

视觉计算理论范文5

关键词:计算机图形图像设计;视觉传达设计;关系研究

中图分类号:TP391.41

将计算机技术应用到图形图像设计领域发起于上世纪80年代的欧美国家,并且随着计算机科技的快速发展,电脑制图对许多人来说不再是一件新鲜事,计算机制图技术得到广泛普及与应用[1]。正所谓“过犹不及”,长时间以来人们过度关注计算机制图技术,甚至完全将其当做一种工具,从而导致图形图像设计基本原则被忽视,致使计算机设计的图形图像缺乏艺术创新型,难以满足人类的视觉要求[2]。对此,相关学者开始尝试将计算机图形设计与视觉传达设计结合起来,并取得显著成效。本文即在此背景下展开研究,具体结果如下:

1 基本概念分析

要想了解计算机图像图形设计与视觉传达设计之间的关系,我们需要了解两者的基本概念,具体如下:

1.1 计算机图形图像设计的概念

所谓计算机图形图像设计,顾名思义,是指利用计算机技术设计制作图形图像的过程。计算机图形图像技术是随计算机技术发展而兴起的新技术,相比于传统的图形图像设计工作,它极大的解放了设计家的双手,有效减少了设计家双手的劳动,促使其有更多的时间和精力思考新的创意灵感。

另外,相比于手工制图,计算机软件更为精密,同时设计软件所提供的色彩、线条更为丰富,从而使制图者有更多选择余地。同时,相比于传统制图,计算机制图不需要长时间的美术基础训练,并且随着技术的发展,操作更加简单,适合初学者使用。

1.2 视觉传达设计

1.2.1 传达。在分析视觉传达设计前,我们需要先搞清楚什么是传达?传达是事物之间的一种共通现象,广泛存在于人类、自然界生物、机械等事物之间[3]。相比于其他事物之间的传达,人类之间的传达需要借助各种符号,因此我们可以将人类传达分为语言传达与非语言传达[4]。

语言传达,顾名思义,是指人类通过语言符号传递信息的现象,由于语言是人类最开始也是最常用的沟通方式,因此常被人类用来传达抽象概念。非语言传达是指语言传达之外的人类所采用的传达信息的方式,非语言传达主要通过视觉与听觉传递信息,而其中涉及范围最广的是视觉传达。

1.2.2 视觉传达设计。视觉传达设计是指需要通过视觉传达各种信息的设计。例如:人们通过视觉观察绘画作品的大小、形状、色泽等可以得到作者想要表达的信息,并且画家通过改变以上因素就可以传达出不同的信息。视觉传达设计的内容为:各种标志、文字、图形以及符号等;传达媒体为:电视、广播、杂志、报纸以及网络平台等;传达面向的群体为:社会中不同身份的受众。

2 计算机图形图像设计与视觉传达设计的异同点分析

2.1 两者不同点分析

虽然有关计算机图形图像设计与视觉传达设计结合的研究方兴未艾,但是从根本上来说,两者之间存在较多的不同点。我们只有准确把握两者的差距,才能够更好的将两者融合起来。总结来看,两者之间的不同点主要存在于历史背景、设计任务、培训方法、创作方法等几个方面。

2.1.1 两者的历史背景不同。如前文所说,计算机图形图像设计是随着计算机技术的发展而兴起的,因此该技术形成并兴起于上世纪末与本世纪初。而且进入新世纪后,随着计算机运行速度、存储容量、结构以及网络通信的完善,计算机图形图形设计进入了全新的发展时期,基本实现了与打印机、多媒体、绘图仪等设备的组合使用,从而使得计算机图形图像设计的范围得到拓展,逐渐从二维领域进入到三维领域。

相比于计算机图形图像设计,视觉传达设计的出现较早,其形成于上世纪40年代,第二次世界大战之后。此时人类社会迎来一个发展的新高峰,商品经济流通速度越来越快、流通范围越来越广。尤其是广告业的快速发展使得绘画与广告紧密的结合在一起,从而改变了传统的传达方法,使得视觉传达方式在人类社会中的地位越来越重要。此时,人类对视觉传达的需要促使了视觉传达设计的兴起与发展。

2.1.2 两者设计任务不同。从设计作品的特性来看,计算机图形图像设计的作品主要是立体的、三维的以及动态的,因此其设计任务就是将原本的平面、二维、静止等作品转变成为立体、三维、动态作品。

而视觉传达设计的作品主要是通过视觉传达向受众传递作者想要表达的信息,因此作品的形式并不固定,只要能准确表达信息即可。因此,视觉传达设计的任务主要是树立形象、传递思想、说服受众,同时视觉传达设计还肩负着传递艺术美感的任务。

2.1.3 两者培训方法不同。计算机图形图像设计是依靠计算机技术进行的工作,因此初学者掌握相关的计算机软件技术十分必要。因此,图形图像设计的培训方法主要是训练初学者了解并熟练使用计算机平面图形软件、三维软件,掌握排版印刷、视频编辑等技术。另外,训练初学者掌握一定的作品设计知识也是图形图像设计的主要任务。

由于世界传达设计的主要任务是向受众传达信息、传递美感,因此视觉传达设计工作需要用到广告学、美术学、传播学、设计学等多种知识。因此,在对初学者进行视觉传达设计培训时,要想初学者灌输工艺美术史、广告通论、设计史等学科的理论知识[5];同时,还要训练出初学者掌握广告设计、产品包装、装帧等必要技能。

2.1.4 两者创作方法不同。计算机图形图像设计的创作主要依赖于各种设计软件,因此设计师在创作时只要能够熟练掌握各种软件技术,合理搭配形体与色彩、装饰与视觉美、静与动、立体与空间,就能创作出一幅比较完美的作品。

视觉传达设计的创作还比较倾向于美术作品创作,因此在创作时设计师首先要从绘画技法的角度调整点、线、面、色彩、光线、形体等方面的关系,从而准确将自身思想融入到作品中,进而实现形和意、象征与象的结合。

2.2 两者的相同点分析

计算机图形图像设计与视觉传达设计最主要的共同点是:两者都属于艺术作品。因此,从这一角度来说,两者之间存在重叠的共同领域,例如:两者的教育培训都设计到了平面设计、色彩、素面等专业知识。

同时,两者都是运用文化符号与受众进行沟通并传递信息;并且,两种作品的设计都需要设计师进行创新思考,都必须要充满创意;另外,两者在进行创作时都需要考虑美术作品创作的各种要素以及创作原则。

3 结束语

计算机图形图像设计与视觉传达设计的结合是未来的发展潮流,符合21实际的发展要求,能够充分体现计算机技术与艺术的完美结合[6]。而在分析两者基本概念的基础上,对两者的异同点进行探讨,可以为两者的应用结合提供理论参考,进而更好的推动二者的发展。

参考文献:

[1]张金龙.计算机图形图像设计与视觉传达设计研究[J].吉林广播电视大学学报,2013(01):117-118.

[2]袁志翔.计算机图形图像设计与视觉传达设计探微[J].现代装饰(理论),2013(02):173.

[3]邵玉兰,赵昕.关于计算机图形图像设计与视觉传达设计的分析[J].信息与电脑(理论版),2013(03):45-46.

[4]范丽萍.计算机图形图像设计与视觉传达设计[J].电脑编程技巧与维护,2012(04):83-84.

[5]龚良彩.计算机图形图像设计与视觉传达设计[J].计算机光盘软件与应用,2012(10):181.

视觉计算理论范文6

关键词:人工智能;智能分类;知识体系

文章编号:1672-5913(2010)08-0025-04

中图分类号:G642

文献标识码:A

1 人工智能

斯坦福大学的Nilsson提出人工智能(ArtificialIntelligence AI)是关于知识的科学,即知识的表示、知识的获取以及知识的运用。人工智能在AI学科的基本思想和内容是研究人类智能活动规律,研究模拟人类某些智能行为的基本理论、方法和技术,构造具有一定智能的人工系统,让计算机去完成以往需要人的智力才能胜任的工作。

AI涉及计算机科学、控制论、信息论、神经心理学、哲学及语言学等多个学科,是一门新理论和新技术不断出现的综合性边缘学科。AI与思维科学是实践和理论的关系,属于思维科学的技术应用层次,延伸了人脑的功能,实现脑力劳动的自动化。

作为一门多学科交叉的课程,人工智能在机器学习、模式识别、机器视觉、机器人学、航空航天、自然语言理解、Web知识发现等领域取得了突破性进展。机器学习与知识表达的关系,模式识别与机器人学、机器视觉的关系,是学习的难点。人工智能的研究方法、学术流派、理论知识非常丰富,应用领域十分广泛。没有一个比较科学的AI知识体系,学生找不到体系和关系,会对AI产生神龙见首不见尾的感觉,严重影响学习兴趣。

本文从以下几个方面进行阐述:(1)智能与AI的关系;(2)AI的知识单元;(3)AI的相关学科、理论基础、代表性成果及方法;(4)AI的知识体系及应用。把握好上述的几个方面,就可以确准地表达知识,利用知识进行问题求解,掌握发现知识的方法,感知与理解智能系统构建的成果及技术。

2 AI及分类

认为智能源于脑,把脑(主要人脑)宏观层次的智能称为脑智能。而蜜蜂群、蚂蚁群等群体行为表现出的智能称为群智能。两种智能分属不同的层次和应用,脑智能是个体智能,群智能是社会智能或系统智能。模拟上述智能而生成的AI分两种,模拟脑智能的符号智能和模拟群智能的计算智能。

AI划分为符号智能和计算智能有些笼统。如进行仔细区分,AI来源于心理模拟、生理模拟、行为模拟和群体模拟。

2,1心理模型,符号推演

以心理模拟为依据,智能模型起源于数理逻辑。因人脑的记忆、联系、推理等思维活动在心理层面进行。Boole在《思维法则》中首次用符号语言描述思维活动的基本推理法则。

符号智能将信息和知识表示为符号形式,逻辑建模人的思维活动,通过逻辑推理,模拟人脑的思维过程进行问题求解。称为心理学派、逻辑学派或符号主义。

2,2生理模拟,神经计算

认为AI源于仿生学,特别是人脑模型。代表性成果是生理学家McCulloch和数理逻辑学家Pitts创立的脑模型,即MP模型。Hopfield提出用硬件模拟神经网络,Rumelhart提出多层网络中的反向传播BP算法。从模型到算法,从理论分析到工程实现,生理模拟及神经计算成为AI的一个研究流派。

2,3行为模拟,控制进化

基于行为模拟的AI称为行为主义及控制论学派。起源于控制论,模拟人及动物与环境交互、控制过程中的智能活动或行为,认为智能只有在环境中才是真正的智能。其批评符号主义和仿生学派对真实世界的过分简化。控制论的系统研究在上个世纪60年代播下智能控制和智能机器人的种子,在80年代诞生智能控制和智能机器人系统。

2,4群体智能,仿生计算

模拟生物群落的群体智能行为,将仿生计算的成果,直接付诸应用。代表性成果有遗传算法,进化计算,蚁群算法和粒子群算法等。计算智能以数据为基础,主要通过数值计算,运用算法进行问题求解。通过符号智能的知识表达、推理及模式识别等前期处理得到的数值,运用计算智能算法进行搜索计算。

AI主要体现为符号智能和计算智能,符号智能的研究内容主要有知识模型化及表示、搜索理论、推理、不确定性推理、系统结构和符号学习等。计算智能的研究内容有进化计算、模糊逻辑、神经计算和统计学习。这些研究内容所涵盖的研究方法在表1中进行详细的说明,同时较为完整地体现AI课程的知识体系结构。

3 AI的知识体系

从思维观点看,AI不仅仅限于逻辑思维,同时需要形象思维和灵感思维。数学是基础科学,也进入语言和思维领域,在逻辑、模糊数学等范围发挥作用。

AI是一个庞大的家族,包括众多的基础理论、重要的成果及算法、学科分支和应用领域等。如果将AI家族作为一棵树来描述,智能机器应作为树的最终节点。将AI划分为问题求解、知识与推理、学习与发现、感知与理解、系统与建造等五个知识单元。表2总结了AI家族的知识体系及其相关的学科、理论基础、代表性成果及方法。

3,1问题求解

1957年,Newell和Simon通过心理学实验,发现人在问题求解时思维过程的一般规律大致可分为三个阶段:①先思考出大致的解题计划:②根据记忆中的公理、定理和推理规则组织解题过程:③进行方法和目的分析,不断修正解题计划。

搜索是问题求解的核心技术,符号智能进行图搜索,计算智能进行智能优化搜索。

3,2知识和推理

知识就是力量,知识是智能基础和来源。推理是人脑的基本功能,知识与推理是AI的重要内容,在表1中对这部分内容进行了详细描述。知识表示模型有谓词逻辑、产生式表示、语义网络、框架等方法。推理方法有自动推理和不确定推理等。

AI的研究对象,大多具有不确定性。不确定性是针对系统或问题含有的不确定结构、参数等信息,如天气预报下雨概率45.6%,此预报属结论的不确定性。

3,3学习与发现

机器学习是指机器对自身行为的修正或性能的改善,使计算机具有学习能力,自动获取新的事实及新的推理算法。机器学习的研究重点是学习过程的认知模型、机器学习的计算理论、新的学习算法、综合多种学习方法的机器学习系统等。主要有符号学习、连接学习和统计学习等。

机器发现客观规律的过程称为知识发现,主要从大规模数据集或数据库发现知识或模式。知识发现方法有统计方法、粗集和模糊集、机器学习、智能计算等方法。知识发现的任务分为数据总结、概念描述、分类、聚类及相关性分析等。

机器学习的研究成果主要是机器的直接学习,类似人类通过阅读、讲课等间接继承性学习涉及很少。在智能硬件方面却举步维艰,要实现人工智能的最终目标,作为载体的智能计算机系统必须由质的飞跃。 人工智能的研究仍然是机遇与挑战并存。

3,4感知与理解

机器感知涉及图像、声音、文字等信息的识别问题。

模式识别的主要目标是用计算机模拟人的识别能力,运用知识表达和推理方法,主要从图形、图像和语音抽取出模式,表征或刻画被识别对象类属特有的信息模型。模式识别前,先提取样例模式,通过模式辨识或机器学习识别出分类知识,并对新的待识别模式进行类比判决。

目前有基于模式、基于判别函数、基于统计决策、神经网络、自适应等模式识别方法。

理解包括自然语言、图形和图像的理解,是智能系统进行交流的关键。

自然语言理解需要大量知识表示方法和推理技术,在机器翻译和语音理解程序方面取得了长足进步。

机器视觉在图像处理基础上,需要模式识别、机器学习理解视觉对象。由低层视觉提取对象特征,通过机器学习理解视觉对象。

3,5系统与建造

自从1965年第一个专家系统DENDRAL问世后,出现了各种实用的系统。专家系统的发展依托大量知识表示技术和推理技术,是最先发展的智能系统。

Agent系统是典型的分布式智能系统,由多个智能个体协作或竞争体现智能,是比群智能高级的社会智能。Agent系统采用了知识表示、推理、机器学习、模式识别等领域知识。

智能机器人是一个具有感知机能、运动机能、思维机能、通信机能的Agent系统,需要Agent理论和多Agent协同系统的技术支持。机器人是人工智能标志性研究成果,是一个实用的Agent系统。是人工智能多个基础应用的综合,同时依据了融合了多种基础理论。

4 结论

人工智能源于数理逻辑,20世纪30年代开始用于描述智能行为。并在计算机上实现了逻辑演绎系统。正是这些符号主义者,首先采用“人工智能”这个术语,后来又发展了启发式算法一专家系统一知识工程理论与技术。专家系统的成功开发与应用,为人工智能走向工程应用和实现理论联系实际奠定了基础。在AI其它学派出现之后,符号主义仍然是主流派。