信息技术学科学情分析范例6篇

前言:中文期刊网精心挑选了信息技术学科学情分析范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

信息技术学科学情分析

信息技术学科学情分析范文1

关键字:大数据 情报研究 情报研究技术

中图分类号: G250.2 文献标识码: A 文章编号: 1003-6938(2012)06-0001-08

1 引言

当数据和黄金一样,成为一种新的经济资产[1],当科研处于以数据为基础进行科学发现的第四范式[2],当数据开始变革教育[3],这些无不宣告着我们已经进入了大数据(big data)时代。不同的学科领域,正在不同的层面上广泛地关注着大数据对自己的研究和实践带来的深刻影响,情报研究领域也不例外。

大数据,顾名思义是大规模的数据集,但它又不仅仅是一个简单的数量的概念,IBM公司指出,大数据的特点是4个V:Volume(大量)、Velocity(高速)、Variety(多样)及Veracity(真实),它提供了在新的和正在出现的数据和内容中洞悉事物的机会,使业务更加灵活,并回答以往没有考虑到的问题[4]。Gartner公司的报告也提出,大数据是大容量、高速和多样化的信息资产,它们需要新的处理方式,以提高决策能力、洞察力和流程优化[5]。

由此可见,大数据强调的不单纯只是数据量多少的问题,其背后隐藏了更为复杂和深刻的理念,这些理念包括:①将对数据和信息的分析提升到了前所未有的高度。这里的分析不是一般的统计计算,而是深层的挖掘。大数据时代,如何充分利用好积累的数据和信息,以创造出更多的价值,已经成为企业管理者、政府机构以及科研工作者首要关注的问题。“业务就是数据”、“数据就是业务”、“从大数据中发掘大洞察”等意味着对数据分析提出了新的、更高的要求。可以这么说,大数据时代就是数据分析的时代。②多种数据的整合和融合利用。大数据时代,数据的多样性是一种真实的存在,数据既包括结构化的数据,也包括非结构化的数据,表现方式可以是数据库、数据表格、文本、传感数据、音频、视频等多种形式。同一个事实或规律可以同时隐藏在不同的数据形式中,也可能是每一种数据形式分别支持了同一个事实或规律的某一个或几个侧面,这既为数据和信息分析的结论的交叉验证提供了契机,也要求分析者在分析研究过程中有意识地融集各种类型的数据,从多种信息源中发现潜在知识。只有如此,才能真正地提高数据分析的科学性和准确性。③更加广泛地应用新技术和适用技术。数据量大(Volume)、类型多样(Variety)、增长速度快(Velocity)是大数据的突出特点,这必然会带来数据获取、整合、存储、分析等方面的新发展,产生相应的新技术或者将已有的技术创新地应用于大数据的管理与分析。同时,大数据的这些特点也决定了传统的、以人工分析为主的工作模式将遇到瓶颈,计算机辅助分析或基于计算机的智能化分析,将成为大数据时代数据与信息分析的主流模式。

对于在数据分析领域扮演重要角色的情报研究工作而言,大数据的理念和技术既带来了机遇,也带来了挑战。一方面,在大数据时代,情报研究工作正在得到空前的重视,大数据为情报研究的新发展提供了机会,从更为广阔的视野来看待情报研究的定位,研究新技术新方法,解决新问题,将极大地促进情报研究理论与实践前进的步伐。另一方面,大数据时代本身也要求各行各业重视情报研究工作,这就必然使得众多学科有意识地涉足到以往作为专门领域的情报研究之中,并将其作为本学科的重要组成部分加以建设。文献分析(本质是文本分析)不再为情报研究所独占,以往情报研究领域积累的相关理论和方法很有可能优势不再。因此,如何把握住自身的优势,并抓住机会有所拓展,是情报学在大数据时代需要思考的问题。

2 大数据环境下情报研究的发展趋势

大数据带来的新观念,正在引报研究的新发展,而且,研究人员也在不断地从情报研究的实践中总结经验教训,引导情报研究的未来走向。英国莱斯特大学的Mark Phythian教授在2008年10月作 了题为“情报分析的今天和明天”的报告[6],指出:①获知情境是至关重要的。忽略战略环境、领导风格和心理因素等更为广泛的问题,将导致情报研究的失误;②要加强信息之间的关联。美国政府部门内部的信息共享障碍,致使分析人员无法获取充足的信息来支持分析活动,导致情报研究中的预测失败;③要汲取更多外界的专业知识。这一举措虽然不能保证分析的成功性,但将是竞争分析的重要信息来源。

综合大数据背景的要求和以往情报研究的经验教训,结合国内外同行的研究成果,本文将情报研究的发展趋势总结为以下五个方面:单一领域情报研究转向全领域情报研究;综合利用多种数据源;注重新型信息资源的分析;强调情报研究的严谨性;情报研究的智能化。

2.1 单一领域情报研究转向全领域情报研究

随着学科的深入交叉融合及社会发展、经济发展与科技发展一体化程度的增强,情报研究正从单一领域分析向全领域分析的方向发展。

首先,表现在各领域中的情报研究从视角、方法上的相互借鉴。从方法上看,社交网络分析方法、空间信息分析等其他学科的分析方法,广泛应用于军事情报、科技情报等领域,心理学等领域的理论也用于情报分析的认知过程,以指导情报分析及其工具的研发。同时,情报学中的引文分析等文献计量方法也被借鉴用于网站影响力评估。从技术上看,可视化、数据挖掘等计算机领域的技术,为情报研究提供了有力的技术视角,情报研究获得的知识反过来又给予其他技术领域的发展以引导。可见,无论从思想上、方法上、技术上,各领域之间的交叉点越来越多,虽然这种相互借鉴早就存在,但现在意识更强、手段更为综合。

其次是分析内容的扩展,这也是最为重要和显著的变化。在情报研究过程中,不仅仅局限于就本领域问题的分析而分析,而将所分析的内容置于一个更大的情景下做通盘考虑,从而得出更为严谨的结论。联合国的创新倡议项目Global Pulse在其白皮书“Big Data for Development: Opportunities & Challenges”[7]中指出,情境是关键,基于没有代表性样本而获得的结论是缺乏外部合法性的,即不能反映真实的世界。在情报研究领域,一些数据往往因为一些不可抗力的原因而不完整,如早期的科技数据,可能由于国际形势等外部因素,导致一些国家的科技信息无法获取,基于这样缺失的分析样本来评估该国的科技影响力,如果仅就数据论数据,无疑是会得“正确”的错误结论,这时应针对这样的异常情况,将研究问题放置在当时的时代背景下,揭示背后的原因,从其他方面收集信息来补充,才能得出符合实际的结论。也就是说,必须要考察不同时间戳下的相关信息,再对分析内容加以扩充,这实质是一种基于时间轴的扩展。另外,将内容扩展至本领域的上下游则是一种更为重要的扩展。例如,考察某项技术的发展前景,如果仅就该技术本身来讨论,可能会得出正面的结论,但如果结合特定地区人们对该技术的态度、当地的技术水平、物理条件、发展定位等,却可能会得出相反的结论。这就说明,在很多领域中,环境不同,发展程度不同,要解决的问题也就不同。一些地区当前关注的问题不一定就是其他地区要关注的问题,某些欠发达地区当前不一定就必须照搬另一些所谓发达地区的当前做法。这需要通盘考察,分析相关思想、观点和方法产生的土壤、使用的条件,结合当前环境再做出判断,否则可能会对决策者产生误导。

2.2 综合利用多种数据源

综合利用多种信息源已经成为情报研究的另一大发展趋势。Thomas Fingar[8]从军事情报角度指出,军事情报界需要综合利用人际情报、信号情报、图像情报和外部情报,进行全资源分析(all-source analysis),即利用多种不同的信息资源来评估、揭示、解释事物的发展、发现新知识或解决政策难题。科技情报界也是如此,如利用科技论文和专利,发现科技之间的转换关系、预测技术发展方向,综合利用政府统计数据、高校网站、期刊、报纸、图书等来评估大学等科研机构。可见,综合利用多种信息源是从问题出发,系统化地整合所有相关信息资源来支持情报研究,信息源可以是学术论文、专利等不同类型的文献集合、文本和数据的集合也可以是正式出版物与非正式出版物的集合等。

这一发展趋势是由几大因素决定的。一是情报研究问题的复杂性。在大数据背景下,情报不再局限在科技部门,而成为全社会的普遍知识。公众对情报的需求使得情报研究问题更为综合,涉及要素更为多元,同时也更为细化。这导致单一数据源不能满足分析的要求,需要不同类型的信息源相互补充。例如要分析科技之间的转换关系,就避免不了涉及科技论文和专利这两种类型的信息源。二是各种信息源的特性。不同信息源可以从不同角度揭示问题,如专利、研究出版物、技术报告等,可以较为直观地反映研究者对某科技问题的理解与描述,而评论文章、科技新闻、市场调查等,可以反映出社会对该科技的观点、认知情况[9]。因此,各类信息自身的特性就说明他们之间可以、也需要相互补充。此外,从现实角度来看,通常会遇到某些信息无法获取的情况,这就需要别的信息加以替代,这就从实践角度说明了综合利用多种信息源的必要性。三是分析结果的重要性。以评估大学为例,评估的结果会引导各学校在比较中发现自身优势和差距,指导未来发展定位,同时也为广大学生报考提供参考。可见,研究结果对社会的影响是广泛而深远的,要做到分析结果的可靠性、科学性,必然先要从源头上,即分析数据上加以丰富完善。

综合利用多种信息源也意味着诸多挑战。首先分析人员要熟悉每一种信息资源的特性,了解相似信息在不同资源类型中是如何表现的,不同信息源相互之间的关系是怎样的。其次,针对待分析的问题,要选择适合的信息,并不是信息越多越好,类型越全越好,尤其是当问题含糊不清时,可能需要不断地调整信息源。再次,情报研究人员要能有效地综合、组织、解释不同信息源分析出的结果,特别是当结论有所冲突的时候,识别不当结果、保证分析结果的正确性是很重要的。

2.3 注重新型信息资源的分析

随着网络应用的深入,出现了许多新型的媒体形式。Andreas M. Kaplan等人将构建于Web2.0技术和思想基础上,允许用户创建交换信息内容的基于网络的应用定义为社会化媒体(Social Media),包括合作项目(如维基百科)、博客、内容社区(如YouTube)、社交网站、虚拟游戏世界和虚拟社会世界(如第二人生)等六种类型[10]。这类媒体形式依托于Web2.0等网络技术,以用户为中心来组织、传播信息,信息可以是用户创造性的言论或观点,可以是围绕自己喜好收集的信息资源集合等。由于社会化媒体的易用性、快速性和易获取性等特点,它们正迅速地改变着社会的公共话语环境,并引导着技术、娱乐、政治等诸多主题的发展[11]。这些通过庞大的用户社区来传播的高度多样化的信息及其网络结构,为洞悉公众对某一主题的观点、研究信息扩散等社会现象[12]、预测未来发展方向[11]等提供了机会,有助于发现有共同兴趣的社群、领域专家、热点话题[13]等,带来了网络舆情分析等研究内容。此外,这类信息结合其他类型的数据,产生了新的情报研究领域。例如,智能手机的普及和GPS的广泛应用,使得可以从社交网络和网络交互数据、移动传感数据和设备传感数据中获取社会和社区情报(social and community intelligence,SCI),揭示人类行为模式和社群动态[14]。

此外,机构知识库等作为一种反映组织或群体知识成果的智力资源,也正引报界的重视。网络信息联盟的执行董事Clifford A. Lynch[15]从大学的角度指出,成熟完整的机构知识库应包含机构和学生的智力成果(包括科研材料和教学材料)以及记录机构自身各项事件和正在进行的科研活动的文档。这暗示着学术界从过去只关心科研成果正逐步转向关注科研过程。从机构知识库中,可以发现隐藏其中的科研模式、揭示目前科研状况的不足,引导机构未来科研的发展走向等。但现有的机构知识库工具还缺乏帮助人们理解和分析这些资源的机制[16],在大数据环境下,加强这方面的研究也是必然趋势。可以预见,随着科技的发展和应用的深入,还会不断的有新型资源出现,并不断促进情报研究的发展。

2.4 强调情报研究的严谨性

情报研究活动在宏观层面上是一种意义构建(sensemaking)[17],依赖于分析人员根据已有知识构建认知框架(frame),通过对认知框架的不断修正来达到理解的目的[18]。这意味着情报研究活动本身带有很大的不确定性,很多因素影响着情报研究的有效性。如何使情报研究工作更加严谨,减少情报分析的不确定、提升情报成果的质量,正成为学术界当前普遍关注的问题。情报研究严谨性(rigor)不等同于分析结果的正确性,它衡量的是情报研究的过程,是指在情报研究过程中“基于仔细考虑或调查,应用精确和严格的标准,从而更好地理解和得出结论”[19]。美国俄亥俄州立大学的Deniel Zelik[20][21]从评估角度,给出了8个指标来衡量分析过程的严谨性:假设探索、信息检索、信息验证、立场分析、敏感度分析、专家协作、信息融合和解释评价。从这几项指标看,信息检索和融合是从分析信息源上消除不全面性;假设探索是要使用多种视角来揭示数据和信息;信息验证侧重于数据的溯源、佐证和交叉验证;立场分析强调分析的情境性;敏感度分析指分析人员要了解分析的局限性,目的是从分析方法上消除主观影响;专家协作是防止分析结果受分析人员自身的学科背景或经验带来的偏差;解释评价是要正确对待分析结论。可见,情报研究的严谨性意在消除人的主观偏见,用更为客观的视角对待情报研究。如果说之前的情报研究活动依赖专家的个人判断,带有较为强烈的主观色彩,那么走向严谨性的情报研究活动正逐步转变为一门科学。

在大数据背景下,情报分析的严谨性,不仅体现在理念上,还暗含了对技术的要求。面对海量数据,自动化的技术手段必不可少。当信息的检索更多的是借助检索系统,而不是人工的收集,信息融合更多依赖数据仓库等技术手段,如何在这样的分析环境中将情报研究的科学性落到实处,是需要关注的问题。可以看到,利用技术本身已经在一定程度上避免了人的主观性,但面对同样一个问题,可以有不同的技术手段,也可能产生不同的结果,如何避免由技术产生的偏见,也许通过多种技术手段或采用不同的算法,全方位地展示信息内容及其之间的关系,从而避免产生信息的误读,是一个解决方案。可见,在大数据时代,情报研究需要多种手段来加强其分析过程的科学性,而这又需要多种技术方法加以支持。

2.5 情报研究的智能化

大数据背景下的情报研究,对技术提出了更高的要求。正如美国国家科学基金会(NSF)的报告[22]所说,美国在科学和工程领域的领先地位将越来越取决于利用数字化科学数据以及借助复杂的数据挖掘、集成、分析与可视化工具将其转换为信息和知识的能力。对于情报研究来说,应用智能化技术能自动进行高级、复杂的信息处理分析工作,在很大程度上把情报研究人员从繁琐的体力劳动中解放出来,尤其在信息环境瞬息万变的今天,及时收集信息分析并反馈已经变得非常重要,这都需要智能化技术加以支撑。从信息源来讲,情报研究对象得以扩展,其中可能包含微博等社会化媒体信息,可能包含图片、新闻等,大量非结构或半结构化数据的涌入,必然需要技术将这些数据转化为结构化数据,以供后续分析。同时,多元化的信息,需要根据分析需求加以融合,这可能需要语义层面上的技术支持。从分析需求来讲,简单的统计分析已不能满足现在社会的决策需求,需要从大量信息中发现潜在模式,指导未来的发展,这就涉及数据挖掘、机器学习等技术。此外,要寻求情报研究的客观性,摒除过多的主观意愿,也需要多种技术来支撑。可见,这一发展趋势是大数据时代下的必然。而各国在积极建设的数字化基础设施,也在推动着情报研究的智能化,如欧洲网格基础设施(European Grid Infrastructure,EGI)[23]项目就致力于为欧洲各领域研究人员提供集成计算资源,从而推动创新。

目前,对情报研究中的智能化技术没有统一的界定,但概观之,可以将情报研究智能化的本质概括为定量化、可计算、可重复。定量化是针对过去情报研究更多的是依赖人的主观判断,即基于已有文字材料或数据,根据研究人员的经验等给出粗略的结论,如果说这是一种定性化分析,现在更多地依赖通过计算机自动化处理原始材料并获得潜在数据,并在此基础上辅以人的判断,可以说是一种定量化的分析。可计算是指将各种信息资源转化为计算机可理解、处理的形式,如从新闻、论文、专利等中,提取出科研组织、科研人员等实体,再基于这些结构化的、富有语义的信息,采用统计、数据挖掘等方法加以计算,获取隐含的知识。可重复是指自动化分析技术消除了许多主观因素,从理论上讲,如果分析数据等条件一致,分析结论也应该是一致的,这也体现了智能化技术为情报研究带来客观性的一面。

3 情报研究中的技术问题

情报研究的上述发展走向,决定了情报研究既不能仍然停留在定性分析上,也不能仅仅靠简单的统计替代情报研究中的计算技术,由此对情报研究技术提出了新的要求。美国McKinsey Global Institute在2011年5月了研究报告“大数据:创新、竞争和生产力的下一个前沿领域”(Big data: The next frontier for innovation, competition, and productivity)[24]。报告分六个部分,其中第二部分讨论了大数据技术,并围绕大数据分析技术、大数据技术和可视化三方面进行了阐述。在大数据分析技术中,列举了26项适用于众多行业的分析技术,包括A/B测试、关联规则学习、分类、聚类分析、众包(Crowdsourcing)、数据融合和数据集成、数据挖掘、集成学习、遗传算法、机器学习、自然语言处理、神经网络、网络分析、优化、模式识别、预测建模、回归、情感分析、信号处理、空间分析、统计、监督学习、模拟、时间序列分析、无监督学习和可视化。这些技术绝大部分是已有的技术,也有部分是随着互联网的发展以及对大规模数据挖掘的需求,在原有技术的角度发展起来的,如众包就是随着Web2.0而产生的技术。

根据我们的理解,这些技术大致可以划分为可视化分析、数据挖掘以及语义处理三大类。这三大类技术也是当前情报分析领域应予以关注和深入研究的技术。

3.1 可视化分析

可视化分析(Visual Analytics)是一门通过交互的可视化界面来便利分析推理的科学[25],是自动分析技术与交互技术相结合的产物,目的是帮助用户在大规模及复杂数据内容的基础上进行有效的理解,推理和决策[26]。它不同于信息可视化,信息可视化关注计算机自动生成信息的交互式图形表示,关注这些图形表示的设计、开发及其应用[27],而可视化分析在此基础上加入了知识发现过程,关注自动分析方法及其选择,以及如何将最佳的自动分析算法与适当的可视化技术相结合,以达到辅助决策的目的。

目前的情报分析系统,虽然也提供了多种视图来揭示信息,但更多的是一种分析结果的呈现,系统内部分析、处理的机制对分析人员来讲是个黑匣子,分析人员无法了解分析方法、分析结果的局限性或者有效性,这无疑不符合情报研究严谨性这一发展要求。同时,现有的分析工具需要分析人员输入各种繁杂的参数,又缺乏对情报分析认知过程的支持,这就对使用人员的专业化程度提出了较高的要求,增加了分析的难度。而可视化分析则可以较好地解决这一问题,它整合了多个领域包括采用信息分析、地理空间分析、科学分析领域的分析方法,应用数据管理和知识表示、统计分析、知识发现领域的成果进行自动分析,融入交互、认知等人的因素来协调人与机器之间的沟通,从而更好地呈现、理解、传播分析结果[28]。佐治亚理工学院的John Stasko等人应用Pirolli 等人提出的情报分析概念模型[29],建立了一个名为Jigsaw(拼图)的可视化分析系统[30],并将其应用于学术研究领域(涉及期刊和会议论文)以及研究网络文章(如网络新闻报道或专题博客)领域,也说明了将可视化分析技术应用于情报研究的可行性。

将可视化分析技术应用于情报研究领域,有众多问题要解决。首先,在情报研究工具中,是以自动化分析为主,还是以可视化为主?Daniel A. Keim等人将待分析的问题分为三类,第一类是在分析过程中可视化和自动化方法可以紧密结合的问题,第二类是应用自动化分析潜力有限的问题,第三类是应用可视化分析潜力有限的问题。在研究这三类问题中交互程度对分析效率影响的基础上,Daniel A. Keim等人指出,应分析如何通过考虑用户、任务和数据集特点,来确定可视化和自动分析方法的优化组合,从而达到最佳的效果[31]。可见,要将可视化分析技术应用于情报研究领域,需要明确每类问题适用哪种组合方式。其次,情报研究领域适合使用哪些可视化交互手段?这可能包括原始分析数据、析取出的关系数据、深层挖掘的模式数据等的可视化手段,分析人员与系统交互的方式,分析过程的可视化展示等。第三,情报研究领域中的认知过程是什么样的,关注哪些问题,涉及哪些实体,在大数据环境下面临哪些认知困难,需要在哪些环节加以支持,这些困难能否通过技术来解决。此外,从现有的可视化分析技术来看,主要是将各个相关领域的技术以优化的方式整合起来,但在将来会产生一体化的可视化分析解决方法[32],这种一体化的方法可能是什么形式,又会对情报研究带来怎样的影响等等,都是在情报研究中引入可视化分析技术需要关注的。

3.2 数据挖掘

广义的数据挖掘指整个知识发现的过程,是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它涵盖了数据分析和知识发现的任务,从数据特征化与区分到关联和相关性分析、分类、回归、聚类、离群点分析、序列分析、趋势和演变分析等,吸纳了统计学、机器学习、模式识别、算法、高性能计算、可视化、数据库和数据仓库等领域的技术,并可以用于任何类型的数据,包括数据库数据、数据仓库等基本形式,也包括数据流、序列数据、文本数据、Web数据、图数据等其他类型的数据[33]。

从数据挖掘的涵义看,它与情报研究有着天然的联系;从数据挖掘的方法看,有其特定的含义和实现过程,可以有效地解决情报研究的问题。例如,情报研究可以借鉴关联规则发现的成功案例——超市的“啤酒+尿布”,尝试用关联规划来分析研究主题的相关性,从科技论文与专利的关联中发现科技的转换关系等等。但从目前的情报研究成果看,许多还仅仅停留在简单的频率统计、共词计算层次上,在知识发现的过程中,这些工作仅仅是数据挖掘的数据准备,还有待于更为深入的发掘。可见,数据挖掘能够也应该应用于情报研究领域,这不仅是数据挖掘应用扩展的结果,也是情报研究自身发展的需求。此外,由于较少有专门针对情报研究领域研发的挖掘工具,现有情报分析通常借助于其他工具,不同工具的功能不同,这就导致常常同时使用好几个分析工具,如在使用SPSS进行聚类分析的同时,还使用Ucinet分析社会网络。这带来的问题是,分析缺乏完整性,可能社会网络和其他信息之间有关联,因为工具的分割性,就导致潜在模式的丢失。由此,研发适用于情报研究的挖掘工具,是必要也是紧迫的,尤其是面对大数据的挑战,智能化地辅助分析人员,减少认知压力,是亟待解决的问题。

要解决以上的问题,首先需要研究情报分析任务,分析哪些问题是可以使用数据挖掘技术来支持的,这类问题有哪些共同点、特殊性,能否对未来可能的情报分析问题进行扩展,哪些问题不适用于数据挖掘技术,原因是什么等。其次,对于某类或某个分析问题,使用哪种数据挖掘技术或几种技术的组合才能有效地解决,涉及的算法是否需要针对该问题进行适应性改造,如何评价挖掘的结果等。第三,数据挖掘出现了交互挖掘这一发展趋势,即构建灵活的用户界面和探索式挖掘环境[33],这与可视化分析在某些方面上也不谋而合,这样的趋势会对情报研究带来哪些影响,如何在这一背景下,探索情报研究工具的新发展,寻找情报分析的新模式,值得我们关注。

3.3 语义处理

语义是关于意义(meaning)的科学,语义技术提供了机器可理解或是更好处理的数据描述、程序和基础设施[34],整合了Web技术、人工智能、自然语言处理、信息抽取、数据库技术、通信理论等技术方法,旨在让计算机更好地支持处理、整合、重用结构化和非结构化信息[35]。核心语义技术包括语义标注、知识抽取、检索、建模、推理等[34]。语义技术可以为信息的深层挖掘打好基础,即通过对各类信息的语义处理,在获取的富有语义的结构化数据上使用各种数据挖掘算法来发现其中的潜在模式。数据的语义性支持了机器学习等技术的内在功能[36]。

从现有的情报研究实践和工具看,语义支持的缺失是一个普遍问题,这其中又可划分为两个层次。对于传统的情报研究对象,如科技论文、专利等,有较为成熟的分析工具,但这些工具往往缺少深层次的语义支持。例如,要分析论文的内容主题时,需要从摘要等自由文本中提取出主题信息,在数据处理时,常常无法识别同义词、近义词等,需要人工干预。一些工具虽然在语义方面做了努力,但仍然存在诸多不足,例如在形成的主题聚类结果上,缺乏有效的主题说明,自动形成的主题标签不具有代表性,需要分析人员深入其中重新判断等。这在小数据集环境下,还可以接受,当面对大数据的冲击,这种半自动化的处理方法无疑是耗时又费力的。此外,对于新型情报研究对象,如网络新闻、博客等,已有如动态监测科研机构等的系统工具,但总体来说还处于起步状态,目前较多的还是依赖人工筛选出所需信息,并整理成结构化的数据,同样也不利于大规模的数据分析。这些问题的存在,使得消除语义鸿沟(semantic gap)[37],应用语义技术成为广泛需求及必然。

将语义技术应用于情报分析,需要关注以下几方面的内容。首先,分析情报研究任务的特点,了解它的语义需求,是否存在规律性的准则以供指导分析工具的研发,这既需要原则性和方向性的准则,也需要为针对多维度划分出的各类任务给出详细的规范,例如,对微博等社会化媒体,其中既存在高质量的信息,也存在辱骂等低质量的信息,区分这些信息并筛选出高质量信息,就成为在分析社会化媒体中的语义任务之一。其次,语义资源建设问题,即在情报分析领域中,要实现语义层面上的理解,是否需要建设语义资源,如果不需要,哪些技术手段可以代替,如果需要,哪种类型的语义资源可以便捷、快速、高效地构建,并且这种语义资源应该如何构建,如何使用才能有效地服务于情报研究工作。第三,信息抽取问题。科技信息涉及众多学科的专业术语、各种科研机构、组织等,如何使用语义技术将这些信息准确地提取出来并加以标注,尤其是针对不同类型的信息源,采用什么样的抽取策略等。第四,信息整合问题,即如何使用语义技术,把不同来源的数据对象及其互动关系进行融合、重组,重新结合为一个新的具有更高效率和更好性能的具有语义关联的有机整体,以便后续分析。

4 结语

正如本文引言中所谈到的那样,大数据的理念和技术为情报学领域中情报研究的理论和实践带来了机遇,也带来了挑战。机遇巨大,挑战更大,需要我们对此有清醒的认识。本文分析了大数据背景下情报研究的若干发展趋势,总结了情报研究中值得关注的技术问题,以期能为促进情报研究的理论和实践的发展添砖加瓦。

参考文献:

[1]Big Data,Big Impact[EB/OL].[2012-09-06]..

[27]Chaomei Chen. Information visualization[J]. Wiley Interdisciplinary Reviews:Computational Statistics,2010,

2(4):387-403.

[28]Daniel A. Keim, et al. Challenges in Visual Data Analysis[C]. Information Visualization, 2006:9-16.

[29]P.Pirolli. The Sensemaking Process and Leverage Points for Analyst Technology as Identified Through Cognitive Task Analysis[EB/OL]. [2012-09-16].http://vadl.cc.gatech.edu/documents/2__card-sensemaking.pdf.

[30]John Stasko, et al. Jigsaw: supporting investigative analysis through interactive visualization[EB/OL]. [2012

-09-16].http:///fil

es/Sandbox/victor/jigsaw-VAST07.pdf.

[31]Daniel A. Keim, Florian M., and Jim Thomas. Visual Analytics: How Much Visualization and How Much Analytics?[J]. ACM SIGKDD Explorations Newsletter,2009,11(2):5-8.

[32]Aigner, et al. Visual Methods for Analyzing Time-Oriented Data[J]. Transactions on Visualization and Computer Graphics, 2008, 14(1) :47-60.

[33]Jiawei Han, Micheline Kamber, Jian Pei. Data Mining concepts and techniques third edition[M]. Morgan Kaufmann,2011.

[34]John Domingue, et al.Handbook of Semantic Web Technologies[M]. Springer Publishing Company,2011.

[35]Dieter Fensel,et mon Value Management-based on Effective and Efficient On-line Communication[EB/OL].[2012-09-17].http://wiki.iao.fraunhofer.de/images

/studien/proceedings-common-value-management.pdf#page=19.

[36]Bettina Berendt, Andreas Hotho, Gerd Stumme. Introduction to the Special Issue of the Journal of Web Semantics: Bridging the Gap-Data Mining and Social Network Analysis for Integrating Semantic Web and Web 2.0[J]. Web Semantics: Science, Services and Agents on the World Wide Web,2010,8(2-3):95-96.

信息技术学科学情分析范文2

【关键词】信息分析方法;指标分析;定量分析;定性分析

1 信息分析方法的来源

信息分析是一项综合性很强的学科,它与自然科学、社会科学、管理科学、决策学、科学学、系统工程等诸多学科相互联系和交叉。这种特点决定了信息分析几乎没有自己专用的研究方法,所用的方法

多数是从相关学科的研究方法中借鉴过来的。而这种借鉴正是方法论所要研究的吸收和移植现象,即科学方法体系作为一个整体,各个学科都可以对其基本原理加以应用。

2 信息分析方法的分类

任何研究方法的分类,最普通的不外乎分为定性研究方法、定量研究方法以及定性和定量相结合的研究方法3大类。信息分析方法的分类也不例外。

2.1 定性研究方法

定性研究方法是指获得关于研究对象的质的规定性方法,包括定性的比较、分类、类比、分析和综合、归纳和演绎等方法。主要是分析与综合、相关与对比、归纳与演绎等各种逻辑学方法。定性研究方法适用于那些不需要或不可能应用定量方法进行分析研究的课题。

逻辑学方法具有下列特点:(1)只对某一给定研究对象的宏观特征进行定性的分析研究,而不涉及其微观的数量关系;(2)直感性强,比较容易学习和掌握;推理严密,有说服力。

信息分析工作中较常用的逻辑学方法有:

(1)综合法。对与某一研究对象相关的各种来源、各种内容的信息,按特定的目的进行归纳汇集以形成完整的、系统的信息集合的方法。

(2)对比法。根据2种以上同类事物各自的相关信息来辨别它们的异同或优劣的方法。

(3)相关法。利用事物之间内在的或现象上的联系,从一种或几种已知事物的有关信息判断未知事物的方法。

(4)因果法。根据事物之间固有的因果关系,利用已占有的情报, 由原因推导出结果或由结果探究其原因的方法。

2.2 定量研究方法

定量研究方法是指获得关于研究对象的量的特征的方法。从理论上说,一切事物都是质与量的统一体,质是由量体现的,所以掌握了事物的各种数量关系,就能认识事物的本质与规律。一门科学只有成功地运用数学方法才能达到完善的地步。自然科学的发展离不开数学,社会科学的研究也需要数学作强有力的工具。事实证明,社会科学研究应用定量分析方法也取得了前所未有的成绩。信息分析的定量研究方法就是在这种背景下产生的,可以说定量研究方法在信息分析中的应用,是现代信息分析相对传统信息分析内容与目标转变的要求,也是信息分析日趋成熟的重要标志。

2.3 定性和定量相结合的研究方法

信息分析的主要领域从科学技术领域转移到了经济领域,政府和企业是信息分析的主要服务对象,而决策研究决定了信息分析工作的主流方向。市场经济体制下,市场需求决定了信息分析必须借助于先进的方法和手段。

定性研究方法是信息分析工作的基础,定量研究方法是信息分析工作发展的要求,只有将定性分析和定量分析结合起来使用,才能满足决策、预测的需要。

定性分析与定量研究的有机结合改变了传统信息分析方法多用定性研究方法、很难保证分析结果准确性和重复性的局限。一方面,定性研究把握信息研究的重心和方向,侧重于物理模型的建立和数据意义;另一方面,定量研究为信息分析结果提供数量依据,侧重于数学模型的建立和求解。通过定性研究与定量研究方法的结合,使得信息分析方法更加符合实际需要,得出的结论更加准确和可靠。

3 专利指标分析

在专利信息分析的实际工作中,分析人员无论选择哪种分析方法,在信息分析前应当建立适当的专利指标,以揭示与研究对象相关的专利与科技和经济的关系。

3.1 专利指标研究意义与应用

专利指标涵盖了从简单的专利计数到较复杂的指标,这些指标揭示了技术与科学、技术与研发、技术和经济活动相关联的程度。专利指标的主要优势在于:专利数据可以在高度离散的条件下进行研究,而对数据聚合度标准允许有较大的弹性。专利指标提供了对发明创造过程的清晰的认识,它可以在宏观或微观的不同层面反映国家或企业的发明创新活动以及研发产出、知识产权的拥有量、技术发展水平及其在国际技术与经济竞争中的地位。

在科技活动分析中,一个重要问题在于如何以定量和定性方法来描述科技活动,以便这些指标能够直接或间接地应用在分析模型中。一般来说,科技活动通常只能间接地使用“投入”、“产出”或“影响因素”指标进行测度。OECD最近建议:投入、产出或影响因素指标应当被定义为科技资源、科技结果和影响因素指标。在实践中,确定科技活动的结果远比记录其资源更困难,科技活动的结果和新产品、新工艺在市场上取得的成功,都不能用通常科学概念上“测量”变量来测度。解决的办法是采用一种替代的指标而不是直接测度,在这种背景下专利指标通常被用来测度科技活动。对于国家或企业层面来说,专利指标可以被用来调查技术领域聚焦程度或区域性的技术和经济活动以及其核心竞争力技术。

3.2 专利定量分析

专利定量分析是指通过对专利申请或授权量及其变化的统计,反映技术之间的相互关系。随着科学技术的不断发展,技术之间联系的高度复杂化,越来越多的定量分析方法,如数理统计、频次排序、时间序列,以及趋势回归等,被应用到专利信息分析中。

3.2.1 技术生命周期分析法

技术生命周期分析是专利定量分析中最常用的方法之一。通过分析专利技术所处的发展阶段,推测未来技术发展方向。它针对的研究对象可以是某件专利文献所代表技术的生命周期,也可以是某一技术领域整体技术生命周期。

3.2.2 专利技术生命周期计算方法

基于专利技术生命周期理论上存在4个阶段,即技术引入期、技术发展期、技术成熟期、技术淘汰期,人们引用多种方法来测算专利的技术生命周期。本章重点介绍专利数量测算法、图示法和技术生命周期(technology cycletime, TCT)计算方法。其中,专利数量测算法和图示法主要用于研究相关技术领域的技术生命周期,而TCT计算方法主要用来计算单件专利的技术生命周期。

(1)专利数量测算法。该方法通过计算技术生长率(υ)、技术成熟系数(α)、技术衰老系数(β)和新技术特征系数(N)的值测算专利技术生命周期。

1)技术生长率(υ)。所谓技术生长率是指某技术领域发明专利申请或授权量占过去5年该技术领域发明专利申请或授权总量的比率,计算方法如下:

(1)

式(1)中,α为该技术领域当年发明专利申请量或授权量;α为追溯到5年的该技术领域的发明专利申请累积量或授权累积量。如果连续几年技术生长率持续增大,则说明该技术处于生长阶段。

2)技术成熟系数(α)。所谓技术成熟系数是指某技术领域发明专利申请或授权量占该技术领域发明专利和实用新型专利申请或授权总量的比率,计算方法如下:

(2)

如果技术成熟系数逐年变小,说明该技术处于成熟期。式(2)中,α为该技术领域当年发明专利申请量或授权量; b为该技术领域当年实用新型申请量或授权量。

3)技术衰老系数(β)。所谓技术衰老系数是指某技术领域发明和实用新型专利申请或授权量占该技术领域发明专利、实用新型和外观设计专利申请或授权总量的比率,计算方法如下:

(3)

如果β逐年变小,说明该技术处于衰老期。式(3)中, c为该技术领域当年外观申请量或授权量。

4)新术特征系(N)。指新术特征系数由技术生长率和技术成熟系推算而来。计算方法如下:

(4)

在某一技术领域如果N值越大,说明新技术的特征越强。

3.2.3 应用实例

为了分析电动汽车技术的技术生命周期,选择了中国专利数据库作为数据采集的信息源。数据采集范围为1995-2011年中国专利公开数据,包括发明、实用新型和外观设计,共采集有关电动汽车的专利684件。为了便于作时序分析,数据的统计以申请日为基础,以年为单位;采集数据时以篇数(或称为件)为单位。

v值持续在一定的数值区间,并有逐步变小的趋势,显现出该技术领域技术趋于成熟的迹象。同时电动汽车的技术成熟系数α值的变化也反映出从2008年开始逐年变小的趋势; 而技术衰老系数β值并没有逐年减小,未反映出技术衰老的特征。同样,新技术特征系数N值的变化规律与υ值的变化规律性相似,2007年以后开始逐年变小。这说明电动汽车技术已不属于新技术范畴。从α、β、N系数的变化情况看,电动汽车技术已脱离了新技术范畴,并趋于成熟,而且尚未显现技术衰老的特征,处在技术生命周期的第三阶段,即技术成熟期。

参考文献:

[1]刘焕成.专利信息在分析竞争对手中的作用[J].情报科学,2001.

[2]卢泰宏.信息分析[M].广州:中山大学出版社, 1998.

[3]刘琪.企业专利竞争情报活动的分析[J].情报理论与实践,1999.

[4]朱庆华.信息分析基础、方法及应用[M].科学出版社,2004.

信息技术学科学情分析范文3

关键词:信息技术教师;课程整合;社会网络分析;UCINET

中图分类号:G431文献标识码:A文章编号文章编号:16727800(2013)0010017903

基金项目:长沙师范学院2012年度校级重点项目(XXZD201215)

作者简介:阳永清(1985-),男,长沙师范学院教育技术中心实验师,研究方向为教育技术理论实践、网络与远程教育、数字化学习资源与环境。

0引言

在科技高速发展的时代,信息技术在教师的日常生活和教学工作中起着不可或缺的作用。信息技术教师,作为信息技术的传播者,在信息技术与其他学科教师之间的联系中起着中介的作用,因此信息技术与其他学科教师之间的社会关系,会在一定程度上影响其他学科教师的信息素养。信息技术与课程整合,不仅仅是把信息技术作为辅助教或者辅助学的工具,而是强调要把信息技术作为促进学生自主学习的认知工具和情感激励工具。而良好的教师社会网络关系有利于信息技术与课程整合。

1几个核心概念

(1)社会网络:一个社会网络是由一个特定集合的行动者(也可称之为顶点、点)以及行动者之间的关系(线)组成的。各个点以及点之间的联系构成了“网络结构”,这种结构会对行动者在行为、思想以及态度上产生重要影响。

(2)密度:网络中实际存在的关系数目与可能存在的最多关系数之比。如果密度为1,意味着每个点都与所有其他点相连,密度为0意味着任何点都不相连。

(3)个体的中心度:测量个体处于网络中心的程度,反映了该点在网络中的重要性程度,行动者的个体中心度拥有3个指标:点度中心度、中间中心度、接近中心度。点度中心度是对网络活动的一种测度;中间中心度,它测量的是行动者对资源控制的程度;接近中心度关注的是一个行动者距离网络中的所有其他行动者的接近程度。

2分析信息技术教师社会网络关系的意义

2.1了解教育信息化背景下信息技术教师在学校中的角色

在教育信息化背景下,信息技术教师在学校中是否能发挥专业特色,是否能从多方位利用信息技术,成为判断信息技术是否成功变革的手段之一。本研究借助社会网络分析,能从关系数据的角度对信息技术教师在学校中充当的角色进行分析,为加快教育信息化的发展提了供一定的依据。

2.2为构建和谐的教师社会网络提供依据

本研究借助社会网络分析,从关系数据的角度分析了信息技术与其他学科教师之间的社会网络,使教师之间的联系在借助UCINET软件NetDraw工具下可视化、直观化程度更高。另外,本研究所采用的社会网络分析的实用性不只局限于信息技术与其他学科教师之间的社会网络调查,还可以广泛应用于各学科教师的社会网络分析,对促进建立教师良好的人际关系起到一定的借鉴作用。

2.3促进信息技术与其他学科的整合

信息技术与其它学科的整合有效实现的条件之一是信息技术教师与其他学科教师之间良好的人际关系,只有拥有了良好的人际关系,才能更加有利于教师之间知识、技能的交流。本文研究了信息技术教师与其他学科教师之间的社会网络现状,可以向学校、教师反映或者了解信息技术与其他学科整合力度的实际情况,以实现对不足的方面进行及时地调整和改进。

3研究设计

3.1研究问题

本次研究主要是描述初中学校信息技术教师的社会网络,以此发现中学信息技术教师与其他学科教师交往中存在的问题。中学教师的交互主要包括两个方面,一是工作教学中的交互,二是生活中的交互。因此本次问卷从这两个方面找到了几种具有代表性的行为方式设计问卷,并提出以下几个问题:①在教师人际关系网中,信息技术教师所处的位置;②信息技术教师之间及与其他学科教师之间的联系是否紧密;③是否实现了信息技术与各学科的整合。

3.2样本选取

考虑到调查的可行性,笔者将研究的对象锁定在该中学的全体初中教师。本次调查共抽取福安民族职业中学59名教师,发放问卷59份,收回有效问卷59份,有效率为100%。将59名教师以阿拉伯数字标记从1排到59。其中1~9号为语文组教师,10~18号为数学组教师,19~27号为英语组教师,28~33号为物理组教师,34~39号为化学组教师,40~42号为生物组教师,43~46号为政治组教师,47~49号为历史组教师,50~52号为地理组教师,53~55号为信息技术组教师,56号、57号为体育组教师,58号、59号为音乐组教师,其中54号教师为信息技术学科组组长。

4研究结果

《基础教育课程改革纲要(试行)》指出:“大力推进信息技术在教学过程中的普遍应用,促进信息技术与学科课程的整合,逐步实现教学内容的呈现方式、学生的学习方式、教师的教学方式和师生互动方式的变革,充分发挥信息技术的优势,为学生的学习和发展提供丰富多彩的教育环境和有力的学习工具。”而实现信息技术大力推进的前提是各个学科教师将信息技术应用于教学环境中,信息技术教师的社会网络关系,可以在一定程度上反映信息技术与学科之间的整合情况。因此,笔者做了如下的分析:

4.1在教学工作过程中,信息技术学科组组长在与其他学科教师之间的联系中扮演着联络人的角色

在教学工作过程中,尤其是教师备课的时候,教师可以使用多媒体资源丰富课堂教学内容的呈现方式,吸引学生的注意力以及学习的积极性。社群图作为一种对关系网络最直观、最直接的表现形式,可以直观反映信息技术教师与其他学科教师之间的联系。因此,观察不同信息技术教师与学科教师之间的社群图,以此作为判断信息技术与不同学科整合的证据。

4.2在使用多媒体教学资源遇到困难时,信息技术教师并不是教师们寻求帮助的热门人选

现在我们越来越提倡信息技术与其他学科之间的整合以及各种教学媒体手段的应用,尤其多媒体教学的使用。使用多媒体资源可以提高学生学习的积极性、趣味性,已被许多学科教师用来辅助教学。在使用多媒体教学资源过程中,各学科教师会遇到一些教学设备故障、教学资源开发困难的问题,而信息技术教师就应该发挥自身的专业特长来帮助各学科教师解决难题。因此,借助UCINET软件,分析教师个体网络中心度的3个指标,来判断在使用多媒体教学资源遇到困难时,信息技术教师是否是其他学科教师寻求帮助的热门人选。

点度中心度代表着个体在网络中与其他行动者连接的程度,而点度数越高说明行动者个体在网络结构中越处于中心的位置。在使用多媒体教学资源困难时,信息技术教师(编号为53、54、55)本应该是教师们寻求帮助的最佳人选,但是从表1中的数据可以发现,在点度中心度,处于前三位的教师编号是42、10、43,信息技术教师(53、54、55)分别排名40、14、50。而在中间中心度测量的是该点在多大程度上控制他人之间的交往。依据表1的数据,可以发现54号信息技术教师处于网络的中心,而53号信息技术教师处于半边缘以及55号信息技术教师处于边缘的位置。同样,接近中心度的测量是该点距离中心点的距离,距离越大说明越远离网络中心。因此,依据表1的数据可以知道信息技术教师并不是教师们寻求帮助的热门人选,同时,也在一定程度上反映信息技术教师的专业素养还有待提高。

4.3在学科内部联系紧密程度上,信息技术教师群组的密度较高,但是每位信息技术教师与其他学科教师之间的联系密度比较小

信息技术与学科之间的整合,强调的不仅仅是信息技术教师与其他学科教师之间的联系,信息技术教师内部的联系也在一定程度上影响信息技术的发展,当教师内部有良好的关系时,有利于促进信息的传递、教学经验的传递等。因此,笔者做了如下分析。

由表2的矩阵密度可以发现,相比其他学科教师群组,信息技术教师群组的密度最高,说明信息技术教师内部联系密切。

然而,将表2中的数据与表1的数据相联系可以发现,每位信息技术教师在个体网络中心中的位置都不是最靠前的,与表1中信息技术教师群组的位置情况存在明显差异的。因此,有理由进一步深入调查每位信息技术教师与其他学科教师之间的关系情况。而信息技术教师与其他学科教师之间的联系可以分为两种:点入度和点出度。点入度指其他学科教师指向信息技术教师的有向联系,点出度指信息技术指向其他学科教师的有向联系。一个网络结构的联系程度可以通过社会网络分析中的密度来描述,一个群体的密度可以量化在0~1之间。密度越大,其值就越接近1,也就表示联系越紧密。

依据表3、表4中的数据可以发现,除了54号信息技术教师在行为五也就是日常生活中与其他教师联系较为紧密外,其他的信息技术教师与其他学科教师之间的行为矩阵密度基本上都是不大于0.1,接近于0,说明信息技术教师与其他学科教师联系比较少,54号信息技术教师,承担信息技术学科组组长和多媒体教室管理员的角色,与其他学科教师有比较密切的联系。53号信息技术教师,不仅仅担任教学工作,同时在教务处担任行政工作,因此与其他学科教师也有联系,而55号作为新进信息技术教师,在教学工作中与其他教师联系较少。

5结语

针对调查统计结果,为构建良好的社会网络关系,促进信息技术与课程整合,可以采取以下应对措施:从多方面突出信息技术教师的才能以及提高信息技术教师的专业素养,使学科教研等离不开信息技术,并通过培养更多信息技术教师与其他学科教师联系的联络人,提高信息技术教师与其他学科教师的联系密度,从而构建一个和谐的教师社会网络。

参考文献:

[1]张文渊.对中小学教师人际关系满意度的思考[J].师资培训研究,2003(1):1518.

[2]约翰·斯科特.社会网络分析法[M].刘军,译.重庆:重庆大学出版社,2007.

[3]STEPHEN GARCIA, EDWARD SHIN, ALICIA D'SOUZA. The application of social network analysis as an assessment tool in the field of diversity and inclusion[M].罗格斯大学继续教育和外展公司,2008.

[4]胡勇,王陆.网络协作学习中的社会网络分析[J].开放教育研究,2006,12(3):5661.

[5]陶振超.社会网络分析探讨客家虚拟社群的形成与演进[R].台湾客家研究国际研讨会,2008.

[6]王陆,马如霞.意见领袖在虚拟学习社区社会网络中的作用[J].电化教育研究,2009(1):5458.

信息技术学科学情分析范文4

天津大学图书馆专利情报服务的实践探索

服务队伍由相关专业学科背景的馆员组成,采取馆员与企业“一对一”的服务形式,开展了为企业提供专利申请前的查新检索、专利法律状态检索、提供知识产权指导和咨询、知识产权专题培训等专项对接服务。在服务过程中,图书馆借助企业专利信息需求调研座谈会、企业管理人员专利信息检索操作指导、撰写重点企业专利分析报告等渠道,直接掌握了企业的专利情报需求,同时积累了专利情报服务的实践经验。专利信息人才培养天津大学图书馆教学培训服务团队自2009年起承担选修课程《知识产权与专利情报》的教学任务。课程教学将专利申请文件撰写、专利信息检索和专利情报分析等实践内容,与专利申请审批程序、专利战略、专利权保护等知识内容相融合,锻炼了大学生的专利信息、情报运用能力。该馆通过课程教学,在培养具有专业学科背景、熟悉专利法律知识、掌握专利信息利用技能的复合型人才方面,积累了一定的实践经验,也为创新型国家建设储备了专利信息人才。专利信息专题培训天津大学图书馆在“世界知识产权日宣传教育活动周”活动中,面向全校师生举办了专利信息检索、专利情报分析与知识产权保护的专题讲座;通过精心组织培训内容、选取经典案例、专题讲座等将科技创新与知识产权、专利情报有机结合起来,通过讲解和互动,既掌握了用户需求,又积累了培训经验。

高校图书馆专利情报服务模式的构建

由于专利情报涉及技术、经济、法律等多个领域知识内容,对专利情报服务人员提出了较高要求。专利情报服务人员掌握专利法律、外语、理工学科背景、计算机技术、图书情报等相关知识都是必需的。高校图书馆专利情报服务的队伍构建,应该是有计划、有步骤的实施。首先,应根据学科和专业分布、遴选理工科专业背景的馆员,组成专利情报服务团队。其次,通过短期培训、专业课程、会议等多种渠道,组织团队成员的专利法律知识、专利情报分析知识的强化学习,增强业务水平和竞争能力。在此基础上,定期组织团队成员的研讨和交流,形成钻研、严谨、活跃的学习风气。并且,还应注意市场信息的反馈和统计,培养服务人员的竞争意识。高校图书馆专利情报服务的模式构建专利专题培训“授之以鱼,不如授之以渔。”为用户提供所需专利信息和情报是专利情报服务的“鱼”,而增强用户的专利信息综合运用能力则是授用户以“渔”。专利专题培训正是实现这一目标的最佳途径,同时培训服务也能发挥高校图书馆的资源和人才优势,是参与专利情报服务市场竞争的切入点。不同用户的培训需求有所不同,专题培训的内容也应有所侧重。科研机构的专利专题培训。在我国科研院所、高校等科研机构的管理体制中,长期以来存在着“重论文、轻专利”的现象,虽然科技创新成果丰硕,但知识产权保护意识、专利申请数量、专利技术转化等方面差强人意。高校图书馆可以针对科研机构的特点,开展专利技术的检索和分析、技术成果的专利性分析、专利申请文件撰写、专利申请审批流程介绍、专利权的转让和许可等专题化培训,提高专业人员的专利保护意识,促进专利申请的增长以及专利技术的实施转化。企业的专利专题培训。目前我国企业的专利信息开发、利用和管理能力明显不足,与发达国家相比存在着较大差距。高校图书馆应该分析企业中不同群体的职责和需求,针对企业领导者、技术研发人员、专利管理和知识产权法务人员,从企业专利战略、专利技术检索和分析、专利和管理、专利诉讼等不同角度组织内容,开展专题培训,为企业的生产、经营服务。专利服务机构的专利专题培训。大多数专利机构和知识产权律师事务所,在专利信息资源和专业人才的配置上明显不足,在承担专利申请、专利诉讼等专利实务服务,专利信息检索和专利情报服务方面能力不足。高校图书馆可以通过一定的培训服务,与专利机构实现互补互利。高校图书馆凭借其丰富的专利信息资源和专业的服务队伍,可以为专利服务机构进行专利检索系统介绍、专利检索技巧、专利情报分析等专题培训。同时,可以通过专利服务机构为专题培训补充案例,根据需求调整培训重点,增强高校图书馆与专利服务机构之间的联系度和紧密性,共同服务于创新型国家建设。面向科技创新的专利情报服务高校图书馆作为高校的附属机构,接近科技创新的最前沿,同时也肩负着为区域内科研机构和企业的科技创新活动提供支撑的社会职能。高校图书馆应将面向科技创新活动提供专利情报服务作为服务重点。科技创新是一个循环往复的过程,不同环节的专利情报需求各不相同,只有针对不同类型的专利情报需求提供服务,才能更有效地支持科技创新工作。科技创新前的专利情报服务。大多数的技术创新都是建立在现有技术的基础上,而人类95%的现有技术都会记载在专利信息中。科研活动前进行专利技术检索、技术趋势分析可以避免重复性研究、提高研究起点。高校图书馆应针对科研立项、产品开发以及技术难题公关,提供相关技术主题的专利检索、文献分析和技术报告等情报服务,帮助高校、科研机构和企业明确研究方向,寻找专利技术空白点,启迪创新思路。科技创新中的专利情报服务。收集技术资料、跟踪技术发展、了解最新的技术,是科研过程中必不可少的环节。高校图书馆应针对需求,开展定题跟踪、技术解决方案等专利情报服务,帮助科研人员及时获得专利技术信息,修正研究方向,降低科研成本,加速研发进程。科技创新后的专利情报服务。科技创新成果产生后,同样伴随有专利情报服务的需求。高校图书馆可以根据这一阶段的专利情报需求,针对科技成果的保护策略、专利申请前的专利性检索、专利前的技术交底书撰写、科技成果鉴定/评估报告、技术侵权的法律诉讼,提供与之配套的专利情报服务,帮助研发机构明确科技成果的保护方式、专利权范围、价值评估以及侵权判定。面向管理决策的专利情报服务政府机构。专利是衡量国家竞争力与产业技术水平的重要指标之一。高校图书馆可以为政府机构和产业协会提业发展状况评估、技术发展趋势预测、科技实力对比分析等专利情报服务,为政府机构和产业协会的宏观决策提供科学依据,避免同一领域的重复研究,有利于科技创新和产业规划。企业。企业管理者的决策直接关系到企业的生存和发展。随着专利战略和技术创新的理念逐渐被企业认知和接纳,面向企业管理决策的专利情报需求会逐渐增长。高校图书馆可以开展专利技术的竞争力分析、专利技术的资产评估、竞争对手的技术分析和监视、专利侵权判断等情报服务,帮助企业明确市场定位,规避侵权风险,确定生产经营策略、专利战略的合理化布局,以及支撑企业的专利诉讼、技术进出口、企业并购等方面的正确决策。科研机构。科研管理部门在科研资助方向、产学研结合模式、科技成果奖励政策、科技成果转化实施等方面的管理决策直接影响科技创新的效果。高校图书馆可以提供相应的事实依据,促进科研机构管理决策的科学化。

作者:王玲 李文兰

信息技术学科学情分析范文5

[关键词]技术竞争情报 起源 演化 技术管理

[分类号]G350

竞争情报(CI)作为一项针对竞争环境、竞争对手和竞争策略的合法且符合道德规范的信息搜集分析活动,在全球范围内已逐渐得到认同和应用。其中技术竞争情报(Competitive Technical Intelligence,CTI)是通过充分利用广泛的社会信息和知识资源,运用竞争情报理论与方法,对技术活动中需要的信息与知识进行搜集、甄别、整理和分析研究,进而为创新主体制定和实施竞争策略提供有效的信息支撑服务,其发展已被视为当前CI服务产业化发展的新热点。

1 技术竞争情报研究的兴起与发展概况

1.1 CTI研究与应用的起源

20世纪80年代以来,随着创新及其商业化速度在市场竞争中的作用日益凸现,以知识产权为核心的技术竞争逐渐成为企业博弈的焦点。为此,欧美等发达国家形成了以研究技术管理(Management of Technolo-gy,MOT)规律,实现其价值最大化的学科。为克服创新过程中由于技术扩散与垄断之间利益冲突所形成的“信息不对称”,在“技术监测”和“技术预警”等围绕MOT的信息分析实践基础上,通过吸取CI思想和演化经济学等现代非主流经济学理论,经过Jay E.Paap教授、Allen Porter教授和Tsvhirky博士等一批专家学者近30年的艰苦努力和理论归纳,终于使CTI研究与应用成为CI学科的专门领域。因此,CTI研究与应用的兴起和发展,既是市场竞争重点逐步由资本等传统生产要素向技术、知识等无形要素转变的客观要求,也是情报学理论发展与MOT学科建设结合的必然结果。

1.2 CTI的基本内涵及外延

在Ashton和Klavans等人1997年出版的Keeping abreast of Science and Technology:technical intelligence for business一书中,认为CTI“是指能够给组织的竞争地位带来潜在影响的有关外部科学技术的威胁、机遇或发展的信息以及对这些信息进行搜集、分析、传递、利用和评估的过程”。目前国内通常将CTI定义为:“在竞争环境条件下,能给企业或组织的竞争地位带来重大影响的外部科学或技术的威胁、机会或发展的信息以及这些信息的获取、监控、分析、跟踪和预警过程,是CI理论和方法在科技管理和技术创新领域中的应用与深化”

根据上述对CTI内涵的理解,长期以来由不同创新主体所组织开展的“技术环境扫描”、“技术动向监视”和“技术竞争策略”研究等,涉及到技术竞争中对信息和知识的搜集、甄别、研究和应用的活动,从广义上都可以看作是CTI产品及服务过程或者其中的某个环节,但是这些活动一直缺乏相互联系和理论依据。CTI概念的提出不仅为竞争主体预测技术价值链上的各项活动或流程的变化,为实现其创新战略意图提供情报支撑,而且还为上述活动的相互整合与科学发展提供了理论研究和应用平台。因此,严格说来CTI活动已不再是传统意义上的科技信息搜集与分析,而是在竞争环境下对与技术有关的信息搜集、甄别、评价和研究,从中发现竞争环境、竞争对手、创新机会的新认识及新知识,并在创新中有效利用这些知识来制定和实施竞争策略的过程。

1.3 国外CTI研究与应用发展概况

发达国家围绕增强R&D能力、实施知识产权和标准战略等MOT活动所展开的CTI研究与应用方兴未艾,成为情报科学研究的前沿领域之一。如早在20世纪80年代末期,瑞士苏黎世联邦技术研究所的E.Li-chtenthaler、P.Savioz博士等人就对跨国公司和中小企业CTI活动状况开展了长达近20年的实地调查,对不同类型企业中CTI的应用及组织流程特征进行了深入研究,并形成企业CTI的理论基础;英国苏塞克斯大学科技政策研究所从1996年开始,就结合技术预见和创新绩效评价等管理环节,开展定标比超方法在技术创新绩效评价中应用的研究,开创了CTI绩效评价的先河;2001年匹兹堡大学商学院的Prescott教授与美国生产力与质量中心合作,开展“实现CTI的商业效果”的课题研究,将企业CTI活动按作用划分成管理技术替代、技术组合管理、商品化和营造战略方向4种类型,对企业应用CTI的模式和最佳实践以及如何通过实施CTI项目来实现其商业价值进行了系统研究。上述研究重点关注CTI在感知和预见“颠覆性创新”或“技术跃迁”变化方面的影响及作用,极大地丰富了CTI的理论和实践。

同时,CTI理论与应用研究的不断深入也推动了CTI学术交流的发展。自1997年在波士顿召开首届CTI国际学术会议以来,竞争情报专业协会(SCIP)已先后组织召开了五届CTI研讨会,分别就以下问题开展了深入讨论:企业CTI及其在创新过程中的角色;如何将CTI与创新联系起来以增强技术预测能力;实现CTI制度化使其融入公司流程等,并于2007年8月在纽约举办CTI最佳实践论坛,议题涉及CTI与研发、技术创新和战略决策的关系等。2004年英国还创刊出版发行了《国际技术情报和规划》专业期刊,积极推进CTI学术交流的国际化及与MOT实践的融合。

为适应亚洲经济迅速崛起的趋势,近年来SCIP还在印度尼西亚、新加坡等发展中国家举办“通过在CI中应用技术监测赢得全球化”国际研讨会(2006年)等活动,帮助日本、新加坡和韩国等国结合实施MOT的要求,将CTI与技术装备的引进消化吸收相结合,通过运用技术路线图、战略风险评估等方法,重点开展“技术学习”,使高效率搜寻和利用外部技术源与创新人才成为CTI活动的重要内容之一,从而呈现出不同于西方国家CTI的特点。

2 我国技术竞争情报研究的进展与演化

2.1 国内科技情报研究的渊源与演化

与国外CTI活动起源于MOT的发展不同,我国的CTI活动脱胎于科技情报研究(Scientific&TechnicalIntelligence,STI)。20世纪50年代末期,中国科技情报界结合经济建设与科技发展要求,在学习借鉴前苏联“科学情报综合与交流”、日本“情报动向跟踪”和欧美国家所开展的“技术扫描与预警”等信息分析活动的基础上,逐步建立起了为科技管理和R&D活动提供服务、集信息库和思想库为一体的STI系统。这在突破国外技术封锁和垄断,建立与完善独立自主的R&D和

产业技术体系中发挥了关键作用,并使之成为我国科技情报事业发展中的重要组成部分。

然而,由于受当时我国计划经济体制和国际环境限制等因素的影响,STI基本上是为政府科技管理或高校和科研院所的科学研究服务。研究中利用的信息源更多地来自公开或半公开发表的各类科学和技术文献资料。研究内容从宏观层面看,基本是在系统跟踪国内外科技发展动向及变化的基础上,对其发展趋势进行预测和评价,目的是为各级科技部门制定政策、研究计划提供参考,很少与技术的商业化和市场竞争相结合。在微观层面上开展的STI则主要集中在技术动向跟踪和新产品水平比较等方面,极少关注竞争的影响和创新策略等内容,其目标主要是为科研活动提供深度信息服务。

20世纪80年代,随着我国科技体制改革不断深入,STI的发展环境、服务对象和研究模式发生了巨大变化,尤其是国内软科学研究的兴起给STI发展带来了严重冲击,使STI在计划经济时代所固有的弊端暴露无遗。为此,在科技情报界内出现了两种倾向,一是否定中国STI发展有的,集信息库和思想库为一体的独特性,主张照搬西方国家情报科学(InformationScience)的发展模式、贬低或否认情报研究(Imelli―gence Research)存在的合理性;二是否定市场经济环境中信息的竞争属性,忽视STI与软科学研究在信息搜集方式、服务对象和项目持续性等方面的差异,将STI视为普通软科学研究项目,否认STI的特殊性,进而取消STI。受外部环境变化和上述两种思想的影响,国内情报研究理论与实践发展陷入低潮。

进入90年代中期,在CI研究与服务迅猛发展及市场经济体制改革形势的推动下,国内一些情报研究专家开始反思STI发展中存在的弊端,积极引进CI理念对STI进行改造,并依照信息的竞争属性及其强度,将STI活动划分为学科信息分析和技术情报研究两个不同的领域。其中的技术情报研究概念即对应国外的CTI,这样就将CTI活动与MOT实践有机地结合起来,从而使CTI的发展及其在技术创新中的应用引起工商企业界的密切关注。

2.2 国内CTI研究和应用的最新进展

随着国内STI的发展逐渐向CTI转移,一些专家学者相继开展了对CTI方法的引进和研究。例如,1995年清华大学的苏健民博士提出,应开展企业竞争性科技情报(CTI)研究以迎接全球性竞争挑战的设想;2005年北京城市学院竞争情报研究所的李艳博士就国外CTI理论研究和实践状况进行全面梳理,深入分析了国外CTI发展的态势与特点;北京大学的金炬博士通过总结美国CTI发展和应用情况,对CTI的内涵、方法及应用进行了系统研究。

2005年上海科技情报学会组织召开“技术竞争情报(CTI)”国际研讨会,专门邀请加拿大西安大略大学Liwen Vaughan教授等介绍国外CTI(专利和标准情报等)的发展动态与趋势;2008年中国竞争情报分会、北京大学等单位也针对国外CTI的发展趋势,分别组织召开了主题为“技术竞争情报与情报工作”的学术研讨会和“技术创新与技术竞争情报国际论坛(2008)”。这些活动使我国的CTI研究与实践逐渐为世人所认识。

近年来,随着我国CTI研究与应用的重点,逐渐由介绍国外CTI发展状况及其方法为主,转向结合中国国情,加强针对MOT实践中出现的具体CTI问题进行研究,国内涌现出了一批具有特色的CTI前沿课题和研究成果。如中国科技信息研究所的陈峰博士结合技术预见(TF)活动的兴起,就CTI的属性与TF的相互关系进行专门研究;上海情报研究所的缪其浩研究员通过对日本建立“中国情报中心”和美国制订“日本技术文献法”期间,中、日两国不同反应模式的案例,分析了我国CTI体系建设中存在的薄弱环节及原因;北京理工大学的朱东华教授就技术监测方法在CTI活动中的应用进行了研究;云南省科技情报研究所的彭靖里研究员在开展“企业竞争情报示范工程”课题中,应用CTI方法对示范企业新产品开发的竞争态势进行实证分析。上述研究对推动国内CTI研究与应用的发展起到了积极作用。

3 我国技术竞争情报研究及应用与国外的差距

但是,由于我国CTI理论研究与应用的发展起步较晚,而且缺乏有效的政府宏观引导和管理,使得理论研究与MOT的实践严重脱节,与国外相比存在着很大的差距,具体表现为:

3.1 MOT理念及其情报活动中的竞争意识严重滞后

由于国内长期受计划经济体制思维及改革开放后所引入的西方新古典经济学理论中“完全信息”假设的影响,人们对竞争环境条件下MOT活动由利益冲突所产生的“信息不对称”规律和特征以及创新过程中信息竞争与共享的辩证关系缺乏正确认识,忽视科学信息与技术信息在传播和运用等方面的差异,将技术信息视为完全公开和完备的,认为通过知识信息的交流和共享就能较好地实现技术的转移、吸收和应用,对于MOT思想及其CTI活动的客观性和普遍性缺乏深刻的理解,在技术信息的搜集、分析和利用过程中往往不自觉地流露出STI的惯性思维。这种思想观念严重滞后于全球经济科技一体化竞争的实际,与基于现代竞争思想建立起来的CTI发展与应用要求格格不入,在客观上制约了国内CTI理论研究和实践的健康发展。一些新兴工业化国家/地区和部分发展中国家应用CTI的成功经验表明:基于MOT战略的情报竞争能力在理解和掌握技术创新中的隐含信息与知识,培育和提高企业核心能力,进而促进经济科技发展中发挥着不可替代的作用。

3.2 研究人员的知识结构不适应CTI研究与发展的要求

目前国内从事CTI理论研究与应用的专家学者普遍缺乏MOT知识背景和实践经验,不仅对现代竞争、博弈行为及其创新管理等涉及CTI的理论知识积累不够,而且大多没有新产品研发或创新管理等方面的经验,对MOT实践和CTI活动缺乏必要的感性认识。既富有实践经验又有深厚理论功底的学者屈指可数,难于适应开展CTI研究与应用的要求。而国外学者则往往具备跨学科的知识背景,一般从事过多种技术研发与管理工作,从而将CTI研究与应用提升至与其他学科平等的地位来进行学术对话。如美国乔治亚理工大学的Mien.Porter教授不仅是世界著名的MOT学者,而且是在CTI研究领域多年从事应用CTI进行“技术机会”识别和“技术监测”分析的专家,因而能做到取长补短,融会贯通,将CTI理论研究与实践有机地结合起来,把研究成果顺利转化为对策行动。我国从事CTI理论研究与应用的专家学者的知识结构和素质与国外相比明显存在较大差距,其研究成果在社会上的影响也非常有限。

信息技术学科学情分析范文6

【摘 要 题】理论纵横

【 正 文】

20世纪90年代以后,以数字化技术、多媒体技术、网络通讯技术综合而成的现代信息技术,引发了人类社会的第二次信息革命,人类业已迈入知识经济时代。新的社会环境使包括情报学在内的学科研究发展面临着新的挑战,我们需要新的理论和方法来加以研究和利用,情报学的传统方法在面对新的问题时,就要进行自身的转化。如面对浩瀚的网络信息资源,传统的文献计量学方法就显得力不从心,相应地网络信息计量学(Webmetrics or Cybermetrics)就应运而生,用新的研究方法如链接分析法来描述和组织网络信息世界。

1 网络信息计量学

网络信息计量学是在网络信息环境下迅速形成和发展起来的,作为信息计量学的一个新的发展和重要的研究领域,它的出现使传统的基于文献和信息的文献计量学、信息计量学面临着新的变革。关于其定义主要有:网络计量学是一门计算机科学,是一门研究互联网上数据相互引用的科学,是一门对网络文献规律进行统计分析的科学,基于Web和软件计量分析工具,集计算机技术、网络技术、计量学方法、统计学方法于一体,其应用范围覆盖了所有基于网络通信技术的信息测度。网络计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。网络信息计量学是采用数学、统计学的各种定量方法,对网络信息的组织、存储、分布、传递、相互引证和开发利用进行定量描述和统计分析,借以揭示网络信息的数量特征和内在规律的一门新兴学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科。

2 链接分析法研究现状

2.1 链接分析法的内容

链接分析法是网络信息计量学中一个重要方法,它可以看成是文献计量学中引文分析法在网络环境中的应用。网络超文本通过链可以将结点链接起来,一般使用两种方法——索引链和结构链进行链接,它既可以表示信息之间的关系,又是构成网络的手段。在将网络相关信息资源内容链接起来形成新的信息链或信息集合的基础上,融合了参考文献链接功能,并通过引文关系来分析链接网络信息资源的方法。可以按照引用程度和引用权威信息源来分析,在网络信息组织、检索、评价、服务等方面起着重要作用。

2.1.1 链接分析法在网络信息组织方面的作用

网络信息资源生产者如网页创作者使用链接分析,创建一些对访问者有用的链接,可以链接到不同主题或相同主题质量更优秀的网页。一般来说链接类型大致有:合作链接(被链接网站和链接网站之间存在合作关系)、友情链接(网站之间可能由于在资源或其它相关方面有关系,相当于影视术语中的友情客串)、推荐链接(被推荐网站由于质量好、人气旺、访问用户多或是热门网站等原因链接)、内容链接(被链接网站和链接网站在内容上存在着互补或相通关系等),可以起到网络导航的作用,大大方便用户在网上冲浪。Google还通过链接分析来确定网络上的权威信息源来进行相关的排名。Google认为网页制作者仅创建他们认为重要的网页的链接,链接到另外的网页就像一本书的引文,网页之间的这种引文关系“像是对网页进行评论的过程”。例如,网页的制作者们创造了几千个Yahoo的链接,困此Yahoo被当作一个重要程度点;如果许多重要的网页都指向Yahoo,则其重要程度会更高。这种方法的好处是网页制作者不可能误导网站的排序,并且扩展性极好——当网络增长时,产生更多的重要网页的链接,自然更能确定该网页是否是权威的信息源。

2.1.2 链接分析法在网络信息检索方面的作用

链接分析主要应用于网络信息检索方面,如搜索引擎收集信息、检索结果的排序等。网络信息检索为用户提供海量信息多媒体数据库,采用超文本技术使检索空间比传统的信息检索范围更广泛,以结点为单位组织,以超链接的方式链接相关内容,更加符合人们的思维方式,打破了线性存储的限制,真正实现多维检索。Web信息检索系统可以利用链接信息来优化对相关文献的查询,能够极大地提高检索结果的相关性。在搜索引擎收集信息的过程中,J.Kleinberg认为搜索引擎的Robots直接访问Web提取出权威页(Authority Page)。但是如何提取出权威页,这需要一个原始积累和评价过程。先给出一批起始网页,Robot从这些源网页开始收集,可以按照深度优先或广度优先的算法进行。当网页提取回来后,采用链接分析技术(具体用递归算法)来计算出权威页。有了权威网页,Robot在收集Web信息时,就有针对性地、高效率地访问Web网页。搜索引擎检索结果排序方面也运用了链接分析技术,由于索引数据库容量大,若用户输入一个关键词,有可能会有成千上万条记录相匹配,搜索引擎对如此庞大的结果如何排序,如何把最相关的几十条记录显示出来?搜索引擎按记录号的顺序提取结果集中的前几十条记录,再按邻近图(Neighbor Graph)算法对这几十条记录排序,最先显示给用户。这种检索结果排序就是利用链接分析技术,大大减轻了搜索引擎的负担,Yahoo、Google等搜索引擎就采用了超链接分析技术来对检索结果排序。