科研对比方法范例6篇

前言:中文期刊网精心挑选了科研对比方法范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。

科研对比方法

科研对比方法范文1

【关键词】研究方法;比较;分析

随着社会的发展,以及教育的需求、教育的实践、教育的规模等教育领域发生了深刻的变革,这就需要人们对教育科学研究方法进行研究,探索其中的规律,从而更好地为教育服务。目前国内公开出版的教育科学研究方法有40多个版本,本文选取的四本相关著作以出版顺序排列分别是:(1)裴娣娜:教育研究方法导论(合肥:安徽教育出版社,1995);(2)袁振国:教育研究方法(北京:高等教育出版社,2000);(3)孙亚玲:教育科学研究方法(北京:科学出版社,2009);(4)韩延伦:教育研究方法(北京:高等教育出版社,2011)。下文以A、B、C、D分别代表这四本著作。

一、写作目的

四本著作出版时间先后不同,时间跨度较长,不同时期,不同背景以及个人的研究方向或侧重点不同。这些因素将会对他们的写作目的产生影响,笔者从他们的序或前言中认为:

(一)A的这本著作是她在多年来为本科生、研究生讲授时的讲稿的基础上整理而成,她的目的是:“试图在总结我国丰富的教育研究实践经验和借鉴国内外有关研究成果基础上,建立符合中国实际的教育研究方法学科体系的一种尝试和探索。”她的写作目的可以理解为是教育科学研究方法的一种探索。

(二)B版这本著作是这四本著作中唯一没有序和前言,但是我们可以从内容提要中看书,本书写作的目的是为高等教育学校教育学科而撰写的教学用书,是面向21世纪的课程教材。

(三)C在前言中认为随着我国教育事业的蓬勃发展,教育研究队伍不断壮大,教育研究的价值取向和研究方法,有了长足的发展,旧的一些观点和内容已经不能满足这些需求,因此,需要提出新的观点和研究方法。所以说她的写作目的很明确。

(四)D著作为高等院校教师专业发展系列教材,可见,本书的写作目的是为教师的专业发展而量身订做的。当然也可作为本专科生教学用书。

二、章节、结构安排

(一)A在章节的安排上共分为四编十五章,第一编教育研究方法的一般原理,第二编教育研究的构思与设计,第三编教育研究的基本方法,第四编教育研究的结果与评价。从一般原理——构思设计——研究方法——成果表达,可见编与编之间逻辑性强。但章节内容较多,都比较详细,看不出侧重点,各种研究方法都有介绍。另外,成果表述及评价安排在了倒数第二章,笔者认为应该安排在倒数第一章更为妥当。

(二)B共十四章,前三章论述教育研究的意义,过程,一般性原理,第五章到最后具体论述了各个研究方法的具体步骤、运用。第十三章,两个案例单独成章,这则是本书的亮点之一,不足之处是本书的最后没有成果的表述与评价。应该把成果表达与评价这的内容加进去,样安排才使得整个教育研究更加完整,系统化。

(三)C共十一章,第一章是教育科学研究方法的概述,然后是一般步骤、选题,抽样,论证,建立假设、6种具体的教育科学研究方法、统计法与SPSS操作以及成果的表达。从孙版的章节看出该书思路清晰、循序渐进、一气呵成。

(四)D共十二章,前两章是概述、确定问题。第三章到第十一章具体论述了各个研究方法的含义、分类、步骤、案例。最后一章则是成果的表达。总体上说,思路清新,每一章的题目都是“如何……”,可见,本书的侧重点是怎么做,如何做,操作性很强。

三、研究方法的选取

教育科学研究方法根据研究性质、目的、范围、对象等的不同,可以把教育科学研究分成20多种,这四本著作都选取了5-9种研究方法进行论述,但各版本选取的侧重点不同。

(一)A选取了五种,分别是教育科学的历史研究法、教育科学的调查研究法、教育科学的比较研究法、教育科学的实验研究法、教育科学的理论研究。这五种研究方法比较传统,由于年代久远,以及时代的发展,这五种研究方法目前很少见了,近年新编的教材里较少选取这些研究方法。

(二)B选取了实验研究、调查研究、定性研究、文献研究、比较研究、行动研究等,包括了目前经典和一般的研究方法,各研究方法都有具体的操作步骤介绍。

(三)C选取了文献法、教育调查法、观察法、教育实验研究、行动研究、教育叙事研究、统计法及SPSS操作。涵盖了目前经典和流行的几种研究方法,其中统计法及SPSS操作,其他三版本中是没有,这也是本书的亮点。

(四)D选取了文献研究、定量研究、教育实验研究、调查研究、定性研究、比较研究、现场研究、历史研究、行动研究等共九种研究方法。每一种研究方法按照“含义、特点——分类、设计——运用”的顺序介绍。另外大多数的研究方法的最后都有案例分析。

按照质和量的构成,教育研究方法可分为定量研究和定性研究。问卷调查、统计法、实验研究等属于定量研究。行动研究、比较研究、教育叙事研究等属于定性研究。这四本著作根据自己的写作目的、知识背景、研究方向的不同选取了几种不同类型的教育研究方法。研究方法的种类不是越多越好,也不是越少越好。在选用的时候是选取其中的一种还是多种,要根据问题的具体情况具体分析。将定性研究和定量研究有机地结合起来是未来教育科学研究的发展趋势。

四、语言表达

(一)A是在上世纪90年代出版的,在语言表达上很严谨,语体很正式、详细、准确,更加倾向于学术性的著作特点。该著作专业性很强,里面有很多专业性的术语。如第19页:“熟知人的思维的历史发展过程,熟知各个不同的时代所出现的关于外在世界的普遍联系的见解,这对理论自然科学来说是必要的,因为这位理论自然科学本身所建议起来的理论提供了一个准则。”可以看出,直接运用恩格斯的《自然辩证法》深思难于理解,更倾向于学术性。

(二)B在语言表达上也是更倾向于学术性,书中有很多专业名词的字体都加工成黑色粗体,在解释概念的时候较多地运用了图标、数据等方式加以阐释。有些词语专业性很强,比较难懂,应该需要进一步说明。

(三)C在语言的表达上出现了一种清新的特点,语言幽默诙谐、通俗易通。比如在导入的时候,作者这样写道:“自从有了人类,就有了教育现象,当教育经验有了一定的积累之后,人类开始了对教育这一社会现象的研究。我们不能确切地说出教育研究是从什么时候开始的,因为有关这一问题的记载没有确凿的文献来佐证,所以,我们只能说教育研究很早以前就有了。”从这段文字中,我们可以看出,作者好像和读者对话,讲故事似的。从这里也可以看出作者做学问是很严谨的。语言令人亲切,通俗易懂。

(四)D的语言在表达上总的来说还是比较通俗易懂的,用词严谨、准确。有些词语的引导性很强。比如第65页:“对我国而言,校本课程开发毕竟是一个新手事物,有许多课题亟待研究,国内对校本课程的研究始于20世纪80年代,开始的探索大多停留在‘概念引人’阶段的新奇,并未走入实质化的研究。”

五、各自的特色

(一)A版最大的特点就是历史与现实结合、理论与实际结合以及中西结合。该书对教育科学研究的发展历程作了比较系统的回顾。注重从中国的实际出发以及吸收西方最新科研成果。该书又吸收了自然科学、社会科学、思维科学等方面的成果。把数学方法也运用其中,这突出反映了教育研究时代的特点。

(二)B版的这一著作中,最显著的特点就是第十章,加人了统计法及SPSS的具体操作。这部分内容在其他版本中是没有的。正所谓“物以稀为贵”,这更说明了该著作的独特性,具有新颖性。全书思路清晰,前后编排连贯性强。在内容的安排上有似于人的思维、学习习惯。课后的思考题需与本章的内容结合回答。另外,每一章后面有文献链接,这一点很好,而且选取的案例都是比较经典的。这一做法可以让读者更加广泛地了解到相关知识及最新的学科动态。

(三)C版的亮点、最吸引读者的地方则是书中有很多图式、案例。这样会使读者一目了然。重要性的概念都会黑色加粗,这种则突出了该专业术语的重要性。

(四)D版的亮点则是各章的题目上,都有“如何”,这种句式在著作中并不多见,可作者的这一做法更加突出了本书的亮点。更加具有操作性,章前有内容提要、学习目标等是读者在阅读之前就可以浏览到相关的知识点,有助于理解,在文中有许多信息栏,这也有助于读者拓展课外知识。章后的资源连接,并有该资源连接的简单介绍,这一特点是其他版本所没有的。

六、结语

教育科学研究方法是一门内容丰富、结构复杂的学科,实践性强,以上四种不同版本的教育科学研究方法,作者根据自己的写作背景、研究方向等出发写作,侧重不同,但是都有自己的写作特色,可谓是各具特色、各有千秋。

参考文献

[1] 裴娣娜.教育研究方法导论[M].合肥:安徽教育出版社, 1995.

[2] 袁振国.教育研究方法[M].北京:高等教育出版社,2000.

[3] 孙亚玲.教育科学研究方法[M].北京:科学出版社,2009.

科研对比方法范文2

1类比思想方法的相关理论和作用

类比思想是研究数学非常重要的一种方法,而类比是从希腊文衍生出来的。比如1和2、5和10这是两组完全不同的数字组合,但是他们的比例却是一样的,这种思想就是类比。类比是可以推断的一种方法,是通过对比来完成的。类比方法的运用可以让初中生遇到的数学问题简单化。学生要认真观察两者的关系,找相像的地方,从而解决问题得出正确的答案,掌握了这种方法可以让类似的问题都得到解决。学生用相似的方法去解决,减少了很多不必要的解题麻烦。

类比法在数学发展过程中起到了很大的作用。正是因为合理运用了类比法,波利亚才可以在学科研究中发挥他的能力。类比法可以培养学生的直觉思维能力。学生如果对数学这一科目感兴趣,可以通过第一感觉判断题目,快速准确得出结论。因为学生通过自己的记忆,将以前遇到的问题可以快速和现在出现的问题加以比较,找出他们的相似之处,然后得出解题规律解决问题。类比思想还可以增强课堂教学的有效性。数学学习不是一蹴而就的,它需要整合所有学过的内容,自行加以总结联系,将零散的学习内容串成一个整体脉络。比如当学习反比例函数的时候,就可以借助已经学习过的一次函数进行讲解;学习相似三角形的时候就可以根据全等三角形的相似定理来学习。类比方法加快了学习进程,提高了学习效率。

2类比思想在教学中存在的问题

国家对于教育方面的发展十分重视。数学作为一门基础的逻辑性学科,也可以对世界有很深远的影响。但是根据实际调查发现,学生们在课堂上并不能将身心全部放在学习探索中,多数情况下会打瞌睡,或者走神,身心不集中就导致了课堂效率不高,不能理想的学习运用类比方法。而且在调查中发现,部分老师讲课循规蹈矩,没有创新,没有要求学生举一反三,这在很大程度上影响了学生学习的积极性并且不利于学生学习。所以老师和学生存在的这些问题不能忽视,要及时解决,不能影响学习进程和学习成绩。

3如何培养学生的类比思想

类比思想如此重要,当然要利用合理的方法来培养。首先在学生方面,学生自己要重视起来,通过各种适合自己的方法调动自己的主动学习性。学生通过自己对数学方面知识的理解,加以延伸学习,通过对比新旧知识,找出相像的地方,得出类比结论。其次从老师角度来说,老师是学生的引导人,是指引学生的指明灯。作为老师,要清楚了解学生对知识的掌握程度,善于引用生活中或者数学中简单的事物来做类比,将类比思想深入学生们的心里,这样才能让学生掌握好类比思想并且广泛使用。培养学生类比思想这件事情不是几天就可以做到的,需要通过不断的学习,日积月累进行对比分析,找出类比方法的关键。所以培养好学生的类比思想,需要老师和学生共同磨合进步。通过不断磨合,学生对于类比思想的理解学习才会更加深入,在初中数学的全部学习过程中也会起到很大的作用,学习成绩也会提高。

4初中数学类比思想的教学案例分析

在北师大版数学中有这么一个案例:通过寻找圆与球的相似之处,利用类比思想将圆和球进行比较。我们很熟悉圆的一些性质,比如圆心与非直径的弦中点连线垂直于弦、圆的面积公式是S=πr2、圆是一个对称图形。通过类比思想发现,球可以理解成是由多个等半径同圆心的圆组成的,所以我们就可以类比一下球的性质。球的球心与任意一条非直径的弦中点连线也垂直于弦,通过相同的方法计算出球的面积公式为S=4πr2、体积公式为V=4/3πr3,球也是一个对称体。

再比如中点坐标公式的类比推广。在一维空间里仅仅只有一个方向就可以,所以中点坐标公式为(x1+x2)/2;在二维空间里,通过一维空间的坐标公式就可以推断出二维的中点坐标公式为[(x1+x2)/2,(y1+y2)/2];以此类比,三维空间和多维空间的中点坐标公式就也很容易推出来了。

科研对比方法范文3

关键词:病案管理;问题;解决方案

研究显示:医院病案管理作为医院档案管理体系中的重要构成元素,当前还存在一定的不足[1],这些问题使得医院对于病案资料的利用度较低,无法发挥病案资料对医疗卫生服务的指导价值,故而导致了一定的不良事件产生[2,3]。特别是在当前新医疗体制改革的背景促进之下,大量的医改方案出台,相关配套改革措施进一步落实,对于医疗信息化建设所提出的研究更加的具体[4]。在这一背景下,提升医院病案管理工作质量无疑有着重要的意义与价值。

1资料与方法

1.1一般资料 对我院当前病案管理工作中存在的问题进行分析,针对问题探究相应的解决方案,对比方案实施后的效果与价值。

1.2方法

1.2.1病案管理中存在的问题 病案管理工作当中存在的问题可归纳为以下几个方面:①思想意识上不够重视:当前绝大部分医院管理的中心为医疗服务,对经济的关注高于对病案管理工作的关注。病案作为医疗卫生机构的科技型档案之一,没有在医院医疗卫生服务中发挥相应的价值与功效,一定程度上造成医疗纠纷等不良事件发生率的增长;②病案质量低下,信息利用率低:一份完整的病例资料除需要涵盖患者的一般资料信息以外,还应当覆盖包括疾病诊断、疾病治疗、以及疾病护理在内的相关内容,但当前部分病案在资料信息上不够详实,书写记录不够规范,甚至存在胡乱涂改的问题,潜在一定的安全隐患;③管理人员业务水平低下:医院缺乏集中组织病案管理人员进行培训的故障制度,知识更新速度较慢,缺乏对病案管理工作的系统认知。

1.2.2 病案管理问题的解决方案 针对病案管理工作中存在的几点问题,建议从以下几个方面入手,对病案管理工作加以完善:①促进病案管理规范性的提升:病案作为能够直接反应患者疾病临床治疗干预情况的第一手资料,医师大多是通过借阅的方式展开对病案信息的研究。病案的借阅管理,在医学教学研究、公检法和保险等方面都有涉及,所以需要对病案的借阅过程进行规范化的管理。在病案的借阅中,不能够把病案的原文本给相关部门。要借用一些扫描的文件。从这一角度上来说,建议医院方面购置专门的扫描仪和打印机设备仪器,这样能够有效的防止把病案带出病案室,一方面为患者保守秘密,另一方面还提供了借阅的服务;②促进循环性监控工作制度的全面落实,推行基于三等级的循环监控机制:加强"三级循环监控"是加强责任落实的重要措施,即主治医师对住院医师、科主任对主治医师、职能部门对科主任的监控体系的建设,各级都要把握好质量关卡,积极加强监控和反馈,及时修改审阅病案,对病案的质量管理可以起到良好的效果;③引入质量管理理念的方法,提高相关病案信息资源的利用率:在医院病案管理工作中引入ISO质量管理体系,促进病案管理中,有关医疗文书的书写、诊疗资料的记录等关键工作环节流程得到规范。特别是针对分类、等级处理后的病案资料而言,需要安排专人进行保管,严禁对这部分资料数据进行涂改、伪造、或窃取;④加强对信息资源的开发质量:改变被动的服务方式,提高病案信息资料开发的主动性,通过统计、归总等方式,定期面向医院领导、管理层人员提供阶段性的病案信息,拓展病案资料的利用途径,将病案信息的利用范围进一步扩展至包括医院管理、医疗保健、医疗纠纷、以及医疗科研等多个方面当中;⑤重视对病案管理工作人员综合素质与技能的提升:医院方面需要根据工作人员的不同工作岗位,制定对应的教育培训工作计划,特别重视对病案管理专门性人才的培训,定期在岗学习、专家讲学、外派参加学习班等均是人才培养的有效手段,将学习情况与晋升、与绩效挂钩,及时结合行业发展需求,更新相关人员的病案管理理念与知识。

1.3统计学处理 本文数据使用SPSS 17.0软件进行分析与计算,计数资料以%表示,以X2检验,可信区间95%,检验水准为0.05,当P

2结果

在医院落实相关病案管理措施后,病案质量完善率、患者满意率均明显高于实施前数据,投诉率明显低于实施前,数据对比存在显著差异,P

3讨论

在医疗服务项目、医疗服务数量迅速提升的背景之下,医疗卫生服务开展过程当中所形成的病案资料无论是从数量,还是从完备性方面上来说,都取得了相当长足的进步。有关研究中指出:健全、有效的病案管理工作制度与措施有助于维护医院医疗环境的和谐、稳定,在降低医疗纠纷以及不良事件发生率方面意义重大。

本次研究过程当中,针对当前医院病案管理在思想意识、在信息利用度、在人员业务水平等多个方面存在的问题,展开了积极的探索与创新,在重视对相关法规、标准的宣传与学习基础之上,促进了医院档案管理工作体系与病案管理工作的进一步融合,同时通过引入质量管理理念的方法,提高了相关病案信息资源的利用率,在加强对信息资源开发质量的同时,更进一步重视对病案管理工作人员综合素质与技能的提升。在以上相关措施的引导下,病案管理措施实施后,病案质量完善率、患者满意率均明显高于实施前数据,投诉率明显低于实施前,数据对比存在显著差异,P

综上所述:当前医院在病案管理工作的开展中还存在一定的问题与不足,需要通过对病案管理规范性的提升、推行基于三等级的循环监控机制、提高信息利用率、加强信息资源开发、提升病案管理人员综合素质与技能等多项措施的落实,进一步提高病案管理的工作质量与水平。

参考文献:

[1]黄锋,陈剑铭.医院病案管理工作现状及发展趋势探讨[J].中华医院管理杂志,2013,29(3):192-194.

[2]唐丽华,沈玉梅,朱崇光,等.质量控制在病案管理工作中的应用效果分析[J].中国医院管理,2013,33(12):57-59.

科研对比方法范文4

关键词:地区产业 竞争力 评价

一、引 言

在目前世界竞争力评价方法和指标体系中,较有代表性的有:美国经济学家迈克・波特的“钻石模型”;瑞士洛桑国际管理发展学院(IMD,1998)和瑞士日内瓦世界经济论坛(WEF,1998)的整体国家竞争力评比方法;荷兰格林根大学建立的ICOP(International Comparison of Output and Productivity)方法。在国内较有代表性的有:中国人民大学国家竞争力分析模型;金碚的工业品国际竞争力分析框架;裴长洪的研究模型;魏后凯的区域竞争力评价模型等。

由于国家和国内区域性质的不同,钻石模型、IMD和WEF的整体国家竞争力评比方法显然不适合区域竞争力的评价。目前,在区域竞争力研究方面运用比较广泛的是荷兰格林根大学建立的ICOP方法。此方法主要根据对不同地区、不同行业按同一分类体系标准化得到可比数据,计算出研究竞争力的一些主要参数。其缺陷是理论性不强,特别是各种参数的经济含义难以直观解释。

目前在国内区域竞争力评价指标体系中,人民大学体系是基于IMD和WEF模型,金碚的工业品国际竞争力分析框架中对钻石模型进行了拓展,裴长洪提出了产业国际竞争力的显示性、分析性评价指标,这些模型均不适用于地区竞争力的评价。而魏后凯的区域竞争力评价模型较有代表性地反映了构成地区竞争力的基本要素,从指标选取的经济性到测量结构的解释性都较前人有所突破,对比较和测评地区工业竞争力具有重要意义。

二、竞争力指标体系构建

区域竞争力是竞争主体在争夺资源或市场的过程中表现出来的一种综合能力。就地区工业竞争力来说,它决定于单个企业的核.亡.、竞争力及其群体优势,并主要体现在市场影响力、工业增长力、资源配置力、结构转换力和工业创新力上。这五个方面共同构成了一个地区的工业竞争力的基础。由此,我们可以构筑如下函数关系:地区工业竞争力=F(M,G,D,T,I)。公式中M、G、D、T、1分别代表地区工业的市场影响力、增长力、资源配置力、结构转换力和工业创新力。市场影响力:用地区工业占全国工业市场的份额(市场占有率)来衡量地区工业市场影响力。工业增长力:用地区工业总产值的增长率来反映工业增长力。资源配置力:用工业销售利润率和全员劳动生产率加权平均来衡量地区工业资源配置力。结构转换力:用高增长行业产值占地区工业总产值的比重和加工工业产值占地区工业总产值的比重两个指标,用这两个指标的加权平均来反映地区工业的转换能力。工业创新力:用非国有工业产值占地区工业总产值的比重来反映该地区的制度创新能力,用企业科技经费支出占GDP的比重(简称R&D投入比重)来反映地区的技术创新能力,以二者的加权平均来反映该地区工业的总体创新能力。

三、指标测算和分析

在评价分析中,我们对各个具体指标数据进行了标准化处理,并对分项评价指标进行了适当的加权处理。首先,对各地区的各项评价指标数据都以相应的全国各地区数据的平均值为标准进行了标准化处理。然后,在计算地区工业资源配置力、结构转换力和工业创新力系数时,均采用0.6、0.4加权办法计算上一级指标的数值。即销售利润率、高增长行业比重和非国有工业比重采用权重0.6,而劳动生产率、加工工业比重和IK&D投入比重采用权重0.4。

云南省工业竞争力系数一直处于略高于全国平均水平的状态,在2005年达到最低点后开始反弹,2006年达到最高点,在2007年出现回落,2008年略有上升。在影响工业竞争力系数的五大指标中,资源配置力系数、结构转换力系数、工业增长力系数在全国处于优势指标,工业竞争力系数和工业创新力系数处于劣势指标。具体影响指标变化趋势分析见图1。

其一,云南省市场影响力系数数值从2004-2008年一直低于全国平均水平的一半,且没有较大幅度的增加。云南工业市场影响力成为制约云南产业竞争力发展的最大因素。工业市场影响力主要反映一个地区工业的整体规模水平,这是一个绝对量的指标。由于历史的原因,云南工业发展长期滞后,没有形成规模化的产业结构和布局,随着市场竞争的加剧,致使云南的轻工制造业快速萎缩,进一步减少了云南工业的总体规模。直至2007年,云南销售收入过百亿的企业也只有10户,规模以上工业企业只有2698户,与全国相比这个数字就显得太小了。因此,企业规模小、数量少,是导致云南省工业规模指标偏低的主要原因。

其二,云南省工业增长力系数数值在2005年后一直保持良好增长趋势,在全国处于优势水平。云南省工业持续高速增长与云南省政府实施的一系列产业政策密切相关。从“十五”开始,云南省开始走新型工业化道路,政府提出了实施工业强省战略。为实现云南省工业增长的持续稳定奠定了坚实基础。

其三,云南省工业资源配置力系数数值从2005年后在不断下降,从绝对值上来看云南省该项指标在全国还是处于优势地位。云南省虽然工业增加值总量较小,然而已上市的公司所占的比重很大,上市公司在工业销售利润率和全员劳动生产率等指标上处于同行业领先水平。

其四,云南省工业结构转换率系数数值从2004年以后一直处于稳步上升的态势。该项指标数值的提升与云南省政府近几年大力扶持新兴工业,延长原有传统产业的产业链的思路联系紧密。近年来,云南省能源、原材料、有色金属深加工、化工等非烟产业持续增长,成为推动工业增长的主要力量,天然药物、生物化工、绿色保健食品等新兴生物资源产业增长速度明显加快,成为新的经济增长点。

其五,云南省工业创新力系数数值从2005-2007年逐步下降,到2008年有所回升但仍均低于全国平均水平。云南工业创新力系数已经成为制约云南工业竞争力提升的短板。究其原因云南省大中型工业企业R&D经费总量少,民营企业数量少,技术创新和技术开发水平有待提高。从近几年的数据看,云南省R&D活动经费来源于企业的比重虽然在不断上升,但投资主体还是以政府为主。企业离科技投入主体的要求仍有较大差距,制约了企业技术创新能力和产业科技竞争的进一步提高。

四、指标对比分析

以下抽取沿海发达省浙江省为代表与云南省在该竞争力指标体系下作对比,见表1、表2。

相对于东部沿海发达省浙江,云南省工业竞争力处于落后水平。具体指标中,市场影响力系数和工业创新力系数处于绝对落后水平。工业企业的绝对数量、企业的科研创新能力方面的不足已经成为云南工业竞争力与发达地区形成较大差距的重要原因。优势的资源配置力系数和结构转换力系数指标表明:相较于浙江省工业企业的平均水平,云南的工业企业具有更好的整合资源的能力和更高的经营管理效率。较高的工业增长力系数也显示出作为全国资源大省的云南省工业在今后的发展中具有更大的潜力可挖。

五、结论及对策建议

科研对比方法范文5

1.1课程设置改革

首先,资源环境科学专业是文理兼收的,故选择叶芬霞主编的“无机及分析化学”和“无机及分析化学实验”作为教材。本课程作为专业基础课,课程大纲要求学生掌握分析化学的基本原理和方法以及无机及分析化学试验的基本操作技能,培养严谨的科学态度、分析解决环境科学问题的能力,并为学习后续课程和将来从事环境监测工作和环境化学的学习奠定基础。因此本课程确定选取容量分析(酸碱滴定法、沉淀滴定法、氧化还原滴定法、配位滴定法)和仪器分析(吸光光度法、原子吸收分光光度法、离子色谱法等)作为重点教学内容,设定教学计划,理论环节50学时,实验环节22学时,实验分别设计入门项目、验证性项目、综合性项目等多种层次的8个实验项目来反复训练学生,培养学生获得整体行动能力,同时注重与本专业其他课程的衔接和渗透,真正通过本课程学习为后续专业理论学习和实践能力的培养打下良好的基础。

1.2理论教学改革

在分析化学的理论教学中,既要讲授分析化学的基本原理和方法,使学生严格树立起“量”的概念,培养学生从事理论研究和实践的严谨的科学作风和能力。又要将新发现的现代分析方法和技术巧妙的融合到经典分析化学中,如介绍分析化学在环境监测、环境毒理学、环境化学等课程方面的应用,特别是环境污染治理、生命科学在分析化学方向使学生认识到分析化学的重要性,充分调动学生的积极性,激发学生学习兴趣,积极参与到教学活动中。教师教学不应重在讲授,而应重在“授之予渔”,引导学生提出问题,指导学生解决问题。首先,教师提出能够涵盖课堂教学所有知识点的问题,让学生课前带着问题去预习,既培养独立自主学习能力又可让学生发现自己遇到的难点。然后,通过启发引导,鼓励学生提出问题,引导学生寻找解决问题的途径和方法,并给出一定的时间让学生去思考,去查阅相关的资料,培养学生独立解决问题能力,同时让学生自己挖掘每个问题所涵盖的知识点,并引导其掌握问题在实际中的应用,以学生为主体通过问题的解决而掌握相关的知识点,不但帮助学生自主分析、解决问题,还提高了学生学习的兴趣,使所学知识体系和创新能力不断提高和发展。比如新课前先留下问题水中Cl-和CrO4-同时存在,缓慢加入浓的AgNO3哪种离子先沉淀呢?实验现象又如何?学生带着问题去预习,学习分步沉淀的原理,同时鼓励学生小组设计实验,理论课前可以先进行实验,观察现象,通过查找资料分析原因,课堂上教师根据学生解答问题情况讲授新课,理论与实践相结合,充分调动学生学习的积极性,培养了学生自主学习、团结协作分析解决问题的能力。课堂教学过程中注重灵活引导学生掌握学习方法,如对比方法,包括将有关同类滴定分析方法原理知识进行横向或纵向的比较、几种常规容量分析法的相似点不同点、化学键与分子间作用力的异同点、三种银量法的异同点等,又如如何选择最适的指示剂,重点讲根据酸碱滴定曲线中滴定突跃选择指示剂,而配位滴定和氧化还原滴定,就不再详细讲授,让学生分组讨论学习,而且滴定分析重在应用,加以案例分析教学,有助于提高学习兴趣,让学生学以致用,了解本方法的用途,进而开展实践教学。

1.3创新实践教学模式,多种实验教学模式相结合

现阶段分析化学实践教学中,多数是老师为学生准备好试验水样、土样、药品试剂等,学生仅按照试验步骤依次操作即完成实验,这并不能满足全面提升学生综合实践能力、创新能力的培养要求,针对上述问题,我对分析化学实践教学做如下改革。以学生为主体、教师为引导,强调以工作任务为驱动组织实践教学,开展实验,同时提倡让学生参与试验的布点、采样、试剂配制、试验耗材准备等实验整个过程的教学模式。即根据工作任务让学生分小组完成任务分配表,包括试验样品的选取、实验药品用量的计算和配制方法、实验原理、实验注意事项等,在实践教学方法上注重互动式、启发式教学模式,鼓励学生小组筹备实验,实验过程中出现问题,引导学生查找分析问题原因,注重培养学生能够掌握基本的分析原理和方法基础上,培养学生进行自主式探索研究,能够自主提出问题、分析问题、并通过分工合作解决实际问题,真正实现教学相长。整个实验过程,不仅提高了解决分析问题能力,也培养了学生团队合作精神。实践教学中工作任务的设置应注重基础实验和综合设计实验相结合,如基础项目、验证性项目、自主性项目、综合性项目等多种层次的8个实验项目来反复训练学生。基础项目的选取以学生基本操作规范、实验常用仪器使用方法为主。如天平的使用、基本仪器操作规范及注意事项等。验证性项目则在规范操作基础上,与课程教学大纲相结合,学会如何着手解决工作任务,教师给出概要的指导性问题和解决问题可选择的途径,学生通过实验过程记录现象和课后查阅资料分析现象,形成总结报告,教师根据结果用部分课堂时间予以点评,如开设水中氯化物含量测定、硫代硫酸钠的标定、EDTA的配制和标定等等。自主性项目则以小组为单位,进行自主式探索研究,分工合作,引导可以选择食用米醋酸度的测定、食用盐中碘含量的测定、自来水中总硬度的测定等。综合性项目为设计研究跨课程的大型综合项目,如草溪河水体富营养化评价等,根据所学的知识和操作技能和查阅相关资料,小组合作写出设计方案,在教师论证其可行性后筹备实验,完成实验,写出实验小论文。

1.4改革考试方式,推行全面而科学的考核方法

改革以考核知识的积累、实践能力为目标,考核采取全过程考核,考核方式有闭卷笔试、实验操作、平时作业、实验报告等多种形式,既注重结果又注重过程。理论部分占总成绩的60%,实验部分占总成绩的30%,考勤占10%,共100分。考核内容以应用为主,主要考核学生掌握知识点和灵活运用能力,达到培养学生综合应用能力的目标。

2成果与展望

科研对比方法范文6

关键词:关键词提取;共现矩阵;关键词词库;关键词语义网络;电力项目

中图分类号: TP391.1 文献标志码:A

英文摘要

Abstract:In order to solve the problems of keyword extraction and project keyword lexicon establishment of technological projects in professional fields, an algorithm for building the lexicon based on semantic relation and cooccurrence matrix was proposed. On the basis of conventional keyword extraction research based on cooccurrence matrix, the algorithm considered several advanced factors such as the location, property and Inverse Document Frequency (IDF) index of the keywords to improve the traditional approach. Meanwhile, a method was given for the establishment of keyword semantic network using cooccurrence matrix and hot keyword identification through computing the similarity with semantic base vector. At last, 882 project experiment documents in power field were used to perform the simulation. And the experimental results show that the proposed algorithm can effectively extract the keywords for the technological projects, establish the keyword correlation network, and has better performance in precision, recall rate and F1score than the keyword extraction algorithm of Chinese text based on multifeature fusion.

英文关键词

Key words:keyword extraction; cooccurrence matrix; keyword lexicon; keyword semantic network; power project

0 引言

关键词提取是一项对文档索引、网页索引、文档分类、文本挖掘等领域非常重要的技术。关键词词库则是特定领域关键词的合集,关键词和关键词词库的优劣对各类检索系统、搜索引擎的性能有着重要影响[1]。关键词和关键词词库的质量不仅是评价检索系统优劣的重要标志之一,同时对我国主题词表和文献检索语言的发展有重大意义。

目前的情况下,无论是提取文档关键词,还是建立关键词词库,人工给出的结果都是最为理想的。然而,随着网络的发展,信息量的增长越来越快,网络资源正在以爆炸式的速度增长。据中国互联网络信息中心(China Internet Network Information Center,CNNIC)的《第33次中国互联网络发展状况统计报告》,截至2013年12月,中国网页数量达1500亿个[2]。人工进行关键词标注是不现实的,所以,对于关键词高效自动的提取就显得十分重要。

针对关键词的提取技术,学术界已经开展了许多研究。研究者提出了很多关键词提取方法,主要分为三类[3]:1)基于统计的方法,如词语文档的频率统计;2)基于词语网络的方法,根据一定规则将文档映射为词语网络,利用词语网络计算词语的关键度;3)基于语义和自然语言理解的方法,利用词语的语义特征提取关键词。

在统计方法领域,词频逆向文件频率(Term FrequencyInverse Document Frequency,TFIDF)是一种常用的统计模型,在关键词抽取中应用广泛。文献[4]是基于多特征信息对中文网页进行关键字提取,具体处理上,文章综合考虑了网页上的标题和交互信息,对TFIDF进行了改进。文献[5]也是在统计方法方面对TFIDF进行改进,以解决IDF值的大小和代表文本特征之间不匹配的问题。文献[6]考虑了词长、位置、词性的启发知识,提出了改进的词频逆向词语频率(Term FrequencyInverse Word Frequency,TFIWF)权重算法。在词语网络方面,文献[7]利用了参考文献和原文献重要的上下文关系,通过创建词语共现图和概率主题模型,对词语的相关性进行计算。文献[8]将候选词项与文献引用之间的关系抽象为二部图,使用CoHits方法迭代计算词项重要性得分至收敛,选出得分最高的词项作为关键词。与上述处理参考文献的方法不同,文献[9]则是基于访问日志文件进行关键词提取的,由于访问日志文件和用户的搜索行为关系很大,文章利用了记录和用户索引语句的关系,用聚类的方法将相似的关键词进行分类。在网页关键词提取方面,文献[10]利用网页的社会化标签(Tag)来提高网页关键词抽取的质量,提出了TagTextRank方法。该方法通过对目标文档中的每个Tag引入相关文档来估计词项图的边权重并计算得到词项的重要度,最后将不同Tag下的词项权重计算结果进行融合。语义和自然语言理解方面,大部分考虑了词语的语法语义、词语的关联关系,以及词的共现关系等。文献[11]在传统特征基础上增加了维基百科和文档类型的语义特征,利用分类模型进行提取关键词。词汇链为一系列语义相关的词汇的集合,用于表示将文本中相关的词构成一个链的过程。文献[12]利用基于知网的词语语义相关度算法对词汇链的生成算法进行了改进,对关键词进行了标引。

上述文献中,对关键词研究主要集中在识别特定关键词,以及如何对文档进行关键词的抽取等方面。但是对于关键词词库的建立相关的研究,却相对较少。

在科研活动中,项目评审或咨询发挥着不可替代的作用,如何选择合适的专家及有关专业技术人员将直接影响到相关工作的质量,正确选择专家对于保证评审结果的公正、准确、合理是至关重要的。对科技项目进行量化分析,其中的一个基础工作是建立项目关键词词库。因此,本文针对科研项目评审的场景,选取电力行业相关数据[13]作为数据源,对关键词词库的建立进行研究。

本文主要思路是在词共现矩阵的基础上建立项目关键词库。目前,词共现矩阵的构造方法主要是计算两个关键词共同出现在同一个文档中的次数,即通常意义的词频作为矩阵元素的度量,但它们都存在着缺陷。基于词频的方法只考虑高频词对文档主题的贡献,而没有考虑非高频词对文档主题的贡献。特别是一些高频词,在所有文档中出现的频率都非常高,但是它们包含的信息却非常少。另外, 根据词项在文中出现的位置不同,词项被选为关键词的概率也是不同的。如出现在题目和摘要中的词往往比出现在正文的词所含信息量更多,被提取为关键词的概率更大。还有词性的因素,如名词、形容词、动词等成为关键词的概率比介词、连词、助词等大得多。本文在基本词共现矩阵的基础上,综合考虑了关键词在文章中的位置、词性以及逆向文件频率IDF的关键信息,提出了改进的关键词词库建立算法。

本文的主要工作如下:

1)改进传统的基于词共现矩阵的关键词提取算法,在语义层面上考虑了词语出现的位置、词语的词性和逆向文件频率等关键信息。

2)利用关键词共现矩阵,计算了关键词的语义关联网络,用于发现热点词。

3)本文方法对项目数据自动筛选分词并获取项目关键词,实现了关键词库的建立和动态更新。

1 相关工作

1.1 原来未加中间连接符,是否应统一为加连接符的形式应该统一加中间连接符,另外TF前面“”这个符号是否人为添加?后面很多处这种问题,应该去掉。TFIDF统计方法

TFIDF是信息检索系统最常用的一种统计方法和加权技术,用来评估关键词对于一个文件集或语料库中一份文件的重要程度。对于不同的问题而言,TFIDF有很多不同的形式[14]。TFIDF基于这样一种假设:字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TFIDF分为两个部分原文是否掉了内容?核实目前添加的内容是否正确这里tf前面也有“”符号,这个不应该添加。

1.2 词语语义相似度

词语语义相似度反映的是词语间的关联程度,如“阅读”“书籍”两个词,“阅读”可以作为动词也可以作为名词,“书籍”只作为名词。“阅读”和“书籍”之间存在语义关联关系,因此两者具有语义相似度。计算语义关系的方法分为两种[3]:基于规则和基于统计的方法。基于规则的方法需要借助于世界知识来计算,根据资源中概念间的语义关系来计算词汇间的相似度;基于统计的方法常借助于大规模语料的训练来判断两个词汇的上下文的相似度。本文主要利用统计的方法进行语义相似度的计算。

由于词汇的相似性由人为判断而具有较强的主观性,因此通常先计算词汇间的语义距离然后再用公式转化为相似度值。一般而言词汇间的语义距离是一个大于等于0的实数,数值越大相似度越大;相反,相似度越小。相似度计算方法有很多种,如欧氏距离、曼哈顿距离、夹角余弦等。本文主要利用的是机器学习中应用比较广泛的夹角余弦[15]。对于两个文本向量,夹角余弦度量方法通过计算两者向量空间中的夹角余弦,将两者相似度映射到坐标上,结果越接近1,表明两者越相似。夹角余弦的计算方法如下:

1.3 语义基向量

语义基向量是领域关键词语义向量空间的中心值,是领域簇的聚类中心,它和Kmeans等聚类算法中的簇中心类似。对于本文所研究的专业领域来说,语义空间是聚合在一类的,语义基向量是语义空间倾向性的量化。通过计算候选词向量和语义基向量的相似度,量化候选词的重要性。

通过计算核心关键词与基准向量之间的相似度作为此核心关键词重要程度的度量。定义基准向量权重的各个属性的值是所有关键词向量权重向量对应属性值的平均值[16-17],即:

其中:Wb[k]表示基准权重向量的第k个属性,wi[k]表示权重向量i第k个属性的值,n表示权重向量的个数。

1.4 中文词性和文章结构特征

与英文由空格进行自动分词不同的是,中文的词语需要进行专门的分词,然后对文档进行分析。进行中文关键词的提取需要特别重视词语的属性特征和文章结构特[5]。从词语属性特征来说,一般来说,动词、名词、形容词是句子的主干部分,副词、数词、代词等针对本文的应用目的也具有重要的意义,助词、连词、代词、拟声词等虚词只起修饰作用。本文重点考虑名词、动词以及形容词。

在文章结构方面,在特征提取之前先对文本的各个部分的重要程度作区分,无论哪种类型的文本,一般都会有标题。通常标题部分特征信息的含量都比文章其余部分要大,文章的开头和结尾含有的信息量比正文的其他部分要大。对于本文的电力研究文章来说,分为题目、摘要、关键词以及正文等主要部分。各个部分的重要程度不同,题目和关键词部分相较于其他部分更重要,因此对各个部分赋予不同的权重,对关键词的提取是有帮助的。

1.5 词项间关联度

词共现矩阵是词共现模型的量化,词共现模型是基于统计方法的自然语言处理研究领域的重要模型之一。它的基本假设的基础是:在大规模语料中,如果两个候选词经常共现在文档的同一窗口单元(如一句话、一个自然段等),则认为这两个词在意义上是相互关联的,并且共现的概率越高,其相互关联越紧密[17]。

2 关键词词库和关键词关联网络建立算法

建立关键词的初始部分是选取种子关键词,又称为核心关键词,作为后续算法的种子词库。考虑到项目关键词是整个项目中作者人工选取的关键词,具有较好的分辨作用,因此本文选取项目关键词组成种子关键词词库。利用种子关键词库和分词工具对项目文档进行分词获得待选关键词,然后通过建立关键词共现矩阵,选择与基向量相似度最高的关键词加入到离线词库中。对核心关键词词库建立权重的词共现矩阵,然后计算各个节点之间的相似度,得到关键词关联网络。下面将详细阐述该算法的主要过程:

步骤1 计算关键词基向量Wb。首先对数据进行预处理,对数据库项目数据进行剔除标点符号、剔除停用词等无关词的操作。项目题目和项目关键词是对项目内容以及相关领域的高度概括,因此本文通过对项目数据库项目题目和项目关键词进行分词和统计获得核心关键词。首先对项目关键词进行剔除标点等操作,将项目关键词加入核心关键词词库;然后利用中国科学院分词工具ICTCLAS将项目题目进行分词,剔除停用词后,将结果加入核心关键词库;最终,根据核心关键词词库的统计结果建立核心关键词共现矩阵Mc=[核实矩阵内各元素是否黑?各元素是否为向量或矩阵1:元素为列向量,需要加黑。

其中Si, j表示i, j核心关键词之间的相似度。Gs会根据相似度大小确定图中节点之间边的权重。之指代什么?之指代矩阵中的“关键词”。可以修改为,“对于矩阵中的关键词,若与之相似的其他关键词越多,同时相似性越高,则该关键词对文档集的重要程度更高”对于矩阵中的关键词,若与之相似的其他关键词越多,同时相似性越高,则该关键词对文档集的重要程度更高,如图1中的是否黑?不黑w1。在图1关键词语义关联网络中,边的粗细代表节点间的相似度,关键词wi的面积大小代表该关键词对文档集的重要程度。

其中:m为待选关键词的个数,n为核心关键词的个数,Ci, j为待选关键词i和核心关键词j的共现度。

步骤4 计算待选关键词与基向量的相似度,根据相似度的关键词词库。由步骤3计算得到的关键词词库Mw=[w1w是否应黑?是否应为一字空间隔?应该为黑。抱歉这里是我的失误,各元素间应为一字空格间隔,不是逗号间隔。, w2, …, wn]T,利用式(4)计算每个词wi与关键词基向量Wb的相似度Similarity(wi, Wb),并利用相似度大小进行排序从而得到关键词,存入离线词库中。

步骤5 如果项目发生更新,重复步骤为何没有步骤2。这里没有问题,步骤2是中间建立关键词网络的操作,更新词库的顺序是1,3,4.1、3、4过程,在线更新词库。

3 实验与数据分析

3.1 实验设置和数据源

为了进一步验证基于词共现矩阵获取关键词库的有效

性,本文用Java语言仿真了上述算法。本文选取的数据集是电力行业研究项目数据[13],数据存储在SQL server 2008数据库中。该数据源一共包含882条数据,每条数据代表一个研究项目。每条数据包含项目名称(project_name)、内容摘要(content_abstract)、研究现状(country_study)等多列属性。其中本文选取的列属性为项目名称 (project_name)、内容摘要(content_abstract)、研究现状(country_study)、项目需求(project_need)、 研究基础(study_term),其他摘要(profit_abstract)等6列数据。该6列数据对应的权重分别为λk(k=1,2,…,6),经过多次实验,相关参数设置如表1。对于词性方面的考虑,由于本文的实验数据源为电力方面的科技项目,核心关键词主要为名词,因此本文目前仅对名词进行提取,相关参数qua=10。然而,本文对词性方面的加权技术适用于其他类型的文档,可以根据文档类型的不同,对不同词性的待选词赋予不同权重,根据实验结果进行优化调整。在此数据源的基础上进行分词并建立关键词网络和关键词词库。

3.2 实验结果

实验将882条数据分为6个数据量级,并用两组方法分别对每个数据集进行了关键词提取。首先对步骤2建立的关键词关联网络Gs进行分析。利用分析工具Ucinet对获得关键词关联网络进行可视化处理,得到图2。可以发现,882条项目数据核心词汇主要集中在“研究”“电网”“结构”“系统”,这与实际项目基本吻合。本文所选电力项目数据中,大部分集中在电力方面的研究,主要讨论的是电力系统的结构设计等方面的内容。

在关键词提取的准确性方面,实验用三种性能评估标准:准确率(precision)、召回率(recall)、和一般是F1measure,是同一概念吗同一个概念F1score对两组方法的结果进行测量。由于提取的关键词数量巨大,实验对结果进行了抽样测评,随机抽取100个词,并对该100个词进行实验分析,每次实验进行10次随机抽样。为方便起见,下面的分析中,方法1指代本文提出的方法,方法2为基于多特征融合的中文文本关键词提取方法[18]。对比方法和本文提出的方法都是利用多特征的方式对关键词加权,然而对比方法利用了词语间的关联特性进行关键词提取,并没有考虑词与词之间的语义和共现关系。两者有一定的相同性,同时存在原理上的差异性,因此选取该方法做对比实验可以比较充分地说明本文方法的正确性。

首先对准确率进行对比实验,准确率为提取的关键词中被确认为正确关键词的比率:

precision=nhit/n(11)

其中:nhit为正确关键词的个数,即命中个数;n为提取的关键词总数。在实验中发现本文提出的方法在项目文档数较少时不够稳定,如图3中项目文档数为300时,本文提出的方法的准确率低于对比实验。然而随着文档数的增加,尽管两种方法的准确率都在增长,本文提出的方法的准确率较对比算法更高,最终趋于稳定。综合来看,本文提出的方法在准确率上基本均高于对比方法。

通过上述实验过程,查看相关数据结果也发现了一些问题,导致准确率和召回率不高的原因主要是高词频词汇,由于出现次数过高被算法提取作为关键词。经过多次实验发现,“行政”“员工”“所长”“欧洲”等不能有效区分研究领域的词项大量出现,并被系统提取出作为关键词。利用式(8),考虑逆向文件频率IDF并不能完全消除过高频词汇带来的影响。

4 结语

关键词词库的建立是对科技项目进行量化分析时的一个基础工作,是对专家专业领域、科技项目进行学科分类和领域分类的关键。以往的词库构建往往基于大量语料库并利用传统的中文分词程序分词,由于行业关键词具有很强的专业性,仅仅依赖普通的分词方法很难准确识别专业术语。本文在传统的关键词提取的基础上,提出了基于词共现矩阵的关键词词库建立算法。该算法综合考虑了关键词在文章中的位置、词性以及逆向文件频率(IDF)。实验表明,在电力系统相关数据资源上,本文方法能有效提取关键词并建立相应的关键词词库。同时,在实验中也发现过高词频词汇会使得关键词词库中关键词的准确率下降。通过考虑更多语义上的因素,减小高词频词汇的影响,也是下一步将要研究的重点。

参考文献:

[1]FANG J,GUO L,WANG X. Semantically improved automatic keyphrase extraction [J]. Computer Science, 2008, 35(6): 148-151. (方俊,郭雷,王晓东.基于语义的关键词提取算法[J].计算机科学,2008,35(6):148-151.)

[2]ZHANG Z. Statistical report on Internet development in China [J]. Computer & Network, 2014(2): 5-5. (张紫. 第33次中国互联网络发展状况统计报告[J]. 计算机与网络, 2014(2): 5-5.)

[3]WANG L, HUAI X. Semanticbased keyword extraction algorithm for Chinese text [J]. Computer Engineering, 2012, 38(1): 1-4. (王立霞,淮晓永.基于语义的中文文本关键词提取算法[J].计算机工程,2012,38(1):1-4.)

[4]HE Q, HAO HW, YIN XC. Keyword extraction based on multifeature fusion for Chinese Web pages [C]// Proceedings of the 2011 2nd International Congress on Computer Applications and Computational Science. Berlin: Springer, 2012: 119-124.

[5]LI J, LI P, ZHU Q. An improved TFIDF based approach to extract keywords from Web pages [J]. Computer Applications and Software, 2011, 28(5): 25-27. (李静月,李培峰,朱巧明.一种改进的 TFIDF 网页关键词提取方法[J].计算机应用与软件,2011,28(5):25-27.)

[6]YANG C, HAN Y. Fast algorithm of keywords automatic extraction in field [J]. Computer Engineering and Design, 2011, 32(6): 2142-2145. (杨春明,韩永国.快速的领域文档关键词自动提取算法[J].计算机工程与设计,2011,32(6):2142-2145.)

[7]LU Y, LI R,WEN K, et al. Automatic keyword extraction for scientific literatures using references[C]// Proceedings of the 2014 International Conference on Innovative Design and Manufacturing. Piscataway: IEEE, 2014: 78-81.

[8]CHEN C, LUO P, WANG S. Extraction of keywords with citation information [J]. Library and Information Service, 2014, 58(1): 101-108,116. (陈,罗鹏程,汪十红.利用引用信息的关键词提取[J].图书情报工作,2014,58(1):101-108,116.)

[9]PARK N H, JOO K H. Log based keyword extraction and spread based clustering for an efficient information searching [J]// International Journal of Software Engineering and Its Applications, 2013, 7(6):201.

[10]LI P, WANG B, SHI Z, et al. TagTextRank: a webpage keyword extraction method based on tags [J]. Journal of Computer Research and Development, 2012, 49(11): 2344-2351. (,王斌,石志伟,等.TagTextRank:一种基于 Tag 的网页关键词抽取方法[J].计算机研究与发展,2012,49(11):2344-2351.)

[11]YANG S, ZHANG B, LI S, et al. Keyword extraction using multiple novel features [J]. Journal of Computational Information Systems, 2014, 10(7): 2795-2802.

[12]LI G, DAI Q. Keywords automatic indexing based on lexical chains [J]. Documentation, Information and Knowledge, 2011(3): 67-71. (李纲,戴强斌.基于词汇链的关键词自动标引方法[J].图书情报知识,2011(3):67-71.)

[13] State Grid Information and Telecommunication Branch. State grid[EB/OL]. [2014-12-01]. http://.cn/.给出对应英文,给出的是首页是否恰当?不具体,作者指出是保密考虑未给出具体网址(国家电网公司信息通信分公司.国家电网公司[EB/OL].[2014-12-01].http://.cn/.)

[14]AIZAWA A. An informationtheoretic perspective of tfidf measures [J]. Information Processing and Management, 2003, 39(1): 45-65.

[15]DEHAK N, DEHAK R, GLASS J, et al. Cosine similarity scoring without score normalization techniques [EB/OL]. [2014-12-01]. http://groups.csail.mit.edu/sls/publications/2010/Dehak_Odyssey.pdf.

[16]MONGE A, ELKAN C. The field matching problem: algorithms and applications[C]// KDD 1996: Proceedings of the 1996 Knowledge Discovery and Data Mining (International Conference). Menlo Park: AAAI Press, 1996: 267-270.