前言:一篇好的文章需要精心雕琢,小编精选了8篇识别技术论文范例,供您参考,期待您的阅读。
期刊编辑防范学术不端的必要性
国际科技期刊屡次曝光震惊学术界的学术不端论文撤稿事件,引发国人对学术不端行为的极大关注;但相较于引人瞩目的国际期刊撤稿事件,国内期刊的撤稿显得悄无声息。比如郭佳楠剽窃论文在CNKI消失,刊载刊物连撤稿声明都欠奉。张培福等统计发现,《近代中医》期刊“一稿多刊”的作者占全部样本作者的73.1%,重复刊发的文章数占样本作者发文总数的10.4%。某作者2015年2月15日和20日分别在《江苏理工学院学报》《中州大学学报》发表了题名同为《数字化出版视域下传统科技期刊的发展思考》的文章,内容几乎完全相同。事实表明,国内科研出版环境并非天朗气清,也存在大量剽窃、抄袭、伪造篡改、自我抄袭、重复发表的稿件。107篇学术不端论文撤稿后,中国科协约见SpringerNature出版集团大中华区总裁指出:期刊与编辑对学术不端撤稿事件负有责任。科技期刊编辑作为学术论文出版最终的把关者,既肩负着科研成果出版的重任,又肩负着维护科研诚信的使命,是阻止学术不端行为的最后一道防线,工作举足轻重。很多科技期刊编辑在工作实践中摸索、思考、总结了大量高价值防范学术不端的技巧和方法,然而,没有刻意的培养和训练,再有价值的技巧和方法也仅限于文献。笔者工作之初,由于没能及时树立学术不端防范意识,又缺乏工作经验,对返回审稿意见迅速、评价正面的审稿专家充满感激,不曾意识到其间可能存在学术不端;因此,本文中,笔者阐述培养和加强期刊编辑防范学术不端行为意识和能力的必要性及策略的一些浅见,以期对与笔者一样的新编辑顺利成长为更好的学术守门人有所帮助。
1收益巨大,学术不端行为难以根除
学术论文作为科研成果的载体之一,是许多国家科研规划机构、高校和科研单位都认可的、可以明确界定科研工作者的能力和水平的要素之一。发表足够的学术论文能使作者进入“充裕的科研经费、大笔的奖金、迅速地晋升、各种头衔及名誉的获得和更充裕的科研经费、更大笔的奖金、更迅速地晋升、更多的头衔和名誉的获得”的良性循环,发表学术论文已成职业刚需。马克思在《资本论》中说:“一旦有适当的利润,资本就胆大起来……有百分之五十的利润,它就铤而走险;为了百分之一百的利润,它就敢践踏一切人间法律;有百分之三百的利润,它就敢犯任何罪行,甚至冒绞首的危险。”依靠抄袭、剽窃、篡改数据无异于“空手套白狼”,利润何止300%,必然诱导学术不端行为发生;因此,我国科技部、教育部、基金委等部门对撤稿事件的彻查和雷霆手段,一定程度上可以抑制学术不端。但国内期刊界应有悲观而冷静的认识:只要学术论文依旧是衡量科研能力的刚性条件,的巨大利益回报就不会结束,就不应心存学术不端能彻底消除的幻想。阻止学术不端行为将是一场持久战,每位期刊人都有责任和义务增强防范的意识和能力。
2学术不端检测系统并非万能
调研结果显示,很多科技期刊利用中国知网的学术不端检测系统来防范投稿者抄袭、剽窃等学术不端行为。该系统强大的识别重复字段的功能确实极大地提高了期刊编辑排除抄袭论文的效率,但同时也有人指出这项技术目前对图表和重义篡改还无能为力。吴昔昔等指出,很多低重复率的文章源于作者有意识“修饰”“加工”和“改装”,或者剽窃他人观点、套用他人设计思路等。赵秋民、陆宜新发现,只要作者改换抄袭剽窃内容和观点的描述次序、句式等,即可在学术不端检测系统中“隐形”。笔者曾利用学术不端检测技术定量测试一段篡改的文字,在没有原文作为“触媒”的条件下,即便是简单的字序更改都能避过学术不端检测系统的检测[23]。学术不端检测系统技术逐步成了一柄“双刃剑”,在正直的人手中是帮助净化科研出版环境的工具,在别有用心的人手中是规避期刊学术不端防范工作的利器。很多作者利用付费学术不端检测系统提前检测论文,根据结果精确修改来规避期刊的学术不端检测;所以,期刊编辑在防范抄袭行为上过度依赖该系统而降低对稿件内容的警惕不可取,必须时刻保有防范意识,才能当好学术传播的守门人。
3学术不端行为日益隐蔽
出版物数字化和网络化以及学术不端检测系统使用之后,原文复制粘贴的学术不端文章基本能被期刊拒之门外,但技术的更新使得造假伎俩越来越多样化,越来越难以识别。比如:机构和作者利用期刊网络采编系统漏洞操纵期刊同行评审,通过虚假邮箱顶替专家为自己的论文审稿,提供有利的评审意见;利用翻译平台(Google翻译、Baidu翻译等)将复制的中文翻译成英文,再将英文翻译成中文,略做修改以规避学术不端检测系统的检测;利用释义工具查找一个词的解释或同义词对原词进行替换,造成不重复但重义的抄袭;将他人论文中的文字描述绘制成图片和表格瞒天过海。识别这些学术不端行为不仅需要期刊编辑警觉的防范意识,还需要期刊编辑过硬的识别能力。随着国家对学术不端行为责任人惩罚力度的加大,以及防范学术不端行为手段的更新,学术不端还会更加隐蔽和复杂。期刊编辑必须从一开始就树立防范意识,掌握识别技巧,以应对日益艰巨的防范工作。
学术期刊发展与人工智能融合
一、引言
随着数字时代的到来,网络技术、传媒技术和大数据的蓬勃发展,传统期刊的内容编辑和运营方式都受到了极大的冲击。人工智能的热潮更是为改变和重构新闻出版业的格局、创新学术期刊和文化业态带来了前所未有的机遇。通过与人工智能的融合,学术期刊的宽度、广度和深度都将得到更大的扩展,其发展将迎来全方位、多层次的变革和创新。其实,不管在国外还是在国内,人们已经在尝试将人工智能应用在新闻媒体界。早在2010年,一家名为NarrativeScience的服务公司就推出了一款名为Quill的写作软件,它能将数据转化为有故事情节的叙述文,由于拥有超强的自我学习能力,在一段时间之后便能从大数据中研究出写作模式及风格。《华盛顿邮报》等多家新闻媒体组建了“人工智能编辑部”,首先利用大数据技术获取多种信息,然后利用机器学习对信息进行分析和判断,并且最终能够将有效信息进行合成、输出,形成高质量的多媒体新闻稿件[1]。
二、人工智能的发展及在数字出版领域的应用
人工智能意味着机器可以在各种应用中实现人类大脑的功能,例如解决数学问题等。约翰•麦卡锡于1956年在达特茅斯的一次会议上首次创造了“人工智能”一词,从那时起,人类对于人工智能的兴趣呈指数级增长[2]。人工智能技术的发展和应用,经过了逻辑智能、感知智能和认知智能三个阶段。在逻辑智能阶段,人们重点关注的是计算机的存储、记忆和计算、搜索的能力。无人驾驶汽车是感知智能的一个重要代表。在这一阶段,计算机可以与外界进行交互,感知外界的环境。认知智能目前还处在研究阶段,其强调的是计算机从机器向“人类”的发展,也就是凸显计算机的自我意识。神经网络和深度学习正是目前这一阶段,是人工智能的研究热点。数字时代,越来越多的国内外数字出版机构都在积极关注最新的科学技术,并努力探索与之结合的创新方法。互联网时代,人工智能所带来的革命性新技术将进一步激发数字出版在产品开发、资源建设和用户服务方面的智能性的潜能。目前,将人工智能技术引入数字出版领域,主要是在学术期刊系统中提升大数据收集、处理、分析和应用的智能化水平。
三、数字时代学术期刊发展与人工智能融合的重要性
数字时代,学术出版业正在日益受到人工智能的深刻影响。2014年,有约250万篇以英文出版的科学在28种不同的期刊上。随着大量期刊文章的,人工智能可以成为出版商提高效率的利器。通过使用人工智能,出版商可以很容易检测到学术期刊中是否存在欺诈性数据,也有利于避免出现学术抄袭现象。通过精准的算法,人工智能可以在较短的时间内判断论文和研究的质量,从而决定论文是否适合出版。世界经济论坛称,“人工智能将扰乱科学界———这是一件好事”。学术研究发展到现在,在很多研究领域中,学术文献的发表数量已经呈现过于繁多的现象。例如,仅关于p53蛋白的学术论文就发表了超过70000篇。过多的学术论文迫使学者们努力跟上关于这一主题的各类研究和成果,但如此多的研究及成果对普通大众来说,他们很难找到最新、最前沿的研究内容。在人工智能的帮助下,公众对于已经发表的学术论文能够方便、快捷地搜索和筛选。例如,SemanticScholar是一个由人工智能研究所创建的搜索引擎,它利用数据挖掘技术,能够帮助公众快速定位和分类已发表的研究。可以肯定的是,人工智能可以而且将使科学界受益。人工智能将显著改善学术的研究方式和论文的发表方式。首先,它可以揭示对科学研究而言至关重要的研究趋势:它可以使论文得以根据内容而不是标题进行提炼,使研究人员能够快速识别研究趋势和研究前沿。其次,人工智能可以帮助确定新的同行评审员:人工智能可以从期刊编辑可能没有考虑过的在线资源中找出潜在的同行评审员名单。并且人工智能在打击学术抄袭方面有着突出的优势:使用自然语言处理,人工智能可以放弃传统的检测抄袭的算法,转而使用可以识别整个句子或已经改写的段落软件。另外人工智能能够快速高效地识别有缺陷的报告和统计数据:人工智能可以确定是否缺少研究的重要组成部分以及所应用的统计数据是否存在缺陷。最后,它可以检测数据是否被修改以达到期望的结果。综上所述,在数字时代,将学术期刊的发展与人工智能融合,有着非常大的价值和意义,它将改变学术期刊的发展方向,提高研究者使用学术期刊的效率,也能够极大提高学术期刊的质量,改善学术领域的环境。
四、数字时代学术期刊发展与人工智能融合的策略
教育人工智能产业发展比较研究
摘要:人工智能新的浪潮正在教育领域引发深层次的变革,技术正在重塑教育的形态。教育人工智能的发展问题归结为处理谁来研究、在哪研究、研究什么、研究成果等问题的4W模型。通过对2017—2019年公开的论文和专利等文献的检索与分析,反映出教育人工智能的学术研究和科技创新总体上成果颇丰,在关键技术上侧重于学习算法的研究,而在应用领域更加关注智能机器人和教育游戏;相较于企业,高校的研究占据了主导地位。
关键词:教育人工智能;文献分析;4W模型;产业发展
人工智能的概念是1956年在美国达特茅斯学院确立的,指让计算机像人那样思考、学习和认知,即用计算机来模拟人的智能[1]。大数据智能的出现、群体智能引起的关注、混合智能在人机一体化技术中的引入、跨媒体智能的兴起、无人系统的迅速发展等都初步崭露了新一代人工智能技术的锋芒。
一、研究背景
人工智能已逐渐渗透到社会的各个领域,多个国家已将人工智能提升为国家战略,出台了相关政策和规划,力争抢占科技的制高点。2017年,国务院首次将人工智能写入政府工作报告,同年了《新一代人工智能发展规划》,部署了我国发展人工智能的重点任务。工业和信息化部随即印发《促进新一代人工智能产业发展三年行动计划(2018-2020)》,全力助推人工智能的发展。2018年,教育部印发《高等学校人工智能创新行动计划》。旨在进一步提升高校人工智能领域科技创新、人才培养和服务国家需求的能力。人工智能新的浪潮正在教育领域引发深层次的变革,技术正在重塑教育的形态。在此背景下,研究如何应用新技术推动教育事业的发展具有重要意义。
二、发展概况与文献综述
2006年Hinton等人提出的深度学习技术拉开了新一代人工智能的序幕。ImageNet竞赛代表了计算机智能图像识别领域最前沿的发展水平,2015年基于深度学习的人工智能算法在图像识别准确率方面第一次超越了人类肉眼,人工智能实现了飞跃性的发展。伴随着机器视觉的研究获得前所未有的成功,深度学习在语音识别、数据挖掘、自然语言处理等不同研究领域相继取得突破性进展。2016年,微软将英语语音识别错词率降低至5.9%,可与人类相比肩。如今,人工智能已由实验室走向市场,无人驾驶、智能助理、新闻推荐与撰稿、搜索引擎、机器人等应用已经走进社会生活的各个角落。教育人工智能领域已经涌现出一批相关研究,闫志明团队概括了人工智能的内涵、技术与应用等内容,侧重对美国政府两个人工智能报告的解读,分析了教育人工智能的内涵、关键技术与应用趋势;探索了机器学习在教育中的应用[2];贾积有探讨了人工智能教育应用的热点问题[2];唐烨伟团队分析了人工智能与STEM等课程的融合[4];吴永和团队构筑了人工智能+教育的生态系统[5]。
基于RFID的烟草仓储管理论文
1RFID技术
RFID的中文是射频识别技术,也叫做“电子标签”。人们通过该技术能够识别特点的信息,同时读取相关的数据并进行相应处理。作为一种新兴的技术,该技术具有许多优点:具有很强的穿透性、很大的存储空间、更快的读取速度以及更高的安全性能。RFID一般由以下几个部分组成:天线、标签、读写器以及中间件等等。
2基于RFID的烟草仓储管理方案
本论文设计的烟草仓储系统,主要业务是对卷烟的出入库管理。采用RFID技术,可以使得每个环节的信息更加透明,使得管理者和操作人员能够更方便及时地了解烟草的数量、位置等状态,从而实现了信息流和物流的融合。
2.1系统整体架构
基于RFID的烟草仓储管理系统的主要工作原理是:所有的卷烟都存放在托盘上,每个托盘都贴有相应的电子标签。数据库通过相应处理,将每个托盘上电子标签的信息整合在一起,同时一一对应。采集到相应的电子标签的信息,就可以获得相应的各种条码信息。
2.2系统流程设计
期刊影响因子人为操纵识别
自影响因子广泛应用于学术期刊评价以来,对影响因子科学性和合理性的质疑从来就没有间断过,争议最大的莫过于影响因子的滥用和误用,如用影响因子评价单篇论文、评价研究者个人,甚至应用于职务任命、资金分配和项目评审。许多研究者认为,影响因子的设计存在明显缺陷,如引证时间窗口(2年)过短、分子和分母纳入的文献类型不统一、没有考虑期刊论文被引频次的偏态分布、无法应用于跨学科评价等。尽管如此,影响因子依然被广泛应用于期刊评价和研究绩效评价。正像匈牙利学者Brody所说的那样,影响因子并不完美,但依然无法替代。澳大利亚学者Bradshaw等也指出:无论你喜欢还是厌恶,用文献计量学指标评价学术期刊及相关研究绩效它就在那里;无论正确与否,学术组织评价申请人业绩、学者选择期刊投稿、学术期刊选择出版公司合作它都无所不在。正因如此,许多学术期刊的主编和编辑热衷于人为操纵期刊的影响因子。希腊学者Falagas总结了人为操纵影响因子的10大行为,国内学者徐海丽、郑毅、鞠秀芳等也对人为操作期刊影响因子的现象进行了研究。强制作者引用某期刊、小集团(甚至组成期刊联盟)内部期刊互引成为学术期刊界的潜规则,抑或是公开的秘密。因此,如何从期刊的文献计量学指标识别可能的人为操纵就显得尤为重要,让人为操纵影响因子的行为无可遁形,以进一步加强期刊内涵建设、规范办刊行为。马峥近期撰文,明确提出了通过计量指标分析发现操纵期刊评价结果的行为。他主要论证了通过期刊自引、他引的统计分析,揭示期刊过度自引、集团互引现象。目前,国内外研究主要集中在对人为操纵行为的揭示和理论分析、通过对期刊自引率的研究判断期刊的人为操纵等方面,很少涉及其他指标在识别期刊影响因子和被引频次人为操纵中的作用。本研究将对自引率、扩散因子、被引半衰期、开放因子、互引指数等文献计量学指标在识别期刊影响因子人为操纵行为中的作用进行详细分析。
1自引率与影响因子人为操纵的识别
1.1自引率的分类
期刊自引率是指期刊总被引频次中自引次数所占的百分比。根据自引率适用对象的不同,我们将自引率分为2类,一是总被引频次中自引所占的百分比(self-citedratefortotalcites,RSC,TC),二是计算影响因子的分子中自引所占的百分比(self-citedrateforimpactfactor,RSC,IF)。学术界普遍关注的是RSC,TC,对RSC,IF研究较少。《中国科技期刊引证报告(核心版)》中的是RSC,TC,清华同方的《中国学术期刊影响因子年报》中给出了他引影响因子,未给出RSC,TC。根据影响因子和他引影响因子可以计算出RSC,IF。2015年新版《JCR》(InCitesJCR)里新增的3个指标中就包括他引影响因子,这样就能很方便地计算自引和他引对期刊影响因子的贡献度以及RSC,IF。
1.2自引率在影响因子人为操纵识别中的应用
影响因子是指某期刊前2年发表的所有文献在统计当年的被引频次与该刊前2年发表的可被引文献数量之比。显然,提高影响因子最根本的方法是增加期刊前2年发表的论文在统计当年的被引频次。其他期刊是否引用自家期刊不易控制,期刊自引就成为提高影响因子最直接、最有效的手段;因为,在的全过程涉及3类行为主体,即主编(编辑)、审稿专家、作者,其中作者是弱势群体,主编(编辑)起决定性作用。主编(编辑)要求作者引用某期刊时,作者为了能够顺利在该刊,一般没有勇气也没有必要拒绝主编(编辑)提出的引用要求,尽管有时候可能仅仅是建议。过度的人为操纵必然导致期刊自引率过度升高。一般来讲,期刊自引率应小于20%,异常增高一定存在人为操作的可能。为了遏制期刊通过提高自引量人为操作影响因子的行为,美国汤森路透在1997年版的《期刊引证报告》(JournalCitationReports,JCR)里就加入了期刊总被引频次中的自引率(RSC,TC)和影响因子构成中的自引率(RSC,IF)。中国科学技术信息研究所在1999年出版的《中国科技期刊引证报告(核心版)》中专门增加了RSC,TC指标。国内消化病学领域某刊(英文版),曾经因为RSC,IF和RSC,TC过高一度被《JCR》剔除(2008年恢复),眼科学领域某中文期刊也曾因为RSC,TC过高一度被《中国科技期刊引证报告(核心版)》剔除。为了最大限度地发挥自引对影响因子的贡献,还不至于使自引率(实际上仅指RSC,TC)明显增加,部分办刊人开始强制或引导作者仅引用该刊前2年发表的论文作为参考文献,也就是马峥文中提到的“通过在影响因子时间窗口内外调节自引操纵指标的行为”。这种行为一定会导致RSC,TC小幅增加而RSC,IF过度增加。通常情况下,同一期刊的RSC,TC和RSC,IF应该大体相当,如果RSC,IF远远大于RSC,TC,则可高度怀疑该刊存在人为操作行为。
2扩散因子与影响因子人为操纵的识别
学术不端防范意识和能力培养方法
笔者初入期刊编辑部时,对学术不端行为的认识仅停留在学术不端检测系统的检测结果中,直到看到大量中国学者稿件被撤的消息,听到朱邦芬院士掷地有声地说“科研失去诚信,亡科学亡天下,维护科研诚信,科技期刊编辑义不容辞”,才发现学术不端行为竟如此多样,惊叹自身对学术不端行为及其危害认知浅薄之际,有意加强了对学术不端行为表现和防范措施的学习。回顾个人一步步了解学术不端行为并应用到工作中的经历,笔者认为可以从以下4个方面培养并增强科技期刊编辑防范学术不端行为的意识和能力。
1入职培训,树立意识
学术不端行为不但破坏正常的科研出版活动,而且造成人力资源和社会资源的浪费,扼杀科研创新活力。如果等着靠编辑新人自己突然发现学术不端行为再开始防范就为时已晚。防范意识通过一次培训即可建立,因此,对新入职的编辑进行系统的学术不端行为认知培训是树立防范意识的极佳时机,也是不可或缺的关键环节。期刊编辑部有必要帮助他们在工作起步时就树立防范学术不端行为意识。
2定期宣传,强化意识
期刊应定期宣传学术不端行为的危害性,以防止编辑因职业倦怠而放松警惕,否则,懈怠稿件初审工作,就会使信息审查变成一种形式。不断强调编辑防范学术不端工作对科研出版活动秩序、科研进展、国家的富强乃至人类生存具有重要意义。积极引导、鼓舞编辑不应因工作只是“为人作嫁”而自苦。期刊应发挥宣传工作的核心价值,充分激发编辑的职业使命感,以促使编辑从被动工作到积极主动去研究学术不端,寻找对策,进而达到强化编辑防范学术不端意识的目的。
3注重传承,提高能力
期刊应重视期刊人应对学术不端的经验,归纳前人遇到的各种学术不端现象,组织编辑系统学习学术不端的特征、识别方法和应对策略,共同探讨,出谋划策,取精华弃糟粕,不断传承下去,以指导期刊编辑的工作。跟进国际出版伦理委员会(COPE)对出版问题的信息更新,不断研究学术不端新现象和防范对策,掌握应对变种学术不端行为先机,化被动为主动。要注重编辑专业知识的积累,鼓励编辑多参加学术会议、跟进学术进展、广泛阅读学术论文,提升对学术论文的判断能力,才能在排除学术不端行为中走得更远。期刊编辑部还可以适时分离科学编辑与技术编辑的工作内容,让科学编辑有更充足的时间审查稿件,履行防范学术不端的职责。
科技期刊编辑部的学术不端行为
近年来,国内外科研造假事件频发,如何打击学术造假、维护科研诚信成为学术界、编辑学界非常关注的问题。2018年5月,中共中央办公厅、国务院办公厅印发了《关于进一步加强科研诚信建设的若干意见》,明确要求教育、医疗、学术期刊出版等单位完善内控制度,加强科研诚信建设。本研究通过对30多家学术期刊编辑部进行问卷调查、座谈等形式,对出现较频繁、较隐蔽的学术不端的新花招和编辑部新对策进行总结归纳,现报道如下。
1基金文件造假
本研究涉及的各家编辑部均表示,近年来基金文件造假的比例有所上升,造假形式为:(1)伪造基金申请文件、基金批复件。(2)挂靠他人相符或不相符课题。(3)单位协助证明虚假立项课题。究其原因,在于在对期刊进行评价、考核的过程中,基金文章占比是一个重要的指标,故很多期刊编辑部对基金文章会优先考虑录用。对期刊的评价考核参考基金论文比重,固然有一定的道理,因为科研项目能通过立项,其创新性、科学性、实用性等是经过了一番论证的。而投稿作者利用这一审稿规律,为提高论文录用的可能性,不管自己是不是基金文章,都挂上基金的头衔,甚至出现伪造基金文件等学术不端行为。而作者所在单位一味为了刊发论文数量,也不顾事实,帮助造假。编辑部应加大基金文件真实性的审核和甄别,一般规范的基金项目申报书应有项目基本信息,包含立项依据、项目情况、计划安排、经费预算、项目组负责人、成员基本信息,申报书末尾还应有申报单位签章、主管部门审核意见及盖章。很多作者伪造的基金申报书仅为基金申报书的封面,仅有申报单位的盖章,且上传的电子版申报书单位盖章亦为photoshop软件所做。其次,编辑可以在相应的基金批复单位对基金项目进行查询,如国家自然科学基金即可在国家自然科学基金委员会官网结果公布、项目查询中进行查询。目前部分省级、市级、县级科研项目尚无法在网上进行相应查询,希望后期科研管理部门能加强科研项目的查询和公示工作。编辑在处理这类文章时,如基金属实,作者是可以登录科研管理网上系统的,可向其索要相关截图对基金真实性进行核实。与此同时,编辑部对基金文章的取舍,也应严格按照文章质量。优质文章优先录用,而不是基金文章优先录用,以此打破作者对基金文件造假的学术不端行为。
2数据造假
数据是科学研究的核心,也是学术论文的核心,是作者论点成立与否的基础,但试验并从中搜集整理数据也是一个极其繁重的工作,故有的作者通过编造、篡改、抄袭数据企图蒙混过关。但惮于数据库系统,作者在编造、抄袭时有使用了一些小的“花招”,需要编辑擦亮眼睛仔细分辨。刘胜利等[1]将数据造假分类归纳为三类:(1)故意采用必然产生误导性数据的研究方法/方案;(2)伪造、篡改和歪曲试验记录的数据;(3)研究数据的虚假呈现和运用。综合各编辑部在实际工作中遇到的情况,数据造假类的稿件还有以下特点:(1)多为对计数资料的描述和比较,因对计量资料的正常和异常范围是更为专业,编造起来更为麻烦,容易露出马脚。而计数资料多为率的比较,编造数据更为容易。笔者所在编辑部就曾收到过关于盆底功能障碍疾病治疗的相关文章,文章内只对治愈率进行了比较,编辑对作者提出要补充计量资料的要求,作者就再未返回。发现此类造假尚较为容易。(2)参考已发表相关论文的数据,进行数据编造。此类数据编造是“有理有据”的编造,在识别时更为困难。为使数据合理,有的作者在数据编造时,在已发表文章数据的基础上进行小的改动,数据库系统也不易发现。(3)对数据表述方式进行改变的抄袭,如已发表文章数据为表格的,抄袭文章内用文字描述,或利用他人的数据制作成柱状图、饼图等。数据库系统对这类抄袭也无能为力。那么编辑部如何寻找分辨出这些新型的更加隐蔽的抄袭的“蛛丝马迹”呢,建议为:(1)不能过度依赖数据库系统。在之后,应比对类似文献,对文章数据存疑时要求作者提供原始数据。(2)利用统计方法与规律发现论文数据造假。刘青海[2]提出,可以用excel对统计结果进行验证,同时利用“其他变量固定时,随着统计检验量绝对值的增加,P值相应变小”等统计学规律,发现论文数据造假的痕迹。(3)成立专门的数据编委会对数据进行审核。《科学》杂志为了应对逐渐增多的数据造假,在原有审稿规则的基础上,加入了专业统计学家对论文数据审核这一环节。2013年,杂志还正式公布了第一批数据标准清单,供投稿者和研究者与自己的研究数据进行对照,以追踪数据偏差的根源和进行可重复性验证[3]。如果编辑部囿于实际情况的限制,无法设立专门的数据编委会,也应加强对编辑统计学基础知识能力的培训,提升其数据审核方面的能力。
3图片造假、抄袭
图片造假、抄袭也是一种数据造假,但由于其特殊性,故本文将其单列出来进行讨论。随着数据库系统的使用,单纯的文字抄袭能得到较好的识别。但国内的不端文献检测系统大多是将图片自动剔除后进行的,故图片造假、抄袭成为近年来论文造假的重灾区。叶青等[4]将图片学术不端行为分为3类:图片伪造、图片篡改、图片剽窃。因目前图片处理软件非常多,且使用方便快捷,作者将图像进行调色、饱和度改变、裁剪、拼接等操作后,编辑仅靠肉眼是很难进行真实性判断的。针对这一类较为隐蔽的图片学术不端行为,编辑部可以从以下方向进行应对:(1)注意图片像素:剽窃他人的图片一般为下载、在论文中截取、重新拍摄、扫描等方式获得,图片像素不高,可向作者索要原始图片。(2)查看图片的文件属性:余菁等[5]通过使用MagicEXIF软件查看图片EXIF信息,“XMP数据”和“Pho-toshop资源”,发现如果是小的改动一般也要几千到一万字节,从而鉴别是否进行了图片篡改。(3)注意对图片的文字描述的:作者为了应对同行评议,在图片抄袭时往往使用类似文章中的图片,编辑可查找对图片进行文字描述类似的文章原文,再进行图片比对。(4)利用数据库中的图片库:通过在学术图片库中进行关键词检索,对类似图片进行比对。此外,除了从编辑部内对图片学术不端进行控制,还应加强专家外审与主编复审阶段的图片审核。专家和主编在本行业和专业领域中,见多识广,对图片真实性存疑的稿件,编辑应和专家多沟通,征求他们的意见。徐晶等[6]还提出,在出版后,数据库应对图片加密,使他人不得从下载的pdf或caj文档上拷贝图片,以防止图片抄袭。
学术期刊的数字化传播
人工智能(ArtificialIntelligence)是研究、开发用于模拟、延伸和扩展人的智能行为的综合性学科[1]。人工智能正在改变数字媒介,为学术期刊的数字化传播带来新的知识谱系和更富个性化的内容,并使得跨平台共享成为可能,其优势主要是信息与受众间围绕信息内涵和外延的交互性增强。人工智能技术有助于解决中国学术期刊在传播过程中普遍存在的受众定位不清、传播形式缺乏吸引力、与受众互动不足、用户黏性和活跃度较低等问题。学界对人工智能技术在学术期刊传播中的应用已有初步探讨。主流的研究视角是概述性地讨论人工智能在期刊传播中的作用,例如:刘闯[2]指出人工智能可以积极分析用户需求,通过对用户静态/动态属性的分析构建知识图谱,从而优化用户浏览效果;陈鸿等[3]指出人工智能对期刊发展可起到政治支持、技术支持、观念支持和行为支持的作用;向飒[4]指出人工智能可加速学术出版的流程再造,实现选题策划便捷化、生产印刷按需化、营销发行精准化和知识服务智能化等愿景。部分学者分析了人工智能在期刊传播中的应用困境,如范军等[5]和刘平等[6]认为阻碍人工智能与出版业融合的关键因素有弱智能限制出版自动化、专业出版人才建设乏力、版权和责任风险大、生产方式触及伦理法律边界。还有学者分析了人工智能时代期刊传播的发展趋势,如张耀铭[7]指出建设国家级数字化学术传播平台是学术期刊传播转型的关键进路。海外学者的研究以2010年为界,此前的研究聚焦于知识管理和专家系统,以对基础理论和概念的探讨为主,此后更多关注集群优化算法。在人工智能领域论文的数量上,美国是主力军,中国位居第二,印度和欧洲国家紧跟其后[8],全球人工智能研究排名前10的国家占该领域全球出版份额的74.32%[9]。Wade等[10]指出通过人机交互所发现的用户意图,能让学术服务商更深入地了解研究人员在寻找什么;学术出版商可使用学术知识API(AcademicKnowledgeAPIs)来理解学术用户搜索的内容,并从微软学术图(MicrosoftAcademicGraph)软件中发掘更多相关信息。他们同时指出,由于技术过于复杂且灵活性不足,语义Web方法(SemanticWebapproach)发展缓慢。总体来看,学界对人工智能在学术期刊传播中的应用已从理论和实践方面展开了探讨,但仍存在以下不足:(1)大部分研究是概述性地讨论人工智能对出版业态整体的影响,而专门探讨人工智能应用于学术期刊传播的研究很欠缺;(2)在少有的探讨人工智能与学术期刊传播融合的研究中,鲜有学者提出流程如何嵌合、平台如何运行的系统性设想;(3)几乎没有学者结合我国的具体案例,剖析人工智能在学术期刊传播中应用的难点和对策。本研究基于人工智能在出版业应用的现状,解析人工智能在中国学术期刊传播中应用的优势和存在的问题,勾勒基于人工智能技术的中国学术期刊传播平台,并结合方正出版大数据平台,探讨本研究设想的平台的创新性、可能遇到的瓶颈和对策,以期填补当前学界同类研究较少的空缺。
1人工智能应用于学术期刊传播的现状与问题
学术期刊的数字化传播能掌握受众特征,将传播主体与受众匹配,增强传播效果。当前,中国学术期刊传播中需解决的关键问题即提升传播效果。
1.1人工智能在学术期刊传播中应用的现状
在学术期刊出版领域,人工智能已开始发挥重要作用,主要表现在4个方面。(1)辨别洗稿式论文抄袭。例如,对于形容词替换、语序调换等修改语句类的抄袭,可利用自然语言处理技术(NaturalLanguageProcessing)识别近义词,并基于时间递归神经网络技术(LongShort-TermMemory)的记忆特征,识别被改动的语句结构。(2)发掘学术资源和潜在审稿专家。如,美国非盈利机构泰德(TED)旗下的话题分析工具彩虹人工智能(iRis.AI),通过对用户输入的语段或论文摘要进行机器学习(MachineLearning),从中提取包含语义背景的关键词,并基于此为用户推荐与被检索话题高度相关的资讯和论文。(3)辨别论文数据的可信度,辅助编辑制订用稿决策。如,通过扫描论文的关键信息点(实验环境、统计方法等),甄别数据篡改的可能。(4)通过算法自动向潜在读者推送学术资源。如,国际学术出版推广工具趋势(TrendMD)能实现论文跨平台自动推荐,不仅增强了期刊的显示度,还能精准定位目标读者群,已被爱思唯尔(Elsevier)、电气和电子工程师协会(InstituteofElectricalandElectronicsEngineers,IEEE)等采用。具体到学术期刊传播流程,许多国际出版集团已实现与人工智能技术的融合。如,施普林格-自然(SpringerNature)的关联开放数据平台科研图谱(SciGraph)借助NPG本体(NPGOntologies)进行语义建模,通过数据融合、知识发现、内容计算和语义图形数据集,提升论文在传播过程中的可获得性,为编辑、学者、会议组织者提供知识服务和数据工具[11];爱思唯尔收购了伯克利电子出版社(Bepress)的标志性产品———基于云的机构存储库平台数字共享(DigitalCommons),该平台具备提供存储库、元数据结构、访问接口和跨机构聚合与发现等功能,有助于爱思唯尔掌握更多论文引证、论文传播效果方面的数据[12]。部分中国出版商也已运用人工智能技术提升学术期刊的传播效果。如,世纪超星公司推出的域出版平台,它具备学术期刊数据库搭建、移动出版、社交共享等功能,能通过智能画像了解用户特征,用算法实现动态精准推送,通过智能社交增强用户间的联系[13]。
1.2人工智能在学术期刊传播中应用的优势
实现论文呈现多媒体化,优化内容分发,增强传播效果。一方面,学术期刊可通过智能语音和知识图谱技术,用适配多种设备的方式对论文进行再加工,增强论文的可读性,为论文增添音频和视频传播形式;另一方面,采用人工智能技术对用户研究领域、教育背景、阅读喜好、阅读完成度进行分析,可优化内容聚合和分发机制,解决信息过载与用户个性化需求间的矛盾。如,数据搜集公司图谱(Graphiq)已开发出语义搜索引擎知识图谱(KnowledgeGraph),它允许用户根据话题展开搜索,获得相关主题的数据集,还能生成与报道内容匹配的可视化图表[14]。辨别读者观点,评价和反馈传播效果。一方面,采用人工智能技术对用户阅读时长、用户社交分享等信息进行解析,可了解论文影响读者的具体方面和程度;另一方面,通过自然语言理解(NaturalLanguageUnderstanding)、语音识别、深度神经网络(DeepNeuralNetworks,DNN)等技术,学术期刊能从读者在社交媒体上对论文的评价中,辨别读者观点,掌握比论文浏览量、下载量和被引频次更精准的学术反响。如,威盛电子研发的人工智能平台“欧拉密”,其能实现对90%的语言的语义理解,从而实现提问、信息记忆、知识辅助理解和歧义消除等功能[15]。