烟草业专利数据库建构

烟草业专利数据库建构

 

一、烟草行业专利数据库建设的意义及作用   专利信息汇聚着全人类智慧成果,据WIPO(WorldIntellectualPropertyOrganization世界知识产权组织)统计表明[1],世界上每年发明创造成果的90%-95%能在专利文献中检索到,而且有70%的技术内容未在其它非专利文献中发表过,若能运用好专利文献,能节约40%的科研开发费用,同时少花60%的研究开发时间。专利信息不仅包含技术信息,还包含法律信息和经济情报[2]。每个企业的核心技术和开发项目基本都会反映在专利上,因此通过分析竞争对手的最新专利,可以洞悉竞争对手的技术研发动态、市场开发以及专利战略,甚至了解整个企业的运营战略。随着信息技术的发展,专利信息应用也从最初的手工时代步入互联网时代。目前网络上不乏优秀的专利数据库,如欧洲专利局的EP专利数据库(ep.espacenet.com/),该数据库包含世界上七十多个国家和地区以及欧洲专利局、世界知识产权组织公开的专利[3]。但此类专利数据库面向各个技术领域的用户,包括所有行业的专利,所以专利检索结果不可避免地出现大量不相关专利。另外,这些专利数据库覆盖范围虽广但未包括所有国家的专利数据,用户若需检索不同国家的专利,往往需要到多个数据库分别检索。烟草行业专利数据库包含的绝大部分专利是烟草相关技术的专利。该专利数据库综合了世界主要国家和地区的专利,解决了客户针对不同国家的专利需到不同专利数据库检索的问题,降低了专利检索的专业要求,使得专利检索更加便捷。该数据库可根据使用者的需求定制,既使用者关注的技术主题和重点企业的专利。用户在这个数据库中检索,可排除杂质专利的干扰,提高检索效率。此外,烟草行业专利数据库还设置了其它功能,如针对国外专利可翻译专利标题,专利摘要,专利权利要求书;在检索过程中,不但可以查看专利细节,还可分析专利结果的整体情况,利用分析结果对检索式做进一步调整,得到更准确的检索结果。   二、烟草行业专利数据库的建设思路与流程   (一)建设思路   专利数据库的建设目的是帮助用户提高工作效率,解决实际问题,因此衡量专利数据库的最优标准是使用率。建立烟草专利数据库必须以用户的需求为出发点,了解用户的特征和具体需求。烟草行业专利数据库的建设思路是根据烟草行业的特点,以用户的需求为基本出发点,以现有的专利数据库为数据源。   烟草专利数据库的建设包含以下三个阶段(见图1):⒈确立烟草相关技术主题,以及各技术主题所包含的技术范围;⒉确定检索式,建立相应的技术平台完成烟草专利数据的提取;⒊以已经确定好的技术主题为单元,根据第二阶段提取的数据建立专利数据库,添加检索的功能模块。烟草行业专利数据库由分布在不同部门各类技术人员使用。因此,在专利数据库的建设中,要选择便于部署、管理和维护的构架方式。烟草行业专利数据库采用基于互联网的构架(B/S构架,Browser/Server构架),用户不需要部署客户端软件,通过网页浏览器(如InternetExplorer、Firefox、Chrome等)即可访问专利数据库。专利数据库进行软件版本升级,专利数据进行更新,直接在服务器端完成,实现平滑升级更新和集中管理。   (二)建设流程   ⒈确立技术主题   通过文献调研、调查问卷结合专家咨询等方式,拟订了烟草专题数据库包含的技术主题,这些技术主题不仅涵盖了行业的整个生产链,还聚焦了当今烟草行业的热点技术(见图2)。   ⒉提取专利数据   数据提取是一个从各行各业的专利数据库中筛选烟草行业的专利的过程,称为ETL(Extraction-Transformation-Loading),即数据的抽取、转换和加载。这一过程对于分布在异构数据源中的专利数据进行抽取,并经过整理和转换,最终加载到数据仓库中,作为下一步建立不同专题专利数据库的基础。专利信息是分散的,各国的知识产权数据为各国所有并在所有国的知识产权管理部门公开,查询不同国家的专利,需要登陆相应国家的网站,进入不同的检索页面,采用不同的检索策略,而检索获得的,也是按国家不同的检索结果。因此,获取不同来源的专利数据,并进行转换和加工,是建立烟草专利数据库的基础。   针对世界主要知识产权数据库,烟草行业专利数据库开发了一套分布式的自动化搜索和下载工具,并且针对不同的数据编写了不同的转换器,能够定时从世界主要国家的专利数据库中提取我们所需的烟草相关的专利数据,并对这些数据进行整合,保存在数据库服务器中,从而实现了专利的自动更新运转(见图3)。在数据仓库中,为每一个专利设置了统一的数据字段。由于专利信息包含了技术、法律、经济等诸多信息,在专利数据字段定义时充分考虑了这一特点。对专利信息进行统一规范的定义,可以保证其检索的准确性,从而保证后续专利分析结果的准确性。字段名称的定义以专利信息行业通用称谓的缩写定义。   专利的标题、摘要和权利要求书体现的是技术信息,是重要的专利检索要素之一,专利文献当中的技术专业词基本分布在标题,摘要和权利要求书中。在专利文献中,代表同一意思的技术关键词往往有多个,这里称之为技术同义词。在检索过程中,漏掉一个技术同义词的后果可能是漏检一大批关键性专利,因此技术同义词是一项重要的工作。技术同义词形成的原因很多,如发明人技术用词习惯、专利人的撰写习惯、不同的外文翻译等[4]。收集技术同义词必须综合多方面的信息。国际专利分类也体现了技术信息,是各国对专利进行分类的通用标准。在烟草专利数据库的建设中,为了保证数据库的准确性,必须涵盖IPC分类。   专利法律状态体现的是专利的法律信息,代表专利权的权属情况,是技术借鉴和侵权规避的重要指标,因此必须提取。专利的申请人信息是专利经济信息的一个重要体现。专利申请人也是专利数据库建设的要素之一,是企业结合市场竞争情报综合得到的。实力雄厚的行业巨头往往是一个行业各项技术的开创者,而且它们非常注重知识产权的保护,因此它们的专利代表各项技术的发展方向。从这些企业当前申请的专利信息中,可以挖掘出主要的技术路线,当前技术动向,关注的市场区域等情报。需要注意的是,企业在专利申请的时候所采用的名称可能多种多样,同时,由于行业内经常发生公司的收购兼并重组等情况,使得专利所有人的情况多变,故而需要充分了解主要申请人的情况,以获取全面的专利情况。#p#分页标题#e#   ⒊形成专利数据库   在数据提取的基础上建立各技术主题的专题数据库,并在专利数据库平台上设置方便用户查找专利信息的功能模块。这里所应用的主要技术之一是专利数据的海量检索系统。为了保证检索的速度,烟草行业专利数据库采用了分词技术,并利用计算机集群系统,进行专利数据的海量检索,因而能提高检索的速度和准确性。   三、烟草行业专利数据库功能模块的应用   根据烟草行业的特点以及使用者的具体需求和特征,烟草行业专利数据库的功能模块构成(见图4)包括三大块功能:专利检索、专利监控、专利分析。这三大功能相辅相成,比如在进行专利检索的同时巧妙地运用专利分析可以让检索工作事半功倍。   (一)专利检索   专利检索是烟草行业专利数据库的首要功能,是提高使用率的关键。烟草专利数据库的数据覆盖面广,包含世界主要国家的专利,用户在此数据库中检索可得到较准确的结果。为了让用户检索专利更加灵活和快捷以及适应用户多元化的特点,烟草行业专利数据库提供高级检索和表格检索。高级检索功能强大,可以多个检索要素综合得到的检索式。相比高级检索,表格检索相对较为直观简便,更加适合不经常做专利检索的人使用。烟草数据库中设置了一个记载检索记录的功能,即检索历史。使用者可以对检索历史中的检索记录重新检索,而不必对相同主题重复检索。检索历史还设置了查找的功能,在检索记录过多时,可以在检索历史中搜索检索记录。为了使数据库使用者方便地查看专利信息,烟草数据库平还提供了一系列查看专利的功能。数据库还提供了全文下载功能,经测试,比其他专利数据库快速、简便。   专利文献是包含技术信息的法律文件,从标题到全文都必须符合专利法的相关规定,文件格式和表达方式与其他出版物公开的技术文献有一定的区别。主图视图功能(见图5)帮助使用者在筛选专利的时候快速的理解专利,判断该专利的相关性。专利是申请人用公开换取技术保护的方式,申请专利的最终目的是获取专利权。因此专利法律状态即专利权的权属状态是专利的重要信息之一。烟草专利数据库创造性地用一种直观方式显示法律状态信息—颜色标签,即用专利标题的颜色表示专利的法律状态。红色标题表示该专利已经授权并且目前专利权仍然有效;棕色标题表示该专利已经授权,但是部分专利权被无效;灰色标题代表该专利被撤回,驳回或者无效;绿色标题代表该专利里公开但是并未获得授权,目前权属状态不明朗。数据库的翻译功能主要针对国外专利设置,实现在专利结果列表中翻译专利标题,在专利著录项目页内翻译专利标题、摘要和权利要求书,有效地解决了语言障碍的问题。关注功能是为了给数据库使用者在浏览专利的过程中,对需要关注的专利做记号。标签是关注的升级功能,它不仅可以将需要关注的专利存挡,还能对存档的专利进行整理分类。   (二)专利监控   专利监控是指将重点关注的技术主题建成监控模块,它不但为数据库使用者免去了重点技术主题检索的工作,而且还可以适时监控技术主题的最新专利申请动态。烟草专利数据库设置多种形式的监控模块,如文本监控、图形监控等。烟草专利数据库将相关的15个技术主题做成了监控模块。例如,技术主题是烟草育种国外专利的文本监控(见图6),最近申请的专利显示在前几条,点击图中的“显示模式”可查看所有烟草育种英文专利,点击图中专利标题右边的小图标可依次查看该专利的全文、保存专利、查看专利法律状态和该专利的同族专利;技术主题是烟草育种国外专利的图形监控(见图7),该图表示除中国以外的其它国家根据烟草育种专利数量的排名,在此图中点击相应的区域,可具体查看相应国家的专利,如点击图中红色区域便可查看日本的231件专利。监控模块可以用模块树功能根据模块的内在关系整理成树状结构,并将模块树放到侧边栏中,数据库根据烟草技术框架构建的技术监控模块树。数据库除了可以对技术主题建立专利监控模块树之外,还建立了重点企业专利监控模块树。   (三)专利分析   目前大部分的专利数据库一般都只提供检索的功能,即只能一件一件查看专利的细节而没有对专利结果整体分析的功能。为解决这一问题,烟草行业专利数据库设置了专利分析的功能,可以用统计图表和上文提到的图形监控进行分析。例如,烟草育种国外专利的公开趋势分析(见图8),在该图中点击相应的年份可得到该年公开的专利。数据库使用者在检索专利的同时,还能分析检索结果,结合分析图表修正检索策略。