SCI期刊 | 网站地图 周一至周日 8:00-22:30
你的位置:首页 >  行业经济 » 正文

烟草业专利数据库建构

2021-4-9 | 行业经济

 

一、烟草行业专利数据库建设的意义及作用

 

专利信息汇聚着全人类智慧成果,据WIPO(WorldIntellectualPropertyOrganization世界知识产权组织)统计表明[1],世界上每年发明创造成果的90%-95%能在专利文献中检索到,而且有70%的技术内容未在其它非专利文献中发表过,若能运用好专利文献,能节约40%的科研开发费用,同时少花60%的研究开发时间。专利信息不仅包含技术信息,还包含法律信息和经济情报[2]。每个企业的核心技术和开发项目基本都会反映在专利上,因此通过分析竞争对手的最新专利,可以洞悉竞争对手的技术研发动态、市场开发以及专利战略,甚至了解整个企业的运营战略。随着信息技术的发展,专利信息应用也从最初的手工时代步入互联网时代。目前网络上不乏优秀的专利数据库,如欧洲专利局的EP专利数据库(http://ep.espacenet.com/),该数据库包含世界上七十多个国家和地区以及欧洲专利局、世界知识产权组织公开的专利[3]。但此类专利数据库面向各个技术领域的用户,包括所有行业的专利,所以专利检索结果不可避免地出现大量不相关专利。另外,这些专利数据库覆盖范围虽广但未包括所有国家的专利数据,用户若需检索不同国家的专利,往往需要到多个数据库分别检索。烟草行业专利数据库包含的绝大部分专利是烟草相关技术的专利。该专利数据库综合了世界主要国家和地区的专利,解决了客户针对不同国家的专利需到不同专利数据库检索的问题,降低了专利检索的专业要求,使得专利检索更加便捷。该数据库可根据使用者的需求定制,既使用者关注的技术主题和重点企业的专利。用户在这个数据库中检索,可排除杂质专利的干扰,提高检索效率。此外,烟草行业专利数据库还设置了其它功能,如针对国外专利可翻译专利标题,专利摘要,专利权利要求书;在检索过程中,不但可以查看专利细节,还可分析专利结果的整体情况,利用分析结果对检索式做进一步调整,得到更准确的检索结果。

 

二、烟草行业专利数据库的建设思路与流程

 

(一)建设思路

 

专利数据库的建设目的是帮助用户提高工作效率,解决实际问题,因此衡量专利数据库的最优标准是使用率。建立烟草专利数据库必须以用户的需求为出发点,了解用户的特征和具体需求。烟草行业专利数据库的建设思路是根据烟草行业的特点,以用户的需求为基本出发点,以现有的专利数据库为数据源。

 

烟草专利数据库的建设包含以下三个阶段(见图1):⒈确立烟草相关技术主题,以及各技术主题所包含的技术范围;⒉确定检索式,建立相应的技术平台完成烟草专利数据的提取;⒊以已经确定好的技术主题为单元,根据第二阶段提取的数据建立专利数据库,添加检索的功能模块。烟草行业专利数据库由分布在不同部门各类技术人员使用。因此,在专利数据库的建设中,要选择便于部署、管理和维护的构架方式。烟草行业专利数据库采用基于互联网的构架(B/S构架,Browser/Server构架),用户不需要部署客户端软件,通过网页浏览器(如InternetExplorer、Firefox、Chrome等)即可访问专利数据库。专利数据库进行软件版本升级,专利数据进行更新,直接在服务器端完成,实现平滑升级更新和集中管理。

 

(二)建设流程

 

⒈确立技术主题

 

通过文献调研、调查问卷结合专家咨询等方式,拟订了烟草专题数据库包含的技术主题,这些技术主题不仅涵盖了行业的整个生产链,还聚焦了当今烟草行业的热点技术(见图2)。

 

⒉提取专利数据

 

数据提取是一个从各行各业的专利数据库中筛选烟草行业的专利的过程,称为ETL(Extraction-Transformation-Loading),即数据的抽取、转换和加载。这一过程对于分布在异构数据源中的专利数据进行抽取,并经过整理和转换,最终加载到数据仓库中,作为下一步建立不同专题专利数据库的基础。专利信息是分散的,各国的知识产权数据为各国所有并在所有国的知识产权管理部门公开,查询不同国家的专利,需要登陆相应国家的网站,进入不同的检索页面,采用不同的检索策略,而检索获得的,也是按国家不同的检索结果。因此,获取不同来源的专利数据,并进行转换和加工,是建立烟草专利数据库的基础。

 

针对世界主要知识产权数据库,烟草行业专利数据库开发了一套分布式的自动化搜索和下载工具,并且针对不同的数据编写了不同的转换器,能够定时从世界主要国家的专利数据库中提取我们所需的烟草相关的专利数据,并对这些数据进行整合,保存在数据库服务器中,从而实现了专利的自动更新运转(见图3)。在数据仓库中,为每一个专利设置了统一的数据字段。由于专利信息包含了技术、法律、经济等诸多信息,在专利数据字段定义时充分考虑了这一特点。对专利信息进行统一规范的定义,可以保证其检索的准确性,从而保证后续专利分析结果的准确性。字段名称的定义以专利信息行业通用称谓的缩写定义。

 

专利的标题、摘要和权利要求书体现的是技术信息,是重要的专利检索要素之一,专利文献当中的技术专业词基本分布在标题,摘要和权利要求书中。在专利文献中,代表同一意思的技术关键词往往有多个,这里称之为技术同义词。在检索过程中,漏掉一个技术同义词的后果可能是漏检一大批关键性专利,因此技术同义词是一项重要的工作。技术同义词形成的原因很多,如发明人技术用词习惯、专利代理人的撰写习惯、不同的外文翻译等[4]。收集技术同义词必须综合多方面的信息。国际专利分类也体现了技术信息,是各国对专利进行分类的通用标准。在烟草专利数据库的建设中,为了保证数据库的准确性,必须涵盖IPC分类。

 

专利法律状态体现的是专利的法律信息,代表专利权的权属情况,是技术借鉴和侵权规避的重要指标,因此必须提取。专利的申请人信息是专利经济信息的一个重要体现。专利申请人也是专利数据库建设的要素之一,是企业结合市场竞争情报综合得到的。实力雄厚的行业巨头往往是一个行业各项技术的开创者,而且它们非常注重知识产权的保护,因此它们的专利代表各项技术的发展方向。从这些企业当前申请的专利信息中,可以挖掘出主要的技术路线,当前技术动向,关注的市场区域等情报。需要注意的是,企业在专利申请的时候所采用的名称可能多种多样,同时,由于行业内经常发生公司的收购兼并重组等情况,使得专利所有人的情况多变,故而需要充分了解主要申请人的情况,以获取全面的专利情况。

Top