专利检索子系统介绍

背景介绍:

        上海市知识产权信息工程是建立连接全市知识产权相关节点的计算机网络系统,通过建立知识产权信息基础数据库群和专题数据库群,开发高效率的知识产权检索工具,既为不同应用层次的用户提供知识产权信息服务,也将支撑和促进上海市知识产权服务行业以及企事业单位、科研机构充分利用知识产权信息,发展知识产权事业。

        上海市知识产权信息工程是一项涉及到上海备战世博会,提升综合竞争力的战略工程,是一项关系到上海全局,涉及到上海各阶层、各方面的系统工程,整个工程建设目标为:

        在完善知识产权信息采集、加工、整理、分析等系统建设的基础上,开发适合不同应用需求层面的知识产权信息数据库群,从根本上改善上海市知识产权信息利用滞后的状况,为上海科技创新与经济发展服务。

        在加大各类应用系统,工具开发的基础上,充分利用互联网信息集成技术、检索分析技术,将知识产权文献数据、非专利科技文献数据充分整合,利用先进的应用系统、工具、创建便捷的检索、分析和研究环境,为政府实施科技发展的重点研发活动、重大科技攻关项目等提供准确的知识产权情报和检索服务,为知识产权服务机构提供知识产权信息的增值服务,为企业、行业制定战略规划、保护技术成果、避免专利纠纷、了解同行业或者竞争对手在专利上的策略、跟踪国际国内技术发展趋势等活动提供信息获取渠道。

        在实现以上目标的基础上,实现上海市知识产权信息工作的跨越式发展,走在全国前列,形成上海特色,不断创新,加快与国际接轨的步伐,缩小和发达国家的差距。

        专利检索子系统做为整个信息系统的首期建设项目,目前功能开发和测试工作已经全部完成,已向企事业单位和社会公众全面开放。

        检索子系统做到了既能满足社会公众的专利查询检索需求,又能满足专业信息分析和加工利用人员的需求。面对社会公众它提供了一个界面友好、功能强大、操作简单的检索工具,面对专业人员提供了深度挖掘、构建检索式、在线分析、加工衍生数据库等功能。

        为使用户方便的从数据库中获取信息,提高专利信息的检索利用效率,检索子系统在数据库中加入了索引机制,建立各著录项目的索引,开发了灵活、多样、方便的大型数据库全文检索软件。整个检索子系统以检索结果准确、速度快、使用便捷为核心目标,主要的技术指标为查全率、查准率和响应时间。检索功能除现有专利检索系统中普遍应用的关键字检索、逻辑检索、二次检索外还包括了新开发的概念检索(同义词检索)、自动编制关键词、企业名称(申请人)关联检索,IPC(国际分类表)提示检索,检索结果实时生成企业专题数据库和企业个性化数据库等功能。下面对以上功能做一个简要的描述:

概念检索:

        这是本系统提高检索效率的一个亮点,以往的检索关键词是机械式的匹配,只要发现某个专利文献中有相应的关键词,就将该专利文献作为查询结果返给用户。由于参与匹配的是字符的外在形式,而不是它们所表达的概念,所以经常出现检索不全、答非所问的结果。而概念检索就是指当用户输入一个检索词后,检索工具不仅能检索出包含这个具体词汇的结果,还能检索出包含那些与该词汇同属一类概念的词汇的结果,如"自行车"这个概念,你可把它表述成"单车"、"脚踏车"、"Bicycle"。这样的结果就是突破了以往关键词局限于表面形式的缺陷,从词所表达的概念意义层次上来认识和处理用户的检索请求,从而提高了检索的查全率。

中英文双语检索 :

        在专利检索中往往需要同时查询中外专利数据,需要在各个数据库之间切换,为检索带来了不必要的麻烦。在后台中英文词表的支持下双语检索功能很好的解决了这一问题,当输入中文会自动翻译成英文在外国数据库中进行检索,输入英文会自动翻译成中文在中国数据库中进行检索。

自动编制关键词:

        在给定的一段文章中,运用概率论和信息论的模型匹配技术,即通过统计分析和数据挖掘等技术理解文章的核心概念及概念间的关系,进行上下文分析和概念抽取,自动编制形成有关该段文章所述核心技术的一组关键词,并将这些关键词推荐给用户用以检索。在检索中查询关键词的质量是影响搜索效果的最重要的因素之一,这样的关键词推荐技术可以通过向用户提供高质量的查询词,帮助用户缩小查询范围,提高搜索结果的查准率。

科技文献网上关联检索 :

        为了实现除专利外其它科技文献的查询,本系统加入了网上科技文献的关联检索功能。此功能主要利用在专利数据库中输入的检索式作为检索条件在互联网上查询相关的科技文献。关联检索功能为检索人员提供了更为广泛的参考资料,有利于提高检索质量。

企业名称关联检索:

        在专利检索中,对专利权人的检索经常难于查全,这是由于数据库内对同一专利权人称呼非常不规范,会出现许多不同的名称叫法,如果我们仅用其中的某一个或某几个名称检索,而不知道或忽略了一些其他的叫法,就会产生漏检。企业名称关联检索就是建立公司名称标准化词表,将同一公司的不同叫法,或者一个公司和他的子公司及其他关联公司作为一个检索项目一起检出结果,可以有效解决因一个企业多个名称(尤其是有多个中文译名的外国企业)而造成的漏检问题,该功能也是我们在了解企业需求的基础加入的,目前在类似系统中尚未发行应用。

IPC(国际分类表)提示检索 :

        IPC(国际分类表)是进行的专利文献检索时的一种有效检索工具,而大量技术人员对其并不熟悉,不能有效的利用IPC分类进行检索,导致检索的准确性和效率不高。IPC(国际分类表)提示,是在输入关键词进行检索的同时,提示用户与该关键词相关的专利所处的IPC分类,便于用户运用IPC分类进行进一步检索,提高检索的效率降低检索门槛。

创建企业专题数据库和企业深加工专题数据库:

        用户对专利数据的检索往往不是一次性的,而是一个长期跟踪的过程,用户可自定义检索式进行检索,并可将该检索结果在线实时生成特定的数据库。企业专题数据库以导航的形式呈现给用户,导航可以建立多级。当再次进入系统时可不用重复查询并且可以在专题数据库的范围内进行检索。该数据库还根据用户的检索式对新公开的专利文献进行跟踪,并及时发出警示和提醒。

        企业深加工专题数据库存放在后台的关系数据库中,用户可以基于检索结果在线实时生成个性化数据库,并可对其中的数据进行管理,包括增加、删除、修改、标引等操作。用户也可以把检索得到的某条或者多条数据增量保存到深加工专题数据库中,并可对个性化数据库进行二次检索。该应用将大大方便中小企业的应用成本,利用信息平台,建立属于自己的个性化数据库,还可以结合企业的知识管理系统,实现知识共享。

        一个好的专利检索系统除了拥有功能强大的检索引擎外更离不开数据全、质量高的专利信息资源,它是检索系统服务质量和水平的基础。为此我们搜集了总共78个国家、国际组织和地区的专利文摘数据和中国的tiff,xml格式的全文数据,并通过网上信息采集功能搜集来自网络的免费专利信息资源。通过数据整理、校验、去重后建立一个数据全、质量高、格式统一的专利信息数据库群,为检索子系统提供强有力的信息支撑。