专利检索方法和装置

阅读: 评论:0

著录项
  • CN201510159502.3
  • 20150403
  • CN106156114A
  • 20161123
  • 北京中献电子技术开发中心
  • 朱欣昱;程序;刘琦;郭瑛媚;孔文娟
  • G06F17/30
  • G06F17/30 G06F17/27

  • 北京市海淀区蓟门桥西土城路6号三段
  • 北京(11)
  • 北京康信知识产权代理有限责任公司
  • 吴贵明;张永明
摘要
本发明公开了一种专利检索方法和装置。其中,专利检索方法包括:接收用户的检索请求;确定检索请求中的第一核心词;根据第一核心词和目标信息表确定第一联想词,其中,目标信息表中存储有与第一核心词具有关联关系的联想词;根据第一核心词和第一联想词确定检索条件;根据检索条件检索专利文件。通过本发明,解决了现有技术中专利检索结果不准确的问题。
权利要求

1.一种专利检索方法,其特征在于,包括:

接收用户的检索请求;

确定所述检索请求中的第一核心词;

根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信息表 中存储有与所述第一核心词具有关联关系的联想词;

根据所述第一核心词和所述第一联想词确定检索条件;以及

根据所述检索条件检索专利文件。

2.根据权利要求1所述的专利检索方法,其特征在于,所述检索请求中包括待检索 内容,确定所述检索请求中的第一核心词包括:

对所述待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽 取,得到一个或者多个待检索要素;

接收选择指令;以及

根据所述选择指令确定一个或者多个所述待检索要素中的一个要素为所述第 一核心词。

3.根据权利要求1所述的专利检索方法,其特征在于,所述目标信息表包括第一信 息表、第二信息表和第三信息表中至少之一,在接收用户的检索请求之前,所述 专利检索方法还包括:

根据专利原始数据建立基本检索字段数据表,其中,所述专利原始数据由申 请状态为已公开的专利申请文件组成;

根据所述基本检索字段数据表中的关键词,建立所述第一信息表,其中,所 述第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的所述专利申请 文件的共同出现次数;

根据所述基本检索字段数据表中分类号和所述关键词,建立所述第二信息表, 其中,所述第二信息表中包含每个所述分类号对应的关键词在已公开的所述专利 申请文件中的共同出现次数;以及

根据所述基本检索字段数据表中申请人和所述关键词,建立所述第三信息表, 其中,所述第三信息表中包含每个所述申请人对应的关键词在已公开的所述专利 申请文件中的共同出现次数。

4.根据权利要求3所述的专利检索方法,其特征在于,在根据所述第一核心词和目 标信息表确定第一联想词之前,所述专利检索方法还包括:

判断所述第一核心词的类型,其中,所述第一核心词的类型为关键词型、申 请人型或分类号型;

其中,在判断出所述第一核心词的类型为关键词型的情况下,确定所述目标 信息表包括所述第一信息表、所述第二信息表和所述第三信息表;在判断出所述 第一核心词的类型为分类号型的情况下,确定所述目标信息表包括所述第二信息 表;在判断出所述第一核心词的类型为申请人型的情况下,确定所述目标信息表 包括所述第三信息表。

5.根据权利要求4所述的专利检索方法,其特征在于,所述第一核心词的类型为关 键词型时,所述第一联想词包括关键词型联想词、分类号型联想词和申请人型联 想词,根据所述第一核心词和目标信息表确定第一联想词包括:

根据所述第一核心词和所述第一信息表通过第一推荐模型公式 recommend1 word=get(max n1(fre(word,word')))确定所述关键词型联想词,其中, word为所述第一核心词,recommend1 word为所述第一推荐模型公式的名称,word' 为所述关键词型联想词,n1为预设确定所述关键词型联想词的个数, fre(word,word')为第一核心词word与关键词型联想词word'在所述第一信息表 中的共同出现次数,get(max n1(fre(word,word')))为在所述第一信息表中获取与所 述第一核心词word共同出现次数最多的n1个关键词型联想词;

根据所述第一核心词和所述第二信息表通过第二推荐模型公式 recommend2 word=get(max n2(fre(word,ipc)))确定所述分类号型联想词,其中,ipc 为所述分类号型联想词,recommend2 word为所述第二推荐模型公式的名称,n2为 预设确定所述分类号型联想词的个数,fre(word,ipc)为所述第一核心词word与分 类号型联想词ipc在所述第二信息表中的共同出现次数, get(max n2(fre(word,ipc)))为在所述第二信息表中获取与所述第一核心词word共 同出现次数最多的n2个分类号型联想词;以及

根据所述第一核心词和所述第三信息表通过第三推荐模型公式 recommend3 word=get(max n3(fre(word,appl)))确定所述申请人型联想词,其中, appl为所述申请人型联想词,recommend3 word为所述第三推荐模型公式的名称, n3为预设确定所述申请人型联想词的个数,fre(word,appl)为所述第一核心词 word与申请人型联想词appl在所述第三信息表中的共同出现次数, get(max n3(fre(word,appl)))为在所述第三信息表中获取与所述第一核心词word 共同出现次数最多的n3个申请人型联想词。

6.根据权利要求4所述的专利检索方法,其特征在于,所述第一核心词的类型为分 类号型时,所述第一联想词包括关键词型联想词,根据所述第一核心词和目标信 息表确定第一联想词包括:

根据所述第一核心词和所述第二信息表通过第四推荐模型公式 recommend ipc=get(max n4(fre(ipc,word)))确定所述关键词型联想词,其中, recommend ipc为所述第四推荐模型公式的名称,ipc为所述第一核心词,word为所 述关键词型联想词,n4为预设确定所述关键词型联想词的个数,fre(ipc,word)为 第一核心词ipc与关键词型联想词word在所述第二信息表中的共同出现次数, get(max n4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc共同 出现次数最多的n4个关键词型联想词。

7.根据权利要求4所述的专利检索方法,其特征在于,所述第一核心词的类型为申 请人型时,所述第一联想词包括关键词型联想词,根据所述第一核心词和目标信 息表确定第一联想词包括:

根据所述核心词和所述第三信息表通过第五推荐模型公式 recommend appl=get(max n5(fre(appl,word)))确定所述关键词型联想词,其中, recommend appl为所述第五推荐模型公式的名称,appl为所述第一核心词,word为 所述关键词型联想词,n5为预设确定所述关键词型联想词的个数,fre(appl,word) 为第一核心词appl与关键词型联想词word在所述第三信息中的共同出现次数, get(max n5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词appl共 同出现次数最多的n5个关键词型联想词。

8.根据权利要求1所述的专利检索方法,其特征在于,根据所述第一核心词和所述 第一联想词确定检索条件包括:

获取目标检索词的类型,其中,所述目标检索词为在词汇集合中已选定作为 检索元素的词,所述词汇集合为所述第一核心词和所述第一联想词组成的集合;

按照所述目标检索词的类型对所述目标检索词进行分类,得到不同的目标类 型;以及

将相同所述目标类型下所述目标检索词按照逻辑或的关系连接,并将不同所 述目标类型下所述目标检索词按照逻辑与的关系连接生成搜索条件。

9.根据权利要求1所述的专利检索方法,其特征在于,所述第一联想词为多个,在 根据所述第一核心词和目标信息表确定第一联想词之后,所述专利检索方法还包 括:

判断是否接收到联想指令,其中,所述联想指令为从多个所述第一联想词中 选择任一第一联想词的指令;

在判断出接收到所述联想指令的情况下,确定所述联想指令所选择的第一联 想词为第二核心词;以及

根据所述第二核心词和所述目标信息表确定与所述第二核心词具有关联关系 的第二联想词,其中,所述目标信息表中还存储有与所述第二核心词具有关联关 系的所述第二联想词;

其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述 第一核心词、所述第二核心词、所述第一联想词和所述第二联想词确定检索条件。

10.根据权利要求1所述的专利检索方法,其特征在于,在根据所述第一核心词和目 标信息表确定第一联想词之后,所述专利检索方法还包括:

接收更换指令;以及

按照所述更换指令重新确定所述第一联想词;

其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述 第一核心词和重新确定所述第一联想词确定检索条件。

11.一种专利检索装置,其特征在于,包括:

第一接收单元,用于接收用户的检索请求;

第一确定单元,用于确定所述检索请求中的第一核心词;

第二确定单元,用于根据所述第一核心词和目标信息表确定第一联想词,其 中,所述目标信息表中存储有与所述第一核心词具有关联关系的联想词;

第三确定单元,用于根据所述第一核心词和所述第一联想词确定检索条件; 以及

检索单元,用于根据所述检索条件检索专利文件。

12.根据权利要求11所述的专利检索装置,其特征在于,所述检索请求中包括待检索 内容,所述第一确定单元包括:

抽取模块,用于对所述待检索内容按照关键词型要素、申请人型要素和分类 号型要素进行抽取,得到一个或者多个待检索要素;

接收模块,用于接收选择指令;以及

第一确定模块,用于根据所述选择指令确定一个或者多个所述待检索要素中 的一个要素为所述第一核心词。

13.根据权利要求11所述的专利检索装置,其特征在于,所述目标信息表包括第一信 息表、第二信息表和第三信息表中至少之一,所述专利检索装置还包括:

第一建立单元,用于在接收用户的检索请求之前,根据专利原始数据建立基 本检索字段数据表,其中,所述专利原始数据由申请状态为已公开的专利申请文 件组成;

第二建立单元,用于根据所述基本检索字段数据表中的关键词,建立所述第 一信息表,其中,所述第一信息表中存储有任意两个组成共现矩阵的关键词在已 公开的所述专利申请文件的共同出现次数;

第三建立单元,用于根据所述基本检索字段数据表中分类号和所述关键词, 建立所述第二信息表,其中,所述第二信息表中包含每个所述分类号对应的关键 词在已公开的所述专利申请文件中的共同出现次数;以及

第四建立单元,用于根据所述基本检索字段数据表中申请人和所述关键词, 建立所述第三信息表,其中,所述第三信息表中包含每个所述申请人对应的关键 词在已公开的所述专利申请文件中的共同出现次数。

14.根据权利要求13所述的专利检索装置,其特征在于,所述专利检索装置还包括:

第一判断单元,用于在根据所述第一核心词和目标信息表确定第一联想词之 前,判断所述第一核心词的类型,其中,所述第一核心词的类型为关键词型、申 请人型或分类号型;

其中,在判断出所述第一核心词的类型为关键词型的情况下,确定所述目标 信息表包括所述第一信息表、所述第二信息表和所述第三信息表;在判断出所述 第一核心词的类型为分类号型的情况下,确定所述目标信息表包括所述第二信息 表;在判断出所述第一核心词的类型为申请人型的情况下,确定所述目标信息表 包括所述第三信息表。

15.根据权利要求14所述的专利检索装置,其特征在于,所述第一核心词的类型为关 键词型时,所述第一联想词包括关键词型联想词、分类号型联想词和申请人型联 想词,所述第二确定单元包括:

第二确定模块,用于根据所述第一核心词和所述第一信息表通过第一推荐模 型公式recommend1 word=get(max n1(fre(word,word')))确定所述关键词型联想词, 其中,word为所述第一核心词,recommend1 word为所述第一推荐模型公式的名称, word'为所述关键词型联想词,n1为预设确定所述关键词型联想词的个数, fre(word,word')为第一核心词word与关键词型联想词word'在所述第一信息表 中的共同出现次数,get(max n1(fre(word,word')))为在所述第一信息表中获取与所 述第一核心词word共同出现次数最多的n1个关键词型联想词;

第三确定模块,用于根据所述第一核心词和所述第二信息表通过第二推荐模 型公式recommend2 word=get(max n2(fre(word,ipc)))确定所述分类号型联想词,其 中,ipc为所述分类号型联想词,recommend2 word为所述第二推荐模型公式的名称, n2为预设确定所述分类号型联想词的个数,fre(word,ipc)为所述第一核心词word 与分类号型联想词ipc在所述第二信息表中的共同出现次数, get(max n2(fre(word,ipc)))为在所述第二信息表中获取与所述第一核心词word共 同出现次数最多的n2个分类号型联想词;以及

第四确定模块,用于根据所述第一核心词和所述第三信息表通过第三推荐模 型公式recommend3 word=get(max n3(fre(word,appl)))确定所述申请人型联想词,其 中,appl为所述申请人型联想词,recommend3 word为所述第三推荐模型公式的名 称,n3为预设确定所述申请人型联想词的个数,fre(word,appl)为所述第一核心 词word与申请人型联想词appl在所述第三信息表中的共同出现次数, get(max n3(fre(word,appl)))为在所述第三信息表中获取与所述第一核心词word 共同出现次数最多的n3个申请人型联想词。

16.根据权利要求14所述的专利检索装置,其特征在于,所述第一核心词的类型为分 类号型时,所述第一联想词包括关键词型联想词,所述第二确定单元包括:

第五确定模块,用于根据所述第一核心词和所述第二信息表通过第四推荐模 型公式recommend ipc=get(max n4(fre(ipc,word)))确定所述关键词型联想词, 其中,recommend ipc为所述第四推荐模型公式的名称,ipc为所述第一核心词,word 为所述关键词型联想词,n4为预设确定所述关键词型联想词的个数,fre(ipc,word) 为第一核心词ipc与关键词型联想词word在所述第二信息表中的共同出现次数, get(max n4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc共同 出现次数最多的n4个关键词型联想词。

17.根据权利要求14所述的专利检索装置,其特征在于,所述第一核心词的类型为申 请人型时,所述第一联想词包括关键词型联想词,所述第二确定单元包括:

第六确定模块,用于根据所述核心词和所述第三信息表通过第五推荐模型公 式recommend appl=get(max n5(fre(appl,word)))确定所述关键词型联想词,其中, recommend appl为所述第五推荐模型公式的名称,appl为所述第一核心词,word为 所述关键词型联想词,n5为预设确定所述关键词型联想词的个数,fre(appl,word) 为第一核心词appl与关键词型联想词word在所述第三信息中的共同出现次数, get(max n5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词appl共 同出现次数最多的n5个关键词型联想词。

18.根据权利要求11所述的专利检索装置,其特征在于,所述第三确定单元包括:

获取模块,用于获取目标检索词的类型,其中,所述目标检索词为在词汇集 合中已选定作为检索元素的词,所述词汇集合为所述第一核心词和所述第一联想 词组成的集合;

分类模块,用于按照所述目标检索词的类型对所述目标检索词进行分类,得 到不同的目标类型;以及

生成模块,用于将相同所述目标类型下所述目标检索词按照逻辑或的关系连 接,并将不同所述目标类型下所述目标检索词按照逻辑与的关系连接生成搜索条 件。

19.根据权利要求11所述的专利检索装置,其特征在于,所述第一联想词为多个,所 述专利检索装置还包括:

第二判断单元,用于在根据所述第一核心词和目标信息表确定第一联想词之 后,判断是否接收到联想指令,其中,所述联想指令为从多个所述第一联想词中 选择任一第一联想词的指令;

第四确定单元,用于在判断出接收到所述联想指令的情况下,确定所述联想 指令所选择的第一联想词为第二核心词;以及

第五确定单元,用于根据所述第二核心词和所述目标信息表确定与所述第二 核心词具有关联关系的第二联想词,其中,所述目标信息表中还存储有与所述第 二核心词具有关联关系的所述第二联想词;

其中,所述第三确定单元包括:第七确定模块,用于根据所述第一核心词、 所述第二核心词、所述第一联想词和所述第二联想词确定检索条件。

20.根据权利要求11所述的专利检索装置,其特征在于,所述专利检索装置还包括:

第二接收单元,用于在根据所述第一核心词和目标信息表确定第一联想词之 后,接收更换指令;以及

第六确定单元,用于按照所述更换指令重新确定所述第一联想词,

其中,所述第三确定单元包括:第八确定模块,用于根据所述第一核心词和 重新确定所述第一联想词确定检索条件。

说明书
技术领域

本发明涉及检索领域,具体而言,涉及一种专利检索方法和装置。

近年来,随着国内专利申请量的增加,专利的数量不断膨胀,用户对专利申请的 具体情况也越来越关注。现有技术中,用户通过在专利检索系统中输入检索条件,可 以对各领域、各省市和各企业等的专利申请量进行统计分析,但是,不同于其他检索, 专利检索对检索结果的要求较为严格,所以检索过程中,对检索要素的选择和组配上, 有着非常专业的技能要求。现有技术中主要有以下三种专利检索方式,具体如下:

第一种是目前所有专利检索平台的常规处理方式。在检索时,将检索字段尽可能 多地提供给客户,由客户自行组配。此种专利检索方式的检索结果可控,但对用户的 检索技能要求较高,容易造成关键检索信息遗漏,存在专利检索结果不准确的问题。

第二种是常见的同义词检索或者公司代码检索。在检索时,根据用户的输入或者 用户的选择,使用系统内建的词表进行有限扩展,最后使用扩展的检索要素进行检索。 此种专利检索方式的检索结果可控,但只能在同检索要素内,进行非常有限的扩展, 存在无法满足拆解式的检索要素联想需求和解决检索字段组配的问题,导致专利检索 结果不准确。例如,检索洗衣机,用户需要联想到滚筒、智能控制面板,但是上述检 索方式无法联想到滚筒、智能控制面板。

第三种是常见的语义检索。在检索时,用户可以简单的输入要检索的词汇或描述 语句。系统自动根据输入内容进行语义分析,抽取检索要素,使用语义匹配的方式自 动进行检索。此种检索方式,整个检索过程用户完全不可控,并且检索结果不具备改 进空间,存在专利检索结果不准确的问题。

针对现有技术中专利检索结果不准确的问题,目前尚未提出有效的解决方案。

本发明实施例提供了一种专利检索方法和装置,以解决现有技术中专利检索结果 不准确的问题。

根据本发明实施例的一个方面,提供了一种专利检索方法。

根据本发明的专利检索方法包括:接收用户的检索请求;确定所述检索请求中的 第一核心词;根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信 息表中存储有与所述第一核心词具有关联关系的联想词;根据所述第一核心词和所述 第一联想词确定检索条件;以及根据所述检索条件检索专利文件。

进一步地,所述检索请求中包括待检索内容,确定所述检索请求中的第一核心词 包括:对所述待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取, 得到一个或者多个待检索要素;接收选择指令;以及根据所述选择指令确定一个或者 多个所述待检索要素中的一个要素为所述第一核心词。

进一步地,所述目标信息表包括第一信息表、第二信息表和第三信息表中至少之 一,在接收用户的检索请求之前,所述专利检索方法还包括:根据专利原始数据建立 基本检索字段数据表,其中,所述专利原始数据由申请状态为已公开的专利申请文件 组成;根据所述基本检索字段数据表中的关键词,建立所述第一信息表,其中,所述 第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的所述专利申请文件的 共同出现次数;根据所述基本检索字段数据表中分类号和所述关键词,建立所述第二 信息表,其中,所述第二信息表中包含每个所述分类号对应的关键词在已公开的所述 专利申请文件中的共同出现次数;以及根据所述基本检索字段数据表中申请人和所述 关键词,建立所述第三信息表,其中,所述第三信息表中包含每个所述申请人对应的 关键词在已公开的所述专利申请文件中的共同出现次数。

进一步地,在根据所述第一核心词和目标信息表确定第一联想词之前,所述专利 检索方法还包括:判断所述第一核心词的类型,其中,所述第一核心词的类型为关键 词型、申请人型或分类号型;其中,在判断出所述第一核心词的类型为关键词型的情 况下,确定所述目标信息表包括所述第一信息表、所述第二信息表和所述第三信息表; 在判断出所述第一核心词的类型为分类号型的情况下,确定所述目标信息表包括所述 第二信息表;在判断出所述第一核心词的类型为申请人型的情况下,确定所述目标信 息表包括所述第三信息表。

进一步地,所述第一核心词的类型为关键词型时,所述第一联想词包括关键词型 联想词、分类号型联想词和申请人型联想词,根据所述第一核心词和目标信息表确定 第一联想词包括:根据所述第一核心词和所述第一信息表通过第一推荐模型公式 recommend1word=get(maxn1(fre(word,word')))确定所述关键词型联想词,其中,word 为所述第一核心词,recommend1word为所述第一推荐模型公式的名称,word'为所述关 键词型联想词,n1为预设确定所述关键词型联想词的个数,fre(word,word')为第一核 心词word与关键词型联想词word'在所述第一信息表中的共同出现次数, get(maxn1(fre(word,word')))为在所述第一信息表中获取与所述第一核心词word共同 出现次数最多的n1个关键词型联想词;根据所述第一核心词和所述第二信息表通过第 二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定所述分类号型联想词, 其中,ipc为所述分类号型联想词,recommend2word为所述第二推荐模型公式的名称, n2为预设确定所述分类号型联想词的个数,fre(word,ipc)为所述第一核心词word与分 类号型联想词ipc在所述第二信息表中的共同出现次数,get(maxn2(fre(word,ipc)))为 在所述第二信息表中获取与所述第一核心词word共同出现次数最多的n2个分类号型 联想词;以及根据所述第一核心词和所述第三信息表通过第三推荐模型公式 recommend3word=get(maxn3(fre(word,appl)))确定所述申请人型联想词,其中,appl为 所述申请人型联想词,recommend3word为所述第三推荐模型公式的名称,n3为预设确 定所述申请人型联想词的个数,fre(word,appl)为所述第一核心词word与申请人型联 想词appl在所述第三信息表中的共同出现次数,get(maxn3(fre(word,appl)))为在所述 第三信息表中获取与所述第一核心词word共同出现次数最多的n3个申请人型联想词。

进一步地,所述第一核心词的类型为分类号型时,所述第一联想词包括关键词型 联想词,根据所述第一核心词和目标信息表确定第一联想词包括:根据所述第一核心 词和所述第二信息表通过第四推荐模型公式 recommendipc=get(maxn4(fre(ipc,word)))确定所述关键词型联想词,其中, recommendipc为所述第四推荐模型公式的名称,ipc为所述第一核心词,word为所述关 键词型联想词,n4为预设确定所述关键词型联想词的个数,fre(ipc,word)为第一核心 词ipc与关键词型联想词word在所述第二信息表中的共同出现次数, get(maxn4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc共同出现 次数最多的n4个关键词型联想词。

进一步地,所述第一核心词的类型为申请人型时,所述第一联想词包括关键词型 联想词,根据所述第一核心词和目标信息表确定第一联想词包括:根据所述核心词和 所述第三信息表通过第五推荐模型公式 recommendappl=get(maxn5(fre(appl,word)))确定所述关键词型联想词,其中, recommendappl为所述第五推荐模型公式的名称,appl为所述第一核心词,word为所述 关键词型联想词,n5为预设确定所述关键词型联想词的个数,fre(appl,word)为第一 核心词appl与关键词型联想词word在所述第三信息中的共同出现次数, get(maxn5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词appl共同出 现次数最多的n5个关键词型联想词。

进一步地,根据所述第一核心词和所述第一联想词确定检索条件包括:获取目标 检索词的类型,其中,所述目标检索词为在词汇集合中已选定作为检索元素的词,所 述词汇集合为所述第一核心词和所述第一联想词组成的集合;按照所述目标检索词的 类型对所述目标检索词进行分类,得到不同的目标类型;以及将相同所述目标类型下 所述目标检索词按照逻辑或的关系连接,并将不同所述目标类型下所述目标检索词按 照逻辑与的关系连接生成搜索条件。

进一步地,所述第一联想词为多个,在根据所述第一核心词和目标信息表确定第 一联想词之后,所述专利检索方法还包括:判断是否接收到联想指令,其中,所述联 想指令为从多个所述第一联想词中选择任一第一联想词的指令;在判断出接收到所述 联想指令的情况下,确定所述联想指令所选择的第一联想词为第二核心词;以及根据 所述第二核心词和所述目标信息表确定与所述第二核心词具有关联关系的第二联想词, 其中,所述目标信息表中还存储有与所述第二核心词具有关联关系的所述第二联想词; 其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述第一核心 词、所述第二核心词、所述第一联想词和所述第二联想词确定检索条件。

进一步地,在根据所述第一核心词和目标信息表确定第一联想词之后,所述专利 检索方法还包括:接收更换指令;以及按照所述更换指令重新确定所述第一联想词; 其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述第一核心 词和重新确定所述第一联想词确定检索条件。

根据本发明实施例的另一方面,还提供了一种专利检索装置。

根据本发明的专利检索方法包括:第一接收单元,用于接收用户的检索请求;第 一确定单元,用于确定所述检索请求中的第一核心词;第二确定单元,用于根据所述 第一核心词和目标信息表确定第一联想词,其中,所述目标信息表中存储有与所述第 一核心词具有关联关系的联想词;第三确定单元,用于根据所述第一核心词和所述第 一联想词确定检索条件;以及检索单元,用于根据所述检索条件检索专利文件。

进一步地,所述检索请求中包括待检索内容,所述第一确定单元包括:抽取模块, 用于对所述待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取, 得到一个或者多个待检索要素;接收模块,用于接收选择指令;以及第一确定模块, 用于根据所述选择指令确定一个或者多个所述待检索要素中的一个要素为所述第一核 心词。

进一步地,所述目标信息表包括第一信息表、第二信息表和第三信息表中至少之 一,所述专利检索装置还包括:第一建立单元,用于在接收用户的检索请求之前,根 据专利原始数据建立基本检索字段数据表,其中,所述专利原始数据由申请状态为已 公开的专利申请文件组成;第二建立单元,用于根据所述基本检索字段数据表中的关 键词,建立所述第一信息表,其中,所述第一信息表中存储有任意两个组成共现矩阵 的关键词在已公开的所述专利申请文件的共同出现次数;第三建立单元,用于根据所 述基本检索字段数据表中分类号和所述关键词,建立所述第二信息表,其中,所述第 二信息表中包含每个所述分类号对应的关键词在已公开的所述专利申请文件中的共同 出现次数;以及第四建立单元,用于根据所述基本检索字段数据表中申请人和所述关 键词,建立所述第三信息表,其中,所述第三信息表中包含每个所述申请人对应的关 键词在已公开的所述专利申请文件中的共同出现次数。

进一步地,所述专利检索装置还包括:第一判断单元,用于在根据所述第一核心 词和目标信息表确定第一联想词之前,判断所述第一核心词的类型,其中,所述第一 核心词的类型为关键词型、申请人型或分类号型;其中,在判断出所述第一核心词的 类型为关键词型的情况下,确定所述目标信息表包括所述第一信息表、所述第二信息 表和所述第三信息表;在判断出所述第一核心词的类型为分类号型的情况下,确定所 述目标信息表包括所述第二信息表;在判断出所述第一核心词的类型为申请人型的情 况下,确定所述目标信息表包括所述第三信息表。

进一步地,所述第一核心词的类型为关键词型时,所述第一联想词包括关键词型 联想词、分类号型联想词和申请人型联想词,所述第二确定单元包括:第二确定模块, 用于根据所述第一核心词和所述第一信息表通过第一推荐模型公式 recommend1word=get(maxn1(fre(word,word')))确定所述关键词型联想词,其中,word 为所述第一核心词,recommend1word为所述第一推荐模型公式的名称,word'为所述关 键词型联想词,n1为预设确定所述关键词型联想词的个数,fre(word,word')为第一核 心词word与关键词型联想词word'在所述第一信息表中的共同出现次数, get(maxn1(fre(word,word')))为在所述第一信息表中获取与所述第一核心词word共同 出现次数最多的n1个关键词型联想词;第三确定模块,用于根据所述第一核心词和所 述第二信息表通过第二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定 所述分类号型联想词,其中,ipc为所述分类号型联想词,recommend2word为所述第二 推荐模型公式的名称,n2为预设确定所述分类号型联想词的个数,fre(word,ipc)为所 述第一核心词word与分类号型联想词ipc在所述第二信息表中的共同出现次数, get(maxn2(fre(word,ipc)))为在所述第二信息表中获取与所述第一核心词word共同出 现次数最多的n2个分类号型联想词;以及第四确定模块,用于根据所述第一核心词和 所述第三信息表通过第三推荐模型公式recommend3word=get(maxn3(fre(word,appl))) 确定所述申请人型联想词,其中,appl为所述申请人型联想词,recommend3word为所 述第三推荐模型公式的名称,n3为预设确定所述申请人型联想词的个数, fre(word,appl)为所述第一核心词word与申请人型联想词appl在所述第三信息表中 的共同出现次数,get(maxn3(fre(word,appl)))为在所述第三信息表中获取与所述第一 核心词word共同出现次数最多的n3个申请人型联想词。

进一步地,所述第一核心词的类型为分类号型时,所述第一联想词包括关键词型 联想词,所述第二确定单元包括:第五确定模块,用于根据所述第一核心词和所述第 二信息表通过第四推荐模型公式recommendipc=get(maxn4(fre(ipc,word)))确定所 述关键词型联想词,其中,recommendipc为所述第四推荐模型公式的名称,ipc为所述 第一核心词,word为所述关键词型联想词,n4为预设确定所述关键词型联想词的个数, fre(ipc,word)为第一核心词ipc与关键词型联想词word在所述第二信息表中的共同出 现次数,get(maxn4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc 共同出现次数最多的n4个关键词型联想词。

进一步地,所述第一核心词的类型为申请人型时,所述第一联想词包括关键词型 联想词,所述第二确定单元包括:第六确定模块,用于根据所述核心词和所述第三信 息表通过第五推荐模型公式recommendappl=get(maxn5(fre(appl,word)))确定所述 关键词型联想词,其中,recommendappl为所述第五推荐模型公式的名称,appl为所述 第一核心词,word为所述关键词型联想词,n5为预设确定所述关键词型联想词的个数, fre(appl,word)为第一核心词appl与关键词型联想词word在所述第三信息中的共同 出现次数,get(maxn5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词 appl共同出现次数最多的n5个关键词型联想词。

进一步地,所述第三确定单元包括:获取模块,用于获取目标检索词的类型,其 中,所述目标检索词为在词汇集合中已选定作为检索元素的词,所述词汇集合为所述 第一核心词和所述第一联想词组成的集合;分类模块,用于按照所述目标检索词的类 型对所述目标检索词进行分类,得到不同的目标类型;以及生成模块,用于将相同所 述目标类型下所述目标检索词按照逻辑或的关系连接,并将不同所述目标类型下所述 目标检索词按照逻辑与的关系连接生成搜索条件。

进一步地,所述第一联想词为多个,所述专利检索装置还包括:第二判断单元, 用于在根据所述第一核心词和目标信息表确定第一联想词之后,判断是否接收到联想 指令,其中,所述联想指令为从多个所述第一联想词中选择任一第一联想词的指令; 第四确定单元,用于在判断出接收到所述联想指令的情况下,确定所述联想指令所选 择的第一联想词为第二核心词;以及第五确定单元,用于根据所述第二核心词和所述 目标信息表确定与所述第二核心词具有关联关系的第二联想词,其中,所述目标信息 表中还存储有与所述第二核心词具有关联关系的所述第二联想词;其中,所述第三确 定单元包括:第七确定模块,用于根据所述第一核心词、所述第二核心词、所述第一 联想词和所述第二联想词确定检索条件。

进一步地,所述专利检索装置还包括:第二接收单元,用于在根据所述第一核心 词和目标信息表确定第一联想词之后,接收更换指令;以及第六确定单元,用于按照 所述更换指令重新确定所述第一联想词,其中,所述第三确定单元包括:第八确定模 块,用于根据所述第一核心词和重新确定所述第一联想词确定检索条件。

在本发明实施例中,采用接收用户的检索请求;确定所述检索请求中的第一核心 词;根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信息表中存 储有与所述第一核心词具有关联关系的联想词;根据所述第一核心词和所述第一联想 词确定检索条件;以及根据所述检索条件检索专利文件。通过根据检索请求确定核心 词,进而可以根据预先设置的目标信息表确定出与核心词相关的联想词,实现了以核 心词作为用户的检索意愿,为用户有方向、可控制提供了更多与核心词相关并且可以 用于作为检索条件的联想词,并且上述联想词可以是与核心词为相同类型检索要素的 词汇,也可以是与核心词为不同类型检索要素的词汇,使得用户可以有更大的选择空 间根据核心词和推荐的联想词确定检索条件,进而根据上述检索条件进行专利检索, 解决了现有技术中专利检索结果不准确的问题,进而达到了提高专利检索结果准确性 的效果。

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发 明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图 中:

图1是根据本发明实施例的专利检索方法的流程图;以及

图2是根据本发明实施例的专利检索装置的示意图。

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的 附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例 仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领 域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于 本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第 二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这 样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在 这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的 任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方 法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚 地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本发明实施例,提供了一种专利文件检索的方法实施例,需要说明的是,在 附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并 且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序 执行所示出或描述的步骤。

图1是根据本发明实施例的专利检索方法的流程图。如图1所示,该方法包括步 骤S102至步骤S110,具体如下:

步骤S102:接收用户的检索请求。具体地,检索请求中包括待检索内容,待检索 内容可以是词、句子、段落或者篇章。

在本发明实施例中,用户可以通过终端向执行本发明实施例的专利检索方法的专 利检索系统发送检索请求。专利检索系统中设置有文本输入区,用户可以在文本输入 区中通过键盘等设备输入待检索的相关文本内容,该文本输入区支持复制、粘贴操作, 并且允许编辑修改输入的内容。如果输入的文本内容较多,每超过10个字,字号由 28号字逐级缩小至直至12号字,文本输入区对输入内容支持的最大长度为个1000字 符。当用户输入的文本内容为单个词汇时,可以提供以输入的上述单个词汇为前缀的 相关提示信息供用户选择。例如:输入的文本内容为“发动”时,可以提供发动机和 发动引擎等输入提示。

步骤S104:确定检索请求中的第一核心词。具体地,第一核心词的类型可以为关 键词型,例如汽车;可以为申请人型,例如ABC公司;还可以为分类号型,例如GO1M 99/00(2011.01)。

步骤S106:根据第一核心词和目标信息表确定第一联想词,其中,目标信息表中 存储有与第一核心词具有关联关系的联想词。

具体地,目标信息表为预先设置的多张信息表中与第一核心词具有关联关系的信 息表,不同类型的第一核心词对应不同的目标信息表。第一联想词的类型同样也可以 分为关键词型、申请人型和分类号型。第一联想词可以为一个,也可以为多个,并且 每个第一联想词的类型可以与第一核心词的类型相同,也可以不同,即,每个第一联 想词与第一核心词可以为相同类型检索要素,也可以为不同类型检索要素。

在本发明实施例中,通过能够为用户提供与核心词为不同类型检索要素的联想词, 使得用户对检索条件的选择范围不在只局限于相同类型检索要素之间,为后续用户确 定检索条件提供了较为灵活的选择,进而达到了提高用户满意度的效果。

步骤S108:根据第一核心词和第一联想词确定检索条件。在本发明实施例中,检 索条件可以由核心词和联想词共同组成,可以只由核心词组成,也可以只由联想词组 成,不论是由核心词和联想词共同组成的检索条件还是只由联想词组成的检索条件中 的具体联想词以及联想词的数量都可以根据需求选择设置。

步骤S110:根据检索条件检索专利文件。具体地,根据检索条件检索专利文件的 检索范围是全部专利数据。

在本发明实施例中,通过根据检索请求确定核心词,进而可以根据预先设置的目 标信息表确定出与核心词相关的联想词,实现了以核心词作为用户的检索意愿,为用 户有方向、可控制提供了更多与核心词相关并且可以用于作为检索条件的联想词,并 且上述联想词可以是与核心词为相同类型检索要素的词汇,也可以是与核心词为不同 类型检索要素的词汇,使得用户可以有更大的选择空间根据核心词和推荐的联想词确 定检索条件,进而根据上述检索条件进行专利检索,解决了现有技术中专利检索结果 不准确的问题,达到了提高专利检索结果准确性的效果。

具体地,在本发明实施例中,检索请求中包括待检索内容,可以通过如下步骤确 定检索请求中的第一核心词:

步骤1041:对待检索内容按照关键词型要素、申请人型要素和分类号型要素进行 抽取,得到一个或者多个待检索要素。具体地,可以通过内嵌的关键词抽取和实体识 别算法自动对待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取, 从而得到上述待检索内容中包含的关键词型信息要素、分类号型信息要素和申请人型 信息要素,上述抽取到的要素即为待检索要素,其中,申请人型信息要素可以包括公 司名称或者个人名称。

步骤1043:接收选择指令。具体地,选择指令用于允许用户根据需求选择步骤1041 中抽取得到哪个待检索要素作为核心词。

步骤1045:根据选择指令确定一个或者多个待检索要素中的一个要素为第一核心 词。

在本发明实施例中,通过对待检索内容进行抽取得到一个或者多个待检索要素后, 还允许用户根据需求选择上述一个或者多个待检索要素的中的一个待检索要素作为核 心词,而非直接将上述一个或者多个待检索要素作为检索条件自动进行检索,达到了 提高检索准确度的效果,进而提高了用户的满意度。

具体地,目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,在 接收用户的检索请求之前,本发明实施例所提供的专利检索方法还包括以下步骤:

步骤S1:根据专利原始数据建立基本检索字段数据表,其中,专利原始数据由申 请状态为已公开的专利申请文件组成。具体地,基本检索字段数据表中每条记录为一 个专利申请,每条记录的内容包括申请号、单篇专利抽取的关键词、申请人和IPC分 类号信息。

在本发明实施例中,已公开的专利申请文件可以通过多种方式获取得到,例如: CNIPR专利信息服务平台或者Soopat专利数据搜索引擎等方式。

步骤S3:根据基本检索字段数据表中的关键词,建立第一信息表,其中,第一信 息表中存储有任意两个组成共现矩阵的关键词在已公开的专利申请文件的共同出现次 数。在本发明实施例中,第一信息表也可以叫做关键词数据表,共同出现次数也可以 叫做篇频次数,本步骤也就是,关键词数据表中记录了基本检索字段数据表中全部任 意两个可以组成共现矩阵的关键词在已公开的专利申请文件中的篇频次数。例如,基 本检索字段数据表中的关键词“汽车”和关键词“电脑”组成共现矩阵,假设关键词 “汽车”和关键词“电脑”在1000个已公开的专利申请文件中的100个专利申请文件 中共同出现了,那么关键词“汽车”和关键词“电脑”的篇频次数(即共同出现次数) 为100次。其他任意两个组成共现矩阵的关键词的篇频次数的记录方式与上述举例说 明一样。

需要说明的是,基本检索字段数据表中的同一关键词可以与基本检索字段数据表 中其他多个关键词分别组成共现矩阵,那么在关键词数据表中需要记录上述同一关键 词分别与其他关键词在已公开的专利申请文件中的共同出现次数。

步骤S5:根据基本检索字段数据表中分类号和关键词,建立第二信息表,其中, 第二信息表中包含每个分类号对应的关键词在已公开的专利申请文件中的共同出现次 数。具体地,第二信息表是以分类号为维度建立的信息表,每个分类号对应的关键词 为包含该分类号的专利申请文件中包含的关键词。在本发明实施例中,第二信息表也 可以叫做分类号-关键词数据表,本步骤也就是,分类号-关键词数据表中以分类号为 维度,记录了每个分类号和与该分类号对应的关键词在已公开的专利申请文件中的共 同出现次数。

需要说明的是,一个分类号可能被多个专利申请文件包含,那么上述一个分类号 对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本 检索字段数据表中的同一分类号可以与基本检索字段数据表中多个关键词分别对应, 那么在分类号-关键词数据表中需要记录上述同一分类号分别与上述多个关键词中每 个关键词在已公开的专利申请文件中的共同出现频次。

步骤S7:根据基本检索字段数据表中申请人和关键词,建立第三信息表,其中, 第三信息表中包含每个申请人对应的关键词在已公开的专利申请文件中的共同出现次 数。具体地,第三信息表是以申请人为维度建立的信息表,每个申请人对应的关键词 为包含该申请人的专利申请文件中包含的关键词。在本发明实施例中,第三信息表也 可以叫做申请人-关键词数据表,本步骤也就是申请人-关键词数据表中以申请人为维 度,记录了每个申请人和该申请人对应的关键词在已公开的专利申请文件中的共同出 现次数。

需要说明的是,一个申请人可能被多个专利申请文件包含,那么上述一个申请人 对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本 检索字段数据表中的同一申请人可以与基本检索字段数据表中多个关键词分别对应, 那么在申请人-关键词数据表中需要记录上述同一申请人分别与上述多个关键词中每 个关键词在已公开的专利申请文件中的共同出现次数。

例如:申请人为A公司,包含申请人为A公司的已公开的专利申请文件有两个, 分别是专利申请文件B和专利申请文件C,其中,专利申请文件B中包含的关键词为 手机和天线,专利申请文件C中包含的关键词为电脑,假设A公司和手机共同在25 篇已公开的专利申请文件中出现,A公司和天线共同在20篇已公开的专利申请文件中 出现,A公司和电脑共同在50篇已公开的专利申请文件中出现,那么在申请人-关键 词数据表中,记录A公司和手机的共同出现次数为25次,A公司和天线的共同出现次 数为20次,记录A公司和电脑的共同出现次数为50次。

具体地,在根据第一核心词和目标信息表确定第一联想词之前,本发明实施例所 提供的专利检索方法还包括步骤S9,具体如下:

步骤S9:判断第一核心词的类型,其中,第一核心词的类型为关键词型、申请人 型或分类号型;在判断出第一核心词的类型为关键词型的情况下,确定目标信息表包 括第一信息表、第二信息表和第三信息表;在判断出第一核心词的类型为分类号型的 情况下,确定目标信息表包括第二信息表;在判断出第一核心词的类型为申请人型的 情况下,确定目标信息表包括第三信息表。

在本发明实施例中,通过判断第一核心词的类型,进而可以根据第一核心词的类 型确定目标信息表的范围,为后续确定与核心词为不同类型检索要素,但却具有关联 关系的联想词提供了数据基础。

根据上述内容可知,第一核心词的类型可以为三种类型,分别是关键词型、分类 号型和申请人型,不同类型的核心词对应的目标信息表的组成不同,以下分别针对第 一核心词的类型为关键词型、分类号型和申请人型时,对如何根据第一核心词和目标 信息表确定第一联想词进行具体介绍说明。

类型一:当第一核心词的类型为关键词型时,此时,第一联想词包括关键词型联 想词、分类号型联想词和申请人型联想词,可以通过步骤S1061至步骤S1065完成根 据第一核心词和目标信息表确定第一联想词,步骤S1061至步骤S1065具体如下:

步骤S1061:根据第一核心词和第一信息表通过第一推荐模型公式 recommend1word=get(maxn1(fre(word,word')))确定关键词型联想词,其中,word为第 一核心词,recommend1word为第一推荐模型公式的名称,word'为关键词型联想词,n1 为预设确定关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型 联想词word'在第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在第一 信息表中获取与第一核心词word共同出现次数最多的n1个关键词型联想词。在本步 骤中,通过第一推荐模型公式实现了在第一信息表中获取与第一核心词共同出现次数 最多的n1个关键词型联想词。具体地,n1的具体数值可以根据需求设置。

假设:第一核心词word为汽车,n1设定为5,此时,上述第一推荐模型公式为 recommend1汽车=get(max5(fre(汽车,word'))),表示在第一信息表(即关键词数据表) 中获取与“汽车”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为 关键词型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第一信息表通过模型公式实现了对与第一 核心词为相同类型检索要素的确定。

步骤S1063:根据第一核心词和第二信息表通过第二推荐模型公式 recommend2word=get(maxn2(fre(word,ipc)))确定分类号型联想词,其中,ipc为分类号 型联想词,recommend2word为第二推荐模型公式的名称,n2为预设确定分类号型联想 词的个数,fre(word,ipc)为第一核心词word与分类号型联想词ipc在第二信息表中的 共同出现次数,get(maxn2(fre(word,ipc)))为在第二信息表中获取与第一核心词word 共同出现次数最多的n2个分类号型联想词。在本步骤中,通过第二推荐模型公式实现 了在第二信息表中获取与第一核心词共同出现次数最多的n2个分类号型联想词。同样 的,n2的具体数值也可以根据需求设置。

假设:第一核心词word为汽车,n2设定为5,此时,上述第二推荐模型公式为 recommend2汽车=get(max5(fre(汽车,ipc))),表示在第二信息表(即分类号-关键词数 据表)中获取与“汽车”共同出现次数排在前5名的分类号,上述排在前5名的分类 号即为分类号型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

步骤S1065:根据第一核心词和第三信息表通过第三推荐模型公式 recommend3word=get(maxn3(fre(word,appl)))确定申请人型联想词,其中,appl为申 请人型联想词,recommend3word为第三推荐模型公式的名称,n3为预设确定申请人型 联想词的个数,fre(word,appl)为第一核心词word与申请人型联想词appl在第三信息 表中的共同出现次数,get(maxn3(fre(word,appl)))为在第三信息表中获取与第一核心 词word共同出现次数最多的n3个申请人型联想词。在本步骤中,通过第三推荐模型 公式实现了在第三信息表中获取与第一核心词共同出现次数最多的n3个申请人型联 想词。同样的,n3的具体数值也可以根据需求设置。

假设:第一核心词word为汽车,n3设定为5,此时,上述第三推荐模型公式为 recommend3汽车=get(max5(fre(汽车,appl))),表示在第三信息表(即申请人-关键词数 据表)中获取与“汽车”共同出现次数排在前5名的申请人,上述排在前5名的申请 人即为申请人型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

类型二:当第一核心词的类型为分类号型时,此时,第一联想词包括关键词型联 想词,可以通过步骤S1067完成根据第一核心词和目标信息表确定第一联想词,步骤 S1067具体如下:

步骤S1067:根据第一核心词和第二信息表通过第四推荐模型公式 recommendipc=get(maxn4(fre(ipc,word)))确定关键词型联想词,其中, recommendipc为第四推荐模型公式的名称,ipc为第一核心词,word为关键词型联想 词,n4为预设确定关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型 联想词word在第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在第二信 息表中获取与第一核心词ipc共同出现次数最多的n4个关键词型联想词。在本步骤中, 通过第四推荐模型公式实现了在第二信息表中获取与第一核心词共同出现次数最多的 n4个关键词型联想词。同样的,n4的具体数值也可以根据需求设置。

假设:第一核心词ipc为AAA,n4设定为5,此时,上述第四推荐模型公式为 recommendAAA=get(max5(fre(AAA,word))),表示在第二信息表(即分类号-关键词数 据表)中获取与“AAA”共同出现次数排在前5名的关键词,上述排在前5名的关键词 即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

类型三:第一核心词的类型为申请人型时,此时,第一联想词包括关键词型联想 词,可以通过步骤S1069完成根据第一核心词和目标信息表确定第一联想词,步骤 S1069具体如下:

步骤S1069:根据核心词和第三信息表通过第五推荐模型公式 recommendappl=get(maxn5(fre(appl,word)))确定关键词型联想词,其中, recommendappl为第五推荐模型公式的名称,appl为第一核心词,word为关键词型联 想词,n5为预设确定关键词型联想词的个数,fre(appl,word)为第一核心词appl与关 键词型联想词word在第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在第 二信息表中获取与第一核心词appl共同出现次数最多的n5个关键词型联想词。在本 步骤中,通过第五推荐模型公式实现了在第三信息表中获取与第一核心词共同出现次 数最多的n5个关键词型联想词。同样的,n5的具体数值也可以根据需求设置。

假设:第一核心词appl为三星,n5设定为5,此时,上述第五推荐模型公式为 recommend三星=get(max5(fre(三星,word))),表示在第三信息表(即申请人-关键词数 据表)中获取与“三星”共同出现次数排在前5名的关键词,上述排在前5名的关键 词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

优选地,通过步骤S1081至步骤S1085实现根据第一核心词和第一联想词确定检 索条件包括:

步骤S1081:获取目标检索词的类型,其中,目标检索词为在词汇集合中已选定 作为检索元素的词,词汇集合为第一核心词和第一联想词组成的集合,本步骤也就是 获取用户从第一核心词和第一联想词组成的集合中已选定作为检索元素词的类型。需 要说明的是,已选定的检索元素包括第一核心词和第一联想词,可以只包括第一核心 词,还可以只包括第一联想词,具体可以根据用户需求选择确定。

在本发明实施例中,由语义计算联想扩展获得的检索要素(即联想词)并不直接构 成检索式(即检索元素)参与检索,作为检索元素的联想词的选择,是开放给用户选 择的,从而达到了使整个检索过程可控的目的。

步骤S1083:按照目标检索词的类型对目标检索词进行分类,得到不同的目标类 型,本步骤也就是,对已选定作为检索元素的第一核心词和第一联想词、第一核心词 或者第一联想词进行分类,此时,不再对核心词和联想词进行区分。

需要说明的是,由于第一核心词和第一联想词的类型都为同样的三种类型,分别 是关键词型、申请人型和分类号型,所以目标类型最多也就分为三种类型,同样分别 是关键词型、申请人型和分类号型。

步骤S1085:将相同目标类型下目标检索词按照逻辑或的关系连接,并将不同目 标类型下目标检索词按照逻辑与的关系连接生成搜索条件,也就是,每个相同目标类型 下的目标检索词间采用逻辑“OR”的连接关系,每个目标类型间采用逻辑“AND”的连 接关系。假设:在步骤S1083中得到的目标类型有三种,分别是关键词型、申请人型 和分类号型,关键词型包括两个关目标检索词,分别是汽车和电脑,申请人型包括一 个目标检索词:三星,分类号型包括一个目标检索词:AAA,那么上述目标检索词组成 的搜索条件为(汽车OR电脑)AND三星AND AAA。

需要说明的是,在执行本发明实施例的专利检索方法的专利检索系统中,当目标 类型为关键词型时,对该目标类型下的关键词(即目标检索词)的检索范围包括:标 题、摘要、主权项、权利要求书、说明书全文和附图说明;当目标类型为分类号型时, 对该目标类型下的分类号(即目标检索词)的检索范围包括:IPC分类号和主IPC;当 目标类型为申请人型时,对该目标类型下的申请人(即目标检索词)的检索范围包括: 申请人、发明人、专利权人和相关权利人。在本专利检索系统中,用户可以对已选定 的检索元素进行多次修改,以发送确定检索指令时对应选定的检索元素为准生成检索 条件。

在本发明实施例中,可以自动根据用户的选择,进行检索条件的组配关系,其结 果用户可调,达到了既不影响检索结果的可控性,又能帮助客户组配较为复杂的检索 逻辑的效果。

优选地,第一联想词为多个,在根据第一核心词和目标信息表确定第一联想词之 后,本发明实施例所提供的专利检索方法还包括步骤S11至步骤S15,具体如下:

步骤S11:判断是否接收到联想指令,其中,联想指令为从多个第一联想词中选 择任一第一联想词的指令,本步骤也就是,判断是否接收到从多个第一联想词中选择 任意联想词进行联想的指令。

步骤S13:在判断出接收到联想指令的情况下,确定联想指令所选择的第一联想 词为第二核心词,即,如果接收到从多个第一联想词中选择任意联想词进行联想的指 令,则将联想指令所选择的第一联想词作为新的核心词。

步骤S15:根据第二核心词和目标信息表确定与第二核心词具有关联关系的第二 联想词,其中,目标信息表中还存储有与第二核心词具有关联关系的第二联想词,本 步骤同步骤S106,具体确定第二联想词的过程同确定第一联想词的过程,具体参考上 述内容,此处不再重复说明。

此时,根据第一核心词和第一联想词确定检索条件包括:根据第一核心词、第二 核心词、第一联想词和第二联想词确定检索条件。在本发明实施例中,根据第一核心 词、第二核心词、第一联想词和第二联想词确定检索条件的过程同第一核心词和第一 联想词确定检索条件的过程,在此不再重复说明。

需要说明的是,当第二联想词为多个时,还可以判断是否接收到从多个第二联想 词中选择任意联想词进行联想的指令,如果判断出接收到从多个第二联想词中选择任 意联想词进行联想的指令,那么可以将联想指令所选择的第二联想词作为第三核心词, 进而可以根据第三核心词和目标信息表确定与第三核心词具有关联关系的第三联想词, 所以依次类推,可以重复执行步骤S11至步骤S15,得到多个核心词和与该核心词具 有关联关系的联想词。

在本发明实施例中,通过可以将联想词转变为新的核心词,从而得到与上述新的 核心词具有关联关系的联想词,实现了跨层次联想,不限于同级别的联想的效果,进 一步达到了提高用户满意度的效果,并为后续检索结果准确性提供了良好的基础。

在执行本发明实施例的专利检索方法的专利检索系统中,核心词和联想词均在可 视化搜索界面显示,具体地,以核心词为中心,联想词依次以圆形结构排列分布在核 心词周围。具体地,核心词用12号字显示,当核心词超过10个字时,则只显示三个 点。在该专利检索系统中,用户还可以对核心词执行搜索操作、修改操作和查看操作。 搜索操作用于以该核心词作为检索条件,检索得到预检结果,上述预检结果可以显示 全部检索结果的条目数,并显示检索结果的前五条内容,具体包括名称、申请号、当 前法律状态、专利类型以及摘要信息。该预检索结果通过浮窗的形式显示,用户可以 通过点击浮窗中的收起按钮将浮窗收起。修改操作用于回到初始的文本输入模式下, 也就是重新返回文本输入区,从而可对文本内容进行再次编辑。查看操作用于显示本 次输入的待检索的全部文本内容,主要用于当文本内容较长时的全文查看。

同样的,在本专利检索系统中,用户也可以对每个联想词进行一些操作,具体为 修改操作、检索操作、联想操作和删除操作。修改操作用于对当前得到的联想词进行 编辑修改;搜索操作用于以当前得到的某个联想词作为检索条件,检索得到预检结果, 同样的,该预检结果可以显示全部检索结果的条目数,并显示检索结果的前五条内容, 具体包括名称、申请号、当前法律状态、专利类型以及摘要信息。该预检索结果同样 可以通过浮窗的形式显示,用户可以通过点击浮窗中的收起按钮将浮窗收起。联想操 作用于以当前得到的某个联想词作为新的核心词,继续得到与该新的核心词具有关联 关系的联想词;删除操作用于删除当前得到的某个联想词。

在本专利检索系统中,当前核心词之前的核心词始终固定显示在可视化搜索界面 的固定区域,例如在左上角,当前核心词的上一个核心词用虚线和当前的核心词连接, 其它在固定区域的核心词之间用虚线连接,以表明层级关系。随着联想的逐级深入, 可在上述固定区域形成一棵联想树,该联想树记录了本次检索操作的整个扩展过程, 联想树的节点为每次进行联想操作的核心词,点击该联想树上的任意节点,上述任意 节点对应的核心词会再次展开显示,并用虚线连接该节点与其父节点、子节点的关系。 在本专利系统中,通过形成关于核心词的联想树,实现对检索操作过程的全程记录, 并起到了保证联想过程的可逆性和可重复性的效果。

优选地,在根据第一核心词和目标信息表确定第一联想词之后,本发明实施例所 提供的专利检索方法还包括:接收更换指令;按照更换指令重新确定第一联想词,其 中,根据第一核心词和第一联想词确定检索条件包括:根据第一核心词和重新确定第 一联想词确定检索条件。

在本发明实施例中,用户可以通过发送更换指令,实现对与当前核心词具有关联 关系的联想词进行更换的效果,并扩大了用户后续选取检索元素的选择范围。需要说 明的是,除核心词外,所有的联想词都会进行更换,具体每种类型联想词更换的数量 根据上述内容提供的模型公式决定,此时,检索条件根据当前核心词和更换后的联想 词确定。特别的,用户可以发送多次更换指令,检索条件由当前核心词和最后一次发 送更换指令后对应的联想词确定。

需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系 列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限 制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术 人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块 并不一定是本发明所必须的。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施 例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但 很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者 说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存 储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端 设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述 的方法。

本发明实施例还提供了一种专利检索装置,该专利检索装置可以用于执行本发明 实施例的专利检索方法。

图2是根据本发明实施例的专利检索装置的示意图。如图2所示,该专利文件检 索装置包括:第一接收单元10、第一确定单元20、第二确定单元30、第三确定单元 40和检索单元50,其中:

第一接收单元10用于接收用户的检索请求。具体地,检索请求中包括待检索内容, 待检索内容可以是词、句子、段落或者篇章。

在本发明实施例中,用户可以通过终端向具有本发明实施例的专利检索装置的专 利检索系统发送检索请求。专利检索系统中设置有文本输入区,用户可以在文本输入 区中通过键盘等设备输入待检索的相关文本内容,该文本输入区支持复制、粘贴操作, 并且允许编辑修改输入的内容。如果输入的文本内容较多,每超过10个字,字号由 28号字逐级缩小至直至12号字,文本输入区对输入内容支持的最大长度为个1000字 符。当用户输入的文本内容为单个词汇时,可以提供以输入的上述单个词汇为前缀的 相关提示信息供用户选择。例如:输入的文本内容为“发动”时,可以提供发动机和 发动引擎等输入提示。

第一确定单元20用于确定检索请求中的第一核心词。具体地,第一核心词的类型 可以为关键词型,例如汽车;可以为申请人型,例如ABC公司;还可以为分类号型, 例如GO1M 99/00(2011.01)。

第二确定单元30用于根据第一核心词和目标信息表确定第一联想词,其中,目标 信息表中存储有与第一核心词具有关联关系的联想词。

具体地,目标信息表为预先设置的多张信息表中与第一核心词具有关联关系的信 息表,不同类型的第一核心词对应不同的目标信息表。第一联想词的类型同样也可以 分为关键词型、申请人型和分类号型,第一联想词可以为一个,也可以为多个,并且 每个第一联想词的类型可以与第一核心词的类型相同,也可以不同,即,每个第一联 想词与第一核心词可以为相同类型检索要素,也可以为不同类型类检索要素。

在本发明实施例中,通过能够为用户提供与核心词为不同类型检索要素的联想词, 使得用户对检索条件的选择范围不在只局限于相同类型检索要素之间,为后续用户确 定检索条件提供了较为灵活的选择,进而达到了提高用户满意度的效果。

第三确定单元40用于根据第一核心词和第一联想词确定检索条件。在本发明实施 例中,检索条件可以由核心词和联想词共同组成,可以只由核心词组成,也可以只由 联想词组成,不论是由核心词和联想词共同组成的检索条件还是只由联想词组成的检 索条件中的具体联想词以及联想词的数量都可以根据需求选择设置。

检索单元50用于根据检索条件检索专利文件。具体地,根据检索条件检索专利文 件的检索范围是全部专利数据。

在本发明实施例中,通过根据检索请求确定核心词,进而可以根据预先设置的目 标信息表确定出与核心词相关的联想词,实现了以核心词作为用户的检索意愿,为用 户有方向、可控制提供了更多与核心词相关并且可以用于作为检索条件的联想词,并 且上述联想词可以是与核心词为相同类型检索要素的词汇,也可以是与核心词为不同 类型检索要素的词汇,使得用户可以有更大的选择空间根据核心词和推荐的联想词确 定检索条件,进而根据上述检索条件进行专利检索,解决了现有技术中专利检索结果 不准确的问题,进而达到了提高专利检索结果准确性的效果。

具体地,在本发明实施例中,检索请求中包括待检索内容,第一确定单元20包括 抽取模块、接收模块和第一确定模块,其中:

抽取模块用于对待检索内容按照关键词型要素、申请人型要素和分类号型要素进 行抽取,得到一个或者多个待检索要素。具体地,可以通过内嵌的关键词抽取和实体 识别算法自动对待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽 取,从而得到上述待检索内容中包含的关键词型信息要素、分类号型信息要素和申请 人型信息要素,上述抽取到的要素即为待检索要素,其中,申请人型信息要素包括公 司名称或者个人名称。

接收模块用于接收选择指令。具体地,选择指令用于允许用户根据需求选择抽取 模块中抽取得到哪个待检索要素作为核心词。

第一确定模块用于根据选择指令确定一个或者多个待检索要素中的一个要素为第 一核心词。

在本发明实施例中,通过对待检索内容进行抽取得到一个或者多个待检索要素后, 还允许用户根据需求选择上述一个或者多个待检索要素的中的一个待检索要素作为核 心词,而非直接将上述一个或者多个待检索要素作为检索条件自动进行检索,达到了 提高检索准确度的效果,进而提高了用户的满意度。

具体地,目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,本 发明实施例所提供的专利检索装置还包括第一建立单元、第二建立单元、第三建立单 元和第四建立单元,其中:

第一建立单元用于在接收用户的检索请求之前,根据专利原始数据建立基本检索 字段数据表,其中,专利原始数据由申请状态为已公开的专利申请文件组成。具体地, 基本检索字段数据表中每条记录为一个专利申请,每条记录的内容包括申请号、单篇 专利抽取的关键词、申请人和IPC分类号信息。

在本发明实施例中,已公开的专利申请文件可以通过多种方式获取得到,例如: CNIPR专利信息服务平台或者Soopat专利数据搜索引擎等方式。

第二建立单元用于根据基本检索字段数据表中的关键词,建立第一信息表,其中, 第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的专利申请文件的共同 出现次数。在本发明实施例中,第一信息表也可以叫做关键词数据表,共同出现次数 也可以叫做篇频次数,本单元也就是,关键词数据表中记录了基本检索字段数据表中 全部任意两个可以组成共现矩阵的关键词在已公开的专利申请文件中的篇频次数。例 如,基本检索字段数据表中的关键词“汽车”和关键词“电脑”组成共现矩阵,假设 关键词“汽车”和关键词“电脑”在1000个已公开的专利申请文件中的100个专利申 请文件中共同出现了,那么关键词“汽车”和关键词“电脑”的篇频次数(即共同出 现次数)为100次。其他任意两个组成共现矩阵的关键词的篇频次数的记录方式与上 述举例说明一样。

需要说明的是,基本检索字段数据表中的同一关键词可以与基本检索字段数据表 中其他多个关键词分别组成共现矩阵,那么在关键词数据表中需要记录上述同一关键 词分别与其他关键词在已公开的专利申请文件中的共同出现次数。

第三建立单元用于根据基本检索字段数据表中分类号和关键词,建立第二信息表, 其中,第二信息表中包含每个分类号对应的关键词在已公开的专利申请文件中的共同 出现次数。具体地,第二信息表是以分类号为维度建立的信息表,每个分类号对应的 关键词为包含该分类号的专利申请文件中包含的关键词。在本发明实施例中,第二信 息表也可以叫做分类号-关键词数据表,本单元也就是,分类号-关键词数据表中以分 类号为维度,记录了每个分类号和与该分类号对应的关键词在已公开的专利申请文件 中的共同出现次数。

需要说明的是,一个分类号可能被多个专利申请文件包含,那么上述一个分类号 对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本 检索字段数据表中的同一分类号可以与基本检索字段数据表中多个关键词分别对应, 那么在分类号-关键词数据表中需要记录上述同一分类号分别与上述多个关键词中每 个关键词在已公开的专利申请文件中的共同出现频次。

第四建立单元用于根据基本检索字段数据表中申请人和关键词,建立第三信息表, 其中,第三信息表中包含每个申请人对应的关键词在已公开的专利申请文件中的共同 出现次数。具体地,第三信息表是以申请人为维度建立的信息表,每个申请人对应的 关键词为包含该申请人的专利申请文件中包含的关键词。在本发明实施例中,第三信 息表也可以叫做申请人-关键词数据表,本单元也就是申请人-关键词数据表中以申请 人为维度,记录了每个申请人和该申请人对应的关键词在已公开的专利申请文件中的 共同出现次数。

需要说明的是,一个申请人可能被多个专利申请文件包含,那么上述一个申请人 对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本 检索字段数据表中的同一申请人可以与基本检索字段数据表中多个关键词分别对应, 那么在申请人-关键词数据表中需要记录上述同一申请人分别与上述多个关键词中每 个关键词在已公开的专利申请文件中的共同出现次数。

例如:申请人为A公司,包含申请人为A公司的已公开的专利申请文件有两个, 分别是专利申请文件B和专利申请文件C,其中,专利申请文件B中包含的关键词为 手机和天线,专利申请文件C中包含的关键词为电脑,假设A公司和手机共同在25 篇已公开的专利申请文件中出现,A公司和天线共同在20篇已公开的专利申请文件中 出现,A公司和电脑共同在50篇已公开的专利申请文件中出现,那么在申请人-关键 词数据表中,记录A公司和手机的共同出现次数为25次,A公司和天线的共同出现次 数为20次,记录A公司和电脑的共同出现次数为50次。

具体地,本发明实施例所提供的专利检索装置还包括第一判断单元,其中,第一 判断单元用于在根据第一核心词和目标信息表确定第一联想词之前,判断第一核心词 的类型,其中,第一核心词的类型为关键词型、申请人型或分类号型;在判断出第一 核心词的类型为关键词型的情况下,确定目标信息表包括第一信息表、第二信息表和 第三信息表;在判断出第一核心词的类型为分类号型的情况下,确定目标信息表包括 第二信息表;在判断出第一核心词的类型为申请人型的情况下,确定目标信息表包括 第三信息表。

在本发明实施例中,通过判断第一核心词的类型,进而可以根据第一核心词的类 型确定目标信息表的范围,为后续确定与核心词为不同类型检索要素,但却具有关联 关系的联想词提供了数据基础。

根据上述内容可知,第一核心词的类型可以为三种类型,分别是关键词型、分类 号型和申请人型,不同类型的核心词对应的目标信息表的组成不同,以下分别针对第 一核心词的类型为关键词型、分类号型和申请人型时,对如何根据第一核心词和目标 信息表确定第一联想词进行具体介绍说明。

类型一:当第一核心词的类型为关键词型时,此时,第一联想词包括关键词型联 想词、分类号型联想词和申请人型联想词,第二确定单元30包括第二确定模块、第三 确定模块和第四确定模块,其中:

第二确定模块用于根据第一核心词和第一信息表通过第一推荐模型公式 recommend1word=get(maxn1(fre(word,word')))确定关键词型联想词,其中,word为第 一核心词,recommend1word为第一推荐模型公式的名称,word'为关键词型联想词,n1 为预设确定关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型 联想词word'在第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在第一 信息表中获取与第一核心词word共同出现次数最多的n1个关键词型联想词。在本模 块中,通过第一推荐模型公式实现了在第一信息表中获取与第一核心词共同出现次数 最多的n1个关键词型联想词。具体地,n1的具体数值可以根据需求设置。

假设:第一核心词word为汽车,n1设定为5,此时,上述第一推荐模型公式为 recommend1汽车=get(max5(fre(汽车,word'))),表示在第一信息表(即关键词数据表) 中获取与“汽车”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为 关键词型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第一信息表通过模型公式实现了对与第一 核心词为相同类型检索要素的确定。

第三确定模块用于根据第一核心词和第二信息表通过第二推荐模型公式 recommend2word=get(maxn2(fre(word,ipc)))确定分类号型联想词,其中,ipc为分类号 型联想词,recommend2word为第二推荐模型公式的名称,n2为预设确定分类号型联想 词的个数,fre(word,ipc)为第一核心词word与分类号型联想词ipc在第二信息表中的 共同出现次数,get(maxn2(fre(word,ipc)))为在第二信息表中获取与第一核心词word 共同出现次数最多的n2个分类号型联想词。在本模块中,通过第二推荐模型公式实现 了在第二信息表中获取与第一核心词共同出现次数最多的n2个分类号型联想词。同样 的,n2的具体数值也可以根据需求设置。

假设:第一核心词word为汽车,n2设定为5,此时,上述第二推荐模型公式为 recommend2汽车=get(max5(fre(汽车,ipc))),表示在第二信息表(即分类号-关键词数 据表)中获取与“汽车”共同出现次数排在前5名的分类号,上述排在前5名的分类 号即为分类号型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

第四确定模块用于根据第一核心词和第三信息表通过第三推荐模型公式 recommend3word=get(maxn3(fre(word,appl)))确定申请人型联想词,其中,appl为申 请人型联想词,recommend3word为第三推荐模型公式的名称,n3为预设确定申请人型 联想词的个数,fre(word,appl)为第一核心词word与申请人型联想词appl在第三信息 表中的共同出现次数,get(maxn3(fre(word,appl)))为在第三信息表中获取与第一核心 词word共同出现次数最多的n3个申请人型联想词。在本模块中,通过第三推荐模型 公式实现了在第三信息表中获取与第一核心词共同出现次数最多的n3个申请人型联 想词。同样的,n3的具体数值也可以根据需求设置。

假设:第一核心词word为汽车,n3设定为5,此时,上述第三推荐模型公式为 recommend3汽车=get(max5(fre(汽车,appl))),表示在第三信息表(即申请人-关键词数 据表)中获取与“汽车”共同出现次数排在前5名的申请人,上述排在前5名的申请 人即为申请人型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

类型二:当第一核心词的类型为分类号型时,此时,第一联想词包括关键词型联 想词,第二确定单元30包括第五确定模块,其中:

第五确定模块用于根据第一核心词和第二信息表通过第四推荐模型公式 recommendipc=get(maxn4(fre(ipc,word)))确定关键词型联想词,其中, recommendipc为第四推荐模型公式的名称,ipc为第一核心词,word为关键词型联想 词,n4为预设确定关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型 联想词word在第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在第二信 息表中获取与第一核心词ipc共同出现次数最多的n4个关键词型联想词。在本模块中, 通过第四推荐模型公式实现了在第二信息表中获取与第一核心词共同出现次数最多的 n4个关键词型联想词。同样的,n4的具体数值也可以根据需求设置。

假设:第一核心词ipc为AAA,n4设定为5,此时,上述第四推荐模型公式为 recommendAAA=get(max5(fre(AAA,word))),表示在第二信息表(即分类号-关键词数 据表)中获取与“AAA”共同出现次数排在前5名的关键词,上述排在前5名的关键词 即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

类型三:第一核心词的类型为申请人型时,此时,第一联想词包括关键词型联想 词,第二确定单元30包括第六确定模块,其中:

第六确定模块用于根据核心词和第三信息表通过第五推荐模型公式 recommendappl=get(maxn5(fre(appl,word)))确定关键词型联想词,其中, recommendappl为第五推荐模型公式的名称,appl为第一核心词,word为关键词型联 想词,n5为预设确定关键词型联想词的个数,fre(appl,word)为第一核心词appl与关 键词型联想词word在第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在第 二信息表中获取与第一核心词appl共同出现次数最多的n5个关键词型联想词。在本 模块中,通过第五推荐模型公式实现了在第三信息表中获取与第一核心词共同出现次 数最多的n5个关键词型联想词。同样的,n5的具体数值也可以根据需求设置。

假设:第一核心词appl为三星,n5设定为5,此时,上述第五推荐模型公式为 recommend三星=get(max5(fre(三星,word))),表示在第三信息表(即申请人-关键词数 据表)中获取与“三星”共同出现次数排在前5名的关键词,上述排在前5名的关键 词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。

在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一 核心词为不同类型检索要素的确定。

优选地,第三确定单元40包括获取模块、分类模块和生成模块,其中:

获取模块用于获取目标检索词的类型,其中,目标检索词为在词汇集合中已选定 作为检索元素的词,词汇集合为第一核心词和第一联想词组成的集合,本模块也就是 获取用户从第一核心词和第一联想词组成的集合中已选定作为检索元素词的类型。需 要说明的是,已选定的检索元素包括第一核心词和第一联想词,可以只包括第一核心 词,还可以只包括第一联想词,具体可以根据用户需求选择确定。

在本发明实施例中,由语义计算联想扩展获得的检索要素(即联想词)并不直接构 成检索式(即检索元素)参与检索,作为检索元素的联想词的选择,是开放给用户选 择的,从而达到了使整个检索过程可控的目的。

分类模块用于按照目标检索词的类型对目标检索词进行分类,得到不同的目标类 型,本模块也就是,对已选定作为检索元素的第一核心词和第一联想词、第一核心词 或者第一联想词进行分类,此时,不再对核心词和联想词进行区分。

需要说明的是,由于第一核心词和第一联想词的类型都为同样的三种类型,分别 是关键词型、申请人型和分类号型,所以目标类型最多也就分为三种类型,同样分别 是关键词型、申请人型和分类号型。

生成模块用于将相同目标类型下目标检索词按照逻辑或的关系连接,并将不同目 标类型下目标检索词按照逻辑与的关系连接生成搜索条件,也就是,每个相同目标类型 下的目标检索词间采用逻辑“OR”的连接关系,每个目标类型间采用逻辑“AND”的连 接关系。假设:在分类模块中得到的目标类型有三种,分别是关键词型、申请人型和 分类号型,关键词型包括两个关目标检索词,分别是汽车和电脑,申请人型包括一个 目标检索词:三星,分类号型包括一个目标检索词:AAA,那么上述目标检索词组成的 搜索条件为(汽车OR电脑)AND三星AND AAA。

需要说明的是,在具有本发明实施例的专利检索装置的专利检索系统中,当目标 类型为关键词型时,对该目标类型下的关键词(即目标检索词)的检索范围包括:标 题、摘要、主权项、权利要求书、说明书全文和附图说明;当目标类型为分类号型时, 对该目标类型下的分类号(即目标检索词)的检索范围包括:IPC分类号和主IPC;当 目标类型为申请人型时,对该目标类型下的申请人(即目标检索词)的检索范围包括: 申请人、发明人、专利权人和相关权利人。在本专利检索系统中,用户可以对已选定 的检索元素进行多次修改,以发送确定检索指令时对应选定的检索元素为准生成检索 条件。

在本发明实施例中,可以自动根据用户的选择,进行检索条件的组配关系,其结 果用户可调,达到了既不影响检索结果的可控性,又能帮助客户组配较为复杂的检索 逻辑的效果。

优选地,第一联想词为多个,本发明实施例所提供的专利检索装置还包括:第二 判断单元、第四确定单元和第五确定单元,其中:

第二判断单元用于在根据第一核心词和目标信息表确定第一联想词之后,判断是 否接收到联想指令,其中,联想指令为从多个第一联想词中选择任一第一联想词的指 令,本单元也就是,判断是否接收到从多个第一联想词中选择任意联想词进行联想的 指令。

第四确定单元用于在判断出接收到联想指令的情况下,确定联想指令所选择的第 一联想词为第二核心词,即,如果接收到从多个第一联想词中选择任意联想词进行联 想的指令,则将联想指令所选择的第一联想词作为新的核心词。

第五确定单元用于根据第二核心词和目标信息表确定与第二核心词具有关联关系 的第二联想词,其中,目标信息表中还存储有与第二核心词具有关联关系的第二联想 词,本单元同第二确定单元,具体确定第二联想词的过程同确定第一联想词的过程, 具体参考上述内容,此处不再重复说明。

此时,第三确定单元包括第七确定模块,第七确定模块用于根据第一核心词、第 二核心词、第一联想词和第二联想词确定检索条件。在本发明实施例中,根据第一核 心词、第二核心词、第一联想词和第二联想词确定检索条件的过程同第一核心词和第 一联想词确定检索条件的过程,在此不再重复说明。

需要说明的是,当第二联想词为多个时,还可以判断是否接收到从多个第二联想 词中选择任意联想词进行联想的指令,如果判断出接收到从多个第二联想词中选择任 意联想词进行联想的指令,那么可以将联想指令所选择的第二联想词作为第三核心词, 进而可以根据第三核心词和目标信息表确定与第三核心词具有关联关系的第三联想词, 所以依次类推,可以重复调用第二判断单元、第四确定单元和第五确定单元,得到多 个核心词和与该核心词具有关联关系的联想词。

在本发明实施例中,通过可以将联想词转变为新的核心词,从而得到与上述新的 核心词具有关联关系的联想词,实现了跨层次联想,不限于同级别的联想的效果,进 一步达到了提高用户满意度的效果,并为后续检索结果准确性提供了良好的基础。

在具有本发明实施例的专利检索装置的专利检索系统中,核心词和联想词均在可 视化搜索界面显示,具体地,以核心词为中心,联想词依次以圆形结构排列分布在核 心词周围。具体地,核心词用12号字显示,当核心词超过10个字时,则只显示三个 点。在该专利检索系统中,用户还可以对核心词执行搜索操作、修改操作和查看操作。 搜索操作用于以该核心词作为检索条件,检索得到预检结果,上述预检结果可以显示 全部检索结果的条目数,并显示检索结果的前五条内容,具体包括名称、申请号、当 前法律状态、专利类型以及摘要信息。该预检索结果通过浮窗的形式显示,用户可以 通过点击浮窗中的收起按钮将浮窗收起。修改操作用于回到初始的文本输入模式下, 也就是重新返回文本输入区,从而可对文本内容进行再次编辑。查看操作用于显示本 次输入的待检索的全部文本内容,主要用于当文本内容较长时的全文查看。

同样的,在本专利检索系统中,用户也可以对每个联想词进行一些操作,具体为 修改操作、检索操作、联想操作和删除操作。修改操作用于对当前得到的联想词进行 编辑修改;搜索操作用于以当前得到的某个联想词作为检索条件,检索得到预检结果, 同样的,该预检结果可以显示全部检索结果的条目数,并显示检索结果的前五条内容, 具体包括名称、申请号、当前法律状态、专利类型以及摘要信息。该预检索结果同样 可以通过浮窗的形式显示,用户可以通过点击浮窗中的收起按钮将浮窗收起。联想操 作用于以当前得到的某个联想词作为新的核心词,继续得到与该新的核心词具有关联 关系的联想词;删除操作用于删除当前得到的某个联想词。

在本专利检索系统中,当前核心词之前的核心词始终固定显示在可视化搜索界面 的固定区域,例如在左上角,当前核心词的上一个核心词用虚线和当前的核心词连接, 其它在固定区域的核心词之间用虚线连接,以表明层级关系。随着联想的逐级深入, 可在上述固定区域形成一棵联想树,该联想树记录了本次检索操作的整个扩展过程, 联想树的节点为每次进行联想操作的核心词,点击该联想树上的任意节点,上述任意 节点对应的核心词会再次展开显示,并用虚线连接该节点与其父节点、子节点的关系。 在本专利系统中,通过形成关于核心词的联想树,实现对检索操作过程的全程记录, 并起到了保证联想过程的可逆性和可重复性的效果。

优选地,本发明实施例所提供的专利检索装置还包括第二接收单元和第六确定单 元,其中,第二接收单元用于在根据第一核心词和目标信息表确定第一联想词之后, 接收更换指令;第六确定单元用于按照更换指令重新确定第一联想词;此时,第三确 定单元包括第八确定模块,第八确定模块用于根据第一核心词和第一联想词确定检索 条件包括:根据第一核心词和重新确定第一联想词确定检索条件。

在本发明实施例中,用户可以通过发送更换指令,实现对与当前核心词具有关联 关系的联想词进行更换的效果,并扩大了用户后续选取检索元素的选择范围。需要说 明的是,除核心词外,所有的联想词都会进行更换,具体每种类型联想词更换的数量 根据上述内容提供的模型公式决定,此时,检索条件根据当前核心词和更换后的联想 词确定。特别的,用户可以发送多次更换指令,检索条件由当前核心词和最后一次发 送更换指令后对应的联想词确定。

从以上的描述中,可以看出,本发明解决了现有技术中专利检索结果不准确的问 题,进而达到了提高专利检索结果准确性的效果。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有 详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它 的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分, 可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件 可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所 显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模 块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显 示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到 多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案 的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以 是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成 的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时, 可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质 上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的 形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一 台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所 述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘 等各种可以存储程序代码的介质。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润 饰也应视为本发明的保护范围。

本文发布于:2023-03-13 04:18:52,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/69142.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图