专利信息检索方法及装置

阅读: 评论:0

著录项
  • CN202210104438.9
  • 20220128
  • CN114416827A
  • 20220429
  • 江西知本位科技创业发展有限公司;江西金轩企业咨询集团有限公司
  • 蒋建飞;周沛奇;朱逸灵;祁科峰;孙文强
  • G06F16/2458
  • G06F16/2458 G06F16/248 G06N20/00

  • 江西省南昌市湾里区梅岭国家森林公园旁湾里新经济产业园8栋417
  • 江西(36)
  • 南昌金轩知识产权代理有限公司
  • 魏奇
摘要
本发明实施例公开了一种专利信息检索方法及装置,包括:获取针对第一专利索引库中的第一检索条件;根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息;根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息。如此,不仅使得可价值化专利的筛选工作变得简单而且效率更高,筛选结果也更加准确。
权利要求

1.一种专利信息检索方法,其特征在于,所述方法包括:

获取针对第一专利索引库中的第一检索条件;

根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息;

根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息。

2.根据权利要求1所述的方法,其特征在于,所述根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息,包括:

根据所述第一指标信息,确定各个所述第一指标信息的第一权重信息;

根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,确定基于所述第一检索条件所检索到的目标专利的价值信息;

根据所述目标专利的价值信息,从大到小排序得到所述目标专利的价值排序信息。

3.根据权利要求2所述的方法,其特征在于,所述根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,确定基于所述第一检索条件所检索到的目标专利的价值信息,包括:

根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,计算所述第一指标信息中的最优解的第一欧式距离,以及所述第一指标信息中的最劣解的第二欧式距离;

根据所述第一欧式距离与所述第二欧式距离,计算得到所述目标专利的价值信息。

4.根据权利要求2或3所述的方法,其特征在于,所述根据所述第一指标信息,确定各个所述第一指标信息的第一权重信息,包括:

根据所述第一指标信息,利用深度学习模型,确定各个所述第一指标信息的第一权重信息。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

根据第二检索条件在第二专利索引库中所检索到的样本专利,训练得到所述深度学习模型,其中,所述第一检索条件与所述第二检索条件的相关度满足预设条件。

6.根据权利要求5所述的方法,其特征在于,所述根据第二检索条件在第二专利索引库中所检索到的样本专利,训练得到所述深度学习模型,包括:

根据所述第二检索条件在第二专利索引库中所检索到的样本专利,提取所述样本专利的第二指标信息;

根据所述第二指标信息,确定各个所述第二指标信息的第二权重信息;

将所述第二指标信息作为所述深度学习模型的输入参数,将所述第二指标信息对应的所述第二权重信息作为所述深度学习模型的输出参数。

7.根据权利要求6所述的方法,其特征在于,所述根据所述第二指标信息,确定各个所述第二指标信息的第二权重信息,包括:

根据所述第二指标信息,确定所述第二指标信息的归一化信息;

根据所述第二指标信息的归一化信息,确定各个所述第二指标信息的权重信息。

8.一种专利信息检索装置,其特征在于,所述装置包括:

获取模块,用于获取针对专利索引库的第一检索条件;

第一确定模块,用于根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息;

第二确定模块,用于根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息。

9.一种计算机设备,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中所述处理器用于运行所述计算机程序时,实现权利要求1至7任一项所述的专利信息检索方法。

10.一种计算机存储介质,其特征在于,包括:所述可执行程序被处理器执行时,实现如权利要求1至7任一项所述的专利信息检索方法。

说明书
技术领域

本发明涉及计算机技术领域,尤其涉及一种专利信息检索方法及装置。

专利,从字面上是指专有的权利和利益。专利与企业的利益密不可分,企业通常会对自己将要上市的产品进行专利布局。现如今,高校科技成果转化工作愈发受到重视,因此高校的专利申请也越来越多,从而存在高校的专利数量巨大,技术领域复杂多样等现状。然而,面临这种现状,如何更好地协助高校快速筛选出真正具有潜在可转化的专利成为了亟需解决的技术问题。

为解决现有存在的技术问题,本发明实施例提供了一种专利信息检索方法、装置及计算机存储介质。

为达到上述目的,本发明实施例的技术方案是这样实现的:

本发明实施例提供了一种专利信息检索方法,所述方法包括:

获取针对第一专利索引库中的第一检索条件;

根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息;

根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息。

可选的,所述根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息,包括:

根据所述第一指标信息,确定各个所述第一指标信息的第一权重信息;

根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,确定基于所述第一检索条件所所检索到的目标专利的价值信息;

根据所述目标专利的价值信息,从大到小排序得到所述目标专利的价值排序信息。

可选的,所述根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,确定基于所述第一检索条件所检索到的目标专利的价值信息,包括:

根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,计算所述第一指标信息中的最优解的第一欧式距离,以及所述第一指标信息中的最劣解的第二欧式距离;

根据所述第一欧式距离与所述第二欧式距离,计算得到所述目标专利的价值信息。

可选的,所述根据所述第一指标信息,确定各个所述第一指标信息的第一权重信息,包括:

根据所述第一指标信息,利用深度学习模型,确定各个所述第一指标信息的第一权重信息。

可选的,所述方法还包括:

根据所述第二检索条件在第二专利索引库中所检索到的样本专利,训练得到所述深度学习模型,其中,所述第一检索条件与所述第二检索条件的相关度满足预设条件。

可选的,所述根据第二检索条件在第二专利索引库中所检索到的样本专利,训练得到所述深度学习模型,包括:

根据所述第二检索条件在第二专利索引库中所检索到的样本专利,提取所述样本专利的第二指标信息;

根据所述第二指标信息,确定各个所述第二指标信息的第二权重信息;

将所述第二指标信息作为所述深度学习模型的输入参数,将所述第二指标信息对应的所述第二权重信息作为所述深度学习模型的输出参数。

可选的,所述根据所述第二指标信息,确定各个所述第二指标信息的第二权重信息,包括:

根据所述第二指标信息,确定所述第二指标信息的归一化信息;

根据所述第二指标信息的归一化信息,确定各个所述第二指标信息的权重信息。

本发明实施例还提供一种专利信息检索装置,所述装置包括:

获取模块,用于获取针对专利索引库的第一检索条件;

第一确定模块,用于根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息;

第二确定模块,用于根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息。

本发明实施例还提供一种计算机设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中所述处理器用于运行所述计算机程序时,实现如上述所述的专利信息检索方法。

本发明实施例还提供一种计算机存储介质,存储有可执行程序,所述可执行程序被处理器执行时,实现如上述所述的专利信息检索方法。

上述实施例所提供的专利信息检索方法、装置、计算机设备及计算存储介质,由计算机设备执行,通过获取针对第一专利检索库中的第一检索条件;然后根据第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息,最后基于第一指标信息,来确定基于所述第一检索条件所检索到的目标专利的价值排序信息,从而可以根据目标专利的价值排序信息,智能地为目标专利进行价值评估排序,从而协助选择出排序在前的专利作为潜在可转化的专利。相比现有技术中,需要人工从众多的专利以及众多的专利评价指标中进行专利价值的评估来到价值靠前的潜在可转化的专利而言,本实施例提供的方式能够一方面能够智能地根据检索条件,得到评价专利价值的指标信息,从而减少一些不必要的指标信息的干扰,二方面,能够基于这些准确的指标信息对所检索到的目标专利进行价值排序,从而能够更为准确地的得到潜在可转化的专利。如此,不仅使得可价值化专利的筛选工作变得简单而且效率,筛选结果也更加准确。

图1为本发明一实施例所提供的专利信息检索方法的流程示意图;

图2为本发明一实施例所提供的专利信息检索方法的另一流程示意图;

图3为本发明一实施例所提供的专利信息检索装置的功能结构示意图;

图4为本发明一实施例所提供的计算机设备的硬件结构示意图。

以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。

需要说明的是,现目前高校科技成果转化工作愈发受到重视,当前大部分高校成果管理工作存在着管理专利数量巨大、涉及技术领域复杂多样、对人员综合能力素质要求高与实际管理人员少、待遇相对差、高校专利运营经费少的矛盾,导致大量的存量专利不能得到很好的挖掘、筛选、布局与培育。

基于此,有必要提出一种简便有效的筛选潜在可转化专利的方法,以提升现有高校专利管理工作的效率。

本实施例中应用在专利检索的应用场景中,主要应用于检索专利所承载的终端或者相关应用软件或者网站的服务商所提供的服务器。示例性的,该方法是由计算机设备执行的。这里的计算机设备可以为任何能够与专利索引库通信的终端设备。该终端设备可以为服务器等。示例性的,该终端例如可以是台式电脑、笔记本电脑、一体机、手机或者平板电脑等。

示例性的,以下结合说明书附图及具体实施例对本发明技术方案做进一步的详细阐述。

本发明实施例提供一种专利信息检索方法,由计算机设备执行,图1为本发明一实施例所提供的专利信息检索方法的流程示意图,如图1所示,所述方法包括以下步骤:

步骤101:获取针对第一专利索引库中的第一检索条件;

步骤102:根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息;

步骤103:根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息。

这里,第一专利索引库,可以是仅针对高校的专利索引库。当然,对于一些专利由于是高校与企业的联合申报,为了能够更准确地筛选出有价值的专利,第一专利索引库也可以是针对国内专利的专利索引库。在另一些实施例中,第一专利索引库还可以是针对世界专利的专利索引库。

第一检索条件,包括在搜索终端输入的搜索关键词或者其他限定条件,例如限定的代理机构,或者限定的申请人等限定条件。

需要说明的是,不同的第一检索条件对于需要作为评价专利价值的第一指标信息不同。

示例性的,对于一些企业的专利而言,在评估企业的专利是否具有潜在可转化的价值时,往往会将专利记载的内容,专利的年限等等作为评价的指标。而对于高校的专利而言,由于高校为事业单位,不进行生产经验,不参与商业竞争,其专利基本上不进行海关备案,面临无效、诉讼的风险也很低,因此,有一些指标并不适合于高校专利的评价。例如,引证文献的平均年龄、专利说明书附图数量、独立权利要求数量等这些指标可以不作为评价高校的专利的可价值性的指标。基于此,本实施例中,会根据第一检索条件,智能地配置出与第一检索条件相匹配的用于评价专利价值的第一指标信息,从而减少无效指标信息的引入造成的专利价值评估的复杂性和不准确性的现象。

可以理解的是,第一检索条件与所述第一检索条件匹配的第一指标信息的对应关系可以预先存储在计算机设备中。

所述根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息,包括:

根据所述第一检索条件,确定所述第一检索条件中针对申请人的检索关键词;若针对申请人的检索关键词指示所检索的申请人为高校,则确定与高校相匹配的用于评价专利价值的第一指标信息。

示例性的,高校的检索条件下,对应的指标信息可以包括但不限于:简单同族数量、扩展同族数量、被引证次数、引证次数、家族被引证次数、家族引证次数、发明人数量、申请人数量、IPC分类数量、权利要求数量、文献页数、独权字数以及同族国家数量。

需要说明的是,简单同族数量,是指以共同的一个或共同的几个专利申请为优先权的专利族成员数量,可知,简单同族数量能够反映专利申请的布局情况和专利对申请人的保护价值。扩展同族数量,是指扩展专利族中每个专利族成员与该组中的至少一个其他专利族成员至少共同以一个专利申请为优先权,可知,扩展同族数量也能够反映专利申请的布局情况和专利对申请人的保护价值。同族国家数量,是指在其他国家申请该专利的国家数量,显然,同族国家数量也能够反应专利应用的地域布局情况及其对申请人的保护价值。引证次数,是指专利说明书中引用其他专利文献的数量,如此,能够反映专利技术与现有技术的关联情况。被引证次数,是指专利被其他文献的引用次数,如此,能够反映专利文献对后续技术或市场的影响力。家族引证次数,是指同族专利中引用其他专利文献的总和,如此也能反映出专利技术与现有技术的关联情况。家族被引证次数,是指同族专利被其他文献引用的次数总和,如此,也能够反映专利文献对后续技术或市场的影响力。发明人数量,也能够反应出专利技术的技术投入。申请人数量,也能反映出专利技术的技术投入和对市场的影响力。IPC分类数量,能够反映出专利技术方案应用领域的广泛程度。权利要求数量,能够反映权利稳定性、专利保护范围和保护的技术方案的数量。文献页数,能够反映出专利技术方案的复杂程度和权利稳定性。独权字数,能够反映专利保护范围。

可以理解的是,上述指标信息中,除了独权字数,其他的指标信息的指标值与专利价值都是正相关的。示例性的,权利要求数量越多,则反映专利保护的技术方案多,从属权利要求层次结构更健全,相对稳定性好,且权利要求大于10项后将产生附加费,说明成果持有人愿意付出更多的成本进行专利保护;又如申请人数量较多则说明技术投入更大,且一般高校联合申请人多为企业,也能说明该成果更贴近市场需求;被引证次数越多则说明专利文献对后续技术或市场的影响力较大,可能作为原始的基本专利而对后续改良技术进行统治力;而独权字数这一指标信息的指标值与专利价值是反相关的,独权字数越多意味着很可能技术方案需要的必要技术特征多,导致权利要求保护范围相对较小,故在授权专利的研究中,独权字数这一指标信息的指标值与专利价值是反相关的。

当然,如果第一检索条件不为高校,则对应的评价专利价值的第一指标信息也有所不同。如此,能够准确地得到所定位的范围的专利的价值排序。

上述实施例中,通过获取针对第一专利检索库中的第一检索条件;然后哦根据第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息,最后基于第一指标信息,来确定基于第一检索条件所检索到的目标专利的价值排序信息,从而可以根据目标专利的价值排序信息,智能地为目标专利进行价值评估排序,从而协助选择出排序在前的专利作为潜在可转化的专利。相比现有技术中,需要人工从众多的专利以及众多的专利评价指标中进行专利价值的评估来到价值靠前的潜在可转化的专利而言,本实施例提供的方式能够一方面能够智能地根据检索条件,得到评价专利价值的指标信息,从而减少一些不必要的指标信息的干扰,二方面,能够基于这些准确的指标信息对所检索到的目标专利进行价值排序,从而能够更为准确地的得到潜在可转化的专利。如此,不仅使得可价值化专利的筛选工作变得简单而且效率,筛选结果也更加准确。

请参阅图2,图2为本发明一实施例所提供的专利信息检索方法的另一流程示意图,如图2所示,所述步骤103,即所述根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息,包括:

步骤1031:根据所述第一指标信息,确定各个所述第一指标信息的第一权重信息;

步骤1032:根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,确定基于所述第一检索条件所检索到的目标专利的价值信息;

步骤1033:根据所述目标专利的价值信息,从大到小排序得到所述目标专利的价值排序信息。

需要说明的是,不同的第一指标信息对应的权重不同,例如,独权字数的权重可以设置的最低。

示例性的,所述根据所述第一指标信息,确定各个所述第一指标信息的第一权重信息,包括:根据所述第一指标信息的标识,从所述第一指标信息的标识与第一权重信息的对应表中,确定出所述第一指标信息的标识对应的第一权重信息。

这里,第一指标信息的标识可以是用于标识第一指标信息的字母或数字,或者名称等。

本实施例中,通过引入各个第一指标信息对应的第一权重信息,来最终确定第一检索条件所检索到的目标专利的价值信息,能够得到更加准确地的目标专利的价值信息。

在另一些实施例中,所述根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,确定基于所述第一检索条件所检索到的目标专利的价值信息,包括:

根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,计算所述第一指标信息中的最优解的第一欧式距离,以及所述第一指标信息中的最劣解的第二欧式距离;

根据所述第一欧式距离与所述第二欧式距离,计算得到所述目标专利大额价值信息。

示例性的,表1为第一指标信息与第一权重信息的对应表;

第一指标信息 第一权重信息 家族被引证次数 22.91% 被引证次数 9.26% 申请人数量 34.26% 发明人数量 25.06% IPC数量 8.49%

表1

获得权重后,即可计算各组第一指标信息相对于最优解及最劣解在CRITIC权重下的欧式距离,具体计算如下:

其中,j表示某个评价指标,m表示评价指标个数(本实施例中取5个为例),Wj表示相应指标的权重,表示第j个指标的最优(劣)值,aij表示被评价第i个专利的第j个指标的数值。此两值的实际意义是评价对象与最优或最劣解的距离,值越大说明距离越远,研究对象D+值越大,说明与最优解距离越远;D-值越大,说明与最劣解距离越远。最理想的研究对象是D+值越小同时D-值越大。

通过相对接近度C的计算来对所有专利进行价值排序。C的计算公式为:

C=D-/(D++D-)

C值越大说明该专利潜在许可转让价值越高。对所有样本专利的C值进行排序,即获得专利潜在许可转让价值的排名情况。

如此,本实施例中,利用CRITIC权重下的欧式距离的计算方式,能够更加准确地得到目标专利的价值信息,从而基于价值信息得到目标专利的价值排序信息。

在另一些实施例中,所述方法还包括:

基于所述价值排序信息,确定所述目标专利在专利检索应用界面的显示顺序;

将所述显示顺序发送至终端,所述显示顺序用于供所述终端按照所述显示顺序显示所述目标专利的专利信息。

如此,能够帮助专利检索人员能够迅速基于第一检索条件,检索到按照价值排序的目标专利。

在一些实施例中,所述步骤1021,即所述根据第一指标信息,确定各个所述第一指标信息的第一权重信息,包括:

根据所述第一指标信息,利用深度学习模型,确定各个所述第一指标信息的第一权重信息。

这里,该深度学习模型的输入参数是第一指标信息,输出参数则是第一指标信息的第一权重信息。通过深度学习模型中确定第一指标信息的第一权重信息,相比利用简单的第一指标信息的标识与第一权重信息的固定的对应表而言,能够更加准确地基于大数据得到第一指标信息的第一权重信息,从而得到准确的第一权重信息,从而为后续准确地得到目标专利的价值信息提供有利基础。

在一些实施例中,所述方法还包括:

根据第二检索条件在第二专利索引库中所检索到的样本专利,训练得到所述深度学习模型,其中,所述第一检索条件与所述第二检索条件的相关读满足预设条件。

这里的第二专利索引库的专利数量可以比第一专利索引库的专利数量大。这里的第一检索条件可以是包含第二检索条件的检索条件。

如此,通过比第一专利索引库的专利数量大,以及检索范围更大的检索条件,所检索得到的专利作为样本专利,来训练得到所述深度学习模型,能够减少信息的遗漏,帮助得到更为准确的输入输出参数。

当然,在另一些实施例中,所述第二专利索引库也可以是第一专利索引库,或者与第一专利索引库具有相同性质的专利索引库。如此,能够通过对相似专利样本的分析,从而得到更为精准的输入输出参数。

示例性的,以《中国科技成果转化2020年度报告》中全国高校科技成果转化合同金额排名前四名的清华大学、浙江大学、上海交通大学和同济大学的发明专利为研究对象,并选取这四所大学2012年1月至2018年12月31日之间所有授权的发明的专利作为样本数据。该选取样本的几点考虑:此四所大学的科技成果转化合同金额连续多年居于全国前列,说明其科技成果质量较高,在国内处于领先水平,具有代表性;这四所高校的发明专利授权数量、许可及转让专利数量均较大,即样本量足够大,有利于对专利数据进行统计分析,避免小样本带来的模型可靠性差等问题;考虑到发明专利与实用新型专利在专利保护客体、公开时间、实质审查、有效期限等许多方面均有较大区别,会导致多项评估指标随着专利类型呈现较大差异,不适宜将两者简单进行比较,因此本实施例中仅选取发明专利作为样本专利;考虑到近年来我国知识产权事业进步较快,各主体专利申请质量不断提升,不宜将申请时间相距过久的专利进行简单比较。且经数据统计,这四所高校发明专利一般在其授权后的5~8年达到转让许可的高峰.因此选取2012~2018年获得授权的专利作为样本专利,如此,获得了36071件发明专利数据,该总样本专利用编号O标记。在总体样本O中,筛选出2012-2018年间发生许可或转让的专利共1950件,组成样本A,作为高价值专利样本。筛选出未发生许可转让且在2018年12月31日前已经失效的专利,构成样本C,此部分专利对高校而言已没有管理需求。在样本C中,继续筛选专利失效时寿命小于等于3年的专利,组成样本C1。样本C1表示获得申请并获得授权后,短时间内(3年以内)即放弃维持的专利,说明这些专利的发明人认为这些专利没有继续维持的必要,也就间接说明这些专利的转化价值较低,因此样本C1可作为低价值专利样本。样本C中除去样本C1后的其余专利组成样本C2。在总样本中,除去样本A与C的专利,组成样本B,表示尚未失效、具备许可转让潜力的样本。另外,为了使得深度学习模型的样本更具可研性,本实施例中通过获得了上述四所高校从2019年1月1日至2021年12月31日获得授权的专利,共26011件,组成样本P,并对其中截至2021年12月31前已发生许可或转让的643件专利进行了标记。

对这些样本专利进行分析,综合上述的各个指标信息,得到各个指标信息的权重信息。从上述示例的样本来看,只需要进行家族被引证次数、申请人个数、发明人个数,被引证次数、IPC数量这五个指标能够用于在一般专利中筛选出潜在许可转让的专利。

如此,本实施例中,通过样本专利对深度学习模型的训练,准确地得到第二指标信息在深度学习模型中输出的第二权重信息,从而将一些无效的第二指标信息,或者权重较低的指标信息排除,从而能够利用深度学习模型快速得到第一指标信息的第一权重信息,从而为基于第一指标信息以及第一指标信息的第一权重信息计算得到目标专利的价值信息提供有利基础。

在另一些实施例中,所述根据所述第二指标信息,确定各个所述第二指标信息的第二权重信息,包括:

根据所述第二指标信息,确定所述第二指标信息的归一化信息;

根据所述第二指标信息的归一化信息,确定各个所述第二指标信息的权重信息。

示例性的,仍以上述样本为例,表2为家族被引证次数编码规则:

表1

编码过程将全部家族被引证次数分为10个分组,每组的编码即为其对应的A样本出现概率的百分值,这种编码方式既能够满足TOPSIS对指标正向化的要求,避免了奇异样本数据的产生,也能够有效反映出不同家族被引证次数对A样本出现概率的影响。

采用相同的方式对其余4个评价指标进行编码,如表3~表4所示,最终获得编码后的5项指标数据。

表3被引证次数编码规则

表4申请人数量编码规则

表5发明人数量编码规则

表6 IPC数量编码规则

在对所有指标进行重新编码后,对指标进行归一化处理建立规范化决策矩阵,本实施例中通过常见的平方和归一化方式进行归一化,其公式为:

式中,n为样本总数,对应于样本O,n=36071。由于n值数量较大,本文中未展示鞠策矩阵具体数值。归一化后各指标最大值及最小值如表7所示,根据其值可确定TOPSIS算法中的最优解及最劣解。

表7归一化后各评价指标在总样本O中最大值与最小值情况

为保证指标权重的客观性,本实施例采用CRITIC权重法对各指标进行赋权,CRITIC权重法基于评价指标的对比强度和指标之间的冲突性来综合衡量指标权重,是一种比熵权法和标准离差法更好的客观赋权法。

本实施例中通过SPSS数据分析软件对归一化后的指标进行CRITIC赋权,其计算结果如表8所示。

表8归一化后各评价指标CRITIC权重计算结果

本实施例中,通过将第二指标信息进行归一化,得到第二指标信息的归一化信息,并根据第二指标信息的归一化信息,确定各个第二指标信息的权重信息,能够简化计算,且得到更为准确的权重信息。

需要补充的是,上述实施例可以独立实施,也可以任何组合实施,在此不作任何限定。

如图3所示,本发明实施例还提供了一种专利信息检索装置,所述装置包括:

获取模块31,用于获取针对专利索引库的第一检索条件;

第一确定模块32,用于根据所述第一检索条件,确定与所述第一检索条件相匹配的用于评价专利价值的第一指标信息;

第二确定模块33,用于根据所述第一指标信息,确定基于所述第一检索条件所检索到的目标专利的价值排序信息。

在一些实施例中,所述第二确定模块33,还用于:

根据所述第一指标信息,确定各个所述第一指标信息的第一权重信息;

根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,确定基于所述第一检索条件所检索到的目标专利的价值信息;

根据所述目标专利的价值信息,从大到小排序得到所述目标专利的价值排序信息。

在一些实施例中,所述第二确定模块33,还用于:

根据所述第一指标信息以及所述第一指标信息对应的第一权重信息,计算所述第一指标信息中的最优解的第一欧式距离,以及所述第一指标信息中的最劣解的第二欧式距离;

根据所述第一欧式距离与所述第二欧式距离,计算得到所述目标专利的价值信息。

在一些实施例中,所述第二确定模块33,还用于:

根据所述第一指标信息,利用深度学习模型,确定各个所述第一指标信息的第一权重信息。

在一些实施例中,所述装置还包括:

训练模块,用于根据第二检索条件在第二专利索引库中所检索到的样本专利,训练得到所述深度学习模型,其中,所述第一检索条件与所述第二检索条件的相关度满足预设条件。

在一些实施例中,所述训练模块,还用于:

根据所述第二检索条件在第二专利索引库中所检索到的样本专利,提取所述样本专利的第二指标信息;

根据所述第二指标信息,确定各个所述第二指标信息的第二权重信息;

将所述第二指标信息作为所述深度学习模型的输入参数,将所述第二指标信息对应的所述第二权重信息作为所述深度学习模型的输出参数。

在一些实施例中,所述训练模块,还用于:

根据所述第二指标信息,确定所述第二指标信息的归一化信息;

根据所述第二指标信息的归一化信息,确定各个所述第二指标信息的权重信息。

这里需要指出的是:以上专利信息检索装置项的描述,与上述专利信息检索方法项描述是类似的,同方法的有益效果描述,不做赘述。对于本发明专利信息检索装置实施例中未披露的技术细节,请参照本发明应用于专利信息检索方法实施例的描述。

如图4所示,本发明实施例还提供了一种计算机设备,所述计算机设备包括存储器42、处理器41及存储在存储器42上并可在处理器41上运行的计算机指令;所述处理器41执行所述指令时实现应用于所述专利信息检索方法的步骤。

在一些实施例中,本发明实施例中的存储器42可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable ROM,PROM)、可擦除可编程只读存储器(Erasable PROM,EPROM)、电可擦除可编程只读存储器(Electrically EPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(Random Access Memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,SRAM)、动态随机存取存储器(Dynamic RAM,DRAM)、同步动态随机存取存储器(Synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(Double DataRate SDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(Enhanced SDRAM,ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM,DRRAM)。本文描述的系统和方法的存储器42旨在包括但不限于这些和任意其它适合类型的存储器。

而处理器41可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器41中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器41可以是通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(FieldProgrammable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器42,处理器41读取存储器42中的信息,结合其硬件完成上述方法的步骤。

在一些实施例中,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(Application Specific Integrated Circuits,ASIC)、数字信号处理器(Digital SignalProcessing,DSP)、数字信号处理设备(DSP Device,DSPD)、可编程逻辑设备(ProgrammableLogic Device,PLD)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、通用处理器、控制器、微控制器、微处理器、用于执行本申请所述功能的其它电子单元或其组合中。

对于软件实现,可通过执行本文所述功能的模块(例如过程、函数等)来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。

本发明又一实施例提供了一种计算机存储介质,该计算机可读存储介质存储有可执行程序,所述可执行程序被处理器41执行时,可实现如图1或图2所述的专利信息检索方法的步骤。

在一些实施例中,所述计算机存储介质可以包括:U盘、移动硬盘、只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是:本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

本文发布于:2023-03-13 03:00:45,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/68974.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图