一种知识产权信息处理方法和装置

阅读: 评论:0

著录项
  • CN201910159608.1
  • 20190304
  • CN110083674A
  • 20190802
  • 温州涌润信息科技有限公司
  • 卢健;包观串;吴青青
  • G06F16/31
  • G06F16/31 G06F16/951 G06Q50/18

  • 浙江省温州市瓯海区仙岩街道繁荣北路88号第一层前半间
  • 浙江(33)
  • 北京睿博行远知识产权代理有限公司
  • 龚家骅
摘要
本发明属于数据处理领域,尤其涉及一种知识产权信息处理方法和装置,步骤一、构建专利信息库;步骤二、从专利数据库中爬取自身的专利信息,采用步骤一中的方法形成自身专利信息库;步骤三、设置竞争对手信息,从专利数据库中爬取竞争对手的专利信息,采用步骤一中的方法形成竞争对手专利信息库;步骤四、按照分类号索引,交叉比对自身专利信息库和竞争对手专利信息库,得出方向相似性和专利相似性;步骤五、可视化方向相似性的排序情况;本申请从分类号、个体专利两个角度对企业和其竞争对手的专利布局情况进行分析,计算方向相似性和专利相似性指导企业对自身的研发方向和专利布局进行调整,实现智能化的知识产权信息处理分析。
权利要求

1.一种知识产权信息处理方法,其特征在于,所述方法包括以下步骤:

步骤一、构建专利信息库:根据国际分类表,构建分类号的多叉树索引,并且为每个分类号对应分配一个存储空间,用于存储分类号对应的分类号语义向量,预先按照分类号定义提取分类号的关键词,存储至分类号语义向量中,从而构建分类号索引表;根据从专利数据库爬取的专利信息,对分类号索引表中的分类号语义向量进行补充;并针对每个爬取的专利,采用文本向量生成方法生成专利语义向量,生成专利信息库;

步骤二、从专利数据库中爬取自身的专利信息,采用步骤一中的方法形成自身专利信息库;

步骤三、设置竞争对手信息,从专利数据库中爬取竞争对手的专利信息,采用步骤一中的方法形成竞争对手专利信息库;

步骤四、按照分类号索引,交叉比对自身专利信息库和竞争对手专利信息库,得出方向相似度和专利相似度;其中,交叉比对包括遍历两个信息库中相同分类号中的各个专利,根据专利语义向量计算专利相似性,以及两个信息库中相同分类号,根据分类号语义向量计算方向相似性;

步骤五、可视化方向相似性的排序情况,用户可根据方向相似性的排序调整研发方向;根据专利相似性,给出专利的授权期望值,用户可参考该值确定专利的处理方式。

2.如权利要求1所述的方法,其特征在于,步骤一中,在补充分类号语义向量时,利用专利已给出的分类号信息,根据专利给出的关键词对相应的分类号语义向量补充更新,并且根据关键词来源调整关键词在语义向量中的权重,关键词来源包括摘要、背景技术、权利要求、说明书,对于提取自摘要、背景技术的关键词设置更高的权重信息。

3.如权利要求1所述的方法,其特征在于,步骤三中,竞争对手信息可动态调整。

4.如权利要求1所述的方法,其特征在于,步骤四中,方向相似性可分为大组相似性和小组相似性。

5.如权利要求1所述的方法,其特征在于,该方法还包括对于待提交的技术方案,提取该文件的文本向量,分别与各分类号语义向量计算相似度,将相似度超过一定阈值的分类号作为该方案的推荐分类号,并根据该推荐分类号的方向相似性,确定是否将该方案提交专利申请。

6.一种知识产权信息处理装置,其特征在于,包括如下模块:

信息库构建模块,用于构建专利信息库:根据国际分类表,构建分类号的多叉树索引,并且为每个分类号对应分配一个存储空间,用于存储分类号对应的分类号语义向量,预先按照分类号定义提取分类号的关键词,存储至分类号语义向量中,从而构建分类号索引表;根据从专利数据库爬取的专利信息,对分类号索引表中的分类号语义向量进行补充;并针对每个爬取的专利,采用文本向量生成方法生成专利语义向量,生成专利信息库;

自身专利信息库生成模块,用于从专利数据库中爬取自身的专利信息,采用步骤一中的方法形成自身专利信息库;

竞争对手专利信息库生成模块,用于设置竞争对手信息,从专利数据库中爬取竞争对手的专利信息,形成竞争对手专利信息库;

相似性计算模块,用于按照分类号索引,交叉比对自身专利信息库和竞争对手专利信息库,得出方向相似性和专利相似性;其中,交叉比对包括遍历两个信息库中相同分类号中的各个专利,根据专利语义向量计算专利相似性,以及两个数据库中相同分类号,根据分类号语义向量计算方向相似性;

可视化模块,用于可视化方向相似性的排序情况,用户可根据方向相似性的排序调整研发方向;根据专利相似性,给出专利的授权期望值,用户可参考该值确定专利的处理方式。

7.如权利要求6所述的装置,其特征在于,信息库构建模块还包括在补充分类号语义向量时,利用专利已给出的分类号信息,根据专利给出的关键词对相应的分类号语义向量补充更新,并且根据关键词来源调整关键词在语义向量中的权重,关键词来源包括摘要、背景技术、权利要求、说明书,对于提取自摘要、背景技术的关键词设置更高的权重信息。

8.如权利要求6所述的装置,其特征在于,竞争对手专利信息库生成模块中竞争对手信息可动态调整。

9.如权利要求6所述的装置,其特征在于,相似性计算模块中方向相似性可分为大组相似性和小组相似性。

10.如权利要求6所述的装置,其特征在于,该装置还包括分析模块,用于对于待提交的技术方案,提取该文件的文本向量,分别与各分类号语义向量计算相似度,将相似度超过一定阈值的分类号作为该方案的推荐分类号,并根据该推荐分类号的方向相似性,确定是否将该方案提交专利申请。

说明书
技术领域

本发明属于数据处理领域,尤其涉及一种知识产权信息处理方法和装置。

目前,大众对于知识产权的保护意识越来越强,对于科技企业来说,专利是保护自主创新的有效手段,然而,现有技术中,企业主要通过对申请后的专利进行收集,人工进行分析处理,耗时耗力,缺乏对专利进行智能分析的有效手段,使得企业在进行专利布局和技术研发方向上缺乏指导。

本发明提出一种知识产权信息处理方法和装置,用于解决如何对知识产权信息进行智能处理这一技术问题,使得企业前瞻性地了解当前行业技术发展和专利布局情况。

本发明通过如下方式实现知识产权信息的智能处理,包括:

步骤一、构建专利信息库:根据国际分类表,构建分类号的多叉树索引,并且为每个分类号对应分配一个存储空间,用于存储分类号对应的分类号语义向量,预先按照分类号定义提取分类号的关键词,存储至分类号语义向量中,从而构建分类号索引表;根据从专利数据库爬取的专利信息,对分类号索引表中的分类号语义向量进行补充;并针对每个爬取的专利,采用文本向量生成方法生成专利语义向量,生成专利信息库;

步骤二、从专利数据库中爬取自身的专利信息,采用步骤一中的方法形成自身专利信息库;

步骤三、设置竞争对手信息,从专利数据库中爬取竞争对手的专利信息,形成竞争对手专利信息库;

步骤四、按照分类号索引,交叉比对自身专利信息库和竞争对手专利信息库,得出方向相似性和专利相似性;其中,交叉比对包括遍历两个信息库中相同分类号中的各个专利,根据专利语义向量计算专利相似性,以及两个信息库中相同分类号,根据分类号语义向量计算方向相似性;

步骤五、可视化方向相似性的排序情况,用户可根据方向相似性的排序调整研发方向;根据专利相似性,给出专利的授权期望值,用户可参考该值确定专利的处理方式。

同时,本发明中还包括对于待提交的技术方案,提取该方案的文本向量,分别与各分类号语义向量计算相似度,将相似度超过一定阈值的分类号作为该方案的推荐分类号,并根据该推荐分类号的方向相似性,确定是否将该方案提交专利申请。

本申请从分类号、个体专利两个角度对企业和其竞争对手的专利布局情况进行分析,计算方向相似性和专利相似性指导企业对自身的研发方向和专利布局进行调整,并能够对待提交的技术方案智能分析其专利化的可能性,避免企业浪费不必要的申请费用,实现智能化的知识产权信息处理分析。

图1是本发明的方法流程图

图2是本发明的装置结构图

下面结合附图,对实施例作详细说明。

如图1所示的本发明的方法流程图:

步骤一、构建专利信息库:根据国际分类表,构建分类号的多叉树索引,并且为每个分类号对应分配一个存储空间,用于存储分类号对应的分类号语义向量,预先按照分类号定义提取分类号的关键词,存储至分类号语义向量中,从而构建分类号索引表;根据从专利数据库爬取的专利信息,对分类号索引表中的分类号语义向量进行补充;并针对每个爬取的专利,采用文本向量生成方法生成专利语义向量,生成专利信息库;

在建立基于IPC分类表的多叉树索引时,根节点为分类号的部索引,为每个部建立一个根节点,按照IPC的大类、小类、大组、小组的顺序,依次进行多叉树的划分,为每个节点生成对应的分类号语义向量,并实时进行更新,可以指导后续对其它专利信息的分类;同时分类号索引表可根据需要只选择一部分进行构建,可根据企业具体研究领域而定,从而减少数据处理量。

在补充分类号语义向量时,利用专利已给出的分类号信息,根据专利给出的关键词对相应的分类号语义向量补充更新,并且根据关键词来源调整关键词在语义向量中的权重,关键词来源包括摘要、背景技术、权利要求、说明书,摘要信息中涉及专利的发明点信息,而背景技术更能反映专利所属领域信息,因此,对于提取自摘要、背景技术的关键词设置更高的权重信息。

所述的文本向量生成方法可采用公知的各种文本向量生成方法,如神经网络,doc2vec等。

步骤二、从专利数据库中爬取自身的专利信息,采用步骤一中的方法形成自身专利信息库;

自身专利信息库包括自身分类号索引表和自身专利语义向量构成的专利信息;自身分类号索引表中的分类号语义向量根据自身专利信息进行了更新。

步骤三、设置竞争对手信息,从专利数据库中爬取竞争对手的专利信息,采用步骤一中的方法形成竞争对手专利信息库;

竞争对手专利信息库包括竞争对手分类号索引表和竞争对手专利语义向量构成的专利信息;竞争对手分类号索引表中的分类号语义向量根据竞争对手专利信息进行了更新。

步骤四、按照分类号索引表,交叉比对自身专利信息库和竞争对手专利信息库,得出方向相似性和专利相似性;其中,交叉比对包括遍历两个信息库中相同分类号中的各个专利,根据专利语义向量计算专利相似性,以及两个信息库中相同分类号的分类号语义向量,根据分类号语义向量计算方向相似性。

例如,对于分类号A,自身专利信息库中有专利a1、b1、c1,竞争对手专利信息库中有专利a2、b2;那么比较(a1,a2)、(a1,b2)、(b1,a2)、(b1,b2)、(c1,a2)、(c1,b2)的专利语义向量相似度,定义专利相似性;计算自身专利信息库中分类号A的分类号语义向量与竞争对手专利信息库中分类号A的分类号语义向量的相似度,定义方向相似性。

方向相似性可分为大组相似性和小组相似性。根据竞争对手与自身研究领域重叠情况,可动态调整参数计算大组相似性或小组相似性,能够为企业自身提供更加细致的研发方向指导,大组、小组指的是分类表中的大组小组结构。

步骤五、可视化方向相似性的排序情况,用户可根据方向相似性的排序调整研发方向;根据专利相似性,给出专利的授权期望值,用户可参考该值确定专利的处理方式。

步骤三中,竞争对手信息可动态调整。

在另一个实施例中,本发明中还包括对于待提交的技术方案,提取该方案的文本向量,分别与各分类号语义向量计算相似度,将相似度超过一定阈值的分类号作为该方案的推荐分类号,并根据该推荐分类号的方向相似性,确定是否将该方案提交专利申请。

如图2所示的本发明一具体实施例,一种知识产权信息处理装置,其特征在于,包括如下模块:

信息库构建模块,构建专利信息库:根据国际分类表,构建分类号的多叉树索引,并且为每个分类号对应分配一个存储空间,用于存储分类号对应的分类号语义向量,预先按照分类号定义提取分类号的关键词,存储至分类号语义向量中,从而构建分类号索引表;根据从专利数据库爬取的专利信息,对分类号索引表中的分类号语义向量进行补充;并针对每个爬取的专利,采用文本向量生成方法生成专利语义向量,生成专利信息库;

自身专利信息库生成模块,用于从专利数据库中爬取自身的专利信息,采用步骤一中的方法形成自身专利信息库;

竞争对手专利信息库生成模块,用于设置竞争对手信息,从专利数据库中爬取竞争对手的专利信息,形成竞争对手专利信息库;

相似性计算模块,用于按照分类号索引,交叉比对自身专利信息库和竞争对手专利信息库,得出方向相似性和专利相似度性;其中,交叉比对包括遍历两个信息库中相同分类号中的各个专利,根据专利语义向量计算专利相似性,以及两个数据库中相同分类号,根据分类号语义向量计算方向相似性;

可视化模块,用于可视化方向相似性的排序情况,用户可根据方向相似性的排序调整研发方向;根据专利相似性,给出专利的授权期望值,用户可参考该值确定专利的处理方式。

其中,信息库构建模块在补充分类号语义向量时,根据专利已给出的分类号信息,根据专利给出的关键词对相应的分类号语义向量补充更新,并且根据关键词来源调整关键词在语义向量中的权重,关键词来源包括摘要、背景技术、权利要求、说明书,对于提取自摘要、背景技术的关键词设置更高的权重信息。

其中,竞争对手专利信息库生成模块中竞争对手信息可动态调整。

其中,相似性计算模块中方向相似性可分为大组相似性和小组相似性。

在另一实施例中,该装置还包括分析模块,用于对于待提交的技术方案,提取该文件的文本向量,分别与各分类号语义向量计算相似度,将相似度超过一定阈值的分类号作为该方案的推荐分类号,并根据该推荐分类号的方向相似性,确定是否将该方案提交专利申请。

上述实施例仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

本文发布于:2023-03-13 05:33:38,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/69303.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图