一种识别研发方向的方法

阅读: 评论:0

著录项
  • CN201711426233.8
  • 20171226
  • CN108255807A
  • 20180706
  • 中国专利信息中心
  • 任智军;谷威;张威;陈强;范婷婷;和兰;谢慧;张凯
  • G06F17/27
  • G06F17/27 G06Q50/18 G06Q10/06

  • 北京市海淀区大柳树路17号富海中心2号楼10层
  • 北京(11)
  • 北京瑞恒信达知识产权代理事务所(普通合伙)
  • 黄庆芳
摘要
本申请提供一种研发方向识别的方法,包括:步骤1:收集专利文献,将专利文献分为新申请文献、新失效文献和其他文献三部分,将新申请文献和新失效文献整合作为分析数据库;步骤2:生成技术主题,建立主题矩阵;步骤3:计算主题矩阵的新申请相关度和新失效相关度;步骤4:识别研发方向。利用本发明的方法,可以建立规则识别四类研发状态,分析技术研发趋势,为单位的技术研发动态、调整研发策略提供参考借鉴。
权利要求

1.一种识别研发方向的方法,包括:

步骤1:收集专利文献,将所述专利文献分为新申请文献、新失效文献和其他文献三部 分,将所述新申请文献和所述新失效文献整合作为分析数据库;

步骤2:生成技术主题,建立主题矩阵;

步骤3:计算所述主题矩阵的新申请相关度和新失效相关度;和

步骤4:根据所述新申请相关度和所述新失效相关度识别研发方向。

2.根据权利要求1所述的方法,其中,所述步骤2中生成技术主题使用主题模型生成算 法。

3.根据权利要求2所述的方法,其中,所述步骤2中建立主题矩阵的步骤包括:

步骤21:计算所述专利文献在所述技术主题中的概率分布;和

步骤22:建立所述主题矩阵,每一行代表一篇文献,每一列代表一个技术主题,每篇文 献和每个主题的交点代表该文献在该主题的概率分布。

4.根据权利要求3所述的方法,其中,所述步骤2中还包括:

步骤23:设定所述技术主题的概率阈值;

步骤24:在所述主题矩阵中,当所述概率分布大于所述技术主题的概率阈值时,将所述 概率分布设置为1,当所述概率分布小于所述技术主题的概率阈值时,将所述概率分布设置 为0。

5.根据权利要求1所述的方法,其中,所述步骤3包括:

步骤31:设定专利文献分析的时间范围,从所述主题矩阵中获取新申请文献主题矩阵 和新失效文献主题矩阵;

步骤32:计算所述技术主题的概率分布总值;和

步骤33:计算所述新申请相关度和所述新失效相关度。

6.根据权利要求5所述的方法,其中,所述步骤32还包括对所述技术主题的概率分布总 值进行归一化处理。

7.根据权利要求5所述的方法,其中,所述步骤33包括:

步骤331:新申请相关度的计算公式为:

新申请相关度=(T-T min)/(T max-T min)

其中,T为新申请文献主题矩阵中所述技术主题对应的概率分布总值,T min为新申请文 献主题矩阵中所有技术主题概率分布总值的最小值,T max为新申请文献主题矩阵中所有技 术主题概率分布总值的最大值;和

步骤332:新失效相关度的计算公式为:

新失效相关度=(T-T min)/(T max-T min)

其中,T为新失效文献主题矩阵中所述技术主题对应的概率分布总值,T min为新失效文 献主题矩阵中所有技术主题概率分布总值的最小值,T max为新失效文献主题矩阵中所有技 术主题概率分布总值的最大值。

8.根据权利要求1所述的方法,其中,所述步骤4包括:

步骤41:设定所述新申请相关度的阈值和所述新失效相关度的阈值;和

步骤42:判定所述单位的研发方向。

说明书
技术领域

本发明涉及大数据技术领域,更具体地,涉及一种识别研发方向的方法。

随着专利文献数量的迅速增长,基于专利数据的单位分析研究日益普遍。研究工 作可分为两类,一是单位识别,二是针对特定的单位进行分析及竞争情报的获取与分析。

专利引文分析法中主要运用高被引分析法识别单位。2003年,Batagelj(2003)根 据Dos i(1988)的技术演进主路径理论,提出了关键路径方法。但关键路径法和高被引分析 法仅仅只能识别重要的单位,并不能确定单位的竞争地位如何。Kim等人(2011)人认为识别 关键技术的时候,如果不排除自引的情况,技术的重要程度会增加,识别出来的关键技术就 不准确。对于识别单位也是一样,如果不区分自引和他引的情况,单位的识别也可能不准 确。对此,黎欢、彭爱东(2014)引入了一种竞争地位评价方法,通过计算专利引证率构建专 利引证率四方图,将单位分为技术先驱者、重点技术持有者、技术参与者和技术模仿者,以 此研究企业的竞争能力。温金林(2001)提出了一种基于专利排序的企业单位分析方法。先 根据一些准则对目前单位进行排序,接着根据一些指标对潜在单位进行排序,最后根据一 些基准,形成单位完整的优先排序。每个组织都希望能有效地监视单位,但没有组织有无限 的资源来监视每个单位。该方法是以资源观为基础的方法,解决的核心问题是利用有限资 源有效的监视核心单位。该方法具有一定的局限性,突出的表现为是一种的方法,过分强调 现有资源的排序;过分强调排序,忽略了单位之间的关联关系,是一种静态的方法。

单位分析与竞争情报分析方面,主要分析方法有专利申请数量统计与预测、专利 IPC的技术分布分析、专利IPC主题结构信息可视化分析、各时间分段内专利主题词的技术 变化分析以及专利主题词局域网络可视化分析(贡金涛,杨帅&魏晓峰,2013)。Mogee(1991) 将专利数据用于技术分析和规划,并详细分析专利分析法在技术竞争情报中的应用; Porter研发了针对大型数据库中的科技论文和专利文献进行技术机会分析的软件,识别特 定领域中新出现的技术和技术机会,快速获取技术竞争情报(CunninghamPorter&Newman, 2006;Porter,2005;Porter&Cunningham,2005;Porter&Detampel,1995);肖沪卫(2003)提 出点、线、面、立体相结合的专利竞争情报分析法;方曙(2007)从定量、定性、拟定量三个角 度总结了专利情报分析方法及其应用。孙涛涛和刘云(2011)运用专利文献耦合的文献计量 学方法分析、确定和可视化表达DVD激光头技术发展中的主要单位及其技术优势,为企业技 术竞争情报分析提供有效的方法和示范。

刘红光和吕义超(2010)以日本久保田株式会社的柴油机专利为例,通过对其进行 数量分析、IPC分析、同族专利分析、被引专利分析、发明人分析等,具体阐述专利分析法在 特定单位分析中的应用。王兴旺(2007)探讨了专利地图与单位分析之间的深层联系,认为 可以通过构建专利地图实现可视化,利用可视化观察来实现单位识别。利用专利引证图来 实现单位定位;利用专利权人关联图来实现单位潜在关联分析;利用专利权人研发重点分 布图来实现单位研发重点分析;利用专利权人研发趋势图来实现单位研发趋势分析;利用 专利权人引证排行表、技术实力指标来实现单位技术实力分析。最终,在专利地图技术的基 础上构建了单位分析模型,实现了较为全面的技术单位分析。

通过观察一系列基于专利分析的技术单位分析方法,我们可以获得初步的判断: 专利信息分析方法是适合技术单位识别的方法,它能够与各种理论完美的集合,同时能够 方便的应用于技术单位分析的各项实践;目前,技术单位识别方法研究的尚不深入,实践中 多釆用频次、指标、排序的方法进行分析,专利数据分析的范围也不广泛,仅涉及题录信息, 不涉及到深层次的法律诉讼、企业战略信息(张虎胆,2013)。目前,市场对于技术单位存在 调查其技术发展方向的需求,然而,还未见到有基于专利申请、放弃信息对技术单位的技术 方向进行定量预测的方法。

为克服现有技术的上述缺陷,本发明提出一种研发方向识别的方法,包括:步骤1: 收集专利文献,将专利文献分为新申请文献、新失效文献和其他文献三部分,将新申请文献 和新失效文献整合作为分析数据库;步骤2:生成技术主题,建立主题矩阵;步骤3:计算主题 矩阵的新申请相关度和新失效相关度;步骤4:识别单位的研发方向。

生成技术主题可以使用主题模型生成算法,如LDA算法。

在步骤2中,建立主题矩阵的步骤包括:步骤21:计算专利文献在技术主题中的概 率分布;步骤22:建立主题矩阵,每一行代表一篇文献,每一列代表一个技术主题,每篇文献 和每个主题的交点代表该文献在该主题的概率分布。

进一步的,步骤2中还可以包括:步骤23:设定技术主题的概率阈值;步骤24:在主 题矩阵中,当概率分布大于技术主题的概率阈值时,将概率分布设置为1,当概率分布小于 技术主题的概率阈值时,将概率分布设置为0。

步骤3包括如下步骤:步骤31:设定专利文献分析的时间范围,从主题矩阵中获取 新申请文献主题矩阵和新失效文献主题矩阵;步骤32:计算技术主题的概率分布总值;步骤 33:计算新申请相关度和新失效相关度。

新申请相关度的计算公式为:

新申请相关度=(T-Tmin)/(Tmax-Tmin)

其中,T为新申请文献主题矩阵中技术主题对应的概率分布总值,Tmin为新申请文 献主题矩阵中所有技术主题概率分布总值的最小值,Tmax为新申请文献主题矩阵中所有技 术主题概率分布总值的最大值;和

新失效相关度的计算公式为:

新失效相关度=(T-Tmin)/(Tmax-Tmin)

其中,T为新失效文献主题矩阵中技术主题对应的概率分布总值,Tmin为新失效文 献主题矩阵中所有技术主题概率分布总值的最小值,Tmax为新失效文献主题矩阵中所有技 术主题概率分布总值的最大值。

优选的,在步骤32中,还可以对技术主题的概率分布总值进行归一化处理。

步骤4包括:步骤41:设定新申请相关度的阈值和新失效相关度的阈值;和步骤42: 判定单位的研发方向。

本发明通过对单位专利数据的收集整理,利用技术主题模型识别申请和失效技术 主题,并构建新申请相关度与新失效相关度测度模型,建立规则识别四类研发状态,分析技 术研发趋势,为企业把握技术对手研发动态、调整研发策略提供参考。

图1为根据本发明的研发方向识别方法的流程图;

图2为根据本发明的研发方向识别方法的技术主题坐标示意图;

图3为根据本发明的研发方向识别示意图;

图4为根据本发明的多家单位的研发方向示意图。

下面结合附图和具体实施例对本发明提供的一种研发方向识别的方法进行详细 描述。

在以下的描述中,将描述本发明的多个不同的方面,然而,对于本领域内的普通技 术人员而言,可以仅仅利用本发明的一些或者全部结构或者流程来实施本发明。为了解释 的明确性而言,阐述了特定的数目、配置和顺序,但是很明显,在没有这些特定细节的情况 下也可以实施本发明。在其他情况下,为了不混淆本发明,对于一些众所周知的特征将不再 进行详细阐述。

图1示出根据本发明的一种研发方向识别方法的流程图,如图1所示,该方法包括: 步骤1:收集专利文献,将专利文献分为新申请文献、新失效文献和其他文献三部分,将新申 请文献和新失效文献整合作为分析数据库;步骤2:生成技术主题,建立主题矩阵;步骤3:计 算主题矩阵的新申请相关度和新失效相关度;步骤4:识别研发方向。

其中,在步骤1中,首先收集专利文献等数据,并将其分成新申请文献、新失效文献 和其他文献三部分,将新申请文献和新失效文献整合作为分析数据库。收集的专利文献可 以是同一个单位的,即对某一单位的研发方向进行分析。

其中,在步骤2中,利用主题模型生成算法(例如LDA算法)对分析数据库进行分析, 生成文献-主题模型(也称为主题矩阵),该文献-主题模型给出了文献和主题之间的概率关 系,其中每一行代表一篇文献,每一列代表一个主题,每篇文献和每个主题的交点代表该文 献在该主题的概率分布。在一个实施例中,为简化计算,可以将概率关系转化为0和1的二元 关系,即到表达文献主旨的技术主题。为准确表达技术主题和文献之间的关系,为技术主 题设定一个阈值,大于阈值设为1,小于阈值设为0,即只有达到这个阈值的主题才能作为这 篇文献的标引主题。标引主题只是技术主题的一个优化实例,是为了方便处理,也可以直接 使用技术主题进行归一化处理。

之后,根据时间(专利申请时间和专利失效时间)窗口和专利状态(申请和失效)从 主题矩阵中提取某时间段的新申请文献和新失效文献,形成新申请文献主题矩阵和新失效 文献主题矩阵。例如,从主题矩阵中提取2016年的新申请和新失效文献,形成新申请文献主 题矩阵和新失效文献主题矩阵。

其中,在步骤3中,根据得到的新申请文献主题矩阵和新失效文献主题矩阵分别计 算新申请相关度和新失效相关度。

在主题矩阵中对每个技术主题所对应的所有新申请文献的概率分布进行求和,即 主题矩阵中每列求和,得到新申请文献在主题矩阵中每个技术主题的概率分布总值,可以 对每个主题的概率分布总值进行归一化处理,得到每个主题对应的新申请相关度。

新申请相关度=(T-Tmin)/(Tmax-Tmin)

其中:为申请文献主题矩阵中每个技术主题对应的概率分布总值

为申请文献主题矩阵中所有技术主题概率分布总值的最小值

为申请文献主题矩阵中所有技术主题概率分布总值的最大值

新失效相关度计算方法同新申请相关度,通过计算,得到每个主题对应的新失效 相关度。

新失效相关度=(T-Tmin)/(Tmax-Tmin)

其中:为申请文献主题矩阵中每个技术主题对应的概率分布总值

为申请文献主题矩阵中所有技术主题概率分布总值的最小值

为申请文献主题矩阵中所有技术主题概率分布总值的最大值

其中,在步骤4中,以新失效相关度为横轴,以新申请相关度为纵轴作图,并设定两 者的阈值,得到4个区域,如图2所示,区域一由于相关度都较低,无实际意义,区域二表示研 发方向,区域三表示技术提升方向;区域四表示放弃的技术方向。

将每个技术主题(或标引主题)都画到坐标图中,通过其所在区域即可判读出该技 术主题(标引主题)所处的技术研发地位。

根据建立的主题模型对失效专利数据进行分析,针对不同的技术主题(或标引主 题)可以建立一个新申请相关度和新失效相关度的二维数据阵图。

经过数据模型运算的失效专利数据,分散在申请量和失效量的象限中,有的数据 分布在失效量和申请量较少靠近原点的位置,有的分布在失效量和申请量都较多的远离近 原点的位置。

经过分析发现,靠近原点申请量较低而失效量较高的数据,专利权人在申请或是 授权后不长的时间就大量地放弃了专利权,使专利处于失效状态,表明专利权人已对这些 技术领域的技术不感兴趣,不再愿意持有或是继续做下一步的申请,因此可以判定这些主 题的专利是其技术领域放弃的方向。

再来看一下从原点向上沿着申请量增长的数据,专利权人或是申请人持续增加专 利申请,同时保持低放弃量,也可以说这一区域内技术主题的专利失效的不多,显然申请人 还将会持续增加研发的时间或是投入,也可说是其后续研发的方向。

最后,再看一下处于原点较远申请量和失效量都较大的一些样本,一方面申请量 不断增长,同时专利失效的比例也不断上升,这说明随着技术的升级进步,申请人或专利权 人对原有技术或是专利权不再维持,这样做,既可以增加对新技术的研发和资金投入,也可 以通过放弃一些落后或不需要维持的专利来降低专利管理成本,因此可以判定处于这一区 域主题技术将是专利申请人技术提升和升级的领域。

【实施例】

获取2016年索尼公司的专利申请情况和失效数据,两者进行对比分析,以此来确 定企业的技术发展方向。通过申请与失效的二维关系图(如图3所示),可以看出,该年度新 申请相关度较高而新失效相关度偏低的技术主题,是该企业重点的研发方向,包括无线通 信、显示装置以及通信系统等;与此相对,新申请相关度很低,而新失效相关度较高的技术 主题,为该企业正在放弃的技术,如光盘、红外线触摸屏以及太阳能电池板和打印机等;而 另外,新申请相关度和新失效相关度两者都较高的存储设备、图像处理设备等技术主题,为 该企业正在进行升级的技术。通过这一对比,企业的技术发展方向便能够一目了然。

实施方式2

获取7家重点企业2016年所有公开专利与失效专利的权利要求与摘要,运用LDA模 型进行主题概率计算,将同一技术主题涉及的所有专利对应的概率相加,得到每个技术主 题的总值,并提取最大值与最小值。将数据分别计算各技术主题的新申请相关度和新失效 相关度并建立二维坐标系,七家企业各技术主题的散点分布如图4所示。大部分技术主题聚 集在低新申请相关度、低新失效相关度区域,当新申请相关度、新失效相关度超过某一值 时,技术主题的分布呈现分散趋势。图4所示为以散点疏密分布差异为界限,将每个企业的 技术主题分布图大致分为四个区域。

以佳能株式会社为例,选取具有典型意义的技术主题进行研发方向具体分析。如 表1所示,佳能公司对智能控制的研发涉足未深,新申请相关度与新失效相关度都较低,而 缓冲装置、套管、溶剂并非电子信息行业的典型技术,故相关度也较低;印刷电路板、微光测 距等技术主题具有高新申请相关度、低新失效相关度,是其大力研发的方向;打印机、半导 体的新申请相关度与新失效相关度都较高,企业正对其进行技术升级;等离子体、无线通讯 等技术具有低新申请相关度、高新失效相关度,属于企业的放弃方向。

表1佳能株式会社典型技术主题研发方向分析

通过以上的分析,运用主题矩阵模型,这一方法可以建立起技术主题与新申请相 关度、新失效相关度的关联关系,通过新申请相关度、新失效相关度的分析可以判断出在某 一特定技术领域该项技术主题是处于技术放弃、技术升级还是研发的方向,由于在专利数 据中可以通过专利分类号建立起与技术主题的对应关系,因此,也就可以容易地得出具体 一个技术领域所处的技术发展阶段。

最后应说明的是,以上实施例仅用以描述本发明的技术方案而不是对本技术方法 进行限制,本发明在应用上可以延伸为其他的修改、变化、应用和实施例,并且因此认为所 有这样的修改、变化、应用、实施例都在本发明的精神和教导范围内。

本文发布于:2023-03-13 00:13:09,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/68584.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图