G06F40/18 G06F16/33 G06Q50/18 G06Q10/06
1.一种数据处理方法,其特征在于,包括:
设定目标技术和至少一个申请人;
采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表;
基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力。
2.根据权利要求1所述的数据处理方法,其特征在于,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括:
建立所述目标技术的专利分类号对比数据列表;
采集所有所述申请人在预设年限内的所有专利分类号信息,以生成专利分类号数据列表;
将所述专利分类号数据列表与所述专利分类号对比数据列表进行对比,以获取所述申请人与所述目标技术相关的专利分类号;
根据所述申请人与所述目标技术相关的专利分类号获取专利信息,以生成专利信息列表。
3.根据权利要求1所述的数据处理方法,其特征在于,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括:
建立所述目标技术的关键词数据列表;
采集所述申请人所有专利文件中的关键词,以生成采集词汇数据列表;
将所述采集词汇数据列表与所述关键词数据列表进行对比,以生成相似度数据列表;
基于所述相似度数据列表获取专利信息,以生成专利信息列表。
4.根据权利要求1所述的数据处理方法,其特征在于,所述采集所述申请人所有专利文件中的关键词,以生成采集词汇数据列表,还包括:
对所述关键词进行近义词扩充。
5.根据权利要求1所述的数据处理方法,其特征在于,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括:
建立所述目标技术的专利分类号对比数据列表以及关键词数据列表;
采集所有所述申请人在预设年限内的所有专利分类号信息,以生成专利分类号数据列表;
将所述专利分类号数据列表与所述专利分类号对比数据列表进行对比,以获取所述申请人与所述目标技术相关的专利分类号以及非相关的专利分类号;
根据所述申请人与所述目标技术相关的专利分类号获取专利信息,以生成专利信息列表;
根据所述申请人与所述目标技术非相关的专利分类号获取专利信息,以生成专利信息筛选列表;
采集所述专利信息筛选列表中专利文件的关键词,以生成筛选词汇数据列表;
将所述筛选词汇数据列表与所述关键词数据列表进行对比,以生成筛选词汇相似度数据列表;
基于所述筛选词汇相似度数据列表获取专利信息,以更新所述专利信息列表。
6.根据权利要求5所述的数据处理方法,其特征在于,所述采集所述专利信息筛选列表中专利文件的关键词,以生成筛选词汇数据列表,还包括:
对所述关键词进行近义词扩充。
7.根据权利要求1~6任意一项所述的数据处理方法,其特征在于,所述专利信息包括:专利数量、专利质量、专利科学性、专利速度中的至少一种,所述专利数量包括专利申请数量、专利授权数量中的至少一种,所述专利质量包括实时影响指数、专利引证频率、技术范围、国际范围、PCT专利申请数量、有效专利占有率、共同合作密度中的至少一种,所述专利科学性包括科学关联性,所述专利速度包括专利成长率和技术生命周期。
9.根据权利要求7所述的数据处理方法,其特征在于,所述科学关联性为专利文件引用的公开文献数量,所述专利成长率为专利申请数量的增长率,所述技术生命周期为引证专利文件的年限的中位数与专利申请数量的比值。
8.根据权利要7所述的数据处理方法,其特征在于,所述专利申请数量为预设年限内的专利申请总数量,所述专利授权数量为预设年限内的专利授权总数量,所述实时影响指数为专利文件在预设年内被引用的次数,所述专利引证频率为引证专利的次数与专利申请数量的比值,所述技术范围为IPC分类号中大组的数量,所述国际范围为国外申请专利的数量,所述有效专利占有率为授权且继续缴费的专利数量与专利申请数量的比值,所述共同合作密度为共同申请的专利数量。
10.一种用于实现如权利要求1~9任一项所述数据处理方法的数据处理系统,其特征在于,所述数据处理系统包括:
设定单元,用于设定目标技术和至少一个申请人;
采集单元,用于采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表;
处理单元,基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力。
本发明涉及数据处理技术领域,尤其涉及一种数据处理方法及系统。
现有的许多技术创新评价理论和方法大多是基于企业绩效来评价创新水平,其评价的核心在于创新成果,忽略创新过程的评价。创新是一个动态性的、阶段性的过程,创新产出在时间上滞后于创新过程,而且这些成果多跟企业综合实力挂钩,因此这些指标不能真实有效的反映企业创新能力。
专利作为反映创新能力的综合性指标,具有客观性、法定性、公开性和唯一性,是科技创新活动中最主要和最直接的产出成果之一,他与创新活动最为密切,从专利角度来分析产业技术创新能力的研究分别讨论了企业创新投资能力、支持能力和产出能力。例如,IPC分类号可以表现技术领域,专利引证频率可以表征专利质量。因此,专利数据可以动态地、并从企业内部测度出真实创新能力。但因专利数据量大,现有技术中无法准确快速的对专利数据进行处理。
因此,有必要提供一种新型的数据处理方法及系统以解决现有技术中存在的上述问题。
本发明的目的在于提供一种数据处理方法及系统,提高数据处理的准确性和效率。
为实现上述目的,本发明的所述数据处理方法,包括:
设定目标技术和至少一个申请人;
采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表;
基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力。
所述数据处理方法的有益效果在于:设定目标技术和至少一个申请人,采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力,提高了数据处理的准确性和效率。
可选地,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括:
建立所述目标技术的专利分类号对比数据列表;
采集所有所述申请人在预设年限内的所有专利分类号信息,以生成专利分类号数据列表;
将所述专利分类号数据列表与所述专利分类号对比数据列表进行对比,以获取所述申请人与所述目标技术相关的专利分类号;
根据所述申请人与所述目标技术相关的专利分类号获取专利信息,以生成专利信息列表。
可选地,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括:
建立所述目标技术的关键词数据列表;
采集所述申请人所有专利文件中的关键词,以生成采集词汇数据列表;
将所述采集词汇数据列表与所述关键词数据列表进行对比,以生成相似度数据列表;
基于所述相似度数据列表获取专利信息,以生成专利信息列表。
可选地,所述采集所述申请人所有专利文件中的关键词,以生成采集词汇数据列表,还包括:
对所述关键词进行近义词扩充。
可选地,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括:
建立所述目标技术的专利分类号对比数据列表以及关键词数据列表;
采集所有所述申请人在预设年限内的所有专利分类号信息,以生成专利分类号数据列表;
将所述专利分类号数据列表与所述专利分类号对比数据列表进行对比,以获取所述申请人与所述目标技术相关的专利分类号以及非相关的专利分类号;
根据所述申请人与所述目标技术相关的专利分类号获取专利信息,以生成专利信息列表;
根据所述申请人与所述目标技术非相关的专利分类号获取专利信息,以生成专利信息筛选列表;
采集所述专利信息筛选列表中专利文件的关键词,以生成筛选词汇数据列表;
将所述筛选词汇数据列表与所述关键词数据列表进行对比,以生成筛选词汇相似度数据列表;
基于所述筛选词汇相似度数据列表获取专利信息,以更新所述专利信息列表。
可选地,所述采集所述专利信息筛选列表中专利文件的关键词,以生成筛选词汇数据列表,还包括:
对所述关键词进行近义词扩充。
可选地,所述专利信息包括:专利数量、专利质量、专利科学性、专利速度中的至少一种,所述专利数量包括专利申请数量、专利授权数量中的至少一种,所述专利质量包括实时影响指数、专利引证频率、技术范围、国际范围、PCT专利申请数量、有效专利占有率、共同合作密度中的至少一种,所述专利科学性包括科学关联性,所述专利速度包括专利成长率和技术生命周期。
可选地,所述专利申请数量为预设年限内的专利申请总数量,所述专利授权数量为预设年限内的专利授权总数量,所述实时影响指数为专利文件在预设年内被引用的次数,所述专利引证频率为引证专利的次数与专利申请数量的比值,所述技术范围为IPC分类号中大组的数量,所述国际范围为国外申请专利的数量,所述有效专利占有率为授权且继续缴费的专利数量与专利申请数量的比值,所述共同合作密度为共同申请的专利数量。
可选地,所述科学关联性为专利文件引用的公开文献数量,所述专利成长率为专利申请数量的增长率,所述技术生命周期为引证专利文件的年限的中位数与专利申请数量的比值。
本发明还提供了一种数据处理系统,所述数据处理系统包括:
设定单元,用于设定目标技术和至少一个申请人;
采集单元,用于采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表;
处理单元,基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力。
所述数据处理系统的有益效果在于:设定单元用于设定目标技术和至少一个申请人,采集单元用于采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,处理单元基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力,提高了数据处理的准确性和效率。
图1为本发明一些实施例中数据处理方法的流程图;
图2为本发明一些实施例中生成专利信息列表的流程图;
图3为本发明又一些实施例中生成专利信息列表的流程图;
图4为本发明另一些实施例中生成专利信息列表的流程图;
图5为本发明一些实施例中数据处理系统的结构框图。
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。除非另外定义,此处使用的技术术语或者科学术语应当为本发明所属领域内具有一般技能的人士所理解的通常意义。本文中使用的“包括”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。
针对现有技术存在的问题,本发明的实施例提供了一种数据处理方法。参照图1,所述数据处理方法包括以下步骤:
S1:设定目标技术和至少一个申请人;
S2:采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表;
S3:基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力。
图2为本发明一些实施例中生成专利信息列表的流程图。参照图2,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括以下步骤:
S21:建立所述目标技术的专利分类号对比数据列表;
S22:采集所有所述申请人在预设年限内的所有专利分类号信息,以生成专利分类号数据列表;
S23:将所述专利分类号数据列表与所述专利分类号对比数据列表进行对比,以获取所述申请人与所述目标技术相关的专利分类号;
S24:根据所述申请人与所述目标技术相关的专利分类号获取专利信息,以生成专利信息列表。
图3为本发明又一些实施例中生成专利信息列表的流程图。参照图3,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括以下步骤:
S211:建立所述目标技术的关键词数据列表;
S212:采集所述申请人所有专利文件中的关键词,以生成采集词汇数据列表;
S213:将所述采集词汇数据列表与所述关键词数据列表进行对比,以生成相似度数据列表;
S214:基于所述相似度数据列表获取专利信息,以生成专利信息列表。
一些实施例中,所述采集所述申请人所有专利文件中的关键词,以生成采集词汇数据列表,还包括:对所述关键词进行近义词扩充。
图4为本发明另一些实施例中生成专利信息列表的流程图。参照图4,所述采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表,包括以下步骤:
S221:建立所述目标技术的专利分类号对比数据列表以及关键词数据列表;
S222:采集所有所述申请人在预设年限内的所有专利分类号信息,以生成专利分类号数据列表;
S223:将所述专利分类号数据列表与所述专利分类号对比数据列表进行对比,以获取所述申请人与所述目标技术相关的专利分类号以及非相关的专利分类号;
S224:根据所述申请人与所述目标技术相关的专利分类号获取专利信息,以生成专利信息列表;
S225:根据所述申请人与所述目标技术非相关的专利分类号获取专利信息,以生成专利信息筛选列表;
S226:采集所述专利信息筛选列表中专利文件的关键词,以生成筛选词汇数据列表;
S227:将所述筛选词汇数据列表与所述关键词数据列表进行对比,以生成筛选词汇相似度数据列表;
S228:基于所述筛选词汇相似度数据列表获取专利信息,以更新所述专利信息列表。
一些实施例中,所述采集所述专利信息筛选列表中专利文件的关键词,以生成筛选词汇数据列表,还包括:对所述关键词进行近义词扩充。
一些实施例中,所述专利信息包括:专利数量、专利质量、专利科学性、专利速度中的至少一种,所述专利数量包括专利申请数量、专利授权数量中的至少一种,所述专利质量包括实时影响指数、专利引证频率、技术范围、国际范围、PCT专利申请数量、有效专利占有率、共同合作密度中的至少一种,所述专利科学性包括科学关联性,所述专利速度包括专利成长率和技术生命周期。
一些实施例中,所述专利申请数量为预设年限内的专利申请总数量,所述专利授权数量为预设年限内的专利授权总数量,所述实时影响指数为专利文件在预设年内被引用的次数,所述专利引证频率为引证专利的次数与专利申请数量的比值,所述技术范围为IPC分类号中大组的数量,所述国际范围为国外申请专利的数量,所述有效专利占有率为授权且继续缴费的专利数量与专利申请数量的比值,所述共同合作密度为共同申请的专利数量。
一些实施例中,所述科学关联性为专利文件引用的公开文献数量,所述专利成长率为专利申请数量的增长率,所述技术生命周期为引证专利文件的年限的中位数与专利申请数量的比值。例如,2019年的专利申请数量减去2018年的专利申请数量,得到专利申请数量差,所述专利申请数量差与2018年的专利申请数量的比值即为2019年的专利成长率。
一些实施例中,所述密切值法是将每个申请人下的专利信息进行规范化后出每个申请人的最大值与最小值,即“最优点”和“最劣点”,接着根据“最优点”和“最劣点”集合求出各申请人的密切值,最后根据所得到的结果进行排序,即可得到各个申请人的优劣。
一些实施例中,所述密切值法的步骤包括:
(1)计算初始指标矩阵;
m个申请人,一个申请人为一个方案,假设方案Ai(i=1,2,…,m)在指标Sj(j=1,2,…,n)下的取值为a ij,则得到指标矩阵为A=(aij)m*n。
(2)规范化矩阵;
令即可得到规范后的指标矩阵R=(rij)m*n。
(3)根据规范后的指标矩阵到每个指标的最优点和最劣点;
设J+,J-分别是“最优点”和“最劣点”指标的集合。
对每个指标Sj到最优的rj+组成最优方案,rj+={(max(rij|i=1,2···m|)j∈J+),(max(rij|i=1,2···m|j∈J-))}={rj+|j=1,2···n|}。
同理,rj-={(min(rij|i=1,2···m|)j∈J+),(min(rij|i=1,2···m|j∈J-))}={rj-|j=1,2···n|}。
则,最优方案为最劣方案为
(4)求取各方案的密切值;
表示方案Ai与A+之间的欧式距离,表示Ai与A-之间的欧氏距离,
d+表示的最小值,d-表示的最大值,则方案Ai的密切值Ci的计算公式为
(5)根据所述密切值的大小对各个方案进行排序,以得到结果数据,即专利信息结果数据。
当Ci=0,方案Ai距离最优点最近,若Ci>0,且Ci值越大,所对应的方案离最优点越远,排名越靠后,代表创新能力越低。
图5为本发明一些实施例中数据处理系统的结构框图。参照图5,所述数据处理系统100用于实现所述数据处理方法,所述数据处理系统100包括设定单元101、采集单元102和处理单元103。其中,所述设定单元101用于设定目标技术和至少一个申请人;所述采集单元102用于采集所有所述申请人关于所述目标技术的专利信息,以生成专利信息列表;所述处理单元103用于基于所述专利信息列表,通过密切值法生成专利信息结果数据,所述专利信息结果数据用于指示所述申请人的创新能力。
虽然在上文中详细说明了本发明的实施方式,但是对于本领域的技术人员来说显而易见的是,能够对这些实施方式进行各种修改和变化。但是,应理解,这种修改和变化都属于权利要求书中所述的本发明的范围和精神之内。而且,在此说明的本发明可有其它的实施方式,并且可通过多种方式实施或实现。
本文发布于:2023-04-14 00:30:33,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/86311.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |