G06F40/279 G06F40/216 G06Q50/18
1.一种企业专利数据比对方法,其特征在于,包括:
当接收到客户端发送的原专利文献时,确定所述原专利文献中包含的特征词;
将所述特征词代入预设词库,确定所述特征词对应的多个词义相近的特征词;
由所述多个词义相近的特征词构建第一数据矩阵;
将所述第一数据矩阵中的所述多个词义相近的特征词分别代入预设第二专利数据库进行比对,确定每个词义相近的特征词对应的专利文献;
基于预设反馈准则,将所述每个词义相近的特征词对应的专利文献反馈至终端设备进行显示。
2.根据权利要求1所述的方法,其特征在于,所述确定所述原专利文献中包含的特征词,之前还包括:
当接收到客户端发送的原专利文献时,确定所述原专利文献的所属技术领域;
将所述技术领域与第一专利数据库内的所有的专利文献进行比对,确定划分在所述技术领域内的专利文献;
由划分在所述技术领域内的专利文献构建第二专利数据库。
3.根据权利要求1所述方法,其特征在于,所述由多个近义词相近的特征词构建第一数据矩阵,包括:
将所述多个词义相近的特征词分别代入第一专利数据库中,确定每个词义相近的特征词对应的出现频次;
基于高频次的词义相近的特征词优先排布的准则,将所述多个词义相近的特征构建成第一数据矩阵。
4.根据权利要求1所述的方法,其特征在于,所述确定每个词义相近的特征词对应的专利文献,之后还包括:
在所述每个词义相近的特征词对应多个专利文献时,从所述每个词义相近的特征词对应多个专利文献中,确定每个专利文献中出现对应的词义相近的特征词的频次;
基于出现对应的词义相近的特征词的频次的高低,确定对应的专利文献的优先级;
将优先级高的专利文献定义为优先反馈的专利文献。
5.根据权利要求4所述的方法,其特征在于,所述确定每个专利文献中出现对应的词义相近的特征词的频次,之后还包括:
判断每个专利文献中出现对应的词义相近的特征词频次是否小于预设频次;
若是,则将小于预设频次对应的专利文献舍弃。
6.根据权利要求1所述的方法,其特征在于,所述基于预设反馈准则,将所述每个词义相近的特征词对应的专利文献反馈至终端设备进行显示,之前还包括:
由多个词义相近的特征词对应的专利文献构建多个第二数据矩阵,其中,所述词义相近的特征词与第二数据矩阵一一对应;
将所有第二数据矩阵内的专利文献之间进行比对,确定所有第二数据矩阵中包含的重复专利文献;
将所述重复专利文献从对应的第二数据矩阵内舍弃。
7.根据权利要求6所述的方法,其特征在于,所述将所有第二数据矩阵内的专利文献之间进行比对,确定所有第二数据矩阵中包含的重复专利文献,包括:
选取任一第二数据矩阵,从该任一第二数据矩阵中依次调取存储的专利文献,并与其余第二数据矩阵中的专利文献进行比对,确定任一第二数据矩阵对应的重复专利文献;
待该任一第二数据矩阵内的所有专利文献比对完成,再次选取除任一第二数据数据矩阵之外的第二数据矩阵中的专利文献,重复对比过程,确定所有第二数据矩阵中包含的重复专利文献。
8.一种企业专利数据比对装置,其特征在于,包括:
第一特征词确定模块,用于当接收到客户端发送的原专利文献时,确定所述原专利文献中包含的特征词;
第二特征词确定模块,用于将所述特征词代入预设词库,确定所述特征词对应的多个词义相近的特征词;
数据矩阵构建模块,用于由所述多个词义相近的特征词构建第一数据矩阵;
第一专利文献确定模块,用于将所述第一数据矩阵中的所述多个词义相近的特征词分别代入预设第二专利数据库进行比对,确定每个词义相近的特征词对应的专利文献;
第一反馈模块,用于基于预设反馈准则,将所述每个词义相近的特征词对应的专利文献反馈至终端设备进行显示。
9.一种电子设备,其特征在于,该电子设备包括:
至少一个处理器;
存储器;
至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行权利要求1~7任一项所述的企业专利数据比对方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,当所述计算机程序在计算机中执行时,令所述计算机执行权利要求1~7任一项所述的企业专利数据比对方法。
本申请涉及大数据技术领域,尤其是涉及一种企业专利数据矩阵比方法、装置、电子设备及介质。
随着我国企业的不断创新和产业升级,企业发展的成效在逐步显现,最突出的体现是产生了大量的科技成果,而该些科技成果通常会被企业以申请专利的方式进行保护;而在企业创新或生产过程中,为了避免出现创新与已申请的专利出现重合或生产过程中造成已申请专利的侵权,企业往往会通过在公布有大量专利文献的专利平台中,比对出针对自身企业技术以及发展方向的相关专利文献,进行研究;而传统的专利文献比对的方式则是通过原专利文献中的特征词来与专利数据路中包含的专利文献进行比对,进而寻出企业所需要的相关专利文献。
但是,尤其针对中国的专利文献,通过特征词比对专利文献时,特征词可能存在对应的近义词,甚至是多个对应的近义词,而一部对应分相关技术的专利文献恰恰正是使用该特征词对应的近义词进行描述的,基于特征词本身进行比对,无法比对出使用对应的近义词的专利文献,即不能涵盖对应技术领域的所有专利文献,存在所比对的专利文献并不符合企业需求的情况,从而降低了专利数据比对的准确率。
为了提高专利数据比对的准确率,本申请提供一种企业专利数据比对方法、装置、电子设备及介质。
第一方面,本申请提供一种企业专利数据比对方法,采用如下的技术方案:
一种企业专利数据比对方法,包括:
当接收到客户端发送的原专利文献时,确定所述原专利文献中包含的特征词;
将所述特征词代入预设词库,确定所述特征词对应的多个词义相近的特征词;
由所述多个词义相近的特征词构建第一数据矩阵;
将所述第一数据矩阵中的所述多个词义相近的特征词分别调入预设第二专利数据库中进行比对,确定每个词义相近的特征词对应的专利文献;
基于预设反馈准则,将所述每个词义相近的特征词对应的专利文献反馈至终端设备进行显示。
通过采用上述技术方案,客户端发送原专利文献,基于接收到的原专利文献确定出该原专利文献中包含的特征词;随后,为了能够比对出所有的相关专利文献,将该特征词代入至提前预设的词库,进而确定出与特征词对应的多个词义相近的特征词;由多个词义相近的特征词进行数据矩阵的构建,即第一数据矩阵,以便于后续通过词义相近的特征词进行专利文献的比对;随后,从第二数据矩阵分别调取出词义相近的特征词至第二专利数据库中进行专利文献的比对,进而确定出每个词义相近的特征词对应的专利文献,由于确定出的专利文献数量较大,为了能够有序将专利文献反馈至终端设备进行显示,继而基于预设的反馈准则将确定出的专利文献有序的反馈至终端设备进行显示,进而比对出所有可能为企业所需的专利文献,进而提高了专利数据比对的准确率。
在一种可能的实现方式中,所述确定所述原专利文献中包含的特征词,之前还包括:
当接收到客户端发送的原专利文献时,确定所述原专利文献的所属技术领域;
将所述技术领域与第一专利数据库内的所有的专利文献进行比对,确定划分在所述技术领域内的专利文献;
由划分在所述技术领域内的专利文献构建第二专利数据库。
通过采用上述技术方案,在接收到原专利文献时,首先确定出原则专利文献中所记载的技术领域,随后,将该技术领域代入至专利数据库中,并与第一专利数据库中的专利文献所属技术领域进行比对,进而确定出符合原专利文献的技术领域的专利文献,为了能够便于后期特征词的比对,由该专利文献构建新的专利数据库,即第二专利数据库;之后,将词义相近的特征词代入至第二专利数据可中进行比对;进而减少了基于特征词进行专利文献比对过程中的运算量。
在一种可能的实现方式中,所述由多个近义词相近的特征词构建第一数据矩阵,包括:
将所述多个词义相近的特征词分别代入第一专利数据库中,确定每个词义相近的特征词对应的出现频次;
基于高频次的词义相近的特征词优先排布的准则,将所述多个词义相近的特征构建成第一数据矩阵。
通过采用上述技术方案,根据原专利文献的特征词确定出多个词义相近的特征词后,将确定出的多个词义相近的特征词分别代入第一专利数据库中进行比对,确定每个词义相近的特征词出现的频次,随后,在构建第一数据矩阵时将高频次的词义相近的特征词优先构建,进而在后续进行特征词比对的过程中,优先进行比对,优先确定出对应的专利文献;继而能够使企业人员更加快速的比对出所需专利文献。
在一种可能的实现方式中,所述确定每个词义相近的特征词对应的专利文献,之后还包括:
在所述每个词义相近的特征词对应多个专利文献时,从所述每个词义相近的特征词对应多个专利文献中,确定每个专利文献中出现对应的词义相近的特征词的频次;
基于出现对应的词义相近的特征词的频次的高低,确定对应的专利文献的优先级;
将优先级高的专利文献定义为优先反馈的专利文献。
通过采用上述技术方案,在确定出每个词义相近的特征词对应的多个专利文献后,确定出每个专利文献中出现该词义相近的特征词的频次,随后将频次进行比对,频次高的专利文献定义优先级,随后将定义为优先级的专利文献优先进行反馈显示,进而提高了企业人员进行专利文献比对,确定出所需专利文献的效率。
在一种可能的实现方式中,所述确定每个专利文献中出现对应的词义相近的特征词的频次,之后还包括:
判断每个专利文献中出现对应的词义相近的特征词频次是否小于预设频次;
若是,则将小于预设频次对应的专利文献舍弃。
通过采用上述技术方案,确定出每个专利文献中出现对应的词义相近的特征词频次后,与预设频次进行比对,判断是否小于预设频次,当小于预设频次时,则表明该专利文献做记载的内容不符合企业人员的需求,继而将该小于预设频次对应的专利文献进行舍弃,从而减少电子设备运算量的同时,减小了企业人员的无用工作量。
在一种可能的实现方式中,所述基于预设反馈准则,将所述每个词义相近的特征词对应的专利文献反馈至终端设备进行显示,之前还包括:
由多个词义相近的特征词对应的专利文献构建多个第二数据矩阵,其中,所述词义相近的特征词与第二数据矩阵一一对应;
将所有第二数据矩阵内的专利文献之间进行比对,确定所有第二数据矩阵中包含的重复专利文献;
将所述重复专利文献从对应的第二数据矩阵内舍弃。
通过采用上述技术方案,由每个词义相近的特征词对应的多个专利文献构建成一个数据矩阵,即第二数据矩阵;随后,将所有第二数据矩阵内的专利文献之间进行比对,进而确定出所有第二数据矩阵内的重复专利文献,之后将重复专利文献从对应的第二数据矩阵内舍弃,从而避免了将重复专利文献反馈这客户端进行显示,使得影响到企业人员的体验。
在一种可能的实现方式中,所述将所有第二数据矩阵内的专利文献之间进行比对,确定所有第二数据矩阵中包含的重复专利文献,包括:
选取任一第二数据矩阵,从该任一第二数据矩阵中依次调取存储的专利文献,并与其余第二数据矩阵中的专利文献进行比对,确定任一第二数据矩阵对应的重复专利文献; 待该任一第二数据矩阵内的所有专利文献比对完成,再次选取除任一第二数据数据矩阵之外的第二数据矩阵中的专利文献,重复对比过程,确定所有第二数据矩阵中包含的重复专利文献。
通过采用上述技术方案,以任一第二数据矩阵中的专利文献作为一个比对单元,与其他第二数据矩阵中的专利文献进行比对,确定出该任一第二数据矩阵中的专利文献对应的重复专利文献后,在选取其他第二数据矩阵中的专利文献继续进行比对,直至所有第二数据矩阵的专利文献对应的重复专利文献,进而避免了重复对比,减小了运算量。
第二方面,本申请提供一种企业专利数据比对装置,采用如下的技术方案:
一种企业专利数据比对装置,包括第一特征词确定模块、第二特征词确定模块、数据矩阵构建模块、第一专利文献确定模块以及第一反馈模块,其中,
第一特征词确定模块,用于当接收到客户端发送的原专利文献时,确定所述原专利文献中包含的特征词;
第二特征词确定模块,用于将所述特征词代入预设词库,确定所述特征词对应的多个词义相近的特征词;
数据矩阵构建模块,用于由所述多个词义相近的特征词构建第一数据矩阵;
第一专利文献确定模块,用于将所述第一数据矩阵中的所述多个词义相近的特征词分别代入预设第二专利数据库进行比对,确定每个词义相近的特征词对应的专利文献;
第一反馈模块,用于基于预设反馈准则,将所述每个词义相近的特征词对应的专利文献反馈至终端设备进行显示。
通过采用上述技术方案,客户端发送原专利文献,第一特征词确定模块基于接收到的原专利文献确定出该原专利文献中包含的特征词;随后,为了能够比对出所有的相关专利文献,第二特征词确定模块将该特征词代入至提前预设的词库,进而由第二特征词确定模块确定出与特征词对应的多个词义相近的特征词;通过数据矩阵构建模块构建由多个词义相近的特征词组成的数据矩阵,即第一数据矩阵,以便于后续通过词义相近的特征词进行专利文献的比对;随后,第一专利文献确定模块从第二数据矩阵分别调取出词义相近的特征词至第二专利数据库中进行专利文献的比对,进而确定出每个词义相近的特征词对应的专利文献,由于确定出的专利文献数量较大,为了能够有序将专利文献反馈至终端设备进行显示,继而第一反馈模块基于预设的反馈准则将确定出的专利文献有序的反馈至终端设备进行显示,进而比对出所有可能为企业所需的专利文献,进而提高了专利数据比对的准确率。
在一种可能的实现方式中,所述企业专利数据比对装置,还包括:技术领域确定模块、第二专利文献确定模块以及数据库构建模块,其中,
图1是本申请实施例企业专利数据比对方法的流程示意图;
图2是本申请实施例企业专利数据比对装置的方框示意图;
图3是本申请实施例电子设备的示意图。
以下结合附图1-3对本申请作进一步详细说明。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了方便理解本申请提出的技术方案,首先在此介绍本申请描述中会引入的几个要素。应理解的是,以下介绍仅方便理解这些要素,以期理解本申请实施例的内容,并非一定涵盖所有可能的情况。
本申请实施例提供了一种企业专利数据比对方法,由电子设备执行,其中,该电子设备可以为服务器也可以为终端设备,其中,该服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集或者分布式系统,还可以是提供云计算的云服务器。终端设备可以为智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此,该终端是被以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例在此不做限制。
参照图1,该方法包括:步骤S101、步骤S102、步骤S103以及步骤S104,其中,
S101、当接收到客户端发送的原专利文献时,确定原专利文献中包含的特征词。
通过采用上述技术方案,原专利文献为企业所持有的专利文献,以该原专利文献作为比对专利文献,来确定出企业所要寻出与该原专利文献相似的专利文献。
终端设备安设有客户服务平台,企业人员将原专利文献录入至终端设备的客户服务平台,并将原专利文献中的特征词标记出来;电子设备在接收到已进行特征词标记的原专利文献后,从该专利文献中识别出已标记特征词,即确定出原专利文献中包含的特征词;并在以后将该特征词作为确定其他相关专利文献的参考信息。例如,企业人员通过手机、电脑以及平板等具备上网功能的终端设备将原专利文件进行录入,并在录入之后,将原专利文件中特征词进行标记,随后,终端设备将以进行特征词标记的原专利文献发送至电子设备,而电子设备进行特征词识别,继而确定出该原专利文献中包含的特征词。
值得说明的,在企业人员在没有原专利文献的前提下,企业人员也可通过人工录入特征词的方式,将特征词录入至终端设备,并由终端设备发送至电子设备。
S102、将特征词代入预设词库,确定特征词对应的多个词义相近的特征词。
通过采用上述技术方案,预设词库包含有众多技术领域和生活中所运用到的词语,并且存在每个词语与词义相近的词语之间的对应关系,其中,该预设词库可通过以往申请的各技术领域的专利文献中所记载的内容进行构建,也可以与由第三方构建的公共词库进行连接,构成预设词库。
电子设备从原专利文献中确定出所包含的特征词后,将该特征词代入至预设词库,与预设词库中所包含的词语进行对应匹配,继而在预设词库中确定出该特征词,随后,根据该特征词与对应的词义相近的特征词之间的对应关系,继而确定出该特征词对应的词义相近的特征词;例如,原专利文献的案件为神经网络案件,电子设备从原专利文献中确定出的特征词为:卷积核,其中,在该神经网络技术领域中该特征词还可以称作:窗口、小窗口或者过滤器;电子设备将卷积核代入至预设词库,随后,基于卷积核与词语相近之间对应的关系,确定出窗口、小窗口以及过滤器等特征词。
S103、由多个词义相近的特征词构建第一数据矩阵。
通过采用上述技术方案,电子设备基于特征词确定出对应的多个词义相近的特征词后,为了便于确定出多个词义相近的特征词对应的专利文献,电子设备将由确定出的多个词义相近的特征词构建第一数据矩阵;其中,多个词义相近的特征词可基于特征词在对应的技术领域中使用的频次高低进行第一数据矩阵的构建,以使得使用频次较高的特征词在第一数据矩阵中排序靠前,继而能够优先进行调取比对。
S104、将第一数据矩阵中的多个词义相近的特征词分别代入预设第二专利数据库进行比对,确定每个词义相近的特征词对应的专利文献。
通过采用上述技术方案,第二专利数据库为众多专利文献构建的数据库,可将特征词代入该第二专利数据库,与第二专利数据库中包含的专利文献进行比对;具体地,电子设备将由多个词义的特征词构建完成第一数据矩阵后,电子设备从第一数据矩阵中依次调取出某一词义相近的特征词,并随后将该某一词义相近的特征词代入至第二数据库中,与第二数据库中包含的专利文献进行比对,确定专利文献中是否包含该某一词义相近的特征词,当某一词义相近的特征词比对完第二数据库中包含的所有专利文献,并确定出该某一词义相近的特征词对应的专利文献后,电子设备从第一数据矩阵中调取出另外特征词继续进行比对,直至将第一数据矩阵中包含的所有词义相近的特征词对应的专利文献确定完成。
例如,电子设备首先从第一数据库中调取出过滤器一词,将该过滤器一词代入至第二专利数据库中,与第二专利数据库中的所有专利文献进行比对,进而确定出第二专利数据库中所有包含该过滤器一词的专利文献;随后,电子设备调取第一数据矩阵中其他词义相近的特征词并代入至第二数据库中,继续进行专利文献的比对。其中,电子设备可根据多个词义相近的特征词在对应技术领域中的使用频次高低作为从第一数据矩阵中调取的词义相近的特征词的先后顺序。
S105、基于预设反馈准则,将每个词义相近的特征词对应的专利文献反馈至终端设备进行显示。
通过采用上述技术方案,预设反馈准则为电子设备将多个专利文献发送至终端设备进行显示的发送规则。
电子设备确定出每个词义相近的特征词对应的专利文献后,则需要将该批次的专利文献反馈这终端设备进行显示,考虑到该批次专利文献众多,并且该批次的专利文献中并不是所有的专利文献都为企业所需的专利文献,因此,电子设备预设有反馈准则;电子设备基于预设反馈准则,将该批次的专利文献反馈至终端设备进行显示,其中,可基于专利文献中出现对应的特征词的次数作为优先进行反馈显示的条件;继而在将所有可能为企业所需的专利文献筛选出并反馈的同时,以使得最有可能为企业的专利文献优先反馈至终端设备进行显示,进而提高了专利数据比对的准确性。
本申请实施例提供了一种企业专利数据比对方法,客户端发送原专利文献,基于接收到的原专利文献确定出该原专利文献中包含的特征词;随后,为了能够比对出所有的相关专利文献,将该特征词代入至提前预设的词库,进而确定出与特征词对应的多个词义相近的特征词;由多个词义相近的特征词进行数据矩阵的构建,即第一数据矩阵,以便于后续通过词义相近的特征词进行专利文献的比对;随后,从第二数据矩阵分别调取出词义相近的特征词至第二专利数据库中进行专利文献的比对,进而确定出每个词义相近的特征词对应的专利文献,由于确定出的专利文献数量较大,为了能够有序将专利文献反馈至终端设备进行显示,继而基于预设的反馈准则将确定出的专利文献有序的反馈至终端设备进行显示,进而比对出所有可能为企业所需的专利文献,进而提高了专利数据比对的准确率。
本申请实施例的一种可能的实现方式,步骤S101中,确定原专利文献中包含的特征词,之前还包括:
当接收到客户端发送的原专利文献时,确定原专利文献的所属技术领域;
将技术领域与第一专利数据库内的所有的专利文献进行比对,确定划分在技术领域内的专利文献;
由划分在技术领域内的专利文献构建第二专利数据库。
对于本申请实施例,第一专利数据库为专利平台的总专利数据库,其中录入了众多技术领域的专利文献,对于每个企业所需的专利文献受企业运行领域的影响,所要比对的专利文献的技术领域也具有局限性,通过特征词与众多技术领域的专利文献进行比对,在特征词比对过程中将花费大量的运算时间,因此,电子设备在接收到原专利文献时,首先,确定出原则专利文献中所记载的技术领域,随后,电子设备将该技术领域代入至专利数据库中,并与第一专利数据库中的专利文献所属技术领域进行比对,进而确定出符合原专利文献的技术领域的专利文献,将该专利文献作为进行后续特征词比对的专利文献,并且为了能够便于后期特征词的比对,由该专利文献构建新的专利数据库,即第二专利数据库。例如,电子设备确定出原专利文献为神经网络技术领域,随后电子设备将神经网络技术领域代入至第一专利数据库中,确定出符合该技术领域的专利文献,随即电子设备将符合神经网络技术领域的专利文献构建成新的专利数据库,即第二专利数据库。
之后,电子设备在确定出原专利文献对应的特征词后,将词义相近的特征词代入至第二专利数据可中进行比对;进而减少了基于特征词进行专利文献比对过程中的运算量。
本申请实施例的一种可能的实现方式,步骤S103中,由多个近义词相近的特征词构建第一数据矩阵,包括:
将多个词义相近的特征词分别代入第一专利数据库中,确定每个词义相近的特征对应的出现频次;
基于高频次的词义相近的特征词有限排布的准则,将多个词义相近的特征词构建第一数据矩阵。
对于本申请实施例,电子设备根据原专利文献的特征词确定出多个词义相近的特征词后,其中在对应的技术领域中,由于技术人员的使用规范不同,多个词义相近的特征词之间存在使用频次高低上的差异,使用频次高的词义相近的特征词往往所涉及到专利文献数量更多,且在该频次高的词义相近的特征词对应的专利文献中,企业人员所需的专利文献的可能性往往会更高,因此,为了能够使企业人员更加快速的比对出所需专利文献,则需要将在第一专利数据库中出现频次最高的词义相近的特征词进行优先反馈至终端设备进行显示。
具体地,电子设备将确定出的多个词义相近的特征词分别代入第一专利数据库中进行比对,确定每个词义相近的特征词出现的频次,随后,电子设备在构建第一数据矩阵时将高频次的词义相近的特征词优先构建,进而在后续进行特征词比对的过程中,优先进行比对,优先确定出对应的专利文献。
本申请实施例的一种可能的实现方式,步骤S105中,基于预设反馈准则,将每个词义相近的特征词对应的专利文献反馈至终端设备进行显示,之前还包括:
由多个词义相近的特征词对应的专利文献构建多个第二数据矩阵,其中,词义相近的特征词与第二数据矩阵一一对应;
将所有第二数据矩阵内的专利文献之间进行比对,确定所有第二数据矩阵中包含的重复专利文献;
将重复专利文献从对应的第二数据矩阵内舍弃。
对于本申请实施例,在同一技术领域的专利文献中,存在任一一篇专利文献中记载有至少两个词义相近的特征词,对于该任一一篇专利文献在进行特征词比对过程中,将出现至少两次被比对出的情况,即出现重复专利文献,若将重复的专利文献多次反馈至终端设备进行显示,将影响企业人员的正常使用,将第企业人员的使用体验;因此,电子设备由每个词义相近的特征词对应的多个专利文献构建成一个数据矩阵,即第二数据矩阵;随后,电子设备将所有第二数据矩阵内的专利文献之间进行比对,进而确定出所有第二数据矩阵内的重复专利文献,随即将重复专利文献从对应的第二数据矩阵内舍弃,从而避免了将重复专利文献反馈这客户端进行显示,使得影响到企业人员的体验的情况发生。
本申请实施例的一种可能的实现方式,步骤S104中,确定每个词义相近的特征对应的专利文献,之后还包括:
在每个词义相近的特征词对应多个专利文献时,从每个词义相近的特征词对应多个专利文献中,确定每个专利文献中出现对应的词义相近的特征词的频次;
基于出现对应的词义相近的特征词的频次的高低,确定对应的专利文献的优先级;
将优先级高的专利文献定义为优先反馈的专利文献。
对于本申请实施例,通过词义相近的特征词对应出多个专利文献时,其中每个专利文献所包含的该词义相近的特征词的数量并不一样,即专利文献中出现该词义相近的特征词的频次不同,而出现词义相近的特征词频率较低的专利文献即表明该专利文献中所记载的内容往往并不是围绕该词义相近的特征词进行的记载。
因此,该专利文献很大可能性并不是企业所需的专利文献;而出现词义相近的特征频率较高的专利文献则表明该词义相近的特征词在专利文献中具有重要的作用,因此该专利文献很大可能性为企业所需的专利文献;为了能够让企业人员快速比对出所需专利文献,则需要将出现频率较高的原专利文献的特征词对应的词义相近的特征词对应的专利文献优先进行反馈显示。
因此,电子设备在确定出每个词义相近的特征词对应的多个专利文献后,确定出每个专利文献中出现该词义相近的特征词的频次,随后将频次进行比对,将频次高的专利文献定义为优先级,例如,词义相近的特征词为该专利文献中的核心特征词,在该专利文献中所使用该词义相近的特征词的频率将会很高,当词义相近的特征词在该专利文献中只是简单的进行介绍说明,而该词义相近的特征词所出现的频次将会很低;在将该多个专利文献反馈至终端设备进行显示时,将定义为优先级的专利文献优先进行反馈显示,进而提高了企业人员进行专利文献比对,确定出所需专利文献的效率。
进一步的,每个专利文献中出现对应的词义相近的特征词的频次的高低,表明专利文献中所记载的内容中该词义相近的特征词是否为核心特征词,对应的词义相近的特征词出现的频次很低,亦表明专利文献中所记载的内容与该词义相近的特征词关联很小,即与词义相近的特征词关联很小的专利文献与企业人员提供的原专利文献之间所记载内容相差很大,出现词义相近的特征词频次很低的专利文献比不是企业人员所需的专利文献,进而将该专利文献反馈至终端设备进行显示,不能满足企业人员的需求的同时,反而提高了企业人员的工作量;具体地,在确定每个专利文献中出现对应的词义相近的特征词的频次,之后还包括:
判断每个专利文献中出现对应的词义相近的特征词频次是否小于预设频次;
若是,则将小于预设频次对应的专利文献舍弃。
具体地,电子设备预设有用于判断通过词义相近的特征词确定出的专利文献是否符合企业人员所需的判断条件,即预设词义相近的特征词的出现频次;当确定出每个专利文献中出现对应的词义相近的特征词频次后,与预设频次进行比对,判断是否小于预设频次,当小于预设频次时,则表明该专利文献做记载的内容不符合企业人员的需求,至此,电子设备将该小于预设频次对应的专利文献进行舍弃,从而减少电子设备运算量的同时,减小了企业人员的无用工作量;例如,任一专利文献中的词义相近的特征词只是在某一技术特征中进行的一个解释说明,在后续方案描述中没有过多用到,此时,该词义相近的特征词在专利文献中出现的频次将会很低,致使则判定该专利文献中所记载的内容不符合企业人员所需,此时,电子设备在将确定出来的多个专利文献反馈至终端设备进行显示之前,则将该专利文献进行舍弃。
进一步,在对所有第二数据矩阵对比过程中,为了减小电子设备的运算量,将所有第二数据矩阵内的专利文献之间进行比对,确定所有第二数据矩阵中包含的重复专利文献时,具体包括:选取任一第二数据矩阵,从该任一第二数据矩阵中依次调取存储的专利文献,并与其余第二数据矩阵中的专利文献进行比对,确定任一第二数据矩阵对应的重复专利文献;待该任一第二数据矩阵内的所有专利文献比对完成,再次选取除任一第二数据数据矩阵之外的第二数据矩阵中的专利文献,重复对比过程,确定所有第二数据矩阵中包含的重复专利文献。
对于本申请实施例,从多个第二数据矩阵中选取任一第二数据矩阵,将该任一第二数据矩阵的中的专利文献分别对于其余第二数据矩阵中的专利文献进行逐一对比,确定出与该任一第二数据矩阵中的专利文献重复的专利文献,随后,再次选取除任一第二数据矩阵之外的第二数据矩阵重复上述对比过程,直至确定出每个第二数据矩阵中专利文献对应的重复专利文献,进而有序的且无重复的确定出多个词义相近的特征词对应的所有专利文献的重复专利文献,减小了运算量。
上述实施例从方法流程的角度介绍一种企业专利数据比对的方法,下述实施例从虚拟模块或者虚拟单元的角度介绍了一种企业专利数据比对的装置,具体详见下述实施例。
参照图2,企业专利数据比对装置,20具体可以包括:第一特征词确定模块21、第二特征词确定模块22、数据矩阵构建模块23、第一专利文献确定模块24以及第一反馈模块25,其中,
第一特征词确定模块21,用于当接收到客户端发送的原专利文献时,确定原专利文献中包含的特征词;
第二特征词确定模块22,用于将特征词代入预设词库,确定特征词对应的多个词义相近的特征词;
数据矩阵构建模块23,用于由多个词义相近的特征词构建第一数据矩阵;
第一专利文献确定模块24,用于将第一数据矩阵中的多个词义相近的特征词分别代入预设第二专利数据库进行比对,确定每个词义相近的特征词对应的专利文献;
第一反馈模块25,用于基于预设反馈准则,将每个词义相近的特征词对应的专利文献反馈至终端设备进行显示。
本申请实施例的一种可能的实现方式,企业专利数据比对装置20,还包括:技术领域确定模块、第二专利文献确定模块以及数据库构建模块,其中,
本文发布于:2023-03-13 01:03:06,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/68671.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |