G06F40/216 G06F40/289 G06Q50/18
1.一种基于词频的专利信息处理服务系统,其特征在于,包括:
专用存储器,所述专用存储器用于替代词词汇存储;
存储服务器,所述存储服务器用于专利信息存储;
自动入库模块,所述自动入库模块用于建立替代词词库和获得标准化的检索程序,根据专题检索词并调用替代词词库作为关键词在全领域专利数据库进行检索,进而形成某一技术领域的专题数据库;
关联匹配模块,所述关联匹配模块用于运用自然语言处理技术对某个专利专题数据库的专利信息进行特征词信息提取,通过所述特征词信息分析每篇专利文本的特征词词频并构建特征词词频向量矩阵,依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度;
专题数据服务模块,所述专题数据服务模块用于为用户提供可选的智慧检索服务,并为用户及时推送技术关联度较高的所述专利文本,同时可通过自建词库实现智慧检索;
技术供需匹配模块,所述技术供需匹配模块用于分别获得规范的技术需求文本和技术供给文本,并通过所述关联匹配模块实现供需技术关联匹配,根据所述供需技术关联匹配访问存储服务器得到对应的供需专利文本,进而向相关用户推送。
专利权许可评估辅助决策模块,所述专利权许可评估辅助决策模块用于将企业自身能力与条件与所述供需专利结合,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值。
2.根据权利要求1所述的一种基于词频的专利信息处理服务系统,其特征在于,所述自动入库模块包括:
替代词词库建立单元,所述替代词词库建立单元用于利用检索词的同义或者相近的词语形成替代词在所述专用存储器中建立替代词词库;
标准化专题检索单元,所述标准化专题检索单元用于构建标准化的检索程序,每个所述检索程序可对应一个专题;
专利信息入库单元,所述专利信息入库单元用于在第一间隔时间内,启用标准化的检索程序,调用所述替代词词库的词语作为关键词在全领域专利数据库进行检索得到第一专利信息,并将所述第一专利信息存入所述存储服务器对应的专利专题数据库中。
3.根据权利要求1所述的一种基于词频的专利信息处理服务系统,其特征在于,所述关联匹配模块包括:
词频数据标引单元,所述词频数据标引单元用于获得所述检索词,运用自然语言处理技术结合检索词访问所述存储服务器对某个所述专利专题数据库的专利信息进行特征词信息提取;
统计单元,所述统计单元用于通过所述特征词信息统计每篇专利文本的特征词词频,将每篇专利文本的所述特征词词频构建特征词词频向量矩阵,同时处理后的所述特征词信息存入所述存储服务器的信息数据库与相应的专利文本一一对应;
技术关联计算单元,所述技术关联计算单元用于依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度;
排序单元,所述排序单元用于根据每篇所述专利文本之间的技术关联度计算每篇所述专利文本之间的技术关联度,依据每篇所述专利文本的技术关联度进行排序后,并将所述技术关联度大于预设值的所述专利文本存入所述存储服务器的关联度数据库。
4.根据权利要求3所述的一种基于词频的专利信息处理服务系统,其特征在于,所述特征词词频向量的表达公式为:
式中:A-为某篇专利文本的特征词词频向量矩阵;
aj为第j个特征词,j=1...m;
αj为对应的特征词aj在专利文本中出现的总频次;
βj为对应的特征词aj在专利文本中附图说明的词频;
为对应的特征词aj在专利文本中说明书摘要的词频;
σj为对应的特征词aj在专利文本中权利要求书的词频;
πj为对应的特征词aj在专利文本中实施方案中的词频。
5.根据权利要求1所述的一种基于词频的专利信息处理服务系统,其特征在于,所述专题数据服务模块包括:
智慧检索单元,所述智慧检索单元用于录入检索词,根据按照用户的选择,访问所述替代词词库进行匹配并实现用输入的检索词及调用对应替代词词库进行检索;
自建词库单元,所述自建词库单元用于检索时根据用户的设定,可选启用用户自建词库内的所有关键词实现智慧检索。
6.根据权利要求1所述的一种基于词频的专利信息处理服务系统,其特征在于,所述技术供需匹配模块包括:
技术需求处理单元,所述技术需求处理单元用于获得用户的技术需求文本,提取所述技术需求文本中的特征词,形成技术需求文本的特征词词频向量矩阵;
技术供给处理单元,所述技术供给处理单元用于获得用户的技术供给文本,提取所述技术供给文本中的特征词,形成技术供给文本的特征词词频向量矩阵;
技术供需匹配单元,所述技术供需匹配单元用于调用技术关联计算单元、技术需求文本的特征词词频向量矩阵、技术供给文本的特征词词频向量矩阵,并计算技术供给和技术需求之间的技术关联度,实现供需技术关联匹配,进而向相关用户推送。
7.根据权利要求1所述的一种基于词频的专利信息处理服务系统,其特征在于,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值,其线性规划模型的计算公式为:
式中,z为某企业实施专利技术前或后取得的最大收益;
xi为第i种产品的生产数量;
ai为生产一个单位第i种产品取得的收益;
bij为生产第i种产品消耗的第j种资源的数量;
j为生产资源的数量;
cj为企业可获得第j种生产资源的最大数量。
8.一种基于词频的专利信息处理服务方法,应用于权利要求1~7任一项所述的一种基于词频的专利信息处理服务系统,其特征在于,包括以下步骤:
S1,建立替代词词库和获得标准化的检索程序,根据专题检索词并调用替代词词库作为关键词在全领域专利数据库进行检索,进而形成某一技术领域的专题数据库;
S2,运用自然语言处理技术对某个专利专题数据库的专利信息进行特征词信息提取,通过所述特征词信息分析每篇专利文本的特征词词频并构建特征词词频向量矩阵,依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度;
S3,通过替代词词库为用户提供可选的智慧检索服务,并为用户及时推送技术关联度较高的所述专利文本,同时可通过自建词库实现智慧检索;
S4,分别获得规范的技术需求文本和技术供给文本,并通过所述关联匹配模块实现供需技术关联匹配,根据所述供需技术关联匹配访问存储服务器得到对应的供需专利文本,进而向相关用户推送;
S5,将企业自身能力与条件与所述供需专利结合,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值。
本发明属于专利信息服务系统技术领域,具体而言,涉及一种基于词频的专利信息处理服务系统及其服务方法。
某一技术领域的专题专利数据库是进行技术开发的重要工具,但当前技术交叉融合,专利数量庞大,分部分类已难以满足现代专利信息管理要求,技术相关性日益复杂,信息冗余不断增加,信息管理成本不断提高,尤其在中文专利文本中,存在多词多义,现有数据相似度计算不准确、技术关联日益增多等问题,因此如何设计好专题数据库,为技术开发人员节省检索和研发成本,并实现专利技术信息舆情的及时监控管理,是当前一项重要的课题。
本发明实施例提供了一种基于词频的专利信息处理服务系统及其服务方法,其目的在于解决现有的专题专利数据库技术交叉融合,专利数量庞大,分部分类已难以满足现代专利信息管理要求,技术相关性日益复杂,信息冗余不断增加,信息管理成本不断提高以及数据相似度计算不准确、技术关联日益增多的问题。
鉴于上述问题,本发明提出的技术方案是:
一种基于词频的专利信息处理服务系统,其特征在于,包括:
专用存储器,所述专用存储器用于替代词词汇存储;
存储服务器,所述存储服务器用于专利信息存储;
自动入库模块,所述自动入库模块用于建立替代词词库和获得标准化的检索程序,根据专题检索词并调用替代词词库作为关键词在全领域专利数据库进行检索,进而形成某技术领域的专题数据库;
关联匹配模块,所述关联匹配模块用于运用自然语言处理技术对某个专利专题数据库的专利信息进行特征词信息提取,通过所述特征词信息分析每篇专利文本的特征词词频并构建特征词词频向量矩阵,依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度;
专题数据服务模块,所述专题数据服务模块用于为用户提供可选的智慧检索服务,并为用户及时推送技术关联度较高的所述专利文本,同时可通过自建词库实现智慧检索;
技术供需匹配模块,所述技术供需匹配模块用于分别获得规范的技术需求文本和技术供给文本,并通过所述关联匹配模块实现供需技术关联匹配,根据所述供需技术关联匹配访问存储服务器得到对应的供需专利文本,进而向相关用户推送。
专利权许可评估辅助决策模块,所述专利权许可评估辅助决策模块基于某企业自身能力,采用线性规划模型计算一段时间内专利权实施技术前后企业的收益差,辅助确定专利权许可价值。
作为本发明的一种优选技术方案,所述自动入库模块包括:
替代词词库建立单元,所述替代词词库建立单元用于利用检索词的同义或者相近的词语形成替代词在所述专用存储器中建立替代词词库;
标准化专题检索单元,所述标准化专题检索单元用于构建标准化的检索程序,每个所述检索程序可对应一个专题;
专利信息入库单元,所述专利信息入库单元用于在第一间隔时间内,启用标准化的检索程序,调用所述替代词词库的词语作为关键词在全领域专利数据库进行检索得到第一专利信息,并将所述第一专利信息存入所述存储服务器对应的专利专题数据库中。
作为本发明的一种优选技术方案,所述关联匹配模块包括:
词频数据标引单元,所述词频数据标引单元用于获得所述检索词,运用自然语言处理技术结合检索词访问所述存储服务器对某个所述专利专题数据库的专利信息进行特征词信息提取;
统计单元,所述统计单元用于通过所述特征词信息统计每篇专利文本的特征词词频,将每篇专利文本的所述特征词词频构建特征词词频向量矩阵,同时处理后的所述特征词信息存入所述存储服务器的信息数据库与相应的专利文本一一对应;
技术关联计算单元,所述技术关联计算单元用于依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度;
排序单元,所述排序单元用于根据每篇所述专利文本之间的技术关联度计算每篇所述专利文本之间的技术关联度,依据每篇所述专利文本的技术关联度进行排序后,并将所述技术关联度大于预设值的所述专利文本存入所述存储服务器的关联度数据库。
作为本发明的一种优选技术方案,所述特征词向量的表达公式为:
式中:A-为某篇专利文本的特征词词频向量矩阵;
aj为第j个特征词,j=1...m;
αj为对应的特征词aj在专利文本中出现的总频次;
βj为对应的特征词aj在专利文本中附图说明的词频;
为对应的特征词aj在专利文本中说明书摘要的词频;
σj为对应的特征词aj在专利文本中权利要求书的词频;
πj为对应的特征词aj在专利文本中实施方案中的词频。
作为本发明的一种优选技术方案,所述专题数据服务模块包括:
智慧检索单元,所述智慧检索单元用于录入检索词,根据按照用户的选择,访问所述替代词词库进行匹配并实现用输入的检索词及调用对应替代词词库进行检索;
自建词库单元,所述自建词库单元用于检索时根据用户的设定,可选启用用户自建词库内的所有关键词实现自建智慧检索。
作为本发明的一种优选技术方案,所述技术供需匹配模块包括:
技术需求处理单元,所述技术需求处理单元用于获得用户的技术需求文本,提取所述技术需求文本中的特征词,形成技术需求文本的特征词词频向量矩阵;
技术供给处理单元,所述技术供给处理单元用于获得用户的技术供给文本,提取所述技术供给文本中的特征词,形成技术供给文本的特征词词频向量矩阵;
技术供需匹配单元,所述技术供需匹配单元用于调用技术关联计算单元、技术需求文本的特征词词频向量矩阵、技术供给文本的特征词词频向量矩阵,并计算技术供给和技术需求之间的技术关联度,实现供需技术关联匹配,进而向相关用户推送。
作为本发明的一种优选技术方案,还包括专利权许可评估辅助决策模块,所述专利权许可评估辅助决策模块用于将企业自身能力与条件与所述供需专利结合,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值。作为本发明的一种优选技术方案,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值,其线性规划模型的计算公式为:
式中,z为某企业实施专利技术前或后取得的最大收益;
xi为第i种产品的生产数量;
ai为生产一个单位第i种产品取得的收益;
bij为生产第i种产品消耗的第j种资源的数量;
j为生产资源的数量;
cj为企业可获得第j种生产资源的最大数量。
另一方面,本发明实施例还提供了一种基于词频的专利信息处理服务方法,包括以下步骤:
S1,建立替代词词库和获得标准化的检索程序,根据专题检索词并调用替代词词库作为关键词在全领域专利数据库进行检索,进而形成某一技术领域的专题数据库;
S2,运用自然语言处理技术对某个专利专题数据库的专利信息进行特征词信息提取,通过所述特征词信息分析每篇专利文本的特征词词频并构建特征词词频向量矩阵,依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度;
S3,通过替代词词库为用户提供可选的智慧检索服务,并为用户及时推送技术关联度较高的所述专利文本,同时可通过自建词库实现智慧检索;
S4,分别获得规范的技术需求文本和技术供给文本,并通过所述关联匹配模块实现供需技术关联匹配,根据所述供需技术关联匹配访问存储服务器得到对应的供需专利文本,进而向相关用户推送;
S5,将企业自身能力与条件与所述供需专利结合,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值。
本发明实施例提供的上述技术方案的有益效果至少包括:通过对检索词汇的处理后,提高了专利的检索查询的效果,节省了人工进行专利分析的成本,提高了系统性能,减少了检索查询分析过程中原专利文本中心信息冗余导致的相似相关专利分析困难。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
图1是本发明所公开的一种基于词频的专利信息处理服务系统的结构示意图;
图2是本发明所公开的一种基于词频的专利信息处理服务方法的流程图;
图3是本发明所公开的一种基于词频的专利信息处理服务方法的步骤S1流程图;
图4是本发明所公开的一种基于词频的专利信息处理服务方法的步骤S2流程图
图5是本发明所公开的一种基于词频的专利信息处理服务方法的步骤S3流程图;
图6是本发明所公开的一种基于词频的专利信息处理服务方法的步骤S4流程图。
附图标记说明:100、专用存储器;200、关联匹配模块;210、替代词词库建立单元;220、标准化专题检索单元;230、专利信息入库单元;310、词频数据标引单元;320、统计单元;330、技术关联计算单元;340、排序单元;400、专题数据服务模块;410、智慧检索单元;420、自建词库单元;500、技术供需匹配模块;510、技术需求处理单元;520、技术供给处理单元;530、技术供需匹配单元;600、专利权许可评估辅助决策模块;700、存储服务器。
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
实施例一
参照附图1所示,本发明提供一种技术方案:一种基于词频的专利信息处理服务系统,包括专用存储器100、自动入库模块200、关联匹配模块200、专题数据服务模块400、技术供需匹配模块500、专利权许可评估辅助决策模块600和存储服务器700,专用存储器100用于词汇存储,所述存储服务器700用于专利信息存储。
自动入库模块200用于建立替代词词库和获得标准化的检索程序,根据专题检索词并调用替代词词库作为关键词在全领域专利数据库进行检索,进而形成某一技术领域的专题数据库。
其中,自动入库模块200包括替代词词库建立单元210、标准化专题检索单元220和专利信息入库单元230,替代词词库建立单元210用于利用检索词的同义或者相近的词语形成替代词在所述专用存储器100中建立替代词词库,所述标准化专题检索单元220用于构建标准化的检索程序,每个所述检索程序可对应一个专题,专利信息入库单元230用于在第一间隔时间内,启用标准化的检索程序,调用所述替代词词库的词语作为关键词在全领域专利数据库进行检索得到第一专利信息,并将所述第一专利信息存入所述存储服务器700对应的专利专题数据库中。
具体而言,检索词的同义或者相近的词语形成替代词是基于现有词典、语言数据库中解释和记录的同义词、替代词和相近词等可以替代检索词的词语;还可以是技术领域专家确定的需要添加的可以替代检索词的词语;或经大数据分析及在专利专题数据库使用过程中发现的匹配的可能替代检索词的词语,经专家辨识确认后进入词库。例如“装置”可得到“设备、装备、机器、仪器”等词语即可将检索词替换。
标准化的检索程序是通过专利信息检索软件工具编辑得到,并将检索程序进行存储,待每次到达第一间隔时间后,专利信息入库单元230启用标准化的检索程序,并将替代词词库的词语作为关键词在全领域专利数据库进行检索得到第一专利信息,当然,第一专利信息为当前检索时间检索得到的新公开以及新发布的专利信息。
需要说明的是,第一间隔时间的范围为1d~3d。
关联匹配模块200用于运用自然语言处理技术对某个专利专题数据库的专利信息进行特征词信息提取,通过所述特征词信息分析每篇专利文本的特征词词频并构建特征词词频向量矩阵,依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度。
其中,关联匹配模块200包括词频数据标引单元310、统计单元320、技术关联计算单元330和排序单元340,词频数据标引单元310用于获得所述检索词,运用自然语言处理技术结合检索词访问所述存储服务器700对某个所述专利专题数据库的专利信息进行特征词信息提取,统计单元320用于通过所述特征词信息统计每篇专利文本的特征词词频,将每篇专利文本的所述特征词词频构建特征词词频向量矩阵,同时处理后的所述特征词信息存入所述存储服务器700的信息数据库与相应的专利文本一一对应,技术关联计算单元330用于依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度,排序单元340用于根据每篇所述专利文本之间的技术关联度计算每篇所述专利文本之间的技术关联度,依据每篇所述专利文本的技术关联度进行排序后,并将所述技术关联度大于预设值的所述专利文本存入所述存储服务器700的关联度数据库。
具体而言,按照排序数据将若干个较高的专利文本形成至少一个专利簇,将至少一个专利簇发送至专用服务器的关联专利数据库。
进一步的,特征词词频向量的表达公式为:
式中:A-为某篇专利文本的特征词向量矩阵;
aj-为特征词;
αj-为对应的特征词aj在专利文本中出现的总频次;
βj-为对应的特征词aj在专利文本中附图说明的词频向量;
-为对应的特征词aj在专利文本中说明书摘要的词频向量;
σj-为对应的特征词aj在专利文本中权利要求书的词频向量;
πj为对应的特征词aj在专利文本中实施方案中的词频。
还有,αj、βi、σj≤λ,j≤ρ,其中,λ和ρ分别为一个常数,λ为检索词词频的最高值,ρ特征词的数量。
由于专利信息的词频具有不确定因素,通常λ不高于40次,例如,当“的”词频高于40次将不具有代表意义;同样的,一篇专利文本有效的特征词也是有限的,因此ρ不高于50个;同时通过表1和表2进行举例说明;
进一步而言,计算每篇专利文本之间的技术关联度采用余弦相似度公式进行计算,例如,专利A权利要求书的词频向量为A=[a1,a2……an],专利B权利要求书的词频向量为B=[b1,b2……bn],将专利A和专利B中的词频向量数值代入余弦相似度公式计算得出专利A与专利B的技术关联度,然而,余弦相似度计算为现有技术,因此在此不再详细说明。
还有,技术关联度是通过层次分析法赋权值得出,其计算公式为:
式中:μ-为专利文本间的技术关联度;
ωi-为通过判断矩阵专家法获得,和等于1。
μi-为专利文本。
专题数据服务模块400用于为用户提供可选的智慧检索服务,并为用户及时推送技术关联度较高的所述专利文本,同时可通过自建词库实现智慧检索。
其中,专题数据服务模块400包括智慧检索单元410、推送单元420和自建词库单元430,智慧检索单元410用于录入检索词,根据按照用户的选择,访问所述替代词词库进行匹配并实现用输入的检索词及调用对应替代词词库进行检索,自建词库单元430用于检索时根据用户的设定,可选启用用户自建词库内的所有关键词实现智慧检索。
具体而言,用户在主动检索过程中,智慧检索单元410则作为备选,当用户勾选使用替代单元后才可启用,访问替代词词库进行匹配并将检索词替换为替代词。
需要说明的是,第二专利信息为某用户所关注的专利信息。
技术供需匹配模块500用于分别获得规范的技术需求文本和技术供给文本,并通过所述关联匹配模块200实现供需技术关联匹配,根据所述供需技术关联匹配访问存储服务器700得到对应的供需专利文本,进而向相关用户推送。
其中,技术供需匹配模块500包括技术需求处理单元510、技术供给处理单元520和技术供需匹配单元530,技术需求处理单元510用于获得用户的技术需求文本,提取所述技术需求文本中的特征词,形成技术需求文本的特征词词频向量矩阵,技术供给处理单元520用于获得用户的技术供给文本,提取所述技术供给文本中的特征词,形成技术供给文本的特征词词频向量矩阵,技术供需匹配单元530用于调用技术关联计算单元330、技术需求文本的特征词词频向量矩阵、技术供给文本的特征词词频向量矩阵,并计算技术供给和技术需求之间的技术关联度,实现供需技术关联匹配,进而向相关用户推送。
专利权许可评估辅助决策模块600用于将企业自身能力与条件与所述供需专利结合,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值。
具体而言,在得到供需专利文本后,需要合适的价格,方能达成技术供需交易。另外,从生产的角度看,一项专利技术对于某企业一定时间内的使用价值受企业自身能力与条件的限制,因此使用线性规划模型评估专利权对某企业的许可价格。
在实施该供需专利文本的专利技术的某一段时间t,某企业具有实施该供需专利文本的专利技术取得的利润和不实施该供需专利文本的专利技术的利润的两种情况,t时间内专利权实施价值为V,由于是否采用该供需专利文本的专利技术,某企业获取利润不同,则该供需专利文本的专利技术实施价值为V=实施该供需专利文本的专利技术取得的利润-不实施该供需专利文本的专利技术的利润。
进一步的,线性规划模型的公式为:
其中,z为某企业实施专利技术前或后取得的利润;
i为某种产品;
xi为第二种产品的生产数量;
ai为生产一个单位第i种取得的利润;
bij为第i种产品消耗的第j中资源;
j为生产资源的数量;
cj为企业可获得第j种生产资源的数量。
实施例二
本发明实施例还公开了一种基于词频的专利信息处理服务方法,参照附图2~6所示,包括以下步骤:
S1,建立替代词词库和获得标准化的检索程序,根据专题检索词并调用替代词词库作为关键词在全领域专利数据库进行检索,进而形成某一技术领域的专题数据库。
其中,步骤S1的具体实施例为:
S11,利用检索词的同义或者相近的词语形成替代词在所述专用存储器100中建立替代词词库。
S12,构建标准化的检索程序,每个所述检索程序可对应一个专题。
S13,在第一间隔时间内,启用标准化的检索程序,调用所述替代词词库的词语作为关键词在全领域专利数据库进行检索得到第一专利信息,并将所述第一专利信息存入所述存储服务器对应的专利专题数据库中。
S2,运用自然语言处理技术对某个专利专题数据库的专利信息进行特征词信息提取,通过所述特征词信息分析每篇专利文本的特征词词频并构建特征词词频向量矩阵,依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度。
其中,步骤S2的具体实施例为:
S21,获得所述检索词,运用自然语言处理技术结合检索词访问所述存储服务器700对某个所述专利专题数据库的专利信息进行特征词信息提取。
S22,通过所述特征词信息统计每篇专利文本的特征词词频,将每篇专利文本的所述特征词词频构建特征词词频向量矩阵,同时处理后的所述特征词信息存入所述存储服务器700的信息数据库与相应的专利文本一一对应。
S23,依据所述特征词词频向量矩阵并运用余弦相似度建立模型计算专利文本之间的技术关联度。
S24,根据每篇所述专利文本之间的技术关联度计算每篇所述专利文本之间的技术关联度,依据每篇所述专利文本的技术关联度进行排序后,并将所述技术关联度大于预设值的所述专利文本存入所述存储服务器700的关联度数据库。
S3,通过替代词词库为用户提供可选的智慧检索服务,并为用户及时推送技术关联度较高的所述专利文本,同时可通过自建词库实现智慧检索。
其中,步骤S3的具体实施例为:
S31,录入检索词,根据按照用户的选择,访问所述替代词词库进行匹配并实现用输入的检索词及调用对应替代词词库进行检索;
S32,检索时根据用户的设定,可选启用用户自建词库内的所有关键词实现智慧检索。
S4,分别获得规范的技术需求文本和技术供给文本,并通过所述关联匹配模块200实现供需技术关联匹配,根据所述供需技术关联匹配访问存储服务器700得到对应的供需专利文本,进而向相关用户推送。
其中,步骤S4的具体实施例为:
S41,获得用户的技术需求文本,提取所述技术需求文本中的特征词,形成技术需求文本的特征词词频向量矩阵。
S42,获得用户的技术供给文本,提取所述技术供给文本中的特征词,形成技术供给文本的特征词词频向量矩阵。
S43,调用技术关联计算单元330、技术需求文本的特征词词频向量矩阵、技术供给文本的特征词词频向量矩阵,并计算技术供给和技术需求之间的技术关联度,实现供需技术关联匹配,进而向相关用户推送。
S5,将企业自身能力与条件与所述供需专利结合,使用线性规划模型计算一段时间内专利技术实施技术前后对某企业的最大收益差额,并通过技术分成确定专利技术的许可实施价值。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
本文发布于:2023-03-12 21:51:57,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/68268.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |