G06F17/27 G06F17/30
1.一种创新方案匹配方法,其特征在于,包括:
根据标准工程参数建立语义本体,以及发明原理分别与专利和历史解决方案之间的对 应关系,进而利用TRIZ矛盾矩阵将标准工程参数、发明原理、专利和历史解决方案四者相关 联,最后形成TRIZ矛盾矩阵法知识网络;
获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用TRIZ矛 盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专利及历 史解决方案,并将专利及历史解决方案分别与发明原理的相关度进行计算并排序;
将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息而建 立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始解决 方案并输出。
2.如权利要求1所述的一种创新方案匹配方法,其特征在于,根据标准工程参数建立语 义本体的具体过程为:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词库 中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射到标 准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
3.如权利要求1所述的一种创新方案匹配方法,其特征在于,建立发明原理与专利之间 的对应关系的具体过程包括:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一个向 量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量进行 降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间的对 应关系。
4.如权利要求1所述的一种创新方案匹配方法,其特征在于,建立发明原理与历史解决 方案之间的对应关系的具体过程包括:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的欲改 善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将 恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进而得 到与推荐的发明原理相对应的专利和历史解决方案。
5.一种创新方案匹配装置,其特征在于,包括:
TRIZ矛盾矩阵法知识网络构建模块,其用于根据标准工程参数建立语义本体,以及发 明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准工程参 数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网络;
创新方案匹配模块,其用于获取发明创意需求描述,并从发明创意需求描述中提取非 标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明 原理及与其相关的专利及历史解决方案,并将专利及历史解决方案分别与发明原理的相关 度进行计算并排序;
初始解决方案生成模块,其用于将得到的历史解决方案作为训练样本,根据训练样本 中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动输入 至语言模型,自动生成初始解决方案并输出。
6.如权利要求5所述的一种创新方案匹配装置,其特征在于,所述TRIZ矛盾矩阵法知识 网络构建模块还包括语义本体建立模块,其用于:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词库 中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射到标 准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
7.如权利要求6所述的一种创新方案匹配装置,其特征在于,所述TRIZ矛盾矩阵法知识 网络构建模块还包括发明原理与专利关系建立模块,其用于:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一个向 量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量进行 降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间的对 应关系。
8.如权利要求6所述的一种创新方案匹配装置,其特征在于,所述TRIZ矛盾矩阵法知识 网络构建模块还发明原理与历史解决方案关系建立模块,其用于:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的欲改 善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数和将 恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进而得 到与推荐的发明原理相对应的专利和历史解决方案。
9.一种创新方案匹配服务器,其特征在于,包括如权利要求5-8中任一所述的一种创新 方案匹配装置。
10.一种创新方案匹配系统,其特征在于,包括如权利要求9所述的一种创新方案匹配 服务器。
本发明涉及一种创新方案匹配方法、装置、服务器及系统。
大数据环境下,企业在进行创新活动时,通过数据分析和众智得到新的创意。如何 充分利用现有资源和技术解决创新中的难题,由创意得到可实施的创新方案,是当前创新 的难点。
目前较为成熟的方法是TRIZ矛盾解决原理。对应TRIZ中的技术矛盾和物理矛盾, 矛盾解决原理分为技术矛盾解决原理和物理矛盾解决原理。技术矛盾解决原理:TRIZ提出 描述技术矛盾的39个通用工程参数,如温度、速度、强度等,同时,为了解决技术矛盾,TRIZ 理论提出了40项发明原理,如分割、分离、不对称等。TRIZ中利用矛盾矩阵将描述技术矛盾 的39个工程参数与40条发明原理建立了对应关系,通过矛盾中的两个参数可以得到相应的 发明原理。物理矛盾解决原理:TRIZ提出采用分离原理解决物理矛盾的方法,包括空间分离 和时间分离、基于条件的分离、整体与部分的分离。另外,解决物理矛盾的分离原理与解决 技术矛盾的发明原理之间也存在关系,一条分离原理可以与多条发明原理存在对应关系。
TRIZ矛盾解决原理目前广泛应用到企业解决创新问题过程中,但从寻矛盾参数 到将对应的发明原理应用到实际问题中,均需要依赖专业研究人员的知识水平和经验,具 有一定局限性,实施效果因人而异。
为了解决现有技术的不足,本发明的第一目的是提供一种创新方案匹配方法。
本发明的一种创新方案匹配方法,包括:
根据标准工程参数建立语义本体,以及发明原理分别与专利和历史解决方案之间 的对应关系,进而利用TRIZ矛盾矩阵将标准工程参数、发明原理、专利和历史解决方案四者 相关联,最后形成TRIZ矛盾矩阵法知识网络;
获取发明创意需求描述,并从发明创意需求描述中提取非标准工程参数,利用 TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到发明原理及与其相关的专 利及历史解决方案,并将专利及历史解决方案分别与发明原理的相关度进行计算并排序;
将得到的历史解决方案作为训练样本,根据训练样本中标记的关键词及专利信息 而建立语言模型,最终将已标记的关键词及专利信息自动输入至语言模型,自动生成初始 解决方案并输出。
进一步的,根据标准工程参数建立语义本体的具体过程为:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词 库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射 到标准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
本发明通过建立标准工程参数词典,来构建语义本体,提高了后续从发明创意需 求描述中提取非标准工程参数的准确性和效率。
进一步的,建立发明原理与专利之间的对应关系的具体过程包括:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一 个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量 进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间 的对应关系,不需要依赖专业研究人员的知识水平和经验,为准确获取与发明创意需求描 述相匹配的初始方案奠定了基础。
进一步的,建立发明原理与历史解决方案之间的对应关系的具体过程包括:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的 欲改善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数 和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进 而得到与推荐的发明原理相对应的专利和历史解决方案。
利用TRIZ矛盾矩阵法知识网络,得到发明原理与专利之间的对应关系,不需要依 赖专业研究人员的知识水平和经验,为准确获取与发明创意需求描述相匹配的初始方案奠 定了基础。
本发明的第二目的是提供一种创新方案匹配装置。
本发明的一种创新方案匹配装置,包括:
TRIZ矛盾矩阵法知识网络构建模块,其用于根据标准工程参数建立语义本体,以 及发明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准工 程参数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网络;
创新方案匹配模块,其用于获取发明创意需求描述,并从发明创意需求描述中提 取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得到 发明原理及与其相关的专利及历史解决方案,并将专利及历史解决方案分别与发明原理的 相关度进行计算并排序;
初始解决方案生成模块,其用于将得到的历史解决方案作为训练样本,根据训练 样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自动 输入至语言模型,自动生成初始解决方案并输出。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括语义本体建立模块,其 用于:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词 库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射 到标准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括发明原理与专利关系建 立模块,其用于:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一 个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量 进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间 的对应关系。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还发明原理与历史解决方案关 系建立模块,其用于:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的 欲改善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数 和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进 而得到与推荐的发明原理相对应的专利和历史解决方案。
本发明的第三目的是提供一种创新方案匹配服务器。
本发明的一种创新方案匹配服务器,包括上述所述的一种创新方案匹配装置。
本发明的第四目的是提供一种创新方案匹配系统。
本发明的一种创新方案匹配系统,包括如所述的一种创新方案匹配服务器。
与现有技术相比,本发明的有益效果是:
本发明采用大数据处理技术手段在非标准工程参数、标准工程参数、发明原理、专 利和历史解决方案之间建立联系,形成知识网络,获得从创意直接得到相关发明原理、专利 和历史解决方案的效果;这样从寻矛盾参数到将对应的发明原理应用到实际问题中,不 需要依赖专业研究人员的知识水平和经验,采用机器学习技术手段,建立语言模型,能够自 动准确地获取初始解决方案。
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示 意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1是创新方案匹配方法流程图。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另 有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常 理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根 据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式 也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包 括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
本发明中的“标准工程参数”指的是:TRIZ的39标准工程参数:
例如:
(1)运动物体的重量是指在重力场中运动物体多受到;
(2)静止物体的重量是指在重力场中静止物体所受到;
(3)运动物体的长度是指运动物体的任意线性尺寸;
(4)静止物体的长度是指静止物体的任意线性尺寸。
“语义本体”:指的是将实际产品创新中工程参数的不同词汇表达映射到标准工程 参数。
“发明原理”:TRIZ发明创造40原理,比如:
(1)分割原理
1)火车车厢之间是单独的个体,可调整车厢的数量;
2)圆珠笔的笔心与笔套是两个可分的部分,笔心可以换;
3)电风扇的三片叶片是三个独立的个体,可拆卸;
4)田地里的浇水水管系统,每一段用一个接头连接;
5)自行车、摩托车等的链条是一环一环相接的,每环都是可以取下来的。
(2)分离原理
1)石油加工中,将一些油渣或其他有害物质提炼分离,已获得精度较高的汽油或 柴油;
2)子弹发出后,弹芯与弹壳分离;
3)电脑键盘与鼠标分开,为的是方便人们跟好的操作;
4)火箭在冲出大气层的过程中将已经燃完燃料的部分解体分离。
5)现在用在建筑中的隔音材料将噪音吸收或隔离,从而使噪音被分离出我们所处 的环境“专利”:是发明创造人或其权利受让人对特定的发明创造在一定期限内依法享有的 独占实施权,是知识产权的一种,例如:发明专利和实用新专利。
“历史解决方案”:针对某些已经体现出的,或者可以预期的问题、不足、缺陷、需 求,目前已经存在的所提出的一个解决整体问题的方案(建议书、计划表),同时能够确保加 以有效的执行。
本发明的创新方案匹配方法包括:
对创意进行矛盾智能识别——从创意需求描述中抽取改善和恶化的工程参数,将 抽取的工程参数对应到标准工程参数,智能匹配矛盾对,利用TRIZ矛盾矩阵确定发明原理;
发明原理到相关专利和历史方案的智能匹配——对现有发明专利和历史创新方 案按发明原理分类,通过确定的发明原理到与其对应的相关发明专利和历史创新方案, 与创意进行相关度计算,并根据优先级排序输出;
自动生成初始解决方案——根据已标记的关键词及创意需求描述本身,利用建立 好的语言模型,自动生成与创意匹配的创新初始方案。
采用本发明,创新方案的提出不再依赖于创新者的知识水平和经验,而是在相关 历史和专利等数据基础上科学系统地给出。
本发明通过以下技术方案来解决创意到创新方案的智能匹配问题,具体包括:
(1)TRIZ矛盾矩阵法知识网络构建:主要是对现有TRIZ矛盾数据和专利数据进行 融合。对标准工程参数进行语义本体建立,即将实际产品创新中工程参数的不同词汇表达 映射到标准工程参数上;建立发明原理与专利之间的对应关系,即对每一个专利标注其对 应的发明原理;整理利用本方法产生的历史解决方案和其采用的发明原理之间的对应关 系。最终形成工程参数-发明原理-专利/历史解决方案的知识网络,为后续从需求描述中提 取工程参数,确定发明原理,进而得到发明原理相关的专利和历史解决方案提供技术支持。
(2)创新方案匹配:描述发明创意需求;从发明创意需求的文本描述中自动提取非 标准工程参数,利用TRIZ矛盾矩阵法知识网络,确定标准工程参数矛盾对,利用TRIZ现有的 矛盾矩阵工具,确定发明原理;利用TRIZ矛盾矩阵法知识网络,得到与发明原理相关的发明 专利及历史解决方案,并计算相关度进行排序输出,供用户参考、标记。
(3)初始解决方案生成:通过现有大量权威解决方案数据训练,建立一种语言模 型,根据用户标记出来的关键词和创意需求描述本身,自动生成初始解决方案并输出。
具体的,TRIZ矛盾矩阵法知识网络构建模块包括以下实现步骤:
1.对TRIZ中已总结出的39个标准工程参数进行语义本体建立——提取出每个标 准工程参数在实际产品创新当中的不同词汇表达,通过计算语义相似度对标准工程参数进 行补充描述,将所有可能的表达词汇映射到每个标准工程参数上,形成标准工程参数词典。 具体步骤如下:
(1)建立改善和恶化参数提取词汇库。TRIZ中的矛盾矩阵工具是由一个欲改善参 数和一个将恶化参数来确定发明原理,参数改善和恶化的情况通常有一些特定的词汇表 示,如“可以”、“改善”、“提高”等关键词前后的词汇可能为改善参数,而“破坏”、“导致”、“丧 失”等关键词前后的词汇可能为恶化参数。通过对一定数量有代表性的专利文本进行人工 分析整理,得到初始的改善参数提取词汇集合Wi={"可以",改善","提高",……}、恶化参 数相关词汇集合Wd={"破坏","导致","丧失",……},由此,建立改善和恶化参数提取词汇 库W。
(2)提取非标准工程参数。对于已经进行分词、去停用词等预处理后的专利文本集 合D,当D中存在词汇ti∈W时,ti前后名词即可能为工程参数,将其加入到非标准工程参数词 汇库P中。
(3)利用改善和恶化参数提取词汇库W和非标准工程参数词库P互相更新改进。从 专利文本集合D中提取词汇tj(tj∈P)的前后动词,判断其是否在Wi和Wd中,若不在,判断其 为改善参数提取词还是恶化参数提取词,并加入到Wi或Wd中。继续执行步骤(2),利用更新后 的词汇库W,从D中提取新的工程参数加入到词汇库P中。如此循环,不断更新改进W和P。
(4)将非标准工程参数pi映射到标准工程参数建立标准工程参数词典PD。将上一步提取出的非标准工程参数词汇库P中的词与标准工程参数词汇库中的词,利用HowNet或同义词词林进行语义相似度计算,将多个pi映射到一个对标准工程参数进行补充。
2.利用文本挖掘技术对专利按发明原理进行自动分类,建立专利与发明原理之间 的对应关系,即对每一个专利标注其对应的发明原理。具体步骤如下:
(1)对专利数据进行预处理。从TRIZ中的40个发明原理的权威中文定义、描述和参 考专利案例中提取出其中大部分的实意词组成发明原理专有词汇库IP,辅助ICTCLAS等汉 语分词系统进行中文分词。停用词库可选择中科院统计的中文停用词库,同时,考虑专利文 献特殊性,可建立专利数据专有停用词库PS,除了一些语气词和形容词等非实意词,也应包 含“该发明、该专利、实用、新型、公开、领域、权利、要求、特征、上述、涉及”等对提取发明原 理信息无关的实意词。
(2)将处理后的专利文本用向量空间模型VSM表示。每个专利文本都被表示为一个向量,向量由一组与给定专利文本有关的词组成,即每个专利文本可以表示为d=(t1,t2,……tn),ti为特征项,即组成专利文本的字、词或短语,对含有n个特征项的文本而言,通常会给每个特征项赋予一定的权重表示其重要程度,则d=(w1,w2,……wn),wi为ti的权重,被称为专利文本d的向量表示或向量空间模型。通过TF-IDF计算词语权重,自动提取关键词。TF-IDF的计算公式为:TF-IDF=词频(TF)×逆文档频率(IDF),其中,TF词频(TermFrequency)指的是某一个给定的词语在该文件中出现的次数,计算公式为:词频(TF)=某个词在文章中出现的次数/文章的总词数;IDF逆向文件频率(Inverse Document Frequency)是一个语句普遍重要性的度量,计算公式为:逆向文档频率(IDF)=log(专利文档的总数/(包含该词的文档数+1))。TF-IDF与一个词在文档中的出现次数成正比,与该词在整个语言中的出现次数成反比。所以,提取关键词就是计算出文档的每个词的TF-IDF值,然后按降序排列,取最前面的几个词。之后,采用信息增益等特征选择算法对提取的特征进行降维处理,信息增益用于文本数据的特征选择时衡量的是某个词的出现与否对判断一个文本是否属于某个类所提供的信息量,定义如下:其中,P(ci)表示类别ci出现的概率;P(t)表示词t出现的概率;表示词t不出现的概率;P(ci|t)表示词t出现的情况下文本属于ci类的概率;表示词t不出现的情况下文本属于类的概率。
(3)利用多标签分类方法将专利按发明原理进行分类。每个专利通常采用多个发 明原理,即一个专利对应多个发明原理。先使用多标签的问题转换方法,如PPT(Pruned Problem Transformation)等对数据集先进行转换,PPT方法相对优于其他多标签分类算 法,其将每个对象所属的标签集合作为一个新的标签,分类一个新的样本,PPT方法的单标 签分类器输出一个标签集合。之后,用常用的监督学习算法,如支持向量机SVM对数据集进 行训练学习,将专利按发明原理进行分类。
3.整理利用本方法产生的历史解决方案与其最终采用的发明原理之间的对应关 系。
具体的,创新方案匹配模块包括以下实现步骤:
1.描述发明创意需求。发明创意需求分为创意名称、创意背景、期望结果、潜在困 难四部分内容,便于提取工程参数。创新者根据要求输入相应的创意描述。
2.利用TRIZ矛盾矩阵法知识网络中改善和恶化参数提取词汇库,从步骤1中输入 的创意描述中分别提取出欲改善和将恶化的非标准工程参数,一般情况下,期望结果部分 内容可提取欲改善参数,潜在困难部分可提取将恶化参数。
3.利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参 数和将恶化的非标准工程参数映射为标准工程参数。若存在多个欲改善或将恶化的工程参 数,无法将其一一对应,则将两类工程参数分别进行组合,经过人工判定筛选确定最终矛盾 对。
4.利用TRIZ矛盾矩阵,得到推荐的发明原理。
5.利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系, 得到与推荐的发明原理相对应的专利和历史解决方案,计算得到的专利或历史解决方案与 创意需求描述的相关度,按优先级排序显示。在向量空间模型中,两个文本di和dj之间的内 容相关度Sim(di,dj)常用向量之间夹角的余弦值表示,计算公式为:
其中,wik、wjk分别表示文本di和dj第k个特征项的权重,1<=k<=n。
具体的,初始解决方案生成模块包括以下实现步骤:
1.将爬取到的大量创新方案数据作为训练语言模型的数据集(分为训练集和测试 集),对语句进行分词,并对得到的词语进行预处理后,语句e可表示为e=(
2.按优先级查看相关专利和历史解决方案,标记出其中与创意问题有关的关键词 或句子。
3.标记的信息自动输入到训练好的语言模型,生成创初始解决方案并输出。
如图1所示,本发明创意到创新方案的智能匹配方法流程如下:
步骤101,构建TRIZ矛盾矩阵法知识网络:对现有TRIZ矛盾数据和专利数据进行融 合。对标准工程参数进行语义本体建立1011,建立发明原理与专利之间的对应关系1012,建 立发明原理与和历史解决方案之间的对应关系1013,建立TRIZ矛盾矩阵法知识网络。
具体地,步骤101还包括以下步骤:
分步骤1011:提取出每个工程参数在实际产品创新当中的一般词汇表达,通过计 算语义相似度对TRIZ中39个标准工程参数进行补充描述,将所有可能的表达词汇映射到每 个标准工程参数上,形成标准工程参数词典,建立标准工程参数语义本体。
分步骤1012:对专利数据进行预处理,将处理后的专利文本用向量空间模型VSM表 示,利用多标签分类方法将专利按发明原理进行分类,建立专利与发明原理之间的对应关 系,即对每一个专利标注其对应的发明原理。
分步骤1013:整理利用本方法产生的历史解决方案与其最终采用的发明原理之间 的对应关系。
步骤102,创新方案匹配:从发明创意需求描述中提取非标准工程参数,利用TRIZ 矛盾矩阵法知识网络,确定标准工程参数矛盾对,利用矛盾矩阵,确定发明原理,利用TRIZ 矛盾矩阵法知识网络,得到与发明原理相关的发明专利及历史解决方案,并计算其与创意 需求描述的相关度排序显示。
具体地,步骤102还包括以下步骤:
分步骤1021:描述发明创意需求。发明创意需求分为创意名称、创意背景、期望结 果、潜在困难四部分内容,便于提取工程参数。创新者根据要求输入相应的创意描述。
分步骤1022:利用TRIZ矛盾矩阵法知识网络中改善和恶化参数提取词汇库,从输 入的创意描述中分别提取出欲改善和将恶化的非标准工程参数,一般情况下,期望结果部 分内容可提取欲改善参数,潜在困难部分可提取将恶化参数。
分步骤1023:利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将分步骤2中得 到非标准工程参数的映射为标准工程参数。若存在多个欲改善或将恶化的标准工程参数, 无法将其一一对应,则将两类工程参数分别进行组合,可经过人工判定筛选确定最终矛盾 对。
分步骤1024:通过TRIZ矛盾矩阵,得到推荐的发明原理集合。
分步骤1025:利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的 对应关系,得到与推荐的发明原理相对应的专利和历史解决方案,通过计算两个文本向量 之间夹角的余弦值,得到的专利或历史解决方案与创意需求描述的相关度,并按优先级排 序显示。
步骤103,初始解决方案生成:通过大量权威解决方案数据训练,建立一种语言模 型,根据用户标记出来的关键词以及专利信息自动生成初始解决方案并输出。
具体地,步骤103还包括以下步骤:
分步骤1031:将爬取到的大量创新方案数据作为训练语言模型的数据集(分为训 练集和测试集),通过对训练集中的创新方案进行逐一学习,得到一组能覆盖训练集的语言 模型,然后用测试集进行测试并调整模型信息,进而得到一个自动生成创新方案的语言模 型。
分步骤1032:按优先级查看相关专利和历史解决方案,标记出与发明创意需求相 关的信息。
分步骤1033:标记的信息自动输入到训练好的语言模型,生成初始创新方案并输 出。
本发明的一种创新方案匹配装置,包括:
(1)TRIZ矛盾矩阵法知识网络构建模块,其用于根据标准工程参数建立语义本体, 以及发明原理分别与专利和历史解决方案之间的对应关系,进而利用TRIZ矛盾矩阵将标准 工程参数、发明原理、专利和历史解决方案四者相关联,最后形成TRIZ矛盾矩阵法知识网 络;
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括语义本体建立模块,其 用于:
构建改善和恶化参数相关词库;
对获取的专利信息进行预处理,当专利信息中词汇出现在改善和恶化参数相关词 库中,提取该词汇的前后名词并存储至非标准工程参数词库中;
利用改善和恶化参数相关词汇库和非标准工程参数词库互相更新改进;
利用HowNet或同义词词林进行语义相似度计算,将非标准工程参数库的参数映射 到标准工程参数库中,进而建立标准工程参数词典,最终得到语义本体。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还包括发明原理与专利关系建 立模块,其用于:
对专利数据进行预处理,生成发明原理词库;
将处理后的专利文本用空间向量模型VSM表示,其中,每个专利文本都被表示为一 个向量,向量由一组与给定专利文本有关的词组成,通过TF-IDF自动提取标记词,再对向量 进行降维处理;
利用多标签分类方法将专利按发明原理进行分类,进而得到发明原理与专利之间 的对应关系。
进一步的,所述TRIZ矛盾矩阵法知识网络构建模块还发明原理与历史解决方案关 系建立模块,其用于:
利用TRIZ矛盾矩阵法知识网络中改善和恶化参数库,提取发明创意需求描述中的 欲改善和将恶化的非标准工程参数;
利用TRIZ矛盾矩阵法知识网络中标准工程参数词典,将提取的欲改善的工程参数 和将恶化的非标准工程参数映射为标准工程参数;
通过TRIZ矛盾矩阵,得到推荐的发明原理集合;
利用TRIZ矛盾矩阵法知识网络中发明原理与专利和历史解决方案的对应关系,进 而得到与推荐的发明原理相对应的专利和历史解决方案。
(2)创新方案匹配模块,其用于获取发明创意需求描述,并从发明创意需求描述中 提取非标准工程参数,利用TRIZ矛盾矩阵法知识网络来确定标准工程参数矛盾对,进而得 到发明原理及与其相关的专利及历史解决方案,并将专利及历史解决方案分别与发明原理 的相关度进行计算并排序;
(3)初始解决方案生成模块,其用于将得到的历史解决方案作为训练样本,根据训 练样本中标记的关键词及专利信息而建立语言模型,最终将已标记的关键词及专利信息自 动输入至语言模型,自动生成初始解决方案并输出。
本发明采用大数据处理技术手段在非标准工程参数、标准工程参数、发明原理、专 利和历史解决方案之间建立联系,形成知识网络,获得从创意直接得到相关发明原理、专利 和历史解决方案的效果;这样从寻矛盾参数到将对应的发明原理应用到实际问题中,不 需要依赖专业研究人员的知识水平和经验,采用机器学习技术手段,建立语言模型,能够自 动准确地获取初始解决方案。
本发明还提供一种创新方案匹配服务器,该服务器包括创新方案匹配装置。
本发明的创新方案匹配服务器,采用大数据处理技术手段在非标准工程参数、标 准工程参数、发明原理、专利和历史解决方案之间建立联系,形成知识网络,获得从创意直 接得到相关发明原理、专利和历史解决方案的效果;这样从寻矛盾参数到将对应的发明 原理应用到实际问题中,不需要依赖专业研究人员的知识水平和经验,采用机器学习技术 手段,建立语言模型,能够自动准确地获取初始解决方案。
本发明还提供一种创新方案匹配系统,该系统包括上述创新方案匹配服务器。
本发明的创新方案匹配系统,采用大数据处理技术手段在非标准工程参数、标准 工程参数、发明原理、专利和历史解决方案之间建立联系,形成知识网络,获得从创意直接 得到相关发明原理、专利和历史解决方案的效果;这样从寻矛盾参数到将对应的发明原 理应用到实际问题中,不需要依赖专业研究人员的知识水平和经验,采用机器学习技术手 段,建立语言模型,能够自动准确地获取初始解决方案。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序 产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形 式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储 介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流 程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序 指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产 生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实 现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一 个方框或多个方框中指定的功能的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以 通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质 中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁 碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范 围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不 需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
本文发布于:2023-03-13 07:54:00,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/69534.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |