G06F40/258 G06F40/194 G06F40/186 G06F40/289 G06F16/332 G06Q50/18
1.一种专利申请文本的生成方法,其特征在于,所述专利申请文本中权利要求书的生成步骤,包括:
对技术交底文本中的标题,从技术交底文本中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
按技术交底文本中标题的层级关系,确定所述标题对应的第一权利要求文本之间的引用关系;
根据所述第一权利要求文本和所述引用关系生成所述权利要求书。
2.如权利要求1所述的方法,其特征在于,还包括:
从所述技术交底文本中,确定标题的至少一段具有预设特征的描述文本,将所述描述文本输入预先训练的文本生成模型,得到第二权利要求文本;
确定所述第二权利要求文本,引用所述描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将所述第二权利要求文本添加到所述权利要求书中的对应位置。
3.如权利要求2所述的方法,其特征在于,还包括:
利用选定的分词模型将第一权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第一权利要求文本中的该词替换为所述知识库中与该词匹配的上一层级的词,或为该第一权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词;和/或,
利用选定的分词模型将第二权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第二权利要求文本中的该词替换为所述知识库中与该词匹配的上一层级的词,或为该第二权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词。
4.如权利要求2所述的方法,其特征在于,从所述技术交底文本中,确定标题的至少一段具有预设特征的描述文本,具体包括:
将所述技术交底文本中标题的每段描述文本在预设数据库中进行检索,确定所述描述文本与所述数据库的相似度;
根据所述相似度确定至少一段具有预设特征的描述文本。
5.如权利要求1所述的方法,其特征在于,所述将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本,具体包括:
根据技术交底文本的类型确定匹配的权利要求生成模板;
将所述标题及下一层级标题,按照所述模板组合生成与所述标题对应的一项第一权利要求文本。
6.如权利要求1所述的方法,其特征在于,所述文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述文本和与所述该描述文本对应的权利要求文本。
7.如权利要求1-6任一所述的方法,其特征在于,从技术交底文本中抽取所述标题及所述标题的下一层级标题,具体包括:
根据所述标题的标签确定所述标签的下一层级标签,从技术交底文本中抽取所述标题,抽取所述下一层级标签所属标题作为所述标题的下一层级标题;或,
从树状结构的技术交底文本中抽取所述标题及所述标题的下一层级标题。
8.一种专利申请文本的生成装置,其特征在于,所述装置用于生成专利申请文本中的权利要求书,包括:
第一生成模块,用于对技术交底文本中的标题,从技术交底文本中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
确定模块,用于按技术交底文本中标题的层级关系,确定所述标题对应的所述第一生成模块生成的第一权利要求文本之间的引用关系;
第二生成模块,用于根据所述第一生成模块生成的第一权利要求文本和所述确定模块确定的引用关系生成所述权利要求书。
9.一种服务器,其特征在于,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现权利要求1-7所述的专利申请文本的生成方法。
10.一种计算机可读存储介质,其上存储有计算机指令,其特征在于,当该指令被处理器执行时实现权利要求1-7所述的专利申请文本的生成方法。
本发明涉及信息智能处理技术领域,特别涉及一种专利申请文本的生成方法和装置。
随着技术创新的飞速发展,专利申请量也在逐步增加,但目前专利申请文本主要依赖于申请人或专利代理师的人工撰写,专利代理师的数量与市场需求之间的差距较大,导致专利代理师的工作量较大,而专利申请文本的撰写,比较耗时耗精力的便是权利要求的撰写。
同时,专利申请人自己撰写专利申请文本时,往往不能很好的掌握权利要求的撰写思路,不能很好的完成权利要求的撰写。所以迫切需要能够基于技术交底内容智能生成专利申请文本的权利要求,来提高专利申请文本的撰写效率和质量。
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种专利申请文本的生成方法和装置。
第一方面,本发明实施例提供一种专利申请文本的生成方法,所述专利申请文本中权利要求书的生成步骤,包括:
对技术交底文本中的标题,从技术交底文本中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
按技术交底文本中标题的层级关系,确定所述标题对应的第一权利要求文本之间的引用关系;
根据所述第一权利要求文本和所述引用关系生成所述权利要求书。
在一些可选的实施例中,还包括:
从所述技术交底文本中,确定标题的至少一段具有预设特征的描述文本,将所述描述文本输入预先训练的文本生成模型,得到第二权利要求文本;
确定所述第二权利要求文本,引用所述描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将所述第二权利要求文本添加到所述权利要求书中的对应位置。
在一些可选的实施例中,还包括:
利用选定的分词模型将第一权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第一权利要求文本中的该词替换为所述知识库中与该词匹配的上一层级的词,或为该第一权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词;和/或,
利用选定的分词模型将第二权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第二权利要求文本中的该词替换为所述知识库中与该词匹配的上一层级的词,或为该第二权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词。
在一些可选的实施例中,从所述技术交底文本中,确定标题的至少一段具有预设特征的描述文本,具体包括:
将所述技术交底文本中标题的每段描述文本在预设数据库中进行检索,确定所述描述文本与所述数据库的相似度;
根据所述相似度确定至少一段具有预设特征的描述文本。
在一些可选的实施例中,所述将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本,具体包括:
根据技术交底文本的类型确定匹配的权利要求生成模板;
将所述标题及下一层级标题,按照所述模板组合生成与所述标题对应的一项第一权利要求文本。
在一些可选的实施例中,所述文本生成模型,是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,所述数据对包括描述文本和与所述该描述文本对应的权利要求文本。
在一些可选的实施例中,从技术交底文本中抽取所述标题及所述标题的下一层级标题,具体包括:
根据所述标题的标签确定所述标签的下一层级标签,从技术交底文本中抽取所述标题,抽取所述下一层级标签所属标题作为所述标题的下一层级标题;或,
从树状结构的技术交底文本中抽取所述标题及所述标题的下一层级标题。
第二方面,本发明实施例提供一种专利申请文本的生成装置,所述装置用于生成专利申请文本中的权利要求书,包括:
第一生成模块,用于对技术交底文本中的标题,从技术交底文本中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
确定模块,用于按技术交底文本中标题的层级关系,确定所述标题对应的所述第一生成模块生成的第一权利要求文本之间的引用关系;
第二生成模块,用于根据所述第一生成模块生成的第一权利要求文本和所述确定模块确定的引用关系生成所述权利要求书。
第三方面,本发明实施例提供一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述专利申请文本的生成方法。
第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机指令,当该指令被处理器执行时实现上述专利申请文本的生成方法。
本发明实施例提供的上述技术方案的有益效果至少包括:
本发明实施例提供的专利申请文本的生成方法,专利申请文本中权利要求书的生成步骤,包括:针对技术交底文本中的每个标题,确定该标题有下一层级的标题时,从技术交底文本中抽取该标题及该标题的下一层级标题,将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本;按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系;根据第一权利要求文本和引用关系生成所述权利要求书。可以根据获取到的技术交底文本自动生成专利申请文本的权利要求书,节省了人力,提高了专利申请文本的撰写效率,同时避免了权利要求书中的形式问题。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明实施例一中专利申请文本中权利要求书的生成方法流程图;
图2为本发明实施例二中权利要求书的生成方法的具体实现流程图;
图3为本发明实施例三中说明书实施例文本生成方法的具体实现流程图;
图4为本发明实施例中专利申请文本的生成装置的结构示意图。
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
为了解决现有技术中存在的人工撰写专利申请文本的权利要求书费时费力的问题,本发明实施例提供一种专利申请文本的生成方法和装置,能够自动根据技术交底文本生成专利申请文本的权利要求书,节省了人力,同时提高了专利申请文本的撰写效率。
实施例一
本发明实施例一提供一种专利申请文本的生成方法,参照图1所示,专利申请文本中权利要求书的生成,包括如下步骤:
步骤S11:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题。
具体的,针对技术交底文本中的每个标题,确定是否有下一层级的标题,若是,从技术交底文本中抽取标题及标题的下一层级标题。
获取到的技术交底文本包含多层级标题,其最高层级的标题是发明名称或实用新型名称;可选的,若获取到的技术交底文本的最高层级的标题不是发明名称或实用新型名称,可以先对技术交底文本进行预处理:抽取所有最高层级的标题,确定能够概括抽取的标题的名称,将概括出的名称作为最高层级添加到技术交底文本中。
具体的,确定能够概括抽取的标题的名称,可以是抽取标题中的关键词,将抽取到的关键词按预设模板组合成名称。
上述技术交底文本的格式可以是非结构化的,每个标题带有标签,用于标明标题间的层级关系,故可以根据标题的标签确定标签的下一层级标签,从技术交底文本中抽取该标题,抽取下一层级标签所属标题作为该标题的下一层级标题。可选的,上述技术交底文本的格式也可以是树形结构的,从树状结构的技术交底文本中抽取标题及该标题的下一层级标题。
步骤S12:将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。
在一个实施例中,可以包括,根据技术交底文本的类型确定匹配的权利要求生成模板;将标题及下一层级标题,按照模板组合生成与标题对应的一项第一权利要求文本。
技术交底文本的类型可以是发明或实用新型,发明又可以分为方法类和产品类,不同的类型对应的权利要求文本的生成模板也不同。以发明中的方法类为例,权利要求生成模板可以是“1、一种……方法,其特征在于,包括下述步骤:……”,用于根据最高层级的标题和下一层级的标题,生成最高层级的标题对应的第一权利要求文本(最终生成权利要求书中的独立权利要求文本)。也可以是“x、如权利要求x所述的方法,其特征在于,所述……,具体包括:……”(模板中的“……”是生成权利要求文本时需要补充的内容,“x”是生成权利要求文本时需要替换的内容),用于生成非最高层级的标题对应的第一权利要求文本(最终生成权利要求书中的从属权利要求文本),以非最高层级的标题为标题A为例,模板中的第一个省略号处可以补充为标题A对应的文本,第二个省略号处可以补充为标题A的下一层级标题对应的文本;将模板中的第二个x替换为标题A的上一层级标题对应的权利要求文本的序号;第一个x为生成的权利要求文本的序号,在步骤S14中生成权利要求书时将x进行替换。
步骤S13:按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系。
例如标题A的下一层级的标题是标题B、标题C和标题D,标题B的下一层级的标题是标题E和标题F;根据标题A、标题B、标题C和标题D组合生成的第一权利要求文本为标题A对应的第一权利要求文本A;根据标题B、标题E和标题F组合生成的第一权利要求文本为标题B对应的第一权利要求文本B;根据标题A和标题B的层级关系确定第一权利要求文本A和第一权利要求文本B之间的引用关系,因为标题A是标题B的上一层级的标题,所以确定第一权利要求文本A被第一权利要求文本B引用。
步骤S14:根据第一权利要求文本和引用关系生成权利要求书。
根据引用关系确定第一权利要求文本的序号,被引用的第一权利要求文本排在引用他的第一权利要求的前面,将确定的第一权利要求文本的序号替换对应的第一权利要求文本中的第一个x,将第一权利要求文本排列生成权利要求书。
本发明实施例一提供的专利申请文本的生成方法,专利申请文本中权利要求书的生成步骤,包括:针对技术交底文本中的每个标题,确定该标题有下一层级的标题时,从技术交底文本中抽取该标题及该标题的下一层级标题,将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本;按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系;根据第一权利要求文本和引用关系生成所述权利要求书。可以根据获取到的技术交底文本自动生成专利申请文本的权利要求书,节省了人力,提高了专利申请文本的撰写效率,同时避免了权利要求书中的形式问题。
在一个实施例中,从技术交底文本中,确定标题的至少一段具有预设特征的描述文本,将描述文本输入预先训练的文本生成模型,得到第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。
技术交底文本包括多层级的标题外,至少一个标题还可以具有至少一段描述文本,用于详细描述该标题。故,以标题A为例,生成一个标题A对应的第一专利申请文本A后,若确定标题A的至少一段描述文本具有预设特征,则针对每段具有预设特征的描述文本,以描述文本B为例,利用描述文本和预先训练的文本生成模型,生成第二权利要求文本B。可选的,也可以在生成所有的第一权利要求文本后,再生成第二权利要求文本。具体第二权利要求文本的生成方法,后续实施例二中详细介绍。
上述确定的具有预设特征的描述文本,可以是技术交底文本中预先标记好的描述文本。也可以是将技术交底文本中标题的每段描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;根据相似度确定至少一段具有预设特征的描述文本,例如,将相似度低于设定阈值的描述文本确定为具有预设特征的描述文本。
具体的,上述预设特征可以是具有一定的创造性,申请人在输入技术交底的相关内容时将自己认为的具有创造性的描述文本进行勾选,在根据申请人输入的技术交底内容生成技术交底文本的过程中,根据申请人的选择将描述文本进行标记。判断描述文本是否具有预设特征可以直接根据描述文本有无对应的标注来判断。
可选的,获取到的技术交底文本也可以是没有上述标注,判断描述文本是否具有预设特征,可以包括,将描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度;若确定的相似度小于预先设定的阈值,则确定描述文本具有预设特征。
可选的,也可以是先根据是否有标注确定描述文本是否具有预设特征,对于没有标注的描述文本,再根据相似度检索确定是否具有预设特征。
描述文本是否具有预设特征的判断方法,本实施例不做具体限定。
在一个实施例中,还可以包括,利用选定的分词模型将第一权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第一权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词,或为该第一权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词。该步骤可以在生成每一个第一权利要求文本后执行,也可以在生成所有的第一权利要求文本后再执行,也可以在生成所有的第一权利要求文本和第二权利要求文本后执行。和/或,
利用选定的分词模型将第二权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第二权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词,或为该第二权利要求文本中的该词标注知识库中与该词匹配的上一层级的词。该步骤可以在生成每一个第二权利要求文本后都执行,也可以在生成所有的第二权利要求文本后再执行。
上述替换使得生成的第一或第二权利要求文本的保护范围变大;若没有替换,只是在对应的词的预设位置进行标注,可以方便专利申请文本的撰写人员根据标注的词来确定选用哪个词更为合理,省去了撰写人员自己查询的麻烦,或避免了撰写人员忘记上位撰写(将对应的词替换为层级更高的词)以争取更大的保护范围。
实施例二
本发明实施例二提供一种专利申请文本的权利要求书生成方法的具体实现,其流程如图2所示,包括如下步骤:
步骤S201:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题。
步骤S202:将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本。
步骤S203:按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系。
针对技术交底文本中的每个标题的每段描述文本,执行步骤S204-步骤S210。
步骤S204:判断描述文本是否标注有具有预设特征。
具体的,上述技术交底文本可以是预先根据用户的选择对描述文本进行了标注,例如用户判断哪段描述文本具有创造性,便会在描述文本对应的是否具有创造性处勾选,故根据用户输入的信息生成技术交底文本的过程中,可以根据用户的选择对描述文本进行是否具有创造性的标注。判断描述文本是否具有预设特征可以直接根据描述文本有无对应的标注来判断。
若判断描述文本标注有具有预设特征,执行步骤S205;否则,执行步骤S206。
步骤S205:将描述文本在预设数据库中进行检索,得到数据库中与描述文本的相似度满足预设条件的相似文档。
步骤S205后执行步骤S209。
步骤S206:将描述文本在预设数据库中进行检索,确定描述文本与数据库的相似度。
具体的,可以将描述文本与数据库中的文档相似度最高值确定为描述文本与数据库的相似度。
步骤S207:判断确定的相似度是否小于预设的阈值。
若是,则确定描述文本具有预设特征,执行步骤S208;若否,确定描述文本不具有预设特征。
步骤S208:得到数据库中与描述文本的相似度满足预设条件的相似文档。
步骤S209:将描述文本输入预先训练的文本生成模型,得到第二权利要求文本。
在一个实施例中,上述文本生成模型,可以是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述文本和与该描述文本对应的权利要求文本。
步骤S210:确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,得到第二权利要求文本与第一权利要求文本之间的引用关系。
步骤S211:根据第一权利要求文本、第二权利要求文本、相似文档和引用关系,生成权利要求书。
具体的,上述引用关系包括步骤S203中确定的第一权利要求文本之间的引用关系,和步骤S210中确定的第二权利要求文本与第一权利要求文本之间的引用关系。
下述为了表述方便,将第二权利要求文本与第一权利要求文本合称为权利要求文本。
可以是以标记的形式根据权利要求文本在权利要求书中的位置,将权利要求文本对应的相似文档添加到权利要求书中。
步骤S212:利用选定的分词模型将权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该权利要求文本中的该词替换为知识库中与该词匹配的上一层级的词。
可选的,也可以不是将权利要求文本中的词进行替换,而是为权利要求文本中的词标注知识库中与该词匹配的上一层级的词。标注的词供用户参考是否需要修改。可选的,也可以是不只标注与选定的词匹配的上一层级的词,可以同时标注知识库中与该词匹配的高层级的多个层级的词。
上述流程中的步骤没有严格的顺序关系,上述步骤顺序仅是一种示意,例如,可以生成标题对应的一项第一权利要求文本后,生成标题对应的第二权利要求文本;还可以每生成一项第一或第二权利要求文本后,就将权利要求文本中的词进行知识库匹配后的替换。
实施例三
本发明实施例三提供一种专利申请文本的说明书实施例文本生成方法的具体实现,其流程如图3所示,包括如下步骤:
步骤S31:按预设规则将技术数据分解成至少一个描述单元。
具体的,上述技术数据可以是根据获取到的技术交底信息生成的技术交底文本,生成的技术交底文本包括多层级的标题和至少一个标题的至少一段描述文本。按预设规则将技术交底文本分解成至少一个描述单元,可以包括:将从技术交底文本中分解出的每个标题确定为一个描述单元;针对技术交底文本中标题的每段描述文本,按照预设的分隔符分解成至少一个描述单元。
具体的,技术交底文本是根据用户输入的技术交底信息生成的,例如可以预先约定用户在输入描述文本时,每输入完一个完整的意思表达后,按“回车键”进行分段撰写,故生成的技术交底文本中可以包含回车键标识,以回车键标识为分隔符将一段描述文本分解成至少一个描述单元。
可选的,也可以不直接从技术交底文本中分解描述单元,而是先根据技术交底文本自动生成权利要求书,从权利要求书中的每项权利要求文本中分解描述单元。可以是,以分号为分隔符,将权利要求文本的特征部分或附加技术特征部分分解成至少一个描述文本;也可以是,将每项权利要求文本的特征部分或附加技术特征部分整体分解为一个描述文本。
根据技术交底文本自动生成权利要求书,在一个实施例中,可以包括:对技术交底文本中的标题,从技术交底文本中抽取标题及标题的下一层级标题,将标题及下一层级标题组合生成与标题对应的一项第一权利要求文本;按技术交底文本中标题的层级关系,确定标题对应的第一权利要求文本之间的引用关系;根据第一权利要求文本和引用关系生成权利要求书;从技术交底文本中,确定标题的至少一段具有预设特征的描述文本,利用描述文本和预先训练的文本生成模型,生成第二权利要求文本;确定第二权利要求文本,引用描述文本所属的标题的上一层级标题对应的第一权利要求文本,并将第二权利要求文本添加到权利要求书中的对应位置。
根据技术交底文本自动生成权利要求书的具体实现流程后续实施例中详细介绍。
上述描述单元可以为一段描述文本,也可以是至少一张图片,也可以是描述文本和描述图片的组合。
步骤S32:将各描述单元输入预先训练的文本生成模型,得到描述单元对应的实施例文本段。
在一个实施例中,文本生成模型,可以是利用获取到的多个数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,数据对包括描述单元和与该描述单元对应的实施例文本段。
在一个实施例中,数据对中的描述单元为描述文本或至少一张描述图片,或是描述文本和描述图片的组合。其中,描述文本可以是技术交底中的技术描述文本(获取的申请人单从技术角度撰写的描述文本);也可以是将技术描述文本转换成符合专利审查指南要求的权利要求文本;也可以是将技术描述文本输入第二文本生成模型得到的权利要求文本。第二文本生成模型是利用获取到的多个第二数据对,对指针生成网络模型和/或序列到序列Seq2Seq模型训练得到的,第二数据对包括描述文本和与该描述文本对应的权利要求文本。
将一个描述单元输入预先训练的文本生成模型,得到该描述单元对应的实施例文本段。
步骤S33:将实施例文本段组合生成实施例文本。
在一个实施例中,根据技术数据的类型确定匹配的实施例文本生成模板;根据技术数据中描述单元的层级结构,确定描述单元对应的实施例文本段的层级结构;按照生成模板和实施例文本段的层级结构,将实施例文本段组合生成实施例文本。
可选的,将实施例文本段组合生成实施例文本,还可以包括,将实施例文本段对应的描述单元以预设形式与实施例文本段一起添加进实施例文本,可以使得专利申请文本的撰写人员在查阅或者修改自动生成的实施例文本时,清晰的了解到每段实施例文本段是根据哪个描述单元生成的。
本发明实施例三提供的专利申请文本的自动生成方法,专利申请文本中说明书中实施例文本的自动生成步骤,包括:按预设规则将技术数据分解成至少一个描述单元;将各描述单元输入预先训练的文本生成模型,得到描述单元对应的实施例文本段;将实施例文本段组合生成实施例文本。可以根据获取到的技术数据自动生成专利申请文本的说明书实施例文本,节省了人力,提高了专利申请文本的撰写效率,同时避免了说明书实施例文本中的形式问题。
在一个实施例中,上述方法还可以包括,将描述单元在预设数据库中进行检索,得到数据库中与描述单元的相似度满足预设条件的相似文档;根据描述单元对应的实施例文本段在实施例文本中的位置,使用标注的方式将相似文档添加进实施例文本中。
可以使得专利申请文本的撰写人员在查阅或者修改自动生成的实施例文本时,参照每段实施例文本段对应的相似文档,将实施例文本段进一步补充完善,或修改实施例文本段及对应的权利要求文本,使得申请保护的权利要求文本与现有技术不同,具有创造性。
基于本发明的发明构思,本发明实施例还提供一种专利申请文本的生成装置,所述装置用于生成专利申请文本中的权利要求书,其结构如图4所示,包括:
第一生成模块41,用于对技术交底文本中的标题,从技术交底文本中抽取所述标题及所述标题的下一层级标题,将所述标题及下一层级标题组合生成与所述标题对应的一项第一权利要求文本;
确定模块42,用于按技术交底文本中标题的层级关系,确定所述标题对应的第一生成模块41生成的第一权利要求文本之间的引用关系;
第二生成模块43,用于根据第一生成模块41生成的第一权利要求文本和确定模块42确定的引用关系生成所述权利要求书。
在一个实施例中,上述装置还包括,第三生成模块44,用于:
从所述技术交底文本中,确定标题的至少一段具有预设特征的描述文本,将所述描述文本输入预先训练的文本生成模型,得到第二权利要求文本;对应的,确定模块42,还用于:
确定第三生成模块44生成的第二权利要求文本,引用所述描述文本所属的标题的上一层级标题对应的第一权利要求文本;对应的,第二生成模块33,还用于:
将第三生成模块44生成的第二权利要求文本添加到所述权利要求书中的对应位置。
在一个实施例中,上述装置还包括,替换模块45,用于:
利用选定的分词模型将第一权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第一权利要求文本中的该词替换为所述知识库中与该词匹配的上一层级的词,或为该第一权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词;和/或,利用选定的分词模型将第二权利要求文本进行分词,将得到的每个词与预先建立的知识库匹配,若匹配成功,将该第二权利要求文本中的该词替换为所述知识库中与该词匹配的上一层级的词,或为该第二权利要求文本中的该词标注所述知识库中与该词匹配的上一层级的词。
在一个实施例中,第三生成模块44,具体用于:
将所述技术交底文本中标题的每段描述文本在预设数据库中进行检索,确定所述描述文本与所述数据库的相似度;根据所述相似度确定至少一段具有预设特征的描述文本。
在一个实施例中,第一生成模块41,具体用于:
根据技术交底文本的类型确定匹配的权利要求生成模板;将所述标题及下一层级标题,按照所述模板组合生成与所述标题对应的一项第一权利要求文本。
在一个实施例中,第一生成模块41,具体用于:
根据所述标题的标签确定所述标签的下一层级标签,从技术交底文本中抽取所述标题,抽取所述下一层级标签所属标题作为所述标题的下一层级标题;或,从树状结构的技术交底文本中抽取所述标题及所述标题的下一层级标题。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
基于本发明的发明构思,本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,当该指令被处理器执行时实现上述专利申请文本的生成方法。
基于本发明的发明构思,本发明实施例还提供一种服务器,包括:存储器、处理器及存储于存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述本发明的发明方法。
除非另外具体陈述,术语比如处理、计算、运算、确定、显示等等可以指一个或更多个处理或者计算系统、或类似设备的动作和/或过程,所述动作和/或过程将表示为处理系统的寄存器或存储器内的物理(如电子)量的数据操作和转换成为类似地表示为处理系统的存储器、寄存器或者其他此类信息存储、发射或者显示设备内的物理量的其他数据。信息和信号可以使用多种不同的技术和方法中的任何一种来表示。例如,在贯穿上面的描述中提及的数据、指令、命令、信息、信号、比特、符号和码片可以用电压、电流、电磁波、磁场或粒子、光场或粒子或者其任意组合来表示。
应该明白,公开的过程中的步骤的特定顺序或层次是示例性方法的实例。基于设计偏好,应该理解,过程中的步骤的特定顺序或层次可以在不脱离本公开的保护范围的情况下得到重新安排。所附的方法权利要求以示例性的顺序给出了各种步骤的要素,并且不是要限于所述的特定顺序或层次。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本发明处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本发明单独的优选实施方案。
本领域技术人员还应当理解,结合本文的实施例描述的各种说明性的逻辑框、模块、电路和算法步骤均可以实现成电子硬件、计算机软件或其组合。为了清楚地说明硬件和软件之间的可交换性,上面对各种说明性的部件、框、模块、电路和步骤均围绕其功能进行了一般地描述。至于这种功能是实现成硬件还是实现成软件,取决于特定的应用和对整个系统所施加的设计约束条件。熟练的技术人员可以针对每个特定应用,以变通的方式实现所描述的功能,但是,这种实现决策不应解释为背离本公开的保护范围。
结合本文的实施例所描述的方法或者算法的步骤可直接体现为硬件、由处理器执行的软件模块或其组合。软件模块可以位于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质连接至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。该ASIC可以位于用户终端中。当然,处理器和存储介质也可以作为分立组件存在于用户终端中。
对于软件实现,本申请中描述的技术可用执行本申请所述功能的模块(例如,过程、函数等)来实现。这些软件代码可以存储在存储器单元并由处理器执行。存储器单元可以实现在处理器内,也可以实现在处理器外,在后一种情况下,它经由各种手段以通信方式耦合到处理器,这些都是本领域中所公知的。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本文发布于:2023-04-13 01:47:13,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/4/85591.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |