G06F17/27 G06F17/30
1.一种专利核驳信息提取方法,其特征在于,该方法包括:
读取步骤:从存储器中获取一个专利申请的官方来文;
判别步骤:根据预先设定的关键词,采用正则表达式匹配方法从官方来文中判别出核驳意见正文部分;
提取步骤:通过预先设定的正则表达式提取所述核驳意见正文部分的权利要求项、核驳法条及对比文件信息,并以数组的形式暂存在存储器中;
识别步骤:识别所述提取的权利要求项中被核驳的权利要求项,并建立被核驳权利要求项、核驳法条及对比文件信息之间的对应关系;
暂存步骤:将所述被核驳权利要求项、核驳法条和对比文件信息按照权利要求项重要等级和对应关系,以数组形式暂存于所述存储器中;及
存储步骤:当到所有被核驳权利要求项及相对应的核驳法条和对比文件信息之后,将所述存储器中暂存的所有被核驳权利要求项及相对应的核驳法条和对比文件信息存入数据库中。
2.如权利要求1所述的专利核驳信息提取方法,其特征在于,所述识别步骤包括:
根据所述提取的权利要求项,在核驳意见正文部分判断每个权利要求项字段后面区域是否存在预先设定的核驳字符串,所述权利要求项字段后面区域的范围为当前页或预先设定的文字范围;
当一个权利要求项字段后面区域存在预先设定的核驳字符串时,判断该权利要求项属于被核驳的权利要求项,通过最小贪婪匹配法及最近最优匹配法从所述核驳字符串后面到最近的核驳法条及对比文件字段,建立所述被核驳权利要求项、核驳法条及对比文件信息之间的对应关系;及
当一个权利要求项字段后面区域不存在预先设定的核驳字符串时,判断该权利要求项不属于被核驳的权利要求项,将该权利要求项的信息从暂存的数组中删除,继续判断下一个权利要求项字段后面区域是否存在预先设定的核驳字符串。
3.如权利要求1所述的专利核驳信息提取方法,其特征在于,所述权利要求项重要等级为该专利申请的各权利要求项属于独立项或者附属项的记录。
4.如权利要求3所述的专利核驳信息提取方法,其特征在于,所述暂存步骤包括:将属于独立项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于一个核驳信息列表上层,将属于附属项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于该核驳信息列表下层。
5.如权利要求1所述的专利核驳信息提取方法,其特征在于,该方法在所述存储步骤之后还包括:
清空以数组形式暂存于所述存储器中的所有数据。
6.一种专利核驳信息提取系统,其特征在于,该系统包括:
读取模块,用于从存储器中获取一个专利申请的获取官方来文;
判别模块,用于根据预先设定的关键词,采用正则表达式匹配方法从官方来文中判别出核驳意见正文部分;
提取模块,用于通过预先设定的正则表达式提取所述核驳意见正文部分的权利要求项、核驳法条及对比文件信息,并以数组的形式暂存在存储器中;
识别模块,用于识别所述提取的权利要求项中被核驳的权利要求项,并建立被核驳权利要求项、、核驳法条及对比文件信息之间的对应关系;
暂存模块,用于将所述被核驳权利要求项、核驳法条和对比文件信息按照权利要求项重要等级和对应关系,以数组形式暂存于所述存储器中;及
存储模块,用于当到所有被核驳权利要求项及相对应的核驳法条和对比文件信息之后,将所述存储器中暂存的所有被核驳权利要求项及相对应的核驳法条和对比文件信息存入数据库中。
7.如权利要求6所述的专利核驳信息提取系统,其特征在于,所述识别模块的识别过程包括:
根据所述提取的权利要求项,在核驳意见正文部分判断每个权利要求项字段后面区域是否存在预先设定的核驳字符串,所述权利要求项字段后面区域的范围为当前页或预先设定的文字范围;
当一个权利要求项字段后面区域存在预先设定的核驳字符串时,判断该权利要求项属于被核驳的权利要求项,通过最小贪婪匹配法及最近最优匹配法从所述核驳字符串后面到最近的核驳法条及对比文件字段,建立所述被核驳权利要求项、核驳法条及对比文件信息之间的对应关系;及
当一个权利要求项字段后面区域不存在预先设定的核驳字符串时,判断该权利要求项不属于被核驳的权利要求项,将该权利要求项的信息从暂存的数组中删除,继续判断下一个权利要求项字段后面区域是否存在预先设定的核驳字符串。
8.如权利要求6所述的专利核驳信息提取系统,其特征在于,所述权利要求项重要等级为该专利申请的各权利要求项属于独立项或者附属项的记录。
9.如权利要求8所述的专利核驳信息提取系统,其特征在于,所述暂存模块的暂存过程包括:将属于独立项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于一个核驳信息列表上层,将属于附属项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于该核驳信息列表下层。
10.如权利要求6所述的专利核驳信息提取系统,其特征在于,所述存储模块还用于清空以数组形式暂存于所述存储器中的所有数据。
本发明涉及一种信息提取方法及系统,尤其是涉及一种专利核驳信息提取方法及系统。
如今随着科技的发展,各行各业对自身知识产权的保护意识越来越强,因此专利申请量也逐年攀升。在专利申请过程中,答辩是非常重要的环节,官方审查员主要通过答辩文件来反映答辩状况。在专利答辩文件中,审查员往往通过大篇幅的描述来核驳专利某些方面的缺陷和不足,导致阅读耗时易忘,不容易获取其真实意图。
鉴于以上内容,有必要提供一种专利核驳信息提取方法,可以自动从官方来文中提取专利核驳信息,以便阅读和理解。
鉴于以上内容,还有必要提供一种专利核驳信息提取系统,可以自动从官方来文中提取专利核驳信息,以便阅读和理解。
所述专利核驳信息提取方法包括:读取步骤:从存储器中获取一个专利申请的官方来文;判别步骤:根据预先设定的关键词,采用正则表达式匹配方法从官方来文中判别出核驳意见正文部分;提取步骤:通过预先设定的正则表达式提取所述核驳意见正文部分的权利要求项、核驳法条及对比文件信息,并以数组的形式暂存在存储器中;识别步骤:识别所述提取的权利要求项中被核驳的权利要求项,并建立被核驳权利要求项、核驳法条及对比文件信息之间的对应关系;暂存步骤:将所述被核驳权利要求项、核驳法条和对比文件信息按照权利要求项重要等级和对应关系,以数组形式暂存于所述存储器中;及存储步骤:当到所有被核驳权利要求项及相对应的核驳法条和对比文件信息之后,将所述存储器中暂存的所有被核驳权利要求项及相对应的核驳法条和对比文件信息存入数据库中。
所述专利核驳信息提取系统包括:读取模块,用于从存储器中获取一个专利申请的获取官方来文;判别模块,用于根据预先设定的关键词,采用正则表达式匹配方法从官方来文中判别出核驳意见正文部分;提取模块,用于通过预先设定的正则表达式提取所述核驳意见正文部分的权利要求项、核驳法条及对比文件信息,并以数组的形式暂存在存储器中;识别模块,用于识别所述提取的权利要求项中被核驳的权利要求项,并建立被核驳权利要求项、、核驳法条及对比文件信息之间的对应关系;暂存模块,用于将所述被核驳权利要求项、核驳法条和对比文件信息按照权利要求项重要等级和对应关系,以数组形式暂存于所述存储器中;及存储模块,用于当到所有被核驳权利要求项及相对应的核驳法条和对比文件信息之后,将所述存储器中暂存的所有被核驳权利要求项及相对应的核驳法条和对比文件信息存入数据库中。
相较于现有技术,所述的专利核驳信息提取方法及系统,可以提取官方来文中核驳意见正文部分核驳的权利要求项、核驳法条及对比文件信息,并出三者之间的对应关系,按照重要等级组成简单明了的核驳信息列表,以便阅读和理解。另外,本发明首先将提取的专利核驳信息以数组形式暂存于存储器中,到所有核驳的权利要求项信息及相对应的核驳法条和对比文件信息之后,再转存入所述数据库中,可以避免因中途匹配或存储异常而导致数据漏存。
图1是本发明专利核驳信息提取系统较佳实施例的应用环境图。
图2是本发明专利核驳信息提取系统较佳实施例的功能模块图。
图3是提取的核驳信息列表的示意图。
图4是本发明专利核驳信息提取方法较佳实施例的流程图。
主要元件符号说明
服务器 1
专利核驳信息提取系统 10
存储器 20
数据库 30
核驳信息列表 40
读取模块 100
判别模块 200
提取模块 300
识别模块 400
暂存模块 500
存储模块 600
如下具体实施方式将结合上述附图进一步说明本发明。
参阅图1所示,是本发明专利核驳信息提取系统较佳实施例的应用环境图。所述专利核驳信息提取系统10运行于服务器1中,所述服务器1中还包括存储器20及数据库30。
所述存储器20用于存储官方来文及从官方来文中提取专利核驳信息过程中产生的暂存数据等。
所述数据库30用于存储官方来文相关专利的权利要求项重要等级及从官方来文中提取的专利核驳信息。所述权利要求项重要等级为该专利申请的各权利要求项属于独立项或者附属项的记录。所述专利核驳信息包括官方来文中被核驳的权利要求项信息及针对该权利要求项引用的核驳法条及对比文件信息。值得注意的是,在其他实施例中,所述数据库30可以存在于其他服务器等可用于存储数据的设备中;另外,所述官方来文相关专利的权利要求项重要等级及从官方来文中提取的专利核驳信息可以分别存储于不同的数据库中。
参阅图2所示,是本发明专利核驳信息提取系统较佳实施例的功能模块图。
所述专利核驳信息提取系统10包括读取模块100、判别模块200、提取模块300、识别模块400、暂存模块500及存储模块600。
所述读取模块100用于从存储器20中获取一个专利申请的官方来文,读取官方来文具体内容。所述官方来文可以预先存储在存储器20中。
所述判别模块200用于根据预先设定的关键词,采用正则表达式匹配方法从该官方来文中判别出核驳意见正文部分。以美国专利申请为例,可以预先设定以关键词“Detailed Action”为开始,以关键词“Notice of References Cited Application”为结束的部分即为核驳意见正文。
所述提取模块300用于通过预先设定的正则表达式提取所述核驳意见正文部分的权利要求项,并以数组的形式将提取的权利要求项的信息暂存在所述存储器20中。所述提取权利要求项相应的正则表达式可以通过分析核驳意见正文部分中权利要求项常用的的文字表达形式得出。以美国专利申请为例,核驳意见正文部分中权利要求项为类似“Claims 2, 3, 15 and 16”的文字表达形式,可以通过正则表达式“Claims?s*d.*”进行匹配。
所述提取模块300还用于通过预先设定的正则表达式提取所述核驳意见正文部分的核驳法条信息,并以数组的形式将提取的核驳法条信息暂存在所述存储器20中。所述提取核驳法条信息相应的正则表达式可以通过分析核驳意见正文部分中核驳法条常用的的文字表达形式得出。以美国专利申请为例,核驳意见正文部分中核驳法条为类似“35 U.S.C. 103(a)”的文字表达形式,可以通过正则表达式“d{2}s*USCs*§s*d{3}s*((s*ws*))?s*‑?s*((s*ws*))?|d{2}s*U.S.C.s*d{3}s*((s*ws*))?s*‑?s*((s*ws*))?|d{2}s*CFRs*[d.]{3,}s*((s*ws*))?s*‑?s*((s*ws*))?”进行匹配。
所述提取模块300还用于通过预先设定的正则表达式提取所述核驳意见正文部分的对比文件信息,并以数组的形式将提取的对比文件信息暂存在所述存储器20中。所述提取对比文件信息相应的正则表达式可以通过分析核驳意见正文部分中对比文件常用的的文字表达形式得出。以美国专利申请为例,核驳意见正文部分中对比文件为类似“US 2009/0196071”的文字表达形式,可以通过正则表达式“(PCT/)?(U.?[S5].?s*|K.?R.?s*|T.?W.?s*|E.?P.?s*|C.?N.?s*|J.?P.?s*|Science.?s*)?(P[GAU][PTB]w*.?s*)?(NO.?s*:?s*|Applications*)?(Publications*)?(NO.?s*:?s*)?d[^a‑zA‑Z]{3,13}d{2}(s*)?w{0,2}d?s*)?”进行匹配。
所述识别模块400用于识别所述提取的权利要求项中被核驳的权利要求项,并建立被核驳权利要求项、核驳法条及对比文件信息之间的对应关系。所述识别模块400根据所述提取模块300提取的权利要求项信息,在核驳意见正文部分判断每个权利要求项字段后面区域是否存在预先设定的核驳字符串。所述每个权利要求项字段后面区域的范围可以是当前页或其他预先设定的文字范围。所述核驳字符串为涉及核驳字样的字符串,以美国专利申请为例,核驳意见正文部分的相关表述类似“Claims 2, 3, 15 and 16 are rejected under 35 U.S.C. 103(a) as being unpatentable over Shimura et al.(US 2008/0130317)”,核驳字符串可以设定为“rejected under”等。
当某个权利要求项字段后面区域存在预先设定的核驳字符串时,则所述识别模块400判断该权利要求项属于该官方来文中被核驳的权利要求项,所述识别模块400通过最小贪婪匹配法及最近最优匹配法从所述核驳字符串后面到最近的核驳法条及对比文件字段,即与该权利要求项相对应的核驳法条及对比文件字段,从而建立所述被核驳权利要求项、核驳法条及对比文件信息之间的对应关系。
当某个权利要求项字段后面区域不存在预先设定的核驳字符串时,则所述识别模块400判断该权利要求项不属于该官方来文中被核驳的权利要求项,所述识别模块400将该权利要求项的信息从暂存的数组中删除,继续判断下一个权利要求项字段后面区域是否存在预先设定的核驳字符串。
所述暂存模块500用于将所述被核驳权利要求项、核驳法条和对比文件信息按照权利要求项重要等级和对应关系,以数组形式暂存于所述存储器20中。所述暂存模块500根据所述数据库30中存储的各被核驳权利要求项属于独立项或者附属项的记录,将属于独立项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于核驳信息列表40上层,将属于附属项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于核驳信息列表40下层。其中,属于同一组的被核驳权利要求项放在一起(参阅图3所示)。
所述存储模块600用于当到所有被核驳权利要求项及相对应的核驳法条和对比文件信息之后,将所述存储器20中暂存的所有被核驳权利要求项及相对应的核驳法条和对比文件信息存入数据库30中,并清空以数组形式暂存于所述存储器20中的所有数据。
参阅图4所示,是本发明专利核驳信息提取方法较佳实施例的流程图。
步骤S10,所述读取模块100从存储器20中获取一个专利申请的官方来文,读取官方来文具体内容。所述官方来文可以预先存储在存储器20中。
步骤S12,所述判别模块200根据预先设定的关键词,采用正则表达式匹配方法从该官方来文中判别出核驳意见正文部分。以美国专利申请为例,可以预先设定以关键词“Detailed Action”为开始,以关键词“Notice of References Cited Application”为结束的部分即为核驳意见正文。
步骤S14,所述提取模块300通过预先设定的正则表达式提取所述核驳意见正文部分的权利要求项,并以数组的形式将提取的权利要求项的信息暂存在所述存储器20中。所述提取权利要求项相应的正则表达式可以通过分析核驳意见正文部分中权利要求项常用的文字表达形式得出。以美国专利申请为例,核驳意见正文部分中权利要求项为类似“Claims 2, 3, 15 and 16”的文字表达形式,可以通过正则表达式“Claims?s*d.*”进行匹配。
步骤S16,所述提取模块300通过预先设定的正则表达式提取所述核驳意见正文部分的核驳法条信息,并以数组的形式将提取的核驳法条信息暂存在所述存储器20中。所述提取核驳法条信息相应的正则表达式可以通过分析核驳意见正文部分中核驳法条常用的文字表达形式得出。以美国专利申请为例,核驳意见正文部分中核驳法条为类似“35 U.S.C. 103(a)”的文字表达形式,可以通过正则表达式“d{2}s*USCs*§s*d{3}s*((s*ws*))?s*‑?s*((s*ws*))?|d{2}s*U.S.C.s*d{3}s*((s*ws*))?s*‑?s*((s*ws*))?|d{2}s*CFRs*[d.]{3,}s*((s*ws*))?s*‑?s*((s*ws*))?”进行匹配。
步骤S18,所述提取模块300通过预先设定的正则表达式提取所述核驳意见正文部分的对比文件信息,并以数组的形式将提取的对比文件信息暂存在所述存储器20中。所述提取对比文件信息相应的正则表达式可以通过分析核驳意见正文部分中对比文件常用的文字表达形式得出。以美国专利申请为例,核驳意见正文部分中对比文件为类似“US 2009/0196071”的文字表达形式,可以通过正则表达式“(PCT/)?(U.?[S5].?s*|K.?R.?s*|T.?W.?s*|E.?P.?s*|C.?N.?s*|J.?P.?s*|Science.?s*)?(P[GAU][PTB]w*.?s*)?(NO.?s*:?s*|Applications*)?(Publications*)?(NO.?s*:?s*)?d[^a‑zA‑Z]{3,13}d{2}(s*)?w{0,2}d?s*)?”进行匹配。
步骤S20,所述识别模块400识别所述权利要求项中被核驳的权利要求项,并建立被核驳权利要求项、核驳法条及对比文件信息之间的对应关系。所述识别模块400根据所述提取模块300提取的权利要求项信息,在核驳意见正文部分判断每个权利要求项字段后面区域是否存在预先设定的核驳字符串。所述每个权利要求项字段后面区域的范围可以是当前页或其他预先设定的文字范围。所述核驳字符串为涉及核驳字样的字符串,以美国专利申请为例,核驳意见正文部分的相关表述类似“Claims 2, 3, 15 and 16 are rejected under 35 U.S.C. 103(a) as being unpatentable over Shimura et al.(US 2008/0130317)”,核驳字符串可以设定为“rejected under”等。
当某个权利要求项字段后面区域存在预先设定的核驳字符串时,则所述识别模块400判断该权利要求项属于该官方来文中被核驳的权利要求项,所述识别模块400通过最小贪婪匹配法及最近最优匹配法从所述核驳字符串后面到最近的核驳法条及对比文件字段,即与该权利要求项相对应的核驳法条及对比文件字段,从而建立所述被核驳权利要求项、核驳法条及对比文件信息之间的对应关系。
当某个权利要求项字段后面区域不存在预先设定的核驳字符串时,则所述识别模块400判断该权利要求项不属于该官方来文中被核驳的权利要求项,所述识别模块400将该权利要求项的信息从暂存的数组中删除,继续判断下一个权利要求项字段后面区域是否存在预先设定的核驳字符串。
步骤S22,所述暂存模块500将所述被核驳权利要求项、核驳法条和对比文件信息按照权利要求项重要等级和对应关系,以数组形式暂存于所述存储器20中。所述多重集合临时存储为根据所述数据库30中存储的各被核驳权利要求项属于独立项或者附属项的记录,将属于独立项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于核驳信息列表40上层,将属于附属项的被核驳权利要求项信息及相对应的核驳法条和对比文件信息置于核驳信息列表40下层。其中,属于同一组的被核驳权利要求项放在一起(参阅图3所示)。
步骤S24,当到所有被核驳权利要求项及相对应的核驳法条和对比文件信息之后,所述存储模块600将所述存储器20中暂存的所有被核驳权利要求项及相对应的核驳法条和对比文件信息存入数据库30中,并清空以数组形式暂存于所述存储器20中的所有数据。
值得注意的是,所述步骤S14、步骤S16、步骤S18之间的顺序可以交换,不影响本发明专利核驳信息提取方法最后得到的结果。本实施例以美国专利申请为例,其它国家专利申请提取专利核驳信息的方法依此类推。
综上所述,使用本发明专利核驳信息提取方法及系统,可以通过分析官方来文中核驳意见正文部分常用的文字表达形式,设定相应的正则表达式提取被核驳的权利要求项、核驳法条及对比文件信息,并采用最小贪婪匹配法及最近最优匹配法,出三者之间的对应关系,组成简单明了的核驳信息列表,以便阅读和理解;而且,根据各权利要求项属于独立项或者附属项的记录,将属于独立项的专利核驳信息置于核驳信息列表40上层,将属于附属项的专利核驳信息置于核驳信息列表40下层,便于体现核驳信息的重要等级。另外,本发明首先将提取的专利核驳信息以数组形式暂存于所述存储器20中,到所有被核驳权利要求项信息及相对应的核驳法条和对比文件信息之后,再转存入所述数据库30中,可以避免因中途匹配或存储异常而导致数据漏存。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
本文发布于:2023-03-13 04:41:36,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/69188.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |