G06F17/30(2006.01)I G06F19/00(2006.01)I
1、一种企业专利数据库中专利法律状态自动更新方法,其特征在于,所述 方法包括以下步骤:
步骤S1:定时触发法律状态自动更新请求,开始对专利数据库中的本地专 利的法律状态进行更新;
步骤S2:依次对企业专利数据库中的每一个欲更新本地专利,登录到该本 地专利对应的专利法律状态信息发布网站,并执行步骤S3;
步骤S3:由计算机自动从该本地专利对应的专利法律状态信息发布网站进 行检索,获取相应的检索结果页面,并将检索结果页面公布的法律状态与本地 专利的法律状态进行对比,以对专利数据库中的法律状态进行更新。
2、根据权利要求1所述的方法,其特征在于,所述步骤S3进一步包括以 下内容:
步骤R1:从专利法律状态信息发布网站获取相应专利的目标检索页面,将 该本地专利的法律状态特征词与目标检索页面的特征词进行对比,如果存在不 匹配的特征词,则转向步骤R2;如果特征词匹配,则转向步骤R3;
步骤R2:执行一自学习算法,以识别所述不匹配的特征词,并据以更新本 地专利的法律状态特征词或向其中添加新的特征词;
步骤R3:根据特征词的位置,分析目标检索页面特性,抽象出目标检索页 面的文档对象模型;
步骤R4:根据目标检索页面的文档对象模型,获取特征词对应的特征词内 容,获得该本地专利的当前法律状态;
步骤R5:将步骤R4获取的法律状态与企业专利数据库中保存的相应专利的 法律状态进行对比,如果二者相同,则无操作;如果二者不同,则更新企业专 利数据库中对应专利的法律状态。
3、根据权利要求2所述的方法,其特征在于,所述步骤R5中,还包括在 所有操作完成后,将当前更新时间记录到企业专利数据库中。
4、企业专利数据库中专利法律状态自动更新系统,其特征在于,所述系 统包括:
定时触发模块,根据预先设定的更新周期T启动整个系统的更新运行;
搜索模块,其用于通过链接到专利法律状态信息发布网站,获得本地数据 库中指定专利的法律状态目标检索页面;
法律状态特征词对比模块,用于将所述目标检索页面的法律状态特征词与 本地特征词进行对比;
数据存储模块,用于进行法律状态特征词的提取和更新;
法律状态自学习模块,用于根据法律状态特征词对比模块的对比结果进行 自学习,并生成新的法律状态特征词;
特征内容分析模块,用于根据法律状态特征词对比模块产生的结果进行目 标检索页面的文档对象模型分析,从而获得根据法律状态特征词在目标页面的 DOM树形结构中对应的节点;
内容提取模块,用于根据法律状态特征词在目标检索页面上进行特征词内 容的提取;
法律状态对比保存模块,用于将内容提取模块提取出来特征词内容和本地 数据库中已有的相应法律状态进行对比,如果二者相同,则不需要更新,如果 不同,更新本地数据库中此专利的相应法律状态;
中央控制模块,用于对上述各个模块的运行进行调度和控制。
技术领域
本发明涉及数据库的自动更新系统和方法,特别是涉及到企业专利数据库 中法律状态的自动更新系统和方法。
背景技术
随着知识产权法律制度的完善和执法力度的增强,企业的知识产权保护意 识也不断提高。其中,了解和跟踪行业内的知识产权,尤其是专利分布情况已 经成为企业生存和发展的必要条件之一。因此,很多企业都已经或正在建立其 相关行业和针对企业特点的专利数据库,以对产品的研发和生产进行指引和作 为参考。
但是,由于专利权的特殊性,一项专利从申请、公开到授权再到权利的结 束,期间法律状态是不断变动的。显然,专利(专利申请)的法律状态对于企 业而言至关重要。例如,对于制药企业,尤其我国制药企业,一项刚刚获得授 权的新药的产品专利意味着以该药品为目标的研发最终即使成功也有可能落入 他人的权利范围,因此有必要调整研发方向或考虑取得专利权人的授权许可; 而一项即将过保护期的产品专利则意味着可以着手准备生产。因此,单单是建 立了专利数据库还不够,还必须对数据库中的专利的法律状态进行实时跟踪。
而目前企业专利数据库中专利法律状态的更新均是通过人工逐条检索进行 的,通过登录国内外相应的权威知识产权网站,查询公布的专利法律状态信息, 然后手动更新企业专利数据库中的法律状态,工作量巨大,势必导致工作周期 长,效率低下。并且,这种周期性的重复劳动一方面造成人力资源的浪费,另 一方面由人工手动检索和识别也易于产生错误,而对其进行校对又会增加额外 成本。
发明内容
本发明的目的正是针对现有手工检索和更新的缺陷,提供一种由计算机自 行完成专利法律状态检索和更新的方法和系统。最小化更新过程中人员的参与。
本发明提供了一种企业专利数据库中专利法律状态自动更新方法,所述方 法包括以下步骤:
步骤S1:定时触发法律状态自动更新请求,开始对专利数据库中的本地专 利的法律状态进行更新;
步骤S2:依次对企业专利数据库中的每一个欲更新本地专利,登录到该本 地专利对应的专利法律状态信息发布网站,并执行步骤S3;
步骤S3:由计算机自动从该本地专利对应的专利法律状态信息发布网站进 行检索,获取相应的检索结果页面,并将检索结果页面公布的法律状态与本地 专利的法律状态进行对比,以对专利数据库中的法律状态进行更新。
其中,所述步骤S3进一步包括以下内容:
步骤R1:从专利法律状态信息发布网站获取相应专利的目标检索页面,将 该本地专利的法律状态特征词与目标检索页面的特征词进行对比,如果存在不 匹配的特征词,则转向步骤R2;如果特征词匹配,则转向步骤R3;
步骤R2:执行一自学习算法,以识别所述不匹配的特征词,并据以更新本 地专利的法律状态特征词或向其中添加新的特征词;
步骤R3:根据特征词的位置,分析目标检索页面特性,抽象出目标检索页 面的文档对象模型;
步骤R4:根据目标检索页面的文档对象模型,获取特征词对应的特征词内 容,获得该本地专利的当前法律状态;
步骤R5:将步骤R4获取的法律状态与企业专利数据库中保存的相应专利 的法律状态进行对比,如果二者相同,则无操作;如果二者不同,则更新企业 专利数据库中对应专利的法律状态。
同时,本发明还提供了一种企业专利数据库中专利法律状态自动更新系统, 所述系统包括:
定时触发模块,根据预先设定的更新周期T启动整个系统的更新运行;
搜索模块,其用于通过链接到专利法律状态信息发布网站,获得本地数据 库中指定专利的法律状态目标检索页面;
法律状态特征词对比模块,用于将所述目标检索页面的法律状态特征词与 本地特征词进行对比;
数据存储模块,用于进行法律状态特征词的提取和更新;
法律状态自学习模块,用于在根据法律状态特征词对比模块的对比结果进 行自学习,并生成新的法律状态特征词;
特征内容分析模块,用于根据法律状态特征词对比模块产生的结果进行目 标检索页面的文档对象模型分析,从而获得根据法律状态特征词在目标页面的 DOM树形结构中对应的节点;
内容提取模块,用于根据法律状态特征词在目标检索页面上进行特征词内 容的提取;
法律状态对比保存模块,用于将内容提取模块提取出来特征词内容和本地 数据库中已有的相应法律状态进行对比,如果二者相同,则不需要更新,如果 不同,更新本地数据库中此专利的相应法律状态;
中央控制模块,用于对上述各个模块的运行进行调度和控制。
本发明的有益效果在于,通过法律状态数据库的自动更新,可以及时跟踪 数据库中专利的法律状态变化,并且由于无需人员参与,减少了出错的概率。 同时也可节省人力成本。
附图说明
图1是本发明的专利数据库系统的实施例系统结构示意图;
图2是本发明的专利法律状态更新系统结构模块图;
图3是本发明的专利法律状态更新的方法流程图;
图4是根据本发明的一实施例所提取的目标检索页面的DOM结构图。
具体实施方式
通常,企业的专利数据库系统是通过企业内部的局域网连接在一起的一台 或几台服务器构成。图1是根据本发明的专利数据库系统的一个实施例系统结 构示意图。图1所示的系统中,包括企业专利数据库服务器、企业专利文献服 务器和应用服务器,企业内部的用户通过连接到应用服务器的查询终端对数据 库进行访问。其中,专利数据库服务器、企业专利文献服务器和应用服务器均 为逻辑概念,即其可分别用多台服务器或PC实现,也可使用一台服务器或PC 实现。
其中,专利数据库服务器用于存储专利文献的著录项等信息,包括申请号、 申请日、专利名称、公开(公告)号、公开(公告)日、分类号、申请(专利权)人、 发明(设计)人、法律状态类型等,并支持对著录项等信息的检索功能;企业专利 文献服务器用于存储专利全文(图形文件);而应用服务器则提供数据库与用 户终端的接口,使得用户可以通过其终端(如PC机)对数据库进行查询和检索 以及更新。
要说明的是,上述各数据库的功能的逻辑划分也只是作为本发明实施环境 的一个优选示例而例举于此,其目的在于使本发明的方案更易于理解,但并不 能以此作为对本发明的限制。本发明的法律状态自动更新方法并不受企业专利 数据库构成形式或数据服务形式的限制。
图2为本发明的专利法律状态更新系统结构模块图,从图中可见,本发明 的专利法律状态更新系统包括:定时触发模块220;搜索模块230;法律状态特 征词对比模块240;数据存储模块250;法律状态自学习模块260;特征内容分 析模块270;内容提取模块280;法律状态对比保存模块290,以及对上述各个 模块的运行起调度和控制作用的中央控制模块210。
其中,定时触发模块220根据预先设定的更新周期T启动整个系统的更新 运行,即用定时触发模块每隔时间T启动一次数据库中专利法律状态的更新操 作。为了使更新操作有序进行,显然,更新周期T应大于对全部欲更新的专利 进行一次法律状态更新所需的时间。考虑到互联网通信链路的随机时延,通常, T的选择要在多次试验的更新时间平均值的基础上留有一定时间百分比的裕量。 或者,亦可设置为每天、每周、每月等固定时间更新一次。
搜索模块230是本发明的核心模块之一,其通过链接到国内外的权威知识 产权网站,通常是各个国家和/或地区以及政府间组织的知识产权机构 (如中国国家知识产权局、美国专利局、欧洲专利局、日本专利局、世界知识 产权组织等,为便于叙述,下文将之统称为专利法律状态信息发布网站),登 录各个专利法律状态信息发布网站的相应法律状态检索页面(以下称目标网 页),通过能唯一确定专利或专利申请的标识——如专利号或专利申请号,对 企业专利数据库中的相应专利在专利法律状态信息发布网站的法律状态进行检 索,以获取对应特定专利(申请)号的目标检索页面。关于具体的实现形式, 将在下文中结合本发明的方法流程进行详细说明。
法律状态特征词对比模块240用于对搜索模块230获取的目标检索页面进 行法律状态特征词与本地特征词的对比,并根据对比结果选择调用法律状态自 学习模块260或特征内容分析模块270。
数据存储模块250对专利法律状态数据库进行操作,并可进行数据库条目 的法律状态特征词的提取和更新操作。
法律状态自学习模块260是一可选模块,其未必在每次更新中均被调用到。 只有当法律状态特征词对比模块240在进行对比后,发现目标检索页面的法律 状态特征词与本地特征词并不完全匹配时才会调用法律状态自学习模块260,例 如,在目标网页上出现了本地特征词之外的特征词,此时,法律状态自学习模 块260将根据法律状态特征词对比模块240的对比结果进行自学习,并产生新 的法律状态特征词。
特征内容分析模块270则用于根据对比模块产生的结果进行页面的DOM (Document Object Model文档对象模型)分析,从而获得根据法律状态特征词 在目标页面的DOM树形结构中对应的节点。
内容提取模块280用于根据法律状态特征词的内容在网页上进行法律状态 特征词内容的提取。
法律状态对比保存模块290则是将内容提取模块280提取出来的法律状态 特征词内容,即该特征词所对应的法律状态参数和数据库中已有的相应法律状 态参数进行对比,如果二者相同,则不需要更新,如果不同,更新数据库中此 专利的法律状态参数。
下面结合图3对用本发明的方法进行企业专利数据库的法律状态自动更新 的流程进行详细说明。本发明的方法包括以下内容:
步骤S1:定时触发模块220触发法律状态自动更新请求;在本发明的系统 连续运行的过程中,本步骤S1是以周期T循环往复,以保证法律状态的及时更 新。
步骤S2:搜索模块230遍历企业专利数据库中的本地专利,登录到本地专 利对应的专利法律状态信息发布网站,搜索到指定专利的法律状态检索页面; 例如对于中国专利,可以登录到http://search.sipo.gov/sipo/zljs/searchflzt.jsp。
步骤S3、对于每一个本地专利由中央控制模块控制依次执行下列步骤:
步骤R1:从专利法律状态信息发布网站获取相应的检索结果(以下称目标 检索页面),提取本地法律状态数据库中的特征词(如专利(申请)号、授权 公告号、法律状态公告日、法律状态类型、公开、授权等),利用法律状态特 征词对比模块240对比目标检索页面内容,如果存在不匹配的特征词,则转向 步骤R2;如果特征词匹配,则转向步骤R3;
步骤R2、利用法律状态自学习模块260,通过自学习算法,识别新的特征 词,并更新法律状态特征库中的特征词或在其中添加新的特征词;
步骤R3、调用特征内容分析模块270,分析目标检索页面特性,分析出目 标检索页面的DOM结构;由于对于一个页面而言,无论该页面文件是用何种语 言制作,其生成相应的页面文件(如html文档)后,其便具有一定的DOM结 构,并且对于通常的专利法律状态信息发布网站而言,其页面框架结构相对稳 定,这使得根据字符串匹配进行特征词分析具有可能性和可行性。
步骤R4、根据目标检索页面的DOM结构,获取特征词对应的特征词内容, 调用内容提取模块280,提取出该特征词内容,获得当前专利的法律状态;
步骤R5、利用法律状态对比保存模块290,对比法律状态数据库中相应专 利的法律状态与步骤R4获取的法律状态,如果二者相同,则无需操作,或者只 记录下当前时间作为最后更新时间;如果二者不同,则更新法律状态数据库中 对应专利的法律状态。
其中,步骤R2是根据专利法律状态信息发布网站的网页结构的可选步骤, 并且,也可以先分析目标检索页面特性,分析出目标检索页面的DOM结构,然 后在此基础上进行步骤R2中的新的特征词自学习,以提高效率。例如对于中国 国家知识产权局的法律状态检索页面,由于其根据专利法律状态的每一次变化 而相应地在页面增加一个表格显示,这就意味着对应目标检索网页的DOM中增 加一个子节点。并且同时也可能增加了法律状态特征词,例如,在对于一个刚 完成公布的专利,其目标检索页面只有一个表格,举例来说,在2008年3月10 日运行本方法,得到如表一所示的结果。其中法律状态特征词只有“申请(专 利)号”、“授权公告号”、“法律状态公告日”、“法律状态类型”和“公 开”;而在2008年4月30日其法律状态更新之后第一次执行本发明的方法时, 除表一外,该专利的目标检索页面还会包含表二,并且法律状态特征词中增加 了“实质审查的生效”。此时就有必要进行自学习和进行特征词添加。而对于 著录项目变更等则需要自学习的特征词会更多。
表一
表二
下面以一中国专利的法律状态更新过程为例,具体说明本发明的法律状态 自动更新方法和自动更新系统的运作。
例如,自动更新系统安装于应用服务器,而法律状态数据库则存储于企业 专利数据库服务器。系统启动后,由定时触发模块220以设定的时间周期进行 法律状态数据库中所有专利法律状态的依序遍历更新。而步骤R1到R5的具体 实现如下:
首先从法律状态数据库中获取一个专利条目,该条目包括专利(申请)号、 申请日、公开日等内容,其中,将如“专利(申请)号”、“授权公告号”、 “法律状态公告日”、“公开”、“实质审查的生效”等项目称为“特征词”, 而将该等项目所对应的值域称为“特征词内容”,例如“200710071070.6”、 “2008.03.05”等。例如,一个专利条目可以用以下数据结构抽象:
Structure patent_legal_state
{
Char item_application_Number
Char value_application_Number
Char item_publication_Number
Char value_publication_Number
Char item_publication
Char value_publication
......
}
其中item_****表示特征词,value_****表示相应的特征词内容。而特征词 的个数是可变的,以适应不断更新的法律状态。
步骤R1:获取相应的检索结果(以下称目标检索页面),首先要从该专利 条目中提取能唯一确定该专利的项目,如专利申请号,之后程序自动生成相应 该专利申请号的目标页面地址,例如对申请号200510043446.3,其目标页面地 址为 http://search.sipo.gov/sipo/zljs/FlztResult.jsp?searchword=%C9%EA%C7%EB% BA%C5%3D200510043446%2E3。其中,需要说明的是,在字符串 “%C9%EA%C7%EB%BA%C5%3D200510043446%2E3”中, “%C9%EA%C7%EB%BA%C5%3D”是urlencode编码,意思是“申请号=”; “200510043446”是指定专利的专利号;%2E的意思是“.”;最后一位“3” 是指定专利的奇偶校验位。而所述urlencode编码是根据目标专利法律状态信息 发布网站的页面而定的,需要在自动更新运行之前在程序中设定,即需对页面 进行人工分析而获得,该分析过程为一般熟悉页面编程语言的一般技术人员即 可以进行。考虑到专利法律状态信息发布网站的页面结构一般较为稳定,因此, 只需每隔相当长一段时间进行一次人工检查即可令本发明得以实现,或者也可 设立一错误监督模块,当目标页面指令运行后返回的结果不佳或无法返回结果 时进行报警。
运行上述目标页面地址,即可通过互联网获得相应的对应该申请号的目标 检索页面。
将当前专利条目的特征词(如专利(申请)号、授权公告号、法律状态公告 日、法律状态类型、公开、授权等),与目标检索页面的特征词进行对比,所 述对比通过法律状态特征词对比模块240实现,如果存在不匹配的特征词,则 转向步骤R2;如果特征词匹配,则转向步骤R3,这里特征词匹配有两种方式, 一种是直接通过字符串匹配的方式进行,另一种是也可以先对目标检索页面进 行页面分析,分析出目标检索页面的DOM结构,并根据DOM结构达到更简化 和精确的对比,例如如图4所示的DOM结构中,可以直接对比“元素
留言与评论(共有 0 条评论) |