G06F17/27 G06F17/30
1.一种专利信息检索的语法转换方法,其进行语法转换时参照一存储 于数据库的语法参考文件,其特征在于,该方法包括如下步骤:
通过使用者端计算机输入检索字串;
通过一与所述使用者端计算机相连的服务器,对输入的检索字串进行 语法分析,即参照数据库中存储的语法参考文件,将检索字串自动切分成 个体进行辨识和分析;
对检索字串自动切分后,生成语法树;
对生成的语法树进行优化;
对优化后的个体进行语意分析,识别个体在数据库中所表示的语意并 执行类型检查;
进行语法转换,通过加载不同的Schema语言,将上述分析后的语法转 译成不同的检索语句;及
通过语法转换,自动生成适合各国专利局网上数据库检索语法的相关 检索语句,直接至各国专利局网上数据库进行搜索。
2.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所 述输入检索字串的语法定义采用BNF范式。
3.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所 述对输入的检索字串进行语法分析是采用JavaCC语言来实现。
4.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所 述通过语法转换而生成的检索语句可为生成SQL检索语句,该SQL检索语 句对企业内存储专利信息的数据库进行检索。
5.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所 述通过语法转换而生成的检索语句可为生成XML语言格式的检索语句。
6.如权利要求1所述的专利信息检索的语法转换方法,其特征在于,所 述通过语法转换而生成检索语句,其生成方式有如下两种类型:
将Java代码嵌入到JavaCC脚本;及
利用JJTree产生动态树结构。
【技术领域】
本发明涉及一种信息检索方法,尤其涉及一种专利信息检索的语 法转换方法。
【背景技术】
专利信息,是指包括专利申请、授权、专利法律状态、专利技术 内容等信息的集合,它汇集了大量的技术信息、经济信息和法律信息, 是一个反映科技发展最迅速、最全面、最系统的知识库。专利信息对 于技术进步和科研开发具有非常重要的意义。所以,如果作为发明人, 则应该知已知彼,了解个人所掌握技术的发展历程;如果作为企业家, 则应该监视竞争对手的新产品以及竞争对手所取得的专利;如果从事 应用研究,则必须不时注意相关领域中的新专利和送审中的专利,以 掌握关键技术的发展动向。而专利检索可以帮助研发人员和企业,追 踪技术发展动向,掌握研发方向和研拟市场竞争策略,避免重复研究 所造成的人力、物力、时间等资源的浪费,并及时把握竞争对手的发 展动向。
查询专利在过去是一项既费时又费事的工作,首先是专利光盘系 统或是Dialog等线上检索系统所费不菲,不是每个大学图书馆或是学 术研究图书馆所负担得起,更无法建立专门图书馆。其次专利既是技 术文件又是法律文件,其专利文件有其特殊的检索系统和检索策略, 不是研究人员所熟悉,所以多半是委由专利律师或是相关机构的专利 检索人员代为检索。由于专利检索系统的不普及和检索界面的不友善, 使得研究人员参考引用专利信息的比例明显偏低,也使研发生产力受 到相当程度的影响。
之后,随着互联网的发展,为专利信息检索开拓了新地局面。每 位研究人员都可以利用网络的友善界面,联机检索各国的专利信息。 然而,这些网站所支持的检索语法,有相当程度的差别,使用户在不 同国家的专利信息网站进行检索时要注意不同的检索规则,既耗费人 力又降低了效率。传统的检索程序设计,没有统一的语法描述方法; 语法分析中对检索字串逐字匹配,其语法规则嵌入代码中;手工编写 Java代码;且语法维护困难,逻辑复杂。
所以需要提供专利信息检索的语法转换方法,可实现将检索语法 进行自动转换为各国专利信息网站上的不同检索语法,方便用户准确 快捷地检索相关专利信息,其以JavaCC设计检索程序,语法描述采 用BNF范式(Backus Naur Form,巴科斯-诺尔范式);提供语法分析; 自动产生Java代码;且语法维护容易,语法简单。
【发明内容】
本发明的主要目的在于提供专利信息检索的语法转换方法,其可 通过对专利信息的检索语法进行自动转换,实现对不同国家的专利信 息进行检索。
为达成上述的目的,本发明提供一种专利信息检索的语法转换方 法,其进行语法转换时参照一存储于数据库的语法参考文件。该方法 包括以下步骤:输入检索字串,对输入字串的语法定义采用BNF范式 (Backus Naur Form,巴科斯-诺尔范式);对输入的检索字串进行语法 分析,即将检索字串自动切分成个体进行辨识和分析,分析过程中利 用的工具是JavaCC(Java Compiler Compiler,纯Java的词法分析建构 程序);对检索字串自动切分后,生成语法树;对生成的语法树进行优 化,例如进行条件合并;对优化后的个体进行语意分析,识别个体在 数据库中所表示的语意,并执行类型检查;经过各类分析后,进行语 法转换,通过加载不同的Schema语言,将上述分析后的语法转译成 不同的检索语句;通过语法转换,可以生成SQL(Structured Query Language,结构化查询语言)检索语句,在数据库中进行检索;若需要 检索的专利信息在数据库中无法检索到,或者数据库所存储的信息不 够全面,则可通过语法转换自动生成适合各国专利局网上数据库检索 语法的相关检索语句,直接至各国专利局网上数据库进行检索;此外, 通过语法转换还可生成XML(Extensible Markup Language,可扩展标 记语言)语句等其它格式的检索语句。其中,通过语法转换而生成的各 类检索语句,其生成方式有两种类型,第一种是将Java代码嵌入到 JavaCC脚本;第二种是利用JJTree(JJTree是一个JavaCC的插件,通 过AST扩充JavaCC生成的解析器)产生动态树结构。
利用本发明,可提供通用的专利语法,并实现将检索语法自动转 换为各国专利信息网站上的不同检索语法,方便用户准确快捷地检索 相关专利信息。
【附图说明】
图1是本发明专利信息检索的语法转换方法的系统架构图。
图2是本发明专利信息检索的语法转换方法的流程图。
图3是本发明专利信息检索的语法转换方法的语法树图。
【具体实施方式】
如图1所示,是实施本发明专利信息检索的语法转换方法的系统 架构图,其包括多个使用者端计算机1、至少一服务器2、至少一数据 库3及将它们相连起来的网络4。用户通过使用者端计算机1输入一 检索字串并发送至服务器2,服务器2对该检索字串进行语法分析, 从数据库3中快速搜索相关专利信息,并将搜索结果进行处理后传送 至使用者端计算机1;若数据库3中没有相关专利信息,服务器2可 自动将输入的检索字串进行语法转换,即将语法转译为相应国家专利 网站的检索语法,并通过网络4至相应国家的专利网站进行搜索及获 取搜索结果。
网络4可以是一企业内部网(Intranet),也可以是互联网(Internet) 或其它类型通讯网络。使用者端计算机1提供一交互式用户界面,以 便于用户进行专利信息检索及查看相关结果。
数据库3中存储有服务器2通过互联网下载的各国专利信息,并 且存储一语法参考文件,其列出定义的各类语法及对应的内容描述等 信息,如专利名称(Patent Name)在检索时可用TTL表示,专利权人 (Assignee Name)用AN表示,专利摘要(Abstract)用ABST表示,专利 描述(Specification)用SPEC表示,专利范围(Claim)用ACLM表示,专 利号(Patent Number)用PN表示,申请号(Application Number)用APN 表示,专利公告日期(Issue Date)用ISD表示等等。
如图2所示,是本发明专利信息检索的语法转换方法的流程图。 首先,输入检索字串,对输入字串的语法定义采用BNF范式(Backus Naur Form,巴科斯-诺尔范式),例如检索在2004年专利权人(AN)是B 公司或者C公司,且专利范围(ACLM)包含连接器(Connector)的所有 专利,其检索字串为AN/(B or C)and ACLM/Connector AND ISD/[2004.1.1-2004.12.31],其中AN、ACLM及ISD为自定义语法(步 骤S1)。对输入的检索字串进行语法分析,即参照数据库3中的语法 参考文件,将检索字串自动切分成个体进行辨识和分析,分析过程中 利用的工具是JavaCC(Java Compiler Compiler,纯Java的词法分析建 构程序),如对上述查询的分析,其JavaCC片段如下所示:
AN/(B or C)and ACLM/Connector AND ISD/[2004.1.1-2004.12.31](步 骤S2)。
对检索字串自动切分后,生成如图3所示的语法树(步骤S3)。对 生成的语法树进行优化,例如进行条件合并,如上述检索专利权人(AN) 是B公司或者C公司所申请的专利,若其输入的检索字串为(AN/B or AN/C),则可优化为AN/(B or C)(步骤S4)。对优化后的个体进行语意 分析,如识别个体“AN”在数据库中所表示的语意应为专利权人,且执 行类型检查,AN应为字符类型,而代表公告目的ISD应为日期类型(步 骤S5)。经过各类分析后,进行语法转换,通过加载不同的Schema语 言,将上述分析后的语法转译成不同的检索语句(步骤S6)。通过语法 转换,可以生成SQL(Structured Query Language,结构化查询语言)检 索语句,在数据库3中进行检索,例如上述检索专利权人是B公司或 者C公司所申请的连接器专利通过语法转换后生成如下所示SQL语 句(片段):
(CONTAINS(PATENT_INFO.TX$ASN_NAME,
‘B or C’)>0 and CONTAINS(PATENT_INFO.TX$PNT_CLAM,
‘Connector’>0)And DECISION_DATE TO_DATE(′2004.1.1′,
′yyyy.mm.dd′)AND TO_DATE(′2004.12.31′,′yyyy.mm.dd′)(步骤S7)。
若需要检索的专利信息在数据库3中并不存在,或者数据库3所 存储的信息不够全面,则可通过语法转换自动生成适合各国专利局网 上数据库检索语法的相关检索语句,直接至各国专利局网上数据库进 行搜索(步骤S8)。此外,通过语法转换还可生成XML(Extensible Markup Language,可扩展标记语言)语句等其它格式的检索语句,以 适应不同类型语法的要求(步骤S9)。
在上述检索语法的转换方法流程中,检索字串可通过语法转换而 自动生成不同格式的代码,其生成方式有两种类型,第一种是将Java 代码嵌入到JavaCC脚本;第二种是利用JJTree(JJTree是一个JavaCC 的插件,通过AST扩充JavaCC生成的解析器)产生动态树结构。
如图3所示,是本发明专利信息检索的语法转换方法的语法树图。 语法树是对检索语法进行语法分析后所生成。上述实施方式中举例: 检索2004年专利权人是B公司或者C公司,且专利范围包含连接器 的所有专利,其检索字串为AN/(B or C)and ACLM/Connector AND ISD/[2004.1.1-2004.12.31],对该检索字串进行语法分析后,则生成如 本图所示的语法树。
本文发布于:2023-03-13 04:25:25,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/69157.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |