G06F16/35 G06F16/33 G06F16/338
1.一种专利自动分类系统,包括服务器(1)、客户端(2)及连接所述服务器(1)与所述客户端(2)的网络,其特征在于,所述服务器包括总数据库(11)、检测模块(12)、自动配对模块(13),所述检测模块用于检测所述总数据库(11)新增的专利文件,所述总数据库具有若干的分类数据库,启动所述自动配对模块(13),对新增的所述专利文件根据不同的预设分类条件进行分类,所述新增的专利被分配至不同的分类数据库中,所述服务器还包括关联度计算模块(14),所述客户端包括显示模块(22)、搜索模块(21),所述搜索模块连接至单个分类数据库中或者总数据库中,所述显示模块(22)将所述搜索模块(21)的结果依据关联度计算模块计算结果对专利进行排序,所述关联度计算模块(14)可根据相关度的不同得出每个专利的相关值,其中每个词的词频设为a(a1,a2..,an)、词在专利全文中的不同位置的权重设为w(w1,w2…wn),得出的相关度为X,计算公式如下:
X=a1*w1+a2*w2+a3*w3+…+an*wn,
其中w1+w2+…+wn=100%。
2.根据权利要求1所述的专利自动分类系统,其特征在于,所述预设分类条件的种类大于等于分类数据库的数量。
3.根据权利要求2所述的专利自动分类系统,其特征在于,所述预设分类条件为关键字的组合或者关键与分类号的组合。
4.根据权利要求1或2所述的专利自动分类系统,其特征在于,所述预设分类条件为申请人、申请年份、技术领域中一个。
5.根据权利要求1所述的专利自动分类系统,其特征在于,X=a1*w1+a2*w2,所述w1为说明书内容a1的权值,w2为权利要求书内容a2的权值。
6.根据权利要求1所述的专利自动分类系统,其特征在于,X=a1*w1+a2*w2+a3*w3+a4*w4+a5*w5,技术领域a1的权值为w1,背景技术a2的权值为w2,发明内容a3的权值为w3,具体实施方式a4的权值为w4,权利要求书a5的权值为w5。
7.根据权利要求1所述的专利自动分类系统,其特征在于,所述网络(3)为企业内部网或互联网。
8.根据权利要求1所述的专利自动分类系统,其特征在于,所述客户端(2)还具有下载模块(23)、本地数据库(24),所述下载模块(23)根据用户的指令下载专利至本地数据库(24)。
9.根据权利要求1所述的专利自动分类系统,其特征在于,X=a1*w1+a2*w2+a3*w3+a4*w4+a5*w5+a6*w6,技术领域a1的权值为w1,背景技术a2的权值为w2,发明内容a3的权值为w3,具体实施方式a4的权值为w4,独立权利要求a5的权值为w5,从属权利要求a6的权值为w6。
10.根据权利要求1所述的专利自动分类系统,其特征在于,所述预设分类条件的数量小于分类数据库的数量。
本发明涉及数据自动分类,特别涉及一种专利自动分类系统。
随着研发技术越来越来越发达,企业对专利的监控也越来越重视,越来越多的企业会建立自己的专利数据库。专利数据库可以方便企业了解自己专利的同时,也能让企业了解关注竞争对手的专利情况,对于产品在不同维度去分析专利分布情况,如各个不同的时间段、产品不同的模块、不同的用户语言去得出竞争对手的专利分布情况。但是专利数量庞大的数据库,企业使用起来不方便,数据库的专利杂乱无章,用户不能快速地到自己想要的结果,耗时耗力,维护繁琐。而且在用户通过关键字在数据库中检索时,不能及时得到目标专利,久而久之,使得企业数据库形同虚设。由此可见,提供一种专利自动分类系统及方法是本领域亟需解决的问题。
本发明针对上述问题,提供一种专利自动分类系统,包括服务器、客户端及连接所述服务器与所述客户端的网络,所述服务器包括总数据库、检测模块、自动配对模块,所述检测模块用于检测所述总数据库新增的专利文件,所述总数据库具有若干的分类数据库,启动所述自动配对模块,对新增的所述专利文件根据不同的预设分类条件进行分类,所述新增的专利被分配至不同的分类数据库中,所述服务器还包括关联度计算模块,所述客户端包括显示模块、搜索模块,所述搜索模块连接至单个分类数据库中或者总数据库中,所述显示模块将所述搜索模块的结果依据关联度计算模块计算结果对专利进行排序,所述关联度计算模块可根据相关度的不同得出每个专利的相关值,其中每个词的词频设为a(a1,a2..,an)、词在专利全文中的不同位置的权重设为w
(w1,w2…wn),得出的相关度为X,计算公式如下:
X=a1*w1+a2*w2+a3*w3+…+an*wn,
其中w1+w2+…+wn=100%。
进一步的,本发明提供的所述预设分类条件的种类大于等于分类数据库的数量。
进一步的,所述预设分类条件为关键字的组合或者关键与分类号的组合。
进一步的,所述预设分类条件为申请人、申请年份、技术领域中一个。
进一步的,X=a1*w1+a2*w2,所述w1为说明书内容a1的权值,w2为权利要求书内容a2的权值。
进一步的,X=a1*w1+a2*w2+a3*w3+a4*w4+a5*w5,技术领域a1的权值为w1,背景技术a2的权值为w2,发明内容a3的权值为w3,具体实施方式a4的权值为w4,权利要求书a5的权值为w5。
进一步的,所述网络为企业内部网或互联网。
进一步的,所述客户端还具有下载模块、本地数据库,所述下载模块根据用户的指令下载专利至本地数据库。
进一步的,X=a1*w1+a2*w2+a3*w3+a4*w4+a5*w5+a6*w6,技术领域a1的权值为w1,背景技术a2的权值为w2,发明内容a3的权值为w3,具体实施方式a4的权值为w4,独立权利要求a5的权值为w5,从属权利要求a6的权值为w6。
进一步的,所述预设分类条件的数量小于分类数据库的数量。
再者,本发明方案中的专利自动分类系统对于新增的专利做分类,并且使用者可根据需要在分类数据库、总数据库中做检索,切换自如,使用方便,同时显示模块根据相关度排序显示专利,方便使用者快速到目标专利。
图1是本发明专利自动分类系统的结构框图。
图2是本发明专利分类过程的结构框图。
参见图1至图2,给出了本发明中专利自动分类系统的示意图。所述专利自动分类系统包括服务器1、客户端2及连接所述服务器1与所述客户端2的网络。网络可以是企业内部网,也可以是互联网或其他类型通讯网络。
所述服务器1包括总数据库11、检测模块12、自动配对模块13、关联度计算模块14。所述检测模块12检测所述总数据库11中增加了新的专利文件,启动所述自动配对模块13进行根据预设的分类条件对专利进行分类,新增的专利文件根据不同的预设分类条件可以被分类至不同的分类数据库中。预设的分类条件可以不同的申请人、不同的申请年份、不同的产品领域、同一产品领域下不同的产品类型等。以同一产品领域下不同的产品类型为例,电动工具的种类有很多,有电锤、电钻、砂光机、角磨、往复锯等等。以砂光机为例,一种分类条件为:将权利要求书中具有包含砂、磨关键字的专利分配至砂光机中,另一种分类条件为:将专利全文中包含砂、磨,并且分类号为B24B或B25F的专利分配至砂光机中。一种分类条件是关键字的组合,一种分类条件是关键字和分类号的组合,符合两种不同类型的分类条件可被分配至同一分类数据库中,预设的分类条件的种类不少于分类数据库的数量。最后将不符合任何分类条件的专利分配至其他专利数据库D中,所以分类条件的数量小于分类数据库的数量。对于其他专利数据库中的数据进行人工分类。通过不同种类的分类条件分配只同一分类数据库,可以防止分类错误,减少分配至其他专利数据库D的数量,从而降低了人工工作量。但是,如果以不同的申请人作为预设的分类条件,那么预设的分来条件的种类等于分类数据库的数量。以申请人为例,一个公司可能有多个分公司,所以同一家公司有不同的专利申请人,所以在专利分类时,都是以公司名称作为分类条件,属于同一种类的分类条件,那么预设分类条件的种类等于分类数据库的数量。
客户端2包括搜索模块21、显示模块22、下载模块23、本地数据库24,所述搜索模块21具有不同的搜索条目,根据单个搜索条目或者不同搜索条目的组合进行检索专利,所述搜索模块链接至分类数据库中或者总数据库11中,并调取分类数据库中或者总数据库11的数据,显示模块22可显示检索到的专利,同时用户可根据需要通过下载模块23下载需要的专利至本地数据库24。用户可根据需要选择在不同的数据库中搜索相关专利,比如在已经分类好的申请人中搜索专利了解特定申请人的的专利申请情况,通过不同的搜索条目或不同的搜索条目的组合进行从不同维度去分析申请人的专利分布情况,所述搜索条目为申请人、申请时间、分类号、法律状态等。当用不同的关键字去检索时,关联度计算模块14可根据相关度的不同得出每个专利的相关值,其中每个词的词频a(a1,a2..,an)、词在不同位置的权重w(w1,w2…wn),得出的相关度X。计算公式如下:相关度:
X=a1*w1+a2*w2+a3*w3+…+an*wn,
其中w1+w2+…+wn=100%,在显示模块,显示专利的同时显示每件专利的相关值。在专利全文的不同位置设定不同的权值,即在说明书标题、说明书内容、权利要求书、说明书摘要设定不同的权值,举例说明,设定说明书内容的权值为30%,权利要求书的权值为60%,说明书摘要的权值为10%,根据关键词在不同位置的词频与权重的乘积相加得出相关度。优选地,将说明书内容部门再细分,即将说明书中的技术领域、背景技术、发明内容、具体实施方式部分与权利要求书、标题、权利要求书的词频乘以权值后相加得出相关度。并且,显示模块根据不同的相关值的大小对专利进行排序,方便使用者快速地出目标专利,省时省力。也可以有其他的设定权值的方法,只要是专利文件中的内容都可以单独设定一个权值。例如可以将权利要求部分的权值再具体,例如给独立权力要求、从属权利要求设定不同的权值。
本发明方案中的专利自动分类系统对于新增的专利做分类,并且使用者可根据需要在分类数据库、总数据库中做检索,切换自如,使用方便,同时显示模块根据相关度排序显示专利,方便使用者快速到目标专利。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
本文发布于:2023-03-13 00:52:40,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/68648.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |