G06Q40/03 G06F16/33 G06F16/35 G06F40/194
1.一种信贷制度信息处理方法,包括:
获取信贷制度信息查询申请中的业务要素,所述业务要素包括申请信贷业务的客户信息和业务信息;
根据所述业务要素获得N个第一关键词,N大于或等于1;
将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,所述每条信贷制度预先设置有对应的信贷类别标签和/或信贷规则标签,M大于或等于1;
返回匹配到的至少一条第一信贷制度。
2.根据权利要求1所述的方法,其中,所述将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配包括:
将所述N个第一关键词与所述M条信贷制度的信贷类别标签进行匹配,获得具有被匹配到信贷类别标签的至少一条第二信贷制度;
将所述N个第一关键词与所述至少一条第二信贷制度的信贷规则标签进行匹配,获得具有被匹配到信贷规则标签的至少一条第三信贷制度;
将所述N个第一关键词与所述至少一条第三信贷制度的内容进行匹配,获得所述至少一条第一信贷制度。
3.根据权利要求2所述的方法,其中,所述将所述N个第一关键词与所述至少一条第三信贷制度的内容进行匹配包括:
根据所述N个第一关键词获得第一特征向量;
根据每条第三信贷制度的内容获得对应的第二特征向量;
计算所述第一特征向量与所述每条第三信贷制度对应的第二特征向量之间的相似度。
4.根据权利要求1或2所述的方法,其中,所述M条信贷制度属于S篇规章制度文件,在将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配之前,所述方法还包括:
对所述S篇规章制度文件进行分类,得到每篇规章制度文件的至少一个信贷类别标签,所述每篇规章制度文件包括至少一条信贷制度,S大于或等于1;
根据所述每篇规章制度文件的至少一个信贷类别标签,为所述每条信贷制度设置对应的信贷类别标签。
5.根据权利要求4所述的方法,其中,所述对所述S篇规章制度文件进行分类包括:
对所述每篇规章制度文件中部分或全部内容进行词频计算;
将词频大于或等于预设值的第二关键词与每个信贷类别标签下的字典值进行匹配;
根据匹配到的字典值,确定所述每篇规章制度文件的至少一个信贷类别标签。
6.根据权利要求4所述的方法,其中,在为所述每条信贷制度设置对应的信贷类别标签之后,还包括:
根据所述每条信贷制度的信贷类别标签,对该条信贷制度进行信贷规则提取,其中,不同信贷类别标签之间的信贷规则提取方式相同或不同;
根据所述每条信贷制度的信贷规则提取结果设置对应的信贷规则标签。
7.根据权利要求6所述的方法,其中,根据所述每条信贷制度的信贷规则提取结果设置对应的信贷规则标签包括:
将所述每条信贷制度的信贷规则提取结果标准化处理;
将所述标准化处理后的信贷规则提取结果与至少一个业务要素进行匹配;
根据匹配到的业务要素设置对应的信贷规则标签。
8.一种信贷制度信息处理装置,包括:
业务要素模块,用于获取信贷制度信息查询申请中的业务要素,所述业务要素包括申请信贷业务的客户信息和业务信息;
关键词模块,用于根据所述业务要素获得N个第一关键词,N大于或等于1;
匹配模块,用于将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,所述每条信贷制度预先设置有对应的信贷类别标签和/或信贷规则标签,M大于或等于1;
目标制度返回模块,用于返回匹配到的至少一条第一信贷制度。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1~7中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~7中任一项所述的方法。
11.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~7中任一项所述的方法。
本公开涉及人工智能技术领域,更具体地,涉及一种信贷制度信息处理方法、装置、设备、介质和程序产品。
内控合规管理是商业银行的一项基础性管理工作,合规风险也是信用风险、市场风险、操作风险和其他风险的首要配伍,银行着重确保各项风险管理政策和程序的一致性。
作为银行业防范化解重大风险的重要抓手,内控合规在实践中却面临着许多问题,尤其在信贷领域,信贷从业人员必须根据政策制度文件执行,而目前业务人员在人工或使用通用的搜索引擎寻制度文件时经常遇到“不到、不好、不全面、不完整”等问题,而且信贷制度文件数量繁多,且频繁更新,经常存在交叉覆盖的条目,需人工进行查、比对,降低了业务办理的效率。若到的信贷制度内容不全面、不完整,还会存在因不了解政策制度导致的业务操作信贷风险。
鉴于上述问题,本公开提供了一种实现精准匹配的信贷制度信息处理方法、装置、设备、介质和程序产品。
本公开实施例的一个方面提供了一种信贷制度信息处理方法,包括:获取信贷制度信息查询申请中的业务要素,所述业务要素包括申请信贷业务的客户信息和业务信息;根据所述业务要素获得N个第一关键词,N大于或等于1;将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,所述每条信贷制度预先设置有对应的信贷类别标签和/或信贷规则标签,M大于或等于1;返回匹配到的至少一条第一信贷制度。
根据本公开的实施例,所述将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配包括:将所述N个第一关键词与所述M条信贷制度的信贷类别标签进行匹配,获得具有被匹配到信贷类别标签的至少一条第二信贷制度;将所述N个第一关键词与所述至少一条第二信贷制度的信贷规则标签进行匹配,获得具有被匹配到信贷规则标签的至少一条第三信贷制度;将所述N个第一关键词与所述至少一条第三信贷制度的内容进行匹配,获得所述至少一条第一信贷制度。
根据本公开的实施例,所述将所述N个第一关键词与所述至少一条第三信贷制度的内容进行匹配包括:根据所述N个第一关键词获得第一特征向量;根据每条第三信贷制度的内容获得对应的第二特征向量;计算所述第一特征向量与所述每条第三信贷制度对应的第二特征向量之间的相似度。
根据本公开的实施例,所述M条信贷制度属于S篇规章制度文件,在将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配之前,所述方法还包括:对所述S篇规章制度文件进行分类,得到每篇规章制度文件的至少一个信贷类别标签,所述每篇规章制度文件包括至少一条信贷制度,S大于或等于1;根据所述每篇规章制度文件的至少一个信贷类别标签,为所述每条信贷制度设置对应的信贷类别标签。
根据本公开的实施例,所述对S篇规章制度文件进行分类包括:对所述每篇规章制度文件中部分或全部内容进行词频计算;将词频大于或等于预设值的第二关键词与每个信贷类别标签下的字典值进行匹配;根据匹配到的字典值,确定所述每篇规章制度文件的至少一个信贷类别标签。
根据本公开的实施例,在为所述每条信贷制度设置对应的信贷类别标签之后,还包括:根据所述每条信贷制度的信贷类别标签,对该条信贷制度进行信贷规则提取,其中,不同信贷类别标签之间的信贷规则提取方式相同或不同;根据所述每条信贷制度的信贷规则提取结果设置对应的信贷规则标签。
根据本公开的实施例,根据所述每条信贷制度的信贷规则提取结果设置对应的信贷规则标签包括:将所述每条信贷制度的信贷规则提取结果标准化处理;将所述标准化处理后的信贷规则提取结果与至少一个业务要素进行匹配;根据匹配到的业务要素设置对应的信贷规则标签。
本公开实施例的另一方面提供了一种信贷制度信息处理装置,包括:业务要素模块,用于获取信贷制度信息查询申请中的业务要素,所述业务要素包括申请信贷业务的客户信息和业务信息;关键词模块,用于根据所述业务要素获得N个第一关键词,N大于或等于1;匹配模块,用于将所述N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,所述每条信贷制度预先设置有对应的信贷类别标签和/或信贷规则标签,M大于或等于1;目标制度返回模块,用于返回匹配到的至少一条第一信贷制度。
所述信贷制度信息处理装置包括分别用于执行如上所述任意一项所述的方法的各个步骤的模块。
本公开实施例的另一方面提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行如上所述的方法。
本公开实施例的另一方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行如上所述的方法。
本公开实施例的另一方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如上所述的方法。
上述一个或多个实施例具有如下有益效果:相对于现有技术中人工或者使用通用搜索引擎寻信贷制度信息的方式,预先为每条信贷制度设置对应的信贷类别标签和/或信贷规则标签,根据信贷制度信息查询申请时的N个关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,可以从信贷类别标签、信贷规则标签和规章制度内容中的至少一个维度返回所要查询的目标制度,有效解决现有查、筛选、评估和匹配信贷制度信息时不准确且费时费力的问题,提升了办理效率。
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的信贷制度信息处理方法的应用场景图;
图2示意性示出了根据本公开实施例的信贷制度信息处理方法的流程图;
图3示意性示出了根据本公开实施例的匹配第一关键词的流程图;
图4示意性示出了根据本公开另一实施例的匹配第一关键词的流程图;
图5示意性示出了根据本公开实施例的设置信贷类别标签的流程图;
图6示意性示出了根据本公开实施例的对规章制度文件分类的流程图;
图7示意性示出了根据本公开实施例的设置信贷规则标签的流程图;
图8示意性示出了根据本公开另一实施例的设置信贷规则标签的流程图;
图9示意性示出了根据本公开另一实施例的信贷制度信息处理方法的流程图;
图10示意性示出了根据本公开实施例的信贷制度信息处理装置的结构框图;以及
图11示意性示出了根据本公开实施例的适于实现信贷制度信息处理方法的电子设备的方框图。
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
图1示意性示出了根据本公开实施例的信贷制度信息处理方法的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的用户请求等数据进行分析等处理,并将处理结果(例如根据用户请求获取或生成的网页、信息、或数据等)反馈给终端设备。
需要说明的是,本公开实施例所提供的信贷制度信息处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的信贷制度信息处理装置一般可以设置于服务器105中。本公开实施例所提供的信贷制度信息处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集执行。相应地,本公开实施例所提供的信贷制度信息处理装置也可以设置于不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
以下将基于图1描述的场景,通过图2~图9对本公开实施例的信贷制度信息处理方法进行详细描述。
图2示意性示出了根据本公开实施例的信贷制度信息处理方法的流程图。
如图2所示,该实施例的信贷制度信息处理方法包括操作S210~操作S240。
在操作S210,获取信贷制度信息查询申请中的业务要素,业务要素包括申请信贷业务的客户信息和业务信息。
信贷制度是指有关信贷和信贷业务的各种规定、准则等的总称,可以包括信贷活动的组织,信贷法规和条例的确立,信贷机构的设置等内容。信贷制度信息包括上述信贷机构、组织、信贷法规和条例等内容。用户(如信贷业务人员)可以通过终端设备浏览器输入要查询的信息并发送查询申请。信贷业务包括信贷机构通过放款收回本金和利益的业务,客户信息包括贷款客户的类型、职业、资产情况和贷款用途等信息。业务信息包括贷款种类、贷款期限、放款范围和贷款环节等信息。
在操作S220,根据业务要素获得N个第一关键词,N大于或等于1。
举例说明,根据前台客户经理录入检索信息,如客户编码、客户名称或贷款种类等业务要素,利用客户编码从对应数据库查询出客户类型为“个人客户”,前台录入贷款品种为“法人账户透支业务”,录入页面的“具体期限”等,确定N个第一关键词包括“个人客户、法人账户透支业务、期限”。
在操作S230,将N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,每条信贷制度预先设置有对应的信贷类别标签和/或信贷规则标签,M大于或等于1。
示例性地,响应页面的查询申请,获取前台系统录入的业务要素并提取关键词后,将提取到的关键词输入预先建立的规章制度条目库。该规章制度条目库中包括M条信贷制度,每条信贷制度关联有对应的一个或多个信贷类别标签和/或一个或多个信贷规则标签。
信贷类别标签用于标识各条信贷制度所记载的内容类别,例如根据产品、客户类型、业务环节三大维度进行分类,每个维度下根据具有的业务信息分配对应的类别标签。信贷规则标签用于对各条信贷制度中存在规则进行分类,例如期限规则、利率规则和客户信用等级规则等。
在操作S240,返回匹配到的至少一条第一信贷制度。
例如可以将“个人客户、法人账户透支业务、期限”与信贷类别标签、信贷规则标签和规章制度内容中一个或多个进行匹配,返回匹配结果。该匹配结果可包括具有被命中信贷类别标签、信贷规则标签和规章制度内容中其中一个或者是命中至少两个的制度。
根据本公开的实施例,对于现有技术中人工或者使用通用搜索引擎寻信贷制度信息的方式,预先为每条信贷制度设置对应的信贷类别标签和/或信贷规则标签,根据信贷制度信息查询申请时的N个关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,可以从信贷类别标签、信贷规则标签和规章制度内容中的至少一个维度返回所要查询的目标制度,有效解决现有查、筛选、评估和匹配信贷制度信息时不准确且费时费力的问题,提升办理效率。
图3示意性示出了根据本公开实施例的匹配第一关键词的流程图。
如图3所示,在操作S230将N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配包括操作S310~操作S330。
在操作S310,将N个第一关键词与M条信贷制度的信贷类别标签进行匹配,获得具有被匹配到信贷类别标签的至少一条第二信贷制度。
在一些实施例中,可以将每个第一关键词与每条制度的贷类别标签进行匹配。在另一些实施例中,可以统计M条信贷制度中共存在几类标签,将N个第一关键词与各类标签进行匹配。
如上述存在产品、客户类型、业务环节等维度的标签,将“个人客户、法人账户透支业务、期限”与各维度的标签进行匹配,可以得到个人客户类型的标签。设置有个人客户类型标签的制度为第二信贷制度。
在操作S320,将N个第一关键词与至少一条第二信贷制度的信贷规则标签进行匹配,获得具有被匹配到信贷规则标签的至少一条第三信贷制度。
例如将“个人客户、法人账户透支业务、期限”与每条第二信贷制度的信贷规则标签进行匹配,设置有期限标签的制度为第三信贷制度。
在操作S330,将N个第一关键词与至少一条第三信贷制度的内容进行匹配,获得至少一条第一信贷制度。
在一些实施例中,可以将N个第一关键词在每条第三信贷制度中进行搜索,根据搜索到的关键词数量(如大于某预设阈值)确定是否为第一信贷制度。在另一些实施例中,可以计算N个第一关键词与每条第三信贷制度内容之间的相似度。
根据本公开的实施例,通过对信贷类别标签、信贷规则标签和规章制度内容依次匹配,可以逐渐缩小目标范围,结合类别、规则和内容多个方面的因素来提高所返回制度的准确性。
图4示意性示出了根据本公开另一实施例的匹配第一关键词的流程图。
如图4所示,在操作S330将N个第一关键词与至少一条第三信贷制度的内容进行匹配包括操作S410~操作S430。
在操作S410,根据N个第一关键词获得第一特征向量。
例如获取前台录入的业务要素,生成对应的关键词,形成第一特征向量a={a1,a2,…,an}。
在操作S420,根据每条第三信贷制度的内容获得对应的第二特征向量。
可以提取每条第三信贷制度的内容关键词,形成第二特征向量b={b1,b2,......,bn}。
在一些实施例中,可以对每条第三信贷制度所属的规章制度文件进行tf-idf关键词提取,根据关键词提取结果生成第二特征向量。具体如下。
例如根据tf-idf算法计算并排序得出的关键词组形成特征向量b={b1,b2,......,bn}。针对每条第三信贷制度,进行关键词特征提取,基于tf-idf算法求解已发布的规章制度条目中每个词的tf-idf值。如下公式1):
tf-idf(t,d)=tf(t,d)×idf(t) 式1)
其中,t为词,d为规章制度文件,tf(t,d)为一个词在对应文档中出现的次数,n为文档总数,idf(t)为包含词t的文档个数。
将一份规章制度文件中多个词的tf-idf值按照从大到小的顺序排序,根据排序结果,筛选前5个词(仅为示例)作为该文件的关键词并进行标识,根据上述5个词生成第二特征向量b。
在操作S430,计算第一特征向量与每条第三信贷制度对应的第二特征向量之间的相似度。
计算a、b之间的相似度,那么用ai、bi分别表示a、b中各个关键词的词频,可以采用向量空间模型VSM来计算相似度,如下公式2):
以此类推,逐一将录入查询的特征向量a与规章制度库中的每一个特征向量做相似度计算,从而得出相似度从高到低的政策制度条目排序。
在一些实施例中,可以根据每条规章制度的内容进行关键词识别,将若识别到与信贷类别标签相同或类似的关键词,则设置对应的标签。在另一些实施例中,可以根据每条规章制度所在的文件来确定信贷类别标签。以下通过图5和图6进一步说明。
图5示意性示出了根据本公开实施例的设置信贷类别标签的流程图。
在操作S230将N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配之前,如图5所示,该实施例的设置信贷类别标签包括操作S510~操作S520。
在操作S510,对S篇规章制度文件进行分类,得到每篇规章制度文件的至少一个信贷类别标签,每篇规章制度文件包括至少一条信贷制度,S大于或等于1。M条信贷制度属于S篇规章制度文件。
S篇规章制度文件包括来自各个相关部门发布的信贷制度条目,每篇文件可能从多个维度进行信贷制度的制定,所以根据每篇文件中的信贷制度内容可以具有一个或多个信贷类别标签。例如可以对整篇文件利用自然语言处理(NLP)技术进行文档主题识别来确定标签。又例如可以对整篇文件进行词频计算,根据关键词来确定标签。
图6示意性示出了根据本公开实施例的对规章制度文件分类的流程图。
如图6所示,在操作S510,对S篇规章制度文件进行分类包括操作S610~操作S630。
在操作S610,对每篇规章制度文件中部分或全部内容进行词频计算。
在对部分内容进行词频计算时,可以对各个章节内容分别计算。
在操作S620,将词频大于或等于预设值的第二关键词与每个信贷类别标签下的字典值进行匹配。
在操作S630,根据匹配到的字典值,确定每篇规章制度文件的至少一个信贷类别标签。
示例性地,根据产品、客户类型、业务环节三大维度进行分类,每个分类对应一级标签,每个类别下从数据库采集对应字典值(比如产品大类下,包括营运资金贷款、项目贷款、一般法人透支贷款等等字典值,客户类型下包括法人客户、机构客户、小企业客户、个人客户等字典值,业务环节包括评级、授信、业务办理等字典值)。对结构化的规章制度进行词频计算,提取出现次数最多或大于或等于预设值的第二关键词进行大类匹配和分类,并使用定义的一级标签和具体类别进行数据标注,例如产品大类-项目贷款类别标签、客户类型大类-法人客户类别标签和业务环节大类-授信类别标签等。
在操作S520,根据每篇规章制度文件的至少一个信贷类别标签,为每条信贷制度设置对应的信贷类别标签。
示例性地,在一篇规章制度文件具有一个信贷类别标签时,可以对该文件中所有条目赋予该标签。在一篇规章制度文件具有多个信贷类别标签时,可以根据各个信贷类别标签的来源内容(如各个章节),对其中条目赋予对应的标签。
根据本公开的实施例,可能存在一条信贷制度的内容较少的情况,不能给出足够的信息进行分类。而考虑到每篇规章制度文件的内容具有充分的信息,能够体现出文章主题等,因此从一篇规章制度文件入手实现信贷类别标签的设置可以更准确。
图7示意性示出了根据本公开实施例的设置信贷规则标签的流程图。
在操作S520为每条信贷制度设置对应的信贷类别标签之后,如图7所示,该实施例的设置信贷规则标签包括操作S710~操作S720。
在操作S710,根据每条信贷制度的信贷类别标签,对该条信贷制度进行信贷规则提取,其中,不同信贷类别标签之间的信贷规则提取方式相同或不同。
以项目贷款类别标签和授信类别标签举例,两者属于产品和业务环节不同的大类,且类别差异较大,对于贷款客户存在不同的信贷规则要求,满足各自的信贷规则才能放款。例如项目贷款具有项目种类、研发人员背景、项目内容和年限等信贷规则,而授信环节具有逾期要求、现金流要求、经营状况良好和财务状况良好等信贷规则,由于信贷规则的特点不同,因此具有不同的解析方式,即信贷规则提取方式。
而对于同大类下的不同信贷类别,可能具有相同的信贷规则提取方式,可依实际情况针对性选择。
在操作S720,根据每条信贷制度的信贷规则提取结果设置对应的信贷规则标签。信贷规则提取结果包括每条信贷制度所含有的信贷规则内容。
根据本公开的实施例,通过信贷规则内容设置对应的信贷规则标签,可以在查询时一定程度上实现对信贷规则的匹配,能够更精准的返回用户所要了解的信贷制度信息。
图8示意性示出了根据本公开另一实施例的设置信贷规则标签的流程图。
如图8所示,在操作S720根据每条信贷制度的信贷规则提取结果设置对应的信贷规则标签包括操作S810~操作S830。
在操作S810,将每条信贷制度的信贷规则提取结果标准化处理。
举例说明,比如针对“法人账户透支额度有效期最长不超过2年。透支额度在有效期内可循环使用,透支额度有效期满后不得再发生新的透支。法人账户透支期限是客户实际透支的具体期限,最长不得超过3个月”这条制度条目,进行规则提取。
信贷规则提取结果为“法人账户透支额度有效期最长不超过2年”、“法人账户透支期限是客户实际透支的具体期限,最长不得超过3个月”,标准化处理后,为规则“法人账户透支额度有效期≤2年,法人账户透支期限≤3个月”。
在操作S820,将标准化处理后的信贷规则提取结果与至少一个业务要素进行匹配。
可以将标注化处理后的信贷规则匹配业务要素打信贷规则标签作为二级标签,如详细的业务要素,比如融资期限、融资利率、客户信用等级等。
在操作S830,根据匹配到的业务要素设置对应的信贷规则标签。
在一些实施例中,如匹配二级标签为“期限”,详细规则标签为“法人账户透支额度有效期≤2年,法人账户透支期限≤3个月”。在另一些实施例中,可以仅以二级标签“期限”作为信贷规则标签。
根据本公开的实施例,规章制度中通过文字描述的信贷规则可能导致无法被精准搜索到,因此将规则内容标准化处理,并设置对应的标签,更有利于对信贷制度信息的准确查询。
图9示意性示出了根据本公开另一实施例的信贷制度信息处理方法的流程图。
如图9所示,该实施例的信贷制度信息处理方法包括操作S910~操作S960。
在操作S910,数据采集。
示例性地,接入、处理和存储监管机构及各单位发布的政策制度信息,如规章制度文件。对已发布的规章制度文件进行文本预处理(清洗脏数据),再进行结构化处理,将不同格式的制度文件中相同的信息提取出来填入固定模板,方便后续识别。
由于不同机构、单位或部门发布的规章制度文件格式和制度内容不同,因此将不同来源的规章制度文件进行结构化处理,可以提高形成规章制度条目库的效率。
在操作S920,分类存储。
可以参照图5和图6对应的实施例对预处理后的S篇规章制度文件进行分类,并给每条信贷制度设置对应的信贷类别标签。最后将各条制度信贷及对应的一级标签(信贷类别标签)进行存储。
示例性地,获取银行制度文件《公司客户法人账户透支业务管理办法》将其按照章节、段落进行文本预处理、切割和结构化处理,形成固定格式的制度文本,对整个文本进行词频计算,得出该文件词频最高的关键词为“法人账户透支业务”,与一级标签“产品”下的字典值“法人账户透支业务”匹配成功,将此文本存储在产品大类模块下。
在操作S930,规则提取。
可以参照图7和图8的实施例,对各规章制度文件进行文本切割形成规章制度条目,逐条目进行信贷规则提取,匹配并标记二级标签(信贷规则标签)。最后将二级标签及对应的规章条目进行存储。
在操作S940,关键词提取。
对操作S920生成的规章制度文本进行词频计算提取,比如《公司客户法人账户透支业务管理办法》文件中总则的某条制度:
公司客户法人账户透支(以下简称“法人账户透支”)是根据公司客户申请,核定其账户透支额度,允许其在结算账户存款不足以支付时,在核定的透支额度内直接透支取得信贷资金的一种短期融资方式。
基于tf-idf算法得出每个词的tf-idf(t,d)值并排序,可以得出关键词为“透支、法人账户透支、公司客户、账户、透支额度”。
尤其说明,可以根据一级标签,设置对应的词频计算规则,优先考虑与一级标签匹配的关键词。
通过操作910~操作S940,可以得到存储有各条信贷制度、信贷类别标签、信贷规则标签和关键词提取结果的规章制度条目库。
在操作S950,查询匹配。
响应页面的查询申请,获取前台系统录入的业务要素,提取关键词(如前述获取关键词“公司客户、法人账户透支业务、期限”),将提取到的关键词输入预先建立的规章制度条目库,先与一级标签进行匹配计算,到对应的大类。再与已发布规章制度所具有的二级标签、关键词分别做基于词向量的相似度计算,查询与待办理业务相关的规章制度条目。
例如根据业务要素提取关键词,获得特征向量a。对于每条信贷制度,根据一级标签和/或该一级标签下,及二级标签和/或该二级标签下的具体标签,获得特征向量b。根据操作S940的关键词提取结果获得特征向量c。将特征向量a依次与特征向量b和c之间计算相似度,参照图3和图4的实施例。
在操作S960,结果推送。
获取匹配的规章制度条目,按照相似度排序并推送至前台的参考政策界面,将相似度高的结果对应的制度条目及制度文件在前展示,并支持通过超链接形式查看政策条目对应原文。
根据本公开的实施例,可将规章制度处理成业务维度、以客户为中心、逻辑统一、内容丰富的制度条款案例,可根据与系统展示的要素关键词,从规章制度条目库获取与查询申请操作匹配的制度条款案例,能快速帮助用户快速、精准地匹配出对应的政策制度政策,有效解决现有查、筛选、评估和匹配费时费力的问题,更好地为用户服务,确保用户清晰了解业务规范要点和办理要求,提升办理效率。
基于上述信贷制度信息处理方法,本公开还提供了一种信贷制度信息处理装置。以下将结合图10对该装置进行详细描述。
图10示意性示出了根据本公开实施例的信贷制度信息处理装置的结构框图。
如图10所示,该实施例的信贷制度信息处理装置1000包括业务要素模块1010、关键词模块1020、匹配模块1030和目标制度返回模块1040。
业务要素模块1010可以执行操作S210,用于获取信贷制度信息查询申请中的业务要素,业务要素包括申请信贷业务的客户信息和业务信息。
关键词模块1020可以执行操作S220,用于根据业务要素获得N个第一关键词,N大于或等于1。
根据本公开的实施例,关键词模块1020还用于对规章制度文件进行关键词提取。
匹配模块1030可以执行操作S230,用于将N个第一关键词与M条信贷制度中每条信贷制度的信贷类别标签、信贷规则标签和规章制度内容中至少一个进行匹配,每条信贷制度预先设置有对应的信贷类别标签和/或信贷规则标签,M大于或等于1。
根据本公开的实施例,匹配模块1030还可以执行操作S310~操作S330,操作S410~操作S430,在此不做赘述。
目标制度返回模块1040可以执行操作S240,用于返回匹配到的至少一条第一信贷制度。
根据本公开的实施例,信息处理装置1000还可以包括数据采集模块,用于对已发布的规章制度文件进行文本预处理和结构化处理。
根据本公开的实施例,信息处理装置1000还可以包括分类存储模块,该模块可以执行操作S510~操作S520,操作S610~操作S630,在此不做赘述。
根据本公开的实施例,信息处理装置1000还可以包括规则提取模块,该模块可以执行操作S710~操作S720,操作S810~操作S830,在此不做赘述。
需要说明的是,信息处理装置1000包括分别用于执行如上图2~图9描述的任意一个实施例的各个步骤的模块。装置部分实施例中各模块/单元/子单元等的实施方式、解决的技术问题、实现的功能、以及达到的技术效果分别与方法部分实施例中各对应的步骤的实施方式、解决的技术问题、实现的功能、以及达到的技术效果相同或类似,在此不再赘述。
根据本公开的实施例,业务要素模块1010、关键词模块1020、匹配模块1030和目标制度返回模块1040中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。
根据本公开的实施例,业务要素模块1010、关键词模块1020、匹配模块1030和目标制度返回模块1040中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,业务要素模块1010、关键词模块1020、匹配模块1030和目标制度返回模块1040中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图11示意性示出了根据本公开实施例的适于实现信贷制度信息处理方法的电子设备的方框图。
如图11所示,根据本公开实施例的电子设备1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1103中,存储有电子设备1100操作所需的各种程序和数据。处理器1101、ROM 1102以及RAM 1103通过总线1104彼此相连。处理器1101通过执行ROM 1102和/或RAM1103中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM 1102和RAM 1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备1100还可以包括输入/输出(I/O)接口1105,输入/输出(I/O)接口1105也连接至总线1104。电子设备1100还可以包括连接至I/O接口1105的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1106。包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107。包括硬盘等的存储部分1108。以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的。也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1102和/或RAM 1103和/或ROM 1102和RAM 1103以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机系统中运行时,该程序代码用于使计算机系统实现本公开实施例所提供的方法。
在该计算机程序被处理器1101执行时执行本公开实施例的系统/装置中限定的上述功能。根据本公开的实施例,上文描述的系统、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分1109被下载和安装,和/或从可拆卸介质1111被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被处理器1101执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。
本文发布于:2023-04-15 08:48:25,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/87175.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |