一种基于反欺诈变量与决策结果的案件定性方法及系统

阅读: 评论:0

著录项
  • CN202010657756.9
  • 20200709
  • CN111861702A
  • 20201030
  • 睿智合创(北京)科技有限公司
  • 王玉海;雷军;罗耀东
  • G06Q40/02
  • G06Q40/02 G06K9/62

  • 北京市密云区鼓楼东大街3号山水大厦3层313室-2360(云创谷经济开发中心集中办公区)
  • 北京(11)
  • 北京冠和权律师事务所
  • 张楠楠
摘要
本发明公开了一种基于反欺诈变量与决策结果的案件定性方法及系统,方法包括:获取银行或金融机构的信贷申请信息;根据所述信贷申请信息通过决策系统获取决策结果和决策原因码;根据所述信贷申请信息通过反欺诈变量加工平台获取反欺诈变量信息;案件系统根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值;将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果。可以有效提高银行以及金融机构的申请欺诈防范能力、降低案件调查成本、加强系统自动化水平;同时实现数据共享机制,消除数据孤岛带来的不良影响。
权利要求

1.一种基于反欺诈变量与决策结果的案件定性方法,其特征在于,包括:

获取银行或金融机构的信贷申请信息;

根据所述信贷申请信息通过决策系统获取决策结果和决策原因码;

根据所述信贷申请信息通过反欺诈变量加工平台获取反欺诈变量信息;

案件系统根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值;

将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果。

2.如权利要求1所述的基于反欺诈变量与决策结果的案件定性方法,其特征在于,所述根据所述信贷申请信息通过反欺诈变量加工平台获取反欺诈变量信息,包括:

根据所述信贷申请信息通过关联网络系统获取欺诈交易申请的关联关系信息;

根据所述信贷申请信息通过中文模糊匹配系统获取所述与信贷申请信息的匹配信息;所述匹配信息包括地址匹配信息;

根据所述信贷申请信息、欺诈交易申请的关联关系信息及与信贷申请信息的匹配信息通过反欺诈变量加工平台生成反欺诈变量信息。

3.如权利要求1所述的基于反欺诈变量与决策结果的案件定性方法,其特征在于,对案件定性模型的训练方法包括:

获取样本案件的数据特征值,通过随机森林的方法对样本案件的数据特征值进行计算,标注样本案件关键属性标签及标注样本案件定性结果;

将样本案件的数据特征值输入案件定性模型中,将案件定性模型输出的样本案件关键属性标签及样本案件定性结果分别与标注样本案件关键属性标签及标注样本案件定性结果进行对比,在对比结果为不一致时,不断更新优化案件定性模型的模型参数,直到对比结果一致时,得到训练好的案件定性模型。

4.如权利要求1所述的基于反欺诈变量与决策结果的案件定性方法,其特征在于,所述输出案件关键属性标签及案件定性结果后,还包括:

根据所述案件定性结果,获取案件定性结果为欺诈案件的第一数据集;

对所述第一数据集中不同欺诈案件的相同特征属性进行叠加并进行排序;

选取叠加值最大的P个特征属性,并获取P个特征属性所述对应的信贷申请信息;

将P个特征属性及P个特征属性所述对应的信贷申请信息放入黑名单库;

将P个特征属性及P个特征属性所述对应的信贷申请信息放入先验数据库:

在接收到信贷申请信息时,判断所述信贷申请信息是否包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息;

在确定信贷申请信息包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息,则确定所述信贷申请信息对应的案件为欺诈案件;反之,通过案件定性模型检验所述信贷申请信息对应的案件是否为欺诈案件。

5.如权利要求1所述的基于反欺诈变量与决策结果的案件定性方法,其特征在于,所述特征转换处理,包括:

判断进行特征转换处理的信息类别是否为反欺诈变量信息;

在确定进行特征转换处理的信息类别为反欺诈变量信息时,判断反欺诈变量信息是否为第一类反欺诈变量信息,在确定为第一类反欺诈变量信息时,进行数字化转换;在确定为第二类反欺诈变量信息时,使用非线性转换法;所述第一类反欺诈变量信息包括:内部黑名单类,一致性比对类,模糊匹配相关衍生变量,勾稽校验类,部分组网变量;所述第二类反欺诈变量信息包括:历史比对类,多人共用类,人行比对类,设备属性类,设备注册行为类,设备登录行为类,设备申请行为类,设备提现行为类;

在确定进行特征转换处理的信息类别为非反欺诈变量信息时,使用One-hot编码型特征值转换。

6.如权利要求1所述的基于反欺诈变量与决策结果的案件定性方法,其特征在于,对案件定性模型的训练方法,包括:

获取样本案件的数据特征值并根据所述样本案件关键属性标签分类,得到样本案件定性分类集合D;

D={(x1,y1),(x2,y2),...(xN,yN)}

其中,xi为样本案件的F维的特征向量对应的数据特征值;yi为样本案件关键属性标签;yi∈{1,2,...,K},K为常数;i=1,2,3...N;

在样本案件中有放回的抽取大小和D一样的训练集,作为根节点的训练样本;从根节点进行训练,判断当前节点是否满足终止条件;在确定当前节点满足终止条件时,设置当前节点为叶子节点;在确定当前节点不满足终止条件时,则从样本案件的F维的特征向量中无放回的随机选取f维特征向量,其中,F>f;根据选取的f维特征向量获取分类特征信息;所述分类特征信息包括训练阈值th;

当前节点上的训练结果小于训练阈值th的样本案件被划分到左节点,当前节点上的训练结果大于等于阈值th的样本案件被划分到右节点;

继续训练其他节点,直到通过随机森林方法构建的所有树都输出样本案件关键属性标签,得到案件定性模型的模型参数;

yN+1=argmaxp*c(yN+1|xN+1)

其中,c为叶子节点的预测输出为当前节点样本案件集合中数量最多的类别;p为c占当前节点样本案件集合的比例;xN+1为输入案件定性模型的案件的F维的特征向量对应的数据特征值;yN+1为输出的案件关键属性标签。

7.如权利要求6所述的基于反欺诈变量与决策结果的案件定性方法,其特征在于,所述将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果,包括:

案件系统获取决策系统和反欺诈变量加工平台输入的xN+1并输入至案件定性模型中,输出案件关键属性标签,并根据预设规则对案件关键属性标签进行排序;

获取对案件关键属性标签影响最大的反欺诈因子z,计算案件关键属性标签的分值并根据分值进行排序:

SZ=WZ*100

其中,SZ案件关键属性标签的分值;为WZ为反欺诈因子的得分占比;

根据案件关键属性标签及案件关键属性标签的分值排序信息,得到案件定性结果。

8.一种基于反欺诈变量与决策结果的案件定性系统,其特征在于,包括:

数据获取系统,用于获取银行或金融机构的信贷申请信息;

决策系统,用于根据所述信贷申请信息得到决策结果和决策原因码;

反欺诈变量加工平台,用于根据所述信贷申请信息得到反欺诈变量信息;

案件系统,用于:

根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值;

将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果。

说明书
技术领域

本发明涉及数据处理技术领域,特别涉及一种基于反欺诈变量与决策结果的案件定性方法及系统。

随着移动互联网技术的不断发展,越来越多的金融机构开通了互联网服务渠道,充分利用互联网、大数据、云计算等科技手段开展差异化竞争;越来越多的消费者选择通过手机终端,借助移动互联网办理金融信贷业务。互联网助推了金融行业的繁荣,也培养了消费者先进的移动支付理念,然而在经历了几年的快速发展之后,风险隐患也逐渐暴露出来,监管层对移动互联网金融行业的监管也越来越重视,如何确保互联网金融安全性、识别欺诈并有效的防范欺诈交易是银行业乃至监管层亟待解决的问题。为有效破解这一难题,目前开展互联网业务的传统商业银行及民营银行、国内持牌消费金融公司、互金机构均在不同程度上自行研发或通过第三方公司引入了反欺诈系统平台,在防范欺诈交易方面起到了非常重要的作用。

然而,目前来说,存在以下问题:1、互联网科技在案调系统领域渗透度低,银行案调相关机构的风控水平参差不齐,很多机构采用线下人工的传统案件调查方式,缺乏互联网科技的应用与助力,在案调风控成本、风控质量、风控时效性上均无法满足实际的业务需求。2、传统的反欺诈案件调查方式受调查资料无法与审批系统通联、调查记录无法统一留存、欺诈案件数据不易分析等因素限制,已不适用于当前专业性案件频发的欺诈环境。3、互联网金融行业数据“孤岛”现象严重,缺乏数据共享机制,不同的互联网金融机构会接存储有大量的借款申请信息,但由于市场缺乏共享机制,金融机构的申请信息难以共通,不少机构获知有关借款人的信用数据,特别是强金融属性数据的难度非常大,一方面导致机构无法有效判断客户的风险等级,另一方面也导致多头负债现象频生。

本发明旨在至少一定程度上解决上述技术中的技术问题之一。为此,本发明的第一个目的在于提出一种基于反欺诈变量与决策结果的案件定性方法,可以有效提高银行以及金融机构的申请欺诈防范能力、降低案件调查成本、加强系统自动化水平;同时实现数据共享机制,消除数据孤岛带来的不良影响。

本发明的第二个目的在于提出一种基于反欺诈变量与决策结果的案件定性系统。

为达到上述目的,本发明第一方面实施例提出了一种基于反欺诈变量与决策结果的案件定性方法,包括:

获取银行或金融机构的信贷申请信息;

根据所述信贷申请信息通过决策系统获取决策结果和决策原因码;

根据所述信贷申请信息通过反欺诈变量加工平台获取反欺诈变量信息;

案件系统根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值;

将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果。

根据本发明的一些实施例,所述根据所述信贷申请信息通过反欺诈变量加工平台获取反欺诈变量信息,包括:

根据所述信贷申请信息通过关联网络系统获取欺诈交易申请的关联关系信息;

根据所述信贷申请信息通过中文模糊匹配系统获取所述与信贷申请信息的匹配信息;所述匹配信息包括地址匹配信息;

根据所述信贷申请信息、欺诈交易申请的关联关系信息及与信贷申请信息的匹配信息通过反欺诈变量加工平台生成反欺诈变量信息。

根据本发明的一些实施例,对案件定性模型的训练方法包括:

获取样本案件的数据特征值,通过随机森林的方法对样本案件的数据特征值进行计算,标注样本案件关键属性标签及标注样本案件定性结果;

将样本案件的数据特征值输入案件定性模型中,将案件定性模型输出的样本案件关键属性标签及样本案件定性结果分别与标注样本案件关键属性标签及标注样本案件定性结果进行对比,在对比结果为不一致时,不断更新优化案件定性模型的模型参数,直到对比结果一致时,得到训练好的案件定性模型。

根据本发明的一些实施例,所述输出案件关键属性标签及案件定性结果后,还包括:

根据所述案件定性结果,获取案件定性结果为欺诈案件的第一数据集;

对所述第一数据集中不同欺诈案件的相同特征属性进行叠加并进行排序;

选取叠加值最大的P个特征属性,并获取P个特征属性所述对应的信贷申请信息;

将P个特征属性及P个特征属性所述对应的信贷申请信息放入黑名单库;

将P个特征属性及P个特征属性所述对应的信贷申请信息放入先验数据库:

在接收到信贷申请信息时,判断所述信贷申请信息是否包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息;

在确定信贷申请信息包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息,则确定所述信贷申请信息对应的案件为欺诈案件;反之,通过案件定性模型检验所述信贷申请信息对应的案件是否为欺诈案件。

根据本发明的一些实施例,所述特征转换处理,包括:

判断进行特征转换处理的信息类别是否为反欺诈变量信息;

在确定进行特征转换处理的信息类别为反欺诈变量信息时,判断反欺诈变量信息是否为第一类反欺诈变量信息,在确定为第一类反欺诈变量信息时,进行数字化转换;在确定为第二类反欺诈变量信息时,使用非线性转换法;所述第一类反欺诈变量信息包括:内部黑名单类,一致性比对类,模糊匹配相关衍生变量,勾稽校验类,部分组网变量;所述第二类反欺诈变量信息包括:历史比对类,多人共用类,人行比对类,设备属性类,设备注册行为类,设备登录行为类,设备申请行为类,设备提现行为类;

在确定进行特征转换处理的信息类别为非反欺诈变量信息时,使用One-hot编码型特征值转换。

根据本发明的一些实施例,对案件定性模型的训练方法,包括:

获取样本案件的数据特征值并根据所述样本案件关键属性标签分类,得到样本案件定性分类集合D;

D={(x1,y1),(x2,y2),...(xN,yN)}

其中,xi为样本案件的F维的特征向量对应的数据特征值;yi为样本案件关键属性标签;yi∈{1,2,...,K},K为常数;i=1,2,3...N;

在样本案件中有放回的抽取大小和D一样的训练集,作为根节点的训练样本;从根节点进行训练,判断当前节点是否满足终止条件;在确定当前节点满足终止条件时,设置当前节点为叶子节点;在确定当前节点不满足终止条件时,则从样本案件的F维的特征向量中无放回的随机选取f维特征向量,其中,F>f;根据选取的f维特征向量获取分类特征信息;所述分类特征信息包括训练阈值th;

当前节点上的训练结果小于训练阈值th的样本案件被划分到左节点,当前节点上的训练结果大于等于阈值th的样本案件被划分到右节点;

继续训练其他节点,直到通过随机森林方法构建的所有树都输出样本案件关键属性标签,得到案件定性模型的模型参数;

yN+1=argmaxp*c(yN+1|xN+1)

其中,c为叶子节点的预测输出为当前节点样本案件集合中数量最多的类别;p为c占当前节点样本案件集合的比例;xN+1为输入案件定性模型的案件的F维的特征向量对应的数据特征值;yN+1为输出的案件关键属性标签。

根据本发明的一些实施例,所述将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果,包括:

案件系统获取决策系统和反欺诈变量加工平台输入的xN+1并输入至案件定性模型中,输出案件关键属性标签,并根据预设规则对案件关键属性标签进行排序;

获取对案件关键属性标签影响最大的反欺诈因子z,计算案件关键属性标签的分值并根据分值进行排序:

SZ=WZ*100

其中,SZ案件关键属性标签的分值;为WZ为反欺诈因子的得分占比;

根据案件关键属性标签及案件关键属性标签的分值排序信息,得到案件定性结果。

为达到上述目的,本发明第二方面实施例提出了一种基于反欺诈变量与决策结果的案件定性系统,包括:

数据获取系统,用于获取银行或金融机构的信贷申请信息;

决策系统,用于根据所述信贷申请信息得到决策结果和决策原因码;

反欺诈变量加工平台,用于根据所述信贷申请信息得到反欺诈变量信息;

案件系统,用于:

根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值;

将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果。

有益效果:决策系统和反欺诈变量加工平台,能够为不同的金融机构提供统一或者定制的接入接口,提供一种金融数据的共享机制,在金融大数据中进行反欺诈变量加工,组网申请的变量计算,提供适用于不同金融机构的案件定性方法,辅助信贷审批决策,积累反欺诈信用数据,实现反欺诈变量查询,案件定性方法的共享,实现数据共享。对案件的定性分类能力强,能输入准确的案件关键属性标签,协助案调人员快速对案件进行判别,提高对案件定性的准确性,同时实现对案件定性的自动化,节约时间,降低调查成本。决策系统和反欺诈变量加工平台对数据处理专业性强,依托强金融属性数据以及先进的风控经验形成的决策结果和反欺诈变量。案件系统根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值,数据特征值全面且多样,案件系统的数据特征值方面完善,提高对案件定性的准确性。适用范围广,在其他金融机构中,可以共享反欺诈指标结果,具有泛用性及共享性。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1是根据本发明一个实施例的一种基于反欺诈变量与决策结果的案件定性方法的流程图;

图2是根据本发明一个实施例的一种基于反欺诈变量与决策结果的案件定性系统的框图。

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

下面参考图1至图2来描述本发明实施例提出的一种基于反欺诈变量与决策结果的案件定性方法及系统。

如图1所示,本发明第一方面实施例提出了一种基于反欺诈变量与决策结果的案件定性方法,包括步骤S1-S5:

S1、获取银行或金融机构的信贷申请信息;

S2、根据所述信贷申请信息通过决策系统获取决策结果和决策原因码;

S3、根据所述信贷申请信息通过反欺诈变量加工平台获取反欺诈变量信息;

S4、案件系统根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值;

S5、将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果。

上述技术方案的工作原理及有益效果:决策系统和反欺诈变量加工平台,能够为不同的金融机构提供统一或者定制的接入接口,提供一种金融数据的共享机制,在金融大数据中进行反欺诈变量加工,组网申请的变量计算,提供适用于不同金融机构的案件定性方法,辅助信贷审批决策,积累反欺诈信用数据,实现反欺诈变量查询,案件定性方法的共享,实现数据共享。对案件的定性分类能力强,能输入准确的案件关键属性标签,协助案调人员快速对案件进行判别,提高对案件定性的准确性,同时实现对案件定性的自动化,节约时间,降低调查成本。决策系统和反欺诈变量加工平台对数据处理专业性强,依托强金融属性数据以及先进的风控经验形成的决策结果和反欺诈变量。案件系统根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值,数据特征值全面且多样,案件系统的数据特征值方面完善,提高对案件定性的准确性。适用范围广,在其他金融机构中,可以共享反欺诈指标结果,具有泛用性及共享性。

根据本发明的一些实施例,所述根据所述信贷申请信息通过反欺诈变量加工平台获取反欺诈变量信息,包括:

根据所述信贷申请信息通过关联网络系统获取欺诈交易申请的关联关系信息;

根据所述信贷申请信息通过中文模糊匹配系统获取所述与信贷申请信息的匹配信息;所述匹配信息包括地址匹配信息;

根据所述信贷申请信息、欺诈交易申请的关联关系信息及与信贷申请信息的匹配信息通过反欺诈变量加工平台生成反欺诈变量信息。

上述技术方案的工作原理及有益效果:根据信贷申请信息,反欺诈变量加工平台调用关联网络系统及中文模糊匹配系统,组装统一的反欺诈变量信息给案件系统,生成准确且全面的反欺诈变量信息。

根据本发明的一些实施例,对案件定性模型的训练方法包括:

获取样本案件的数据特征值,通过随机森林的方法对样本案件的数据特征值进行计算,标注样本案件关键属性标签及标注样本案件定性结果;

将样本案件的数据特征值输入案件定性模型中,将案件定性模型输出的样本案件关键属性标签及样本案件定性结果分别与标注样本案件关键属性标签及标注样本案件定性结果进行对比,在对比结果为不一致时,不断更新优化案件定性模型的模型参数,直到对比结果一致时,得到训练好的案件定性模型。

根据本发明的一些实施例,所述输出案件关键属性标签及案件定性结果后,还包括:

根据所述案件定性结果,获取案件定性结果为欺诈案件的第一数据集;

对所述第一数据集中不同欺诈案件的相同特征属性进行叠加并进行排序;

选取叠加值最大的P个特征属性,并获取P个特征属性所述对应的信贷申请信息;

将P个特征属性及P个特征属性所述对应的信贷申请信息放入黑名单库;

将P个特征属性及P个特征属性所述对应的信贷申请信息放入先验数据库:

在接收到信贷申请信息时,判断所述信贷申请信息是否包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息;

在确定信贷申请信息包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息,则确定所述信贷申请信息对应的案件为欺诈案件;反之,通过案件定性模型检验所述信贷申请信息对应的案件是否为欺诈案件。

上述技术方案的工作原理及有益效果:将P个特征属性及P个特征属性所述对应的信贷申请信息放入黑名单库,在接收到新的信贷申请信息时与放入黑名单库的信息做对比,在判断匹配度大于预设匹配度时,对该信贷申请信息不进行审批,即该信贷申请信息无效,没有权限进行申请信贷。节省审批时间,提高审批效率。或在接收到信贷申请信息时,判断所述信贷申请信息是否包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息;首先对该信贷申请信息进行先行检验,在确定信贷申请信息包括先验数据库中存储的P个特征属性中的任一特征属性和/或P个特征属性中的任一特征属性所对应的信贷申请信息,则确定所述信贷申请信息对应的案件为欺诈案件;反之,通过案件定性模型检验所述信贷申请信息对应的案件是否为欺诈案件。提高对欺诈案件的准确识别,提高案件定性的准确性,多角度较全面地描述信贷申请人的欺诈风险可能。

根据本发明的一些实施例,所述特征转换处理,包括:

判断进行特征转换处理的信息类别是否为反欺诈变量信息;

在确定进行特征转换处理的信息类别为反欺诈变量信息时,判断反欺诈变量信息是否为第一类反欺诈变量信息,在确定为第一类反欺诈变量信息时,进行数字化转换;在确定为第二类反欺诈变量信息时,使用非线性转换法;所述第一类反欺诈变量信息包括:内部黑名单类,一致性比对类,模糊匹配相关衍生变量,勾稽校验类,部分组网变量;所述第二类反欺诈变量信息包括:历史比对类,多人共用类,人行比对类,设备属性类,设备注册行为类,设备登录行为类,设备申请行为类,设备提现行为类;

在确定进行特征转换处理的信息类别为非反欺诈变量信息时,使用One-hot编码型特征值转换。

上述技术方案的工作原理及有益效果:示例的,第一类反欺诈变量信息为“是否调用行内黑灰名单”,在确定调用行内黑灰名单时,转换为1;在确定没有调用行内黑灰名单时,转换为0;第二类反欺诈变量信息为统计数量或频率的信息。示例的,第二类反欺诈变量信息为“当前产品首期逾期天数”,采用非线性转换法,转为为具体数字。非反欺诈变量信息包括:人物性别编码、决策类型编码,案件省市区编码,案件定性标签编码;示例的,在非反欺诈变量信息为决策类型编码时,决策类型编码有N个类别,类别值为0至N-1,转换为N个类别的特征编码。实现对不同信息进行相对应的特征转换处理,提高数据的全面性与准确性。

根据本发明的一些实施例,对案件定性模型的训练方法,包括:

获取样本案件的数据特征值并根据所述样本案件关键属性标签分类,得到样本案件定性分类集合D;

D={(x1,y1),(x2,y2),...(xN,yN)}

其中,xi为样本案件的F维的特征向量对应的数据特征值;yi为样本案件关键属性标签;yi∈{1,2,...,K},K为常数;i=1,2,3...N;

在样本案件中有放回的抽取大小和D一样的训练集,作为根节点的训练样本;从根节点进行训练,判断当前节点是否满足终止条件;在确定当前节点满足终止条件时,设置当前节点为叶子节点;在确定当前节点不满足终止条件时,则从样本案件的F维的特征向量中无放回的随机选取f维特征向量,其中,F>f;根据选取的f维特征向量获取分类特征信息;所述分类特征信息包括训练阈值th;

当前节点上的训练结果小于训练阈值th的样本案件被划分到左节点,当前节点上的训练结果大于等于阈值th的样本案件被划分到右节点;

继续训练其他节点,直到通过随机森林方法构建的所有树都输出样本案件关键属性标签,得到案件定性模型的模型参数;

yN+1=argmaxp*c(yN+1|xN+1)

其中,c为叶子节点的预测输出为当前节点样本案件集合中数量最多的类别;p为c占当前节点样本案件集合的比例;xN+1为输入案件定性模型的案件的F维的特征向量对应的数据特征值;yN+1为输出的案件关键属性标签。

上述技术方案的工作原理及有益效果:通过样本案件对案件定性模型进行训练,根节点为初始节点,在样本案件中有放回的抽取大小和D一样的训练集,对根节点训练结束后,依次对其他节点进行训练。在确定当前节点满足终止条件时,设置当前节点为叶子节点;在确定当前节点不满足终止条件时,则从样本案件的F维的特征向量中无放回的随机选取f维特征向量,根据选取的f维特征寻分类效果最好的特征向量及该特征向量对应的阈值,即训练阈值th。根据训练阈值th将当前节点上的样本案件划分为左节点及右节点,在左节点或右节点中继续进行划分。直到通过随机森林方法构建的所有树都输出样本案件关键属性标签,得到案件定性模型的模型参数,将案件的F维的特征向量对应的数据特征值输入案件定性模型中,输出结果为案件关键属性标签。提高对案件定性的准确性。

根据本发明的一些实施例,所述将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果,包括:

案件系统获取决策系统和反欺诈变量加工平台输入的xN+1并输入至案件定性模型中,输出案件关键属性标签,并根据预设规则对案件关键属性标签进行排序;

获取对案件关键属性标签影响最大的反欺诈因子z,计算案件关键属性标签的分值并根据分值进行排序:

SZ=WZ*100

其中,SZ案件关键属性标签的分值;为WZ为反欺诈因子的得分占比;

根据案件关键属性标签及案件关键属性标签的分值排序信息,得到案件定性结果。

上述技术方案的工作原理及有益效果:提高对案件定性的准确性。

为达到上述目的,本发明第二方面实施例提出了一种基于反欺诈变量与决策结果的案件定性系统,包括:

数据获取系统,用于获取银行或金融机构的信贷申请信息;

决策系统,用于根据所述信贷申请信息得到决策结果和决策原因码;

反欺诈变量加工平台,用于根据所述信贷申请信息得到反欺诈变量信息;

案件系统,用于:

根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值;

将所述案件的数据特征值输入预先训练好的案件定性模型中,输出案件关键属性标签及案件定性结果。

上述技术方案的工作原理及有益效果:决策系统和反欺诈变量加工平台,能够为不同的金融机构提供统一或者定制的接入接口,提供一种金融数据的共享机制,在金融大数据中进行反欺诈变量加工,组网申请的变量计算,提供适用于不同金融机构的案件定性方法,辅助信贷审批决策,积累反欺诈信用数据,实现反欺诈变量查询,案件定性方法的共享,实现数据共享。对案件的定性分类能力强,能输入准确的案件关键属性标签,协助案调人员快速对案件进行判别,提高对案件定性的准确性,同时实现对案件定性的自动化,节约时间,降低调查成本。决策系统和反欺诈变量加工平台对数据处理专业性强,依托强金融属性数据以及先进的风控经验形成的决策结果和反欺诈变量。案件系统根据所述信贷申请信息、决策结果和反欺诈变量信息进行特征转换处理,转换生成案件的数据特征值,数据特征值全面且多样,案件系统的数据特征值方面完善,提高对案件定性的准确性。适用范围广,在其他金融机构中,可以共享反欺诈指标结果,具有泛用性及共享性。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

本文发布于:2023-04-13 16:12:23,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/86111.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图