G06Q40/02 G06Q10/04 G06K9/62 G06N3/00 G06N3/12
1.一种客户违约实时监控系统,其特征在于,包括贷款用户端、服务端和出借用户端,所述贷款用户端和出借用户端均和服务端通信;
所述贷款用户端,用于发起贷款申请请求向服务端;
所述服务端,用于在接收到贷款申请请求后,根据贷款申请请求拟定智能合约发向贷款用户端;
所述贷款用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述贷款用户端签署的智能合约后,将智能合约发送至出借用户端;
所述出借用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述出借用户端签署的智能合约后,执行贷款操作;
在所述服务端将智能合约发送至出借用户端时,对所述贷款用户端的贷款用户执行违约概率预测,并将预测结果同步发送至出借用户端;
所述服务端,还用于在所述贷款用户出现违约情况时,根据智能合约中的条款进行执行违约惩罚操作。
2.按照权利要求1所述的一种贷款用户违约实时监控系统,其特征在于,所述服务端执行违约概率预测,包括以下步骤:
步骤1、调取贷款用户在贷款用户端注册时的个人基本信息和在贷款用户端操作时的行为数据;
步骤2、基于个人基本信息查询并抽取个人征信数据;
步骤3、对个人征信数据和行为数据预处理,生成用户特征数据;
步骤4、将用户特征数据输入预设的违约概率预测模型中,输出预测的用户违约概率。
3.按照权利要求2所述的一种贷款用户违约实时监控系统,其特征在于,所述服务端,用于周期性的重新生成违约概率预测模型。
4.按照权利要求3所述的一种贷款用户违约实时监控系统,其特征在于,所述服务端重新生成违约概率预测模型,包括以下步骤:
Step1、从数据库中抽取若干用户的样本数据,所述样本数据包括基于用户的个人征信数据和行为数据预处理生成的用户特征数据和用户实际违约数据;
Step2、将若干样本数据随机分配,生成训练数据集和测试数据集;
Step3、采用训练数据集对SVR模型进行训练;
Step4、采用测试数据集,对训练完成的SVR模型进行测试,若测试通过,则进入下一步,若测试未通过,则进入Step2;
Step5、将测试通过后的SVR模型作为违约概率预测模型。
5.按照权利要求4所述的一种贷款用户违约实时监控系统,其特征在于,对SVR模型进行训练时,输入为用户特征数据,输出为基于用户实际违约数据得到的违约概率数据,所述用户实际违约数据为实际违约天数a,违约概率数据为a%。
6.按照权利要求5所述的一种贷款用户违约实时监控系统,其特征在于,对SVR模型进行训练时,采用五折交叉验证法进行参数寻优。
7.按照权利要求6所述的一种贷款用户违约实时监控系统,其特征在于,对SVR模型进行训练时,利用杂草优化算法对SVR模型中的模型参数进行优化,所述模型参数包括:误差敏感系数ε、惩罚函数C和核函数的宽度参数σ。
8.按照权利要求7所述的一种贷款用户违约实时监控系统,其特征在于,利用杂草优化算法对SVR模型中的模型参数进行优化时,随机产生若干杂草个体,每个杂草个体对应一组模型参数;对SVR模型中的模型参数进行优化的过程,是寻最优杂草个体的过程;随机产生若干杂草个体时,包括以下步骤:
在d维空间中随机产生一个d维向量Y1=(y1,y2,…,yd)作为第一个杂草个体,其中yi∈[-1,1],1≤i≤d;
根据yi=r-2yi-yi3对所述d维向量Y逐维进行M-1次迭代,产生其余M-1个杂草个体;其中,yi∈[-1,1],i=(0,1,…,M)为杂草个体序列,M≤d;r为随机数。
9.按照权利要求4所述的一种贷款用户违约实时监控系统,其特征在于,Step1中对样本数据的预处理包括:根据用户的个人征信数据筛选出用户实际违约数据,并将用户实际违约数据产生前的所有个人征信数据和行为数据作为用户特征数据。
10.按照权利要求9所述的一种贷款用户违约实时监控系统,其特征在于,Step1中对样本数据的预处理还包括:对采集的个人征信数据进行缺失值处理、异常值处理和标准化处理。
本发明属于人工智能技术领域,尤其涉及一种贷款用户违约实时监控系统。
随着互联网金融的发展,越来越多的人开始在网络上进行贷款操作,网络贷款为的主要是便捷性和快捷性,但若如传统线下贷款一样,进行材料提供和材料审核,势必会让贷款进度变慢。而若不进行有效的资料审核,势必会给贷款操作带来巨大的坏账风险。
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种贷款用户违约实时监控系统,能够及时的对贷款用户的违约概率进行预测,并在发生违约是直接执行智能合约,可以有效的降低贷款风险。
为解决上述技术问题,本发明采用的技术方案是:一种客户违约实时监控系统,包括贷款用户端、服务端和出借用户端,所述贷款用户端和出借用户端均和服务端通信;
所述贷款用户端,用于发起贷款申请请求向服务端;
所述服务端,用于在接收到贷款申请请求后,根据贷款申请请求拟定智能合约发向贷款用户端;
所述贷款用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述贷款用户端签署的智能合约后,将智能合约发送至出借用户端;
所述出借用户端,还用于在接收到智能合约后,进行签署或退回;
所述服务端,在收到所述出借用户端签署的智能合约后,执行贷款操作;
在所述服务端将智能合约发送至出借用户端时,对所述贷款用户端的贷款用户执行违约概率预测,并将预测结果同步发送至出借用户端;
所述服务端,还用于在所述贷款用户出现违约情况时,根据智能合约中的条款进行执行违约惩罚操作。
上述贷款用户违约实时监控系统,所述服务端执行违约概率预测,包括以下步骤:
步骤1、调取贷款用户在贷款用户端注册时的个人基本信息和在贷款用户端操作时的行为数据;
步骤2、基于个人基本信息查询并抽取个人征信数据;
步骤3、对个人征信数据和行为数据预处理,生成用户特征数据;
步骤4、将用户特征数据输入预设的违约概率预测模型中,输出预测的用户违约概率。
上述贷款用户违约实时监控系统,所述服务端,用于周期性的重新生成违约概率预测模型。
上述贷款用户违约实时监控系统,所述服务端重新生成违约概率预测模型,包括以下步骤:
Step1、从数据库中抽取若干用户的样本数据,所述样本数据包括基于用户的个人征信数据和行为数据预处理生成的用户特征数据和用户实际违约数据;
Step2、将若干样本数据随机分配,生成训练数据集和测试数据集;
Step3、采用训练数据集对SVR模型进行训练;
Step4、采用测试数据集,对训练完成的SVR模型进行测试,若测试通过,则进入下一步,若测试未通过,则进入Step2;
Step5、将测试通过后的SVR模型作为违约概率预测模型。
上述贷款用户违约实时监控系统,对SVR模型进行训练时,输入为用户特征数据,输出为基于用户实际违约数据得到的违约概率数据,所述用户实际违约数据为实际违约天数a,违约概率数据为a%。
上述贷款用户违约实时监控系统,对SVR模型进行训练时,采用五折交叉验证法进行参数寻优。
上述贷款用户违约实时监控系统,对SVR模型进行训练时,利用杂草优化算法对SVR模型中的模型参数进行优化,所述模型参数包括:误差敏感系数ε、惩罚函数C和核函数的宽度参数σ。
上述贷款用户违约实时监控系统,利用杂草优化算法对SVR模型中的模型参数进行优化时,随机产生若干杂草个体,每个杂草个体对应一组模型参数;对SVR模型中的模型参数进行优化的过程,是寻最优杂草个体的过程;随机产生若干杂草个体时,包括以下步骤:
在d维空间中随机产生一个d维向量Y1=(y1,y2,…,yd)作为第一个杂草个体,其中yi∈[-1,1],1≤i≤d;
根据yi=r-2yi-yi3对所述d维向量Y逐维进行M-1次迭代,产生其余M-1个杂草个体;其中,yi∈[-1,1],i=(0,1,…,M)为杂草个体序列,M≤d;r为随机数。
上述贷款用户违约实时监控系统,Step1中对样本数据的预处理包括:根据用户的个人征信数据筛选出用户实际违约数据,并将用户实际违约数据产生前的所有个人征信数据和行为数据作为用户特征数据。
上述贷款用户违约实时监控系统,Step1中对样本数据的预处理还包括:对采集的个人征信数据进行缺失值处理、异常值处理和标准化处理。
本发明与现有技术相比具有以下优点:本发明能够在贷款前及时的对贷款用户的违约概率进行预测,并在发生违约是直接执行智能合约,可以有效的降低贷款风险。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
图1为本发明的系统架构图。
如图1所示,一种客户违约实时监控系统,包括贷款用户端1、服务端2和出借用户端3,所述贷款用户端1和出借用户端3均和服务端2通信;
所述贷款用户端1,用于发起贷款申请请求向服务端2;
所述服务端2,用于在接收到贷款申请请求后,根据贷款申请请求拟定智能合约发向贷款用户端1;
所述贷款用户端1,还用于在接收到智能合约后,进行签署或退回;
所述服务端2,在收到所述贷款用户端1签署的智能合约后,将智能合约发送至出借用户端3;
所述出借用户端3,还用于在接收到智能合约后,进行签署或退回;
所述服务端2,在收到所述出借用户端3签署的智能合约后,执行贷款操作;
在所述服务端2将智能合约发送至出借用户端3时,对所述贷款用户端1的贷款用户执行违约概率预测,并将预测结果同步发送至出借用户端3;
所述服务端2,还用于在所述贷款用户出现违约情况时,根据智能合约中的条款进行执行违约惩罚操作。
本实施例中,所述出借用户端3为银行放贷人员使用的用户端;所述智能合约指当被触发时,可自动执行的合约,例如使用债券抵押贷款,当贷款用户违约后,可直接将债券所有权转到银行名下。
实际使用时,贷款用户只需在贷款用户端1进行简单的操作发起贷款申请请求,而通过服务端2对贷款用户执行违约概率预测,可以让出借用户端3的放贷人员不需要复杂的分析即可得到一个参考,来决定是否进行放贷,从而在保证贷款操作效率的前提下,依旧能够降低违约风险。
本实施例中,所述服务端2执行违约概率预测,包括以下步骤:
步骤1、调取贷款用户在贷款用户端1注册时的个人基本信息和在贷款用户端1操作时的行为数据;
需要说明的是,个人基本信息如:姓名、年龄、身份证号、征信查询授权指令等等;行为数据包括埋点时采集的设备行为数据和日志数据,其中设备行为数据包括:登录本平台的次数、点击次数、点击频率、输入总耗时及平均耗时、手机号数据、GPS位置、MAC地址、IP地址数据、LBS、WIF数据、地理信息申请频次、IP的申请频次、设备电量占比、陀螺仪的平均加速度,另外日志数据包括:7天内登录次数、首次点击到申请授信时长、一天内最多的session数、申请授信前一周的行为统计等获取历史上用户注册、登录、身份信息提交等用户APP端操作事件,根据各个历史用户操作事件追踪该用户的历史用户行为轨迹,以及历史用户行为轨迹数据等。
步骤2、基于个人基本信息查询并抽取个人征信数据;
需要说明的是,个人征信数据包括个人消费数据、收入数据,还包括如信用卡通过率、贷款通过率、贷款查询次数、多头借贷数据等;
步骤3、对个人征信数据和行为数据预处理,生成用户特征数据;
需要说明的是,此处对个人征信数据和行为数据预处理,是指对个人征信数据和行为数据执行特征标记操作,可采用分类器进行标记;
步骤4、将用户特征数据输入预设的违约概率预测模型中,输出预测的用户违约概率。
需要说明的是,违约概率预测模型为神经网络模型,本实施例中采用支持向量回归机,即SVR模型。
本实施例中,所述服务端2,用于周期性的重新生成违约概率预测模型。
本实施例中,所述服务端2重新生成违约概率预测模型,包括以下步骤:
Step1、从数据库中抽取若干用户的样本数据,所述样本数据包括基于用户的个人征信数据和行为数据预处理生成的用户特征数据和用户实际违约数据;
需要说明的是,Step1中对样本数据的预处理包括:根据用户的个人征信数据筛选出用户实际违约数据,并将用户实际违约数据产生前的所有个人征信数据和行为数据作为用户特征数据。
需要说明的是,Step1中对样本数据的预处理还包括:对采集的个人征信数据进行缺失值处理、异常值处理和标准化处理。
所述缺失值处理包括判断所述个人征信数据中的数据缺失状态,若大于缺失阈值则采用随机森林算法填补缺失数据;若小于缺失阈值则采用均值法对缺失数据进行填补,对离散非数值型属性进行one-hot编码,得到预处理结果;
异常值处理指删除数据值异常的数据,例如数据值过大或过小的数据。
所述标准化处理常见的方法有最大最小标准化和Zsocre标准化。本申请采用的是最大最小标准化,表达式如下:
其中max(x)为样本序列中的最大值;min(x)为样本序列中的最小值;xi为要归一化的数据;为标准化后的数据;
Step2、将若干样本数据随机分配,生成训练数据集和测试数据集;
需要说明的是,此处采用7:3的比例,生成训练数据集和测试数据集;
Step3、采用训练数据集对SVR模型进行训练;
需要说明的是,SVR模型指支持向量回归机(Support Vector Regression,SVR)是在支持向量机(Support Vector Machine,SVM)基础上发展起来的非线性回归算法。与SVM一样,SVR的目标也是寻空间中的最优超平面,但是与SVM不同,SVM所到的是能将样本分割的超平面,而SVR到的是能准确预测样本分布的超平面。SVR通过构建非线性映射,将原始数据集映射至高位甚至无穷维的一个新的特征空间中,不敏感损失函数的引入替代了SVM高维空间中的内积运算,免去了在高维空间计算复杂的点积运算;
SVR模型具有较好的推广能力和非线性处理能力,尤其在处理高维数据时,能有效地解决“维数灾难”问题,能够较好地解决小样本、非线性、高维数和局部极小点等实际问题,并成功应用于分类、回归、时间序列预测等领域;
此处假定有训练数据集T={(xi,yi)}={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rm代表输入空间的一个样本,m为训练数据的维数,yi∈R是该样本对应的输出值,为对应的信用评分值,i=1,…,n是样本数;SVR模型首先将输入向量通过一个非线性映射φ(x)映射到一个高维Hilbert特征空间,然后在高维特征空间中构造优化超平面,进行线性回归,线性回归函数表现形式为:
f(x)=wTφ(x)+b
其中,w∈Rm为权值向量;φ(x)为非线性映射函数;b为阈值。
SVR模型的训练需要最小化权值w和b阈值,|yi-f(xi)|为真实数据与输出数据的差值,为了使SVR模型保持较好的稀疏性,定义不敏感损失函数ε>0,当|yi-f(xi)|>ε时计算损失。通过引入不敏感损失函数使误差得到控制;对于代价函数的风险最小化求解,可以通过最小化欧几里得范数来实现;从而问题转化为一个凸优化问题,得到代价函数:
根据结构风险最小化准则,引入松弛变量ξi和ξ*i以处理ε不能估计的数据,因此SVR转变为求解以下目标函数的最小化的问题;对于代价函数的风险最小化求解,可以转化为目标函数:
s.t.yi-
其中,||w||2为Euclidean范数,用来描述函数f的复杂度;C>为惩罚系数,用于平衡算法复杂度与样本误差之间的权重,对样本中超出误差ε的惩罚度进行控制;yi∈R为输出样本,i=1,…,n是样本数;ξi和ξ*i为松弛变量;
为解决上述凸优化问题,引入拉格朗日乘子αi、α*i≥0,构造拉格朗日函数,求导使得函数最小;再化为其对偶形式,从而求得支持向量非线性回归函数,经对偶转换得到的回归函数的表达式为:
其中,xi、x分别为训练集和测试集的特征向量,i=1,2,…,n为样本数;αi、α*i为拉格朗日乘子;φ(x)为非线性映射函数;b为阈值;<φ(xi),φ(x>是映射函数的点积;
由于非线性函数φ(x)未知,而特征空间的维数很高(甚至无穷),因此权值向量w难以求得,为了解决这个问题,利用对偶原理和拉格朗日函数引入核函数k(xi,x)代替上述表达式中映射函数的点积<φ(xi),φ(x>,可以实现低维空间向高维空间的精确映射,从而较好地解决多因素非线性预测问题;
引入核函数后的回归函数的表达式为:
其中,xi、x分别为训练集和测试集的特征向量;αi、α*i为拉格朗日乘子;k(xi,x)为核函数;b为阈值。
核函数k(xi,x)的选取对支持向量回归机分析影响很大,常用的核函数主要有线性函数、多项式函数、sigmoid函数和径向基函数(RBF函数)。相比其他核函数,RBF函数只需要确定一个参数:核函数的宽度,具有复杂度低、预测误差小、拟合精度高、非线性逼近能力强等优点,故本专利采用RBF函数作为核函数,RBF核函数表达式如下:
其中,xi、x分别为训练集和测试集的特征向量;σ为核函数的宽度。
SVR模型中,误差敏感系数ε是样本数据不敏感区域的宽度,取值大小影响回归模型的精度,若数值过小,则回归精度较高,得不到好的推广能力;若过大模型简单,导致学习精度不够;惩罚函数C反映了算法对超出ε的样本数据的惩罚程度,若C取值过大,易导致模型的泛化能力变差,C取值较小,易使ε不敏感,使得训练误差变大;核函数的宽度参数σ控制了函数的径向作用范围,反映了训练集分布特征,进而决定局部领域的带宽;
SVR模型中参数误差敏感系数ε、惩罚函数C、核函数的宽度参数σ组合(ε,C,σ)的值的选择影响预测的精度,若参数选取不当,将会导致SVR模型的过学习或欠学习现象。所以需要建立优化的预测模型就需要选取最优的参数组合来最小化实际值和预测值之间的误差;
Step4、采用测试数据集,对训练完成的SVR模型进行测试,若测试通过,则进入下一步,若测试未通过,则进入Step2;
Step5、将测试通过后的SVR模型作为违约概率预测模型。
本实施例中,对SVR模型进行训练时,输入为用户特征数据,输出为基于用户实际违约数据得到的违约概率数据,所述用户实际违约数据为实际违约天数a,违约概率数据为a%。
需要说明的是,实际中违约天数越长,越说明诚信度越低,越容易在以后再次出现违约,故基于违约天数得到违约概率数据为a%,是一个比较简单准确的数据。
本实施例中,对SVR模型进行训练时,采用五折交叉验证法进行参数寻优。
本实施例中,对SVR模型进行训练时,利用杂草优化算法对SVR模型中的模型参数进行优化,所述模型参数包括:误差敏感系数ε、惩罚函数C和核函数的宽度参数σ。
本实施例中,利用杂草优化算法对SVR模型中的模型参数进行优化时,随机产生若干杂草个体,每个杂草个体对应一组模型参数;对SVR模型中的模型参数进行优化的过程,是寻最优杂草个体的过程;随机产生若干杂草个体时,包括以下步骤:
在d维空间中随机产生一个d维向量Y1=(y1,y2,…,yd)作为第一个杂草个体,其中yi∈[-1,1],1≤i≤d;
根据yi=r-2yi-yi3对所述d维向量Y逐维进行M-1次迭代,产生其余M-1个杂草个体;其中,yi∈[-1,1],i=(0,1,…,M)为杂草个体序列,M≤d;r为随机数。
需要说明的是,杂草优化算法(Invasive Weed Optimization,IWO)主要模拟杂草的扩散、繁殖、生长和竞争行为的一种元启发式搜索算法,以体中优秀个体来指导种的进化,以正态分布动态改变标准差的方式将由优秀个体产生的子代个体叠加在父代个体周围,通过种子的空间扩散、生长、繁殖和竞争消亡,同时采用子父代竞争排斥机制,最大限度保留有用信息,避免早熟和陷入局部最优。
杂草优化算法包括:种初始化、生长繁殖、空间扩散和竞争淘汰四个步骤,多次重复生长繁殖、空间扩散和竞争淘汰直至达到停止准则,即可输出最优解。
本实施例中,通过将杂草优化算法的种初始化进行改进,解决了传统的杂草优化算法的随机产生杂草的初始位置有可能会导致位置分布不均匀的问题。
为了评价训练后的SVR模型预测能力及模型的稳定性,验证杂草搜索算法优化支持向量回归机的优越性,分别用原始支持向量回归机、遗传算法(GA)、粒子算法(PSO)、杂草搜索算法(IWO)和改进后的杂草搜索算法(IIWO)来优化支持向量回归机的性能对比,采用准确率(precision)、召回率(recall)以及F1分数(F1score)等指标来衡量模型的性能。
所述准确率(precision)为预测准确违约概率样本数与预测违约概率样本数的百分比;召回率(recall)为预测准确违约概率样本数与实际违约概率样本数的百分比;F1分数(F1score)是统计学中用来衡量二分类模型精确度的一种指标,它同时兼顾了用户流失预测模型的准确率和召回率,可以看作是准确率和召回率的一种加权平均。
各元启发式智能算法GA-SVR,PSO-SVR,IWO-SVR和改进IWO-SVR中,种的最大迭代次数为200,种规模为20,惩罚参数C范围(0,100],核参数σ范围(0,100]、误差敏感系数ε范围(0,1];设置遗传算法(GA)的交叉概率为0.8,变异概率为0.05。粒子算法(PSO)更新速度c1取1.49445,更新速度c2取0.5,粒子最大速度取0.5,最小速度取-0.5;杂草算法(IWO)和改进的杂草算法(IIWO)参数:初始种大小P=5,最大迭代次数itermax=200,问题的求解维数dim=29~125,最大种数量Pmax=500,最大种子数seedmax=5,最小种子数seedmin=0,初始标准差σinit=0.1,最终标准差σfin=0.001。各个模型性能结果如下:
改进的IWO实验都获得了比GA和PSO更高的Precision、Recall和F1-Score值,表现出改进杂草算法具有极好的搜索能力和稳定性。
以上所述,仅是本发明的较佳实施例,并非对本发明作任何限制,凡是根据本发明技术实质对以上实施例所作的任何简单修改、变更以及等效结构变化,均仍属于本发明技术方案的保护范围内。
本文发布于:2023-04-14 22:28:34,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/4/86754.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |