G06Q40/02 G06F16/22 G06F16/242
1.一种基于人行数据的客户收入评估方法,其特征在于,包括以下步骤:
步骤1、获取所有进件用户的申请贷款信息及人行征信报告信息,并对所有用户是否存在用户公积金记录进行标记,若存在标记为1,若不存在公积金记录,则标记为0;
步骤2、针对步骤1中存在公积金记录的用户,获取用户人行报告中距今最近的一次公积金的参缴日期YM,并以参缴日期YM为基础往前推一年,计算出近一年的平均公积金的参缴额度,记为(YM,AM),其中YM表示参缴日期,AM表示参缴金额;
步骤3、针对步骤2获取的参缴日期YM和参缴金额AM,依据参缴日期YM对应的公积金参缴逻辑,推导用户参缴日期YM的工资水平,记为(YM,amount),amount表示参缴日期YM的工资收入;
步骤4、依据步骤3计算得出的用户参缴日期YM、工资收入amount及步骤1中征信报告参缴日期YM的参缴地记录,计算每一个参缴地所有用户后一年工资金额平均值相对于前一年工资金额平均值的比值,作为对应参缴地社会平均工资金额的年均上涨幅度f;
步骤5、针对步骤3中所有的用户,若参缴日期YM为当前年份,则直接代表了用户当前的工资收入;若参缴日期YM非当前年份,则依据步骤4中计算出的平均工资金额上涨幅度f,计算出参缴日期YM为非当前年份的用户税前工资额度折现为当前年份的税前工资额度,即获得用户较为准确的当前税前工资额度;
步骤6、针对步骤5中计算出的当前用户税前工资、依据当前税收逻辑转化为对应的用户当前税后工资额度;
步骤7、针对步骤1中未匹配中任何公积金信息的用户、即步骤1标记为0的用户,进一步匹配存在行内代发工资行为的用户作为收入预测模型的建模样本,以此代发工资作为样本用户的实际税后工资收入;
步骤8、针对步骤7中存在代发工资行为的样本用户,匹配用户申请数据及步骤1中的人行征信数据,并对所有数据进行数据清洗、特征衍生、缺失值填充、特征编码处理,形成可供入模使用的特征,以步骤7中的实际税后工资收入为Y值,衍生标准化的用户申请数据及人行征信数据为X值,建立起衍生变量X与实际税后工资收入Y值之间的线性回归模型,即收入预测模型,并以此模型在线预测未匹配中任何公积金信息的用户的工资收入。
2.根据权利要求1所述的一种基于人行数据的客户收入评估方法,其特征在于,对于步骤4中参缴地,在各参缴地的量满足评估结果稳定的条件下,参缴地的最小单位包括县级、市级、省级以及地区级,地区单位越小,针对特定用户的工资收入预测效果越准确;对于步骤8中匹配的数据,还匹配外部多头数据、消费数据及交易数据,增加收入预测模型的预测精度。
3.一种基于人行数据的客户收入评估装置,其特征在于,包括:
样本获取模块,该模块获取全量申请进件用户的申请数据、人行征信数据及行内代发工资数据,作为用户后续工资收入计算的分析基础数据;
样本处理模块,对获取的全量进件用户的人行征信数据按照有无公积金参缴信息,用公积金参缴信息的用户标记为1,无公积金参缴信息的用户标记为0。同时针对标记为0且匹配中行内代发工资的用户,对该部分用户获取的申请数据及人行征信数据,进行数据清洗、特征衍生、缺失值填充、特征编码处理,形成可供建模使用的特征特征。
工资推断模块,对于存在公积金参缴记录的用户,获取距今最近的一次公积金参缴日期YM,并以参缴日期YM为基础往前推一年,计算出近一年的平均公积金参缴额度,记为(YM,AM),若参缴日期YM为当前年份,则直接依据当前公积金参缴逻辑计算出月平均收入;若参缴日期YM非当前年份,则通过用户对应的参缴年份、参缴金额及相应的参缴地信息,计算每一个参缴地所有用户后一年工资金额平均值相对于前一年工资金额平均值的比值,作为对应参缴地社会平均工资金额的年平均上涨幅度f,依据计算出的年平均工资金额上涨幅度f,计算出参缴日期YM为非当前年份的用户税前工资额度折现为当前年份的税前工资额度,即获得用户较为准确的现有税前工资额度,最后依据现有税收逻辑转化为对应的用户税后工资收入,对于无公积金参缴记录的用户,以标记为0且匹配中行内代发工资的用户为样本,代发工资为目标变量,申请数据及人行征信数据衍生变量为建模特征,建立起代发工资收入与衍生变量之间的关联线性回归模型,即收入预测模型,通过该模型在线预测未匹配中任何公积金参缴记录的用户工资收入。
4.一种存储介质,其特征在于,所述存储介质存储有一种基于人行数据的客户收入评级的程序,处理器执行所述程序时实现如权利要求1-2任一所述的一种基于人行数据的客户收入评级方法。
本发明涉及信息技术领域,提供了一种基于人行数据的客户收入评估方法、装置及存储介质。
众所周知,信贷的核心是风控,银行个贷业务首要任务是要做好用户风险评估与管理,在用户成为“真正客户”的各个环节均需要对用户进行风险进行评估,包括用户准入、风险评估、额度确定和风险定价等。而收入作为用户最主要的还款能力判断依据,与个人信用风险有很高的关联性。因此在银行个贷场景中,如何较为准确地预测用户个人收入,对风控管理和应用至关重要。
本发明公开了一种较为准确的贷前预测收入的方法及装置,拟解决现有预测方法准确度不够,导致错误预估用户还款能力,最终客户无法偿还部分贷款,导致较大的风险的问题。
本发明通过以下技术方案进行实现。
提出一种基于人行数据的客户收入评估方法,包括:
本发明提供了一种基于人行数据的客户收入评估方法,包括以下步骤:
步骤1、获取所有进件用户的申请贷款信息及人行征信报告信息,并对所有用户是否存在用户公积金记录进行标记,若存在标记为1,若不存在公积金记录,则标记为0;
步骤2、针对步骤1中存在公积金记录的用户,获取用户人行报告中距今最近的一次公积金参缴日期YM,并以参缴日期YM为基础往前推一年,计算出近一年的平均公积金参缴额度,记为(YM,AM),其中YM表示参缴日期,AM表示参缴金额;
步骤3、针对步骤2获取的参缴日期YM和参缴金额AM,依据参缴日期YM对应的公积金参缴逻辑,推导用户参缴日期YM的工资水平,记为(YM,amount),amount表示参缴日期YM的工资收入;
步骤4、依据步骤3计算得出的用户参缴日期YM、工资收入amount及步骤1中征信报告参缴日期YM的参缴地记录,计算每一个参缴地所有用户后一年工资金额平均值相对于前一年工资金额平均值的比值,作为对应参缴地社会平均工资金额的年均上涨幅度f;
步骤5、针对步骤3中所有的用户,若参缴日期YM为当前年份,则直接代表了用户当前的工资收入;若参缴日期YM非当前年份,则依据步骤4中计算出的平均工资金额上涨幅度f,计算出参缴日期YM为非当前年份的用户税前工资额度折现为当前年份的税前工资额度,即获得用户较为准确的当前税前工资额度;
步骤6、针对步骤5中计算出的当前用户税前工资、依据当前税收逻辑转化为对应的用户当前税后工资额度;
步骤7、针对步骤1中未匹配中任何公积金信息的用户、即步骤1标记为0的用户,进一步匹配存在行内代发工资行为的用户作为收入预测模型的建模样本,以此代发工资作为样本用户的实际税后工资收入;
步骤8、针对步骤7中存在代发工资行为的样本用户,匹配用户申请数据及步骤1中的人行征信数据,并对所有数据进行数据清洗、特征衍生、缺失值填充、特征编码处理,形成可供入模使用的特征,以步骤7中的实际税后工资收入为Y值,衍生标准化的用户申请数据及人行征信数据为X值,建立起衍生变量X与实际税后工资收入Y值之间的线性回归模型,即收入预测模型,并以此模型在线预测未匹配中任何公积金信息的用户的工资收入。
上述技术方案中,对于步骤4中参缴地,在各参缴地的量满足评估结果稳定的条件下,参缴地的最小单位包括县级、市级、省级以及地区级,地区单位越小,针对特定用户的工资收入预测效果越准确;对于步骤8中匹配的数据,还匹配外部多头数据、消费数据及交易数据,增加收入预测模型的预测精度。
本发明还提供了一种基于人行数据的客户收入评估装置,包括:
样本获取模块,该模块获取全量申请进件用户的申请数据、人行征信数据及行内代发工资数据,作为用户后续工资收入计算的分析基础数据;
样本处理模块,对获取的全量进件用户的人行征信数据按照有无公积金参缴信息,用公积金参缴信息的用户标记为1,无公积金参缴信息的用户标记为0。同时针对标记为0且匹配中行内代发工资的用户,对该部分用户获取的申请数据及人行征信数据,进行数据清洗、特征衍生、缺失值填充、特征编码处理,形成可供建模使用的特征特征。
工资推断模块,对于存在公积金参缴记录的用户,获取距今最近的一次公积金参缴日期YM,并以参缴日期YM为基础往前推一年,计算出近一年的平均公积金参缴额度,记为(YM,AM),若参缴日期YM为当前年份,则直接依据当前公积金参缴逻辑计算出月平均收入;若参缴日期YM非当前年份,则通过用户对应的参缴年份、参缴金额及相应的参缴地信息,计算每一个参缴地所有用户后一年工资金额平均值相对于前一年工资金额平均值的比值,作为对应参缴地社会平均工资金额的年平均上涨幅度f,依据计算出的年平均工资金额上涨幅度f,计算出参缴日期YM为非当前年份的用户税前工资额度折现为当前年份的税前工资额度,即获得用户较为准确的现有税前工资额度,最后依据现有税收逻辑转化为对应的用户税后工资收入,对于无公积金参缴记录的用户,以标记为0且匹配中行内代发工资的用户为样本,代发工资为目标变量,申请数据及人行征信数据衍生变量为建模特征,建立起代发工资收入与衍生变量之间的关联线性回归模型,即收入预测模型,通过该模型在线预测未匹配中任何公积金参缴记录的用户工资收入。
本发明还提供了一种存储介质,所述存储介质存储有一种基于人行数据的客户收入评级的程序,处理器执行所述程序时实现一种基于人行数据的客户收入评级方法。
因为本发明采用上述技术方案,因此具备以下有益效果:
本发明提出的基于人行数据的客户收入评估方法、装置及存储介质,更加准确充分地利用到了人行征信中的公积金参缴信息及其他信息。一方面充分考虑了公积金参缴信息中的距今最近一次的参缴日期YM及参缴地址,由于公积金参缴信息中,部分用户在早期参缴后由于各类原因,出现了断缴情况,不存在最新的参缴信息,无法获知当前年份用户的真实情况,通过对不同参缴日期YM的所有用户参缴金额推算工资收入平均值,并对不同参缴日期YM的工资平均值计算比值,即年均工资上涨幅度f,同时考虑到各地区发展的不平衡,工资上涨不一致的问题,对各地区分别计算年均工资上涨幅度,通过年均上涨幅度计算出用户当前年份工资水平。另一方面对于未匹配中任何公积金参缴信息的客户,以行内存在代发工资的客户作为样本,代发工资作为客户真实的工资收入作为目标变量Y;同时对人行征信中的其他信息及用户申请信息加工衍生变量X,建立衍生变量X与真实工资Y之间相关关系,预测不存在公积金参缴信息客户的工资收入,在利用公积金参缴信息推算客户工资收入的过程中,更加充分的利用了参缴信息缺失客户的参缴信息,同时对于完全不存在参缴信息的客户,采用存在真实工资的样本,建立起其他征信信息和申请信息与真实工资的回归模型,用户预测该部分用户的工资收入,具有更好效果及更广的覆盖面。
图1为本发明提出的基于人行数据的客户收入评估方法示意图。
本发明提出一种基于人行数据的客户收入评估方法,其中
更加准确充分地利用到了人行征信中的公积金参缴信息及其他信息。对于匹配中公积金参缴信息的用户,通过参考公积金参缴日期YM及参缴地址,考虑到不同参缴日期YM工资上涨水平及不同参缴地址发展水平不同,更加准确的计算出不同参缴日期YM不同参缴地址的用户的当前工资水平。同时对于未匹配中参缴信息的用户,采用行内代发工资作为目标变量Y,通过对用户申请信息及征信其他信息字段加以衍生,建立起衍生变量X与真实工资Y之间的相关关系,更加准确全面的推算出所有用户的真实工资水平,具有更好效果及更广的覆盖面。
本发明提出的基于人行数据的客户收入评估方法,旨在更充分的利用公积金参缴信息及人行报告中的其他信息,通过两个不同的路线,确定用户的最终收入水平,提高了预测的准确性,具有更好效果及更广的覆盖面。
该方法包括以下步骤:
步骤1、获取所有进件用户的申请贷款信息及人行征信报告信息,并对所有用户是否存在用户公积金记录进行标记,若存在标记为1,若不存在公积金记录,则标记为0;
步骤2、针对步骤1中存在公积金记录的用户,获取用户人行报告中距今最近的一次公积金参缴日期YM,并以参缴日期YM为基础往前推一年,计算出近一年的平均公积金参缴额度,记为(YM,AM),其中YM表示参缴日期,AM表示参缴金额;
步骤3、针对步骤2获取的参缴日期YM和参缴金额AM,依据参缴日期YM对应的公积金参缴逻辑,推导用户参缴日期YM的工资水平,记为(YM,amount),amount表示参缴日期YM的工资收入;
步骤4、依据步骤3计算得出的用户参缴日期YM、工资收入amount及步骤1中征信报告参缴日期YM的参缴地记录,计算每一个参缴地所有用户后一年工资金额平均值相对于前一年工资金额平均值的比值,作为对应参缴地社会平均工资金额的年均上涨幅度f;
步骤5、针对步骤3中所有的用户,若参缴日期YM为当前年份,则直接代表了用户当前的工资收入;若参缴日期YM非当前年份,则依据步骤4中计算出的平均工资金额上涨幅度f,计算出参缴日期YM为非当前年份的用户税前工资额度折现为当前年份的税前工资额度,即获得用户较为准确的当前税前工资额度;
步骤6、针对步骤5中计算出的当前用户税前工资、依据当前税收逻辑转化为对应的用户当前税后工资额度;
步骤7、针对步骤1中未匹配中任何公积金信息的用户、即步骤1标记为0的用户,进一步匹配存在行内代发工资行为的用户作为收入预测模型的建模样本,以此代发工资作为样本用户的实际税后工资收入;
步骤8、针对步骤7中存在代发工资行为的样本用户,匹配用户申请数据及步骤1中的人行征信数据,并对所有数据进行数据清洗、特征衍生、缺失值填充、特征编码处理,形成可供入模使用的特征,以步骤7中的实际税后工资收入为Y值,衍生标准化的用户申请数据及人行征信数据为X值,建立起衍生变量X与实际税后工资收入Y值之间的线性回归模型,即收入预测模型,并以此模型在线预测未匹配中任何公积金信息的用户的工资收入。
本文发布于:2023-04-15 04:28:33,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/4/86944.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |