1.本发明涉及风险预警技术领域,特别是涉及
供应链金融信用风险预警方法及相关设备。
背景技术:
2.供应链金融上融资企业的信用风险是决定金融机构是否注资的重要衡量因素之一。
3.传统信用风险评估方法(如传统统计方法、传统机器学习方法)应用于供应链金融信用风险评估由于非线性拟合能力差以及模型欠稳定等原因,无法准确的对供应链金融信用风险进行预警。
技术实现要素:
4.本发明实施例的目的在于提供一种供应链金融信用风险预警方法及相关设备,以准确的对供应链金融信用风险进行预警。具体技术方案如下:一种供应链金融信用风险预警方法,包括:获得与供应链金融信用风险相关的
多个评估
指标;对
所述多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标;从多个样本企业所在供应链中提取所述多个目标指标的数据,将提取的数据及所述样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,所述预设的信用风险预测模型为基于注意力机制的长短期记忆模型;使用训练好的所述信用风险预测模型对目标企业的供应链金融信用风险进行预测。
5.可选的,所述多个评估指标,包括:企业素质、运营能力、偿债能力、成长能力、盈利能力、现金能力、信用历史、信用状况、资产周转能力、行业成长性、供应链运营状况中的至少一个。
6.可选的,所述对所述多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标,包括:对所述多个评估指标进行相关性分析,剔除所述多个评估指标中相关系数高于预设值的评估指标;使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标。
7.可选的,所述预设的信用风险预测模型的模型结构包括从下至上的长短期记忆网络层、注意力机制层和输出特征层,所述长短期记忆网络层为特征输入层,所述特征输入层的输入为所述多个目标指标的指标数据,所述输出特征层的输出为供应链金融信用风险。
8.可选的,所述对所述多个评估指标进行相关性分析,剔除所述多个评估指标中相关系数高于预设值的评估指标,包括:分别计算所述多个评估指标中不同的两个评估指标之间的皮尔逊相关系数,将所述皮尔逊相关系大于预设值的两个评估指标中的一个剔除;所述使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标,包括:将剩余的评估指标中的方差不满足预设阈值的评估指标剔除,获得初始指标集合,其中,所述剩余的评估指标为离散型变量;使用基于特征递归消除法的极致梯度提升分类器计算所述初始指标集合中每个评估指标的信用风险贡献度,筛选出所述信用风险贡献度满足预设要求的多个目标指标。
9.一种供应链金融信用风险预警装置,包括:获得单元,用于获得与供应链金融信用风险相关的多个评估指标;分析单元,用于对所述多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标;训练单元,用于从多个样本企业所在供应链中提取所述多个目标指标的数据,将提取的数据及所述样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,所述预设的信用风险预测模型为基于注意力机制的长短期记忆模型;预测单元,用于使用训练好的所述信用风险预测模型对目标企业的供应链金融信用风险进行预测。
10.可选的,所述分析单元,包括:剔除子单元,用于对所述多个评估指标进行相关性分析,剔除所述多个评估指标中相关系数高于预设值的评估指标;筛选子单元,用于使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标。
11.可选的,所述剔除子单元,具体用于:分别计算所述多个评估指标中不同的两个评估指标之间的皮尔逊相关系数,将所述皮尔逊相关系大于预设值的两个评估指标中的一个剔除;所述筛选子单元,具体用于:将剩余的评估指标中的方差不满足预设阈值的评估指标剔除,获得初始指标集合,其中,所述剩余的评估指标为离散型变量;使用基于特征递归消除法的极致梯度提升分类器计算所述初始指标集合中每个评估指标的信用风险贡献度,筛选出所述信用风险贡献度满足预设要求的多个目标指标。
12.一种计算机可读存储介质,所述计算机可读存储介质中存储有程序,所述程序被处理器执行时实现上述的任一种供应链金融信用风险预警方法。
13.一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述的任一种供应链金融信用风险预警方法。
14.本发明实施例提供的供应链金融信用风险预警方法及相关设备,可以获得与供应链金融信用风险相关的多个评估指标;对多个评估指标进行相关性分析,并基于相关性分
析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标;从多个样本企业所在供应链中提取多个目标指标的数据,将提取的数据及样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,预设的信用风险预测模型为基于注意力机制的长短期记忆模型;使用训练好的信用风险预测模型对目标企业的供应链金融信用风险进行预测。本技术通过基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标,可以有效降低指标的维度,并将重要的指标筛选出来。同时,本技术使用基于注意力机制的长短期记忆模型注了指标数据与信用风险之间的动态强相关性,提高信用风险预测的准确度。
15.当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。
附图说明
16.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
17.图1为本发明实施例提供的一种供应链金融信用风险预警方法的流程图;图2为供应链金融的一种可选的融资模式的示意图;图3为本发明实施例提供的另一种供应链金融信用风险预警方法的流程图;图4为本发明实施例提供的预设的信用风险预测模型的结构示意图;图5为本发明实施例提供的一种供应链金融信用风险预警装置的结构示意图;图6为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.如图1所示,本发明实施例提供的一种供应链金融信用风险预警方法,可以包括:s100、获得与供应链金融信用风险相关的多个评估指标。
20.具体的,上述多个评估指标可以是由技术专家进行选定的。在实际应用中,选定上述评估指标的过程可以包括:s1.1:考虑供应链金融的融资模式,综合考虑供应链金融信用风险的评估角度。
21.s1.2:分析影响供应链金融信用风险的重要因素,建立供应链金融信用风险评估指标体系。
22.其中,供应链金融信用风险评估指标体系中包括与供应链金融信用风险相关的多个评估指标。
23.步骤s1.1所述的供应链金融的融资模式包含应收账款质押、存货仓单质押、预付账款(保兑仓)等融资模式。
24.步骤s1.1所述的预付账款类供应链金融融资模式是指供应链下游的供应商可以通过与核心企业的交易项目获得银行授信或者获得企业预付给核心企业货物所需的贷款,从而保证了资金流的顺畅。
25.图2给出了供应链金融的一种可选的融资模式。如图2所示,供应链包括上游供应商、核心企业、下游分销商和金融机构,其中,上游供应商可以有多个,如上游供应商1,2
…
n;下游分销商也可以有多个,如下游分销商1,2
…
n。其中,上游供应商向核心企业提供原材料货物,并收到核心企业应收类票据;下游分销商收到核心企业提供的货物,核心企业收到下游分销商给予的预付类票据。金融机构可以为融资银行、机构投资者等,上游供应商可以凭应收类票据向金融机构融资,并获得金融机构的直接授信。下游分销商可以凭供应链商业合同融资,并获得金融机构的直接授信。金融机构向核心企业间接授信,核心企业承担上游供应商、下游分销商的连带责任。
26.步骤s1.1所述的供应链金融的融资模式对供应链金融信用风险评估的影响是银行的授信不仅仅依赖于融资企业的抵押物和融资企业的资信状况,而且转向依赖于核心企业与融资企业真实的贸易背景和真实贸易背景下产生的稳定现金流,以及核心企业的信用水平。
27.步骤s1.1所述的供应链金融信用风险的评估角度是融资企业资质、核心企业资质、融资资产状况以及供应链整体状况四个方面。
28.步骤s1.1所述的融资企业资质包含企业素质、运营能力、偿债能力、成长能力、盈利能力、现金能力以及信用历史。
29.步骤s1.1所述的核心企业资质包含信用状况、盈利能力以及偿债能力。
30.步骤s1.1所述的融资资产状况包含资产周转能力。
31.步骤s1.1所述的供应链整体状况包含行业成长性以及供应链运营状况。
32.步骤s1.2所述的影响供应链金融信用风险的重要因素即步骤s1.1所分析的评估角度下的二级指标因素。
33.步骤s1.2所述的供应链金融信用风险评估指标体系是二级指标因素所对应的定性和定量运营指标。
34.下面示例性示出供应链金融信用风险评估指标体系。
35.供应链金融信用风险评估指标可以包括:一级指标、二级指标和三级指标。
36.其中,一级指标可以包括:融资企业资质、核心企业资质、融资资产状况和供应链整体状况等。
37.其中,一级指标融资企业资质可以包括:企业素质、运营能力、偿债能力、成长能力、盈利能力、现金能力、信用历史等二级指标。
38.具体的,融资企业资质的二级指标企业素质可以包括:企业规模、所处生命周期、内部控制质量、会计信息披露质量、企业创新能力等三级指标。
39.具体的,融资企业资质的二级指标运营能力可以包括:总资产周转率等三级指标。
40.具体的,融资企业资质的二级指标偿债能力可以包括:资产负债率、流动比率、现金比率等三级指标。
41.具体的,融资企业资质的二级指标成长能力可以包括:营业利润增长率、净利润增长率等三级指标。
42.具体的,融资企业资质的二级指标盈利能力可以包括:净资产收益率、营业净利率等三级指标。
43.具体的,融资企业资质的二级指标现金能力可以包括:营业收入现金含量、营业收入现金净含量等三级指标。
44.具体的,融资企业资质的二级指标信用历史可以包括:履约历史等三级指标。
45.其中,一级指标核心企业资质包括:信用状况、盈利能力、偿债能力等二级指标。
46.具体的,核心企业资质的二级指标信用状况可以包括:信用评级、履约历史等三级指标。
47.具体的,核心企业资质的二级指标盈利能力可以包括:净资产收益率、营业净利率、资产报酬率等三级指标。
48.具体的,核心企业资质的二级指标偿债能力可以包括:流动比率、现金比率、资产负债率等三级指标。
49.其中,一级指标融资资产状况可以包括:资产周转能力等二级指标。
50.具体的,融资资产状况的二级指标资产周转能力可以包括:存货周转率、应收账款周转率、流动资产周转率等三级指标。
51.其中,一级指标供应链整体状况可以包括:行业成长性、供应链运营状况等二级指标。
52.具体的,供应链整体状况的二级指标行业成长性可以包括:行业竞争程度、行业营业收入增长率、行业可持续增长率等三级指标。
53.具体的,供应链整体状况的二级指标供应链运营状况可以包括:供应链集中度等三级指标。
54.在实际应用中,技术人员可以根据实际需要从上述各指标中选择全部或部分作为与供应链金融信用风险相关的多个评估指标,并使用选择的评估指标进行后续步骤的处理。
55.具体的,多个评估指标,可以包括:企业素质、运营能力、偿债能力、成长能力、盈利能力、现金能力、信用历史、信用状况、资产周转能力、行业成长性、供应链运营状况中的至少一个。
56.步骤s1.2所述的供应链集中度是指供应链上融资企业与核心企业合作关系密切程度,若融资企业供应链集中度高,与供应链合作关系越密切,则其所在供应链完整性和稳定性越高,表明融资企业供应链金融能力越强。
57.s200、对多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标。
58.如图3所示,步骤s200可以包括以下步骤:s210、对多个评估指标进行相关性分析,剔除多个评估指标中相关系数高于预设值的评估指标;s220、使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标。
59.在一可选实施例中,步骤s210可以具体包括:分别计算多个评估指标中不同的两个评估指标之间的皮尔逊相关系数,将皮尔逊相关系大于预设值的两个评估指标中的一个
剔除。
60.在一可选实施例中,步骤s220可以具体包括:将剩余的评估指标中的方差不满足预设阈值的评估指标剔除,获得初始指标集合,其中,剩余的评估指标为离散型变量;使用基于特征递归消除法的极致梯度提升分类器计算初始指标集合中每个评估指标的信用风险贡献度,筛选出信用风险贡献度满足预设要求的多个目标指标。
61.其中,本发明采用的相关性分析方法是皮尔逊相关系数(pearson相关系数)。
62.可选的,pearson相关系数大于0.8为高度相关,介于0.5到0.8之间为中度相关,介于0.3到0.5之间为弱相关,小于0.3为几乎不相关。当两变量之间皮尔逊相关系数的绝对值大于0.8时,说明两者的相关性较强,会影响其对被解释变量的可解释性,因此剔除与其他变量相关性高的一个。即:步骤s210中的预设值为0.8。
63.其中,基于特征递归消除法的模型xgboost是基于boosting算法改进的机器学习模型,是梯度提升决策树(gradient boosting decision tree,gbdt)的一种。该模型具有准确率高、运行速度快等优势,也可以在不进行插补预处理的情况下处理缺失值。
[0064] xgboost在求解过程中运用了二阶泰勒公式,可以更加准确迅速地得到目标函数最优解。xgboost将每棵cart(classification and regression trees,分类回归树)分值的和作为样本的预测值,最终预测函数如下:
[0065]
xgboost的目标函数为损失函数和正则化惩罚项的结合,一定程度上防止了过拟合,具体函数为:
[0066][0067]
其中,l(
·
)为损失函数;ω(
·
)为正则项;c为常数。
[0068]
正则化项由下面两部分组成:
[0069]
其中,wj为叶子节点权重;λ和γ为惩罚系数;t为树的个数。
[0070]
通过二阶泰勒公式展开,得到如下函数:
[0071]
其中,gi,hi分别是一阶和二阶导数。
[0072]
将正则化项带入二阶泰勒展开式,并去掉常数项,得到:
[0073]
令,,当时,目标函数取得如下最小值:
[0074]
xgboost树生成的分裂点确定公式为:
[0075]
其中,g
l
,h
l
,gr,hr表示分裂后不同子树的相应值。
[0076]
结构评分gain越大,表明切分后的目标函数值越低,效果越好。
[0077]
步骤s220的指标筛选过程如下:首先,移除离散型变量中所有方差不满足阈值的特征,将阈值设置为99%。
[0078]
移除低方差特征后,使用特征递归消除方法继续特征选择。递归特征消除算法在选择特征时以递归方式考虑越来越小的特征集合。首先,使用xgboost分类器在初始特征集合上训练,计算模型的特征重要度从而获得每个特征的重要性,然后将重要性较低的一部分特征从集合中删除。在特征集合上重复进行上述过程,直到特征数量满足要求为止,最终得到一组最优特征子集。
[0079] xgboost算法的参数结构包括:决策树数量、学习速率(learning_rate)、树的最大深度(max_depth)以及决定最小叶子节点样本权重(min_child_weight),调整参数结构以达到最优的特征选择结果,其他参数使用sklearn默认设置。
[0080]
s300、从多个样本企业所在供应链中提取多个目标指标的数据,将提取的数据及样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,预设的信用风险预测模型为基于注意力机制的长短期记忆模型。
[0081]
可选的,步骤s300可以包括以下步骤:s3.1:从多个样本企业所在供应链中提取多个目标指标的数据,将提取的数据及样本企业的已知信用数据作为样本数据并进行预处理,实现定性指标可量化。
[0082]
s3.2:使用预处理后的样本数据对预设的信用风险预测模型进行训练,其中,预设的信用风险预测模型为基于注意力机制的长短期记忆模型。其中,预设的信用风险预测模型的输入为所述多个目标指标的指标数据,输出为供应链金融信用风险。预设的信用风险预测模型可以为以季度为单位的时间序列上的滚动lstm-a模型。
[0083]
步骤s3.1从多个样本企业所在供应链中提取多个目标指标的数据的一种可选的
具体执行过程如下:选取制造业中的供应链上的中小企业和核心企业作为研究对象,从国泰安数据库中选取制造业供应链2014年-2021年企业的数据进行实证研究。通过查企业、财经门户网站、公司信息披露网站、公司年报等信息,查中小企业合作的核心企业,出每个中小企业所在的供应链。查阅制造业中小企业的年报,剔除少于两年财报数据或财务数据不全或异常的样本;以中小企业年报中披露的前五大供应商或客户中主板上市的企业为核心企业,剔除核心企业为非上市或无法查询核心企业的样本;剔除核心企业不存在信用评级的样本。
[0084]
步骤s3.1所述的预处理方式如下:融资企业信用风险度量:当企业的带息负债率高于《企业绩效评价标准值》中的较低值,则企业被定义为高风险企业,赋值为0;否则被定义为低风险企业,赋值为1。
[0085]
企业所处的生命周期:以营业收入增长率所处的区间定性表示,小于5%(衰退期)赋值为 0,大于10%(成长期)赋值为1,处于5%~10%(成熟期)赋值为2。
[0086]
内部控制质量:通过查看企业内部控制评价报告是否存在缺陷进行赋值,假设内部控制存在缺陷,赋值为0,反之赋值为1。
[0087]
会计信息披露质量:根据公司会计信息披露质量考评结果的等级赋值,分别赋值为 4(优秀)、3(良好)、2(合格)、1(不合格)。
[0088]
企业创新能力:研发支出占营业收入的比例。
[0089]
企业信用历史:以企业是否存在因履约纠纷而被起诉来定性衡量企业信用历史,存在因履约纠纷而被起诉的企业赋值为0,否则赋值为1。
[0090]
核心企业信用评级: aa 级以下的被定义为高信用风险,赋值为0,反之则被定义为低信用风险,赋值为1。
[0091]
行业竞争程度:将深圳a股该行业内的公司总数由小到大划分为4个区间来定性衡量行业竞争程度,分别赋值为4、3、2、1。
[0092]
预设的信用风险预测模型的结构可以如图4所示,预设的信用风险预测模型的模型结构包括从下至上的长短期记忆网络层(lstm层)、注意力机制层和输出特征层,所述长短期记忆网络层为特征输入层,所述特征输入层的输入为所述多个目标指标的指标数据,所述输出特征层的输出为供应链金融信用风险。
[0093]
下面分别说明lstm层和注意力机制层:lstm层:x
t
表示t时期的输入向量,,m表示向量中指标的个数,s
ti
表示t时期的评估指标的值,如资产负债率、流动比率、净利润增长率、资产报酬率等对融资企业信用风险贡献度靠前的指标数据。模型通过一个单层的lstm,建模多变量输入的时间序列的动态演变过程,对于每一个时间步都有:,其中,h
t
,c
t
分别表示当前t时期的隐状态以及记忆状态。
[0094]
注意力机制层:注意力机制通过计算注意力概率分布,突出了某些重要输入对于输出的影响作用。如图4所示,注意力层将lstm的输出h
t
作为输入,以对lstm各时刻的输出分别计算重要度,最后根据重要度对结果进行加和汇总。
[0095]
注意力机制对不同时刻不同输入的权重分配公式为:
[0096][0097]
其中,a
t
代表t第个时间点输出的权重,最终得到c代表lstm各个时间点输出的加权合计,等同于包含了重要性信息的新输出h
t
,最终lstm-a模型将会输出一个特征向量。
[0098]
本发明采用基于滚动窗口的滚动样本预测评价方法,通过计算预测值与真实值的滚动窗口误差值获取更多的预测训练。滚动窗口是根据指定的单位长度来构建时间序列。以一步向前滚动样本预测为例:时间序列x1,x2,
…
,xn用于获取x
n+1
的预测值;时间序列x2,x3,
…
,x
n+1
用于获取x
n+2
的预测值;以此类推。
[0099]
步骤s3.2所述的lstm-a模型训练过程包括:将s3.1预处理后的指标数据作为lstm-a模型的不同时刻的多维向量输入,形式为,x
t
表示t时期的输入向量,s
ti
表示t时期的评估指标的值,如资产负债率、流动比率、净利润增长率、资产报酬率等对融资企业信用风险贡献度靠前的指标数据。
[0100]
模型将通过一个单层的lstm,以季度为时间序列的基本单位,输入x
t
,输出h
t
,采用滚动样本预测方法,以一定时间长度作为滚动窗口进行预测,采用的lstm-a得到一个二元非线性分类模型。
[0101]
将通过单层lstm后的输出h
t
作为注意力机制层的输入,以对lstm各时刻的输出分别计算重要度,最后根据重要度对结果进行加和汇总,输出一个特征向量。其中,将数据集70%作为训练集、30%作为测试集。
[0102]
采用指标衡量lstm-a模型准确度,如准确率、auc以及f1值。在训练过程中,不断调节模型参数结构,使得模型预测准确率达到最优,则停止调节。采用dropout方法关闭lstm网络中某些神经单元,防止模型过拟合。具体地,模型优化器选用adam,模型参数结构包括时间步长、预测步长、迭代次数、批量大小(batch_size)、隐藏神经元个数、激活函数(tanh、relu、softmax)、dropout值以及损失函数等。
[0103]
具体地,衡量指标计算公式为:准确率:
[0104]
精确率:
[0105]
召回率:
[0106]
f1值:
[0107]
真阳性率:
[0108]
假阳性率:
[0109]
其中,tp(true positive)是真正例,即真实正例中预测也是正例的个数;fp(false positive)是假正例,即真实反例中预测是正例的个数;fn(false negative)和tn(true negative)同理。
[0110]
其中,准确率表示实际正确样本占总样本的比例;f1值表示精确率和召回率的调和平均值。roc曲线是以真阳性率(tpr)和假阳性率(fpr)分别作为横坐标和纵坐标所形成的折线图,auc被定义为roc曲线下与坐标轴围成的面积,auc值越大,说明模型分类性能越好。
[0111]
所述的lstm层的具体处理步骤如下:首先,输入门i
t
从输入x
t
中过滤并提取新信息,用于创建更新状态的候选值。其中,h
t-1
和x
t
先经过s函数层得到i
t
(介于0到1之间的数值),i
t
作为概率对本次学习的所有知识进行一个过滤,补充到之前学习的信息中。
[0112][0113][0114]
其次,遗忘门f
t
通过读取h
t-1
和x
t
,并通过s函数层得到一个介于0到1之间的数值,其中,1表示“完全保留”,0表示“完全舍弃”。通过遗忘门f
t
过滤后可以保留包含长期趋势的信息并丢弃非关键信息。
[0115][0116]
通过从旧向量组中删除部分信息并添加过滤后的候选值,将旧向量组的状态c
t-1
更新为新向量组状态c
t
。其中,f
tct-1
是遗忘旧信息,是添加新信息,f
t
是旧记忆的通过率,i
t
是本次新信息的过滤器,是本次学习的新信息。
[0117][0118]
最后,输出门o
t
对更新状态c
t
进行过滤,根据更新状态和输出门状态计算最终输出h
t
。
[0119]
[0120][0121]
以上lstm公式中:wc,wf,wo代表合适的权重矩阵;bi,bc,bf,bo代表相应的偏差向量;σ(
·
)和tanh(
·
)分别是s型函数(sigmoid函数)和双曲正切函数。
[0122]
s400、使用训练好的信用风险预测模型对目标企业的供应链金融信用风险进行预测。
[0123]
本技术增加了定性指标数据处理方式,为了更加客观地表示定性指标,通过财务数据转换或统计数据等级化的方式处理数据,避免使用主观分析法或专家打分法等主观性过强的方法,提高风险预测的准确度。
[0124]
本技术增加了基于特征递归消除法的xgboost特征选择的指标筛选方案,降低数据维度,从而在保证提升后续预测模型准确度的同时尽可能降低计算复杂度,提高模型运行效率;另外可以提高后续lstm-a模型预测精度,规避过拟合现象。本发明增加了指标筛选过程,得到最优特征子集,有利于降低后续预测模型的计算复杂度以及规避过拟合现象。本发明采用了皮尔逊相关系数进行第一次筛选,剔除变量间具有较高相关性的指标变量,保留不同维度的低相关性指标,然后采用基于特征递归消除的xgboost筛选出对信用风险贡献度高的指标数据集合作为后续预测模型的输入。
[0125]
本技术增加了融合了注意力机制的lstm预测模型(lstm-a),首次提出了建立在时间序列上的供应链金融信用风险预警模型,关注了指标数据与信用风险之间的动态强相关性,提高信用风险预测的准确度。
[0126]
在模型训练阶段,传统信用风险评估方法(如传统统计方法、传统机器学习方法)可作为替代方案,但其应用于供应链金融信用风险评估或非线性拟合能力差,或模型欠稳定。另外,目前尚无基于时间序列的供应链金融信用风险预警方法,本发明填补了供应链金融信用风险预测领域的空白;而且,仅仅采用lstm模型时未考虑不同指标不同时刻的权重分配,模型准确度会下降。本发明以多角度分析建立了较全面的供应链金融信用风险评估指标体系,采用了较客观的定性指标数据预处理方式,从计算效率和后续预测模型性能考量适度筛选出了对信用风险贡献度靠前的指标从而降低模型计算复杂度、规避预测模型过拟合导致的预测精度下降问题,提高了后续预测模型的运算效率和精确度,从指标与信用风险的动态强相关性考量建立了基于时间序列的供应链金融信用风险预警模型,填补了供应链金融信用风险在时间序列预测领域的空白。
[0127]
与上述方法实施例相对应,如图5所示,本技术还提供了一种供应链金融信用风险预警装置,可以包括:获得单元100,用于获得与供应链金融信用风险相关的多个评估指标;分析单元200,用于对多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标;训练单元300,用于从多个样本企业所在供应链中提取多个目标指标的数据,将提取的数据及样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,预设的信用风险预测模型为基于注意力机制的长短期记忆模型;预测单元400,用于使用训练好的信用风险预测模型对目标企业的供应链金融信用风险进行预测。
[0128]
可选的,分析单元200,可以包括:剔除子单元,用于对多个评估指标进行相关性分析,剔除多个评估指标中相关系数高于预设值的评估指标;筛选子单元,用于使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标。
[0129]
可选的,剔除子单元,具体用于:分别计算多个评估指标中不同的两个评估指标之间的皮尔逊相关系数,将皮尔逊相关系大于预设值的两个评估指标中的一个剔除;筛选子单元,具体用于:将剩余的评估指标中的方差不满足预设阈值的评估指标剔除,获得初始指标集合,其中,剩余的评估指标为离散型变量;使用基于特征递归消除法的极致梯度提升分类器计算初始指标集合中每个评估指标的信用风险贡献度,筛选出信用风险贡献度满足预设要求的多个目标指标。
[0130]
所述供应链金融信用风险预警装置包括处理器和存储器,上述获得单元、分析单元、训练单元和预测单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0131]
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来对目标企业的供应链金融信用风险进行预测。
[0132]
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述供应链金融信用风险预警方法。
[0133]
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述供应链金融信用风险预警方法。
[0134]
如图6所示,本发明实施例提供了一种电子设备70,电子设备70包括至少一个处理器701、以及与处理器701连接的至少一个存储器702、总线703;其中,处理器701、存储器702通过总线703完成相互间的通信;处理器701用于调用存储器702中的程序指令,以执行上述的供应链金融信用风险预警方法。本文中的电子设备可以是服务器、pc、pad、手机等。
[0135]
本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有上述的供应链金融信用风险预警方法包括的步骤的程序。
[0136]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0137]
在一个典型的配置中,设备包括一个或多个处理器(cpu)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。
[0138]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。
[0139]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。
计算机的存储介质的例子包括,但不限于相变内存 (pram)、静态随机存取存储器 (sram)、动态随机存取存储器 (dram)、其他类型的随机存取存储器 (ram)、只读存储器 (rom)、电可擦除可编程只读存储器 (eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器 (cd-rom)、数字多功能光盘 (dvd) 或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
[0140]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0141]
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0142]
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0143]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
技术特征:
1.一种供应链金融信用风险预警方法,其特征在于,包括:获得与供应链金融信用风险相关的多个评估指标;对所述多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标;从多个样本企业所在供应链中提取所述多个目标指标的数据,将提取的数据及所述样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,所述预设的信用风险预测模型为基于注意力机制的长短期记忆模型;使用训练好的所述信用风险预测模型对目标企业的供应链金融信用风险进行预测。2.根据权利要求1所述的方法,其特征在于,所述多个评估指标,包括:企业素质、运营能力、偿债能力、成长能力、盈利能力、现金能力、信用历史、信用状况、资产周转能力、行业成长性、供应链运营状况中的至少一个。3.根据权利要求1所述的方法,其特征在于,所述对所述多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标,包括:对所述多个评估指标进行相关性分析,剔除所述多个评估指标中相关系数高于预设值的评估指标;使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标。4.根据权利要求1所述的方法,其特征在于,所述预设的信用风险预测模型的模型结构包括从下至上的长短期记忆网络层、注意力机制层和输出特征层,所述长短期记忆网络层为特征输入层,所述特征输入层的输入为所述多个目标指标的指标数据,所述输出特征层的输出为供应链金融信用风险。5.根据权利要求3所述的方法,其特征在于,所述对所述多个评估指标进行相关性分析,剔除所述多个评估指标中相关系数高于预设值的评估指标,包括:分别计算所述多个评估指标中不同的两个评估指标之间的皮尔逊相关系数,将所述皮尔逊相关系大于预设值的两个评估指标中的一个剔除;所述使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标,包括:将剩余的评估指标中的方差不满足预设阈值的评估指标剔除,获得初始指标集合,其中,所述剩余的评估指标为离散型变量;使用基于特征递归消除法的极致梯度提升分类器计算所述初始指标集合中每个评估指标的信用风险贡献度,筛选出所述信用风险贡献度满足预设要求的多个目标指标。6.一种供应链金融信用风险预警装置,其特征在于,包括:获得单元,用于获得与供应链金融信用风险相关的多个评估指标;分析单元,用于对所述多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标;训练单元,用于从多个样本企业所在供应链中提取所述多个目标指标的数据,将提取的数据及所述样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,所述预设的信用风险预测模型为基于注意力机制的长短期记忆模型;
预测单元,用于使用训练好的所述信用风险预测模型对目标企业的供应链金融信用风险进行预测。7.根据权利要求6所述的装置,其特征在于,所述分析单元,包括:剔除子单元,用于对所述多个评估指标进行相关性分析,剔除所述多个评估指标中相关系数高于预设值的评估指标;筛选子单元,用于使用基于特征递归消除法的模型从剩余的评估指标中筛选出信用风险贡献度满足预设要求的多个目标指标。8.根据权利要求7所述的装置,其特征在于,所述剔除子单元,具体用于:分别计算所述多个评估指标中不同的两个评估指标之间的皮尔逊相关系数,将所述皮尔逊相关系大于预设值的两个评估指标中的一个剔除;所述筛选子单元,具体用于:将剩余的评估指标中的方差不满足预设阈值的评估指标剔除,获得初始指标集合,其中,所述剩余的评估指标为离散型变量;使用基于特征递归消除法的极致梯度提升分类器计算所述初始指标集合中每个评估指标的信用风险贡献度,筛选出所述信用风险贡献度满足预设要求的多个目标指标。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序,所述程序被处理器执行时实现权利要求1至5中任一项所述的供应链金融信用风险预警方法。10.一种电子设备,其特征在于,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行权利要求1至5中任一项所述的供应链金融信用风险预警方法。
技术总结
本发明实施例提供了一种供应链金融信用风险预警方法及相关设备,可以获得与供应链金融信用风险相关的多个评估指标;对多个评估指标进行相关性分析,并基于相关性分析结果剔除部分评估指标,使用基于特征递归消除法的模型从剩余的评估指标中筛选出多个目标指标;从多个样本企业所在供应链中提取多个目标指标的数据,将提取的数据及样本企业的已知信用数据作为样本数据,对预设的信用风险预测模型进行训练,其中,预设的信用风险预测模型为基于注意力机制的长短期记忆模型;使用训练好的信用风险预测模型对目标企业的供应链金融信用风险进行预测。本申请提高信用风险预测的准确度。度。度。
技术研发人员:
王栋 李达 冯景丽 王合建 赵丽花 郭庆雷 陈浩 黄建平 李钟煦 颜拥 韩嘉佳 姚影
受保护的技术使用者:
国网区块链科技(北京)有限公司 国网浙江省电力有限公司电力科学研究院 国家电网有限公司
技术研发日:
2023.02.15
技术公布日:
2023/3/27