一种基于社交网络分析的信用风险评估方法

阅读: 评论:0

著录项
  • CN201910713787.9
  • 20190802
  • CN110413901A
  • 20191105
  • 深圳索信达数据技术有限公司
  • 付志超
  • G06F16/9536
  • G06F16/9536 G06Q40/02 G06Q50/00

  • 广东省深圳市南山区高新南六道6号迈科龙大厦13层1301A室
  • 广东(44)
  • 深圳市千纳专利代理有限公司
  • 黄良宝
摘要
一种基于社交网络分析的信用风险评估方法,涉及到金融信贷风控评估系统技术领域,解决现有的金融信贷风控评估系统的金融信贷风险评估方法人工依赖程序高,存在欺诈识别率低的技术不足,包括有:数据收集和清洗;社交网络构建;社交网络优化;在基于历史申请件织成不同大小的社交网络,对于申请件少于预设值的社交网络,进行切割;网络评分模型构建;实现对申请件的风险量化;网络图形展示。从新的模式来进行风险评估,不仅是对当前风险评估方法的补充,而且对于团伙或体欺诈有更有效的识别。
权利要求

1.一种基于社交网络分析的信用风险评估方法,其特征在于所述方法包括有:

数据收集和清洗;收集申请件对应申请人的相关社交属性特征,并进行清洗、标准化和分组处理;

社交网络构建;以申请件为中心节点,相关社交属性特征信息为连接节点,根据不同申请件在相同连接节点的匹配关系,进行网络图构建;

社交网络优化;在基于历史申请件织成不同大小的社交网络,对于申请件少于预设值的社交网络,进行切割;

网络评分模型构建;在完成社交网络优化后,需要对网络进行风险评分,每个申请件都将归属于一个网络;然后基于网络结构和申请件的相关特征,加工特征因子,构建风险评分模型,实现对申请件的风险量化;

网络图形展示;根据申请件的社交网络关系生成图数据,并展示成社交网络图,进一步根据需求定制展示风格。

2.根据权利要求1所述的一种基于社交网络分析的信用风险评估方法,其特征在于:所述的数据收集过程中,收集的申请件对应申请人的相关社交属性特征包括有:基于历史申请件的相关结构化和非结构化数据,包括地址、、朋友圈、联系人、身份证、推荐人,申请件的逾期和违约相关信息,申请人的信用信息,黑白名单信息。

3.根据权利要求1所述的一种基于社交网络分析的信用风险评估方法,其特征在于:数据清洗包括以下几个处理过程:

①数据缺失和异常的处理;

②实体抽取,从结构化数据和非结构化数据中抽取实体对象,实体属性,实体之间的关系;

③实体融合、消岐:保证一致性,对非结构化数据进行融合、消歧,标准化和模糊匹配,然后进行分组处理,同一组的文本变量分配相同组号,并对所有文本特征进行分组编码。

4.根据权利要求1所述的一种基于社交网络分析的信用风险评估方法,其特征在于:在完成社交网络优化后,所述的评分模型对网络进行风险评分,利用逻辑回归进行风险模型构建,根据历史申请件的标注信息,将申请件标记为正负样本,并根据网络构建相关特征,训练逻辑回归模型,如下:

logit(p)=β0+β1x1+β2x2+…+βkxk

其中p=P(y=1|X=x)的概率。

说明书
技术领域

本发明涉及到金融信贷风控评估系统技术领域,具体涉及到信用风险评估系统的信用风险评估方法改进方面。

近年来,随着金融信贷业务的快速发展,金融普惠大众的同时,也因逾期和违约给金融业带来了巨大损失。尤其是在宏观经济下行与监管重拳治理的双重冲击下,我国银行业陷入了不良攀升的困境,巨大的逾期贷款包袱造成信贷资源难以释放。风险管理能力的强弱,将成为未来区分银行经营优劣的核心。

当前的金融信贷风险评估方法主要以专家经验和传统的机器学习算法为主。专家经验依赖于业务人员对欺诈场景的熟悉度,规则简单,识别率不高。机器学习利用大量样本进行模型训练,能提高欺诈识别率。但这两类方法都只是利用申请件相关特征变量进行风控识别,没有挖掘申请件与申请件背后的人物社交网络关系来进行风险评估。

综上所述,本发明的目的在于解决现有的金融信贷风控评估系统的金融信贷风险评估方法人工依赖程序高,存在欺诈识别率低的技术不足,而提出一种基于社交网络分析的信用风险评估方法。

为了解决本发明所提出的技术问题,采用的技术方案为:

一种基于社交网络分析的信用风险评估方法,其特征在于所述方法包括有:

数据收集和清洗;收集申请件对应申请人的相关社交属性特征,并进行清洗、标准化和分组处理;

社交网络构建;以申请件为中心节点,相关社交属性特征信息为连接节点,根据不同申请件在相同连接节点的匹配关系,进行网络图构建;

社交网络优化;在基于历史申请件织成不同大小的社交网络,对于申请件少于预设值的社交网络,进行切割;

网络评分模型构建;在完成社交网络优化后,需要对网络进行风险评分,每个申请件都将归属于一个网络;然后基于网络结构和申请件的相关特征,加工特征因子,构建风险评分模型,实现对申请件的风险量化;

网络图形展示;根据申请件的社交网络关系生成图数据,并展示成社交网络图,进一步根据需求定制展示风格。

作为对本发明进一步限定的技术方案包括有:

所述的数据收集过程中,收集的申请件对应申请人的相关社交属性特征包括有:基于历史申请件的相关结构化和非结构化数据,包括地址、、朋友圈、联系人、身份证、推荐人,申请件的逾期和违约相关信息,申请人的信用信息,黑白名单信息。

数据清洗包括以下几个处理过程:

①数据缺失和异常的处理;

②实体抽取,从结构化数据和非结构化数据中抽取实体对象,实体属性,实体之间的关系;

③实体融合、消岐:保证一致性,对非结构化数据进行融合、消歧,标准化和模糊匹配,然后进行分组处理,同一组的文本变量分配相同组号,并对所有文本特征进行分组编码。

在完成社交网络优化后,所述的评分模型对网络进行风险评分,利用逻辑回归进行风险模型构建,根据历史申请件的标注信息,将申请件标记为正负样本,并根据网络构建相关特征,训练逻辑回归模型,如下:

logit(p)=β0+β1x1+β2x2+…+βkxk

其中p=P(y=1|X=x)的概率。

本发明的有益效果为:本发明通过收集申请件对应申请人的相关社交属性特征,然后经社交网络构建、社交网络优化和网络评分模型构建相关处理后,可以根据申请件的社交网络关系生成图数据,并展示成社交网络图,方便业务人员根据社交网络关系进行进一步的调查,本发明从新的模式来进行风险评估,不仅是对当前风险评估方法的补充,而且对于团伙或体欺诈有更有效的识别。

图1为本发明的工作流程示意图;

图2为社交网络图谱;

图3为根据申请件的社交网络关系生成图数据,并展示成的社交网络图谱。

以下结合附图和本发明优选的具体实施例对本发明作进一步地说明。

参照图1至图3中所示,本发明基于社交网络分析的信用风险评估方法,其特征在于所述方法包括有:

数据收集和清洗;收集申请件对应申请人的相关社交属性特征,并进行清洗、标准化和分组处理;

社交网络构建;以申请件为中心节点,相关社交属性特征信息为连接节点,根据不同申请件在相同连接节点的匹配关系,进行网络图构建;基于此,构建历史申请件的社交网络关系,将会形成大大小小的社交网络图谱,图2中所示;该社交网络关系图将展现不同申请件之间的连接关系。同一网络的申请件彼此之间存在一定关联。

社交网络优化;在基于历史申请件织成不同大小的社交网络,对于申请件少于预设值的社交网络,进行切割;有些社交网络可能只有一个申请件,没有跟其它申请件构建联系。有些网络可能存在成百上千个申请件,而网络的连接实际上是存在连接强弱。在弱连接的节点,需要对网络进行切割,形成相对合理的网络团;

网络评分模型构建;在完成社交网络优化后,需要对网络进行风险评分,每个申请件都将归属于一个网络;然后基于网络结构和申请件的相关特征,加工特征因子,构建风险评分模型,实现对申请件的风险量化;

网络图形展示;根据申请件的社交网络关系生成图数据,并展示成社交网络图,进一步根据需求定制展示风格。为了方便业务人员根据社交网络关系进行进一步的调查,可以根据申请件的社交网络关系生成图数据,并展示成社交网络图。进一步根据需求定制展示风格如图3中所示。

对本发明技术方案进行详细说明如下:

1、数据收集:收集整理社交网络相关数据。基于历史申请件的相关结构化和非结构化数据。包括但不限于:各类地址、、朋友圈、联系人、身份证、推荐人,申请件的逾期和违约相关信息,申请人的信用信息,黑白名单信息等。

2、数据清洗与预处理。主要包括以下几个处理过程:

①数据缺失和异常的处理。

②实体抽取。从结构化数据和非结构化数据中抽取实体对象,如:客户名、客户账号;实体属性,如:公司名、手机号、家庭住址;实体之间的关系,如:同事关系、邻居关系,客户跟手机号之间的持有关系等。

③实体融合、消岐:保证一致性。对非结构化数据进行融合、消歧,标准化和模糊匹配,然后进行分组处理,同一组的文本变量分配相同组号,并对所有文本特征进行分组编码。

3、社交网络构建。根据分组处理好的历史申请数据,以申请件作为中心节点、申请件的相关信息作为连接节点,按照无向边关系进行网络构建。将会形成大大小小的社交网络图谱。

4、社交网络优化。也叫网络切割或社发现。在基于历史申请件织成不同大小的社交网络,有些网络可能存在成百上千个申请件,而网络的连接实际上是存在连接强弱。在弱连接的节点,需要对网络进行切割,形成大小相对合理的网络团(社)。

5、网络评分模型构建。在完成社交网络优化后,需要对网络进行风险评分。此处利用逻辑回归进行风险模型构建。根据历史申请件的标注信息,将申请件标记为正负样本。并根据网络构建相关特征,训练逻辑回归模型。如下:

logit(p)=β0+β1x1+β2x3+…+βkxk

其中p=P(y=1|X=x)的概率。

可参考以下维度衍生特征:

1、风险特征。网络中申请件数、网络中黑名单申请数、网络中灰名单申请数、网络中逾期申请数、网络中违约申请件数,申请件历史是否发生逾期、违约等信息;

2、真实性特征。“同一身份证不同手机”规则触发数,“同一公司名不同地址”规则触发数,“同一邮箱不同身份证”规则触发数等;

3、基本属性特征。同一网络的平均申请年龄,收入等;

4、连接信息特征。申请件与黑名单、灰名单、逾期、违约申请件的连接数等;

6、网络图展示。为了方便业务人员根据社交网络关系进行进一步的调查,可以根据申请件的社交网络关系生成图数据,并展示成社交网络图。进一步根据需求定制展示风格。

本文发布于:2023-04-13 13:20:31,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/3/86036.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图