G06Q40/02
1.一种服务器,其特征在于,所述服务器包括:存储器、处理器及存储在所述存储器上 并可在所述处理器上运行的客户关系挖掘的系统,所述客户关系挖掘的系统被所述处理器 执行时实现如下步骤:
设置步骤:定义客户贷款的负面标签,并设置客户之间有关联关系的多种类型的关联 因子以及多种类型的关联因子的优先顺序;
提取步骤:从数据库中读取一预设时间范围内的贷款申请数据,从所述贷款申请数据 中提取各笔贷款申请中的负面标签字段,以及一个或多个关联因子;
建团初始步骤:读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客户,从 该第一客户的关联因子中读取优先顺序最高的关联因子,在所述贷款申请数据中查与读 取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团;
建团扩展步骤:按照读取的该笔贷款申请的剩余的关联因子的优先顺序,在所述贷款 申请数据中依次查与剩余的关联因子相同的贷款申请,将查到的贷款申请依次加入该 客户团;
客户团关系分析步骤:分析得到该客户团中贷款申请之间的关联信息,所述关联信息 包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比及 团中负面标签客户占比。
2.根据权利要求1所述的服务器,其特征在于,所述关联因子的类型包括身份证类、电 话类、设备类、GPS类及IP类,所述多种类型的关联因子的优先顺序为按照所述身份证类、电 话类、设备类、GPS类及IP类的先后顺序。
3.根据权利要求1所述的服务器,其特征在于,所述客户关系挖掘的系统被所述处理器 执行时,还实现如下步骤:
若有贷款申请中的关联因子与读取的该笔贷款申请中的关联因子均不相同,则独立成 团,将独立成团的贷款申请按照所述建团初始步骤及建团扩展步骤进行扩建,直至将所述 贷款申请数据划分为多个客户团。
4.根据权利要求1至3任一项所述的服务器,其特征在于,所述客户关系挖掘的系统被 所述处理器执行时,还实现如下步骤:
模型建立步骤:将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象 为边,构建客户关系网模型;
标签步骤:根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负 面标签;
初始赋值步骤:为不同类型的关联因子赋予不同的因子权重,根据负面标签的种类为 相应顶点的负面标签赋予相应的初始值;
边权重计算步骤:根据客户关系网模型中每条边代表的关联因子计算每条边的权重;
顶点得分计算步骤:选择一个有负面标签的顶点作为起点,根据起点的初始值及相邻 边的权重计算得到相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得分; 及
风险量化步骤:根据所述客户关系网模型中每个顶点的得分提示对应的客户申请贷款 的风险系数,根据客户关系网模型中每个顶点的得分之和提示该客户团的风险系数。
5.根据权利要求4所述的服务器,其特征在于,所述边权重计算步骤包括:分别从每条 边连接的顶点所代表的客户之间关联的每种类型的因子中选取因子权重最大的值,并从选 取出的因子权重中选取最大值作为该条边的权重;
所述顶点得分计算步骤包括:
获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点,根据所述起 点的初始值及相邻边的权重计算得到相邻顶点的得分;
若相邻顶点的得分大于等于所述起点的初始值,则结束计算;
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为一个,则以该相邻顶 点的得分及下一相邻边的权重计算下一相邻顶点的得分;
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为两个或两个以上,则 获取该相邻顶点的得分中最大的得分,以该最大的得分及下一相邻边的权重计算下一相邻 顶点的得分,直至计算完所述客户关系网模型中每个顶点的得分。
6.一种客户关系挖掘的方法,其特征在于,所述客户关系挖掘的方法包括:
设置步骤:定义客户贷款的负面标签,并设置客户之间有关联关系的多种类型的关联 因子以及多种类型的关联因子的优先顺序;
提取步骤:从数据库中读取一预设时间范围内的贷款申请数据,从所述贷款申请数据 中提取各笔贷款申请中的负面标签字段,以及一个或多个关联因子;
建团初始步骤:读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客户,从 该第一客户的关联因子中读取优先顺序最高的关联因子,在所述贷款申请数据中查与读 取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团;
建团扩展步骤:按照读取的该笔贷款申请的剩余的关联因子的优先顺序,在所述贷款 申请数据中依次查与剩余的关联因子相同的贷款申请,将查到的贷款申请依次加入该 客户团;
客户团关系分析步骤:分析得到该客户团中贷款申请之间的关联信息,所述关联信息 包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比及 团中负面标签客户占比。
7.根据权利要求6所述的客户关系挖掘的方法,其特征在于,所述关联因子的类型包括 身份证类、电话类、设备类、GPS类及IP类,所述多种类型的关联因子的优先顺序为按照所述 身份证类、电话类、设备类、GPS类及IP类的先后顺序。
8.根据权利要求6所述的客户关系挖掘的方法,其特征在于,所述建团扩展步骤之后还 包括:
若有贷款申请中的关联因子与读取的该笔贷款申请中的关联因子均不相同,则独立成 团,将独立成团的贷款申请按照所述建团初始步骤及建团扩展步骤进行扩建,直至将所述 贷款申请数据划分为多个客户团。
9.根据权利要求6至8任一项所述的客户关系挖掘的方法,其特征在于,还包括:
模型建立步骤:将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象 为边,构建客户关系网模型;
标签步骤:根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负 面标签;
初始赋值步骤:为不同类型的关联因子赋予不同的因子权重,根据负面标签的种类为 相应顶点的负面标签赋予相应的初始值;
边权重计算步骤:根据客户关系网模型中每条边代表的关联因子计算每条边的权重;
顶点得分计算步骤:选择一个有负面标签的顶点作为起点,根据起点的初始值及相邻 边的权重计算得到相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得分; 及
风险量化步骤:根据所述客户关系网模型中每个顶点的得分提示对应的客户申请贷款 的风险系数,根据客户关系网模型中每个顶点的得分之和提示该客户团的风险系数。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有客户关 系挖掘的系统,所述客户关系挖掘的系统被处理器执行时实现如权利要求6至9中任一项所 述的客户关系挖掘的方法的步骤。
本发明涉及金融技术领域,尤其涉及一种服务器、客户关系挖掘的方法及计算机 可读存储介质。
目前,关于贷款客户的风险分析方案中,一般是通过设计风控规则,对客户进行层 层校验,最终根据客户对于风控规则的匹配程度,得出不同的风控策略。这种方式停留在对 单个客户的各项指标的校验,无法客观、整体分析客户与其他客户的关联影响。
本发明的目的在于提供一种服务器、客户关系挖掘的方法及计算机可读存储介 质,旨在客观、整体分析客户与其他客户的关联影响。
为实现上述目的,本发明提供一种服务器,所述服务器包括:存储器、处理器及存 储在所述存储器上并可在所述处理器上运行的客户关系挖掘的系统,所述客户关系挖掘的 系统被所述处理器执行时实现如下步骤:
设置步骤:定义客户贷款的负面标签,并设置客户之间有关联关系的多种类型的 关联因子以及多种类型的关联因子的优先顺序;
提取步骤:从数据库中读取一预设时间范围内的贷款申请数据,从所述贷款申请 数据中提取各笔贷款申请中的负面标签字段,以及一个或多个关联因子;
建团初始步骤:读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客 户,从该第一客户的关联因子中读取优先顺序最高的关联因子,在所述贷款申请数据中查 与读取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团;
建团扩展步骤:按照读取的该笔贷款申请的剩余的关联因子的优先顺序,在所述 贷款申请数据中依次查与剩余的关联因子相同的贷款申请,将查到的贷款申请依次加 入该客户团;
客户团关系分析步骤:分析得到该客户团中贷款申请之间的关联信息,所述关联 信息包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占 比及团中负面标签客户占比。
优选地,所述关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类,所述 多种类型的关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先 后顺序。
优选地,所述客户关系挖掘的系统被所述处理器执行时,还实现如下步骤:
若有贷款申请中的关联因子与读取的该笔贷款申请中的关联因子均不相同,则独 立成团,将独立成团的贷款申请按照所述建团初始步骤及建团扩展步骤进行扩建,直至将 所述贷款申请数据划分为多个客户团。
优选地,所述客户关系挖掘的系统被所述处理器执行时,还实现如下步骤:
模型建立步骤:将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系 抽象为边,构建客户关系网模型;
标签步骤:根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打 上负面标签;
初始赋值步骤:为不同类型的关联因子赋予不同的因子权重,根据负面标签的种 类为相应顶点的负面标签赋予相应的初始值;
边权重计算步骤:根据客户关系网模型中每条边代表的关联因子计算每条边的权 重;
顶点得分计算步骤:选择一个有负面标签的顶点作为起点,根据起点的初始值及 相邻边的权重计算得到相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得 分;及
风险量化步骤:根据所述客户关系网模型中每个顶点的得分提示对应的客户申请 贷款的风险系数,根据客户关系网模型中每个顶点的得分之和提示该客户团的风险系数。
优选地,所述边权重计算步骤包括:分别从每条边连接的顶点所代表的客户之间 关联的每种类型的因子中选取因子权重最大的值,并从选取出的因子权重中选取最大值作 为该条边的权重;
所述顶点得分计算步骤包括:
获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点,根据所 述起点的初始值及相邻边的权重计算得到相邻顶点的得分;
若相邻顶点的得分大于等于所述起点的初始值,则结束计算;
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为一个,则以该相 邻顶点的得分及下一相邻边的权重计算下一相邻顶点的得分;
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为两个或两个以 上,则获取该相邻顶点的得分中最大的得分,以该最大的得分及下一相邻边的权重计算下 一相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得分。
为实现上述目的,本发明还提供一种客户关系挖掘的方法,所述客户关系挖掘的 方法包括:
设置步骤:定义客户贷款的负面标签,并设置客户之间有关联关系的多种类型的 关联因子以及多种类型的关联因子的优先顺序;
提取步骤:从数据库中读取一预设时间范围内的贷款申请数据,从所述贷款申请 数据中提取各笔贷款申请中的负面标签字段,以及一个或多个关联因子;
建团初始步骤:读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客 户,从该第一客户的关联因子中读取优先顺序最高的关联因子,在所述贷款申请数据中查 与读取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团;
建团扩展步骤:按照读取的该笔贷款申请的剩余的关联因子的优先顺序,在所述 贷款申请数据中依次查与剩余的关联因子相同的贷款申请,将查到的贷款申请依次加 入该客户团;
客户团关系分析步骤:分析得到该客户团中贷款申请之间的关联信息,所述关联 信息包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占 比及团中负面标签客户占比。
优选地,所述关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类,所述 多种类型的关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先 后顺序。
优选地,所述建团扩展步骤之后还包括:
若有贷款申请中的关联因子与读取的该笔贷款申请中的关联因子均不相同,则独 立成团,将独立成团的贷款申请按照所述建团初始步骤及建团扩展步骤进行扩建,直至将 所述贷款申请数据划分为多个客户团。
优选地,还包括:
模型建立步骤:将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系 抽象为边,构建客户关系网模型;
标签步骤:根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打 上负面标签;
初始赋值步骤:为不同类型的关联因子赋予不同的因子权重,根据负面标签的种 类为相应顶点的负面标签赋予相应的初始值;
边权重计算步骤:根据客户关系网模型中每条边代表的关联因子计算每条边的权 重;
顶点得分计算步骤:选择一个有负面标签的顶点作为起点,根据起点的初始值及 相邻边的权重计算得到相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得 分;及
风险量化步骤:根据所述客户关系网模型中每个顶点的得分提示对应的客户申请 贷款的风险系数,根据客户关系网模型中每个顶点的得分之和提示该客户团的风险系数。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有客户 关系挖掘的系统,所述客户关系挖掘的系统被处理器执行时实现上述的客户关系挖掘的方 法的步骤。
本发明的有益效果是:本发明从数据库读取一时间范围内的金融贷款申请数据, 从每条贷款申请中提取预先设置的一个或多个关联因子;选取一笔贷款申请,按照该贷款 申请的关联因子的优先顺序逐步从剩余贷款申请中匹配出与该贷款申请有关联关系的申 请,以建立客户团;分析得到该客户团中贷款申请之间的关联信息,包括团中申请关系紧密 度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比、团中负面标签客户占比, 通过这种方式,可以根据关联因子将金融机构接收到的大批量零散的贷款申请进行精确匹 配、从多个维度挖掘客户间的关联,将批量的贷款申请根据关联关系划分为客户团表示客 户间的关联,供风控客观、整体了解零散的贷款申请之间的关系,以掌控风险。
图1为本发明各个实施例一可选的应用环境示意图;
图2是图1中服务器一实施例的硬件架构的示意图;
图3为构建的客户关系网模型的示意图;
图4为本发明客户关系挖掘的方法一实施例的流程示意图;
图5为本发明客户关系挖掘的方法另一实施例的流程示意图。
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不 用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前 提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能 理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第 一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技 术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的 结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求 的保护范围之内。
参阅图1,是本发明各个实施例一可选的应用环境示意图。在本实施例中,本发明 可应用于包括,但不仅限于,服务器1、客户端2、网络3、数据库4的应用环境中。其中,数据库 4可以独立于服务器1之外的服务器中,也可以安装在服务器1中。服务器1通过网络3与客户 端2所在的设备进行通信。
所述客户端2所在的设备包括,但不限于,任何一种可与用户通过键盘、鼠标、遥控 器、触摸板或者声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智 能手机、个人数字助理(Personal Digital Assistant,PDA)、游戏机、交互式网络电视 (Internet Protocol Television,IPTV)、智能式穿戴式设备、导航装置等等的可移动设 备,或者诸如数字TV、台式计算机、笔记本、服务器等等的终端设备。
所述网络3可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统 (Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有 线网络。其中,所述服务器1中通过所述网络3与客户端2通信连接,以接收客户在客户端2输 入的贷款申请数据。
所述数据库4中存储有金融机构的相关信息,包括金融机构通过服务器1接收到的 大批量客户的贷款申请数据,例如,客户的姓名、身份证等基本信息,以及贷款详细信息,将 其以一条条历史贷款申请记录的形式进行存储。
所述服务器1是一种能够按照事先设定或者存储的指令,自动进行数值计算和/或 信息处理的设备。所述服务器1可以是机架式服务器、刀片式服务器、塔式服务器或机柜式 服务器等计算设备,该服务器1可以是独立的服务器,也可以是多个服务器所组成的服务器 集;或者所述服务器1可以是单个网络服务器、多个网络服务器组成的服务器组或者基于 云计算的由大量主机或者网络服务器构成的云,其中云计算是分布式计算的一种,由一 松散耦合的计算机集组成的一个超级虚拟计算机。
参阅图2,是图1中服务器1一可选的硬件架构的示意图,本实施例中,服务器1可包 括,但不仅限于,可通过系统总线相互通信连接的客户关系挖掘的系统10、存储器11、处理 器12、网络接口13。需要指出的是,图2仅示出了具有组件10-13的服务器1,但是应理解的 是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括 闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随 机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只 读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述服 务器1的内部存储单元,例如该服务器1的硬盘或内存。在另一些实施例中,所述存储器11也 可以是所述服务器1的外部存储设备,例如该服务器1上配备的插接式硬盘,智能存储卡 (Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当 然,所述存储器11还可以既包括所述服务器1的内部存储单元也包括其外部存储设备。本实 施例中,所述存储器11通常用于存储安装于所述服务器1的操作系统和各类应用软件,例如 所述客户关系挖掘的系统10的程序代码等。此外,所述存储器11还可以用于暂时地存储已 经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit, CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述服 务器1的总体操作,例如执行与所述客户端2进行数据交互或者通信相关的控制和处理等。 本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如 运行所述客户关系挖掘的系统10等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在 所述服务器1与其他电子设备之间建立通信连接。本实施例中,所述网络接口13主要用于通 过所述网络3将所述客户端2与服务器1相连,以建立数据传输通道和通信连接。
所述客户关系挖掘的系统10存储在存储器11中,包括至少一个存储在存储器11中 的计算机可读指令,该至少一个计算机可读指令可被处理器器12执行,以实现本申请各实 施例的方法步骤;以及,该至少一个计算机可读指令依据其各部分所实现的功能不同,可被 划为不同的逻辑模块。
其中,上述客户关系挖掘的系统10被所述处理器12执行时实现如下步骤:
设置步骤:定义客户贷款的负面标签,并设置客户之间有关联关系的多种类型的 关联因子以及多种类型的关联因子的优先顺序;
本实施例中,预先定义客户贷款的负面标签,负面标签例如包括存在欺诈、还款逾 期或通过中介贷款等。关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类,且各 类关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先后顺序,每 个类型可能包括一条信息或多条不同的信息,例如,对于电话类可能包括注册手机号及银 行卡预留手机号,每个类型的信息具体可以参阅下述的表1。每个类型的一条信息称作一个 关联因子。存在关联关系的客户之间至少有一个关联因子是相同的,例如两笔贷款申请的 客户之间的身份证相同,则该两笔贷款申请的客户有关联关系。
提取步骤:从数据库中读取一预设时间范围内的贷款申请数据,从所述贷款申请 数据中提取各笔贷款申请中的负面标签字段,以及一个或多个关联因子;
本实施例中,从数据库4中读取一预设时间范围内的贷款申请数据,例如读取最近 3个月内的贷款申请数据,若有贷款申请中有负面标签字段,则提取该负面标签字段,负面 标签字段例如为“还款逾期10天”。然后提取各笔贷款申请中的关联因子,所提取的关联因 子为上述设置步骤中所设置的关联因子,即包括身份证类、电话类、设备类、GPS类及IP类。
建团初始步骤:读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客 户,从该第一客户的关联因子中读取优先顺序最高的关联因子,在所述贷款申请数据中查 与读取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团;
本实施例中,可以读取所述贷款申请数据中申请最早的一笔贷款申请作为客户团 的第一客户;或者随机读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客户, 等等。按照所设置的关联因子的优先顺序读取优先顺序最高的关联因子,在贷款申请数据 中查与读取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团, 即读取该笔贷款申请中的身份证号,然后在贷款申请数据中查与该身份证号相同的贷款 申请,将查到的身份证号相同的贷款申请加入该客户团,以此类推,直至将贷款申请数据 中与该身份证号相同的所有贷款申请均加入该客户团。
建团扩展步骤:按照读取的该笔贷款申请的剩余的关联因子的优先顺序,在所述 贷款申请数据中依次查与剩余的关联因子相同的贷款申请,将查到的贷款申请依次加 入该客户团;
本实施例中,按照读取的该笔贷款申请的剩余的关联因子的优先顺序,将贷款申 请数据中与该笔贷款申请的优先顺序次高的关联因子相同的贷款申请加入该客户团,即将 贷款申请数据中与该笔贷款申请的电话类相同贷款申请加入该客户团,直至将贷款申请数 据中与该笔贷款申请的电话类相同的所有贷款申请均加入该客户团。
然后,将贷款申请数据中与该笔贷款申请的优先顺序次次高的关联因子相同的贷 款申请加入该客户团,即将贷款申请数据中与该笔贷款申请的设备类相同贷款申请加入该 客户团,直至将贷款申请数据中与该笔贷款申请的设备类相同的所有贷款申请均加入该客 户团。以此类推,直至将贷款申请数据中与该笔贷款申请的所有关联因子相同的所有贷款 申请均加入该客户团。
客户团关系分析步骤:分析得到该客户团中贷款申请之间的关联信息,所述关联 信息包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占 比及团中负面标签客户占比。
本实施例中,根据最终得到的客户团可以分析该客户团中贷款申请之间的关联信 息,包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占 比及团中负面标签客户占比。
其中,团中申请关系紧密度=团中申请的关系数/[N*(N-1)/2],N为客户团中的总 顶点数量,在已建好后的客户团中,两两申请看关联关系,两两申请之间有一个关联因子连 接则记录一条关系,记录的总条数为团中申请的关系数。团中申请关系紧密度越大,则表征 该客户团中各笔贷款申请之间关系越紧密;
团中人关系紧密度=团中申请人的关系数/[N*(N-1)/2],N为客户团中的总顶点 数量,在已建好后的客户团中,两两申请人看关系时,如果两两申请人之间的任意一笔申请 有关联因子相同,则两申请人就有关系,有关系的两申请人记录一条关系,记录的总条数为 团中申请人的关系数。团中人关系紧密度越大,则表征该客户团中各笔贷款申请的客户之 间关系越紧密;
申请时间密集度=团中申请数量/(最近申请日期-最早申请日期),申请时间密集 度越大,则表征该客户团中各笔贷款申请的时间越集中;
团中负面标签申请占比=团中负面标签申请数/团人申请数;
团中负面标签客户占比=团中负面标签客户数/团人数;
团中负面标签申请占比和/或团中负面标签客户占比越高,则表征该客户团的贷 款风险越高。
与现有技术相比,本实施例从数据库读取一时间范围内的金融贷款申请数据,从 每条贷款申请中提取预先设置的一个或多个关联因子;选取一笔贷款申请,按照该贷款申 请的关联因子的优先顺序逐步从剩余贷款申请中匹配出与该贷款申请有关联关系的申请, 以建立客户团;分析得到该客户团中贷款申请之间的关联信息,包括团中申请关系紧密度、 团中人关系紧密度、申请时间密集度、团中负面标签申请占比、团中负面标签客户占比,通 过这种方式,可以根据关联因子将金融机构接收到的大批量零散的贷款申请进行精确匹 配、从多个维度挖掘客户间的关联,将批量的贷款申请根据关联关系划分为客户团表示客 户间的关联,供风控客观、整体了解零散的贷款申请之间的关系,以掌控风险。
在一优选的实施例中,在上述图2的实施例的基础上,所述客户关系挖掘的系统10 被所述处理器12执行建团扩展步骤之后,还实现如下步骤:
若有贷款申请中的关联因子与读取的该笔贷款申请中的关联因子均不相同,则独 立成团,将独立成团的贷款申请按照所述建团初始步骤及建团扩展步骤进行扩建,直至将 所述贷款申请数据划分为多个客户团。
本实施例中,以关联因子的优选顺序为按照身份证类、电话类、设备类、GPS类、IP 类的先后顺序为例,首先通过身份证进行精确匹配,直到所有贷款申请都匹配完毕;然后, 按电话类进行匹配(比如客户A的注册手机号和客户B的PBOC客户手机号进行匹配),直到所 有贷款申请都匹配完毕;接着匹配设备类、GPS类及IP类。若贷款申请数据中有某笔贷款申 请与上述读取的该笔贷款申请中的所有关联因子均不相同,则将该某笔贷款申请独立成 团,即建立第二个客户团。
对于第二个客户团中的第一笔贷款申请,按照上述的建团初始步骤及建团扩展步 骤进行扩建,以此类推,直至将所述贷款申请数据划分为多个客户团。
本实施例也可以对于多个客户团进行客户团关系分析:即分析得到该客户团中贷 款申请之间的关联信息,所述关联信息包括客户团中申请关系紧密度、团中人关系紧密度、 申请时间密集度、团中负面标签申请占比及团中负面标签客户占比,以进一步客观、整体了 解零散的贷款申请之间的关系。
在一优选的实施例中,在上述图2的实施例的基础上,所述客户关系挖掘的系统10 被所述处理器12执行时,还实现如下步骤:
模型建立步骤:将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系 抽象为边,构建客户关系网模型;
结合参阅图3,以每个圆圈为顶点,每个顶点为申请贷款的客户团中的一个客户, 有关联关系(一个或多个关联因子)的客户之间以边连接,以构建客户关系网模型。
标签步骤:根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打 上负面标签;
初始赋值步骤:为不同类型的关联因子赋予不同的因子权重,根据负面标签的种 类为相应顶点的负面标签赋予相应的初始值;
其中,每一类型的关联因子可能包括一条信息或多条不同的信息,例如,对于电话 类可能包括注册手机号及银行卡预留手机号。每个类型的一条信息称作一个关联因子。其 中,通过回归分析,可以为每一类型中的各个因子分别赋予初始的权重(其范围介于0-1之 间),因子的权重越大,与黑客户产生关联的风险相对越高。
其中,客户的基本资料包括的类型、因子及权重如下表1所示:
表1
其中,负面标签的种类包括黑名单客户、历史最高逾期天数大于等于30天、已理赔 客户、还款当前逾期、还款首期逾期、欺诈拒绝等,根据负面标签的种类为相应顶点的负面 标签赋予相应的初始值,如下表2所示:
表2
其中,负面标签的初始值越高表示其为黑客户的风险越高,与之关联的客户风险 也相对较高。
边权重计算步骤:根据客户关系网模型中每条边代表的关联因子计算每条边的权 重;
例如,客户A与客户B为客户关系网模型中以一条边连接的客户,客户A与客户B的 关联因子有电话类及IP类,则基于电话类及IP类中的关联因子权重计算客户A与客户B连接 的边的权重。
其中,根据客户之间的关联因子对应的因子权重计算每条边的权重的方式有多 种,例如可以计算所有关联因子权重的均值,以该均值作为边的权重;或者先获取其中一些 较大的因子权重,然后计算这些较大的因子权重的均值,以该均值作为边的权重;或者取所 有因子权重中的最大值作为边的权重,等等。
顶点得分计算步骤:选择一个有负面标签的顶点作为起点,根据起点的初始值及 相邻边的权重计算得到相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得 分;及
本实施例中,在客户关系网模型中有负面标签的顶点可能有一个或者多个,可以 选择其中一个有负面标签的顶点作为起点,根据起点的初始值及相邻边的权重计算得到相 邻顶点的得分,以该得分的顶点继续沿边给未被计算得分的顶点计算得分,以此类推,直至 计算完所述客户关系网模型中每个顶点的得分。每个顶点所代表的客户的得分受客户关系 网模型中关联客户尤其是负面标签的客户的影响。
风险量化步骤:根据所述客户关系网模型中每个顶点的得分提示对应的客户申请 贷款的风险系数,根据客户关系网模型中每个顶点的得分之和提示该客户团的风险系数。
本实施例中,根据上述客户关系网模型中计算的每个顶点的得分量化客户贷款的 风险值,根据客户关系网模型中每个顶点的得分之和量化该客户团的风险系数。得分越高 风险系数越大,金融机构可据此量化结果对申请贷款的客户的风险进行评估,还可进一步 作为是否放款的参考条件。
本实施例将客户抽象成顶点、客户关系抽象成边来构造客户的关系网。一方面,根 据客户是否有负面信息给相应顶点打上负面标签;另一方面,将不同的负面标签种类和不 同属性的边分别赋予权重值。以负面标签为起点,沿边赋予相邻顶点赋予得分,以此类推直 至所有顶点含有得分。本实施例通过构建客户关系网模型,客观、整体地分析了客户关系对 于客户贷款风险的影响,并量化了客户的风险得分,更加科学、准确地决策客户贷款风险。
在一优选的实施例中,在上述实施例的基础上,上述的边权重计算步骤包括:分别 从每条边连接的顶点所代表的客户之间关联的每种类型的关联因子中选取因子权重最大 的值,并从选取出的因子权重中选取最大值作为该条边的权重。例如客户A与客户B之间的 关联因子有电话类及IP类两种类型。电话类的因子权重包括“1,0.75,1,1,0.75”,IP类的因 子权重包括“0,1”,则客户A与客户B之间的边的权重计算如下:W=Max{电话类权重,IP类权 重}=Max{Max{1,0.75,1,1,0.75},Max{0,1}}=1。
本实施例先选取每一类型的关联因子中因子权重的最大值,再从所选取出的因子 权重中选取最大值作为该条边的权重,以便对具有较大风险的客户的客户关系进行追踪。
优选地,上述的顶点得分计算步骤包括:
获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点,根据所 述起点的初始值及相邻边的权重计算得到相邻顶点的得分;
若相邻顶点的得分大于等于所述起点的初始值,则结束计算(不再计算该相邻顶 点的下一相邻顶点的得分);
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为一个,则以该相 邻顶点的得分及下一相邻边的权重计算下一相邻顶点的得分;
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为两个或两个以 上,则获取该相邻顶点的得分中最大的得分,以该最大的得分及下一相邻边的权重计算下 一相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得分。
其中,若顶点为起点的相邻顶点,则该顶点的得分等于起点的初始值与对应的相 邻边的权重的乘积,若顶点非起点的相邻顶点,则该顶点的得分等于计算得到的相邻顶点 的得分与对应的相邻边的权重的乘积。
如图4所示,图4为本发明客户关系挖掘的方法一实施例的流程示意图,该客户关 系挖掘的方法包括以下步骤:
S1,设置步骤:定义客户贷款的负面标签,并设置客户之间有关联关系的多种类型 的关联因子以及多种类型的关联因子的优先顺序;
本实施例中,预先定义客户贷款的负面标签,负面标签例如包括存在欺诈、还款逾 期或通过中介贷款等。关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类,且各 类关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先后顺序,每 个类型可能包括一条信息或多条不同的信息,例如,对于电话类可能包括注册手机号及银 行卡预留手机号,每个类型的信息具体可以参阅下述的表1。每个类型的一条信息称作一个 关联因子。存在关联关系的客户之间至少有一个关联因子是相同的,例如两笔贷款申请的 客户之间的身份证相同,则该两笔贷款申请的客户有关联关系。
S2,提取步骤:从数据库中读取一预设时间范围内的贷款申请数据,从所述贷款申 请数据中提取各笔贷款申请中的负面标签字段,以及一个或多个关联因子;
本实施例中,从数据库4中读取一预设时间范围内的贷款申请数据,例如读取最近 3个月内的贷款申请数据,若有贷款申请中有负面标签字段,则提取该负面标签字段,负面 标签字段例如为“还款逾期10天”。然后提取各笔贷款申请中的关联因子,所提取的关联因 子为上述设置步骤中所设置的关联因子,即包括身份证类、电话类、设备类、GPS类及IP类。
S3,建团初始步骤:读取所述贷款申请数据中的一笔贷款申请作为客户团的第一 客户,从该第一客户的关联因子中读取优先顺序最高的关联因子,在所述贷款申请数据中 查与读取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团;
本实施例中,可以读取所述贷款申请数据中申请最早的一笔贷款申请作为客户团 的第一客户;或者随机读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客户, 等等。按照所设置的关联因子的优先顺序读取优先顺序最高的关联因子,在贷款申请数据 中查与读取的关联因子相同的其他贷款申请,将查到的贷款申请依次加入该客户团, 即读取该笔贷款申请中的身份证号,然后在贷款申请数据中查与该身份证号相同的贷款 申请,将查到的身份证号相同的贷款申请加入该客户团,以此类推,直至将贷款申请数据 中与该身份证号相同的所有贷款申请均加入该客户团。
S4,建团扩展步骤:按照读取的该笔贷款申请的剩余的关联因子的优先顺序,在所 述贷款申请数据中依次查与剩余的关联因子相同的贷款申请,将查到的贷款申请依次 加入该客户团;
本实施例中,按照读取的该笔贷款申请的剩余的关联因子的优先顺序,将贷款申 请数据中与该笔贷款申请的优先顺序次高的关联因子相同的贷款申请加入该客户团,即将 贷款申请数据中与该笔贷款申请的电话类相同贷款申请加入该客户团,直至将贷款申请数 据中与该笔贷款申请的电话类相同的所有贷款申请均加入该客户团。
然后,将贷款申请数据中与该笔贷款申请的优先顺序次次高的关联因子相同的贷 款申请加入该客户团,即将贷款申请数据中与该笔贷款申请的设备类相同贷款申请加入该 客户团,直至将贷款申请数据中与该笔贷款申请的设备类相同的所有贷款申请均加入该客 户团。以此类推,直至将贷款申请数据中与该笔贷款申请的所有关联因子相同的所有贷款 申请均加入该客户团。
S5,客户团关系分析步骤:分析得到该客户团中贷款申请之间的关联信息,所述关 联信息包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请 占比及团中负面标签客户占比。
本实施例中,根据最终得到的客户团可以分析该客户团中贷款申请之间的关联信 息,包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占 比及团中负面标签客户占比。
其中,团中申请关系紧密度=团中申请的关系数/[N*(N-1)/2],N为客户团中的总 顶点数量,在已建好后的客户团中,两两申请看关联关系,两两申请之间有一个关联因子连 接则记录一条关系,记录的总条数为团中申请的关系数。团中申请关系紧密度越大,则表征 该客户团中各笔贷款申请之间关系越紧密;
团中人关系紧密度=团中申请人的关系数/[N*(N-1)/2],N为客户团中的总顶点 数量,在已建好后的客户团中,两两申请人看关系时,如果两两申请人之间的任意一笔申请 有关联因子相同,则两申请人就有关系,有关系的两申请人记录一条关系,记录的总条数为 团中申请人的关系数。团中人关系紧密度越大,则表征该客户团中各笔贷款申请的客户之 间关系越紧密;
申请时间密集度=团中申请数量/(最近申请日期-最早申请日期),申请时间密集 度越大,则表征该客户团中各笔贷款申请的时间越集中;
团中负面标签申请占比=团中负面标签申请数/团人申请数;
团中负面标签客户占比=团中负面标签客户数/团人数;
团中负面标签申请占比和/或团中负面标签客户占比越高,则表征该客户团的贷 款风险越高。
与现有技术相比,本实施例从数据库读取一时间范围内的金融贷款申请数据,从 每条贷款申请中提取预先设置的一个或多个关联因子;选取一笔贷款申请,按照该贷款申 请的关联因子的优先顺序逐步从剩余贷款申请中匹配出与该贷款申请有关联关系的申请, 以建立客户团;分析得到该客户团中贷款申请之间的关联信息,包括团中申请关系紧密度、 团中人关系紧密度、申请时间密集度、团中负面标签申请占比、团中负面标签客户占比,通 过这种方式,可以根据关联因子将金融机构接收到的大批量零散的贷款申请进行精确匹 配、从多个维度挖掘客户间的关联,将批量的贷款申请根据关联关系划分为客户团表示客 户间的关联,供风控客观、整体了解零散的贷款申请之间的关系,以掌控风险。
在一优选的实施例中,在上述图4的实施例的基础上,所述建团扩展步骤之后还包 括:
若有贷款申请中的关联因子与读取的该笔贷款申请中的关联因子均不相同,则独 立成团,将独立成团的贷款申请按照所述建团初始步骤及建团扩展步骤进行扩建,直至将 所述贷款申请数据划分为多个客户团。
本实施例中,以关联因子的优选顺序为按照身份证类、电话类、设备类、GPS类、IP 类的先后顺序为例,首先通过身份证进行精确匹配,直到所有贷款申请都匹配完毕;然后, 按电话类进行匹配(比如客户A的注册手机号和客户B的PBOC客户手机号进行匹配),直到所 有贷款申请都匹配完毕;接着匹配设备类、GPS类及IP类。若贷款申请数据中有某笔贷款申 请与上述读取的该笔贷款申请中的所有关联因子均不相同,则将该某笔贷款申请独立成 团,即建立第二个客户团。
对于第二个客户团中的第一笔贷款申请,按照上述的建团初始步骤及建团扩展步 骤进行扩建,以此类推,直至将所述贷款申请数据划分为多个客户团。
本实施例也可以对于多个客户团进行客户团关系分析:即分析得到该客户团中贷 款申请之间的关联信息,所述关联信息包括客户团中申请关系紧密度、团中人关系紧密度、 申请时间密集度、团中负面标签申请占比及团中负面标签客户占比,以进一步客观、整体了 解零散的贷款申请之间的关系。
在一优选的实施例中,如图5所示,在上述图4的实施例的基础上,该客户关系挖掘 的方法还包括以下步骤:
模型建立步骤:将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系 抽象为边,构建客户关系网模型;
结合参阅图3,以每个圆圈为顶点,每个顶点为申请贷款的客户团中的一个客户, 有关联关系(一个或多个关联因子)的客户之间以边连接,以构建客户关系网模型。
标签步骤:根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打 上负面标签;
初始赋值步骤:为不同类型的关联因子赋予不同的因子权重,根据负面标签的种 类为相应顶点的负面标签赋予相应的初始值;
其中,每一类型的关联因子可能包括一条信息或多条不同的信息,例如,对于电话 类可能包括注册手机号及银行卡预留手机号。每个类型的一条信息称作一个关联因子。其 中,通过回归分析,可以为每一类型中的各个因子分别赋予初始的权重(其范围介于0-1之 间),因子的权重越大,与黑客户产生关联的风险相对越高。
其中,客户的基本资料包括的类型、因子及权重如上述表1所示,此处不再赘述。
其中,负面标签的种类包括黑名单客户、历史最高逾期天数大于等于30天、已理赔 客户、还款当前逾期、还款首期逾期、欺诈拒绝等,根据负面标签的种类为相应顶点的负面 标签赋予相应的初始值如上述表2所示,此处不再赘述。
其中,负面标签的初始值越高表示其为黑客户的风险越高,与之关联的客户风险 也相对较高。
边权重计算步骤:根据客户关系网模型中每条边代表的关联因子计算每条边的权 重;
例如,客户A与客户B为客户关系网模型中以一条边连接的客户,客户A与客户B的 关联因子有电话类及IP类,则基于电话类及IP类中的关联因子权重计算客户A与客户B连接 的边的权重。
其中,根据客户之间的关联因子对应的因子权重计算每条边的权重的方式有多 种,例如可以计算所有关联因子权重的均值,以该均值作为边的权重;或者先获取其中一些 较大的因子权重,然后计算这些较大的因子权重的均值,以该均值作为边的权重;或者取所 有因子权重中的最大值作为边的权重,等等。
顶点得分计算步骤:选择一个有负面标签的顶点作为起点,根据起点的初始值及 相邻边的权重计算得到相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得 分;及
本实施例中,在客户关系网模型中有负面标签的顶点可能有一个或者多个,可以 选择其中一个有负面标签的顶点作为起点,根据起点的初始值及相邻边的权重计算得到相 邻顶点的得分,以该得分的顶点继续沿边给未被计算得分的顶点计算得分,以此类推,直至 计算完所述客户关系网模型中每个顶点的得分。每个顶点所代表的客户的得分受客户关系 网模型中关联客户尤其是负面标签的客户的影响。
风险量化步骤:根据所述客户关系网模型中每个顶点的得分提示对应的客户申请 贷款的风险系数,根据客户关系网模型中每个顶点的得分之和提示该客户团的风险系数。
本实施例中,根据上述客户关系网模型中计算的每个顶点的得分量化客户贷款的 风险值,根据客户关系网模型中每个顶点的得分之和量化该客户团的风险系数。得分越高 风险系数越大,金融机构可据此量化结果对申请贷款的客户的风险进行评估,还可进一步 作为是否放款的参考条件。
本实施例将客户抽象成顶点、客户关系抽象成边来构造客户的关系网。一方面,根 据客户是否有负面信息给相应顶点打上负面标签;另一方面,将不同的负面标签种类和不 同属性的边分别赋予权重值。以负面标签为起点,沿边赋予相邻顶点赋予得分,以此类推直 至所有顶点含有得分。本实施例通过构建客户关系网模型,客观、整体地分析了客户关系对 于客户贷款风险的影响,并量化了客户的风险得分,更加科学、准确地决策客户贷款风险。
优选地,上述的边权重计算步骤包括:分别从每条边连接的顶点所代表的客户之 间关联的每种类型的关联因子中选取因子权重最大的值,并从选取出的因子权重中选取最 大值作为该条边的权重。例如客户A与客户B之间的关联因子有电话类及IP类两种类型。电 话类的因子权重包括“1,0.75,1,1,0.75”,IP类的因子权重包括“0,1”,则客户A与客户B之 间的边的权重计算如下:W=Max{电话类权重,IP类权重}=Max{Max{1,0.75,1,1,0.75}, Max{0,1}}=1。
本实施例先选取每一类型的关联因子中因子权重的最大值,再从所选取出的因子 权重中选取最大值作为该条边的权重,以便对具有较大风险的客户的客户关系进行追踪。
优选地,上述的顶点得分计算步骤包括:
获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点,根据所 述起点的初始值及相邻边的权重计算得到相邻顶点的得分;
若相邻顶点的得分大于等于所述起点的初始值,则结束计算(不再计算该相邻顶 点的下一相邻顶点的得分);
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为一个,则以该相 邻顶点的得分及下一相邻边的权重计算下一相邻顶点的得分;
若相邻顶点的得分小于所述起点的初始值,且相邻顶点的得分为两个或两个以 上,则获取该相邻顶点的得分中最大的得分,以该最大的得分及下一相邻边的权重计算下 一相邻顶点的得分,直至计算完所述客户关系网模型中每个顶点的得分。
其中,若顶点为起点的相邻顶点,则该顶点的得分等于起点的初始值与对应的相 邻边的权重的乘积,若顶点非起点的相邻顶点,则该顶点的得分等于计算得到的相邻顶点 的得分与对应的相邻边的权重的乘积。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有客户 关系挖掘的系统,所述客户关系挖掘的系统被处理器执行时实现上述的方法的步骤。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方 法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下 前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做 出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质 (如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服 务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发 明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技 术领域,均同理包括在本发明的专利保护范围内。
本文发布于:2023-04-13 05:04:57,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/85806.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |