服务器、客户关系挖掘的方法及计算机可读存储介质

阅读：评论：0

著录项

申请号 CN201710614491.2
申请日 20170725
公开（公告）号 CN107871277A
公开日 20180403
申请（专利权）人平安普惠企业管理有限公司
发明人任钢林;杨钊
主分类号 G06Q40/02
分类号
G06Q40/02
地址广东省深圳市前海深港合作区前湾一路1号A栋201室（入驻深圳市前海商务秘书有限公司）
国省代码广东(44)
代理机构深圳市沃德知识产权代理事务所（普通合伙）
代理人于志光;高杰

摘要

本发明涉及一种服务器、客户关系挖掘的方法及存储介质，服务器包括：存储器、处理器及存储在存储器上的系统，该系统被处理器执行时实现：定义负面标签，并设置客户之间有关联关系的多种类型的关联因子及其优先顺序；读取贷款申请数据，并提取各笔贷款申请中的负面标签字段，以及关联因子；从该第一客户的关联因子中读取优先顺序最高的关联因子，在贷款申请数据中查与该关联因子相同的其他贷款申请，将查到的贷款申请加入该客户团；按照剩余的关联因子的优先顺序，在贷款申请数据中查与剩余的关联因子相同的贷款申请并将其加入该客户团；分析得到该客户团中贷款申请之间的关联信息。本发明可以客观、整体分析客户与其他客户的关联影响。

权利要求



1.一种服务器，其特征在于，所述服务器包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的客户关系挖掘的系统，所述客户关系挖掘的系统被所述处理器执行时实现如下步骤：

设置步骤：定义客户贷款的负面标签，并设置客户之间有关联关系的多种类型的关联因子以及多种类型的关联因子的优先顺序；

提取步骤：从数据库中读取一预设时间范围内的贷款申请数据，从所述贷款申请数据中提取各笔贷款申请中的负面标签字段，以及一个或多个关联因子；

建团初始步骤：读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客户，从该第一客户的关联因子中读取优先顺序最高的关联因子，在所述贷款申请数据中查与读取的关联因子相同的其他贷款申请，将查到的贷款申请依次加入该客户团；

建团扩展步骤：按照读取的该笔贷款申请的剩余的关联因子的优先顺序，在所述贷款申请数据中依次查与剩余的关联因子相同的贷款申请，将查到的贷款申请依次加入该客户团；

客户团关系分析步骤：分析得到该客户团中贷款申请之间的关联信息，所述关联信息包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比及团中负面标签客户占比。

2.根据权利要求1所述的服务器，其特征在于，所述关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类，所述多种类型的关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先后顺序。

3.根据权利要求1所述的服务器，其特征在于，所述客户关系挖掘的系统被所述处理器执行时，还实现如下步骤：

若有贷款申请中的关联因子与读取的该笔贷款申请中的关联因子均不相同，则独立成团，将独立成团的贷款申请按照所述建团初始步骤及建团扩展步骤进行扩建，直至将所述贷款申请数据划分为多个客户团。



4.根据权利要求1至3任一项所述的服务器，其特征在于，所述客户关系挖掘的系统被所述处理器执行时，还实现如下步骤：

模型建立步骤：将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象为边，构建客户关系网模型；

标签步骤：根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负面标签；

初始赋值步骤：为不同类型的关联因子赋予不同的因子权重，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值；

边权重计算步骤：根据客户关系网模型中每条边代表的关联因子计算每条边的权重；

顶点得分计算步骤：选择一个有负面标签的顶点作为起点，根据起点的初始值及相邻边的权重计算得到相邻顶点的得分，直至计算完所述客户关系网模型中每个顶点的得分；及

风险量化步骤：根据所述客户关系网模型中每个顶点的得分提示对应的客户申请贷款的风险系数，根据客户关系网模型中每个顶点的得分之和提示该客户团的风险系数。

5.根据权利要求4所述的服务器，其特征在于，所述边权重计算步骤包括：分别从每条边连接的顶点所代表的客户之间关联的每种类型的因子中选取因子权重最大的值，并从选取出的因子权重中选取最大值作为该条边的权重；

所述顶点得分计算步骤包括：

获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点，根据所述起点的初始值及相邻边的权重计算得到相邻顶点的得分；

若相邻顶点的得分大于等于所述起点的初始值，则结束计算；

若相邻顶点的得分小于所述起点的初始值，且相邻顶点的得分为一个，则以该相邻顶点的得分及下一相邻边的权重计算下一相邻顶点的得分；

若相邻顶点的得分小于所述起点的初始值，且相邻顶点的得分为两个或两个以上，则获取该相邻顶点的得分中最大的得分，以该最大的得分及下一相邻边的权重计算下一相邻顶点的得分，直至计算完所述客户关系网模型中每个顶点的得分。



6.一种客户关系挖掘的方法，其特征在于，所述客户关系挖掘的方法包括：

设置步骤：定义客户贷款的负面标签，并设置客户之间有关联关系的多种类型的关联因子以及多种类型的关联因子的优先顺序；

7.根据权利要求6所述的客户关系挖掘的方法，其特征在于，所述关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类，所述多种类型的关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先后顺序。

8.根据权利要求6所述的客户关系挖掘的方法，其特征在于，所述建团扩展步骤之后还包括：

9.根据权利要求6至8任一项所述的客户关系挖掘的方法，其特征在于，还包括：

模型建立步骤：将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象为边，构建客户关系网模型；

标签步骤：根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负面标签；

初始赋值步骤：为不同类型的关联因子赋予不同的因子权重，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值；

边权重计算步骤：根据客户关系网模型中每条边代表的关联因子计算每条边的权重；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有客户关系挖掘的系统，所述客户关系挖掘的系统被处理器执行时实现如权利要求6至9中任一项所述的客户关系挖掘的方法的步骤。

说明书

技术领域

本发明涉及金融技术领域，尤其涉及一种服务器、客户关系挖掘的方法及计算机可读存储介质。

目前，关于贷款客户的风险分析方案中，一般是通过设计风控规则，对客户进行层层校验，最终根据客户对于风控规则的匹配程度，得出不同的风控策略。这种方式停留在对单个客户的各项指标的校验，无法客观、整体分析客户与其他客户的关联影响。

本发明的目的在于提供一种服务器、客户关系挖掘的方法及计算机可读存储介质，旨在客观、整体分析客户与其他客户的关联影响。

为实现上述目的，本发明提供一种服务器，所述服务器包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的客户关系挖掘的系统，所述客户关系挖掘的系统被所述处理器执行时实现如下步骤：

设置步骤：定义客户贷款的负面标签，并设置客户之间有关联关系的多种类型的关联因子以及多种类型的关联因子的优先顺序；

优选地，所述关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类，所述多种类型的关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先后顺序。

优选地，所述客户关系挖掘的系统被所述处理器执行时，还实现如下步骤：

模型建立步骤：将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象为边，构建客户关系网模型；

标签步骤：根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负面标签；

初始赋值步骤：为不同类型的关联因子赋予不同的因子权重，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值；

边权重计算步骤：根据客户关系网模型中每条边代表的关联因子计算每条边的权重；

优选地，所述边权重计算步骤包括：分别从每条边连接的顶点所代表的客户之间关联的每种类型的因子中选取因子权重最大的值，并从选取出的因子权重中选取最大值作为该条边的权重；

所述顶点得分计算步骤包括：

获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点，根据所述起点的初始值及相邻边的权重计算得到相邻顶点的得分；

若相邻顶点的得分大于等于所述起点的初始值，则结束计算；

若相邻顶点的得分小于所述起点的初始值，且相邻顶点的得分为一个，则以该相邻顶点的得分及下一相邻边的权重计算下一相邻顶点的得分；

为实现上述目的，本发明还提供一种客户关系挖掘的方法，所述客户关系挖掘的方法包括：

设置步骤：定义客户贷款的负面标签，并设置客户之间有关联关系的多种类型的关联因子以及多种类型的关联因子的优先顺序；

优选地，所述建团扩展步骤之后还包括：

优选地，还包括：

模型建立步骤：将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象为边，构建客户关系网模型；

标签步骤：根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负面标签；

初始赋值步骤：为不同类型的关联因子赋予不同的因子权重，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值；

边权重计算步骤：根据客户关系网模型中每条边代表的关联因子计算每条边的权重；

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有客户关系挖掘的系统，所述客户关系挖掘的系统被处理器执行时实现上述的客户关系挖掘的方法的步骤。

本发明的有益效果是：本发明从数据库读取一时间范围内的金融贷款申请数据，从每条贷款申请中提取预先设置的一个或多个关联因子；选取一笔贷款申请，按照该贷款申请的关联因子的优先顺序逐步从剩余贷款申请中匹配出与该贷款申请有关联关系的申请，以建立客户团；分析得到该客户团中贷款申请之间的关联信息，包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比、团中负面标签客户占比，通过这种方式，可以根据关联因子将金融机构接收到的大批量零散的贷款申请进行精确匹配、从多个维度挖掘客户间的关联，将批量的贷款申请根据关联关系划分为客户团表示客户间的关联，供风控客观、整体了解零散的贷款申请之间的关系，以掌控风险。

图1为本发明各个实施例一可选的应用环境示意图；

图2是图1中服务器一实施例的硬件架构的示意图；

图3为构建的客户关系网模型的示意图；

图4为本发明客户关系挖掘的方法一实施例的流程示意图；

图5为本发明客户关系挖掘的方法另一实施例的流程示意图。

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术方案可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在，也不在本发明要求的保护范围之内。

参阅图1，是本发明各个实施例一可选的应用环境示意图。在本实施例中，本发明可应用于包括，但不仅限于，服务器1、客户端2、网络3、数据库4的应用环境中。其中，数据库 4可以独立于服务器1之外的服务器中，也可以安装在服务器1中。服务器1通过网络3与客户端2所在的设备进行通信。

所述客户端2所在的设备包括，但不限于，任何一种可与用户通过键盘、鼠标、遥控器、触摸板或者声控设备等方式进行人机交互的电子产品，例如，个人计算机、平板电脑、智能手机、个人数字助理(Personal Digital Assistant，PDA)、游戏机、交互式网络电视 (Internet Protocol Television,IPTV)、智能式穿戴式设备、导航装置等等的可移动设备，或者诸如数字TV、台式计算机、笔记本、服务器等等的终端设备。

所述网络3可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统 (Global System of Mobile communication，GSM)、宽带码分多址(Wideband Code Division Multiple Access，WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。其中，所述服务器1中通过所述网络3与客户端2通信连接，以接收客户在客户端2输入的贷款申请数据。

所述数据库4中存储有金融机构的相关信息，包括金融机构通过服务器1接收到的大批量客户的贷款申请数据，例如，客户的姓名、身份证等基本信息，以及贷款详细信息，将其以一条条历史贷款申请记录的形式进行存储。

所述服务器1是一种能够按照事先设定或者存储的指令，自动进行数值计算和/或信息处理的设备。所述服务器1可以是机架式服务器、刀片式服务器、塔式服务器或机柜式服务器等计算设备，该服务器1可以是独立的服务器，也可以是多个服务器所组成的服务器集；或者所述服务器1可以是单个网络服务器、多个网络服务器组成的服务器组或者基于云计算的由大量主机或者网络服务器构成的云，其中云计算是分布式计算的一种，由一松散耦合的计算机集组成的一个超级虚拟计算机。

参阅图2，是图1中服务器1一可选的硬件架构的示意图，本实施例中，服务器1可包括，但不仅限于，可通过系统总线相互通信连接的客户关系挖掘的系统10、存储器11、处理器12、网络接口13。需要指出的是，图2仅示出了具有组件10-13的服务器1，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

其中，所述存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，所述存储器11可以是所述服务器1的内部存储单元，例如该服务器1的硬盘或内存。在另一些实施例中，所述存储器11也可以是所述服务器1的外部存储设备，例如该服务器1上配备的插接式硬盘，智能存储卡 (Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)等。当然，所述存储器11还可以既包括所述服务器1的内部存储单元也包括其外部存储设备。本实施例中，所述存储器11通常用于存储安装于所述服务器1的操作系统和各类应用软件，例如所述客户关系挖掘的系统10的程序代码等。此外，所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit， CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述服务器1的总体操作，例如执行与所述客户端2进行数据交互或者通信相关的控制和处理等。本实施例中，所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据，例如运行所述客户关系挖掘的系统10等。

所述网络接口13可包括无线网络接口或有线网络接口，该网络接口13通常用于在所述服务器1与其他电子设备之间建立通信连接。本实施例中，所述网络接口13主要用于通过所述网络3将所述客户端2与服务器1相连，以建立数据传输通道和通信连接。

所述客户关系挖掘的系统10存储在存储器11中，包括至少一个存储在存储器11中的计算机可读指令，该至少一个计算机可读指令可被处理器器12执行，以实现本申请各实施例的方法步骤；以及，该至少一个计算机可读指令依据其各部分所实现的功能不同，可被划为不同的逻辑模块。

其中，上述客户关系挖掘的系统10被所述处理器12执行时实现如下步骤：

设置步骤：定义客户贷款的负面标签，并设置客户之间有关联关系的多种类型的关联因子以及多种类型的关联因子的优先顺序；

本实施例中，预先定义客户贷款的负面标签，负面标签例如包括存在欺诈、还款逾期或通过中介贷款等。关联因子的类型包括身份证类、电话类、设备类、GPS类及IP类，且各类关联因子的优先顺序为按照所述身份证类、电话类、设备类、GPS类及IP类的先后顺序，每个类型可能包括一条信息或多条不同的信息，例如，对于电话类可能包括注册手机号及银行卡预留手机号，每个类型的信息具体可以参阅下述的表1。每个类型的一条信息称作一个关联因子。存在关联关系的客户之间至少有一个关联因子是相同的，例如两笔贷款申请的客户之间的身份证相同，则该两笔贷款申请的客户有关联关系。

本实施例中，从数据库4中读取一预设时间范围内的贷款申请数据，例如读取最近 3个月内的贷款申请数据，若有贷款申请中有负面标签字段，则提取该负面标签字段，负面标签字段例如为“还款逾期10天”。然后提取各笔贷款申请中的关联因子，所提取的关联因子为上述设置步骤中所设置的关联因子，即包括身份证类、电话类、设备类、GPS类及IP类。

本实施例中，可以读取所述贷款申请数据中申请最早的一笔贷款申请作为客户团的第一客户；或者随机读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客户，等等。按照所设置的关联因子的优先顺序读取优先顺序最高的关联因子，在贷款申请数据中查与读取的关联因子相同的其他贷款申请，将查到的贷款申请依次加入该客户团，即读取该笔贷款申请中的身份证号，然后在贷款申请数据中查与该身份证号相同的贷款申请，将查到的身份证号相同的贷款申请加入该客户团，以此类推，直至将贷款申请数据中与该身份证号相同的所有贷款申请均加入该客户团。

本实施例中，按照读取的该笔贷款申请的剩余的关联因子的优先顺序，将贷款申请数据中与该笔贷款申请的优先顺序次高的关联因子相同的贷款申请加入该客户团，即将贷款申请数据中与该笔贷款申请的电话类相同贷款申请加入该客户团，直至将贷款申请数据中与该笔贷款申请的电话类相同的所有贷款申请均加入该客户团。

然后，将贷款申请数据中与该笔贷款申请的优先顺序次次高的关联因子相同的贷款申请加入该客户团，即将贷款申请数据中与该笔贷款申请的设备类相同贷款申请加入该客户团，直至将贷款申请数据中与该笔贷款申请的设备类相同的所有贷款申请均加入该客户团。以此类推，直至将贷款申请数据中与该笔贷款申请的所有关联因子相同的所有贷款申请均加入该客户团。

本实施例中，根据最终得到的客户团可以分析该客户团中贷款申请之间的关联信息，包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比及团中负面标签客户占比。

其中，团中申请关系紧密度＝团中申请的关系数/[N*(N-1)/2]，N为客户团中的总顶点数量，在已建好后的客户团中，两两申请看关联关系，两两申请之间有一个关联因子连接则记录一条关系，记录的总条数为团中申请的关系数。团中申请关系紧密度越大，则表征该客户团中各笔贷款申请之间关系越紧密；

团中人关系紧密度＝团中申请人的关系数/[N*(N-1)/2]，N为客户团中的总顶点数量，在已建好后的客户团中，两两申请人看关系时，如果两两申请人之间的任意一笔申请有关联因子相同，则两申请人就有关系，有关系的两申请人记录一条关系，记录的总条数为团中申请人的关系数。团中人关系紧密度越大，则表征该客户团中各笔贷款申请的客户之间关系越紧密；

申请时间密集度＝团中申请数量/(最近申请日期-最早申请日期)，申请时间密集度越大，则表征该客户团中各笔贷款申请的时间越集中；

团中负面标签申请占比＝团中负面标签申请数/团人申请数；

团中负面标签客户占比＝团中负面标签客户数/团人数；

团中负面标签申请占比和/或团中负面标签客户占比越高，则表征该客户团的贷款风险越高。

与现有技术相比，本实施例从数据库读取一时间范围内的金融贷款申请数据，从每条贷款申请中提取预先设置的一个或多个关联因子；选取一笔贷款申请，按照该贷款申请的关联因子的优先顺序逐步从剩余贷款申请中匹配出与该贷款申请有关联关系的申请，以建立客户团；分析得到该客户团中贷款申请之间的关联信息，包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比、团中负面标签客户占比，通过这种方式，可以根据关联因子将金融机构接收到的大批量零散的贷款申请进行精确匹配、从多个维度挖掘客户间的关联，将批量的贷款申请根据关联关系划分为客户团表示客户间的关联，供风控客观、整体了解零散的贷款申请之间的关系，以掌控风险。

在一优选的实施例中，在上述图2的实施例的基础上，所述客户关系挖掘的系统10 被所述处理器12执行建团扩展步骤之后，还实现如下步骤：

本实施例中，以关联因子的优选顺序为按照身份证类、电话类、设备类、GPS类、IP 类的先后顺序为例，首先通过身份证进行精确匹配，直到所有贷款申请都匹配完毕；然后，按电话类进行匹配(比如客户A的注册手机号和客户B的PBOC客户手机号进行匹配)，直到所有贷款申请都匹配完毕；接着匹配设备类、GPS类及IP类。若贷款申请数据中有某笔贷款申请与上述读取的该笔贷款申请中的所有关联因子均不相同，则将该某笔贷款申请独立成团，即建立第二个客户团。

对于第二个客户团中的第一笔贷款申请，按照上述的建团初始步骤及建团扩展步骤进行扩建，以此类推，直至将所述贷款申请数据划分为多个客户团。

本实施例也可以对于多个客户团进行客户团关系分析：即分析得到该客户团中贷款申请之间的关联信息，所述关联信息包括客户团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比及团中负面标签客户占比，以进一步客观、整体了解零散的贷款申请之间的关系。

在一优选的实施例中，在上述图2的实施例的基础上，所述客户关系挖掘的系统10 被所述处理器12执行时，还实现如下步骤：

模型建立步骤：将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象为边，构建客户关系网模型；

结合参阅图3，以每个圆圈为顶点，每个顶点为申请贷款的客户团中的一个客户，有关联关系(一个或多个关联因子)的客户之间以边连接，以构建客户关系网模型。

标签步骤：根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负面标签；

初始赋值步骤：为不同类型的关联因子赋予不同的因子权重，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值；

其中，每一类型的关联因子可能包括一条信息或多条不同的信息，例如，对于电话类可能包括注册手机号及银行卡预留手机号。每个类型的一条信息称作一个关联因子。其中，通过回归分析，可以为每一类型中的各个因子分别赋予初始的权重(其范围介于0-1之间)，因子的权重越大，与黑客户产生关联的风险相对越高。

其中，客户的基本资料包括的类型、因子及权重如下表1所示：

表1

其中，负面标签的种类包括黑名单客户、历史最高逾期天数大于等于30天、已理赔客户、还款当前逾期、还款首期逾期、欺诈拒绝等，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值，如下表2所示：

表2

其中，负面标签的初始值越高表示其为黑客户的风险越高，与之关联的客户风险也相对较高。

边权重计算步骤：根据客户关系网模型中每条边代表的关联因子计算每条边的权重；

例如，客户A与客户B为客户关系网模型中以一条边连接的客户，客户A与客户B的关联因子有电话类及IP类，则基于电话类及IP类中的关联因子权重计算客户A与客户B连接的边的权重。

其中，根据客户之间的关联因子对应的因子权重计算每条边的权重的方式有多种，例如可以计算所有关联因子权重的均值，以该均值作为边的权重；或者先获取其中一些较大的因子权重，然后计算这些较大的因子权重的均值，以该均值作为边的权重；或者取所有因子权重中的最大值作为边的权重，等等。

本实施例中，在客户关系网模型中有负面标签的顶点可能有一个或者多个，可以选择其中一个有负面标签的顶点作为起点，根据起点的初始值及相邻边的权重计算得到相邻顶点的得分，以该得分的顶点继续沿边给未被计算得分的顶点计算得分，以此类推，直至计算完所述客户关系网模型中每个顶点的得分。每个顶点所代表的客户的得分受客户关系网模型中关联客户尤其是负面标签的客户的影响。

本实施例中，根据上述客户关系网模型中计算的每个顶点的得分量化客户贷款的风险值，根据客户关系网模型中每个顶点的得分之和量化该客户团的风险系数。得分越高风险系数越大，金融机构可据此量化结果对申请贷款的客户的风险进行评估，还可进一步作为是否放款的参考条件。

本实施例将客户抽象成顶点、客户关系抽象成边来构造客户的关系网。一方面，根据客户是否有负面信息给相应顶点打上负面标签；另一方面，将不同的负面标签种类和不同属性的边分别赋予权重值。以负面标签为起点，沿边赋予相邻顶点赋予得分，以此类推直至所有顶点含有得分。本实施例通过构建客户关系网模型，客观、整体地分析了客户关系对于客户贷款风险的影响，并量化了客户的风险得分，更加科学、准确地决策客户贷款风险。

在一优选的实施例中，在上述实施例的基础上，上述的边权重计算步骤包括：分别从每条边连接的顶点所代表的客户之间关联的每种类型的关联因子中选取因子权重最大的值，并从选取出的因子权重中选取最大值作为该条边的权重。例如客户A与客户B之间的关联因子有电话类及IP类两种类型。电话类的因子权重包括“1，0.75，1，1，0.75”，IP类的因子权重包括“0，1”，则客户A与客户B之间的边的权重计算如下：W＝Max{电话类权重，IP类权重}＝Max{Max{1，0.75，1，1，0.75}，Max{0，1}}＝1。

本实施例先选取每一类型的关联因子中因子权重的最大值，再从所选取出的因子权重中选取最大值作为该条边的权重，以便对具有较大风险的客户的客户关系进行追踪。

优选地，上述的顶点得分计算步骤包括：

获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点，根据所述起点的初始值及相邻边的权重计算得到相邻顶点的得分；

若相邻顶点的得分大于等于所述起点的初始值，则结束计算(不再计算该相邻顶点的下一相邻顶点的得分)；

若相邻顶点的得分小于所述起点的初始值，且相邻顶点的得分为一个，则以该相邻顶点的得分及下一相邻边的权重计算下一相邻顶点的得分；

其中，若顶点为起点的相邻顶点，则该顶点的得分等于起点的初始值与对应的相邻边的权重的乘积，若顶点非起点的相邻顶点，则该顶点的得分等于计算得到的相邻顶点的得分与对应的相邻边的权重的乘积。

如图4所示，图4为本发明客户关系挖掘的方法一实施例的流程示意图，该客户关系挖掘的方法包括以下步骤：

S1，设置步骤：定义客户贷款的负面标签，并设置客户之间有关联关系的多种类型的关联因子以及多种类型的关联因子的优先顺序；

S2，提取步骤：从数据库中读取一预设时间范围内的贷款申请数据，从所述贷款申请数据中提取各笔贷款申请中的负面标签字段，以及一个或多个关联因子；

S3，建团初始步骤：读取所述贷款申请数据中的一笔贷款申请作为客户团的第一客户，从该第一客户的关联因子中读取优先顺序最高的关联因子，在所述贷款申请数据中查与读取的关联因子相同的其他贷款申请，将查到的贷款申请依次加入该客户团；

S4，建团扩展步骤：按照读取的该笔贷款申请的剩余的关联因子的优先顺序，在所述贷款申请数据中依次查与剩余的关联因子相同的贷款申请，将查到的贷款申请依次加入该客户团；

S5，客户团关系分析步骤：分析得到该客户团中贷款申请之间的关联信息，所述关联信息包括团中申请关系紧密度、团中人关系紧密度、申请时间密集度、团中负面标签申请占比及团中负面标签客户占比。

申请时间密集度＝团中申请数量/(最近申请日期-最早申请日期)，申请时间密集度越大，则表征该客户团中各笔贷款申请的时间越集中；

团中负面标签申请占比＝团中负面标签申请数/团人申请数；

团中负面标签客户占比＝团中负面标签客户数/团人数；

团中负面标签申请占比和/或团中负面标签客户占比越高，则表征该客户团的贷款风险越高。

在一优选的实施例中，在上述图4的实施例的基础上，所述建团扩展步骤之后还包括：

对于第二个客户团中的第一笔贷款申请，按照上述的建团初始步骤及建团扩展步骤进行扩建，以此类推，直至将所述贷款申请数据划分为多个客户团。

在一优选的实施例中，如图5所示，在上述图4的实施例的基础上，该客户关系挖掘的方法还包括以下步骤：

模型建立步骤：将客户团的每个贷款申请抽象为顶点、贷款申请之间的关联关系抽象为边，构建客户关系网模型；

标签步骤：根据贷款申请中的负面标签字段为所述客户关系网模型的相应顶点打上负面标签；

初始赋值步骤：为不同类型的关联因子赋予不同的因子权重，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值；

其中，客户的基本资料包括的类型、因子及权重如上述表1所示，此处不再赘述。

其中，负面标签的种类包括黑名单客户、历史最高逾期天数大于等于30天、已理赔客户、还款当前逾期、还款首期逾期、欺诈拒绝等，根据负面标签的种类为相应顶点的负面标签赋予相应的初始值如上述表2所示，此处不再赘述。

其中，负面标签的初始值越高表示其为黑客户的风险越高，与之关联的客户风险也相对较高。

边权重计算步骤：根据客户关系网模型中每条边代表的关联因子计算每条边的权重；

优选地，上述的边权重计算步骤包括：分别从每条边连接的顶点所代表的客户之间关联的每种类型的关联因子中选取因子权重最大的值，并从选取出的因子权重中选取最大值作为该条边的权重。例如客户A与客户B之间的关联因子有电话类及IP类两种类型。电话类的因子权重包括“1，0.75，1，1，0.75”，IP类的因子权重包括“0，1”，则客户A与客户B之间的边的权重计算如下：W＝Max{电话类权重，IP类权重}＝Max{Max{1，0.75，1，1，0.75}， Max{0，1}}＝1。

优选地，上述的顶点得分计算步骤包括：

获取客户关系网模型中负面标签初始值最高的一个或多个顶点作为起点，根据所述起点的初始值及相邻边的权重计算得到相邻顶点的得分；

若相邻顶点的得分大于等于所述起点的初始值，则结束计算(不再计算该相邻顶点的下一相邻顶点的得分)；

若相邻顶点的得分小于所述起点的初始值，且相邻顶点的得分为一个，则以该相邻顶点的得分及下一相邻边的权重计算下一相邻顶点的得分；

本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有客户关系挖掘的系统，所述客户关系挖掘的系统被处理器执行时实现上述的方法的步骤。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质 (如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

本文发布于:2023-04-13 05:04:57，感谢您对本站的认可！

本文链接：https://patent.en369.cn/patent/3/85806.html

上一篇：管理数据权属凭证的方法和装置及电子设备

下一篇：一种授权序列号申请方法、系统及提货系统、应用服务器

标签：服务器、客户关系挖掘的方法及计算机可读存储介质

留言与评论（共有 0 条评论）