G06Q30/00 G06Q10/06 G06N99/00
1.一种商户审核方法,其特征在于,包括:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
2.根据权利要求1所述的商户审核方法,其特征在于,所述审核模型的构建过程包括:
从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合,其中,所述样本集合中的任一样本均包括商户信息向量和审核结果;
构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,Result为模型输出的审核结果;
使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
3.根据权利要求2所述的商户审核方法,其特征在于,所述使用所述样本集合对所述审核模型进行训练包括:
根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),
根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果,Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn;
根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值;
若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新,并对所述审核模型进行第tn+1次样本训练;
若第tn次样本训练的误差值小于所述误差阈值,则结束对所述审核模型的训练。
4.根据权利要求3所述的商户审核方法,其特征在于,所述对所述权重向量进行更新包括:
根据下式对所述权重向量进行更新:
WeightVectn+1T=WeightVectnT-λ×SpMatrixT×ErrortnT
其中,λ为预设的更新系数,
5.根据权利要求1至4中任一项所述的商户审核方法,其特征在于,所述根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息包括:
向所述商户的终端设备发送数据授权请求;
接收所述商户的终端设备反馈的所述商户的授权信息;
从预设的服务器列表中选取与第s个数据源对应的服务器作为数据服务器,所述服务器列表记录了各个数据源与各个服务器之间的对应关系,1≤s≤SourceNum,SourceNum为数据源的总数;
向所述数据服务器发送数据请求,所述数据请求中包括所述商户的商户标识和授权信息;
接收所述数据服务器发送的所述商户的商户信息。
6.一种商户审核装置,其特征在于,包括:
商户审核申请接收模块,用于接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
商户信息获取模块,用于根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
商户信息向量构造模块,用于根据各个审核维度上的商户信息构造所述商户的商户信息向量;
审核模型计算模块,用于使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
7.根据权利要求6所述的商户审核装置,其特征在于,还包括:
样本集合构造模块,用于从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合,其中,所述样本集合中的任一样本均包括商户信息向量和审核结果;
审核模型构造模块,用于构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,Result为模型输出的审核结果;
样本训练模块,用于使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
8.根据权利要求7所述的商户审核装置,其特征在于,所述样本训练模块包括:
样本训练单元,用于根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),
误差向量计算单元,用于根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果,Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn;
误差值计算单元,用于根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值;
权重向量更新单元,用于若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新;
结束训练单元,用于若第tn次样本训练的误差值小于所述误差阈值,则结束对所述审核模型的训练。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的商户审核方法的步骤。
10.一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的商户审核方法的步骤。
本发明属于计算机技术领域,尤其涉及一种商户审核方法、装置、计算机可读存储介质及服务器。
随着移动互联网技术的不断发展,各种为商户提供服务的应用平台层出不穷,例如,当前市场上有为商户提供外卖服务的外卖平台,还有为商户提供收款服务的支付平台等等。为了杜绝不合规的商户加入到应用平台中,给应用平台造成不良的社会影响,这些应用平台一般会对要加入的商户进行审核,只有审核通过的商户才能加入到应用平台中。但是目前的商户审核,一般需要设置专门的审核人员根据自己的经验对商户进行人工审核,审核效率低,且严重依赖审核人员的个人经验,难以保证公正客观。
有鉴于此,本发明实施例提供了一种商户审核方法、装置、计算机可读存储介质及服务器,以解决现有的人工审核方式效率低,且严重依赖审核人员的个人经验,难以保证公正客观的问题。
本发明实施例的第一方面提供了一种商户审核方法,可以包括:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例的第二方面提供了一种商户审核装置,可以包括:
商户审核申请接收模块,用于接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
商户信息获取模块,用于根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
商户信息向量构造模块,用于根据各个审核维度上的商户信息构造所述商户的商户信息向量;
审核模型计算模块,用于使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如下步骤:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例的第四方面提供了一种服务器,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现如下步骤:
接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
根据各个审核维度上的商户信息构造所述商户的商户信息向量;
使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例在接收到商户的终端设备发送的商户审核申请后,从所述商户审核申请中提取所述商户的商户标识,根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,并根据各个审核维度上的商户信息构造所述商户的商户信息向量,最后使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果。由于所述审核模型预先经过了大量的样本训练,通过机器学习从历史商户审核记录中得到了通用的审核模式,在无需审核人员干预的情况下,既可自动对商户进行审核,大大提高了审核效率,且无需依赖审核人员的个人经验,保证了审核结果的公正客观。
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例中一种商户审核方法的一个实施例流程图;
图2为根据商户标识分别从各个预设的数据源中获取商户在各个预设的审核维度上的商户信息的示意流程图;
图3本发明实施例中一种商户审核装置的一个实施例结构图;
图4本发明实施例中一种服务器的示意框图。
为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1,本发明实施例中一种商户审核方法的一个实施例可以包括:
步骤S101、接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识。
当商户想要加入到应用平台中时,可以通过手机、平板电脑、笔记本电脑等终端设备向负责进行商户审核的执行服务器发送商户审核申请,在该商户审核申请中携带着其商户标识,该商户标识可以是商户的工商登记号码、法人身份证号码或者其它可以唯一代表该商户的标识。
所述执行服务器在接收到该商户审核申请后,即可从中提取出所述商户的商户标识。
步骤S102、根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息。
其中,每个数据源均对应至少一个审核维度上的商户信息。
这些商户信息包括但不限于:工商登记信息、法人信用信息、税务记录信息、各大网站及论坛关于该商户的正、负面信息等等审核维度。
这些商户信息可以是从多个不同的数据源获取的,例如,工商行政机关的服务器中存储的该商户的工商登记信息、银行的服务器中存储的该商户的法人信用信息、税务行政机关的服务器中存储的该商户的税务记录信息、各大网站及论坛的服务器中存储的该商户的正、负面信息等等。
如图2所示,步骤S102具体可以包括如下过程:
步骤S1021、向所述商户的终端设备发送数据授权请求。
所述数据授权请求中包括所述执行服务器的设备标识,所述设备标识为唯一代表所述执行服务器的标识。
步骤S1022、接收所述商户的终端设备反馈的所述商户的授权信息。
所述商户的终端设备在接收到数据授权请求后,会记录下所述执行服务器的设备标识,并向所述执行服务器反馈所述商户的授权信息。
步骤S1023、从预设的服务器列表中选取与第s个数据源对应的服务器作为数据服务器。
其中,1≤s≤SourceNum,SourceNum为数据源的总数。
所述执行服务器列表记录了各个数据源与各个数据服务器之间的对应关系,具体如下表所示:
步骤S1024、向所述数据服务器发送数据请求。
所述数据请求中包括所述商户的商户标识和授权信息,还包括所述执行服务器的设备标识。
步骤S1025、接收所述数据服务器发送的所述商户的商户信息。
所述数据服务器在接收到所述数据请求后,对所述授权信息进行核对,若核对无误,则根据所述商户标识在本地数据库中查到所述商户的商户信息,并向所述执行服务器发送所述商户的商户信息。
通过以上过程,在获得商户授权的前提下,再从各个数据服务器中获取客户的信息,保证了商户信息的安全性。当获得了所述商户在各个预设的审核维度上的商户信息后,则可根据这些商户信息进行审核。
步骤S103、根据各个审核维度上的商户信息构造所述商户的商户信息向量。
由于步骤S102中获取的商户信息并不是数值化的信息,不利于进行分析计算,因此,需要首先对各个审核维度的商户信息进行数值化处理。
例如,对于工商登记信息这一审核维度,将从工商行政机关的服务器中获取的登记信息与商户提供的信息进行比对,例如,可以通过OCR识别来对工商登记执照进行比对,计算两者之间的相似度,该相似度的取值区间为[0,1],最后将该相似度作为商户在工商登记信息这一审核维度上的取值。
对于法人信用信息这一审核维度,统计其中的不良记录(例如,失信、违约等记录)次数,并设置不良记录的阈值,若超过该阈值,则将法人信用信息这一审核维度数值化为1,若小于该阈值,则计算不良记录次数与该阈值的比值,将该比值作为数值化处理后的结果。特殊地,若不良记录次数为0,则将法人信用信息这一审核维度数值化为0。
对于税务记录信息这一审核维度,统计其中的不良记录(例如,偷税漏税等记录)次数,并设置不良记录的阈值,若超过该阈值,则将税务记录信息这一审核维度数值化为1,若小于该阈值,则计算不良记录次数与该阈值的比值,将该比值作为数值化处理后的结果。特殊地,若不良记录次数为0,则将税务记录信息这一审核维度数值化为0。
对于各大网站及论坛关于该商户的正、负面信息这一审核维度,可以根据下式计算数值化后的结果:
其中,w为网站(论坛)的序号,1≤w≤WN,WN为网站(论坛)的总数,Weightw为第w个网站(论坛)的权重,可以根据实际情况进行设置,一般地,将影响力较大的网站(论坛)设置较高的权重,将影响力较小的网站(论坛)设置较低的权重,Posw为第w个网站(论坛)关于该商户的正面信息的个数,Negw为第w个网站(论坛)关于该商户的负面信息的个数,Neuw为第w个网站(论坛)关于该商户的中性信息的个数,Val为这一审核维度的数值化结果。
在进行完数值化处理之后,即可将这些商户信息构造为如下所示的商户信息向量:
InfoVec=(InfoEm1,InfoEm2,...,InfoEmdn,...,InfoEmDN)
其中,dn为审核维度的序号,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,InfoVec为所述商户的商户信息向量。
步骤S104、使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果。
所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
所述审核模型的构建过程可以包括:
首先,从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合。
其中,所述样本集合中的任一样本均包括商户信息向量和审核结果。为了保证结果的准确性,应尽量增加所述样本集合中的样本数目,例如,可以将样本数目设置为5000、10000、50000或者其它取值。
所述样本集合中的正样本的数目与负样本的数目应满足一定的限制条件,例如:
其中,PN为所述样本集合中的正样本的总数,NgN为所述样本集合中的负样本的总数,Thresh为预设的阈值,该阈值可以根据实际情况进行设置,例如,可以将其设置为0.1、0.01、0.001或者其它取值。
特殊地,可以保持正样本的数目与负样本的数目一致。例如,若共选取10000个样本,则其中正样本和负样本各5000个,以此保证分析结果的平衡性。
然后,构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,Result为模型输出的审核结果。
最后,使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
具体的训练过程可以包括:
根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),特殊地,第1次样本训练的权重向量可以根据实际情况进行设置,例如,可以将其设置为全1向量,即WeightVec1=(1,1,...,1,...,1)。
根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果(例如,若审核结果为通过,则用1来表示,若审核结果为不通过,则用0来表示),Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn。
在此基础上,还可以进一步根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值。
若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新,并对所述审核模型进行第tn+1次样本训练。
所述误差阈值可以根据实际情况进行设置,例如,可以将其设置为5、10、20或者其它取值。
所述权重向量的更新过程如下式所示:
WeightVectn+1T=WeightVectnT-λ×SpMatrixT×ErrortnT
其中,λ为预设的更新系数,可以根据实际情况进行设置,例如,可以将其设置为0.1、0.01、0.001或者其它取值,
若第tn次样本训练的误差值小于所述误差阈值,则可认为所述审核模型已训练完毕,结束对所述审核模型的训练。
在所述审核模型训练完成后,使用所述审核模型对所述商户的商户信息向量进行计算,即可得到所述商户的审核结果。
该审核结果若大于预设的结果阈值,则可以判定该商户审核通过,该审核结果若小于或等于该结果阈值,则可以判定该商户审核不通过。所述结果阈值可以根据实际情况进行设置,例如,可以将其设置为0.4、0.5、0.6或者其它取值,在本实施例中,优选将其设置为0.5。
综上所述,本发明实施例在接收到商户的终端设备发送的商户审核申请后,从所述商户审核申请中提取所述商户的商户标识,根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,并根据各个审核维度上的商户信息构造所述商户的商户信息向量,最后使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果。由于所述审核模型预先经过了大量的样本训练,通过机器学习从历史商户审核记录中得到了通用的审核模式,在无需审核人员干预的情况下,既可自动对商户进行审核,大大提高了审核效率,且无需依赖审核人员的个人经验,保证了审核结果的公正客观。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的一种商户审核方法,图3出了本发明实施例提供的一种商户审核装置的一个实施例结构图。
本实施例中,一种商户审核装置可以包括:
商户审核申请接收模块301,用于接收商户的终端设备发送的商户审核申请,并从所述商户审核申请中提取所述商户的商户标识;
商户信息获取模块302,用于根据所述商户标识分别从各个预设的数据源中获取所述商户在各个预设的审核维度上的商户信息,其中,每个数据源均对应至少一个审核维度上的商户信息;
商户信息向量构造模块303,用于根据各个审核维度上的商户信息构造所述商户的商户信息向量;
审核模型计算模块304,用于使用预设的审核模型对所述商户的商户信息向量进行计算,得到所述商户的审核结果,所述审核模型为经过预设的样本集合训练的机器学习模型,所述样本集合中包括审核结果为通过的正样本以及审核结果为不通过的负样本,每个样本均对应于预设的数据库中的一条历史商户审核记录。
进一步地,所述商户审核装置还可以包括:
样本集合构造模块,用于从所述数据库中获取各条历史商户审核记录,并根据所述历史商户审核记录构造样本集合,其中,所述样本集合中的任一样本均包括商户信息向量和审核结果;
审核模型构造模块,用于构造如下所示的审核模型:
其中,WtEmdn为第dn个审核维度上的商户信息的权重系数,1≤dn≤DN,DN为审核维度的总数,InfoEmdn为第dn个审核维度上的商户信息,Result为模型输出的审核结果;
样本训练模块,用于使用所述样本集合对所述审核模型进行训练,直至误差值小于预设的误差阈值为止。
进一步地,所述样本训练模块可以包括:
样本训练单元,用于根据下式对所述审核模型进行第tn次样本训练:
其中,sn为所述样本集合中的样本序号,1≤sn≤SN,SN为所述样本集合中的样本总数,SampleVecsn为第sn个样本的商户信息向量,且SampleVecsn=(SpEmsn,1,SpEmsn,2,...,SpEmsn,dn,...,SpEmsn,DN),SpEmsn,dn为第sn个样本的商户信息向量在第dn个审核维度上的取值,tn为样本训练的次数序号,WeightVectn为第tn次样本训练的权重向量,且WeightVectn=(WtEmtn,1,WtEmtn,2,...,WtEmtn,dn,...,WtEmtn,DN),WtEmtn,dn为WeightVectn在第dn个审核维度上的取值,T为转置符号,EsResultVectn为第tn次样本训练的结果向量,且EsResultVectn=(EsValtn,1,EsValtn,2,...,EsValtn,sn,...,EsValtn,SN),
误差向量计算单元,用于根据下式计算第tn次样本训练的误差向量:
Errortn=EsResultVectn-SpResultVec
其中,SpResultVec为目标结果向量,且SpResultVec=(SpVal1,SpVal2,...,SpValsn,...,SpValSN),SpValsn为第sn个样本的审核结果,Errortn为第tn次样本训练的误差向量,且Errortn=(ErrEmtn,1,ErrEmtn,2,...,ErrEmtn,sn,...,ErrEmtn,SN),ErrEmtn,sn=SpValsn-EsValtn,sn;
误差值计算单元,用于根据下式计算第tn次样本训练的误差值:
其中,ErrValtn即为第tn次样本训练的误差值;
权重向量更新单元,用于若第tn次样本训练的误差值大于或等于所述误差阈值,则对所述权重向量进行更新;
结束训练单元,用于若第tn次样本训练的误差值小于所述误差阈值,则结束对所述审核模型的训练。
进一步地,所述权重向量更新单元具体用于根据下式对所述权重向量进行更新:
WeightVectn+1T=WeightVectnT-λ×SpMatrixT×ErrortnT
其中,λ为预设的更新系数,
进一步地,所述商户信息获取模块可以包括:
数据授权请求发送单元,用于向所述商户的终端设备发送数据授权请求;
授权信息接收单元,用于接收所述商户的终端设备反馈的所述商户的授权信息;
数据服务器选取单元,用于从预设的服务器列表中选取与第s个数据源对应的服务器作为数据服务器,所述服务器列表记录了各个数据源与各个服务器之间的对应关系,1≤s≤SourceNum,SourceNum为数据源的总数;
数据请求发送单元,用于向所述数据服务器发送数据请求,所述数据请求中包括所述商户的商户标识和授权信息;
商户信息接收单元,用于接收所述数据服务器发送的所述商户的商户信息。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的装置,模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
图4示出了本发明实施例提供的一种服务器的示意框图,为了便于说明,仅示出了与本发明实施例相关的部分。
在本实施例中,所述服务器4可以包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机可读指令42,例如执行上述的商户审核方法的计算机可读指令。所述处理器40执行所述计算机可读指令42时实现上述各个商户审核方法实施例中的步骤,例如图1所示的步骤S101至S104。或者,所述处理器40执行所述计算机可读指令42时实现上述各装置实施例中各模块/单元的功能,例如图3所示模块301至304的功能。
示例性的,所述计算机可读指令42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机可读指令42在所述服务器4中的执行过程。
所述处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述服务器4的内部存储单元,例如服务器4的硬盘或内存。所述存储器41也可以是所述服务器4的外部存储设备,例如所述服务器4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器41还可以既包括所述服务器4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机可读指令以及所述服务器4所需的其它指令和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干计算机可读指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储计算机可读指令的介质。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
本文发布于:2023-04-15 05:33:02,感谢您对本站的认可!
本文链接:https://patent.en369.cn/patent/3/87088.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |