基于人工智能的数据处理方法、装置、介质及设备与流程

阅读: 评论:0



1.本技术涉及人工智能技术领域,具体而言,涉及一种基于人工智能的数据处理方法、基于人工智能的数据处理装置、计算机可读存储介质及电子设备。


背景技术:



2.随着终端游戏的不断发展,各类型游戏的可玩性越来越高,而一些特定用户(如,青少年)的自制力一般较弱,在游玩过程中,容易过度沉迷游戏中,这样对特定用户的身心都会造成不同程度的损害。因此,越来越多的游戏提供方为游戏增加防沉迷机制,以通过强制退出游戏等方式,防止特定用户过度沉迷游戏。一般来说,后台会获取用户行为数据,并根据用户行为数据预测当前用户是特定用户的概率,若概率较高,则对其启动防沉迷机制。但是,一般的预测方式只是基于乱序的多条用户数据,并不准确,也没有考虑到影响用户数据的外在因素。因此,根据上述方式进行的特定用户判定可能存在判定准确率较低的问题。
3.需要说明的是,在上述背景技术部分公开的信息仅用于加强对本技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现要素:



4.本技术的目的在于提供一种基于人工智能的数据处理方法、基于人工智能的数据处理装置、计算机可读存储介质及电子设备,可以将目标用户的各条用户数据表示在时间序列的各时间段中,从而可以实现基于时序性的多维度数据分析,进而,根据分析结果可以确定出目标用户的用户特征,作为特定用户判定依据,这样可以提升特定用户判定准确率。
5.本技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本技术的实践而习得。
6.根据本技术的一方面,提供一种基于人工智能的数据处理方法,包括:
7.获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合;
8.读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果;
9.根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合;
10.根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合;其中,相关参数集合用于作为相对应的时间段内的用户数据的多维表征;
11.根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,并基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,第一概率预测模型和第二概率预测模型对应于不同的模型参数。
12.根据本技术的一方面,提供一种基于人工智能的数据处理装置,包括:参数预测单元、参数聚合单元、参数确定单元、参数计算单元、特征生成单元以及特定用户判定单元,其
中:
13.参数预测单元,用于获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合;
14.参数聚合单元,用于读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果;
15.参数确定单元,用于根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合;
16.参数计算单元,用于根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合;其中,相关参数集合用于作为相对应的时间段内的用户数据的多维表征;
17.特征生成单元,用于根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征;
18.特定用户判定单元,用于基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,第一概率预测模型和第二概率预测模型对应于不同的模型参数。
19.在本技术的一种示例性实施例中,各条用户数据分别对应的所属年龄段概率集合中任一所属年龄段概率集合包含:用于表征相对应的用户数据属于预设各年龄段的概率,参数预测单元获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合,包括:
20.采集目标用户在单位时间内对应的各条用户数据;
21.对各条用户数据进行特征变换,得到各条用户数据分别对应的特征向量;
22.将各条用户数据分别对应的特征向量依次输入第一概率预测模型,以使得第一概率预测模型根据各条用户数据分别对应的特征向量计算各条用户数据分别对应的所属年龄段概率集合。
23.在本技术的一种示例性实施例中,参数确定单元根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,包括:
24.根据聚合结果确定划分于各时间段的用户数据,以得到各时间段的数据量;
25.根据各时间段的数据量和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合。
26.在本技术的一种示例性实施例中,参数确定单元根据各时间段的数据量和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,包括:
27.若各时间段中存在数据量大于1的一类时间段,则融合一类时间段内用户数据的所属年龄段概率集合,得到一类时间段的所属年龄段概率集合;
28.若各时间段中存在数据量等于1的二类时间段,则将二类时间段内用户数据的所属年龄段概率集合确定为二类时间段的所属年龄段概率集合;
29.若各时间段中存在数据量小于1的三类时间段,则根据三类时间段的前一相邻时间段的所属年龄段概率集合确定三类时间段的所属年龄段概率集合。
30.在本技术的一种示例性实施例中,各时间段的相关参数集合中任一相关参数集合包含:评分和排名,参数计算单元根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合,包括:
31.根据各时间段的所属年龄段概率集合计算各时间段的评分,并根据各时间段的评分确定各时间段的排名,以得到各时间段的相关参数集合。
32.在本技术的一种示例性实施例中,参数计算单元根据各时间段的评分确定各时间段的排名,包括:
33.确定其他用户在各时间段的评分;
34.针对同一时间段,根据其他用户的评分和目标用户的评分确定目标用户在其他用户中的排名,据此得到目标用户在各时间段的排名。
35.在本技术的一种示例性实施例中,参数计算单元根据各时间段的所属年龄段概率集合计算各时间段的评分,包括:
36.对各时间段的所属年龄段概率集合进行集合内的概率融合,得到各时间段分别对应的参考概率;
37.根据各时间段分别对应的参考概率和所属年龄段概率集合计算各时间段的评分。
38.在本技术的一种示例性实施例中,参数计算单元根据各时间段分别对应的参考概率和所属年龄段概率集合计算各时间段的评分,包括:
39.根据各时间段的参考概率计算各时间段的概率均值和概率标准差;
40.根据各时间段的参考概率、概率均值和概率标准差计算各时间段的评分。
41.在本技术的一种示例性实施例中,特征生成单元根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:
42.根据各条用户数据的时间戳生成各条用户数据分别对应的时间参数;其中,时间参数用于表征相对应的用户数据是否于工作日生成;
43.根据各条用户数据分别对应的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征。
44.在本技术的一种示例性实施例中,特征生成单元根据各条用户数据分别对应的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:
45.根据各条用户数据分别对应的时间参数确定各时间段的时间参数;
46.根据各时间段的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征。
47.在本技术的一种示例性实施例中,特征生成单元根据各时间段的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:
48.将各时间段内的时间参数、各时间段的所属年龄段概率集合、各时间段的相关参数集合中的排名进行拼接,得到各时间段对应的子特征;
49.按照时间序列拼接各时间段对应的子特征,得到用户特征。
50.在本技术的一种示例性实施例中,特定用户判定单元基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,包括:
51.将用户特征输入第二预测模型,以通过第二预测模型计算用户特征对应的特定用户概率,作为判定依据;
52.若特定用户概率处于预设阈值范围,则判定目标用户是特定用户。
53.根据本技术的一方面,提供一种电子设备,包括:处理器;以及存储器,用于存储处理器的可执行指令;其中,处理器配置为经由执行可执行指令来执行上述任意一项的方法。
54.根据本技术的一方面,提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一项的方法。
55.根据本技术的一方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的各种可选实现方式中提供的方法。
56.本技术示例性实施例可以具有以下部分或全部有益效果:
57.在本技术的一示例实施方式所提供的基于人工智能的数据处理方法中,可以获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合;读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果;根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合;根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合;根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,并基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别。依据上述方案描述,本技术一方面可以将目标用户的各条用户数据表示在时间序列的各时间段中,从而可以实现基于时序性的多维度数据分析,进而,根据分析结果可以确定出目标用户的用户特征,作为特定用户判定依据,这样可以提升特定用户判定准确率。本技术又一方面,能够以各时间段为单位对各时间段内的用户数据进行数据分析,从而得到各时间段的相关参数集合,以实现对于各时间段的多维评价,从而提升数据分析精度以及数据分析深度,以便确定出能够准确描述目标用户的用户特征。
58.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术。
附图说明
59.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
60.图1示出了可以应用本技术实施例的一种基于人工智能的数据处理方法及基于人工智能的数据处理装置的示例性系统架构的示意图;
61.图2示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图;
62.图3示意性示出了现有技术中的特定用户判定过程示意图;
63.图4示意性示出了根据本技术的一个实施例的基于人工智能的数据处理方法的流程图;
64.图5示意性示出了根据本技术的一个实施例的多个用户分别对应的用户特征示意图;
65.图6示意性示出了实施基于人工智能的数据处理方法的模块结构示意图;
66.图7示意性示出了根据本技术的一个实施例的基于人工智能的数据处理方法的流
程图;
67.图8示意性示出了根据本技术的一个实施例的实现基于人工智能的数据处理方法的模块结构示意图;
68.图9示意性示出了根据本技术的一个实施例的基于人工智能的数据处理方法的流程图;
69.图10示意性示出了根据本技术的一个实施例中的基于人工智能的数据处理装置的结构框图。
具体实施方式
70.现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本技术将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本技术的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本技术的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本技术的各方面变得模糊。
71.此外,附图仅为本技术的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
72.图1示出了可以应用本技术实施例的一种基于人工智能的数据处理方法及基于人工智能的数据处理装置的示例性应用环境的系统架构的示意图。
73.如图1所示,系统架构100可以包括终端设备101、102、103中的一个或多个,网络104和服务器集105。网络104用以在终端设备101、102、103和服务器集105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于台式计算机、便携式计算机、智能手机和平板电脑等等。应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
74.本技术实施例所提供的基于人工智能的数据处理方法可以由终端设备101、102、103或服务器集105中任一服务器执行。相应地,基于人工智能的数据处理装置一般设置于服务器集105的服务器或终端设备101、102、103中。举例而言,在一种示例性实施例中,服务器集105中任一服务器可以获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合;读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果;根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合;根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合;根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,并基于第二预测模
型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别。
75.图2示出了适于用来实现本技术实施例的电子设备的计算机系统的结构示意图。
76.需要说明的是,图2示出的电子设备的计算机系统200仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
77.如图2所示,计算机系统200包括中央处理单元(cpu)201,其可以根据存储在只读存储器(rom)202中的程序或者从储存部分208加载到随机访问存储器(ram)203中的程序而执行各种适当的动作和处理。在ram 203中,还存储有系统操作所需的各种程序和数据。cpu 201、rom 202以及ram 203通过总线204彼此相连。输入/输出(i/o)接口205也连接至总线204。
78.以下部件连接至i/o接口205:包括键盘、鼠标等的输入部分206;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分207;包括硬盘等的储存部分208;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分209。通信部分209经由诸如因特网的网络执行通信处理。驱动器210也根据需要连接至i/o接口205。可拆卸介质211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器210上,以便于从其上读出的计算机程序根据需要被安装入储存部分208。
79.特别地,根据本技术的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本技术的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分209从网络上被下载和安装,和/或从可拆卸介质211被安装。在该计算机程序被中央处理单元(cpu)201执行时,执行本技术的方法和装置中限定的各种功能。
80.本技术中可以应用区块链技术,具体可以将对于目标用户的判定结果上传至区块链,以便需要的时候可以随时调用,可以使得判定结果不可篡改,保证对于目标用户的判定结果的绝对正确性。其中,区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层。
81.区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合
约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
82.平台产品服务层提供典型应用的基本能力和实现框架,开发人员可以基于这些基本能力,叠加业务的特性,完成业务逻辑的区块链实现。应用服务层提供基于区块链方案的应用服务给业务参与方进行使用。
83.另外,本技术还应用了人工智能技术和机器学习算法,具体表现在对于所属年龄段概率集合的预测以及对于判定依据的预测。人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
84.人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
85.机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
86.本技术实施例提供的方案涉及人工智能的机器学习算法,具体通过如下实施例进行说明:
87.在智能终端用户年龄逐步下探和游戏应用极速丰富的当下,防沉迷机制成为了各方关注的焦点。特别是对于移动游戏提供方,准确捕捉海量用户中的青少年玩家可以为防沉迷机制提供重要的参考。
88.为了能够避开防沉迷机制,青少年玩家有时会积极采取各类手段来规避或是欺骗厂商的各类身份验证机制,例如注册账号使用其他成年人身份证、借用父母手机进行游戏和消费等。这样的行为往往会令显式的防沉迷系统的覆盖率难以保证,而过于严格或复杂的验证机制也会对于占更大比例的成年用户的体验受到极大影响。
89.为了解决这一问题,现有技术中采用了人工智能的机器学习算法,实现基于用户数据的青少年预测。具体请参阅图3,图3示意性示出了现有技术中的特定用户判定过程示意图。如图3所示,现有技术中的特定用户判定过程可以通过执行特征变换模块310、预测判定模型320、均值计算模块330和均值阈值比对模块340得以实现。
90.具体地,可以将收集到的目标用户的各条用户数据输入特征变换模块310,以使得特征变换模块310为每条用户数据计算特征向量,得到各条用户数据的特征向量。进而,可以将各条用户数据的特征向量输入预测判定模型320,以使得预测判定模型320预测各特征向量对应的属于青少年的概率。进而,通过均值计算模块330计算各特征向量对应的属于青
少年的概率的均值,并通过均值阈值比对模块340比对均值和阈值,若均值小于等于阈值,则判定目标用户不属于特定用户;若均值大于阈值,则判定目标用户属于特定用户。
91.可见,图3所示的方式,没有考虑到用户多条数据间的异同。在收集用户行为数据的诸类场景,不同时间中用户的行为很可能没有明显的一致性,而现有技术中没有显示地针对这一现象进行处理,而是代之期望特征变换和预测模型能够进行一个足够好的概率预测结果。此外,上述方案对于数据的需求较大,数据采集的时间周期较长,故,容易导致线上模型无法得到及时的训练。此外,模型筛选用户并非完全基于预先锚定的标准,因此,其结果会受到同批次数据整体的影响。
92.基于上述问题,本示例实施方式提供了一种基于人工智能的数据处理方法。请参阅图4,图4示意性示出了根据本技术的一个实施例的基于人工智能的数据处理方法的流程图。如图4所示,该基于人工智能的数据处理方法可以包括:步骤s410~步骤s450。
93.步骤s410:获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合。
94.步骤s420:读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果。
95.步骤s430:根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合。
96.步骤s440:根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合;其中,相关参数集合用于作为相对应的时间段内的用户数据的多维表征。
97.步骤s450:根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,并基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,第一概率预测模型和第二概率预测模型对应于不同的模型参数。
98.实施图4所示的方法,可以将目标用户的各条用户数据表示在时间序列的各时间段中,从而可以实现基于时序性的多维度数据分析,进而,根据分析结果可以确定出目标用户的用户特征,作为特定用户判定依据,这样可以提升特定用户判定准确率。此外,能够以各时间段为单位对各时间段内的用户数据进行数据分析,从而得到各时间段的相关参数集合,以实现对于各时间段的多维评价,从而提升数据分析精度以及数据分析深度,以便确定出能够准确描述目标用户的用户特征。
99.下面,对于本示例实施方式的上述步骤进行更加详细的说明。
100.在步骤s410中,获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合。
101.具体地,第一预测模型可以为长短时记忆网络模型(long short-term memory,lstm),lstm是一种用以处理序列数据的人工神经网络模型。对于第一预测模型,可以通过标记后的样本用户数据进行训练,根据第一预测模型输出的对于样本用户数据的所属年龄段概率集合与标记结果进行比对,依据比对结果优化第一预测模型中的参数。
102.可选的,在获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合之前,上述方法还可以包括:将数据获取模组集成在项目程序中,以及时进行数据采集和上报;进而,可以从用户日志中采集单位时间(如,48小时)内目标用户的多条用户数据;对多条用户数据进行预处理,得到用于输入第一预测模型
的各条用户数据。其中,预处理过程用于对目标用户的多条用户数据进行标准化,统一用户数据的表示形式,预处理后的用户数据在形式上表示为序列化数据。进而,还可以包括:筛出多条用户数据中不满足于预设条件的非法数据,如,信息不可靠的数据、格式不合法的数据、信息量过少的数据。
103.另外,目标用户可以为待判定的任一用户,本技术可以应用于游戏防沉迷系统,以判别特定用户(如,未成年人用户);其中,游戏防沉迷系统用于防止未成年人过度游戏,倡导健康游戏习惯,帮助法定监护人了解监护对象是否参与此网络游戏和受到防沉迷系统的保护情况等。游戏防沉迷系统的运作机制可以包括:检测当前玩家是否为未成年人玩家,如果是,则采取相对应的措施。
104.需要说明的是,每个用户均可以对应于多条用户数据,每个用户的每条用户数据均是根据用户操作生成的,用户在游戏过程的每次操作都会对应生成一条用户数据,以记录用户的每一次操作。举例来说,用户数据可以基于语音信号、页面跳转逻辑、操作编码等生成,也可以直接从内置传感器中获取。另外,多条用户数据可以对应于特定游戏场景也可以对应于任意游戏场景。
105.另外,所属年龄段概率集合可以包括针对多个年龄段的概率,每个概率用于表征目标用户属于该年龄段的概率,同一用户对应的多条用户数据所对应的所属年龄段概率集合可以是不同的。可选的,所属年龄段概率集合可以包括[8岁-14岁的概率,15岁-17岁的概率,18岁-19岁的概率,20岁-24岁的概率,25岁-29岁的概率,30岁-34岁的概率,35岁-39岁的概率,》=40岁的概率]。
[0106]
针对各条用户数据分别对应的所属年龄段概率集合,举例来说,目标用户(如,张三)对应的各条用户数据分别为用户数据a、用户数据b和用户数据c;其中,用户数据a、用户数据b和用户数据c分别是基于用户操作a、用户操作b和用户操作c生成的。
[0107]
具体地,用户数据a对应的所属年龄段概率集合可以为[8岁-14岁的概率为2%,15岁-17岁的概率为3%,18岁-19岁的概率为3%,20岁-24岁的概率为1%,25岁-29岁的概率为1%,30岁-34岁的概率为5%,35岁-39岁的概率为5%,》=40岁的概率为80%]。可见,目标用户(如,张三)对应的用户数据a可以表明张三为》=40岁的概率为80%。
[0108]
用户数据b对应的所属年龄段概率集合可以为[8岁-14岁的概率为3%,15岁-17岁的概率为2%,18岁-19岁的概率为1%,20岁-24岁的概率为1%,25岁-29岁的概率为3%,30岁-34岁的概率为5%,35岁-39岁的概率为5%,》=40岁的概率为80%]。可见,目标用户(如,张三)对应的用户数据b也可以表明张三为》=40岁的概率为80%。
[0109]
用户数据c对应的所属年龄段概率集合可以为[8岁-14岁的概率为90%,15岁-17岁的概率为4%,18岁-19岁的概率为1%,20岁-24岁的概率为1%,25岁-29岁的概率为1%,30岁-34岁的概率为1%,35岁-39岁的概率为1%,》=40岁的概率为1%]。可见,目标用户(如,张三)对应的用户数据c可以表明张三为8岁-14岁的概率为90%。
[0110]
作为一种可选的实施例,各条用户数据分别对应的所属年龄段概率集合中任一所属年龄段概率集合包含:用于表征相对应的用户数据属于预设各年龄段的概率,获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合,包括:采集目标用户在单位时间内对应的各条用户数据;对各条用户数据进行特征变换,得到各条用户数据分别对应的特征向量;将各条用户数据分别对应的特征向量依
次输入第一概率预测模型,以使得第一概率预测模型根据各条用户数据分别对应的特征向量计算各条用户数据分别对应的所属年龄段概率集合。
[0111]
具体地,所属年龄段概率集合为八维向量,可以表示为{f1,

,fn,fi},i为年龄段的纬度,fi为对应的用户数据属于第i个年龄段的概率,fi的取值处于0~1之间。年龄段具体为[8-14,15-17,18-19,20-24,25-29,30-34,35-39,》=40],可以设定《=14岁为青少年,》14岁为非青少年。
[0112]
举例来说,可以将各条用户数据进行特征变换后得到的特征向量a1,

,an依次输入第一概率预测模型,以使得第一概率预测模型生成与各条用户数据分别对应的所属年龄段概率集合{f1,

,fn,fi}。
[0113]
可见,实施该可选的实施例,能够根据各条用户数据的特征向量计算出各条用户数据分别对应的所属年龄段概率集合,以提升判定预测目标用户属于特定用户的准确率。此外,通过将原有的预测模型拆分为特征变换模块和预测模型,即,第一概率预测模型仅进行预测,可以降低更新量,缩减线上更新模型的时间开销,提升模型优化效率。
[0114]
在步骤s420中,读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果。
[0115]
具体地,时间序列为预设的采样周期(如,30天),时间序列中的各时间段两两之间相邻,相邻时间段进行拼接可以构成时间序列;其中,本技术对于时间段的数量不作限定,时间段的长度也不作限定,优选长度为12小时。另外,时间序列中的相邻时间段之间可以存在重叠也可以不存在重叠。
[0116]
进一步地,读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果,包括:根据各条用户数据的时间戳将各条用户数据划分至时间序列的相应时间段中,以实现对于各条用户数据的聚合;其中,各条用户数据的时间戳分别用于表征各条用户数据的生成时间。
[0117]
举例来说,若时间段包括00:00~02:00、02:00~04:00、04:00~06:00,各条用户数据包括时间戳为01:05的用户数据、时间戳为01:30的用户数据、时间戳为02:25的用户数据,则可以将时间戳为01:05和01:30的用户数据划分至时间段00:00~02:00中,将时间戳为02:25的用户数据划分至时间段02:00~04:00中。
[0118]
在步骤s430中,根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合。
[0119]
具体地,聚合结果可以包括:囊括了不同数量(也可以是相同数量)用户数据的各个时间段。
[0120]
作为一种可选的实施例,根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,包括:根据聚合结果确定划分于各时间段的用户数据,以得到各时间段的数据量;根据各时间段的数据量和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合。
[0121]
举例来说,若时间段包括00:00~02:00、02:00~04:00、04:00~06:00,根据聚合结果确定划分于各时间段的用户数据,可以确定出属于00:00~02:00的用户数据量为2,属于02:00~04:00的用户数据量为4,04:00~06:00的用户数据量为3。
[0122]
进而,对于根据各时间段的数据量和各条用户数据分别对应的所属年龄段概率集
合确定各时间段的所属年龄段概率集合,针对每个时间段的所属年龄段概率集合计算方式一致,故,以各时间段中目标时间段为例,说明目标时间段的所属年龄段概率集合的计算方式,目标时间段可以为各时间段中任一时间段:将目标时间段中同属一个年龄段的概率进行求平均,得到目标时间段中属于每个年龄段的概率,即目标时间段的所属年龄段概率集合。
[0123]
举例来说,若目标时间段为00:00~02:00,属于00:00~02:00的用户数据量为2,一个用户数据的所属年龄段概率集合为[8岁-14岁的概率为2%,15岁-17岁的概率为3%,18岁-19岁的概率为3%,20岁-24岁的概率为1%,25岁-29岁的概率为1%,30岁-34岁的概率为5%,35岁-39岁的概率为5%,》=40岁的概率为80%]。另一个用户数据的所属年龄段概率集合为[8岁-14岁的概率为3%,15岁-17岁的概率为2%,18岁-19岁的概率为1%,20岁-24岁的概率为1%,25岁-29岁的概率为3%,30岁-34岁的概率为5%,35岁-39岁的概率为5%,》=40岁的概率为80%]。进而,可以将对同属8岁-14岁年龄段的概率进行求平均,即,(2%+3%)/2,采用与此相同的方式,可以计算得出目标时间段在[8-14,15-17,18-19,20-24,25-29,30-34,35-39,》=40]各个年龄段的所属年龄段概率,即所属年龄段概率集合[(2%+3%)/2,(3%+2%)/2,(3%+1%)/2,(1%+1%)/2,(1%+3%)/2,(5%+5%)/2,(5%+5%)/2,(80%+80%)/2]。
[0124]
可选的,在根据各时间段的数据量和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合之前,还可以包括:若检测到干扰项设定操作,则将干扰项设定操作对应的目标年龄段设置为干扰项;将各条用户数据分别对应的所属年龄段概率集合中的目标年龄段所对应的概率筛除,以提升对于各时间段的所属年龄段概率集合的计算精度。
[0125]
可见,实施该可选的实施例,能够在用户纬度下实现时间建模,以显式地对用户在不同时间段的行为进行编码和学习,从而可以更好地处理由于时间尺度拉长带来的不同时段间用户切换问题(如,前一小时青少年在玩,后一小时家长在玩),据此提升判定目标用户是否属于特定用户的精度。
[0126]
作为一种可选的实施例,根据各时间段的数据量和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,包括:
[0127]
若各时间段中存在数据量大于1的一类时间段,则融合一类时间段内用户数据的所属年龄段概率集合,得到一类时间段的所属年龄段概率集合;
[0128]
若各时间段中存在数据量等于1的二类时间段,则将二类时间段内用户数据的所属年龄段概率集合确定为二类时间段的所属年龄段概率集合;
[0129]
若各时间段中存在数据量小于1的三类时间段,则根据三类时间段的前一相邻时间段的所属年龄段概率集合确定三类时间段的所属年龄段概率集合。
[0130]
具体地,数据量大于1的一类时间段用于表示该时间段内包含至少两条用户数据,同理,数据量等于1的二类时间段用于表示该时间段内仅包含一条用户数据,数据量小于1的三类时间段用于表示该时间段内不包含任何用户数据。
[0131]
对于包含至少两条用户数据的时间段,可以对其用户数据的所属年龄段概率集合进行对位求平均。即,集合纵向对齐,每个集合的第一位元素求平均,每个集合的第二位元素求平均,以此类推,得到包含至少两条用户数据的时间段的所属年龄段概率集合。
[0132]
对于不包含任何用户数据的时间段,可以将该时间段的前一相邻时间段/后一相邻时间段的所属年龄段概率集合直接作为不包含任何用户数据的时间段的所属年龄段概率集合。这样可以避免出现空值的情况,降低空置对于最终预测结果的影响,提升相邻时间段之间的数据平滑性。
[0133]
请参阅图5,图5示意性示出了根据本技术的一个实施例的多个用户分别对应的用户特征示意图。如图5所示,根据步骤s410~步骤s450可以确定出用户1、用户2和用户3分别对应的用户特征,当用户1、用户2和用户3依次应用于步骤s410~步骤s450时,用户1、用户2和用户3可以依次作为步骤s410~步骤s450中的目标用户。故,用户1、用户2和用户3的用户特征的获取方式是相同的。
[0134]
具体地,针对用户1/用户2/用户3,可以基于第一预测模型预测用户1/用户2/用户3的各条用户数据分别对应的所属年龄段概率集合,表示为向量f。读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果,其中,时间序列的时间方向在图5中通过带指向箭头的直线进行表示,虚线对于带指向箭头的直线的垂直分割可以得到时间序列中不同的时间段,即,时间段1、时间段2
……
时间段n,n为正整数。
[0135]
若存在包含至少两条用户数据的情况,则对包含至少两条用户数据的时间段执行聚合操作,具体包括:可以对包含至少两条用户数据的时间段进行所属年龄段概率集合的对位求平均。即,集合纵向对齐,每个集合的第一位元素求平均,每个集合的第二位元素求平均,以此类推,得到包含至少两条用户数据的时间段的所属年龄段概率集合。
[0136]
若存在不包含任何用户数据的情况,则对不包含任何用户数据的时间段执行填充操作,具体包括:将该时间段的前一相邻时间段/后一相邻时间段的所属年龄段概率集合直接作为不包含任何用户数据的时间段的所属年龄段概率集合。
[0137]
进而,可以根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定时间段1、时间段2
……
时间段n的所属年龄段概率集合,根据各时间段的所属年龄段概率集合可以计算各时间段的评分s。根据计算出的用户1、用户2和用户3在时间序列的各时间段的评分s,可以进行纵向比对以得到评分的排名r。例如,可以比对时间段1内的用户1、用户2和用户3分别对应评分s(如,3,7,6),以得到时间段1内的用户1、用户2和用户3各自的排名r(如,3,1,2)。即,评分s为7的用户2》评分s为6的用户3》评分s为3的用户1。
[0138]
依据上述方法,可以确定出各时间段下用户1、用户2和用户3的评分s和排名r。
[0139]
另外,还可以根据用户1/用户2/用户3的各条用户数据的时间戳生成各条用户数据分别对应的时间参数t;其中,时间参数t用于表征相对应的用户数据是否于工作日生成。进而,根据时间参数t、向量f和排名r可以构成对于各时间段的参数描述。进而,再根据时间段1、时间段2
……
时间段n的时间顺序进行依次拼接,可以得到用户1、用户2和用户3分别对应的用户特征1、用户特征2和用户特征3,用户特征1、用户特征2和用户特征3均具备时序性。
[0140]
可见,实施该可选的实施例,能够通过数据聚合和/或数据填充的方式获取各时间段的所属年龄段概率集合,这样可以计算出准确表征目标用户的用户特征,进而提升对于特定用户的判定精度。
[0141]
在步骤s440中,根据各时间段的所属年龄段概率集合计算各时间段的相关参数集
合;其中,相关参数集合用于作为相对应的时间段内的用户数据的多维表征。
[0142]
具体地,各时间段的相关参数集合包括相对应时间段的评分和排名。
[0143]
作为一种可选的实施例,各时间段的相关参数集合中任一相关参数集合包含:评分和排名,根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合,包括:根据各时间段的所属年龄段概率集合计算各时间段的评分,并根据各时间段的评分确定各时间段的排名,以得到各时间段的相关参数集合。
[0144]
具体地,评分用于作为各个时间段的个性化表征,排名用于表征目标用户在该时间段的评分相较于其他用户在该时间段的评分的排名先后顺序。
[0145]
可见,实施该可选的实施例,能够计算出各时间段对应的评分和排名,从而有利于从多个维度表征该时间段内的用户数据,以提升用户特征的时序性,改善预测结果的精度。
[0146]
作为一种可选的实施例,根据各时间段的所属年龄段概率集合计算各时间段的评分,包括:对各时间段的所属年龄段概率集合进行集合内的概率融合,得到各时间段分别对应的参考概率;根据各时间段分别对应的参考概率和所属年龄段概率集合计算各时间段的评分。
[0147]
具体地,对各时间段的所属年龄段概率集合进行集合内的概率融合,得到各时间段分别对应的参考概率,包括:根据用户设定操作对各所属年龄段概率集合中的冗余年龄段(如,年龄段为15-17的概率)概率筛除,对筛除结果进行年龄段合并以及概率融合,以实现对于所属年龄段概率集合的降维,得到各时间段分别对应的参考概率。其中,对筛除结果进行概率融合的方式具体为:根据或者计算各时间段分别对应的参考概率p。
[0148]
可见,实施该可选的实施例,能够通过对于各时间段的所属年龄段概率集合的内部概率融合,可以将原本多维的各时间段的所属年龄段概率集合降低至二维,从而提升对于评分的计算效率。
[0149]
作为一种可选的实施例,根据各时间段分别对应的参考概率和所属年龄段概率集合计算各时间段的评分,包括:根据各时间段的参考概率计算各时间段的概率均值和概率标准差;根据各时间段的参考概率、概率均值和概率标准差计算各时间段的评分。
[0150]
具体地,根据各时间段的参考概率计算各时间段的概率均值和概率标准差,包括:根据各时间段分别对应的参考概率p计算各时间段的概率均值和概率标准差std{p}。基于此,根据各时间段的参考概率、概率均值和概率标准差计算各时间段的评分,包括:基于表达式计算各时间段的评分其中,用于表示第i个用户在时间段t的评分,pi用于表示第i个用户的参考概率p。
[0151]
可见,实施该可选的实施例,能够基于上述具体计算方式,提升对于评分的计算精度。
[0152]
作为一种可选的实施例,根据各时间段的评分确定各时间段的排名,包括:确定其他用户在各时间段的评分;针对同一时间段,根据其他用户的评分和目标用户的评分确定目标用户在其他用户中的排名,据此得到目标用户在各时间段的排名。
[0153]
具体地,针对同一时间段,根据其他用户的评分和目标用户的评分确定目标用户在其他用户中的排名,包括:对于每个时间段t的所有用户的评分进行排序,得到每个时间段t的目标用户在其他用户中的排名。其中,目标用户在其他用户中的排名可以通过固定参与运算的用户数量或归一化等方式保证其横向尺度的统一。
[0154]
可见,实施该可选的实施例,能够参考其他用户的用户数据,以确定出目标用户在各时间段的排名,从而有利于提升所生成的用户特征的准确率,以及特定用户判定精度。
[0155]
在步骤s450中,根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,并基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,第一概率预测模型和第二概率预测模型对应于不同的模型参数。
[0156]
具体地,特定用户可以为特定年龄阶段用户,如,0~14岁的用户。
[0157]
另外,第二预测模型可以为长短时记忆网络模型(long short-term memory,lstm),lstm是一种用以处理序列数据的人工神经网络模型。可选的,第一预测模型和第二预测模型也可以为卷积神经网络(convolutional neural networks,cnn)或循环神经网络(recurrent neural networks,rnn)等神经网络模型,本技术实施例不作限定。此外,第一预测模型和第二预测模型对应于不同的网络结构以及不同的网络参数。
[0158]
作为一种可选的实施例,根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:根据各条用户数据的时间戳生成各条用户数据分别对应的时间参数;其中,时间参数用于表征相对应的用户数据是否于工作日生成;根据各条用户数据分别对应的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征。
[0159]
具体地,各条用户数据的时间戳用于表征各条用户数据的生成时间。可选的,时间参数也用于表征相对应的用户数据是否于白天生成、是否于游戏活动时间生成;
[0160]
其中,根据各条用户数据的时间戳生成各条用户数据分别对应的时间参数,包括:将各条用户数据输入周期编码器,以使得周期编码器读取各条用户数据中的时间戳并根据时间戳确定用户数据所属的日期是否为工作日;如果是,则将用户数据对应的时间参数设置为1,可以表示为t=1;如果否,则将用户数据对应的时间参数设置为0,可以表示为t=0。可选的,周期编码器可以基于one hot编码算法将用户数据转化为时间参数,其中,one hot编码算法是将类别变量转换为机器学习算法易于利用的一种形式的过程。
[0161]
可见,实施该可选的实施例,能够基于时间参数和相关参数集合生成用户特征,以更准确的表征目标用户,从而有利于提升对于特定用户判定概率的预测精度。
[0162]
作为一种可选的实施例,根据各条用户数据分别对应的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:根据各条用户数据分别对应的时间参数确定各时间段的时间参数;根据各时间段的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征。
[0163]
其中,根据各条用户数据分别对应的时间参数确定各时间段的时间参数,包括:若同属于一个时间段的用户数据对应的时间参数均为相同数值(如,0或1),则将该时间段的时间参数也确定为该数值(如,0或1)。
[0164]
可选的,根据各时间段的时间参数、各时间段的所属年龄段概率集合和各时间段
的相关参数集合生成用户特征,包括:将各时间段内的时间参数t、各时间段的所属年龄段概率集合、相关参数集合中至少一个参数(即,评分和/或排名)进行拼接,得到各时间段对应的子特征;按照时间序列拼接各时间段对应的子特征,得到用户特征。其中,各时间段的所属年龄段概率集合为一个八维向量,通过与时间参数的相关参数集合的拼接可以得到一个十维的子特征。
[0165]
可见,实施该可选的实施例,能够在用户特征中增加时间参数,以表征该时间段是处于工作日还是非工作日,将工作日因素增加至用户特征,可以提升特定用户判定精度。
[0166]
作为一种可选的实施例,根据各时间段的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:将各时间段内的时间参数、各时间段的所属年龄段概率集合、各时间段的相关参数集合中的排名进行拼接,得到各时间段对应的子特征;按照时间序列拼接各时间段对应的子特征,得到用户特征。
[0167]
具体地,用户特征可以为n个十维向量的拼接结果,n为子特征数量。其中,将各时间段内的时间参数、各时间段的所属年龄段概率集合、各时间段的相关参数集合中的排名进行拼接,得到各时间段对应的子特征,包括:将各时间段内的时间参数t、各时间段的所属年龄段概率集合f、各时间段的相关参数集合中的排名r进行拼接,得到各时间段对应的子特征(t-f-r)。
[0168]
可见,实施该可选的实施例,能够通过对于子特征的序列化拼接,得到用于表征目标用户的用户特征,从而有利于提升对于目标用户的判定精度,避免将不属于特定用户的目标用户判定为属于特定用户。
[0169]
请参阅图6,图6示意性示出了实施基于人工智能的数据处理方法的模块结构示意图。如图6所示,该模块结构示意图可以包括:特征变换模块610、周期编码器620、第一预测模型630、融合模块640、评分模块650、排名模块660、特征生成模块670以及第二预测模型680。模块结构示意图可以用于获取目标用户对应的特定用户概率,特定用户概率用于表示目标用户属于特定用户的概率。针对图5所示的用户1、用户2和用户3,均可以使用该模块结构示意图计算出各自对应的特定用户概率,即,目标用户可以为用户1、用户2或用户3等任意用户。
[0170]
具体地,可以输入目标用户的各条用户数据至特征变换模块610,以使得特征变换模块610将目标用户的各条用户数据分别变换为目标用户的特征向量并输入第一预测模型630,第一预测模型630可以计算各条用户数据的所属年龄段概率集合,作为向量f。还可以读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果。进而,各条用户数据的所属年龄段概率集合可以输入融合模块640,以使得将各条用户数据的所属年龄段概率集合融合为各条用户数据的二分概率集合,以便评分模块650根据各条用户数据的二分概率集合计算各时间段分别对应的参考概率,并根据各时间段分别对应的参考概率和所属年龄段概率集合计算各时间段的评分。排名模块660可以根据各时间段的评分确定出各时间段的排名。此外,周期编码器620可以读取各条用户数据中的时间戳并根据时间戳确定用户数据所属的日期是否为工作日,如果是,则将用户数据对应的时间参数t设置为1,可以表示为t=1;如果否,则将用户数据对应的时间参数t设置为0。进而,拼接各时间段(如,时间段1、时间段2
……
时间段n,n为正整数)的排名、时间参数t和向量f可以得到各时间段的子特征。特征生成模块670可以对各时
间段的子特征进行拼接,得到目标用户的用户特征。第二预测模型680可以根据目标用户的用户特征预测目标用户属于特定用户的概率,即,特定用户概率。
[0171]
作为一种可选的实施例,基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,包括:将用户特征输入第二预测模型,以通过第二预测模型计算用户特征对应的特定用户概率,作为判定依据;若特定用户概率处于预设阈值范围(如,80%~100%),则判定目标用户是特定用户。
[0172]
具体地,特定用户概率是用于指示目标用户是否为特定用户。若特定用户概率未处于预设阈值范围,则判定目标用户不是特定用户。在判定目标用户是特定用户的情况下,还可以对目标用户进行标记。进而还可以对目标用户进行进一步的身份验证。
[0173]
基于此,在判定目标用户是特定用户之后,上述方法还可以包括:输出用于提示目标用户已被识别为特定用户的提示信息(如,系统判定您为青少年用户);检测目标用户的连续游玩时间是否超过阈值,如果是,则输出用于提示游戏将在预设时长后强制退出的提示信息(如,您已过度游戏,游戏将在3分钟后强制退出)。
[0174]
另外,输出用于提示游戏将在预设时长后强制退出的提示信息之后,上述方法还可以包括:输出警示信息,警示信息用于警示用户如果不能够在预设时长内退出游戏,则反馈游玩报告至目标设备(如,家长端设备),游玩报告可以包括游玩时间记录。
[0175]
进而,在输出用于提示游戏将在预设时长后强制退出的提示信息之后,上述方法还可以包括:若检测到预设时长后目标用户的账号未退出游戏,则执行强制退出指令,并按比例提升目标用户对应的强制游玩间隔时长,按比例缩减目标用户对应的游玩时长。
[0176]
举例来说,若强制游玩间隔时长为4个小时,游玩时长为30分钟,则目标用户只能够每隔4个小时游玩30分钟。若特定用户不能遵守设定的游玩时长,则可以将强制游玩间隔时长提升为5个小时,将游玩时长缩减为20分钟,以起到对于特定用户的游戏防沉迷控制,以及对于特定用户的警示作用。
[0177]
进一步地,在输出用于提示目标用户已被识别为特定用户的提示信息之后,上述方法还可以包括:若检测到申诉请求,则根据申诉请求输出申诉信息提交界面;通过申诉信息提交界面接收用户输入的申诉信息;根据申诉信息对目标用户进行重新评估,并反馈重新评估结果;若重新评估结果可以用于表示目标用户是特定用户,则执行上述的检测目标用户的连续游玩时间是否超过阈值;若重新评估结果用于表示目标用户不是特定用户,则结束流程。
[0178]
更进一步地,根据申诉信息对目标用户进行重新评估之后,上述方法还可以包括:根据重新评估结果优化第二预测模型。
[0179]
可见,实施该可选的实施例,能够基于周期性的用户数据确定周期性的用户特征,基于此预测特定用户概率,从而提升对于特定用户的判定精度。
[0180]
请参阅图7,图7示意性示出了根据本技术的一个实施例的基于人工智能的数据处理方法的流程图。如图7所示,包括步骤s710~步骤s760。
[0181]
步骤s710:采集目标用户在单位时间内的用户数据。具体地,单位时间可以为一个周期,如,30天。
[0182]
步骤s720:对用户数据进行筛选,并将筛选后的用户数据表示为特征向量输入第一预测模型。具体地,对用户数据进行筛选,可以得到符合预设条件的用户数据。
[0183]
步骤s730:基于第一预测模型预测目标用户的用户数据对应的所属年龄段概率集合。具体地,可以对各条用户数据进行特征变换,得到各条用户数据分别对应的特征向量;将各条用户数据分别对应的特征向量依次输入第一概率预测模型,以使得第一概率预测模型根据各条用户数据分别对应的特征向量计算各条用户数据分别对应的所属年龄段概率集合。
[0184]
步骤s740:根据各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,并根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合,根据各时间段的相关参数集合生成目标用户的用户特征。具体地,可以读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果,在执行上述的根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合。
[0185]
步骤s750:根据历史生成的其他用户的用户特征和对于其他用户的用户特征的标记结果训练第二预测模型。
[0186]
步骤s760:通过训练后的第二预测模型依据目标用户的用户特征判定目标用户是否属于特定用户。具体地,可以将用户特征输入第二预测模型,以通过第二预测模型计算用户特征对应的特定用户概率,作为判定依据;若特定用户概率处于预设阈值范围,则判定目标用户是特定用户。
[0187]
请参阅图8,图8示意性示出了根据本技术的一个实施例的实现基于人工智能的数据处理方法的模块结构示意图。如图8所示,该模块结构示意图可以包括:数据采集模块810、数据预处理模块820、第一概率预测模块830、特征聚合模块840、第二概率预测模块850以及判定结果确定模块860。
[0188]
具体地,数据采集模块810,用于采集单位时间(如,48小时)内目标用户的多条用户数据。数据预处理模块820,用于对目标用户的多条用户数据进行标准化,统一用户数据的表示形式。第一概率预测模块830,用于获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合。特征聚合模块840,用于读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果,根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合。第二概率预测模块850,用于根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,并基于第二预测模型确定用户特征对应的判定依据。判定结果确定模块860,用于根据判定依据对目标用户进行特定用户识别,以明确目标用户是否属于特定用户。
[0189]
请参阅图9,图9示意性示出了根据本技术的一个实施例的基于人工智能的数据处理方法的流程图。如图9所示,该基于人工智能的数据处理方法包括:步骤s900~步骤s970。
[0190]
步骤s900:采集目标用户在单位时间内对应的各条用户数据,对各条用户数据进行特征变换,得到各条用户数据分别对应的特征向量,并将各条用户数据分别对应的特征向量依次输入第一概率预测模型,以使得第一概率预测模型根据各条用户数据分别对应的特征向量计算各条用户数据分别对应的所属年龄段概率集合。
[0191]
步骤s910:读取各条用户数据中的时间戳并依据各条用户数据的时间戳将各条用
户数据聚合至时间序列的各时间段中,得到聚合结果。
[0192]
步骤s920:根据聚合结果确定划分于各时间段的用户数据,以得到各时间段的数据量。
[0193]
步骤s930:若各时间段中存在数据量大于1的一类时间段,则融合一类时间段内用户数据的所属年龄段概率集合,得到一类时间段的所属年龄段概率集合;若各时间段中存在数据量等于1的二类时间段,则将二类时间段内用户数据的所属年龄段概率集合确定为二类时间段的所属年龄段概率集合;若各时间段中存在数据量小于1的三类时间段,则根据三类时间段的前一相邻时间段的所属年龄段概率集合确定三类时间段的所属年龄段概率集合。
[0194]
步骤s940:对各时间段的所属年龄段概率集合进行集合内的概率融合,得到各时间段分别对应的参考概率,并根据各时间段的参考概率计算各时间段的概率均值和概率标准差,进而根据各时间段的参考概率、概率均值和概率标准差计算各时间段的评分。
[0195]
步骤s950:确定其他用户在各时间段的评分,针对同一时间段,根据其他用户的评分和目标用户的评分确定目标用户在其他用户中的排名,据此得到目标用户在各时间段的排名;其中,评分和排名均属于相关参数集合,不同的时间段对应于不同的相关参数集合。
[0196]
步骤s960:根据各条用户数据的时间戳生成各条用户数据分别对应的时间参数,其中,时间参数用于表征相对应的用户数据是否于工作日生成,进而,根据各条用户数据分别对应的时间参数确定各时间段的时间参数,再将各时间段内的时间参数、各时间段的所属年龄段概率集合、各时间段的相关参数集合中的排名进行拼接,得到各时间段对应的子特征,按照时间序列拼接各时间段对应的子特征,可以得到用户特征。
[0197]
步骤s970:将用户特征输入第二预测模型,以通过第二预测模型计算用户特征对应的特定用户概率,作为判定依据,若特定用户概率处于预设阈值范围,则判定目标用户是特定用户,第一概率预测模型和第二概率预测模型对应于不同的模型参数。
[0198]
需要说明的是,步骤s900~步骤s970与图4所示的各步骤及其实施例相对应,针对步骤s900~步骤s970的具体实施方式,请参阅图4所示的各步骤及其实施例,此处不再赘述。
[0199]
可见,实施图9所示的方法,可以将目标用户的各条用户数据表示在时间序列的各时间段中,从而可以实现基于时序性的多维度数据分析,进而,根据分析结果可以确定出目标用户的用户特征,作为特定用户判定依据,这样可以提升特定用户判定准确率。此外,能够以各时间段为单位对各时间段内的用户数据进行数据分析,从而得到各时间段的相关参数集合,以实现对于各时间段的多维评价,从而提升数据分析精度以及数据分析深度,以便确定出能够准确描述目标用户的用户特征。
[0200]
进一步的,本示例实施方式中,还提供了一种基于人工智能的数据处理装置。参考图10所示,该基于人工智能的数据处理装置1000可以包括:参数预测单元1001、参数聚合单元1002、参数确定单元1003、参数计算单元1004、特征生成单元1005以及特定用户判定单元1006,其中:
[0201]
参数预测单元1001,用于获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合;
[0202]
参数聚合单元1002,用于读取各条用户数据中的时间戳并依据各条用户数据的时
间戳将各条用户数据聚合至时间序列的各时间段中,得到聚合结果;
[0203]
参数确定单元1003,用于根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合;
[0204]
参数计算单元1004,用于根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合;其中,相关参数集合用于作为相对应的时间段内的用户数据的多维表征;
[0205]
特征生成单元1005,用于根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征;
[0206]
特定用户判定单元1006,用于基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,第一概率预测模型和第二概率预测模型对应于不同的模型参数。
[0207]
可见,实施图10所示的装置,可以将目标用户的各条用户数据表示在时间序列的各时间段中,从而可以实现基于时序性的多维度数据分析,进而,根据分析结果可以确定出目标用户的用户特征,作为特定用户判定依据,这样可以提升特定用户判定准确率。此外,能够以各时间段为单位对各时间段内的用户数据进行数据分析,从而得到各时间段的相关参数集合,以实现对于各时间段的多维评价,从而提升数据分析精度以及数据分析深度,以便确定出能够准确描述目标用户的用户特征。
[0208]
在本技术的一种示例性实施例中,各条用户数据分别对应的所属年龄段概率集合中任一所属年龄段概率集合包含:用于表征相对应的用户数据属于预设各年龄段的概率,参数预测单元1001获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合,包括:
[0209]
采集目标用户在单位时间内对应的各条用户数据;
[0210]
对各条用户数据进行特征变换,得到各条用户数据分别对应的特征向量;
[0211]
将各条用户数据分别对应的特征向量依次输入第一概率预测模型,以使得第一概率预测模型根据各条用户数据分别对应的特征向量计算各条用户数据分别对应的所属年龄段概率集合。
[0212]
可见,实施该可选的实施例,能够根据各条用户数据的特征向量计算出各条用户数据分别对应的所属年龄段概率集合,以提升判定预测目标用户属于特定用户的准确率。此外,通过将原有的预测模型拆分为特征变换模块和预测模型,即,第一概率预测模型仅进行预测,可以降低更新量,缩减线上更新模型的时间开销,提升模型优化效率。
[0213]
在本技术的一种示例性实施例中,参数确定单元1003根据聚合结果和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,包括:
[0214]
根据聚合结果确定划分于各时间段的用户数据,以得到各时间段的数据量;
[0215]
根据各时间段的数据量和各条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合。
[0216]
可见,实施该可选的实施例,能够在用户纬度下实现时间建模,以显式地对用户在不同时间段的行为进行编码和学习,从而可以更好地处理由于时间尺度拉长带来的不同时段间用户切换问题(如,前一小时青少年在玩,后一小时家长在玩),据此提升判定目标用户是否属于特定用户的精度。
[0217]
在本技术的一种示例性实施例中,参数确定单元1003根据各时间段的数据量和各
条用户数据分别对应的所属年龄段概率集合确定各时间段的所属年龄段概率集合,包括:
[0218]
若各时间段中存在数据量大于1的一类时间段,则融合一类时间段内用户数据的所属年龄段概率集合,得到一类时间段的所属年龄段概率集合;
[0219]
若各时间段中存在数据量等于1的二类时间段,则将二类时间段内用户数据的所属年龄段概率集合确定为二类时间段的所属年龄段概率集合;
[0220]
若各时间段中存在数据量小于1的三类时间段,则根据三类时间段的前一相邻时间段的所属年龄段概率集合确定三类时间段的所属年龄段概率集合。
[0221]
可见,实施该可选的实施例,能够通过数据聚合和/或数据填充的方式获取各时间段的所属年龄段概率集合,这样可以计算出准确表征目标用户的用户特征,进而提升对于特定用户的判定精度。
[0222]
在本技术的一种示例性实施例中,各时间段的相关参数集合中任一相关参数集合包含:评分和排名,参数计算单元1004根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合,包括:
[0223]
根据各时间段的所属年龄段概率集合计算各时间段的评分,并根据各时间段的评分确定各时间段的排名,以得到各时间段的相关参数集合。
[0224]
可见,实施该可选的实施例,能够计算出各时间段对应的评分和排名,从而有利于从多个维度表征该时间段内的用户数据,以提升用户特征的时序性,改善预测结果的精度。
[0225]
在本技术的一种示例性实施例中,参数计算单元1004根据各时间段的评分确定各时间段的排名,包括:
[0226]
确定其他用户在各时间段的评分;
[0227]
针对同一时间段,根据其他用户的评分和目标用户的评分确定目标用户在其他用户中的排名,据此得到目标用户在各时间段的排名。
[0228]
可见,实施该可选的实施例,能够参考其他用户的用户数据,以确定出目标用户在各时间段的排名,从而有利于提升所生成的用户特征的准确率,以及特定用户判定精度。
[0229]
在本技术的一种示例性实施例中,参数计算单元1004根据各时间段的所属年龄段概率集合计算各时间段的评分,包括:
[0230]
对各时间段的所属年龄段概率集合进行集合内的概率融合,得到各时间段分别对应的参考概率;
[0231]
根据各时间段分别对应的参考概率和所属年龄段概率集合计算各时间段的评分。
[0232]
可见,实施该可选的实施例,能够通过对于各时间段的所属年龄段概率集合的内部概率融合,可以将原本多维的各时间段的所属年龄段概率集合降低至二维,从而提升对于评分的计算效率。
[0233]
在本技术的一种示例性实施例中,参数计算单元1004根据各时间段分别对应的参考概率和所属年龄段概率集合计算各时间段的评分,包括:
[0234]
根据各时间段的参考概率计算各时间段的概率均值和概率标准差;
[0235]
根据各时间段的参考概率、概率均值和概率标准差计算各时间段的评分。
[0236]
可见,实施该可选的实施例,能够基于上述具体计算方式,提升对于评分的计算精度。
[0237]
在本技术的一种示例性实施例中,特征生成单元1005根据各时间段的所属年龄段
概率集合和各时间段的相关参数集合生成用户特征,包括:
[0238]
根据各条用户数据的时间戳生成各条用户数据分别对应的时间参数;其中,时间参数用于表征相对应的用户数据是否于工作日生成;
[0239]
根据各条用户数据分别对应的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征。
[0240]
可见,实施该可选的实施例,能够基于时间参数和相关参数集合生成用户特征,以更准确的表征目标用户,从而有利于提升对于特定用户判定概率的预测精度。
[0241]
在本技术的一种示例性实施例中,特征生成单元1005根据各条用户数据分别对应的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:
[0242]
根据各条用户数据分别对应的时间参数确定各时间段的时间参数;
[0243]
根据各时间段的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征。
[0244]
可见,实施该可选的实施例,能够在用户特征中增加时间参数,以表征该时间段是处于工作日还是非工作日,将工作日因素增加至用户特征,可以提升特定用户判定精度。
[0245]
在本技术的一种示例性实施例中,特征生成单元1005根据各时间段的时间参数、各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,包括:
[0246]
将各时间段内的时间参数、各时间段的所属年龄段概率集合、各时间段的相关参数集合中的排名进行拼接,得到各时间段对应的子特征;
[0247]
按照时间序列拼接各时间段对应的子特征,得到用户特征。
[0248]
可见,实施该可选的实施例,能够通过对于子特征的序列化拼接,得到用于表征目标用户的用户特征,从而有利于提升对于目标用户的判定精度,避免将不属于特定用户的目标用户判定为属于特定用户。
[0249]
在本技术的一种示例性实施例中,特定用户判定单元1006基于第二预测模型确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别,包括:
[0250]
将用户特征输入第二预测模型,以通过第二预测模型计算用户特征对应的特定用户概率,作为判定依据;
[0251]
若特定用户概率处于预设阈值范围,则判定目标用户是特定用户。
[0252]
可见,实施该可选的实施例,能够基于周期性的用户数据确定周期性的用户特征,基于此预测特定用户概率,从而提升对于特定用户的判定精度。
[0253]
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0254]
由于本技术的示例实施例的基于人工智能的数据处理装置的各个功能模块与上述基于人工智能的数据处理方法的示例实施例的步骤对应,因此对于本技术装置实施例中未披露的细节,请参照本技术上述的基于人工智能的数据处理方法的实施例。
[0255]
作为另一方面,本技术还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
[0256]
需要说明的是,本技术所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本技术中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本技术中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。
[0257]
附图中的流程图和框图,图示了按照本技术各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0258]
描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
[0259]
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本技术的真正范围和精神由下面的权利要求指出。
[0260]
应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。

技术特征:


1.一种基于人工智能的数据处理方法,其特征在于,包括:获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合;读取所述各条用户数据中的时间戳并依据所述各条用户数据的时间戳将所述各条用户数据聚合至时间序列的各时间段中,得到聚合结果;根据所述聚合结果和所述各条用户数据分别对应的所属年龄段概率集合确定所述各时间段的所属年龄段概率集合;根据所述各时间段的所属年龄段概率集合计算所述各时间段的相关参数集合;其中,所述相关参数集合用于作为相对应的时间段内的用户数据的多维表征;根据所述各时间段的所属年龄段概率集合和所述各时间段的相关参数集合生成用户特征;基于第二预测模型确定所述用户特征对应的判定依据,根据所述判定依据对所述目标用户进行特定用户识别,所述第一概率预测模型和所述第二概率预测模型对应于不同的模型参数。2.根据权利要求1所述的方法,其特征在于,所述各条用户数据分别对应的所属年龄段概率集合中任一所属年龄段概率集合包含:用于表征相对应的用户数据属于预设各年龄段的概率,获取目标用户的各条用户数据并获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合,包括:采集所述目标用户在单位时间内对应的所述各条用户数据;对所述各条用户数据进行特征变换,得到所述各条用户数据分别对应的特征向量;将所述各条用户数据分别对应的特征向量依次输入所述第一概率预测模型,以使得所述第一概率预测模型根据所述各条用户数据分别对应的特征向量计算所述各条用户数据分别对应的所属年龄段概率集合。3.根据权利要求1所述的方法,其特征在于,根据所述聚合结果和所述各条用户数据分别对应的所属年龄段概率集合确定所述各时间段的所属年龄段概率集合,包括:根据所述聚合结果确定划分于所述各时间段的用户数据,以得到所述各时间段的数据量;根据所述各时间段的数据量和所述各条用户数据分别对应的所属年龄段概率集合确定所述各时间段的所属年龄段概率集合。4.根据权利要求3所述的方法,其特征在于,根据所述各时间段的数据量和所述各条用户数据分别对应的所属年龄段概率集合确定所述各时间段的所属年龄段概率集合,包括:若所述各时间段中存在数据量大于1的一类时间段,则融合所述一类时间段内用户数据的所属年龄段概率集合,得到所述一类时间段的所属年龄段概率集合;若所述各时间段中存在数据量等于1的二类时间段,则将所述二类时间段内用户数据的所属年龄段概率集合确定为所述二类时间段的所属年龄段概率集合;若所述各时间段中存在数据量小于1的三类时间段,则根据所述三类时间段的前一相邻时间段的所属年龄段概率集合确定所述三类时间段的所属年龄段概率集合。5.根据权利要求1所述的方法,其特征在于,所述各时间段的相关参数集合中任一相关参数集合包含:评分和排名,根据所述各时间段的所属年龄段概率集合计算所述各时间段
的相关参数集合,包括:根据所述各时间段的所属年龄段概率集合计算所述各时间段的评分,并根据所述各时间段的评分确定所述各时间段的排名,以得到所述各时间段的相关参数集合。6.根据权利要求5所述的方法,其特征在于,根据所述各时间段的评分确定所述各时间段的排名,包括:确定其他用户在所述各时间段的评分;针对同一时间段,根据所述其他用户的评分和所述目标用户的评分确定所述目标用户在所述其他用户中的排名,据此得到所述目标用户在所述各时间段的排名。7.根据权利要求5所述的方法,其特征在于,根据所述各时间段的所属年龄段概率集合计算所述各时间段的评分,包括:对所述各时间段的所属年龄段概率集合进行集合内的概率融合,得到所述各时间段分别对应的参考概率;根据所述各时间段分别对应的参考概率和所属年龄段概率集合计算所述各时间段的评分。8.根据权利要求7所述的方法,其特征在于,根据所述各时间段分别对应的参考概率和所属年龄段概率集合计算所述各时间段的评分,包括:根据所述各时间段的参考概率计算所述各时间段的概率均值和概率标准差;根据所述各时间段的参考概率、概率均值和概率标准差计算所述各时间段的评分。9.根据权利要求1所述的方法,其特征在于,根据所述各时间段的所属年龄段概率集合和所述各时间段的相关参数集合生成用户特征,包括:根据所述各条用户数据的时间戳生成所述各条用户数据分别对应的时间参数;其中,所述时间参数用于表征相对应的用户数据是否于工作日生成;根据所述各条用户数据分别对应的时间参数、所述各时间段的所属年龄段概率集合和所述各时间段的相关参数集合生成所述用户特征。10.根据权利要求9所述的方法,其特征在于,根据所述各条用户数据分别对应的时间参数、所述各时间段的所属年龄段概率集合和所述各时间段的相关参数集合生成所述用户特征,包括:根据所述各条用户数据分别对应的时间参数确定所述各时间段的时间参数;根据所述各时间段的时间参数、所述各时间段的所属年龄段概率集合和所述各时间段的相关参数集合生成所述用户特征。11.根据权利要求10所述的方法,其特征在于,根据所述各时间段的时间参数、所述各时间段的所属年龄段概率集合和所述各时间段的相关参数集合生成所述用户特征,包括:将所述各时间段内的时间参数、所述各时间段的所属年龄段概率集合、所述各时间段的相关参数集合中的排名进行拼接,得到所述各时间段对应的子特征;按照时间序列拼接所述各时间段对应的子特征,得到所述用户特征。12.根据权利要求1所述的方法,其特征在于,基于第二预测模型确定所述用户特征对应的判定依据,根据所述判定依据对所述目标用户进行特定用户识别,包括:将所述用户特征输入所述第二预测模型,以通过所述第二预测模型计算所述用户特征对应的特定用户概率,作为所述判定依据;
若所述特定用户概率处于预设阈值范围,则判定所述目标用户是特定用户。13.一种基于人工智能的数据处理装置,其特征在于,包括:参数预测单元,用于获取目标用户的各条用户数据并基于第一预测模型预测所述各条用户数据分别对应的所属年龄段概率集合;参数聚合单元,用于读取所述各条用户数据中的时间戳并依据所述各条用户数据的时间戳将所述各条用户数据聚合至时间序列的各时间段中,得到聚合结果;参数确定单元,用于根据所述聚合结果和所述各条用户数据分别对应的所属年龄段概率集合确定所述各时间段的所属年龄段概率集合;参数计算单元,用于根据所述各时间段的所属年龄段概率集合计算所述各时间段的相关参数集合;其中,所述相关参数集合用于作为相对应的时间段内的用户数据的多维表征;特征生成单元,用于根据所述各时间段的所属年龄段概率集合和所述各时间段的相关参数集合生成用户特征;特定用户判定单元,用于基于第二预测模型确定所述用户特征对应的判定依据,根据所述判定依据对所述目标用户进行特定用户识别,所述第一概率预测模型和所述第二概率预测模型对应于不同的模型参数。14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-12任一项所述的方法。15.一种电子设备,其特征在于,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1-12任一项所述的方法。

技术总结


本申请提供一种基于人工智能的数据处理方法、基于人工智能的数据处理装置、计算机可读存储介质及电子设备;涉及人工智能技术领域;包括:基于第一预测模型预测目标用户的各条用户数据分别对应的所属年龄段概率集合;依据各条用户数据的时间戳将各条用户数据聚合至时间序列的各时间段中;确定各时间段的所属年龄段概率集合;根据各时间段的所属年龄段概率集合计算各时间段的相关参数集合;根据各时间段的所属年龄段概率集合和各时间段的相关参数集合生成用户特征,并基于第二预测模确定用户特征对应的判定依据,根据判定依据对目标用户进行特定用户识别。可见,实施本申请实施例,可以提升特定用户判定准确率。可以提升特定用户判定准确率。可以提升特定用户判定准确率。


技术研发人员:

曹誉仁 黄伟旭 徐森圣

受保护的技术使用者:

腾讯科技(深圳)有限公司

技术研发日:

2021.04.06

技术公布日:

2022/10/10

本文发布于:2022-11-27 11:26:24,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/4/7617.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:用户   时间段   概率   年龄段
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图