基于大数据话题的流量话题发方法及话题发服务器

阅读: 评论:0

著录项
  • CN202111630283.4
  • 20211228
  • CN114443968A
  • 20220506
  • 孙建
  • 孙建
  • G06F16/9536
  • G06F16/9536

  • 辽宁省沈阳市铁西区经济技术开发区沈辽西路111号
  • 辽宁(21)
摘要
本申请公开的基于大数据话题的流量话题发方法及话题发服务器,能够从话题用户端的话题发需求角度以及话题发方的情绪分析角度和语料极性角度出发,对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析。此外,在确定出多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息之后,能够结合预设话题发申请的舆情风向描述以及预设话题反馈分析的舆情风向描述进行流量话题发,实现话题发和舆情风向分析之间的兼容,结合语料极性分析结果实现流量话题发,在满足正常话题发需求和舆情风向调整的前提下实现流量话题发,从而避免异常流量话题的滥发。
权利要求

1.一种基于大数据话题的流量话题发方法,其特征在于,应用于流量话题发服务器,所述流量话题发服务器与多个话题用户端通信连接,所述方法包括:

获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,并基于事先设定的舆情议题识别网络确定多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息;其中,所述发申请核验信息为所述多个话题用户端之间的关联情绪核验情况;

根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请对应的预设话题反馈分析的舆情风向描述,以及所述语料极性分析结果,进行流量话题发。

2.根据权利要求1所述的基于大数据话题的流量话题发方法,其特征在于,获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,并基于事先设定的舆情议题识别网络确定多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息,包括:

获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,其中,所述处于发准备状态的流量话题项目包括多个流量话题目录,所述语料极性分析结果包括所述话题情绪分布情况在所述流量话题目录中的情感标签分布、所在流量话题目录的区分标识、舆情议题信息的舆情风向指数以及所述话题情绪分布情况在所述流量话题目录中的话题发测评内容;

获得事先设定的舆情议题识别网络对所述处于发准备状态的流量话题项目进行识别得到的多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息,其中,所述发申请核验信息包括所述舆情议题信息的话题发申请所在流量话题目录的区分标识和所述舆情议题信息的话题发申请所在流量话题目录的情感标签分布。

3.根据权利要求2所述的基于大数据话题的流量话题发方法,其特征在于,根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请对应的预设话题反馈分析的舆情风向描述,以及所述语料极性分析结果,进行流量话题发,包括:

根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度,确定所述舆情议题信息的话题发申请与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况是否相匹配;

在所述舆情议题信息的话题发申请与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况相匹配时,基于所述话题情绪分布情况在所述流量话题目录中的情感标签分布、所在流量话题目录的区分标识、舆情议题信息的舆情风向指数以及所述话题情绪分布情况在所述流量话题目录中的话题发测评内容,对所述处于发准备状态的流量话题项目中的舆情议题信息中的至少部分流量话题目录进行话题发。

4.根据权利要求3所述的基于大数据话题的流量话题发方法,其特征在于,根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度,确定所述舆情议题信息的话题发申请与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况是否相匹配的步骤包括:

判断所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与同一流量话题目录中所述话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度,和所述话题发测评内容与预设引战话题指数的相关性的大小;

若所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与同一流量话题目录中所述话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度小于或等于所述话题情绪分布情况的话题发测评内容与预设引战话题指数的相关性,确定所述舆情议题信息的话题发申请与所述话题情绪分布情况相匹配;

若所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与同一流量话题目录中所述话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度大于所述话题情绪分布情况的话题发测评内容与预设引战话题指数的相关性,确定所述舆情议题信息的话题发申请与所述话题情绪分布情况不匹配。

5.根据权利要求3所述的基于大数据话题的流量话题发方法,其特征在于,该方法还包括:

根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的话题互动活跃系数、议题风向稳定度、议题更新频率以及舆情环境适配性中的至少一个发层面检测内容。

6.根据权利要求5所述的基于大数据话题的流量话题发方法,其特征在于,该方法还包括:根据所述话题情绪分布情况中不相同的舆情议题信息的数目,得到所述处于发准备状态的流量话题项目对应的话题用户集;

相应地,根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的话题互动活跃系数的步骤包括:

根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络识别出的话题用户集;

确定所述舆情议题识别网络识别出的话题用户集与所述处于发准备状态的流量话题项目对应的话题用户集的量化占比数据,得到所述舆情议题识别网络的话题互动活跃系数;

根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络识别出的话题用户集的步骤包括:

若所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目为零,确定所述话题情绪分布情况未被所述舆情议题识别网络正常识别;

若所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目不为零,确定所述话题情绪分布情况被所述舆情议题识别网络识别到;

确定所有被所述舆情议题识别网络识别出的话题情绪分布情况的数目的累加情况,得到所述舆情议题识别网络识别出的话题用户集。

7.根据权利要求5所述的基于大数据话题的流量话题发方法,其特征在于,根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的议题风向稳定度的步骤包括:

确定所有流量话题目录中存在正向情绪极性标识的舆情议题信息的话题发申请的数目与所述舆情议题信息的话题发申请的数目的量化占比数据,得到所述议题风向稳定度。

8.根据权利要求5所述的基于大数据话题的流量话题发方法,其特征在于,根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的议题更新频率的步骤包括:

确定所述舆情议题信息的话题发申请的数目与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目的差异情况,得到所述舆情议题识别网络识别出的存在引战意图的舆情议题信息的话题发申请的数目;

确定所述舆情议题识别网络识别出的存在引战意图的舆情议题信息的话题发申请的数目,与所述舆情议题信息的话题发申请的数目的量化占比数据,得到所述舆情议题识别网络对应的议题更新频率;

根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的舆情环境适配性的步骤包括:

确定所述舆情议题信息的话题发申请中不相同的社话题环境的数目,与所述处于发准备状态的流量话题项目对应的话题用户集的量化占比数据,得到所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的舆情环境适配性;

确定所述舆情议题信息的话题发申请中不相同的社话题环境的数目的步骤包括:

根据所述舆情议题信息的话题发申请所在流量话题目录的情感标签分布,确定与该舆情议题信息的话题发申请相匹配的话题情绪分布情况的舆情议题信息的舆情风向指数;

若与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目不为零,且与所述舆情议题信息的话题发申请相匹配的话题情绪分布情况的舆情议题信息的舆情风向指数大于或等于预设风向参考值,确定所述话题情绪分布情况具有对应的不相同的社话题环境;

若与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目为零,或者与所述舆情议题信息的话题发申请相匹配的话题情绪分布情况的舆情议题信息的舆情风向指数小于预设风向参考值,确定所述话题情绪分布情况不具有对应的不相同的社话题环境;

确定所述话题情绪分布情况中具有对应的不相同的社话题环境的话题情绪分布情况的数目,得到所述舆情议题信息的话题发申请中不相同的社话题环境的数目。

9.根据权利要求1所述的基于大数据话题的流量话题发方法,其特征在于,所述方法还包括:

确定进行流量话题发的社运行环境;

根据社运行环境中的第一组团购业务操作和第二组团购业务操作,确定所述第一组团购业务操作的第一团购主题关注情况和第一团购主题更新状态,以及获得所述第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息;其中,所述社运行环境为所述话题用户端与所述流量话题发服务器之间的运行环境;

通过所述第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息,确定第一主题审核方式;

基于事先训练好的异常推送识别网络,判断所述第一主题审核方式对应的运行环境是否存在异常主题推送。

10.一种流量话题发服务器,其特征在于,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行权利要求1-9任一项所述的方法。

说明书
技术领域

本申请涉及大数据和流量话题技术领域,特别涉及一种基于大数据话题的流量话题发方法及话题发服务器。

随着大数据的发展,各类互联网业务呈现流量化趋势。大数据网络时代的流量可以理解为受众面或者受关注度,流量效应越强的产品或者话题的受众面越广和受关注度越高。现目前,各类社交平台层出不穷,使得用户能够通过这些社交平台进行话题讨论和分析。

一般而言,为了提高线上交流交互的效率,一些服务商会进行话题发功能的研发,从而使得多个用户端能够同时接收到发的流量话题。然而在实际操作过程中,常常会出现异常流量话题滥发的现象。

本申请实施例之一提供一种基于大数据话题的流量话题发方法,应用于流量话题发服务器,所述流量话题发服务器与多个话题用户端通信连接,所述方法包括:获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,并基于事先设定的舆情议题识别网络确定多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息;其中,所述发申请核验信息为所述多个话题用户端之间的关联情绪核验情况;根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请对应的预设话题反馈分析的舆情风向描述,以及所述语料极性分析结果,进行流量话题发。

本申请实施例之一提供一种流量话题发服务器,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行上述的方法。

在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。

本申请将以示例性实施例的方式进一步说明,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:

图1是根据本发明的一些实施例所示的一种示例性基于大数据话题的流量话题发方法和/或过程的流程图;

图2是根据本发明的一些实施例所示的一种示例性基于大数据话题的流量话题发方法所对应的通信架构的框图;

图3是根据本发明的一些实施例所示的一种示例性基于大数据话题的流量话题发装置的框图,以及

图4是根据本发明的一些实施例所示的一种示例性流量话题发服务器中硬件和软件组成的示意图。

为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。

应当理解,本文使用的“系统”、“装置”、“单元”和/或“模组”是用于区分不同级别的不同组件、元件、部件、部分或装配的一种方法。然而,如果其他词语可实现相同的目的,则可通过其他表达来替换所述词语。

如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其它的步骤或元素。

本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或后面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各个步骤。同时,也可以将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。

为了在满足正常话题发需求和舆情风向调整的前提下实现流量话题发以满足相关的话题发需求,从而避免异常流量话题的滥发,发明人针对性地提出了基于大数据话题的流量话题发方法及话题发服务器。

请参阅图1,是根据本发明的一些实施例所示的一种示例性基于大数据话题的流量话题发方法和/或过程的流程图,基于大数据话题的流量话题发方法可以应用于流量话题发服务器,所述流量话题发服务器与多个话题用户端通信连接,进一步地,该方法可以包括以下步骤S100和步骤S200所描述的技术方案。

S100:获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,并基于事先设定的舆情议题识别网络确定多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息。

示例性地,处于发准备状态的流量话题项目保存在流量话题发服务器中,发准备状态可以根据话题用户端发送的话题发申请进行更新,比如,话题用户端user向流量话题发服务器发送application1,请求发流量话题项目project1,那么流量话题发服务器可以将流量话题项目project1的状态进行更新,以得到处于发准备状态的流量话题项目project1。舆情议题信息可以理解为用户进行话题讨论的相关主题信息,包括但不限于文本信息、语音信息、图像信息或者超链接信息等。话题反馈分析用于确保舆情议题信息中的相关垃圾议题信息能够及时被检测到,对应地,在进行话题反馈分析后,可以得到话题情绪分布情况。而话题情绪分布情况可以携带相关的情绪测评指示,进一步地,语料极性分析结果用于表征对相关流量话题的情感分析情况,比如情感倾向分析、情感类型分析等,在此不作限定。

进一步地,事先设定的舆情议题识别网络可以根据相关样本进行训练得到,由于模型训练为现有技术,因此在此不作更多说明。此外,话题发申请可以由某些话题用户端向流量话题发服务器发起,也可以由流量话题发服务器向某些话题用户端发起,在此不作限定。

进一步地,所述发申请核验信息为所述多个话题用户端之间的关联情绪核验情况,这样一来,能够尽可能确保发申请核验信息的可信度。在相关实施例中,流量话题项目所涉及的应用场景包括但不限于微博话题互动、新闻舆情分析等。

在实际实施过程中,为了尽可能获取针对情绪角度和语料极性角度的评价信息和处理信息,上述步骤“获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,并基于事先设定的舆情议题识别网络确定多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息”,进一步可以通过以下内容实现:获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,其中,所述处于发准备状态的流量话题项目包括多个流量话题目录,所述语料极性分析结果包括所述话题情绪分布情况在所述流量话题目录中的情感标签分布、所在流量话题目录的区分标识、舆情议题信息的舆情风向指数以及所述话题情绪分布情况在所述流量话题目录中的话题发测评内容;获得事先设定的舆情议题识别网络对所述处于发准备状态的流量话题项目进行识别得到的多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息,其中,所述发申请核验信息包括所述舆情议题信息的话题发申请所在流量话题目录的区分标识和所述舆情议题信息的话题发申请所在流量话题目录的情感标签分布。

举例而言,流量话题目录可以是相关情感分析结果的局部整合结果,情感标签分布用于表征不同类型的情感分析结果的占比情况和关联情况。区分标识用于对流量话题目录进行区分,舆情风向指数用于表征舆情议题信息的议题信息质量,舆情风向指数通常与话题发倾向呈反相关。话题发测评内容则用于表征情感极性和话题发程度之间的互相影响。这样一来,能够尽可能获取针对情绪角度和语料极性角度的评价信息和处理信息,从而基于针对情绪角度和语料极性角度的相关评价信息和处理信息在满足正常话题发需求和舆情风向调整的前提下实现流量话题发,从而避免异常流量话题的滥发。

S200:根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请对应的预设话题反馈分析的舆情风向描述,以及所述语料极性分析结果,进行流量话题发。

示例性地,预设话题发申请的舆情风向描述和预设话题反馈分析的舆情风向描述之间存在相互映射的关系,也即通过对预设话题发申请的舆情风向描述和预设话题反馈分析的舆情风向描述进行分析,能够实现话题发和舆情风向分析之间的兼容,并结合语料极性分析结果实现流量话题发,从而在满足正常话题发需求和舆情风向调整的前提下实现流量话题发,从而避免异常流量话题的滥发。

基于此,上述步骤“根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请对应的预设话题反馈分析的舆情风向描述,以及所述语料极性分析结果,进行流量话题发”,进一步可以包括以下内容:根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度,确定所述舆情议题信息的话题发申请与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况是否相匹配;在所述舆情议题信息的话题发申请与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况相匹配时,基于所述话题情绪分布情况在所述流量话题目录中的情感标签分布、所在流量话题目录的区分标识、舆情议题信息的舆情风向指数以及所述话题情绪分布情况在所述流量话题目录中的话题发测评内容,对所述处于发准备状态的流量话题项目中的舆情议题信息中的至少部分流量话题目录进行话题发。

在相关实施例中,所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度可以通过相关性系数进行表达,比如皮尔森相关性系数(person correlation coefficient)、斯皮尔曼相关性系数(spearmancorrelation coefficient)或肯德尔相关性系数(kendall correlation coefficient)。

在所述舆情议题信息的话题发申请与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况相匹配时,表明已经确定出话题发和舆情风向之间的兼容状态或者平衡状态,在此基础上,可以基于所述话题情绪分布情况在所述流量话题目录中的情感标签分布、所在流量话题目录的区分标识、舆情议题信息的舆情风向指数以及所述话题情绪分布情况在所述流量话题目录中的话题发测评内容,对所述处于发准备状态的流量话题项目中的舆情议题信息中的至少部分流量话题目录进行话题发。

其中,在进行流量话题发时,通过考虑情感标签分布,能够提高流量话题发的针对性,通过考虑区分标识,能够提高流量话题发的效率,通过考虑舆情风向指数以及话题发测评内容,能够在满足流量话题发需求的前提下尽可能真实表达话题发方的互动意图。从而在满足正常话题发需求和舆情风向调整的前提下实现流量话题发,从而避免异常流量话题的滥发。

在上述内容的基础上,步骤“根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度,确定所述舆情议题信息的话题发申请与该舆情议题信息的话题发申请所在流量话题目录中的话题情绪分布情况是否相匹配”,进一步可以包括以下内容:判断所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与同一流量话题目录中所述话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度,和所述话题发测评内容与预设引战话题指数的相关性的大小;若所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与同一流量话题目录中所述话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度小于或等于所述话题情绪分布情况的话题发测评内容与预设引战话题指数的相关性,确定所述舆情议题信息的话题发申请与所述话题情绪分布情况相匹配;若所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与同一流量话题目录中所述话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度大于所述话题情绪分布情况的话题发测评内容与预设引战话题指数的相关性,确定所述舆情议题信息的话题发申请与所述话题情绪分布情况不匹配。

举例而言,预设引战话题指数可以用于表征不同的话题用户端对以发的流量话题进行滥用的评估可能性,预设引战话题指数可以根据历史共享记录中出现流量话题滥用的情况的统计结果进行确定,一般而言,引战话题指数的取值范围可以为0~1。

可以理解,所述话题情绪分布情况的话题发测评内容与预设引战话题指数的相关性同样可以通过相关性系数进行表达,比如皮尔森相关性系数(person correlationcoefficient)、斯皮尔曼相关性系数(spearman correlation coefficient)或肯德尔相关性系数(kendall correlation coefficient)。

如此设计,通过比较所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与同一流量话题目录中所述话题情绪分布情况的预设话题反馈分析的舆情风向描述之间的匹配度,和所述话题发测评内容与预设引战话题指数的相关性的大小,能够将流量话题滥用情况考虑在内,从而准确可靠地判断所述舆情议题信息的话题发申请与所述话题情绪分布情况是否匹配。

在完成上述的流量话题发之后,还可以对相关的发层面检测内容进行确定,从而基于这些发层面检测内容反向验证流量话题发的执行结果是否可靠,为实现这一目的,在上述步骤S100和S200的基础上,还可以包括以下步骤S300所描述的内容。

S300:根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的话题互动活跃系数、议题风向稳定度、议题更新频率以及舆情环境适配性中的至少一个发层面检测内容。

如此设计,通过确定话题互动活跃系数、议题风向稳定度、议题更新频率以及舆情环境适配性,能够基于话题互动活跃系数、议题风向稳定度、议题更新频率以及舆情环境适配性反向验证流量话题发的执行结果是否可靠。

进一步地,关于上述发层面检测内容的进一步确定方式可以如下。

(1)关于话题互动活跃系数的确定方式。

根据所述话题情绪分布情况中不相同的舆情议题信息的数目,得到所述处于发准备状态的流量话题项目对应的话题用户集,在此基础上,根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的话题互动活跃系数的步骤包括:根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络识别出的话题用户集;确定所述舆情议题识别网络识别出的话题用户集与所述处于发准备状态的流量话题项目对应的话题用户集的量化占比数据,得到所述舆情议题识别网络的话题互动活跃系数。其中,话题互动活跃系数用于表征发之后的流量话题的使用关注情况,通过话题互动活跃系数可以判断发的流量话题是否符合实际的发需求。

基于此,步骤“根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络识别出的话题用户集”,进一步可以包括以下内容:若所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目为零,确定所述话题情绪分布情况未被所述舆情议题识别网络正常识别;若所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目不为零,确定所述话题情绪分布情况被所述舆情议题识别网络识别到;确定所有被所述舆情议题识别网络识别出的话题情绪分布情况的数目的累加情况,得到所述舆情议题识别网络识别出的话题用户集。其中,可以通过判断是否存在话题情绪分布情况对应的解析结果来判断是否被所述舆情议题识别网络正常识别。这样一来,能够针对不同的舆情议题信息进行独立地分析,从而确保话题用户集的精准性。

(2)关于议题风向稳定度的确定方式。

在该实施例中,根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的议题风向稳定度的步骤包括:确定所有流量话题目录中存在正向情绪极性标识的舆情议题信息的话题发申请的数目与所述舆情议题信息的话题发申请的数目的量化占比数据,得到所述议题风向稳定度。其中,正向情绪极性标识可以是通过一定数目的极性分析之后所添加的,比如,存在20个发目标,如果舆情议题信息通过10次极性分析,那么可以向对应的舆情议题信息添加正向情绪极性标识。如此设计,能够基于少数服从多数的机制确保议题风向稳定度的可靠性。

(3)关于议题更新频率的确定方式。在该实施例中,根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的议题更新频率的步骤包括:确定所述舆情议题信息的话题发申请的数目与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目的差异情况,得到所述舆情议题识别网络识别出的存在引战意图的舆情议题信息的话题发申请的数目;确定所述舆情议题识别网络识别出的存在引战意图的舆情议题信息的话题发申请的数目,与所述舆情议题信息的话题发申请的数目的量化占比数据,得到所述舆情议题识别网络对应的议题更新频率。其中,议题更新频率可以理解为流量话题滥用层面下的流量话题异常使用对应的概率。引战意图可以包括相关的垃圾评论或者人身攻击评论,在此不做限定。如此,能够精准地确定议题更新频率,以通过议题更新频率确定相关话题用户端的正常社交状态。

(4)关于舆情环境适配性的确定方式。

在该实施例中,根据所有流量话题目录中与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目,确定所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的舆情环境适配性的步骤包括:确定所述舆情议题信息的话题发申请中不相同的社话题环境的数目,与所述处于发准备状态的流量话题项目对应的话题用户集的量化占比数据,得到所述舆情议题识别网络针对所述处于发准备状态的流量话题项目中舆情议题信息的舆情环境适配性。其中,舆情环境适配性用于表征流量话题项目对应的流量话题目录的语义环境适配能力,舆情环境适配性越大,流量话题目录的语义环境适配能力越强,舆情环境适配性越小,流量话题目录的语义环境适配能力越弱,因此,通过上述内容,能够准确确定出处于发状态的流量话题目录的语义环境适配能力,从而为后续的流量话题发提供语义环境层面的决策依据。

进一步地,在该实施例中,步骤“确定所述舆情议题信息的话题发申请中不相同的社话题环境的数目”,可以包括以下内容:根据所述舆情议题信息的话题发申请所在流量话题目录的情感标签分布,确定与该舆情议题信息的话题发申请相匹配的话题情绪分布情况的舆情议题信息的舆情风向指数;若与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目不为零,且与所述舆情议题信息的话题发申请相匹配的话题情绪分布情况的舆情议题信息的舆情风向指数大于或等于预设风向参考值,确定所述话题情绪分布情况具有对应的不相同的社话题环境;若与所述话题情绪分布情况相匹配的舆情议题信息的话题发申请的数目为零,或者与所述舆情议题信息的话题发申请相匹配的话题情绪分布情况的舆情议题信息的舆情风向指数小于预设风向参考值,确定所述话题情绪分布情况不具有对应的不相同的社话题环境;确定所述话题情绪分布情况中具有对应的不相同的社话题环境的话题情绪分布情况的数目,得到所述舆情议题信息的话题发申请中不相同的社话题环境的数目。如此设计,能够精准确定出不相同的社话题环境的数目。

在上述内容的基础上,为了确保流量话题发过程中的流量话题的正常使用,除了语料极性分析,还需要进行实时的异常主题推送检测,基于此,在上述步骤的基础上,包以下内容:确定进行流量话题发的社运行环境;根据社运行环境中的第一组团购业务操作和第二组团购业务操作,确定所述第一组团购业务操作的第一团购主题关注情况和第一团购主题更新状态,以及获得所述第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息;其中,所述社运行环境为所述话题用户端与所述流量话题发服务器之间的运行环境;通过所述第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息,确定第一主题审核方式;基于事先训练好的异常推送识别网络,判断所述第一主题审核方式对应的运行环境是否存在异常主题推送。

进一步,关于上述步骤“根据社运行环境中的第一组团购业务操作和第二组团购业务操作,确定所述第一组团购业务操作的第一团购主题关注情况和第一团购主题更新状态,以及获得所述第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息;其中,所述社运行环境为所述话题用户端与所述流量话题发服务器之间的运行环境;通过所述第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息,确定第一主题审核方式;基于事先训练好的异常推送识别网络,判断所述第一主题审核方式对应的运行环境是否存在异常主题推送”的进一步说明可以如下。

S410:根据社运行环境中的第一组团购业务操作和第二组团购业务操作,确定所述第一组团购业务操作的第一团购主题关注情况和第一团购主题更新状态,以及获得所述第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息。

本申请实施例中,所述社运行环境为所述话题用户端与所述流量话题发服务器之间的运行环境。上述相关技术可以应用于流量话题发服务器,所述流量话题发服务器与话题用户端通信连接,请结合参阅图2,流量话题发服务器100和话题用户端200可以通过无线网络或者有线网络通信连接,社运行环境可以理解为话题用户端200从流量话题发服务器100中获取并使用对应的社的状态,也即话题用户端200和流量话题发服务器100之间存在数据信息互动。在本实施例中,社可以是不同团购用户共同建立的,比如不同社交平台上的交流。进一步地,第一组团购业务操作和第二组团购业务操作之间是存在时序连续性的,且第一组团购业务操作可以理解为话题用户端200对应的团购操作行为,是能够更加准确地反映话题用户端200的实际团购主题的团购业务操作。其中,团购业务操作包括但不限于购买、浏览、转发、点赞、评论等。

在上述基础上,团购主题关注情况可以用于描述话题用户端200的各种操作的团购主题信息的关注比较情况,团购主题关注可以理解为话题用户端200执行对应类型的团购操作的可能性,团购主题关注越高,表明话题用户端200执行对应类型的团购操作的可能性越大,而团购主题关注情况可以通过图表的形式进行表达,比如团购主题分布(团购主题关注情况)可以为[subject-1-v30、subject-2-v90、...、subject-x-v60],其中,x为正整数,subject-1-v30可以表征团购主题subject1的关注度为20,subject-2-v90可以表征团购主题subject2的关注度为60,subject-x-v30可以表征团购主题subjectx的关注度为40。比如,团购主题subject1可以为“篮球鞋”,团购主题subject2可以为“宠物乌龟”等,在此不作限定。

相应地,团购主题更新状态可以用于表征统一团购主题在不同运行环境下或者在不同时段下的变化情况,团购主题更新状态可以通过图形化的形式进行表现,也可以通过纯文本的形式进行表现,在此不作限定。

此外,可疑推送识别记录可以是流量话题发服务器根据之前的异常主题推送判断结果而识别出的一系列与话题用户端200对应的推送团购事件,比如推送团购事件1(多次请求访问社)、推送团购事件2(多次下发主题链接)等。可疑推送判别信息可以用于对第一组团购业务操作进行异常主题推送判断的初筛,这样可以通过阶段性的异常主题推送判断方式提高异常主题推送的检测效率,同时减少流量话题发服务器的不必要的资源开销。

在相关实施例中,为了确保第一团购主题关注情况和第一团购主题更新状态的时序连续性,以确保后续异常主题推送检测的可信度,步骤“根据社运行环境中的第一组团购业务操作和第二组团购业务操作,确定所述第一组团购业务操作的第一团购主题关注情况和第一团购主题更新状态”,可以通过以下方式实现:对社运行环境中连续的第一组团购业务操作和第二组团购业务操作进行以下处理:针对所述第一组团购业务操作和所述第二组团购业务操作中的每个第一阶段性操作信息,根据每个第一阶段性操作信息在所述第一组团购业务操作和所述第二组团购业务操作中的阶段性顺承信息,及所述社运行环境对应的第一主题内容调整情况,确定每个第一阶段性操作信息对应的第一团购主题标签,并确定每个第一阶段性操作信息的第一主题兴趣风向及该第一组团购业务操作的第一团购主题关注情况;根据每个第一阶段性操作信息的第一主题兴趣风向映射到事先设定的主题概念描述集对应的主题概念内容,确定该第一组团购业务操作的第一团购主题更新状态。举例而言,阶段性操作信息用于将连续的团购业务操作进行节点化处理,这样能够实现对团购操作的流程化变换,也即通过不同的阶段性操作之间的传导传递和关联关系确定对应的团购主题,这样能够基于互相关联性和互相影响性从全局出发,进而保证第一团购主题关注情况和第一团购主题更新状态的时序连续性,以确保后续异常主题推送检测的可信度。进一步地,阶段性顺承信息可以是不同阶段性操作信息之间的关联信息,以阶段性操作信息message1和阶段性操作信息message2为例,若阶段性操作信息message1为用户登录节点,阶段性操作信息message2为用户验证节点,那么阶段性操作信息message1和阶段性操作信息message2之间的阶段性顺承信息可以是与登录密码服务相关的逻辑关联信息。

此外,社运行环境对应的第一主题内容调整情况可以是流量话题发服务器基于合法的修改请求对社进行修改之后所保留的记录。在上述内容的基础上,每个第一阶段性操作信息的第一团购主题标签用于对不同的团购主题进行区分,团购主题标签可以是数值标签,也可以是其他形式的标签,在此不作限定。

在上述内容的基础上,主题概念描述集可以是根据接收到的业务预约请求而生成的,“根据每个第一阶段性操作信息的第一主题兴趣风向映射到事先设定的主题概念描述集对应的主题概念内容,确定该第一组团购业务操作的第一团购主题更新状态”可以理解为确定主题兴趣风向在不同的主题概念内容下的变化信息,这样能够基于该变化信息确定出第一组团购业务操作的第一团购主题更新状态,其中,主题兴趣风向可以表征团购主题标签在多个维度上的特征信息。基于上述内容,本领域技术人员能够结合相关技术完整地、准确地确定出第一团购主题更新状态。

在一些可能的实施例中,所述确定该第一组团购业务操作的第一团购主题关注情况包括:根据每个第一阶段性操作信息对应的第一团购主题标签,获取每个第一阶段性操作信息对应的第一团购主题关注,筛选满足第二预置条件的第一团购主题关注,根据所述筛选的每个第一团购主题关注,确定所述第一组团购业务操作的第一团购主题关注情况。其中,可以通过第一团购主题标签对应的标签描述值确定每个第一阶段性操作信息对应的第一团购主题关注,第二预置条件可以是相关的团购主题关注大于设定意图关注。在确定第一组团购业务操作的第一团购主题关注情况时,可以根据实际情况选择关注情况图或者关注情况列表进行确定,在此不作限定。

在相关实施例中,上述步骤根据每个第一阶段性操作信息的第一主题兴趣风向映射到事先设定的主题概念描述集,确定该第一组团购业务操作的第一团购主题更新状态,可以通过以下方式实现:根据所述每个第一阶段性操作信息对应的第一团购主题关注,获取对应的第一团购主题关注满足第三预置条件的每个目标第一阶段性操作信息;并将所述每个目标第一阶段性操作信息的第一主题兴趣风向映射到事先设定的主题概念描述集,根据对应的主题概念内容,确定该第一组团购业务操作的第一团购主题更新状态。相应地,第三预置条件也可以是团购主题关注的大小判定条件,与第二预置条件相比,可以根据不同的运行环境下的话题用户端的数目进行适应性调整。一般而言,不同的主题概念内容可能对应不同的团购主题描述,因此,通过对应的主题概念内容,确定该第一组团购业务操作的第一团购主题更新状态,能够确保第一团购主题更新状态与主题概念内容的高度匹配。

在相关实施例中,步骤“获得所述第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息”,可以包括以下内容:根据每个第一阶段性操作信息在主题审核状态中的整体性操作特征映射到可疑推送识别记录对应的异常主题检测状态的数目,确定该第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息。举例而言,主题审核状态可以是流量话题发服务器在检测到可能存在异常主题推送风险的情况下对应调整的一种用于保护社不被黑客介入的特定运行环境,整体性操作特征用于表征每个第一阶段性操作信息在主题审核状态下的关键操作和实质性操作,整体性操作特征能否映射到可疑推送识别记录对应的异常主题检测状态,取决于第一阶段性操作信息在主题审核状态下的行为变化情况,如果第一阶段性操作信息在主题审核状态下几乎没有变化,则可以将对应的整体性操作特征映射到可疑推送识别记录对应的异常主题检测状态下,如此一来,可以确定出每个第一阶段性操作信息在主题审核状态中的整体性操作特征映射到可疑推送识别记录对应的异常主题检测状态的数目,进而确定该第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息。

在上述内容的基础上,步骤“根据每个第一阶段性操作信息在主题审核状态中的整体性操作特征映射到可疑推送识别记录对应的异常主题检测状态的数目,确定该第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息”,可以包括以下内容:根据所述每个目标第一阶段性操作信息,分别获取每个目标第一阶段性操作信息在主题审核状态中的第七整体性操作特征和第八整体性操作特征,将每个目标第一阶段性操作信息的第七整体性操作特征和第八整体性操作特征映射到可疑推送识别记录,根据每个第七整体性操作特征和第八整体性操作特征所对应的异常主题检测状态的数目,确定该第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息。

可以理解,“根据所述每个目标第一阶段性操作信息,分别获取每个目标第一阶段性操作信息在主题审核状态中的第七整体性操作特征和第八整体性操作特征,将每个目标第一阶段性操作信息的第七整体性操作特征和第八整体性操作特征映射到可疑推送识别记录,根据每个第七整体性操作特征和第八整体性操作特征所对应的异常主题检测状态的数目,确定该第一组团购业务操作相对于可疑推送识别记录的第一可疑推送判别信息”的可以在S420所描述的“针对每个第一组团购业务操作,判断该第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息是否均满足其对应的第一预置条件,如果是,将该第一组团购业务操作确定为第一目标团购业务操作;根据被确定的连续的第一目标团购业务操作,确定每个第一主题审核方式”的基础上实施。在本实施例中,第一、第二、第三等仅用于区分不同的技术特征,并不是对重要性或者先后顺序的限定。

在一些可能的实施例中,为了确保第一阶段性操作信息的信息完整性,在上述步骤所描述的确定每个第一阶段性操作信息在所述第一组团购业务操作和所述第二组团购业务操作中的阶段性顺承信息的步骤之前,该方法还可以包括以下内容。根据第一组团购业务操作的第三非引导型操作和第三引导型操作,获取第一组团购业务操作对应的操作差异信息。举例而言,积极业务和消极业务可以通过流量话题发服务器和话题用户端的请求行为的先后顺序确定,比如,若话题用户端的请求行为先于流量话题发服务器的请求行为,则可以确定非引导型操作,若话题用户端的请求行为晚于流量话题发服务器的请求行为,则可以确定引导型操作。针对第一阶段性操作信息集中的每个第一阶段性操作信息,确定在第三非引导型操作中与该第一阶段性操作信息相关联的每个第二待处理阶段性操作信息。第一阶段性操作信息集可以用于汇总不同的第一阶段性操作信息。将每个第二待处理阶段性操作信息添加到待处理信息集中。针对待处理信息集中的每个第二待处理阶段性操作信息,根据所述操作差异信息,确定该第二待处理阶段性操作信息在第三引导型操作中对应的第四操作习惯特征图,并确定该第二待处理阶段性操作信息在第二组团购业务操作的第四非引导型操作和第四引导型操作中对应的第五操作习惯特征图和第六操作习惯特征图。举例而言,操作习惯特征图可以根据操作习惯特征之间的匹配度进行拆分,这样,能够在不改变操作习惯特征所表达的内容的前提下有效减少流量话题发服务器的资源开销,进而确保第一阶段性操作信息的信息完整性。在第四非引导型操作中确定包含该第五操作习惯特征图的第三操作习惯特征序列,并在第四引导型操作中确定包含第六操作习惯特征图的第四操作习惯特征序列,分别在所述第三操作习惯特征序列和第四操作习惯特征序列内确定与第二待处理阶段性操作信息和第四操作习惯特征图匹配的第三目标操作习惯特征图和第四目标操作习惯特征图。确定第二待处理阶段性操作信息、第四操作习惯特征图、第三目标操作习惯特征图和第四目标操作习惯特征图的事理图谱衔接度,判断该事理图谱衔接度是否大于事先设定的衔接度判定值,如果是,则确定第二待处理阶段性操作信息、第四操作习惯特征图、第三目标操作习惯特征图和第四目标操作习惯特征图为第一目标阶段性操作信息,将该第一阶段性操作信息移除出所述第一阶段性操作信息集,并将该第一目标阶段性操作信息更新为第一阶段性操作信息并添加到第一阶段性操作信息集中。举例而言,事理图谱衔接度用于表征阶段性操作信息之间的信息传递的丢失情况,事理图谱衔接度越大,阶段性操作信息之间的信息传递的失真率越小,表明阶段性操作信息之间的相关性和连续性越强,如此设计,通过引入事理图谱衔接度进行判断,能够实现对阶段性操作信息集的整理,从而确保第一阶段性操作信息的信息完整性。

S420:通过所述第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息,确定第一主题审核方式。

举例而言,主题审核方式用于指示对团购业务操作的哪些团购事件进行分析,以便快速地确定团购业务操作是否为可疑情况。基于此,为了确保第一主题审核方式的可信度,步骤“通过所述第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息,确定第一主题审核方式”,可以包括以下内容:针对每个第一组团购业务操作,判断该第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息是否均满足其对应的第一预置条件,如果是,将该第一组团购业务操作确定为第一目标团购业务操作;根据被确定的连续的第一目标团购业务操作,确定每个第一主题审核方式。一般而言,第一团购主题关注情况对应的第一预置条件可以是团购主题关注情况的集中度,第一团购主题更新状态对应的第一预置条件可以是关注特征的变化率,第一可疑推送判别信息对应的第一预置条件可以是检测结果的时效性指标。

相应地,第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息是否均满足其对应的第一预置条件,可以理解为团购主题关注情况的集中度是否达到设定集中度,关注特征的变化率是否达到设定变化率,检测结果的时效性指标是否大于设定数目个,在第一组团购业务操作的第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息均满足其对应的第一预置条件的前提下,可以确定第一目标团购业务操作,其中,第一目标团购业务操作可以是存在可疑分析标签的团购业务操作,也即站在流量话题发服务器侧所判定出的可能存在异常主题推送风险的团购业务操作。

S430:基于事先训练好的异常推送识别网络,判断所述第一主题审核方式对应的运行环境是否存在异常主题推送。

在本实施例中,异常推送识别网络可以是基于人工智能的机器学习模型,异常主题推送可以理解为对流量话题发服务器中的社用户信息进行盗取和破坏的主题推送,在S410和S420的基础上,步骤“基于事先训练好的异常推送识别网络,判断所述第一主题审核方式对应的运行环境是否存在异常主题推送”,可以包括以下内容:针对每个第一主题审核方式,根据该第一主题审核方式对应的每个第一目标团购业务操作,确定第一目标团购主题关注情况、第一目标团购主题更新状态和第一目标可疑推送判别信息;根据事先训练好的异常推送识别网络,及所述第一目标团购主题关注情况、第一目标团购主题更新状态、第一目标可疑推送判别信息和该第一主题审核方式,确定第一主题审核方式对应的运行环境是否存在异常主题推送。可以理解,第一目标团购主题关注情况、第一目标团购主题更新状态和第一目标可疑推送判别信息与第一目标团购业务操作对应,第一目标团购主题关注情况、第一目标团购主题更新状态和第一目标可疑推送判别信息可以是流量话题发服务器针对第一目标团购业务操作所添加了可疑判断标注的团购主题关注情况、团购主题更新状态以及可疑推送判别信息,也即,第一目标团购主题关注情况、第一目标团购主题更新状态和第一目标可疑推送判别信息相对于第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息具有较高的可疑判断灵敏度,由于第一目标团购主题关注情况、第一目标团购主题更新状态和第一目标可疑推送判别信息与第一目标团购业务操作对应,且第一目标团购主题关注情况、第一目标团购主题更新状态和第一目标可疑推送判别信息是在第一团购主题关注情况、第一团购主题更新状态和第一可疑推送判别信息的基础上确定的,因而能够在不显著增加流量话题发服务器的异常主题推送判断压力的前提下提高异常主题推送的判断可信度。进一步地,步骤“根据事先训练好的异常推送识别网络,及所述第一目标团购主题关注情况、第一目标团购主题更新状态、第一目标可疑推送判别信息和该第一主题审核方式,确定第一主题审核方式对应的运行环境是否存在异常主题推送”,示例性地可以通过以下方式实现。

第一步,确定所述第一目标团购主题关注情况、第一目标团购主题更新状态、第一目标可疑推送判别信息和该第一主题审核方式各自对应的输入信息。

第二步,将所述第一目标团购主题关注情况、第一目标团购主题更新状态、第一目标可疑推送判别信息和该第一主题审核方式各自对应的输入信息输入到事先训练好的异常推送识别网络,并至少通过异常推送识别网络中的特征提取层、特征组合层以及特征识别层输出检测结果,通过检测结果确定第一主题审核方式对应的运行环境是否存在异常主题推送。

举例而言,检测结果可以包括不同的第一主题审核方式对应的运行环境下的异常主题推送风险率,异常主题推送风险率越高,表明第一主题审核方式对应的运行环境存在异常主题推送的可能性越大,如此,可以基于检测结果针对不同的第一主题审核方式对应的运行环境实施相应的社信息防护措施,从而确保社信息的安全性。

在相关实施例中,异常主题推送包括但不限于钓鱼网站、木马链接和流氓软件强制下载等。异常主题推送对社的破坏可以体现在信息篡改、信息盗用和资金盗取等。

在相关实施例中,团购主题可以是话题用户端各自选择的主题,也可以是话题用户端被攻击后攻击方的指定主题,一般而言,为了确保社信息的安全性,通常不对话题用户端各自选择的主题或者攻击方的指定主题进行进一步细分,也即直接对团购主题进行异常检测和分析。

一般而言,可以将相同事件或者类似事件的阶段性操作信息进行整合以得到阶段性操作信息集。通过对连续性的行为数据进行节点化处理,能够提高行为分析的效率。并且通过节点化处理,能够借助行为函数的输入输出以及调用功能实现进一步的用户行为分析,从而为异常主题推送判断和后续的社区团购信息安防的优化提供决策依据。

在实际实施过程中,上述的异常推送识别网络的训练过程可以包括以下内容:对样本社运行环境中每连续的第一组样本团购业务操作和第二组样本团购业务操作进行以下处理:针对所述第一组样本团购业务操作和所述第二组样本团购业务操作中的每个第二阶段性操作信息,根据每个第二阶段性操作信息在所述第一组样本团购业务操作和所述第二组样本团购业务操作中的阶段性顺承信息,及所述样本社运行环境对应的第二主题内容调整情况,确定每个第二阶段性操作信息对应的第二团购主题标签,并确定每个第二阶段性操作信息的第二主题兴趣风向及该第一组样本团购业务操作的第二团购主题关注情况,具体包括:根据每个第二阶段性操作信息对应的第二团购主题标签,获取每个第二阶段性操作信息对应的第二团购主题关注;筛选满足第二预置条件的每个第二团购主题关注,根据所述筛选的每个第二团购主题关注,确定所述第一组样本团购业务操作的第二团购主题关注情况;根据每个第二阶段性操作信息的第二主题兴趣风向映射到事先设定的主题概念描述集对应的主题概念内容,确定该第一组样本团购业务操作的第二团购主题更新状态,具体包括:根据所述每个第二阶段性操作信息对应的第二团购主题关注,获取对应的第二团购主题关注满足第三预置条件的每个目标第二阶段性操作信息;并将所述每个目标第二阶段性操作信息的第二主题兴趣风向映射到事先设定的主题概念描述集,根据对应的主题概念内容,确定该第一组样本团购业务操作的第二团购主题更新状态;根据每个第二阶段性操作信息在主题审核状态中的整体性操作特征映射到可疑推送识别记录对应的异常主题检测状态的数目,确定该第一组样本团购业务操作相对于可疑推送识别记录的第二可疑推送判别信息,具体包括:根据所述每个目标第二阶段性操作信息,分别获取每个目标第二阶段性操作信息在主题审核状态中的第三整体性操作特征和第四整体性操作特征,将每个目标第二阶段性操作信息的第三整体性操作特征和第四整体性操作特征映射到可疑推送识别记录,根据每个第三整体性操作特征和第四整体性操作特征所对应的异常主题检测状态的数目,确定该第一组样本团购业务操作相对于可疑推送识别记录的第二可疑推送判别信息;针对每个第一组样本团购业务操作,判断该第一组样本团购业务操作的第二团购主题关注情况、第二团购主题更新状态和第二可疑推送判别信息是否均满足其对应的第二预置条件,如果是,将该第一组样本团购业务操作确定为第二目标团购业务操作;根据被确定的连续的第二目标团购业务操作,确定每个第二主题审核方式;针对每个第二主题审核方式,根据该第二主题审核方式对应的每个第二目标团购业务操作,确定第二目标团购主题关注情况、第二目标团购主题更新状态和第二目标可疑推送判别信息,根据第二目标团购主题关注情况、第二目标团购主题更新状态、第二目标可疑推送判别信息、该第二主题审核方式以及所述样本社运行环境中每组团购业务操作是否存在异常主题推送的预测标签,对所述异常推送识别网络进行训练。

在上述训练过程中,可以通过将预测标签与预设标记信息进行比较,从而根据差异情况调整异常推送识别网络的网络参量,进而实现对异常推送识别网络的迭代训练,同时也能使得异常推送识别网络不断地进行学习,以提高后续模型使用时的稳定性和泛化能力。举例而言,可以将预测标签和预设标记信息均映射为数值,然后通过数值差值的差异情况进行网络参量的调整,直到预测标签对应的数值与预设标记信息对应的数值之间的差值小于设定值,以完成模型的训练。当然,在训练模型的过程中,还可以通过其他训练条件来判断是否终止模型训练,在此不作限定。

进一步地,在上述内容的基础上,确定每个第二阶段性操作信息在所述第一组样本团购业务操作和所述第二组样本团购业务操作中的阶段性顺承信息之前,所述方法还包括:根据第一组样本团购业务操作的第一非引导型操作和第一引导型操作,获取第一组样本团购业务操作对应的操作差异信息;针对第二阶段性操作信息集中的每个第二阶段性操作信息,确定在第一非引导型操作中与该第二阶段性操作信息相关联的每个第一待处理阶段性操作信息;将每个第一待处理阶段性操作信息添加到待处理信息集中;针对待处理信息集中的每个第一待处理阶段性操作信息,根据所述操作差异信息,确定该第一待处理阶段性操作信息在第一引导型操作中对应的第一操作习惯特征图,并确定该第一待处理阶段性操作信息在第二组样本团购业务操作的第二非引导型操作和第二引导型操作中对应的第二操作习惯特征图和第三操作习惯特征图;在第二非引导型操作中确定包含该第二操作习惯特征图的第一操作习惯特征序列,并在第二引导型操作中确定包含第三操作习惯特征图的第二操作习惯特征序列,分别在所述第一操作习惯特征序列和第二操作习惯特征序列内确定与第一待处理阶段性操作信息和第一操作习惯特征图匹配的第一目标操作习惯特征图和第二目标操作习惯特征图;判断第一待处理阶段性操作信息、第一操作习惯特征图、第一目标操作习惯特征图和第二目标操作习惯特征图的事理图谱衔接度是否大于事先设定的衔接度判定值,如果是,则确定第一待处理阶段性操作信息、第一操作习惯特征图、第一目标操作习惯特征图和第二目标操作习惯特征图为第二目标阶段性操作信息,将该第二阶段性操作信息移除出所述第二阶段性操作信息集,并将该第二目标阶段性操作信息更新为第二阶段性操作信息并添加到第二阶段性操作信息集中。可以理解,关于模型训练过程中的相关内容的说明可以参阅对图1所示的方法的说明,在此不作赘述。

这样,在应用上述在发状态下的异常主题推送判断方案时,能够对社运行环境中的连续的第一组团购业务操作和第二组团购业务操作进行分析,从而确定第一团购主题关注情况、第一团购主题更新状态以及第一可疑推送判别信息,进一步确定出第一主题审核方式,这样能够基于事先训练好的异常推送识别网络判断第一主题审核方式对应的运行环境是否存在异常主题推送。由于在进行异常主题推送判断时考虑到了团购主题的关注情况和团购主题的变化情况,并且能够结合主题审核方式对应的运行环境进行团购环境协同判断,这样可以基于一些列不间断的团购业务操作的互相关联性和互相影响性从社运行环境的整体角度出发进行异常主题推送的判断,不仅可以提高异常主题推送的判断可信度,还可以及时快速地进行异常主题推送判断,实现对社运行环境的准确可靠的异常主题推送判断,从而快速确定出携带有木马程序或者钓鱼网站链接的异常主题,以便确保社用户端的用户信息安全性。

综上,在应用本实施例所提供的上述方案时,能够从话题用户端的话题发需求角度以及话题发方的情绪分析角度和语料极性角度出发,从而对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析,这样能够得到话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果。在此基础上,在确定出多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息之后,能够结合预设话题发申请的舆情风向描述以及预设话题反馈分析的舆情风向描述,进行流量话题发,因而能够实现话题发和舆情风向分析之间的兼容,并结合语料极性分析结果实现流量话题发,从而在满足正常话题发需求和舆情风向调整的前提下实现流量话题发,从而避免异常流量话题的滥发。

针对上述基于大数据话题的流量话题发方法,本发明实施例还提出了一种示例性的基于大数据话题的流量话题发装置,如图3所示,基于大数据话题的流量话题发装置300可以包括以下的功能模块。

获得模块310,用于获得对处于发准备状态的流量话题项目中的舆情议题信息进行话题反馈分析后得到的话题情绪分布情况以及所述话题情绪分布情况的语料极性分析结果,并基于事先设定的舆情议题识别网络确定多个舆情议题信息的话题发申请以及所述舆情议题信息的话题发申请的发申请核验信息;其中,所述发申请核验信息为所述多个话题用户端之间的关联情绪核验情况。

发模块320,用于根据所述舆情议题信息的话题发申请的预设话题发申请的舆情风向描述与该舆情议题信息的话题发申请对应的预设话题反馈分析的舆情风向描述,以及所述语料极性分析结果,进行流量话题发。

可以理解,上述获得模块310和发模块320的进一步说明可以参阅对图1所示的方法的描述,在此不作赘述。

进一步地,请结合参阅图4,流量话题发服务器100可以包括处理引擎110、网络模块120和存储器130,处理引擎110和存储器130通过网络模块120通信。

处理引擎110可以处理相关的信息和/或数据以执行本申请中描述的一个或多个功能。例如,在一些实施例中,处理引擎110可以包括至少一个处理引擎(例如,单核处理引擎或多核处理器)。仅作为示例,处理引擎110可以包括中央处理单元(Central ProcessingUnit,CPU)、专用集成电路(Application-Specific Integrated Circuit,ASIC)、专用指令集处理器(Application-Specific Instruction-set Processor,ASIP)、图形处理单元(Graphics Processing Unit,GPU)、物理处理单元(Physics Processing Unit,PPU)、数字信号处理器(Digital Signal Processor,DSP)、现场可编程门阵列(Field ProgrammableGate Array,FPGA)、可编程逻辑器件(Programmable Logic Device,PLD)、控制器、微控制器单元、精简指令集计算机(Reduced Instruction-Set Computer,RISC)、微处理器等或其任意组合。

网络模块120可以促进信息和/或数据的交换。在一些实施例中,网络模块120可以是任何类型的有线或无线网络或其组合。仅作为示例,网络模块120可以包括缆线网络、有线网络、光纤网络、电信网络、内部网络、互联网、局域网络(Local Area Network,LAN)、广域网(Wide Area Network,WAN)、无线局域网络(Wireless Local Area Network,WLAN)、城域网(Metropolitan Area Network,MAN)、公用电话交换网(Public Telephone SwitchedNetwork,PSTN)、蓝牙网络、无线个域网络、近场通讯(Near Field Communication,NFC)网络等或上述举例的任意组合。在一些实施例中,网络模块120可以包括至少一个网络接入点。例如,网络模块120可以包括有线或无线网路接入点,如和/或网路接入点。

存储器130可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器130用于存储程序,所述处理引擎110在接收到执行指令后,执行所述程序。

可以理解,图4所示的结构仅为示意,流量话题发服务器100还可包括比图4中所示更多或者更少的组件,或者具有与图4所示不同的配置。图4中所示的各组件可以采用硬件、软件或其组合实现。

应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以保存在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。

需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。

同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。

计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。

本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C

本文发布于:2023-04-13 08:14:05,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/1/86365.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图