(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 (43)申请公布日 (21)申请号 201810086726.X
(22)申请日 2018.01.30
(71)申请人 中国人民解放军战略支援部队信息
阶梯教室
工程大学
保险杠模具地址 450000 河南省郑州市高新区科学大
道62号
(72)发明人 尹美娟 刘晓楠 唐梓淇 罗军勇
丁文博 郑燕 何功震
(74)专利代理机构 郑州大通专利商标代理有限
公司 41111
代理人 周艳巧
(51)Int.Cl.
G06F 17/30(2006.01)
G06Q 50/00(2012.01)
(54)发明名称基于微博传播规模预测的用户社会影响力分析方法(57)摘要本发明涉及一种基于微博传播规模预测的用户社会影响力分析方法,包含:筛选具有传播性的微博数据;构建微博传播树,分析粉丝对用户的关注度及两者的兴趣相似度;结合关注度及兴趣相似度,计算粉丝对用户微博转发概率; 通过转发概率预测用户微博传播规模期望,确定用户社会影响力。本发明基于具有传播性的微博的传播规模期望度量用户的社会影响力,在降低不具有传播性的微博对预测微博传播规模期望的干扰同时,更加合理地计算粉丝对用户微博的转发概率,解决在传播规模期望预测过程中不具有传播性的微博的干扰和计算用户微博转发概率时考虑的因素不全面等问题,实现对微博传播规模的准确预测,提高用户社会影响力分析结果的
准确性。权利要求书2页 说明书7页 附图4页CN 108363752 A 2018.08.03
C N 108363752
A
1.一种基于微博传播规模预测的用户社会影响力分析方法,其特征在于,包含:
A)筛选具有传播性的微博数据;
B)构建微博传播树,分析粉丝对用户的关注度及两者的兴趣相似度;
一周药盒
C)结合关注度及兴趣相似度,计算粉丝对用户微博转发概率;
D)通过转发概率预测用户微博传播规模期望,确定用户社会影响力。
2.根据权利要求1所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,A)中,通过预设微博传播深度值,将微博数据中转发层数低于预设微博传播深度值的数据进行过滤,筛选出具有传播性的微博数据。
3.根据权利要求1所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,B)中,包含如下内容:
B1)、对于筛选后得到的微博数据中任意一个用户u,建立该用户u的微博传播树,微博传播树中,微博用户为节点,关注关系为边;
B2)、通过LDA模型分析用户u与粉丝的微博文本,得到两者的话题向量及话题向量的相似度,计算用户u与粉丝的兴趣相似度;
B3)、基于用户u发布的历史微博数据,统计粉丝对用户u历史微博数据中具有传播性的微博数据的转发、评论、点赞和阅读四种行为的频繁度,度量该粉丝对用于u的关注度。
4.根据权利要求3所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,B1)中建立用户u的微博传播树,包含如下内容:
B11)、选取用户u作为根,将用户u的粉丝归入传播树,并建立用户u到所有关注用户u的粉丝的边;
B12)、将用户u第二层粉丝归入传播树,并建立第一层粉丝指向其第二层粉丝的边;
B13)、重复步骤B12),直至满足预设迭代条件,用户u微博传播树构建结束。
5.根据权利要求4所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,B13)中,预设迭代条件为没有多余用户能够加入传播树,或为传播树构建深度达到预设值。
6.根据权利要求3所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,B2)中,计算用户u与粉丝的兴趣相似度,内容如下:将用户u和粉丝v的微博文本通过LDA模型,浓缩成两个文档-话题分布向量(θu1,θu2,...,θu k)和(θv1,θv2,...,θv k),其中,θ1,θ2,...,θk为文档-话题分布向量中的每个元素,该元素表示文档在每个话题中的概率分布,k表示设定的话题数目,兴趣相似度计算公式如下:
7.根据权利要求3所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,B3)中,忽
略阅读行为的频繁度,度量该粉丝对用于u的关注度,计算公式如下: Careness v→u=k1*commentrate v→u+k2*Repostrate v→u+k3*thumbrate v→u,
其中,Repostrate v→u、commentrate v→u和thumbrate v→u分别表示粉丝v对用户u的具有传播性的微博的转发率、评论率和点赞率,k1、k2和k3都是待定参数,且k1+k2+k3=1。
8.根据权利要求1所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,C)中,粉丝对用户微博转发概率,计算公式如下:
Probability v→u=F(SimInterest uv,Careness v→u),
遥控器外壳其中,Probability v→u表示粉丝v对用户u的一篇微博的转发概率,SimInterest uv表示粉丝v和用户u之间的兴趣相似度,Careness v→u表示粉丝v对用户u的关注度。
9.根据权利要求8所述的基于微博传播规模预测的用户社会影响力分析方法,其特征在于,D)中预测用户微博传播规模期望,即是指:微博传播树中的直接粉丝的微博传播规模期望的加权和,权值为粉丝v对用户u的微博的转发概率,用户u微博转发次数期望的计算公式如下:
得到用户u的微博传播树中每个叶子节点的传播规模期望和每个子节点对父节点的微博的转发概率之后,从下至上迭代计算出微博传播树中每个节点所触发的用户u的微博的传播规模期望,最终计算出用户u的微博传播规模期望。
基于微博传播规模预测的用户社会影响力分析方法
技术领域
[0001]本发明属于大数据分析技术领域,特别涉及一种基于微博传播规模预测的用户社会影响力分析方法,用于微博网络中用户社会影响力分析。
背景技术
[0002]微博用户的社会影响力是指的是一个用户对其他用户的思想和行为的影响能力。微博是个庞大的社交媒体,同时也是海量舆论的集散地,分析微博中用户的社会影响力对于微博中的舆论引导工作具有重要的意义。微博中的用户社会影响力分析一直是近几年的研究热点,目前比较前沿的方法主要基于微博的平均传播规模度量用户的社会影响力,但一个用户的社会影响力主要由其发布的具有传播性的微博体现,而不具有传播性的微博的传播规模极小,会拉低其微博平均转发规模,从而造成度量的偏差;并且,与平均传播规模相比,微博的传播规模期望更能客观地体现用户在微博网络中的社会
影响力。此外,微博中的信息传播主要依赖于粉丝的转发行为,但是现有的大多数方法主要基于用户的静态属性(如粉丝数)和其在用户关系网络中的结构位置重要性分析用户的社会影响力,没有重视影响粉丝转发行为的因素,计算粉丝对用户微博的转发概率不够全面,导致预测的微博传播规模期望不准确,从而不能准确度量用户的社会影响力。
发明内容
[0003]针对现有技术中的不足,本发明提供一种基于微博传播规模预测的用户社会影响力分析方法,能够根据微博传播性和粉丝行为规律预测用户微博传播规模期望,准确度量用户的社会影响力。
[0004]按照本发明所提供的设计方案,一种基于微博传播规模预测的用户社会影响力分析方法,包含:
[0005]A)筛选具有传播性的微博数据;
[0006]B)构建微博传播树,分析粉丝对用户的关注度及两者的兴趣相似度;
ysn-264
[0007]C)结合关注度及兴趣相似度,计算粉丝对用户微博转发概率;
[0008]D)通过转发概率预测用户微博传播规模期望,确定用户社会影响力。
dmm1
[0009]上述的,A)中,通过预设微博传播深度值,将微博数据中转发层数低于预设微博传播深度值的数据进行过滤,筛选出具有传播性的微博数据。
[0010]上述的,B)中,包含如下内容:
[0011]B1)、对于筛选后得到的微博数据中任意一个用户u,建立该用户u的微博传播树,微博传播树中,微博用户为节点,关注关系为边;
[0012]B2)、通过LDA模型分析用户u与粉丝的微博文本,得到两者的话题向量及话题向量的相似度,计算用户u与粉丝的兴趣相似度;
[0013]B3)、基于用户u发布的历史微博数据,统计粉丝对用户u历史微博数据中具有传播性的微博数据的转发、评论、点赞和阅读四种行为的频繁度,度量该粉丝对用于u的关注度。
[0014]优选的,B1)中建立用户u的微博传播树,包含如下内容:
[0015]B11)、选取用户u作为根,将用户u的粉丝归入传播树,并建立用户u到所有关注用户u的粉丝的边;
[0016]B12)、将用户u第二层粉丝归入传播树,并建立第一层粉丝指向其第二层粉丝的边;
[0017]B13)、重复步骤B12),直至满足预设迭代条件,用户u微博传播树构建结束。[0018]更进一步,B13)中,预设迭代条件为没有多余用户能够加入传播树,或为传播树构建深度达到预设值。
[0019]上述的,B2)中,计算用户u与粉丝的兴趣相似度,内容如下:将用户u和粉丝v的微博文本通过LDA模型,浓缩成两个文档-话题分布向量(θu1,θu2,...,θu k)和(θv1,θv2,...,θv k),其中,θ1,θ2,...,θk为文档-话题分布向量中的每个元素,该元素表示文档在每个话题中的概率分布,k表示设定的话题数目,兴趣相似度计算公式如下:
[0020]
[0021]上述的,B3)中,忽略阅读行为的频繁度,度量该粉丝对用于u的关注度,计算公式如下:
[0022]Careness v→u=k1*commentrate v→u+k2*Repostrate v→u+k3*thumbrate v→u,
[0023]其中,Repostrate v→u、commentrate v→u和thumbrate v→u分别表示粉丝v对用户u的具有传播性的微博的转发率、评论率和点赞率,k1、k2和k3都是待定参数,且k1+k2+k3=1。[0024]上述的,C)中,粉丝对用户微博转发概率,计算公式如下:
[0025]Probability v→u=F(SimInterest uv,Careness v→u),
[0026]其中,Probability v→u表示粉丝v对用户u的一篇微博的转发概率,SimInterest uv 表示粉丝v和用户u之间的兴趣相似度,Careness v→u表示粉丝v对用户u的关注度。[0027]优选的,D)中预测用户微博传播规模期望,即是指:微博传播树中的直接粉丝的微博传播规模期望的加权和,权值为粉丝v对用户u的微博的转发概率,用户u微博转发次数期望的计算公式如下:
[0028]
[0029]得到用户u的微博传播树中每个叶子节点的传播规模期望和每个子节点对父节点的微博的转发概率之后,从下至上迭代计算出微博传播树中每个节点所触发的用户u的微博的传播规模期望,最终计算出用户u的微博传播规模期望。
[0030]本发明的有益效果:
[0031]1、本发明基于具有传播性的微博的传播规模期望度量用户的社会影响力,在降低了不具有传播性的微博对预测微博传播规模期望的干扰同时,更加合理地计算了粉丝对用户微博的转发概率,解决了在传播规模期望预测过程中不具有传播性的微博的干扰和计算用户微博转发概率时考虑的因素不全面等问题。
[0032]2、本发明从微博数据中筛选出具有传播性的微博,在具有传播性的微博上,通过