基于节点重要性的论文引用网络推荐方法及系统

阅读: 评论:0



1.本发明涉及一种基于节点重要性的论文引用网络推荐方法及系统,属于数据挖掘技术领域。


背景技术:



2.在以往的大多数引用统计研究中,用于量化论文重要性的指标是其引用次数,就底层引文网络而言,其节点代表论文,有向链接代表从施引文章到被引文章的引文,一篇文章的被引用次数转换为相应节点的入度。随着论文引用网络的规模和复杂性不断增长,如何从复杂网络中出重要论文并推荐给用户成为研究热点。
3.针对该问题,brin和page提出了著名的pagerank算法。pagerank算法起初被设计用来衡量网页重要程度,它认为网络中某个网页的重要程度由两方面组成,一是指向该网页的网页数量,二是指向该网页的网页质量。某页面即使被少数网页指向,若来源网页的质量很高,那么这个网页的质量也很高。初始时刻每个节点拥有相同的pr值,每次迭代把当前节点的pr值均分给所有它指向的节点,节点新的pr值来源于其所获得的pr值之和,迭代各节点的pr值直到达到稳定状态。
4.虽然引用次数是衡量论文重要性的自然指标,但实际情况中,仅仅凭借引用数量无法全面的反映论文的影响力,因此,需要研究比只使用引用数量更真实的重要性衡量指标。
5.上述问题是在论文引用网络推荐过程中应当予以考虑并解决的问题。


技术实现要素:



6.本发明的目的是提供一种基于节点重要性的论文引用网络推荐方法及系统解决现有技术中存在的仅考虑引用数量向用户推荐,导致推荐结果的精准性不足的问题。
7.本发明的技术解决方案是:
8.一种基于节点重要性的论文引用网络推荐方法,包括以下步骤,
9.s1、计算论文引用网络中各节点在全局范围内的节点重要程度gi(i);
10.s2、计算各节点在局部范围内的节点重要程度li(i);
11.s3、使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度;
12.s4、对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。
13.进一步地,步骤s1中,计算论文引用网络中各节点在全局范围内的节点重要程度,具体为,
14.s11、对于论文引用网络中节点i,计算其接近中心性:
15.16.其中,n表示网络中节点总数,d
ij
表示节点i、j之间的最短距离;
17.s12、计算节点i的接近中心性与其邻接节点的接近中心性之和,作为该节点i在全局范围内的节点重要度:
[0018][0019]
其中,cc(i)、cc(u)分别为节点i、u的接近中心性,n(v)表示节点v的邻接节点集合。
[0020]
进一步地,步骤s12中,邻接节点为入度节点集与出度节点集的并集,入度节点为以某节点为弧头的有向边的目标节点,出度节点为以某节点为弧尾的有向边的起始节点。
[0021]
进一步地,步骤s2中,计算各节点在局部范围内的节点重要程度,具体为,
[0022]
s21、节点的出度表示引用当前论文的其他论文,计算所有出度节点的入度和出度之和:
[0023][0024]
其中,|out_import(u)|、|in_import(u)|表示节点u的出度值与入度值,out_degree(i)表示节点i的出度节点集合;
[0025]
s22、节点的入度表示当前论文引用的其他论文,求出当前入度值|in_import(i)|,这两部分的积作为节点的局部重要度:
[0026]
li(i)=|out(i)|*|in_import(i)|
[0027]
其中,|out(i)|为所有出度节点的入度值与出度值之和,|in_import(i)|为当前节点入度值。
[0028]
进一步地,步骤s3中,使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度:
[0029]
rank(i)=w1*gi(i)+w2*li(i)
[0030]
其中,w1、w2为权重,i=1,2,其中,hi表示第i个参数的信息熵,r
ij
表示节点j对第i个参数的归一化值,式中只有gi、li两个参数,i取1或2,r
1j
、r
2j
分别表示节点j对第一个参数即gi、第二个参数即li的归一化值,n表示网络中节点总数,gi(j)为节点j的全局重要度,li(j)为节点j的局部重要度。
[0031]
一种实现上述任一项所述的基于节点重要性的论文引用网络推荐方法的系统,包括全局重要度计算模块、局部重要度计算模块、加权模块和重要度排序模块,
[0032]
全局重要度计算模块:计算论文引用网络中各节点在全局范围内的节点重要程度gi(i);
[0033]
局部重要度计算模块:计算各节点在局部范围内的节点重要程度li(i);
[0034]
加权模块:使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度;
[0035]
重要度排序模块:对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。
[0036]
本发明的有益效果是:
[0037]
一、该种基于节点重要性的论文引用网络推荐方法及系统,能够在论文引用网络结构复杂、节点间引用关系众多等问题的场景下,从全局结构和局部结构两个角度充分考量节点的重要性,并将两种指标结合,推荐出重要的节点,能够从复杂论文引用网络中快速精准推荐出最重要的论文,以供用户使用,可适用于含权重或不含权重的有向图。
[0038]
二、该种基于节点重要性的论文引用网络推荐方法及系统,考虑各节点在论文引用网络中所处的位置也是衡量节点重要性的一种重要途径,本发明将节点在网络中的位置和节点引用数量结合,能够使得推荐结果更加精准。
附图说明
[0039]
图1是本发明实施例基于节点重要性的论文引用网络推荐方法的流程示意图。
[0040]
图2是实施例基于节点重要性的论文引用网络推荐系统的说明示意图。
具体实施方式
[0041]
下面结合附图详细说明本发明的优选实施例。
[0042]
实施例
[0043]
一种基于节点重要性的论文引用网络推荐方法,如图1,包括以下步骤,
[0044]
s1、计算论文引用网络中各节点在全局范围内的节点重要程度gi(i);
[0045]
步骤s1中,计算论文引用网络中各节点在全局范围内的节点重要程度,具体为,
[0046]
s11、对于论文引用网络中节点i,计算其接近中心性:
[0047][0048]
其中,n表示网络中节点总数,d
ij
表示节点i、j之间的最短距离。
[0049]
s12、计算节点i的接近中心性与其邻接节点的接近中心性之和,作为该节点i在全局范围内的节点重要度:
[0050][0051]
其中,cc(i)、cc(u)分别为节点i、u的接近中心性,n(v)表示节点v的邻接节点集合。
[0052]
步骤s12中,邻接节点为入度节点集与出度节点集的并集,入度节点为以某节点为弧头的有向边的目标节点,出度节点为以某节点为弧尾的有向边的起始节点。
[0053]
s2、计算各节点在局部范围内的节点重要程度li(i);
[0054]
s21、节点的出度表示引用当前论文的其他论文,计算所有出度节点的入度和出度之和:
[0055][0056]
其中,|out_import(u)|、|in_import(u)|表示节点u的出度值与入度值,out_
degree(i)表示节点i的出度节点集合;
[0057]
s22、节点的入度表示当前论文引用的其他论文,求出当前入度值|in_import(i)|,这两部分的积作为节点的局部重要度:
[0058]
li(i)=|out(i)|*|in_import(i)|
[0059]
其中,|out(i)|为所有出度节点的入度值与出度值之和,|in_import(i)|为当前节点入度值。
[0060]
s3、使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度;
[0061]
rank(i)=w1*gi(i)+w2*li(i)
[0062]
其中,w1、w2为权重,i=1,2,其中,hi表示第i个参数的信息熵,r
ij
表示节点j对第i个参数的归一化值,式中只有gi、li两个参数,i取1或2,r
1j
、r
2j
分别表示节点j对第一个参数即gi、第二个参数即li的归一化值,n表示网络中节点总数,gi(j)为节点j的全局重要度,li(j)为节点j的局部重要度。
[0063]
s4、对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。
[0064]
该种基于节点重要性的论文引用网络推荐方法,能够在论文引用网络结构复杂、节点间引用关系众多等问题的场景下,从全局结构和局部结构两个角度充分考量节点的重要性,并将两种指标结合,推荐出重要的节点,能够从复杂论文引用网络中快速精准推荐出最重要的论文,以供用户使用,可适用于含权重或不含权重的有向图。
[0065]
如图2,实施例还提供一种实现上述任一项所述的基于节点重要性的论文引用网络推荐方法的系统,包括全局重要度计算模块、局部重要度计算模块、加权模块和重要度排序模块,
[0066]
全局重要度计算模块:计算论文引用网络中各节点在全局范围内的节点重要程度gi(i);
[0067]
局部重要度计算模块:计算各节点在局部范围内的节点重要程度li(i);
[0068]
加权模块:使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度;
[0069]
重要度排序模块:对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。
[0070]
该种基于节点重要性的论文引用网络推荐方法及系统,考虑各节点在论文引用网络中所处的位置也是衡量节点重要性的一种重要途径,本发明将节点在网络中的位置和节点引用数量结合,能够使得推荐结果更加精准。
[0071]
该种基于节点重要性的论文引用网络推荐方法及系统,能够从全局结构和局部结构两个角度充分考量节点的重要性,并将两种指标结合,推荐出论文引用网络中最重要的节点,可适用于含权重或者不含权重的有向图,在论文推荐领域具有广泛的实用价值和应用前景。
[0072]
以上所述仅是本发明的优选实施方式,应当指出:对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

技术特征:


1.一种基于节点重要性的论文引用网络推荐方法,其特征在于:包括以下步骤,s1、计算论文引用网络中各节点在全局范围内的节点重要程度gi(i);s2、计算各节点在局部范围内的节点重要程度li(i);s3、使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度;s4、对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。2.如权利要求1所述的基于节点重要性的论文引用网络推荐方法,其特征在于:步骤s1中,计算论文引用网络中各节点在全局范围内的节点重要程度,具体为,s11、对于论文引用网络中节点i,计算其接近中心性:其中,n表示网络中节点总数,d
ij
表示节点i、j之间的最短距离;s12、计算节点i的接近中心性与其邻接节点的接近中心性之和,作为该节点i在全局范围内的节点重要度:其中,cc(i)、cc(u)分别为节点i、u的接近中心性,n(v)表示节点v的邻接节点集合。3.如权利要求2所述的基于节点重要性的论文引用网络推荐方法,其特征在于:步骤s12中,邻接节点为入度节点集与出度节点集的并集,入度节点为以某节点为弧头的有向边的目标节点,出度节点为以某节点为弧尾的有向边的起始节点。4.如权利要求1所述的基于节点重要性的论文引用网络推荐方法,其特征在于:步骤s2中,计算各节点在局部范围内的节点重要程度,具体为,s21、节点的出度表示引用当前论文的其他论文,计算所有出度节点的入度和出度之和:其中,|out_import(u)|、|in_import(u)|表示节点u的出度值与入度值,out_degree(i)表示节点i的出度节点集合;s22、节点的入度表示当前论文引用的其他论文,求出当前入度值|in_import(i)|,这两部分的积作为节点的局部重要度:li(i)=|out(i)|*|in_import(i)|其中,|out(i)|为所有出度节点的入度值与出度值之和,|in_import(i)|为当前节点入度值。5.如权利要求1-3任一项所述的基于节点重要性的论文引用网络推荐方法,其特征在于:步骤s3中,使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度:rank(i)=w1*gi(i)+w2*li(i)
其中,w1、w2为权重,i=1,2,其中,h
i
表示第i个参数的信息熵,r
ij
表示节点j对第i个参数的归一化值,式中只有gi、li两个参数,i取1或2,r
1j
、r
2j
分别表示节点j对第一个参数即gi、第二个参数即li的归一化值,n表示网络中节点总数,gi(j)为节点j的全局重要度,li(j)为节点j的局部重要度。6.一种实现权利要求1-5任一项所述的基于节点重要性的论文引用网络推荐方法的系统,其特征在于:包括全局重要度计算模块、局部重要度计算模块、加权模块和重要度排序模块,全局重要度计算模块:计算论文引用网络中各节点在全局范围内的节点重要程度gi(i);局部重要度计算模块:计算各节点在局部范围内的节点重要程度li(i);加权模块:使用信息熵加权法对节点的全局重要度gi(i)和局部重要度li(i)做加权求和,得到节点最终重要度;重要度排序模块:对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户。

技术总结


本发明提供一种基于节点重要性的论文引用网络推荐方法及系统,该方法通过计算论文引用网络中各节点在全局范围内的节点重要程度GI(i);计算各节点在局部范围内的节点重要程度LI(i);使用信息熵加权法对节点的全局重要度GI(i)和局部重要度LI(i)做加权求和,得到节点最终重要度;对论文引用网络中各节点的重要度排序,重要度越高的表示当前节点代表的论文越重要,将重要度最高的论文推荐给用户;本发明从全局结构和局部结构两个角度充分考量节点的重要性,能够从复杂论文引用网络中快速精准推荐出最重要的论文。准推荐出最重要的论文。准推荐出最重要的论文。


技术研发人员:

刘尚东 洪程 季一木 王汝传

受保护的技术使用者:

南京邮电大学

技术研发日:

2022.09.05

技术公布日:

2022/11/18

本文发布于:2022-11-25 20:02:03,感谢您对本站的认可!

本文链接:https://patent.en369.cn/patent/2/3198.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:节点   论文   网络   全局
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2022 Comsenz Inc.Powered by © 369专利查询检索平台 豫ICP备2021025688号-20 网站地图