首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
基于相似度的加权复杂网络社区发现方法   总被引:2,自引:0,他引:2  
针对加权复杂网络中的社区结构发现问题,本文定义基于权重关系的相似度,并在此基础上定义了节点中心度和归属度,改进GN算法的模块度评价函数,提出一种基于相似度的中心聚类算法(SCC).该算法通过计算节点间的相似度,选取合理的中心度大的节点作为社区中心节点,最后基于节点归属度来聚集从而形成社区;同时,提出了用相似度代替边介数的改进GN算法SGN.通过理论分析,并在数据集上进行实验验证,结果表明SCC算法与WGN算法、SGN算法相比,速度和精度上均有较大改善.同时与I2C算法相比,社区的划分有效性更好.  相似文献   

2.
传统的社区发现算法能够找出网络中所有的社区,其时间复杂度取决于网络的规模.挖掘大网络中的全局社区结构因为时间复杂度高而难以实现,局部社区发现作为一种不需要知道网络的整体结构,从给定的节点逐步向外扩展,寻找该节点所在社区的方法,在大网络时代具有重要的应用意义.目前这方面的研究已经获得广泛关注,并提出了很多局部社区发现算法.针对已有局部社区发现算法需要人工设置参数、准确率低的问题,提出一种新的局部社区发现算法.首先,提出一种加权邻居节点的共同邻居相似度指标,用于计算网络中两个节点间的相似度;然后,基于该相似度指标,给出一种新的局部社区质量度量指标,在保证社区度量指标不下降的前提下,不断选择与当前局部社区嵌入度最大的节点加入到局部社区,逐步找出给定节点所在的社区;最后,在真实网络和仿真网络数据集上进行了实验.实验结果表明,该算法能有效地挖掘出给定节点所在的局部社区,相比具有代表性的Clauset,LWP,GMAC等局部社区发现算法有更高的准确率.  相似文献   

3.
网络中的社区结构有助于简化网络拓扑结构分析,揭示系统内部的规律,能够为信息推荐和信息传播控制提供有力的支撑.网络重叠社区结构与真实生活更加接近,但其分析较非重叠社区结构更加困难.因此,针对重叠社区发现问题,在对网络的边进行峰值聚类的基础上提出了一种基于边信任度的混合参数的自适应重叠社区发现算法.定义了网络边的邻居边集合及与其邻居边之间的信任度函数,通过信息传递获取边的总信息量,并且基于此引入混合参数的概念.基于k-means算法使用混合参数对网络中的边进行聚类,即将网络中的边划分为核心边集与非核心边集,每个核心边作为一个聚类中心.根据非核心边到核心边的距离将所有非核心边划分至距离其最近的聚类中心所在社区.再根据网络中边与节点的关系实现重叠节点发现,最终实现重叠社区的发现.该算法的优点是每条边通过独立地完成信息扩散找到社区的结构,相比于传统的峰值聚类算法,不需要人为设置相关参数,实现重叠社区的自适应发现.为验证算法的可行性,对算法复杂度进行了分析,并且使用两种社区划分评价指标——标准化互信息和模块度,分别在人工数据集及6种真实数据集上进行实验,通过与其他算法进行对比分析,实验结果表明该算法更具可行性和有效性.  相似文献   

4.
重叠社区发现技术对于分析网络社区间关系具有重要意义,本文提出了基于Louvain重叠社区发现算法,该算法在Louvain算法的基础上使用模块度Q的增益度函数dq判断节点是否具有重叠性,并且发现重叠社区;设计实验验证该算法,使用经典数据集American College Football对该算法与常用重叠社区发现算法CPM、LFM和COPRA进行实验对比,结果表明:增益度函数dq能判断重叠节点,且通过找到社会网络中的重叠节点发现重叠社区;该算法在重叠模块度EQ上比CPM、LFM和COPRA算法分别提高17.05%、12.81%和9.45%,在运算时间上比CPM算法、COPRA算法分别增加了12.62%、7.15%,比LFM算法减少了23.06%,表明在综合重叠模块度EQ与算法时间上,本文基于Louvain重叠社区发现算法都优于其他的算法。  相似文献   

5.
为实现加权网络的准确划分,发现真实的社区结构,提出一种基于模块度和共邻节点相似性的层次聚类社区划分方法IEM.首先,定义两节点间基于共邻节点的相似度.之后,基于该度量快速聚合当前节点和与其关联紧密度最强的邻居节点以形成初始社区,并进行社区扩展.最后,以最大化网络模块度为目标进行社区合并以优化划分结果.算法通过形成初始社区、扩展社区、合并社区三步,实现了加权网络合理有效的社区划分.以加权模块度作为社区划分质量的评价标准,在多个数据集上的实验结果表明,IEM算法优于加权CN、加权AA、加权RA.同时,与CRMA算法相比,IEM算法对加权网络社区划分的有效性和正确性更高.  相似文献   

6.
针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果.  相似文献   

7.
重叠社区发现是复杂网络研究的重要课题.提出一种基于标签传播的重叠社区发现算法.首先利用标签传播算法得到初始无重叠社区划分结果,之后通过设计新的重叠节点识别算法确定重叠节点,最后再根据重叠节点的识别结果对社区进行合并从而得到最终的重叠社区划分结果.该算法克服了已有算法重叠节点占比过大的弊端.为验证算法的有效性,在LFR人工数据集、3个标准公开测试集以及真实的大豆基因共表达网络上进行实验,并与已有算法进行对比.实验结果表明,该算法性能明显优于对比算法,极大地改善了重叠节点比重过大问题.  相似文献   

8.
重叠社区发现是复杂网络挖掘中的重要基础工作,可以应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等多种网络的数据分析,从而服务智慧交通、传染病防治、舆情分析、新药研制和人力资源管理等领域.传统的单机运算架构已经难以满足各类大规模复杂网络的分析和计算要求.人工智能领域的研究人员提出将社区发现应用到网络...  相似文献   

9.
发现复杂网络中的重叠社区是目前复杂网络分析的重要内容。选择社区代表性强的节点作为种子节点进行扩展是基于种子扩展策略重叠社区发现算法的关键,提出了一种基于度信息和邻域连通性的节点邻域中心性度量指标,并在此基础上提出了一种基于局部邻域连通性的重叠社区发现算法(Local Neighbor-hood Connectivitybased overlapping community detection Algorithm,LNCA)。首先计算每个节点的局部邻域连通熵和邻域中心性cc,选择中心性高的节点作为种子节点;然后采用带重启的随机游走策略扩展种子节点并得到初始社区;最后合并重叠度较大的社区得到最终社区发现结果。在6个带真实社区标签的网络和9个无真实社区标签的网络上,与SLP A、DEMON、CPM、NodePerception、EgoNetworks、EgonetSplitter等6个经典重叠社区发现算法进行比较,结果表明,在带标签网络上,LNCA算法在重叠NMI和F1分数上优于多数对比算法,可得到与网络真实社区更匹配的社区结...  相似文献   

10.
信息检索模块是自动问答系统中的主要组成部分.实现问题检索的关键问题是句子相似度计算问题.提出的基于特定领域的加权语义相似度算法,首先计算FAQ库中某问句关键词的权重,再利用语义相似度方法,分别计算目标问句各分词与FAQ库问句关键词的相似度矩阵,最后求得2个句子的最终相似度.逐一计算和比较目标问句与FAQ中每个问句的相似度,在大于一定阈值时,最大相似度所对应问句答案输出给用户.由于考虑词语语义和权重2方面信息,实验表明其具有较好的匹配效果.  相似文献   

11.
协同过滤算法已成为用来为用户提供个性化服务以处理海量信息最常用的方法之一.本文提出一种基于重叠社区发现的社会网络推荐算法,该算法同时考虑了群组用户的兴趣以及他们复杂的内部关系,通过将重叠社区发现算法和基于模型的社会推荐算法进行创新融合,以实现重叠社区的发现、建立,和基于社区的智能推荐.基于开放数据集,本文设计了一系列相关实验以验证算法的有效性和准确性.实验结果表明本文提出的算法可以实现高效且准确的社会网络推荐.  相似文献   

12.
为快速、 准确地对日益复杂的大规模社会网络进行社区划分, 提出一种基于相似度投票的改进算法替代Louvain算法的底层划分, 解决了Louvain算法在底层划分收敛速度较慢, 并出现大量重复计算的缺点, 使社区划分更迅速. 由真实社会网络数据实验结果可见, 与Louvain算法相比, 改进算法在保持模块度基本不变的情况下, 效率显著提高, 划分的社区数更少、 社区结构更紧凑.  相似文献   

13.
针对基于标签传播的重叠社区发现算法中出现的随机性和不稳定性问题,提出了一种新的基于节点亲密度的标签传播算法.首先,利用网络的局部信息,以模块度增量为依据,对网络中节点进行粗聚类,实现对节点的初步划分;然后,定义节点亲密度函数进行标签的更新和选择.在人工和真实网络上对算法进行验证.结果表明,该算法能有效地提高大规模重叠社区检测的准确性和稳定性,并且具有近乎线性的时间复杂度.  相似文献   

14.
为提高单机处理复杂网络规模的能力,提出一种新的重叠社区发现算法.首先,通过基于图压缩的社区结构表示模型(压缩社区图),对网络进行无损压缩;然后,在压缩社区图上基于种子迭代的思想,通过不断优化社区适应度函数将种子扩展成社区;最后,将相似度高的社区进行合并,得到最终的重叠社区结果.由于压缩后的凝聚图大大降低了待处理的网络规模,并能在一定程度上减少重复计算,该方法可以大大提高计算效率和单机处理的网络规模.  相似文献   

15.
文本相似度的计算是文本挖掘的基础。传统的基于向量空间模型(VSM)的文本相似度计算方法把文本映射成词向量,再利用余弦距离公式来计算相似度,这样存在文本向量维数过高以及语义敏感度差的问题。针对以上问题,通过对词性以及权值大小的过滤可以缩减特征词规模,在一定程度上可以减少高维稀疏的情况发生,并且引入LDA模型的文本隐含主题特征,增加文本表示的语义背景,通过线性加权的方式结合VSM模型的特征词特征和LDA模型的主题特征,计算文本相似度。实验表明,与单独使用VSM模型和LDA模型比较,利用加权特征计算文本相似度有着更好的效果。  相似文献   

16.
离群点检测是数据挖掘的一个重要研究方向,大多数离群数据挖掘算法在应用到高维数据集时效率较低。给出了一种基于属性熵和加权余弦相似度的离群数据挖掘算法LEAWCD.该算法首先根据局部属性熵分析每个对象在其k-邻域内的局部离群属性,并依据各离群属性的属性偏离度自动设置属性权向量;其次使用对高维数据有效的余弦相似度经加权后度量各对象在k-邻域内的离群程度,实现高维局部离群点检测;最后采用国家天文台提供的天体光谱数据作为数据集,实验验证了LEAWCD算法具有伸缩性强和检测精度高等优点。  相似文献   

17.
针对现有微博社区发现的准确性与效用性问题,提出了一种高效的基于用户内容相似度的微博社区发现算法。首先对微博用户兴趣模型进行分析,进而挖掘微博意见领袖,通过AP算法对意见领袖进行兴趣聚类,以聚类结果为社区中心结合模块度优化算法完成微博社区发现。经实验验证了该方法可以更好地发现微博社区结构。  相似文献   

18.
社交网络拥有社区结构,而网络中的一些节点又被两个或更多社区共享,这就使网络呈现出重叠社区结构.在前面对重叠社区划分算法的研究中提出了基于引力度扩展的重叠社区发现算法(GDE),以引力度最大的节点为种子来扩展与发现重叠社区.这里,提出基于h-域的局部引力度扩展的改进算法(LGDE).改进算法的实验测试结果表明该算法的执行效率获得了极大的提高,并且是可行的.  相似文献   

19.
在相似度的方法用于区间值模糊推理的过程中,为合理地计算区间值加权模糊产生式规则的输入事实与规则前件之间的相似度,给出区间值相似度的计算公式.在此基础上提出基于区间值相似度的加权模糊推理算法.为体现规则前件断言对于规则结果的重要性程度,在区间值模糊产生式规则中加入了权值参数.为了采用该算法,给出区间值排序的方法.最后用实例说明所给出的推理算法更符合实际需要,可操作性强,便于应用.  相似文献   

20.
针对现有静态网络社区发现算法的失真和动态网络社区发现算法时间复杂度较高的问题,本文提出了一种动态网络中的重叠社区发现算法。在网络中,边介数最大的边或分割介数最大的节点是网络中的关键边或点,即联系最不紧密的边或节点,因此,该算法利用去除最大边介数的边和分裂最大分割介数的节点的方法,并将网络社区的动态变化和重叠性考虑在内进行社区发现。最后利用模块度对社区发现进行控制,使发现的社区结构更加合理。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号