首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
社区发现的目标是发现复杂网络的结构、行为和组织形式。标签传播算法是一种快速有效的社区发现算法,然而在初始的标签传播算法中,节点的结构信息和特征信息没有得到充分利用,且存在标签传播过程不稳定的问题。针对上述问题,文章提出了一种基于改进的密度峰值聚类算法和标签传播算法的有向加权复杂网络社区发现算法(DPC-LPA)。该算法首先根据节点的结构和特征对其进行加权,充分利用了结构信息和特征信息;然后,采用改进的密度峰值聚类算法来寻找网络的社区中心,并据此构建初始社区,提高了社区划分的质量;其次,基于节点相似度和节点权重,合理确定标签传播的更新顺序,并通过衡量节点间标签传播的强度来完成标签传播,解决了标签传播算法不稳定的问题。最后,在CiteSeer、Cora、WebKB和SCHOLAT真实数据集上,将DPC-LPA算法与DCN、WCF-LPA、CLPE算法进行对比实验。实验结果证明了DPC-LPA算法的可行性和有效性:从模块度来看,利用DPC-LPA算法划分的社区具有更加显著的社区结构;从调整兰德系数来看,DPC-LPA算法的社区划分质量更稳定;从运行时间来看,DPC-LPA算法具有较高的效率。  相似文献   

2.
针对现有算法受给定节点位置的限制而影响社区发现的稳定性和准确性问题,提出一种基于核心节点跳转的局部社区发现算法,避免从给定节点直接聚类,而是先搜寻给定节点附近的核心节点,并围绕核心节点向外扩张,根据节点适应度聚类邻接节点以构建核心节点子团;并根据子团相似度进行合并,从而得到给定节点所属的局部社区结构.在计算机生成网络和真实网络上的实验和分析证明,该算法能够有效地提升局部社区发现稳定性,并改善局部社区划分的准确性.  相似文献   

3.
重叠社区发现是复杂网络研究的重要课题.提出一种基于标签传播的重叠社区发现算法.首先利用标签传播算法得到初始无重叠社区划分结果,之后通过设计新的重叠节点识别算法确定重叠节点,最后再根据重叠节点的识别结果对社区进行合并从而得到最终的重叠社区划分结果.该算法克服了已有算法重叠节点占比过大的弊端.为验证算法的有效性,在LFR人工数据集、3个标准公开测试集以及真实的大豆基因共表达网络上进行实验,并与已有算法进行对比.实验结果表明,该算法性能明显优于对比算法,极大地改善了重叠节点比重过大问题.  相似文献   

4.
随着社会网络中顶点和边的逐渐增加,计算效率成为了大规模社会网络中社区发现面临的一大难题.为了更加高效地探测社会网络中隐含的社区结构,提出一种基于抽样与标签传播的社区发现算法.该算法首先利用基于度的随机游走技术对整体网络进行抽样得到子图,然后采用基于概要的社区发现算法对此子图进行社区发现,得到核心社区,最后依据已有社区结构与未抽样的节点的相似度迭代式地将社区标签传播到剩余节点.在真实社会网络数据集上,与已有算法通过实验进行了比较分析,结果表明该算法能够在保证有效性的同时提高计算效率.  相似文献   

5.
针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果.  相似文献   

6.
发现复杂网络中的重叠社区是目前复杂网络分析的重要内容。选择社区代表性强的节点作为种子节点进行扩展是基于种子扩展策略重叠社区发现算法的关键,提出了一种基于度信息和邻域连通性的节点邻域中心性度量指标,并在此基础上提出了一种基于局部邻域连通性的重叠社区发现算法(Local Neighbor-hood Connectivitybased overlapping community detection Algorithm,LNCA)。首先计算每个节点的局部邻域连通熵和邻域中心性cc,选择中心性高的节点作为种子节点;然后采用带重启的随机游走策略扩展种子节点并得到初始社区;最后合并重叠度较大的社区得到最终社区发现结果。在6个带真实社区标签的网络和9个无真实社区标签的网络上,与SLP A、DEMON、CPM、NodePerception、EgoNetworks、EgonetSplitter等6个经典重叠社区发现算法进行比较,结果表明,在带标签网络上,LNCA算法在重叠NMI和F1分数上优于多数对比算法,可得到与网络真实社区更匹配的社区结...  相似文献   

7.
针对基于标签传播的重叠社区发现算法中出现的随机性和不稳定性问题,提出了一种新的基于节点亲密度的标签传播算法.首先,利用网络的局部信息,以模块度增量为依据,对网络中节点进行粗聚类,实现对节点的初步划分;然后,定义节点亲密度函数进行标签的更新和选择.在人工和真实网络上对算法进行验证.结果表明,该算法能有效地提高大规模重叠社区检测的准确性和稳定性,并且具有近乎线性的时间复杂度.  相似文献   

8.
重叠社区发现是复杂网络分析研究的重要目标之一。针对传统多标签传播算法存在的社区发现结果具有随机性、不稳定性,以及忽视节点影响力对标签传播的影响等问题,提出一种基于节点影响力与多标签传播的能够生成稳定社区的重叠社区发现算法。算法在节点影响力的计算、排序和核心节点识别基础上,通过邻居节点初始标签的再处理和基于平衡系数的节点标签异步更新策略,实现复杂网络重叠社区的有效识别。在真实数据集和人工数据集上的实验综合表明,算法性能优于各对比算法,适用于大规模复杂网络。  相似文献   

9.
为实现加权网络的准确划分,发现真实的社区结构,提出一种基于模块度和共邻节点相似性的层次聚类社区划分方法IEM.首先,定义两节点间基于共邻节点的相似度.之后,基于该度量快速聚合当前节点和与其关联紧密度最强的邻居节点以形成初始社区,并进行社区扩展.最后,以最大化网络模块度为目标进行社区合并以优化划分结果.算法通过形成初始社区、扩展社区、合并社区三步,实现了加权网络合理有效的社区划分.以加权模块度作为社区划分质量的评价标准,在多个数据集上的实验结果表明,IEM算法优于加权CN、加权AA、加权RA.同时,与CRMA算法相比,IEM算法对加权网络社区划分的有效性和正确性更高.  相似文献   

10.
网络中的社区结构有助于简化网络拓扑结构分析,揭示系统内部的规律,能够为信息推荐和信息传播控制提供有力的支撑.网络重叠社区结构与真实生活更加接近,但其分析较非重叠社区结构更加困难.因此,针对重叠社区发现问题,在对网络的边进行峰值聚类的基础上提出了一种基于边信任度的混合参数的自适应重叠社区发现算法.定义了网络边的邻居边集合及与其邻居边之间的信任度函数,通过信息传递获取边的总信息量,并且基于此引入混合参数的概念.基于k-means算法使用混合参数对网络中的边进行聚类,即将网络中的边划分为核心边集与非核心边集,每个核心边作为一个聚类中心.根据非核心边到核心边的距离将所有非核心边划分至距离其最近的聚类中心所在社区.再根据网络中边与节点的关系实现重叠节点发现,最终实现重叠社区的发现.该算法的优点是每条边通过独立地完成信息扩散找到社区的结构,相比于传统的峰值聚类算法,不需要人为设置相关参数,实现重叠社区的自适应发现.为验证算法的可行性,对算法复杂度进行了分析,并且使用两种社区划分评价指标——标准化互信息和模块度,分别在人工数据集及6种真实数据集上进行实验,通过与其他算法进行对比分析,实验结果表明该算法更具可行性和有效性.  相似文献   

11.
针对基于结构近似度的聚类算法无法解决非对称网络聚类的问题,该文根据社交网络的特点,提出了基于结构近似度的有向社交网络聚类算法,通过将社交网络抽象为图结构,将网络聚类问题看成图论中的子图划分问题,实现了对社交网络的准确聚类分簇,且分簇复杂度较低。使用C++语言编程实现该算法,通过自定义有向网络数据集和标准数据集的测试表明,该算法对社交网络结构的划分较为准确,且能鉴别离群节点和枢纽节点。  相似文献   

12.
[目的]现有的多分辨率层次社区发现方法需要搜索分辨率参数得到特定层次的社区划分,且无法利用网络拓扑与节点属性之间的关联获取社区结构信息.为解决这些限制,本文提出一种基于图增强和图神经网络的层次社区发现方法HCEG.[方法]首先在图增强过程中对原始网络进行重构,使得构建的初始社区种子能涵括节点属性和拓扑信息,然后对初始种子社区集进行合并,再采用基于图神经网络的方法进行拓展,以搜寻网络中不同层次的社区划分.[结果]与其他SOTA方法相比,所提出的HCEG方法可以准确地找到不同类型真实网络中的分层社区结构,并可在不同规模的真实网络中可以获得良好的社区发现性能.[结论]在社交网络、引文网络、网页超链接网络等真实数据集上的一系列实验,验证了HCEG方法的可行性和有效性.  相似文献   

13.
提出基于约束三角剖分的k-means聚类算法.笔者首先按照约束三角剖分规则对数据点集进行三角网格化,删除大于给定阈值的长边形成k个连通子图,每个连通子图作为一个子类;然后对删除长边的孤立数据点在其邻域内进行局部划分,将其归到最接近的子类中.实验结果表明本文算法无需事先输入聚类数目,可以发现任意非凸形状簇.  相似文献   

14.
针对图谱划分方法在划分社区结构不是很明显的网络时,不能得到好的划分效果,该文提出了基于边聚类系数的谱聚类社区划分方法.由于社区内部节点之间的连接比各个社区间节点的连接稠密,边聚类系数的大小反映了节点的聚集程度,因而通过网络中的边所构三角形的数量定义了聚类系数矩阵,矩阵中的元素即处于网络中的边实际构成三角形的数量.在增益函数最大化的过程中,使用了矩阵的特征值和特征向量,以此来进行社区划分.通过在真实网络数据中进行实验,结果表明该算法可行.  相似文献   

15.
提出了一种多标签符号型属性值划分的聚类方法(clustering method for multi-label symbolic value partition, CMSVP)。首先,利用标签排序和K-means算法,对原始标签信息进行聚类。然后,为每一个属性构建一个无向加权图。图中的每一个节点代表一个属性值,边的权重则表示节点之间的相似度。最后,对所有的无向加权图进行随机游走,得到属性值的聚类方案。实验在6个多标签数据集上进行。结果表明,CMSVP算法在对数据有效地进行压缩的同时,也能在一定程度上提高数据的分类性能。  相似文献   

16.
网络中的社区发现是当前的一个研究热点。在众多社区发现算法中,标签传播算法因简单快速而被广泛应用。但标签传播算法也存在结果稳定性较差的问题。通过提取非重叠完全子图来避免社区重叠,提取最小极大团来避免巨型社区的出现,基于此,对标签传播算法的初始化过程进行改进,提出了一种稳定的标签传播社区发现算法,即非重叠最小极大团提取算法。在真实网络中的实验结果表明该算法可以大幅提高结果的稳定性。  相似文献   

17.
谱聚类划分算法是经典社区发现算法之一,由于目前构造的相似图承载的社区结构信息较少,导致聚类效果与理想效果具有较大差距,因此,提出了基于DCBM的马尔可夫谱聚类社区发现算法MSCD.首先,基于DCBM模型提出了以节点间连接概率为元素的概率矩阵,并建立了概率矩阵与相似矩阵之间的映射关系;其次,利用马尔可夫链重构了谱聚类的相似图;最后,使用重构的相似图对网络进行社区划分.在人工合成网络和真实网络上与SC,MRW-KNN和FluidC三种典型算法进行了对比实验.实验结果表明,MSCD算法具有更加高效的聚类性能,能够揭示更加清晰的社区结构.  相似文献   

18.
为了能在大数据中准确快速地寻找到网络结构,该文提出一种基于社区极大类的大数据聚类算法。对于初始节点不确定和适应度函数计算所带来的时间消耗,引入局部关键节点和对适应度公式进行改进来减少时间消耗。对于初始社区的形成,引入了极大团的概念并通过分析极大团的特性,得出社区的核心类别是由极大团构成,同时提出通过极大团的发现来得到局部核心类别的方法并提出了极大团发现算法的并行策略,然后提出整个算法的并行策略并在真实数据集上实验。实验结果证明该文提出的算法是可行和有效的,适用于大规模数据的网络结构发现。  相似文献   

19.
发现复杂网络中的结构和特征是社区发现的一个重要任务.标签传播算法(LPA)因具有接近线性的时间复杂度,常用于快速处理大规模的社区网络.针对该算法在节点的更新顺序和标签选择策略上存在很大的随机性,严重破坏了算法的稳定性和社区划分结果的准确性.提出了一种基于节点H指数的标签传播算法,即利用节点的综合影响力改进标签传播算法的节点更新顺序和标签选择策略.实验研究表明,改进算法有效地降低了算法的随机性,提高了社区划分的稳定性和准确性.  相似文献   

20.
为解决邮件社区挖掘中涉及内容隐私及社区形态单一问题,提出了一种基于聚类融合的邮件社区划分算法.该方法中首先利用邮件社交网络特征及邮件属性衡量节点间距离,避免对邮件内容的分析导致涉及用户隐私,其次使用K-Means算法产生若干初始聚类结果,同时引入共协矩阵记录初始聚类时节点的归属,最后根据共协矩阵中邮箱节点间的相似程度,使用融合算法合并初始聚类结果得到最终社区结构.实验表明,该算法未使用邮件内容,得到的社区结构质量较高,并能发现多形态社区.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号