首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 803 毫秒
1.
谱聚类划分算法是经典社区发现算法之一,由于目前构造的相似图承载的社区结构信息较少,导致聚类效果与理想效果具有较大差距,因此,提出了基于DCBM的马尔可夫谱聚类社区发现算法MSCD.首先,基于DCBM模型提出了以节点间连接概率为元素的概率矩阵,并建立了概率矩阵与相似矩阵之间的映射关系;其次,利用马尔可夫链重构了谱聚类的相似图;最后,使用重构的相似图对网络进行社区划分.在人工合成网络和真实网络上与SC,MRW-KNN和FluidC三种典型算法进行了对比实验.实验结果表明,MSCD算法具有更加高效的聚类性能,能够揭示更加清晰的社区结构.  相似文献   

2.
基于相似度的加权复杂网络社区发现方法   总被引:2,自引:0,他引:2  
针对加权复杂网络中的社区结构发现问题,本文定义基于权重关系的相似度,并在此基础上定义了节点中心度和归属度,改进GN算法的模块度评价函数,提出一种基于相似度的中心聚类算法(SCC).该算法通过计算节点间的相似度,选取合理的中心度大的节点作为社区中心节点,最后基于节点归属度来聚集从而形成社区;同时,提出了用相似度代替边介数的改进GN算法SGN.通过理论分析,并在数据集上进行实验验证,结果表明SCC算法与WGN算法、SGN算法相比,速度和精度上均有较大改善.同时与I2C算法相比,社区的划分有效性更好.  相似文献   

3.
为实现加权网络的准确划分,发现真实的社区结构,提出一种基于模块度和共邻节点相似性的层次聚类社区划分方法IEM.首先,定义两节点间基于共邻节点的相似度.之后,基于该度量快速聚合当前节点和与其关联紧密度最强的邻居节点以形成初始社区,并进行社区扩展.最后,以最大化网络模块度为目标进行社区合并以优化划分结果.算法通过形成初始社区、扩展社区、合并社区三步,实现了加权网络合理有效的社区划分.以加权模块度作为社区划分质量的评价标准,在多个数据集上的实验结果表明,IEM算法优于加权CN、加权AA、加权RA.同时,与CRMA算法相比,IEM算法对加权网络社区划分的有效性和正确性更高.  相似文献   

4.
社区发现的目标是发现复杂网络的结构、行为和组织形式。标签传播算法是一种快速有效的社区发现算法,然而在初始的标签传播算法中,节点的结构信息和特征信息没有得到充分利用,且存在标签传播过程不稳定的问题。针对上述问题,文章提出了一种基于改进的密度峰值聚类算法和标签传播算法的有向加权复杂网络社区发现算法(DPC-LPA)。该算法首先根据节点的结构和特征对其进行加权,充分利用了结构信息和特征信息;然后,采用改进的密度峰值聚类算法来寻找网络的社区中心,并据此构建初始社区,提高了社区划分的质量;其次,基于节点相似度和节点权重,合理确定标签传播的更新顺序,并通过衡量节点间标签传播的强度来完成标签传播,解决了标签传播算法不稳定的问题。最后,在CiteSeer、Cora、WebKB和SCHOLAT真实数据集上,将DPC-LPA算法与DCN、WCF-LPA、CLPE算法进行对比实验。实验结果证明了DPC-LPA算法的可行性和有效性:从模块度来看,利用DPC-LPA算法划分的社区具有更加显著的社区结构;从调整兰德系数来看,DPC-LPA算法的社区划分质量更稳定;从运行时间来看,DPC-LPA算法具有较高的效率。  相似文献   

5.
为降低供水管网漏损,实现供水管网快速准确分区,提出一种耦合模块度优化与谱聚类的供水管网分区算法。该算法采用快速模块度优化算法对供水管网进行社区划分,以每个社区为节点、社区间连接关系为边,结合各社区内的水力特征和空间区位特征计算差异性作为边权重,构建对偶图。利用谱聚类算法完成供水管网分区。结果表明,该算法求解的管网分区结果相比快速模块度优化和谱聚类算法,将空间上更邻近的管段划分在同一分区,不会产生狭长型无效分区,且在模块度及边界管道数量上表现较为均衡,管网分区方案不仅模块度高,而且边界管道数量少。  相似文献   

6.
针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果.  相似文献   

7.
提出了一种多标签符号型属性值划分的聚类方法(clustering method for multi-label symbolic value partition, CMSVP)。首先,利用标签排序和K-means算法,对原始标签信息进行聚类。然后,为每一个属性构建一个无向加权图。图中的每一个节点代表一个属性值,边的权重则表示节点之间的相似度。最后,对所有的无向加权图进行随机游走,得到属性值的聚类方案。实验在6个多标签数据集上进行。结果表明,CMSVP算法在对数据有效地进行压缩的同时,也能在一定程度上提高数据的分类性能。  相似文献   

8.
为了能够发现社会网络中的重叠社区以及解决重叠社区之间关系的模糊性和层次性,提出了一种基于模糊层次聚类的重叠社区检测算法(CDHC)。算法中引入了距离加权因子来计算社区间的相似度,通过模糊层次聚类来合并相似度高的社区;针对合并生成的原始社区计算社区中节点的隶属度,再将隶属度小于阈值的节点从社区中移除,从而形成最终的网络重叠社区结构。该算法不仅可以发现重叠的社区结构,还可以处理孤立节点。在Lancichinetti基准网络和真实网络上将CDHC算法与具有代表性的重叠社区发现算法CMP和LFM进行了比较,结果表明:影响社区检测精度的主要因素是社区间的混合程度,而网络规模和网络中社区的规模的影响并不显著;CDHC算法在小社区网络上的社区检测精度优于LFM,在大社区网络上的社区检测精度优于CMP。CDHC算法在保持社区检测质量的同时,还具有较好的稳定性,是一种有效的社会网络重叠社区检测算法。  相似文献   

9.
集对分析作为将事物视为确定性和不确性相结合的系统的数学理论,适合用于关系复杂的社会网络研究。目前,已有研究将集对分析理论与社会网络分析相结合,提出了加权聚集系数联系度的节点间相似性度量方法以及相应的社区发现方法 VSFCM算法。针对VSFCM算法在独立社区初步聚合阶段存在的节点提早合并问题,引入边聚集系数与相似度共同作为社区合并标准,提高独立社区阶段社区合并的准确性。为了改善VSFCM算法的时间效率,结合k-shell方法,为了实现社区结构更为合理以及社区划分更为贴近现实划分的社区发现算法,分别提出以kshell值优先的层次聚类算法KPCM和KPCMV。  相似文献   

10.
针对现有算法受给定节点位置的限制而影响社区发现的稳定性和准确性问题,提出一种基于核心节点跳转的局部社区发现算法,避免从给定节点直接聚类,而是先搜寻给定节点附近的核心节点,并围绕核心节点向外扩张,根据节点适应度聚类邻接节点以构建核心节点子团;并根据子团相似度进行合并,从而得到给定节点所属的局部社区结构.在计算机生成网络和真实网络上的实验和分析证明,该算法能够有效地提升局部社区发现稳定性,并改善局部社区划分的准确性.  相似文献   

11.
许多成功的社区发现算法已经被广泛应用于复杂网络社区发现任务中.随着数据复杂性的增加,网络中节点间的关系也呈现多样化的特点,因此提出一种基于信息熵的节点稳定性度量方法,衡量网络中节点在社区划分中的稳定性;并在此基础上提出一种基于节点稳定性的社区发现算法(Node Stability-based Algorithm,NSA).首先得到网络的t种社区划分,计算各节点的标签熵,选择熵小于一定阈值的节点作为网络的稳定节点集S;然后,利用所得到的稳定节点集S从原网络中抽取一个包含S的连通子图Gs,使Gs中节点的不稳定性尽可能低;在连通子图Gs上进行社区发现,得到初始聚类结果,再计算其他未聚类节点与初始类簇的距离,确定其社区归属,得到最终聚类结果 .在四个带标签真实网络数据集和八个不带标签的真实网络数据集上,与LPA,Infomap,Walktrap,BGLL,LPA-S等经典算法的比较实验表明,所提出的NSA算法能够较好地进行社区发现,在NMI和模块度等方面表现良好.  相似文献   

12.
基于引力度扩展的重叠社区发现算法(GDE),主要用于挖掘无权社交网络的重叠社区结构.真实社区更多是具有加权属性的,本文根据 GDE 算法的种子策略思想,并依据加权网络的特征,以网络节点的度与强度来综合确定重叠社区的中心节点,提出基于联合引力度扩展的加权网络重叠社区划分算法(UGDE).算法的实验检测结果表明:该算法对划分加权网络中的重叠社区具有可行性与有效性.  相似文献   

13.
为解决邮件社区挖掘中涉及内容隐私及社区形态单一问题,提出了一种基于聚类融合的邮件社区划分算法.该方法中首先利用邮件社交网络特征及邮件属性衡量节点间距离,避免对邮件内容的分析导致涉及用户隐私,其次使用K-Means算法产生若干初始聚类结果,同时引入共协矩阵记录初始聚类时节点的归属,最后根据共协矩阵中邮箱节点间的相似程度,使用融合算法合并初始聚类结果得到最终社区结构.实验表明,该算法未使用邮件内容,得到的社区结构质量较高,并能发现多形态社区.  相似文献   

14.
针对图谱划分方法在划分社区结构不是很明显的网络时,不能得到好的划分效果,该文提出了基于边聚类系数的谱聚类社区划分方法.由于社区内部节点之间的连接比各个社区间节点的连接稠密,边聚类系数的大小反映了节点的聚集程度,因而通过网络中的边所构三角形的数量定义了聚类系数矩阵,矩阵中的元素即处于网络中的边实际构成三角形的数量.在增益函数最大化的过程中,使用了矩阵的特征值和特征向量,以此来进行社区划分.通过在真实网络数据中进行实验,结果表明该算法可行.  相似文献   

15.
针对网络入侵检测系统中的一般聚类算法速度较慢和精度较低的问题,提出了一种基于简化群优化的最优路径森林聚类算法(SSO-OFC).首先,将数据集解析为图,将其节点作为样本;然后,将每个样本连接到其给定特征空间中的k-近邻,图的节点由它们的概率密度函数(pdf)值加权得到;最后,通过样本及k-近邻之间的距离计算得到pdf值.提出的算法主要贡献是快速估计最佳k值,并将最优路径森林聚类应用于网络入侵检测.在5个公开的数据集上进行实验.结果表明,SSO-OFC的精度非常稳定,除了KddCup数据集,其他数据集上的精度都在95%以上,相比基于数据聚类的SSO和自组织映射更加稳定有效.  相似文献   

16.
针对网络的聚类进行研究,提出了一种基于标记注意力机制的社区发现算法,网络特征通过标记节点频率及反示例节点频率联合度量,为使网络特征的度量更加关注于示例节点的细节信息,引入注意力机制来处理网络特征。社区划分由复杂网络预处理、网络节点的策略、社区博弈归并三个部分组成,其中网络节点的策略由无贡献节点归并、节点到社区的判断以及节点逻辑标记和的判断三个步骤组成。实验借助于真实网络进行验证,在归一化互信息、模块度、社区划分数量及运行时间四个方面,基于标记注意力机制的社区发现算法都优于其它社区发现算法。在实际生活中应用此算法,能够更加直观地显示网络内部之间存在的联系。  相似文献   

17.
针对特征指标和权重指标均为区间数的多指标信息聚类问题,在传统的数值信息最大树聚类法的基础上,给出了基于区间数的多指标信息聚类问题的一种具体算法.在此过程中,加权相似矩阵的提出克服了属性权重对聚类产生的双重影响;并通过引入相对贴近度的概念,对相似区间进行排序.最后,通过实例验证了此算法的有效性.  相似文献   

18.
网络中的社区结构有助于简化网络拓扑结构分析,揭示系统内部的规律,能够为信息推荐和信息传播控制提供有力的支撑.网络重叠社区结构与真实生活更加接近,但其分析较非重叠社区结构更加困难.因此,针对重叠社区发现问题,在对网络的边进行峰值聚类的基础上提出了一种基于边信任度的混合参数的自适应重叠社区发现算法.定义了网络边的邻居边集合及与其邻居边之间的信任度函数,通过信息传递获取边的总信息量,并且基于此引入混合参数的概念.基于k-means算法使用混合参数对网络中的边进行聚类,即将网络中的边划分为核心边集与非核心边集,每个核心边作为一个聚类中心.根据非核心边到核心边的距离将所有非核心边划分至距离其最近的聚类中心所在社区.再根据网络中边与节点的关系实现重叠节点发现,最终实现重叠社区的发现.该算法的优点是每条边通过独立地完成信息扩散找到社区的结构,相比于传统的峰值聚类算法,不需要人为设置相关参数,实现重叠社区的自适应发现.为验证算法的可行性,对算法复杂度进行了分析,并且使用两种社区划分评价指标——标准化互信息和模块度,分别在人工数据集及6种真实数据集上进行实验,通过与其他算法进行对比分析,实验结果表明该算法更具可行性和有效性.  相似文献   

19.
复杂网络在新闻网页关键词提取中的应用   总被引:1,自引:0,他引:1  
通过分析新闻网页文档的特征,引入节点权重、有向网络加权聚类系数、中心介数等特征量,并结合传统关键词提取算法的一些优点及网页文档的部分特征,提出了一种改进的基于加权复杂网络的新闻网页关键词提取算法,并通过实验证实了该算法的正确性.  相似文献   

20.
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高。针对这个不足,提出一种特征加权的K-means算法进行优化。首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其次,优化初始聚类中心选择策略,选择距离较大的K个样本作为初始聚类中心,可有效避免样本的错误聚类及空簇问题。实验结果表明,在UCI标准数据集中采用加权K-means聚类算法可以有效减少迭代次数,提高聚类的准确率、精确率和召回率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号