共查询到20条相似文献,搜索用时 15 毫秒
1.
为提高单机处理复杂网络规模的能力,提出一种新的重叠社区发现算法.首先,通过基于图压缩的社区结构表示模型(压缩社区图),对网络进行无损压缩;然后,在压缩社区图上基于种子迭代的思想,通过不断优化社区适应度函数将种子扩展成社区;最后,将相似度高的社区进行合并,得到最终的重叠社区结果.由于压缩后的凝聚图大大降低了待处理的网络规模,并能在一定程度上减少重复计算,该方法可以大大提高计算效率和单机处理的网络规模. 相似文献
2.
当原图转换成边图后,在边图上进行社区发现可以天然地得到重叠社区,然而得到的社区往往相互大面积重叠,甚至相互包含,导致社区模块性质量较低.针对这一问题,在得到边图下重叠社区发现算法结果的基础上,我们将进一步以优化重叠社区模块化质量函数为标准进行社区合并,以获得高质量的重叠社区.本文首先提出一种描述社区间重叠程度的重叠系数,并基于此进一步提出一种构建带权社区图的启发式方法,能够快速有效地完成社区合并的过程.在人工生成网络与真实世界网络上的实验,进一步验证了该算法能够在不削弱边图方法速度优势的前提下,提高高度重叠社区的模块性. 相似文献
3.
社交网络拥有社区结构,而网络中的一些节点又被两个或更多社区共享,这就使网络呈现出重叠社区结构.在前面对重叠社区划分算法的研究中提出了基于引力度扩展的重叠社区发现算法(GDE),以引力度最大的节点为种子来扩展与发现重叠社区.这里,提出基于h-域的局部引力度扩展的改进算法(LGDE).改进算法的实验测试结果表明该算法的执行效率获得了极大的提高,并且是可行的. 相似文献
4.
为了能够发现社会网络中的重叠社区以及解决重叠社区之间关系的模糊性和层次性,提出了一种基于模糊层次聚类的重叠社区检测算法(CDHC)。算法中引入了距离加权因子来计算社区间的相似度,通过模糊层次聚类来合并相似度高的社区;针对合并生成的原始社区计算社区中节点的隶属度,再将隶属度小于阈值的节点从社区中移除,从而形成最终的网络重叠社区结构。该算法不仅可以发现重叠的社区结构,还可以处理孤立节点。在Lancichinetti基准网络和真实网络上将CDHC算法与具有代表性的重叠社区发现算法CMP和LFM进行了比较,结果表明:影响社区检测精度的主要因素是社区间的混合程度,而网络规模和网络中社区的规模的影响并不显著;CDHC算法在小社区网络上的社区检测精度优于LFM,在大社区网络上的社区检测精度优于CMP。CDHC算法在保持社区检测质量的同时,还具有较好的稳定性,是一种有效的社会网络重叠社区检测算法。 相似文献
5.
学习者网络拓扑结构稀疏,且传统的社区检测算法无法为惰性/冷启动学习者检测其潜在的社区。针对该类问题,提出了一种基于高阶组织的学习者潜在重叠社区检测算法(POCDL)。POCDL算法是一种局部图聚类算法,首先利用社交化在线课程平台中的好友关系、同学关系和师生关系解决学习者网络数据稀疏问题;然后挖掘学习者网络中的高阶组织并重构学习者网络;最后,根据学习者的度中心性选取初始种子集,根据社区归属度和社区亲密度进行局部社区检测。在人工网络和学者网真实网络数据集上的实验结果表明:POCDL算法能够较好地为惰性/冷启动学习者检测社区;对其他类型的复杂网络也具有一定的普适性。 相似文献
6.
发现复杂网络中的重叠社区是目前复杂网络分析的重要内容。选择社区代表性强的节点作为种子节点进行扩展是基于种子扩展策略重叠社区发现算法的关键,提出了一种基于度信息和邻域连通性的节点邻域中心性度量指标,并在此基础上提出了一种基于局部邻域连通性的重叠社区发现算法(Local Neighbor-hood Connectivitybased overlapping community detection Algorithm,LNCA)。首先计算每个节点的局部邻域连通熵和邻域中心性cc,选择中心性高的节点作为种子节点;然后采用带重启的随机游走策略扩展种子节点并得到初始社区;最后合并重叠度较大的社区得到最终社区发现结果。在6个带真实社区标签的网络和9个无真实社区标签的网络上,与SLP A、DEMON、CPM、NodePerception、EgoNetworks、EgonetSplitter等6个经典重叠社区发现算法进行比较,结果表明,在带标签网络上,LNCA算法在重叠NMI和F1分数上优于多数对比算法,可得到与网络真实社区更匹配的社区结... 相似文献
7.
在众多社区挖掘算法中,标签传播算法因为接近线性时间复杂度被广泛应用,但其也存在大量随机性,稳定性差的问题,采取一种新型的多标签策略解决重叠社区挖掘问题,并根据节点度减少初始标签赋予量的方法提升了算法的稳定性. 相似文献
8.
为解决模糊层次聚类算法无法收敛的问题,提出一种改进的模糊层次聚类算法.算法在分群前先进行数据处理,将特征向量相同的群合并成一个新的群,再使用模糊层次聚类算法分群,最后使用K-means算法将类簇收敛为想要的数量.实验结果表明,本算法具有较好的稳定性和分群效果,聚类质量高. 相似文献
9.
重叠社区发现技术对于分析网络社区间关系具有重要意义,本文提出了基于Louvain重叠社区发现算法,该算法在Louvain算法的基础上使用模块度Q的增益度函数dq判断节点是否具有重叠性,并且发现重叠社区;设计实验验证该算法,使用经典数据集American College Football对该算法与常用重叠社区发现算法CPM、LFM和COPRA进行实验对比,结果表明:增益度函数dq能判断重叠节点,且通过找到社会网络中的重叠节点发现重叠社区;该算法在重叠模块度EQ上比CPM、LFM和COPRA算法分别提高17.05%、12.81%和9.45%,在运算时间上比CPM算法、COPRA算法分别增加了12.62%、7.15%,比LFM算法减少了23.06%,表明在综合重叠模块度EQ与算法时间上,本文基于Louvain重叠社区发现算法都优于其他的算法。 相似文献
10.
工程中常常通过与邻近电站的单位发电量比较发现故障电站,电站的单位发电量主要与电站地理位置、光伏器件型号及特性等诸多要素有关,选择哪些电站进行比较以及比较的策略是一个需要深入探讨的问题。本文提出了一种改进的A-DBSCAN聚类算法的光伏发电站故障检测方法。通过对影响发电站单位发电量因素的分析,确定了该故障检测模型的输入变量。该方法不需其他外接设备的支持,同时还可以实现在线检测分析。通过比较相同发电环境中的发电系统的单位发电量来对故障检测,初步实验结果反映该方法的正确率为95. 45%,召回率为91. 3%。 相似文献
11.
K-means算法是聚类方法中常用的一种划分方法.基于扩展划分的思想,提出了一种基于扩展的K-means聚类算法(EK-means),在一定程度上避免了聚类结果陷入局部解的现象,减少了原始K-means算法因采用误差平方和准则函数而出现将大的聚类簇分割开的情况.该算法使用了基于距离的技术来处理孤立点,引进了一种基于扩展的方法进行聚类.实验表明该算法可扩展性好,能够很好的识别出孤立点或噪声,并且有很好的精度. 相似文献
12.
一种改进的k-means聚类算法在入侵检测中的应用 总被引:4,自引:0,他引:4
讨论了经典的k-平均聚类算法,说明了它存在不能很好地处理符号数据和对噪声与孤立点数据敏感等不足,提出了一种改进的k-平均聚类算法,克服了k-平均聚类算法的缺点,并从理论上分析了该算法的复杂度。实验证明,用该方法实现的数据聚类与传统的基于平均值的方法相比较,能有效提高数据聚类效果以及入侵检测的准确度。 相似文献
13.
基于全局划分和局部凝聚原理,改进得到一种两步式挖掘算法,该算法以寻找最优模块性Q值为基准,最终挖掘出重叠社区.对两个经典真实世界网络的Zacharys Karate俱乐部数据和海豚网络数据进行了实验测试,实验表明该算法能够有效地划分出重叠社区. 相似文献
14.
15.
引进文本相关度这一影响因子,提出了一种基于蚁群聚类算法的突发话题检测算法,该算法结合蚁群聚类算法的优势,综合考虑文本聚类和文本相关度的影响,得到对网络突发话题检测的最优聚类效果,并对近年来网络突发话题进行实验,达到了很好的聚类速度和聚类效果,验证了算法对突发话题检测的准确性和即时性. 相似文献
16.
17.
一种改进的聚类算法在入侵检测中的应用 总被引:1,自引:0,他引:1
为了研究聚类算法在入侵检测中的应用,该文讨论了传统的k-means算法,指出其存在的问题;将遗传算法引入到聚类算法中,提出了一种改进的k-means算法。实验证明,用该算法实现的数据聚类与传统的k-means算法相比较,能有效提高数据聚类效果。 相似文献
18.
19.
重叠社区发现是复杂网络研究的重要课题.提出一种基于标签传播的重叠社区发现算法.首先利用标签传播算法得到初始无重叠社区划分结果,之后通过设计新的重叠节点识别算法确定重叠节点,最后再根据重叠节点的识别结果对社区进行合并从而得到最终的重叠社区划分结果.该算法克服了已有算法重叠节点占比过大的弊端.为验证算法的有效性,在LFR人工数据集、3个标准公开测试集以及真实的大豆基因共表达网络上进行实验,并与已有算法进行对比.实验结果表明,该算法性能明显优于对比算法,极大地改善了重叠节点比重过大问题. 相似文献
20.
提出一种基于改进密度聚类的异常检测算法(ADIDC), 通过在各特征列上分别进行密度聚类, 并根据各特征对正常轮廓的支持度进行特征加权, 解决了聚类分析方法在异常检测应用中误报率较高的问题. 通过大量基于异常检测数据集 KDD Cup 1999的实验表明, 其相对于传统异常检测方法在保证较高检测率的前提下, 有效地降低了误报率, 对某些与正常行为相近的特殊攻击检测率明显提高. 同时利用特征权值进行特征筛选提高了其检测性能和效率, 更适应实时检测要求. 相似文献