首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
针对二分网络社团检测算法存在精度不高和丢失原始网络信息等问题,设计了一种新的融合奇异值分解的谱聚类(SVD-MS)算法.该方法是将Barber的二分网络模块度最大化问题映射到奇异值向量分解上,并结合启发式算法快速求解向量划分问题.在3个真实世界的网络中对比SVD-MS算法与7种算法的模块度,结果表明,在保留原始网络信息的情况下,SVD-MS算法能更有效地划分二分网络的社团结构.  相似文献   

2.
社区发现是复杂网络研究的基础,其目的是发现网络的真实结构,对于分析复杂网络的拓扑结构、理解其功能和寻找其潜在的性质具有重要的意义.Palla,Yong和James等人分别提出了CPM、LINK算法,此类算法基于网络拓扑结构或边密度发现复杂网络中的社区,性能较好,但不足是计算出的社区存在过度重叠问题.如何设计新算法,避免社区发现的过度重叠问题,是一个亟待解决的重要问题.本文基于加权边相似度,提出了一种社区发现算法LINKw,可以高效发现社区结构,与其他算法相比,本算法能更好地解决社区过度重叠问题.  相似文献   

3.
基于相似度的加权复杂网络社区发现方法   总被引:2,自引:0,他引:2  
针对加权复杂网络中的社区结构发现问题,本文定义基于权重关系的相似度,并在此基础上定义了节点中心度和归属度,改进GN算法的模块度评价函数,提出一种基于相似度的中心聚类算法(SCC).该算法通过计算节点间的相似度,选取合理的中心度大的节点作为社区中心节点,最后基于节点归属度来聚集从而形成社区;同时,提出了用相似度代替边介数的改进GN算法SGN.通过理论分析,并在数据集上进行实验验证,结果表明SCC算法与WGN算法、SGN算法相比,速度和精度上均有较大改善.同时与I2C算法相比,社区的划分有效性更好.  相似文献   

4.
将三支聚类思想和聚类集成思想相结合,提出一种基于样本相似度的三支聚类算法.首先,通过随机选择样本部分特征的方法生成一组基聚类成员,以此构造样本相似度,并在此基础上定义划分有效性指标,用以自动计算最优阈值;其次,使用投票法对基聚类成员集成得到初步的聚类结果;最后,利用最优阈值对聚类结果划分,得到每个类的核心域集合和边界域集合.UCI(University of California Irvine)数据集上的实验结果证明了所提出方法的有效性.  相似文献   

5.
文章提出基于语义相似度的Web文档聚类算法--WDCSS算法,依据文档关键词之间的相似度生成最小树,通过概率统计来确定最小树中相似度阚值,并对最小树中进行切割,同时对较小的子类进行划分合并.实验表明,WECSS不仅能为具有各种不同聚类形状的数据集准确地分析出数据中存在的合理聚类和例外样本,而且避免了用户参数选择所造成聚类质最降低问题.  相似文献   

6.
传统的社交网络社区划分分为两种,一种是以链接属性进行划分,另一种是以用户自身属性进行划分.近年来出现了融合节点自身属性和链接属性的社区划分算法,但是这些算法只是单纯地将链接属性融为节点自身属性进行划分,忽略了链接属性强弱对节点间兴趣度的反映程度.针对这些问题,对微博中用户的链接属性进行了分类,采用直接链接节点链接关注度和间接链接节点链接关注度的概念,以链接强度为搜索顺序,提出一种基于链接强度的兴趣相似社区划分算法.实验表明,本算法划分的社区内链接度质量较高且用户兴趣相似.  相似文献   

7.
针对传统的社区发现算法无法发现社区中的核心成员和边界成员的缺点,提出了基于PCM聚类算法的Blog社区发现算法,用来识别Blog社区的核心和边界.首先,使用随机行走的方法计算可以衡量两个Blog亲密度的对称社会距离;然后,在对称社区距离的基础上使用PCM聚类算法对Blog进行聚类,得到每个社区中的成员属于社区的概率表示.最后,通过确定相应的概率阈值,确定社区的核心和边界.实验结果表明:该算法能够获得社区中的成员属于社区的概率,根据这个概率可以确定社区中的核心成员和边界成员.  相似文献   

8.
为解决网络社区聚类算法在实际应用中存在热点捕捉困难和社区聚类生存时间较低的问题,提出了一种基于热点度轨迹显影机制的网络社区聚类算法。首先,考虑网络社区聚类存在的多径一体特性,采用抽样方式与角度估计方法来实现热点信号的精确捕捉,以提高聚类效率;随后,对热点信号矢量空间进行按列重排,并综合考虑传输矩阵具有的按列正交及全秩特性,构建热点度轨迹显影方法,以提高聚类中热点显影速度和增加聚类生存时间。仿真实验表明:与聚类流动性映射算法(Clustering Liquidity Mapping Algorithms,CLM算法)、超欧里几何热度聚类算法(Hyper-Eulerian Geometric Thermal Clustering Algorithms,H-EGTC算法)相比,所提算法具有更低的聚合时间和搜寻失误率,以及更高的热点显示时间。  相似文献   

9.
兴趣点推荐是基于位置的社交网络(Location Based Social Network,LBSN)的重要服务,近年来关于兴趣点推荐的算法深受学者关注,然而由于多方面的原因,许多推荐算法仍存在一些不足。该文提出的是在用户聚类的基础上利用二分图网络进行推荐的算法。实验表明,该算法取得了比较良好的推荐效果。  相似文献   

10.
基于模糊相似度的科技文献软聚类算法   总被引:3,自引:0,他引:3  
本文提出了一种新的文档软聚类算法。将关键字通过文档的题名、摘要进行映射扩展,并对关键字的出现位置进行加权构造文本向量空间。利用模糊最大支撑树聚类过程中类间和类内相似度变化的规律自动识别最佳聚类数K及硬聚类簇。以硬聚类簇为核心将聚类相似度减小到下相似度进行扩展,从而形成相应软聚类。实验表明该算法能够有效地降低特征维数、提高软聚类精度和速度。  相似文献   

11.
针对现有聚类算法K-均值存在事先指定聚类类数及仿射传播存在计算复杂度偏高的缺陷,提出了一种新型的聚类算法Increase K-Means,并将其应用到Blog内容的相似度聚类分析中,较好地满足了社区发现和话题跟踪的需求.仿真结果表明:在Blog文本聚类分析中,Increase K-Means在时间上与K-Means相近,在精度上与仿射传播接近,适用于大规模网络文本的分析处理.  相似文献   

12.
谱聚类划分算法是经典社区发现算法之一,由于目前构造的相似图承载的社区结构信息较少,导致聚类效果与理想效果具有较大差距,因此,提出了基于DCBM的马尔可夫谱聚类社区发现算法MSCD.首先,基于DCBM模型提出了以节点间连接概率为元素的概率矩阵,并建立了概率矩阵与相似矩阵之间的映射关系;其次,利用马尔可夫链重构了谱聚类的相似图;最后,使用重构的相似图对网络进行社区划分.在人工合成网络和真实网络上与SC,MRW-KNN和FluidC三种典型算法进行了对比实验.实验结果表明,MSCD算法具有更加高效的聚类性能,能够揭示更加清晰的社区结构.  相似文献   

13.
聚类方法的核心是如何度量事物间的邻近性。介绍了邮件特征的向量表示形式、构建了邮件特征矩阵,并使用变形后的极值分布函数模型拟合了邮件间通信特征信息;在此基础上提出了一个新的邻近性度量方法(ex-treme value distribution similarity,EVS),用以指导邮件社区划分;使用微聚类-宏聚类邮件社区划分算法验证了该方法的有效性。实验表明,在测试数据集上,相比余弦、PCC等经典的邻近性度量方法,以EVS作为划分依据的邮件社区划分算法能够更加有效地发现高质量的邮件社区。  相似文献   

14.
为了能在大数据中准确快速地寻找到网络结构,该文提出一种基于社区极大类的大数据聚类算法。对于初始节点不确定和适应度函数计算所带来的时间消耗,引入局部关键节点和对适应度公式进行改进来减少时间消耗。对于初始社区的形成,引入了极大团的概念并通过分析极大团的特性,得出社区的核心类别是由极大团构成,同时提出通过极大团的发现来得到局部核心类别的方法并提出了极大团发现算法的并行策略,然后提出整个算法的并行策略并在真实数据集上实验。实验结果证明该文提出的算法是可行和有效的,适用于大规模数据的网络结构发现。  相似文献   

15.
为实现加权网络的准确划分,发现真实的社区结构,提出一种基于模块度和共邻节点相似性的层次聚类社区划分方法IEM.首先,定义两节点间基于共邻节点的相似度.之后,基于该度量快速聚合当前节点和与其关联紧密度最强的邻居节点以形成初始社区,并进行社区扩展.最后,以最大化网络模块度为目标进行社区合并以优化划分结果.算法通过形成初始社区、扩展社区、合并社区三步,实现了加权网络合理有效的社区划分.以加权模块度作为社区划分质量的评价标准,在多个数据集上的实验结果表明,IEM算法优于加权CN、加权AA、加权RA.同时,与CRMA算法相比,IEM算法对加权网络社区划分的有效性和正确性更高.  相似文献   

16.
随着Web服务数量的剧增,Web服务发现是目前面向服务的体系架构中的重要部分。并且成为Web服务研究的一个热点.笔者提出了一个基于语义匹配的服务发现方法.首先,在标准WSDL中进行本体相关的语义扩充,将服务操作中必要的信息进行语义映射,包括:Web服务操作名称以及服务操作的输入消息和输出消息.其次提出了一个基于消息语义相似度二分匹配的Web服务发现方法.实验表明该方法提高了服务发现的查全率和查准率,且具有良好的可伸缩性.最后得出结论:该方法使用WSDL标准规范而不是特定的Web服务语言或模型,因而易于实施;该方法提高了计算机自动发现服务的效率.  相似文献   

17.
提出一类基于谱聚类算法的带有节点特征的社区发现算法(SCSA),该算法首先将带有节点特征的网络图转化为加权图,其中边的权重用节点特征相似度度量,然后将谱聚类算法应用到加权图上进行社区检测.SCSA算法将带有节点特征的网络图分成K个社区,每个社区内节点不仅连接良好而且具有相似的特征属性.注意到不是所有节点的特征在社区划分过程中都是有用的,与划分无关的特征信息会降低社区发现算法的准确度.为此,提出了一类节点特征权重自调整机制嵌入到谱聚类中以提高社区检测质量.数值实验的结果验证了所提算法的有效性.  相似文献   

18.
传统基于概率分布的不完整数据聚类填充算法,未综合分析数据对象的类别属性,数据填充效率和精度较低。因此,本文提出一种新的聚类填充算法,利用近邻传播(AP)算法聚类不完整数据,采用元祖相似度算法对不同类别的不完整数据实施填充。通过数据挖掘方法获取多类别不完整云计算网络系统中的加权关联规则,实施常规缺失数据的填充,采用数据推荐筛选方案实施元组相似度运算,完成异常缺失数据的填充,最终获取完整的云计算网络数据集,提高云计算网络数据的有效利用率。实验表明,本文设计的聚类填充算法具有较高的填充效率和精度。  相似文献   

19.
传统的社区发现算法能够找出网络中所有的社区,其时间复杂度取决于网络的规模.挖掘大网络中的全局社区结构因为时间复杂度高而难以实现,局部社区发现作为一种不需要知道网络的整体结构,从给定的节点逐步向外扩展,寻找该节点所在社区的方法,在大网络时代具有重要的应用意义.目前这方面的研究已经获得广泛关注,并提出了很多局部社区发现算法.针对已有局部社区发现算法需要人工设置参数、准确率低的问题,提出一种新的局部社区发现算法.首先,提出一种加权邻居节点的共同邻居相似度指标,用于计算网络中两个节点间的相似度;然后,基于该相似度指标,给出一种新的局部社区质量度量指标,在保证社区度量指标不下降的前提下,不断选择与当前局部社区嵌入度最大的节点加入到局部社区,逐步找出给定节点所在的社区;最后,在真实网络和仿真网络数据集上进行了实验.实验结果表明,该算法能有效地挖掘出给定节点所在的局部社区,相比具有代表性的Clauset,LWP,GMAC等局部社区发现算法有更高的准确率.  相似文献   

20.
模糊聚类分析主要用于研究样本的分类问题.在引入加权相似系数和加权距离系数的计算公式的基础上,提出了一种既能考虑到样本之间的值贴近程度,又能考虑到样本之间的形贴近程度的改进统计量-相似度,用相似度矩阵替代传统的相似矩阵,得到了模糊聚类分析方法的改进.实验结果表明改进的模糊聚类分析方法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号