首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 125 毫秒
1.
二支聚类要求聚类结果必须具有清晰的边界,即每个对象要么属于一个类,要么不属于一个类.然而在许多实际问题中,一个对象和类别可能会有三种关系:即确定属于、确定不属于和无法确定.为了克服二支聚类的这一问题,三支聚类使用核心域,边界域和琐碎域来表示每个类别,较好地处理了具有不确定性对象的聚类问题.给出一种基于样本稳定性的三支聚类算法.首先使用聚类集成的结果计算出每个数据的稳定性,然后基于阈值将这些数据元素分为两部分:核与环.对核中的数据采用硬聚类进行聚类,对环中的数据通过比较环中数据到聚类中心的距离将它们分到相应类的边界域中.通过以上策略,可以得到三支聚类的核心域和边界域.在UCI数据集上的实验结果显示,该方法能更好地显示出聚类的结构.  相似文献   

2.
网络中的社区结构有助于简化网络拓扑结构分析,揭示系统内部的规律,能够为信息推荐和信息传播控制提供有力的支撑.网络重叠社区结构与真实生活更加接近,但其分析较非重叠社区结构更加困难.因此,针对重叠社区发现问题,在对网络的边进行峰值聚类的基础上提出了一种基于边信任度的混合参数的自适应重叠社区发现算法.定义了网络边的邻居边集合及与其邻居边之间的信任度函数,通过信息传递获取边的总信息量,并且基于此引入混合参数的概念.基于k-means算法使用混合参数对网络中的边进行聚类,即将网络中的边划分为核心边集与非核心边集,每个核心边作为一个聚类中心.根据非核心边到核心边的距离将所有非核心边划分至距离其最近的聚类中心所在社区.再根据网络中边与节点的关系实现重叠节点发现,最终实现重叠社区的发现.该算法的优点是每条边通过独立地完成信息扩散找到社区的结构,相比于传统的峰值聚类算法,不需要人为设置相关参数,实现重叠社区的自适应发现.为验证算法的可行性,对算法复杂度进行了分析,并且使用两种社区划分评价指标——标准化互信息和模块度,分别在人工数据集及6种真实数据集上进行实验,通过与其他算法进行对比分析,实验结果表明该算法更具可行性和有效性.  相似文献   

3.
针对隶属关系不明确的情况,即样本点属于多个类别的概率接近,高斯混合模型聚类存在较大的误判风险的问题,将三支决策思想融入高斯混合模型中,提出一种基于三支决策的高斯混合聚类算法.新算法计算出数据对象属于各个类簇的后验概率作为决策评价函数,用于确定聚类结果的正域和边界域.由于新算法对边界对象采取了比一般高斯混合聚类算法更加谨慎的操作,避免了直接做出对象属于某一类或不属于某一类的决策所需承担的风险,从而有效减小了误判代价.实验进一步表明,所提出的算法不仅继承了高斯混合聚算法的特点,具有良好的聚类性能,而且还对于非球形数据簇表现出优良的聚类效果.  相似文献   

4.
谱聚类划分算法是经典社区发现算法之一,由于目前构造的相似图承载的社区结构信息较少,导致聚类效果与理想效果具有较大差距,因此,提出了基于DCBM的马尔可夫谱聚类社区发现算法MSCD.首先,基于DCBM模型提出了以节点间连接概率为元素的概率矩阵,并建立了概率矩阵与相似矩阵之间的映射关系;其次,利用马尔可夫链重构了谱聚类的相似图;最后,使用重构的相似图对网络进行社区划分.在人工合成网络和真实网络上与SC,MRW-KNN和FluidC三种典型算法进行了对比实验.实验结果表明,MSCD算法具有更加高效的聚类性能,能够揭示更加清晰的社区结构.  相似文献   

5.
硬聚类要求聚类的结果必须具有清晰的边界,即每个对象要么属于一个类,要么不属于一个类.然而,将某些不确定的对象强制分配到某个类中往往容易带来较高的决策风险.三支聚类将确定的元素放入核心域中,将不确定的元素放入边界域中延迟决策,可以有效地降低决策风险.本文将三支决策理论与传统的谱聚类算法相结合给出了三支谱聚类的聚类算法.该方法通过修改谱聚类算法的聚类过程并获得任一类簇的上界.然后通过扰动分析从该类簇的上界分离出该类簇的核心域,同时上界与核心域的差值认为是该类簇的边界域.在UCI数据集上的实验结果显示,该方法能有效提高聚类结果的ACC、AS、ARI值,并且降低DBI值.  相似文献   

6.
针对待聚类的数据对象的对称性,提出了一种基于对称点距离的蚂蚁聚类算法.该算法不再采用Euclidean距离来计算类内对象的相似性,而是使用新的对称点距离来计算相似性.实验结果表明:与标准的蚂蚁聚类算法相比,该算法在处理带有对称性质的数据集时,可以更好的识别数据集的聚类数目和划分.  相似文献   

7.
针对现有基于改进的K-means模糊聚类的社区发现算法(k-means algorithm for community structures detection based on fuzzy clustering,NKFCM)执行效率较差的问题,将粒子群算法与模糊聚类算法相结合提出了基于粒子群优化与模糊聚类的社区发现算法(community detection algorithm based on particle swarm optimization and fuzzy clustering,PFCM).该算法首先进行迭代运算,找出初始聚类核心,利用以云模型为运行条件的粒子群优化算法确定最优聚类核心与最佳社区个数,最后利用模糊聚类算法(fuzzy c-means algorithm,FCM)进行具体的社区划分.理论解析与测试结果表明:该算法发现网络社区的准确性较高,且与NKFCM算法相比,PFCM在处理网络数据时执行效率获得了极大地提升.  相似文献   

8.
针对现有聚类算法K-均值存在事先指定聚类类数及仿射传播存在计算复杂度偏高的缺陷,提出了一种新型的聚类算法Increase K-Means,并将其应用到Blog内容的相似度聚类分析中,较好地满足了社区发现和话题跟踪的需求.仿真结果表明:在Blog文本聚类分析中,Increase K-Means在时间上与K-Means相近,在精度上与仿射传播接近,适用于大规模网络文本的分析处理.  相似文献   

9.
信息传递是网络具有的基本特征,基于此提出了一种基于信息传递和峰值聚类的自适应社区发现算法。首先,定义了节点与邻居之间的信任度函数,每个节点基于信任度独立的向网络中扩散信息量。扩散结束后,节点总信息量即为峰值聚类中的密度;网络中节点之间的距离通过所含节点信息量的倒数替代。然后,提出一种自动选取核心节点方法并为核心节点分配不同社区,把剩余节点分配到与它距离最短的核心节点所在社区,完成社区划分。本算法的优点在于无需额外参数并且能够发现社区内部结构。实验结果表明本算法发现的社区结构更加接近网络真实社区结构。  相似文献   

10.
为解决邮件社区挖掘中涉及内容隐私及社区形态单一问题,提出了一种基于聚类融合的邮件社区划分算法.该方法中首先利用邮件社交网络特征及邮件属性衡量节点间距离,避免对邮件内容的分析导致涉及用户隐私,其次使用K-Means算法产生若干初始聚类结果,同时引入共协矩阵记录初始聚类时节点的归属,最后根据共协矩阵中邮箱节点间的相似程度,使用融合算法合并初始聚类结果得到最终社区结构.实验表明,该算法未使用邮件内容,得到的社区结构质量较高,并能发现多形态社区.  相似文献   

11.
How to find these communities is an important research work. Recently, community discovery are mainly categorized to HITS algorithm, bipartite cores algorithm and maximum flow/minimum cut framework. In this paper, we proposed a new method to extract communities. The MCL algorithm, which is short for the Markov Cluster Algorithm, a fast and scalable unsupervised cluster algorithm is used to extract communities. By putting mirror deleting procedure behind graph clustering, we decrease comparing cost considerably. After MCL and mirror deletion, we use community member select algorithm to produce the sets of community candidates. The experiment and results show the new method works effectively and properly.  相似文献   

12.
0 IntroductionWeb communities are very i mportant signature of Weborganization. Community is a set of pages denselyconnected, which reflect that many pages have created bysome persons or groups with common interest . Communitiesare helpful for Web information retrival , social attribute ofWeb,customs analysis and site portal management . For in-stance,the Web directories in Yahoo!and Infoseek are com-munities . There two different communities . Oneis manifestlydefined communities such as n…  相似文献   

13.
重叠社区发现是复杂网络挖掘中的重要基础工作,可以应用于社交网络、通讯网络、蛋白质相互作用网络、代谢路径网络、交通网络等多种网络的数据分析,从而服务智慧交通、传染病防治、舆情分析、新药研制和人力资源管理等领域.传统的单机运算架构已经难以满足各类大规模复杂网络的分析和计算要求.人工智能领域的研究人员提出将社区发现应用到网络...  相似文献   

14.
重叠社区发现是复杂网络分析研究的重要目标之一。针对传统多标签传播算法存在的社区发现结果具有随机性、不稳定性,以及忽视节点影响力对标签传播的影响等问题,提出一种基于节点影响力与多标签传播的能够生成稳定社区的重叠社区发现算法。算法在节点影响力的计算、排序和核心节点识别基础上,通过邻居节点初始标签的再处理和基于平衡系数的节点标签异步更新策略,实现复杂网络重叠社区的有效识别。在真实数据集和人工数据集上的实验综合表明,算法性能优于各对比算法,适用于大规模复杂网络。  相似文献   

15.
网络结构关系错综复杂,在复杂网络上寻找最优的社区结构是一个NP-Hard问题,进化计算被认为是解决这类问题的有效方案,人们尝试利用群智能方法来搜索最优的社区结构。目前,针对包含节点属性的属性网络,基于进化计算的社区发现方法还面临若干挑战:(1)基因编码策略都直接或间接采用邻位编码,致使算法的搜索空间受限于拓扑结构,属性信息利用程度低,导致算法精度不足;(2)缺少对社区边缘度较小的节点的考虑,造成社区边界识别较低。针对上述问题,提出了一种基于随机游走的进化计算社区发现算法。首先,设计了一种基于拓扑及属性信息随机游走的社区初始化策略,以准确识别社区边界,提高社区发现的精度。其次,设计了综合考虑拓扑和属性的节点嵌入向量更新策略,使节点的属性信息能够在进化过程中被有效利用,以提高社区划分的质量。通过在真实和人工数据集上实验,验证了提出的新算法能够比现有方法得到更好的社区划分。  相似文献   

16.
日本型经营体系中充满了员工与员工的和谐,员工与管理者的和谐,管理者与组织的和谐,组织与社会的和谐;日本型经营形成了充分发挥子系统和系统成员的能动性、创造性的条件、环境和氛围;系统中各子系统的活动相互协调,系统最终达到整体和谐.“和谐”是日本企业和管理者的管理哲学,和谐思想已渗透到日本企业的各个层面,即和谐是日本型经营体系的主体和精髓.我国要进行和谐社会主义的建设可以从中得到借鉴——首先要提高社会活力与建立和谐文化.  相似文献   

17.
介绍了复杂网络及社团结构的相关概念,给出节点的综合特征值和增益函数的定义,然后提出一种新的社团发现算法(CNCD).综合特征值与节点的度数及其聚类系数有关,用于发现社团中的核心节点;增益函数决定何时获得社团结构的最佳划分.作者用C++语言实现算法,并使用经典数据集对算法进行验证,实验结果表明此算法不仅能够得到正确的社团结构,而且通过动态调整算法中的参数值,能够得到比传统算法更加详细的社团划分结果,获得网络的细节信息.  相似文献   

18.
Quantifying social group evolution   总被引:9,自引:0,他引:9  
Palla G  Barabási AL  Vicsek T 《Nature》2007,446(7136):664-667
The rich set of interactions between individuals in society results in complex community structure, capturing highly connected circles of friends, families or professional cliques in a social network. Thanks to frequent changes in the activity and communication patterns of individuals, the associated social and communication network is subject to constant evolution. Our knowledge of the mechanisms governing the underlying community dynamics is limited, but is essential for a deeper understanding of the development and self-optimization of society as a whole. We have developed an algorithm based on clique percolation that allows us to investigate the time dependence of overlapping communities on a large scale, and thus uncover basic relationships characterizing community evolution. Our focus is on networks capturing the collaboration between scientists and the calls between mobile phone users. We find that large groups persist for longer if they are capable of dynamically altering their membership, suggesting that an ability to change the group composition results in better adaptability. The behaviour of small groups displays the opposite tendency-the condition for stability is that their composition remains unchanged. We also show that knowledge of the time commitment of members to a given community can be used for estimating the community's lifetime. These findings offer insight into the fundamental differences between the dynamics of small groups and large institutions.  相似文献   

19.
批量密钥更新中密钥组织方法的研究与实现   总被引:4,自引:0,他引:4  
在对批量密钥更新和成员行为进行分析的基础上,对现有的优化密钥树结构进行了优化,并给出了一种实现方法.该方法基于Huffman树的构造方法,将组成员的变化概率与成员所在的密钥树级别进行关联,形成多级密钥树,最低级别密钥树高度为1.成员变化概率越大,所在的密钥树级别越低.当成员变化概率发生动态改变时,成员的位置也可随之更改.这种方法较好地解决了多播组中异构成员变化带来的组密钥更新问题.仿真实验结果表明,提出的优化树结构更具有一般意义,可适应具有较大动态变化情形的安全多播密钥更新.  相似文献   

20.
在考虑组员离开通信组不同概率的基础上,提出基于Huffman单向函数树(HOFT)的组播密钥更新协议.介绍了单向函数树(OFT)组播密钥更新协议;提出了包括初始化HOFT算法以及组员加入和离开通信组时的HOFT密钥更新协议;分析了HOFT组播密钥更新协议的消息包数、组控制者保存的密钥数以及组员保存的密钥数等,研究表明,在所有基于OFT的组播密钥更新协议中,HOFT组播密钥更新协议的平均性能最优.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号