首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对图谱划分方法在划分社区结构不是很明显的网络时,不能得到好的划分效果,该文提出了基于边聚类系数的谱聚类社区划分方法.由于社区内部节点之间的连接比各个社区间节点的连接稠密,边聚类系数的大小反映了节点的聚集程度,因而通过网络中的边所构三角形的数量定义了聚类系数矩阵,矩阵中的元素即处于网络中的边实际构成三角形的数量.在增益函数最大化的过程中,使用了矩阵的特征值和特征向量,以此来进行社区划分.通过在真实网络数据中进行实验,结果表明该算法可行.  相似文献   

2.
聚类方法的核心是如何度量事物间的邻近性。介绍了邮件特征的向量表示形式、构建了邮件特征矩阵,并使用变形后的极值分布函数模型拟合了邮件间通信特征信息;在此基础上提出了一个新的邻近性度量方法(ex-treme value distribution similarity,EVS),用以指导邮件社区划分;使用微聚类-宏聚类邮件社区划分算法验证了该方法的有效性。实验表明,在测试数据集上,相比余弦、PCC等经典的邻近性度量方法,以EVS作为划分依据的邮件社区划分算法能够更加有效地发现高质量的邮件社区。  相似文献   

3.
现有的微博社交网络社区挖掘方法多是基于网络结构进行,忽略了节点本身行为的重要性,并且不能同时实现对大规模复杂网络结构适应性和社区挖掘的高效性。为缓解上述问题,提出了一种基于网络距离和内容相似度的微博社交网络社区划分方法,该方法在考虑微博社交网络结构的同时兼顾了网络中节点的历史微博内容,通过对历史微博数据的分析提高社区划分的精确度。文中对Louvain算法和其模块性的修改使用,保证了该方法能够处理大规模网络数据,同时又能保证社区挖掘的效率。实验证明,该方法能够高效地挖掘微博网络社区结构,对学术研究和商业应用都有十分重要的意义。  相似文献   

4.
针对基于结构近似度的聚类算法无法解决非对称网络聚类的问题,该文根据社交网络的特点,提出了基于结构近似度的有向社交网络聚类算法,通过将社交网络抽象为图结构,将网络聚类问题看成图论中的子图划分问题,实现了对社交网络的准确聚类分簇,且分簇复杂度较低。使用C++语言编程实现该算法,通过自定义有向网络数据集和标准数据集的测试表明,该算法对社交网络结构的划分较为准确,且能鉴别离群节点和枢纽节点。  相似文献   

5.
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性.  相似文献   

6.
宋传超  王庚 《山东科学》2013,26(2):92-97
本文将位置敏感哈希算法(LSH)应用于图聚类,提出了概率化的图聚类法(PGC)。利用LSH技术比较图中各结点邻居集的相似度,并结合贝叶斯统计推断进行验证,在线性时间内找到图中最紧密的、非精确聚类。测试结果表明,随着图尺寸的增大PGC扩展性更强,在现实世界数据集上PGC比PageRank Cluster 聚类速度快约1倍,是一种有效的解决方案。  相似文献   

7.
针对传统中心性指标方法忽略节点所在的环结构对网络分解的影响以及基于去环策略方法在去除环结构过程中删除大量非关键节点的问题,提出了基于邻居节点融合的社交网络分解方法。该方法利用邻居节点的融合策略降低了环结构对网络分解的影响,有效减少了非关键节点的删除,同时利用节点放回机制进一步压缩了非关键节点的删除数量。实验结果表明,本文方法能够更加准确地选取网络分解中的关键节点,删除较少的关键节点就能使网络充分分解,并且在不同结构的网络中表现稳定,适应性强。  相似文献   

8.
区域变电站具有数目众多、类型多样、线损构成及节电特性复杂的特点。为提升区域变电站节电研究效率,实现区域变电站节电特性的科学划分,文中提出了一种基于模糊c-均值聚类(FCM)的变电站节电划分的方法.首先,设计一套变电站节电划分综合指标体系,包括涵盖变电站主变容量、主变台数等基本参数的基本属性指标子体系和涵盖输送电量、站用电量等电气参数的电气属性指标子体系;其次,依据各指标对变电站的损耗及其节电特性的影响程度,应用层次分析法(AHP)确定各指标权重,建立AHP-FCM的变电站节电划分模型;然后,分别应用所设计的节电划分综合指标体系、基本属性指标子体系和电气属性指标子体系从3个不同的角度运用AHP-FCM实现区域变电站的划分,通过对3种节电划分结果及其聚类中心矩阵分析研究,获得对各类变电站损耗及其综合节电特性的深入认识,为变电站后续的研究提供参考依据和重要指导;最后,以某区域90个变电站的实际数据进行实例分析,验证了所提方法的实用性和有效性.  相似文献   

9.
在实际生产过程中,过程数据的多模态特性会对数据建模产生一定的影响,进行模态划分有利于获取精确的模型。目前常用的模态划分方法,如k-means、c-means等聚类方法,在有过渡过程的模态划分应用中,有时不能得到理想的结果。本文提出了一种通用的模态划分方法,以谱聚类算法中相似矩阵的特征向量分析为基础,基于相似矩阵的特征向量与其所包含的聚类信息的关系,使用高斯曼哈顿距离构造模态标签,并用小窗口思想实现动态多模态过程的模态划分。通过对稳态与带过渡过程的多模态数据的实验验证了该算法的有效性。  相似文献   

10.
针对现有数据融合方法存在融合精度低、数据完整性差等问题,提出基于云计算的社交网络安全隐私数据融合方法;首先利用敏感信息过滤模型进行社交网络参与者个人隐私数据过滤,然后通过k匿名技术对过滤出的隐私数据进行保护处理,利用k均值聚类算法对个人隐私数据进行聚类,最后使用决策树构建数据融合模型,实现数据融合.仿真测试结果表明:与...  相似文献   

11.
路段变长划分的动态聚类方法   总被引:1,自引:0,他引:1  
路段的合理划分是开展路面养护和管理的基本前提。文章对通常的定长为1km的做法进行了分析,指出不足,进而引进了动态聚类方法,阐述了其应用思路,建立了路段变长划分法。最后,论述了该法的意义,还进行了实例验证。  相似文献   

12.
13.
针对社交网络隐私保护如何减少信息损失,实现数据可用性的问题,提出一种个性化等差数列聚类匿名分配算法(PAS-CAA)。首先对选取的初始节点进行优化,基于综合相似度进行聚类,使每个超点至少包含k个节点;区分非敏感超点集和敏感超点集,对敏感超点集采用递减等差数列进行聚类,灵活地调节保护力度,对非敏感超点集实现基本的k保护力度;最后对超点进行匿名化处理。仿真实验结果表明算法在保护社交网络用户隐私的同时可以减少信息的损失,保留统计属性,实现了社交网络的个性化隐私保护。  相似文献   

14.
从划分聚类要求的时间和空间上看,传统的串行算法已很难适应海量的数据,有必要研发高性能、可扩展的并行算法来解决这一问题,基于一些主要的并行划分聚类算法所存在的问题,提出了在机群系统上采取数据并行策略设计的并行划分聚类算法思想。  相似文献   

15.
针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果.  相似文献   

16.
针对目前协同过滤方法存在的数据稀疏性、冷启动以及未能有效利用用户社交网络信息提高推荐质量等问题,提出一种融合用户社交网络信息的协同过滤方法,该方法以矩阵分解推荐模型为核心,可综合集成目标用户个人偏好以及社交网络中的关系用户偏好特征信息做出推荐.通过设计相应的推荐方法,并基于梯度下降法对用户以及商品特征矩阵的求解进行了优化运算.相关实验结果表明融合社交网络信息可在一定程度上提高协同过滤的推荐准确度以及缓解数据稀疏性、冷启动问题.  相似文献   

17.
聚类集成是聚类分析中的一个重要技术手段,能有效地提高聚类结果的准确性、鲁棒性和稳定性。利用现有的聚类准则提出了一个新的评价指标,用于基聚类结果的有效性评估,并把评估值作为基聚类结果的权重来进行加权聚类集成。在UCI真实数据集上对提出的基于聚类准则融合的加权聚类集成算法进行了测试,实验表明新提出的算法比已有的集成聚类算法具有更高的准确率和回收率,可以得到更好的集成聚类结果。  相似文献   

18.
现有基于用户信誉的反垃圾邮件系统存在诸如发送方标识容易被篡改等缺点,使得恶意用户可以通过特定行为逃避信誉系统的管制。针对这一现象,提出了一种基于IP地址聚类的反垃圾邮件信誉系统(RepuRank)。该系统根据电子邮件的源IP地址进行聚类,并对这些类进行信誉评价,然后利用得到的信誉值来判断新收到的电子邮件是否为垃圾邮件。实验采用了公认的反垃圾邮件指标对RepuRank的性能进行评估,结果表明RepuRank不仅能有效地区分正常邮件与垃圾邮件,还能防止恶意用户使用特定行为逃避信誉系统管制的问题。  相似文献   

19.
当前国内经济快速发展的同时带来了环境质量下降等问题,地区间发展落脚点不同,受到的大气污染程度不同。从主要的大气污染监控物PM2.5、PM10、一氧化碳、二氧化碳、臭氧和二氧化硫6个方面构建大气污染地区分类的聚类评价指标体系,建立地区分类的聚类分析模型。并以北京、上海、海口、西安、佛山、酒泉、拉萨和重庆8个城市为例,应用评价指标的数据进行聚类分析,根据聚类结果提出具有针对性的环境保护建议.  相似文献   

20.
基于C均值聚类算法的交通时段划分方法研究   总被引:1,自引:0,他引:1  
根据小时交通量实现交通时段的划分不能满足交通需求,对以分钟为单位的车辆数变化特性进行研究成为当务之急。首先确定了合理的数据分析周期为5~10m in。根据C均值聚类算法能根据数据的相似性度量将数据集划分成一定数目的子集,设计了基于C均值聚类算法的交通时段划分法。利用实际数据验证了方法是准确可靠的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号