共查询到20条相似文献,搜索用时 15 毫秒
1.
针对图谱划分方法在划分社区结构不是很明显的网络时,不能得到好的划分效果,该文提出了基于边聚类系数的谱聚类社区划分方法.由于社区内部节点之间的连接比各个社区间节点的连接稠密,边聚类系数的大小反映了节点的聚集程度,因而通过网络中的边所构三角形的数量定义了聚类系数矩阵,矩阵中的元素即处于网络中的边实际构成三角形的数量.在增益函数最大化的过程中,使用了矩阵的特征值和特征向量,以此来进行社区划分.通过在真实网络数据中进行实验,结果表明该算法可行. 相似文献
2.
聚类方法的核心是如何度量事物间的邻近性。介绍了邮件特征的向量表示形式、构建了邮件特征矩阵,并使用变形后的极值分布函数模型拟合了邮件间通信特征信息;在此基础上提出了一个新的邻近性度量方法(ex-treme value distribution similarity,EVS),用以指导邮件社区划分;使用微聚类-宏聚类邮件社区划分算法验证了该方法的有效性。实验表明,在测试数据集上,相比余弦、PCC等经典的邻近性度量方法,以EVS作为划分依据的邮件社区划分算法能够更加有效地发现高质量的邮件社区。 相似文献
3.
现有的微博社交网络社区挖掘方法多是基于网络结构进行,忽略了节点本身行为的重要性,并且不能同时实现对大规模复杂网络结构适应性和社区挖掘的高效性。为缓解上述问题,提出了一种基于网络距离和内容相似度的微博社交网络社区划分方法,该方法在考虑微博社交网络结构的同时兼顾了网络中节点的历史微博内容,通过对历史微博数据的分析提高社区划分的精确度。文中对Louvain算法和其模块性的修改使用,保证了该方法能够处理大规模网络数据,同时又能保证社区挖掘的效率。实验证明,该方法能够高效地挖掘微博网络社区结构,对学术研究和商业应用都有十分重要的意义。 相似文献
4.
目的 社交推荐是在传统推荐的基础上引入用户的社交信息以更好地生成推荐结果。 由于社交推荐不仅涉及用户本身的信息,还涉及用户的社交关系信息,因此对用户的隐私保护变得更加重要。 然而,目前的社交推荐方法大多只注重提高推荐准确性,而忽视了对用户个人信息隐私保护的问题。 因此针对社交推荐中用户的评分数据和社交关系数据的隐私保护问题,提出了一种基于社区划分的社交推荐隐私保护方法( SRCD) 。 方法 首先,考虑评分值的分布范围对用户相似度的影响,并结合用户之间的社交关系,来给社交网络中的用户划分社区,并计算每个社区中用户对所看过项目的评分的均值;然后,根据社区划分的结果,寻找与目标用户所在社区相似的其他社区。 从而可以构造出一个社区-项目评分均值矩阵。 并且针对实际场景中评分均值矩阵稀疏的情况,采用了中位数填补矩阵的缺失元素。 最后,用矩阵分解的结果来预测用户对项目的评分,从而评估算法的性能。 结果 通过仿真实验验证,所提方法相比于现有的社交推荐算法不仅在隐私保护方面提供了保障,而且在推荐准确度方面具有相近的预测准确率。 结论 提出的方法不仅在一定程度上保护了用户的隐私信息,还为用户提供了令人满意的推荐结果。 相似文献
5.
《天津理工大学学报》2017,(2):48-52
如何提高大数据环境下推荐系统的推荐效率是一个值得关注的课题.本文提出了一种基于用户社交网络的最短距离聚类算法.该算法在推荐之前预先对用户进行聚类,降低邻域搜索空间,提高推荐效率.本聚类算法将用户分为分簇用户和离群簇用户两大类,推荐时以簇为单位输入.离群簇用户可实现对社交网络的简单扩展.最后通过对真实社交网络的模拟,证明了算法的可行性与有效性. 相似文献
6.
针对基于结构近似度的聚类算法无法解决非对称网络聚类的问题,该文根据社交网络的特点,提出了基于结构近似度的有向社交网络聚类算法,通过将社交网络抽象为图结构,将网络聚类问题看成图论中的子图划分问题,实现了对社交网络的准确聚类分簇,且分簇复杂度较低。使用C++语言编程实现该算法,通过自定义有向网络数据集和标准数据集的测试表明,该算法对社交网络结构的划分较为准确,且能鉴别离群节点和枢纽节点。 相似文献
7.
本文将位置敏感哈希算法(LSH)应用于图聚类,提出了概率化的图聚类法(PGC)。利用LSH技术比较图中各结点邻居集的相似度,并结合贝叶斯统计推断进行验证,在线性时间内找到图中最紧密的、非精确聚类。测试结果表明,随着图尺寸的增大PGC扩展性更强,在现实世界数据集上PGC比PageRank Cluster 聚类速度快约1倍,是一种有效的解决方案。 相似文献
8.
针对传统中心性指标方法忽略节点所在的环结构对网络分解的影响以及基于去环策略方法在去除环结构过程中删除大量非关键节点的问题,提出了基于邻居节点融合的社交网络分解方法.该方法利用邻居节点的融合策略降低了环结构对网络分解的影响,有效减少了非关键节点的删除,同时利用节点放回机制进一步压缩了非关键节点的删除数量.实验结果表明,本... 相似文献
9.
《华东理工大学学报(自然科学版)》2017,(5)
在实际生产过程中,过程数据的多模态特性会对数据建模产生一定的影响,进行模态划分有利于获取精确的模型。目前常用的模态划分方法,如k-means、c-means等聚类方法,在有过渡过程的模态划分应用中,有时不能得到理想的结果。本文提出了一种通用的模态划分方法,以谱聚类算法中相似矩阵的特征向量分析为基础,基于相似矩阵的特征向量与其所包含的聚类信息的关系,使用高斯曼哈顿距离构造模态标签,并用小窗口思想实现动态多模态过程的模态划分。通过对稳态与带过渡过程的多模态数据的实验验证了该算法的有效性。 相似文献
10.
区域变电站具有数目众多、类型多样、线损构成及节电特性复杂的特点。为提升区域变电站节电研究效率,实现区域变电站节电特性的科学划分,文中提出了一种基于模糊c-均值聚类( FCM) 的变电站节电划分的方法. 首先,设计一套变电站节电划分综合指标体系,包括涵盖变电站主变容量、主变台数等基本参数的基本属性指标子体系和涵盖输送电量、站用电量等电气参数的电气属性指标子体系; 其次,依据各指标对变电站的损耗及其节电特性的影响程度,应用层次分析法( AHP) 确定各指标权重,建立AHP-FCM 的变电站节电划分模型; 然后,分别应用所设计的节电划分综合指标体系、基本属性指标子体系和电气属性指标子体系从3 个不同的角度运用AHP-FCM 实现区域变电站的划分,通过对3 种节电划分结果及其聚类中心矩阵分析研究,获得对各类变电站损耗及其综合节电特性的深入认识,为变电站后续的研究提供参考依据和重要指导; 最后,以某区域90 个变电站的实际数据进行实例分析,验证了所提方法的实用性和有效性. 相似文献
11.
傅江辉 《济南大学学报(自然科学版)》2021,35(1):29-33
针对现有数据融合方法存在融合精度低、数据完整性差等问题,提出基于云计算的社交网络安全隐私数据融合方法;首先利用敏感信息过滤模型进行社交网络参与者个人隐私数据过滤,然后通过k匿名技术对过滤出的隐私数据进行保护处理,利用k均值聚类算法对个人隐私数据进行聚类,最后使用决策树构建数据融合模型,实现数据融合.仿真测试结果表明:与... 相似文献
12.
13.
14.
针对社交网络隐私保护如何减少信息损失,实现数据可用性的问题,提出一种个性化等差数列聚类匿名分配算法(PAS-CAA)。首先对选取的初始节点进行优化,基于综合相似度进行聚类,使每个超点至少包含k个节点;区分非敏感超点集和敏感超点集,对敏感超点集采用递减等差数列进行聚类,灵活地调节保护力度,对非敏感超点集实现基本的k保护力度;最后对超点进行匿名化处理。仿真实验结果表明算法在保护社交网络用户隐私的同时可以减少信息的损失,保留统计属性,实现了社交网络的个性化隐私保护。 相似文献
15.
针对往往不能提前预知社区个数的情况,提出了基于相似度聚类的二分网络社区发现算法(similarity clustering algorithm,简称SCA).算法通过计算U类节点之间的相似度获得核心节点,同时选取核心节点邻域中的节点扩展得到社区,将未划分到社区中的孤立点和只包含一个节点的社区分别放入与之联系最紧密的社区中,最后V类节点划分到已有的社区中得到完整的社区划分结果.通过在人工数据集与真实网络上的分析,分别利用归一化互信息和模块度作为评价指标,实验结果表明,SCA比BRIM等算法能够更有效挖掘二分网络社区结构,具有比较良好的社区划分效果. 相似文献
16.
针对目前协同过滤方法存在的数据稀疏性、冷启动以及未能有效利用用户社交网络信息提高推荐质量等问题,提出一种融合用户社交网络信息的协同过滤方法,该方法以矩阵分解推荐模型为核心,可综合集成目标用户个人偏好以及社交网络中的关系用户偏好特征信息做出推荐.通过设计相应的推荐方法,并基于梯度下降法对用户以及商品特征矩阵的求解进行了优化运算.相关实验结果表明融合社交网络信息可在一定程度上提高协同过滤的推荐准确度以及缓解数据稀疏性、冷启动问题. 相似文献
17.
从划分聚类要求的时间和空间上看,传统的串行算法已很难适应海量的数据,有必要研发高性能、可扩展的并行算法来解决这一问题,基于一些主要的并行划分聚类算法所存在的问题,提出了在机群系统上采取数据并行策略设计的并行划分聚类算法思想。 相似文献
18.
《清华大学学报(自然科学版)》2010,(10)
现有基于用户信誉的反垃圾邮件系统存在诸如发送方标识容易被篡改等缺点,使得恶意用户可以通过特定行为逃避信誉系统的管制。针对这一现象,提出了一种基于IP地址聚类的反垃圾邮件信誉系统(RepuRank)。该系统根据电子邮件的源IP地址进行聚类,并对这些类进行信誉评价,然后利用得到的信誉值来判断新收到的电子邮件是否为垃圾邮件。实验采用了公认的反垃圾邮件指标对RepuRank的性能进行评估,结果表明RepuRank不仅能有效地区分正常邮件与垃圾邮件,还能防止恶意用户使用特定行为逃避信誉系统管制的问题。 相似文献
19.
聚类集成是聚类分析中的一个重要技术手段,能有效地提高聚类结果的准确性、鲁棒性和稳定性。利用现有的聚类准则提出了一个新的评价指标,用于基聚类结果的有效性评估,并把评估值作为基聚类结果的权重来进行加权聚类集成。在UCI真实数据集上对提出的基于聚类准则融合的加权聚类集成算法进行了测试,实验表明新提出的算法比已有的集成聚类算法具有更高的准确率和回收率,可以得到更好的集成聚类结果。 相似文献
20.
协同过滤算法是个性化推荐系统中广泛使用的经典算法。针对传统协同过滤算法存在的相似度计算不准确、可扩展性差等问题,设计了一种融合隐性社交网络社团划分和协同过滤的推荐算法ICDCF。该方法将用户对项目的共同兴趣视为社交关系。首先用考虑了用户隐性关系的改进的Jaccard相似系数衡量用户间的社交关系强弱,以用户为顶点、以用户相似度为连边的权值,构建无向加权的隐性社交网络;然后基于隐性社交网络,用谱聚类思想对用户进行社团划分;最后在社团内实施基于用户的协同过滤推荐。该方法可以避免协同过滤推荐阶段因共同评分项目少而导致的相似度计算不准确问题,同时可以减少搜索近邻的计算量,提高时间效率。在数据集MovieLens-100K和FilmTrust上的实验结果体现了ICDCF算法在推荐准确性和可扩展性方面的优势。 相似文献