共查询到20条相似文献,搜索用时 0 毫秒
1.
针对深度嵌入聚类方法仅考虑类内关系及多视图聚类存在特征表示不足等问题,提出一种基于类间损失和多视图特征融合的深度嵌入聚类方法,该方法在深度嵌入聚类的损失函数中引进一个新的正则项提高类判别性.先通过自动编码器提取多视图数据的特征表示,对不同视图的特征表示进行融合得到公共表示,基于此得到数据的软分配分布和辅助目标分布;再对公共表示和聚类分配进行联合优化得到最终的聚类结果.在多视图数据集上的实验结果表明,该方法能有效提高聚类性能. 相似文献
2.
3.
谱聚类是一种无监督学习方法,在许多环境中都能高效地进行应用,且易于实现,已经成为非常流行的聚类算法之一.然而谱聚类仍面临两个主要的问题:(1)如果数据量过大,在对拉普拉斯矩阵进行特征分解时,需要大量的计算;(2)k-means在面对大量数据时也会有计算时间过长的缺陷.为了克服这两个缺陷,文章提出了一种基于图滤波的快速谱... 相似文献
4.
文档聚类和词聚类都是重要且被充分研究的问题.大多数现有的聚类算法针对文档和词是分别聚类,不是同时的.本文提出文档集作为文档和词间的一个二部图的模型思想,使用这个思想,联合聚类问题可以被看成二部图的分割问题.为了解决图的分割问题,使用一个新的联合谱聚类算法,即使用适度规模的词-文档矩阵的奇异向量产生好的分割结果.谱算法得到一些最佳的性能,表明奇异向量通过连续放松解决图划分的NP难问题.最后通过实验结果验证联合聚类算法在实践中非常有效. 相似文献
5.
6.
当前大部分的聚类算法都难以处理任意形状和大小、存在孤立点和噪音以及密度多变的簇,为此,文中提出了一种基于连通图动态分裂的聚类算法.首先构造数据集的l-连通图,然后采用动态分裂策略对l-连通图进行分割,把数据集分成多个互不相连的连通图子集,每个连通图子集为一类.实验结果表明,所提出的算法能够有效地解决任意形状和大小、存在孤立点和噪音以及密度多变的簇的聚类问题,具有广泛的适用性. 相似文献
7.
基于图分割的蚁群聚类算法 总被引:2,自引:0,他引:2
提出了采用两种策略更新信息素来控制蚂蚁行进路径的方法.根据信息素的浓度确定图边的权值,运用了图分割算法断裂所得图的边,从而达到对数据进行聚类的目的.实验结果证明算法是有效的. 相似文献
8.
提出一种新颖的多视图子空间聚类算法,不再对包含各种噪声以及冗余信息的原始数据进行特征融合,而是通过对不同视图的低维子空间表示进行融合,得到一个公共的低维子空间表示.将这个子空间表示作为相似度矩阵进行谱聚类,以得到更优的聚类效果.在3个广泛使用的多视图基准数据集上进行了实验,实验结果证明了所提出算法的有效性. 相似文献
9.
聚类是机器学习和数据挖掘中的重要课题。近年来,深度神经网络(Deep Neural Networks,DNN)在各种聚类任务中受到广泛关注。特别是半监督聚类,在大量无监督数据中仅引入少量先验信息即可显著提高聚类性能。然而,这些聚类方法忽略了定义的聚类损失可能破坏特征空间,从而导致非代表性的无意义特征。针对现有半监督深度聚类的特征学习过程中局部结构保持有所欠缺的问题,本文提出一种改进的半监督深度嵌入聚类(Improved Semi-supervised Deep Embedded Clustering,ISDEC)算法,采用欠完备自动编码器在特征表达学习的同时,保持数据的内在局部结构;通过综合聚类损失、成对约束损失和重构损失,对聚类标签分配和特征表达进行联合优化。在包括基因数据在内的若干高维数据集上的实验结果表明,本方法的聚类性能比现有方法更好。 相似文献
10.
为实现同时利用属性信息和结构信息完成更精确的协同聚类, 提出一种基于属性异构信息网络的半监督协同聚类框架(SCCAIN). 首先, 设计一种可学习的整体关联度量, 其通过元路径和属性投影整合结构关联和属性关联; 其次, 将约束负矩阵三因式分解引入到具有约束的协同聚类节点中, 将相关性度量和协同聚类相结合, 以协同聚类结果作为共享因子, 并提出一个统一的半监督学习框架, 以联合优化协同聚类和相关性测量给定的约束; 最后, 在不同的数据集上进行仿真实验, 实验结果表明, 该方法聚类效果较好, 从而验证了属性信息和结构信息对能提升协同聚类效果. 相似文献
11.
针对传统FCM算法与阈值法两种交通流状态判别方法在适用性上的不足,通过分析交通流数据的分布特征,以各状态数据的离散性变化差异作为参考进行状态的划分,在FCM算法的基础上加入历史先验数据与后验概率进行初始聚类中心的优化,并将传统欧氏距离替换为对多维度数据之间变化关系与空间分布更加敏感的马氏距离进行算法改良,使交通状态判别结果更加接近实际交通运行状况。并使用实验数据进行算法验证,验证了方法的稳定性与结果的有效性,判别结果与数据表现也更加接近。 相似文献
12.
混合属性数据聚类融合算法 总被引:5,自引:0,他引:5
混合属性数据集是现实世界特别是商业金融数据库中最普遍的数据集类型,但适用于这类数据集的聚类算法极少。该文根据聚类融合的方法体系,针对混合属性数据集的特点,提出了基于聚类融合的混合属性特征聚类算法(CEM C),建立了算法框架,列出了算法目标函数和算法主要步骤,并分析了算法复杂度。该算法可以有效处理混合属性海量数据集。用真实数据集验证了算法,并将此算法应用于实际的客户关系管理数据分析中,得到了较好效果。 相似文献
13.
针对视频图像的数量海量性及视频人脸运动性,提出基于距离和密度聚类融合的视频人脸识别方法,该方法同时考虑距离与密度在聚类中的相关性并进行融合处理,设计了聚类人脸识别程序流程,实验中对其聚类算法及视频人脸识别方法分别进行了测试.结果表明,提出的方法识别速度快、准确率高、误检率低,能达到数字视频监控系统对精度的要求,可满足视频监控中实时取证的需要. 相似文献
14.
针对高维数据的聚类过程不够直观、聚类结果也不易解释的问题,本文提出了一种基于改进雷达图的交互式可视化聚类方法。首先对传统雷达图进行了改进,采用熵权法确定数据的主要特征和属性排列,在去掉非主要特征基础上采用以极径表示属性值,以属性权重确定极角的改进雷达图进行数据可视化来突出数据的主要特征;然后采用改进的k-means算法对平面上的点集进行聚类,该改进算法不需事先给定簇的个数,能够依据密度和距离对初始中心进行优化,且在聚类过程中可交互调整参数,并使用不同颜色来区分不同类别,方便观察聚类过程和结果;最后通过仿真实验表明改进的雷达图更能反应数据的分布情况,改进的聚类算法具有更高的效率和聚类准确度。 相似文献
15.
蚁群与遗传算法融合的聚类算法研究 总被引:4,自引:0,他引:4
目的 通过将蚁群与遗传算法融合,以解决蚁群聚类算法参数众多且与问题域相关,搜索容易出现停滞现象等问题.方法 将主要影响蚁群聚类算法性能的5个参数作为遗传算法中的染色体进行编码.首先设计遗传算法的选择、交叉、变异算子,进而将用于聚类结果评价的F-measure函数作为适应度函数,通过多次迭代找出最优的参数组合.结果 在仿真实验中,获得了较好的聚类效果.结论 蚁群与遗传融合的聚类算法较蚁群聚类算法有更大的优势. 相似文献
16.
在地球物理勘探中需要利用测井资料了解地下地质情况,其中测井曲线分层是首先要完成的基础工作。本文利用图论聚类的方法,结合实际数据对测井曲线进行自动分层,并比较了自动分层和人工分层的优越性。 相似文献
17.
谱聚类是一种基于图谱划分理论的聚类算法,本质上是将聚类问题转化为图的最优划分问题;量子聚类可以充分挖掘数据样本的内在信息,是一种基于划分的无监督聚类算法.为了充分发挥谱聚类算法和量子聚类算法的优势,本文提出了一种基于流形距离核的谱聚类和量子聚类融合算法(MFD-NJW-QC).首先,计算数据集的流形距离核矩阵,构造相应的拉普拉斯矩阵;其次,根据拉普拉斯矩阵的若干最大特征值对应的特征向量构造新数据集,并使用量子聚类算法对新构造的数据集进行聚类,从而得到原始数据的类标签;最后,基于7个人工数据集和5个UCI数据集验证MFD-NJW-QC算法的聚类性能.结果显示,MFD-NJW-QC算法能够明显提高聚类性能,尤其对于具有流形结构,且类簇大小不平衡、密度分布不均匀的数据集优势更为突出. 相似文献
18.
基于山峰聚类的聚类上限确定方法 总被引:1,自引:0,他引:1
田彦山 《江西师范大学学报(自然科学版)》2007,31(2):134-137
文章提出了一种基于山峰聚类的聚类上限检测方法,依靠山峰聚类确定聚类数目的上限,仿真试验表明,这种方法能将聚类上限确定在一个合理的范围之内,从而加快聚类的效率. 相似文献
19.
在模糊C-均值聚类(FCM)目标函数的基础上按聚类中心分离原则增加一个聚类中心分离项来扩展FCM算法,提出基于聚类中心分离的模糊聚类模型(FCM_CCS)。该模型可使聚类过程中的聚类中心之间距离扩大,从而得到更好的聚类效果。由于该模型和FCM一样对噪声敏感我们提出它的可能性聚类模型(PCM_CCS),最后进一步扩展成它的可能性模糊聚类模型(PFCM_CCS)。基于聚类中心分离的可能性模糊聚类模型在处理噪声数据和克服一致性聚类问题方面表现出良好的性能。对数据集的测试实验结果表明了提出的PFCM_CCS能同时产生模糊隶属度和典型值,使聚类中心间距扩大,同时具有更好的聚类准确率。 相似文献
20.
陈婵 《杭州师范学院学报(社会科学版)》1990,(6)
本文研究寻找Hamilton的圈的一个方法,证明了如下定理:设G是单图,V(G)={V_1,V_2,…,V_n},则G是Hamilton图的充分必要条件是X_(ki)取1或0时,方程组(*)有解,其中sum from i=1 to n sum from j=1 to n x_(ki)x_(k+1)jV_iV_j=1而x(n+1)j=x_(1j) sum from i=1 to n x_(ki)~2=1 sum from i=1 to n x_(ik)~2=1 而V_iV_i=1 当V_i和V_j邻接时, 0 当V_i和V_j不邻接时。 相似文献