首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
聚类是数据挖掘和机器学习领域的重要研究内容,一般会先基于数据样本构建相似图,再基于相似图将样本划分到相应的类中。但是真实的数据经常被损坏,导致学习的相似图不准确,从而直接影响聚类结果。为解决这些问题,提出一种面向鲁棒聚类的自适应图调节和低秩矩阵分解的方法,该方法的核心思想是:将原始数据X分解为纯净数据D和噪声数据S,再基于纯净数据构造拉普拉斯矩阵并进行自适应图调节。随后,给出一个联合学习框架,将数据分离、自适应图正则、噪声消除和低秩矩阵分解集成到一个目标函数中。利用增广拉格朗日乘子法分别更新变量。最后,在理论上证明算法的收敛性并进行实验。实验结果表明所提出的方法与现有一些方法相比有一定优越性。  相似文献   

2.
针对目前大规模真实数据聚类中存在的效率低和鲁棒性差的问题,提出了一种基于相关熵的快速聚类算法(FCC)。该算法主要分为以下两步:首先对原始数据进行k均值操作,得到粗略的样本类别,作为第二步的标签矩阵;其次利用原始数据与其锚点构建的锚点图对应的拉普拉斯矩阵作为图约束来探寻数据间的内在结构,从而得到样本的最终类别。整个聚类过程在相关熵准则而不是传统的欧氏距离框架下进行,可有效抑制真实数据中大量存在的非线性和非高斯分布的噪声对聚类鲁棒性的影响。为了验证提出算法的性能,使用5种典型的算法作为对比算法与提出的算法一起在4个大规模真实数据集上运行,结果表明,提出的算法可在大部分情况下提高聚类精度,在WebKB、TDT2和Cora数据集上分别提高8.58%,6.86%和1.86%,同时提高聚类效率几倍甚至几十倍;为了验证本算法的鲁棒性,分别加入不同程度的随机噪声和泊松噪声到WebKB和Cora上,得到8个含噪数据集,所有算法均在相同条件下运行于这些噪声数据集上,结果表明,相对于其他对比算法,提出的算法能够保持最优的聚类鲁棒性。  相似文献   

3.
使用稀疏编码解决计算机视觉问题可以取得良好的效果.然而,以往的稀疏编码都是在原始特征空间进行.受核方法可以获得特征的高维非线性映射的启发,扩展了拉普拉斯稀疏编码(LSc),提出了核拉普拉斯稀疏编码(KLSc),它可以降低特征量化误差,增强稀疏编码的性能.在3个标准数据集上的实验结果表明,所提出的基于KLSc的图像分类算法具有良好的分类效果,分类正确率优于LSc.  相似文献   

4.
在现有的稀疏子空间聚类算法基础上提出了一个改进的稀疏子空间聚类算法。首先,利用高维数据可以通过同一子空间的低维数据稀疏地表示这一理论,建立一个稀疏最优化模型,获得稀疏矩阵。然后把稀疏矩阵应用到一个正则化谱聚类算法中,从而有效地把数据聚类到子空间中。最后,该算法应用到一个视频序列中,对每个视频帧里的运动物体进行识别,并与现有的子空间聚类算法相比较。实验结果表明,该算法能够有效地识别运动物体,具有良好的实时性和有效性。  相似文献   

5.
为了构建能反映高维数据本质结构的高质量图,提出了一种新颖的降维方法———基于自适应图的降维方法( DRAG: Dimensionality Reduction based on Adaptive Graphs) 。与其他传统的基于图的降维方法相比,提出的DRAG 避免了传统k 近邻或ε 球准则构图策略中的参数选择问题,考虑了数据的局部信息和噪声,能自适应地构建稀疏的最优图结构,并将其结合在经典的LPP( Locality Preserving Projection) 模型中,学习能有效刻画高维数据本征结构的投影矩阵,从而实现降维的目的。为了评估算法的有效性和可行性,在4 个标准的图像数据库( CMU PIE,Extended YaleB,ORL 和COIL 20) 分别进行了分类与聚类实验,实验结果表明,所提出的方法在分类识别率和聚类准确率上都优于其他对比方法。  相似文献   

6.
提出一种用拉普拉斯图的谱系数夹角谱特征来描述图像几何结构的方法,同时研究了基于图的谱聚类系统.首先将序列图像以角点的形式构成拉普拉斯矩阵;然后分解该矩阵,结合特征值和其特征向量计算图中各点的谱系数夹角谱特征;再以局部保持投影方法将这些向量内嵌到模式空间,并在其特征空间用模糊c-均值算法进行聚类分析.结果表明,以拉普拉斯图的谱系数夹角谱特征解决了图中各点在向量空间的分布及其对应关系,在模式空间进行的聚类分析是有效的.  相似文献   

7.
提出了一种结合数据挖掘方法——聚类分析提取图像边缘的算法.该算法先用拉普拉斯算子给出图像各像素的二阶导数,然后根据一组预先给定的闲值,将图像中的像素分类,每一个像素仅属于一类.在这些类中进行某种准则的凝聚层次聚类.完成聚类后,就得到了图像的边界.比较而言,该算法有效地避开了由噪声信号引起的大量孤立点,更清楚地输出图像边界.在一定程度上,该算法弥补了拉普拉斯算子的不足(孤立点比较多),发扬了拉普拉斯算子的长处(边界完整程度比较高).  相似文献   

8.
基于传统字典学习的近似消息传递(approximate message passing, AMP)算法对训练样本数量的需求较高,且运算成本较高。本文引入双稀疏模型,构建基于稀疏字典学习的AMP框架,降低迭代过程中字典学习对训练样本数量的需求,提高压缩感知图像重建的质量与效率。进一步,提出基于聚类与稀疏字典学习的AMP算法,在迭代过程中依据图像块特征进行分类,并为各类图像块分别学习稀疏字典,实现自适应去噪。与基于传统字典学习的AMP算法相比,基于聚类与稀疏字典学习的AMP算法能够将重建图像的峰值信噪比提高0.20~1.75 dB,并且能够将运算效率平均提高89%。  相似文献   

9.
谱聚类是一种无监督学习方法,在许多环境中都能高效地进行应用,且易于实现,已经成为非常流行的聚类算法之一.然而谱聚类仍面临两个主要的问题:(1)如果数据量过大,在对拉普拉斯矩阵进行特征分解时,需要大量的计算;(2)k-means在面对大量数据时也会有计算时间过长的缺陷.为了克服这两个缺陷,文章提出了一种基于图滤波的快速谱...  相似文献   

10.
针对密度聚类算法对邻域参数设置敏感的问题,提出一种基于密度的模糊自适应聚类算法.算法在无需预先设置聚类数以及邻域参数的情况下,可以自适应地根据样本间距离关系确定邻域半径得到样本密度,并根据样本密度逐渐增加聚类中心.为了保障聚类结果的正确性,同时提出一种新的模糊聚类有效性指标以判断最佳聚类数,消除了密度聚类算法对参数的敏感性.用UCI基准数据集进行实验,发现本文算法在对数据进行聚类时,聚类质量较原始密度聚类算法在准确性和自适应性方面均有显著提高.  相似文献   

11.
针对现有中国邮递员问题求解方法在大规模稀疏路网图上求解效率的瓶颈,提出一种在可接受时间范围内求得可行解的基于蚁群优化的快速求解方法.该方法针对Euler回路求解的奇偶点图上作业法的第二阶段,采用蚁群算法进行求解,同时根据大规模稀疏路网图的特性基于密度峰值聚类算法对方法进行改进:首先在蚁群算法求解前对大规模稀疏路网图进行聚类分割;其次根据邻近节点覆盖率对分割后的节点群进行合并;最后通过改变部分节点所属聚类使各节点群内部节点个数均为偶数.实验结果表明:在奇偶点图上作业法所能支持的节点规模下,该方法可求得与确定性算法相同的最优解,并在运算时间上达到约10倍的效率优化;且该方法在大规模稀疏路网图下可有效提高计算效率,并在可控时间范围内得到优化的可行解,针对5 000个节点规模的路网图最快可在60 s内完成求解.  相似文献   

12.
针对目前的图聚类分析方法存在的不足,在分析研究MapReduce架构理论、最小哈希算法以及图聚类分析中的数据抽样和稀疏化处理机制的基础上,提出了一种基于并行计算的高效的图稀疏化处理算法。该方法以MapReduce架构理论为基础,通过Minhash算法进行并行化分析,利用MapReduce框架结构对图聚类分析稀疏化操作过程中的多个任务进行了高效的推算分析与处理,并在Hadoop计算环境下,通过模拟实验对提出的高效图稀疏化处理算法的性能进行了测试。测试结果表明:基于并行计算的高效图稀疏化处理算法可行,能对图聚类数据信息进行快速稀疏化处理。  相似文献   

13.
谱聚类是一种基于图谱划分理论的聚类算法,本质上是将聚类问题转化为图的最优划分问题;量子聚类可以充分挖掘数据样本的内在信息,是一种基于划分的无监督聚类算法.为了充分发挥谱聚类算法和量子聚类算法的优势,本文提出了一种基于流形距离核的谱聚类和量子聚类融合算法(MFD-NJW-QC).首先,计算数据集的流形距离核矩阵,构造相应的拉普拉斯矩阵;其次,根据拉普拉斯矩阵的若干最大特征值对应的特征向量构造新数据集,并使用量子聚类算法对新构造的数据集进行聚类,从而得到原始数据的类标签;最后,基于7个人工数据集和5个UCI数据集验证MFD-NJW-QC算法的聚类性能.结果显示,MFD-NJW-QC算法能够明显提高聚类性能,尤其对于具有流形结构,且类簇大小不平衡、密度分布不均匀的数据集优势更为突出.  相似文献   

14.
目前的高属性维稀疏数据算法大多面向二态数据,而且没有聚类结果的评价方法,给应用带来很大局限。针对这些问题,给出一种基于信息粒度的高属性维聚类算法。首先通过设计面向数据稀疏特征的半模糊聚类算法对数据进行离散化,并基于此给出稀疏相似度和初始等价关系的定义,然后设计可变精度的二次聚类模型对初始聚类结果进行修正,使算法具有较强抗噪声能力,最后结合应用领域定义一种新的聚类质量的评价模型。实验证明,算法具有更广应用性,可提供多粒度分析结果,准确度更高,得到的聚类结果能真实反映数据的特征。  相似文献   

15.
基于图正则化非负矩阵分解算法(GNMF),提出一种基于凸光滑的L3/2范数正则化图非负矩阵分解算法.该算法用非负矩阵分解算法对数据进行低维非负分解时,根据流形学习的图框架理论,构建邻接矩阵保持数据局部几何结构,并对数据的低维表示特征进行凸光滑的L3/2范数稀疏性约束,在给出算法更新迭代规则的同时,从理论上证明了所给算法的收敛性.通过人脸数据库ORL、手写体数据库USPS和图像库COIL20的仿真实验表明,相对于非负矩阵分解算法及其基于稀疏表示的改进算法,所给算法均具有更高的聚类精度.  相似文献   

16.
提出了一种基于非负稀疏表示(nonnegative sparse representation,NSR)的半监督学习标签传播算法.该算法首先构造一个稀疏概率图(sparse probability graph,SPG),其权重由非负稀疏表示算法计算的非负系数组成,自然地反映了各样本之间的聚类关系,避免了传统半监督学习算法中的邻居选择和参数设置过程;然后通过对未标记样本的标签进行迭代繁殖至收敛而获得所有样本的标签.在人脸识别、物体识别、UCI机器学习和TDT文本数据集上的实验结果表明采用非负稀疏表示的标签传播算法比典型的标签繁殖算法具有更好的分类准确率.  相似文献   

17.
协同过滤算法被广泛运用于各类大数据的推荐系统中,能够向用户推荐与该用户类似的用户感兴趣的信息。随着深度学习,尤其是图神经网络的发展,基于图神经网络的协同过滤算法受到了越来越多的关注。基于图结构的协同过滤模型通常将用户与条目的交互信息建模为二部图,然后利用二部图的高阶连通性建模捕获用户与条目之间的隐藏关系。但是,这种二部图模型没有将用户之间的相似关系和条目之间的相似关系明确建模。此外,二部图的稀疏性会产生图中高阶连通性依赖问题。为此,该文提出了一种基于异质图卷积神经网络的协同过滤模型,将用户之间的相似度和条目之间的相似度显式地编码到图结构中,使得用户与条目的交互关系被建模成异质图。异质图结构使用户之间的相似度与条目之间的相似度能被直接捕获,降低了对高阶连通性的依赖,同时缓解了二部图过于稀疏的问题。该文在4个典型的数据集上进行了实验,并与4种经典模型进行了对比,结果表明所提出的模型效果较好。  相似文献   

18.
针对毫米波雷达数据均匀性差,数据量小,噪点多等问题,提出一种基于DBSCAN (density-based spatial clustering of applications with noise)的雷达自适应聚类算法.改进算法能够根据K近邻距离和目标反射截面自适应调整聚类半径.首先给出一种聚类半径根据K近邻距离动态调整的机制:目标第K个近邻的距离与阈值相比较,以确定阈值半径取值.再提取雷达提供的目标反射截面,基于该值计算目标假象半径作为聚类半径的补充量.实现根据目标反射截面与数据稀疏程度自适应聚类的效果.将改进算法与不同参数的DBSCAN聚类算法在真实雷达点云数据进行实验对比.相较于选取合适参数的DBSCAN算法,改进算法能够更好适应毫米波雷达点云特征,对行人目标识别准确率提高4.18%,对车辆目标识别准确率提高5.63%.  相似文献   

19.
提出了一种基于隐空间的低秩稀疏子空间聚类算法,在聚类的过程中可以对高维数据进行降维,同时在低维空间中利用稀疏表示和低秩表示对数据进行聚类,大大降低了算法的时间复杂度.在运动分割和人脸聚类问题上的实验证明了算法的有效性.  相似文献   

20.
【目的】如何构造一个有效的数据图,是半监督学习领域中一个重要的研究方向,为了更好地研究数据样本之间的结构关系,提高基于图的半监督学习算法性能。【方法】利用数据的稀疏表示,构造数据样本的非对称图,并在标准数据集上进行半监督学习实验。【结果】在半监督学习框架中建立了异类数据和同类数据之间距离、内部结构和数据的稀疏表示关系,构造了非对称稀疏的数据图。【结论】通过在标准数据集上进行实验说明非对称稀疏图可以利用半监督学习数据特点,有效地对数据样本进行分类。
  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号