首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
针对基因表达数据噪声大、冗余性较高,传统的NMF算法在基因表达数据聚类中的低效性问题,提出了一种平滑的l_0范数约束的β散度的矩阵分解与K-means相结合的聚类算法,应用到基因表达数据当中;将平滑的l_0范数约束引入到基于β散度的矩阵分解的目标函数中,从而提取有用特征信息用于聚类;最后通过实验比较,改进的算法平均聚类精度达到70%,比传统的NMF聚类算法精度提高了11%,聚类效果相较其他方法显著。  相似文献   

2.
聚类分析是从基因表达谱数据中提取生物医学信息的主要方法之一.针对传统谱聚类算法无法确定聚类个数的问题,提出一种改进的谱聚类算法并将其应用于基因表达谱聚类分析.首先用基因表达谱数据构造Laplacian矩阵,经特征值分解后得到相应的特征值和特征向量,用谱隙来描述相邻特征值的差值;然后通过寻找谱隙序列的最大值来确定聚类个数;最后从单位化的特征向量着手实现数据类别的划分.通过模拟数据与癌症数据的实验,证明了该文算法的有效性.  相似文献   

3.
双聚类作为一种无监督的学习方法,其作用是对基因表达数据进行分析.为了获取较大容量的双聚类簇,弥补传统的双聚类方法在基因表达数据一致波动性方面的不足,引入粗糙集的上、下近似集概念,将粗糙集理论运用到模糊双聚类算法中,将粗糙上、下近似集与加权均方残差相结合,得到新的粗糙均方残基,进而提出一种基于粗糙均方残基的模糊双聚类算法.针对基因表达数据集,首先进行缺失值填补;其次,用非负矩阵分解算法对基因数据集进行降维;最后,计算数据矩阵的粗糙均方残基,结合综合评判度量函数与贴近度原则对矩阵的行列进行删除和添加,得到容量更大的双聚类结果.实验结果表明,该模糊双聚类算法是有效的.  相似文献   

4.
针对目前深度多视角子空间聚类算法因为缺少对自表达矩阵的低秩表示约束而导致的模型缺乏鲁棒性的问题,提出了深度低秩多视角子空间聚类算法。在深度多视角子空间聚类算法的基础上,通过矩阵分解将自表达层分解为多视角一致性自表达层和单视角特异性自表达层,得到具有低秩线型约束的双层自表达模块;强制所有视角的一致性自表达层的参数相同、特异性自表达层的参数各不相同,充分利用多视角数据的互补性;将自表达模块嵌入到每个视角的深度自编码器中,得到可以通过反向传播算法求解的深度低秩多视角子空间聚类模型;在深度模型训练中,一致性自表达层学习多视角数据的一致性信息,特异性自表达层学习单个视角的独特信息,双层自表达模块隐性地添加了低秩表示约束。6个公开数据集上的实验结果表明:与深度多视角子空间聚类算法相比,所提算法的聚类正确率平均提升了0.064,标准化互信息提升了0.064;所提算法的正确率和标准化互信息优于其他11种先进聚类算法的,聚类正确率最大提升了0.097,标准化互信息最大提升了0.103。  相似文献   

5.
针对传统谱聚类算法在非平衡数据集上聚类效果不理想的问题,提出了一种平衡化谱聚类算法,该算法在传统谱聚类目标函数的基础上加入了对聚类隶属度矩阵的近似正交约束,从而得到新的聚类目标函数.实验结果表明,新算法可以缓解传统谱聚类产生的均匀效应,提升了在非平衡数据集上的聚类纯度.  相似文献   

6.
基于Normalized Cut的基因表达数据聚类   总被引:1,自引:0,他引:1  
利用基因表达数据进行聚类分析可提高肿瘤诊断的正确率,对生物医学研究具有重要意义.该文将Normalized Cut应用于基因表达数据的聚类中,将样本映射为高维空间的点,利用亲近矩阵和度矩阵构造正规Laplacian矩阵,经SVD分解得到反映原始样本类别信息的指示向量,利用指示向量各分量的符号差异实现基因表达数据的聚类.通过对白血病和结肠癌数据集的实验,证明了该文方法的有效性.  相似文献   

7.
为了实现快速谱聚类分析,设计了一种基于余弦函数和矩阵变换的谱聚类算法(CMTSC).CMTSC将余弦函数和矩阵变换技术融入到了谱聚类算法之中.利用余弦函数构造了相似度矩阵W,跳过了传统谱聚类算法中设置尺度因子的过程,随后利用矩阵变换技术实现了矩阵W的特征值分解,降低了分解的计算复杂度.在UCI数据库中部分数据集上的聚类实验和Berkeley图像库中部分图像上的分割实验,验证了CMTSC的有效性和高效性.  相似文献   

8.
在大数据时代,多视图数据普遍存在.多视图聚类是分析多视图数据的一种常用方法.基于多流形正则化非负矩阵分解的多视图聚类是一种极具竞争力的多视图聚类算法,但该算法没有考虑非负矩阵分解的簇排列问题,并且在实验中没有考虑每个视图的差异性.基于上述问题,提出一种优化的多流形正则化的多视图非负矩阵分解算法.该算法的关键问题包括如何利用多视图信息聚类以及如何融合多流形.对多视图数据聚类时,令所有视图的数据共享一个低维的子矩阵,并且最小化所有视图的加权目标函数,从而体现每个视图对聚类的重要性并确保所有非负矩阵分解的簇排列的一致性.在融合多流形信息时,使用基于多视图谱聚类的权重计算方法,加权寻找一致的流形,从而体现每个视图中流形的重要性.实验结果表明,提出的优化策略可以提高多视图聚类的效果.  相似文献   

9.
针对非负矩阵分解算法实现语音增强效果不理想的问题,提出了一种双重约束非负矩阵分解结合改进正交匹配追踪算法的语音增强方法.采用时间约束及稀疏度约束的双重约束方式改进非负矩阵分解算法,使得分解后的数据更能反映出语音特征.通过改进正交匹配追踪算法提升重构精度,并结合语音信号在时频域的分布特征,引入低通滤波器进一步平滑重构后的...  相似文献   

10.
聚类是数据挖掘和机器学习领域的重要研究内容,一般会先基于数据样本构建相似图,再基于相似图将样本划分到相应的类中。但是真实的数据经常被损坏,导致学习的相似图不准确,从而直接影响聚类结果。为解决这些问题,提出一种面向鲁棒聚类的自适应图调节和低秩矩阵分解的方法,该方法的核心思想是:将原始数据X分解为纯净数据D和噪声数据S,再基于纯净数据构造拉普拉斯矩阵并进行自适应图调节。随后,给出一个联合学习框架,将数据分离、自适应图正则、噪声消除和低秩矩阵分解集成到一个目标函数中。利用增广拉格朗日乘子法分别更新变量。最后,在理论上证明算法的收敛性并进行实验。实验结果表明所提出的方法与现有一些方法相比有一定优越性。  相似文献   

11.
在非负矩阵分解算法的基础上,设计了组稀疏约束,并给出了组稀疏非负矩阵分解算法.首先,介绍了非负矩阵分解算法及其稀疏变体;其次,设计了组稀疏非负矩阵分解,推导出迭代规则,并证明了算法的收敛性;最后,将组稀疏非负矩阵算法应用于人脸识别和聚类中,得到了同类算法中较好的效果.  相似文献   

12.
提出一种新的基于非负矩阵分解(NMF)方法的聚类组合算法(NMFCCA).该算法首先采用K-均值算法作为基聚类器,然后使用NMF方法从基聚类器输出结果中提取数据对象的关键特征,最后在关键特征空间中划分数据对象,生成最终结果.在人工数据集和真实数据集上的实验表明,所提出的算法是有效可行的.  相似文献   

13.
半监督学习是近年来机器学习领域中的一个重要研究方向,其监督信息的质量对半监督聚类的结果影响很大,主动学习高质量的监督信息很有必要.提出一种纠错式主动学习成对约束的方法,算法通过寻找聚类算法本身不能发现的成对约束监督信息,将其引入谱聚类算法,利用该监督信息来调整谱聚类中点与点之间的距离矩阵.采用双向寻找的方法,将点与点间距离进行排序,使得学习器即使在接收到没有标记的数据时也能进行主动学习,实现了在较少的约束下可得到较好的聚类结果.同时,该算法降低了计算复杂度,并解决了聚类过程中成对约束的奇异问题.通过在UCI基准数据集以及人工数据集的实验表明,算法的性能好于相关对比算法,并优于采用随机选取监督信息的谱聚类性能.  相似文献   

14.
针对当前大数据背景下推荐系统中所存在推荐效率低下、扩展性差、推荐质量不高等问题,本文提出一种基于Bregman联合聚类与加权矩阵分解的融合推荐算法(CO-CWMA)。首先,通过Bregman联合聚类挖掘出多样、不同层次的低秩评分子矩阵,组合不同约束与距离的聚类结果训练得到子模型,进而在各个模型的子矩阵上并发地进行矩阵分解,最后将各个子模型进行均值融合,提高推荐质量、效率与扩展性。在矩阵分解阶段采用SVD++算法,基于每个子矩阵中的评分分布计算加权策略,给予高频评分较大权值,在梯度下降阶段利用学习率函数控制学习率的更新。实验结果表明,该算法与三种基线算法相比在均方根误差(RMSE)与平均绝对误差(MAE)上均有明显降低,即推荐质量有较大提升。  相似文献   

15.
针对半监督聚类算法中监督信息使用不充分,监督信息中信息含有量低的问题,提出一种结合主动学习的半监督聚类算法.首先结合使用数据的类别标记和成对约束信息,指导Kmeans聚类过程,设计出一种基于Seeds集和成对约束的半监督聚类算法SC-Kmeans;其次将主动学习算法引入到SC-Kmeans中,以尽量小的代价选取信息含有量更高的监督信息,提高SC-Kmeans算法的聚类精度;最后在UCI标准数据集上进行仿真实验.实验结果表明,该算法取得了较好的聚类效果,有效提高了聚类准确率.  相似文献   

16.
非负矩阵分解及其在基因表达数据分析中的应用   总被引:6,自引:0,他引:6  
介绍非负矩阵分解的基本原理及其在生物信息学中基因表达数据分析中的应用.并将该方法用于一组白血病微阵列数据的聚类,得到了新的结果.  相似文献   

17.
多视角子空间聚类是一种利用视角之间的互补信息,找到视角间统一的表示并发现潜在分组结构的方法,近年来已成为机器学习的研究热点.提出一种基于低秩稀疏约束的自权重子空间聚类算法.具体的,低秩稀疏约束能发现数据的全局和局部结构信息,使自表示矩阵呈现稀疏性和低秩的特点;而自权重方法利用视角表示矩阵与共享相似度矩阵之间距离的反比为每个视角分配合理的权重,同时学习到一个视角之间共享的相似度矩阵,降低受损视角对于共享相似度矩阵的影响.以上提到的两种方法组成一个统一的优化框架,再使用增广拉格朗日乘子交换方向最小化方法(ALMADM)对提出的聚类算法进行优化.在基准数据集中的实验结果证明该算法比其他算法更有效.  相似文献   

18.
基于图正则化非负矩阵分解算法(GNMF),提出一种基于凸光滑的L3/2范数正则化图非负矩阵分解算法.该算法用非负矩阵分解算法对数据进行低维非负分解时,根据流形学习的图框架理论,构建邻接矩阵保持数据局部几何结构,并对数据的低维表示特征进行凸光滑的L3/2范数稀疏性约束,在给出算法更新迭代规则的同时,从理论上证明了所给算法的收敛性.通过人脸数据库ORL、手写体数据库USPS和图像库COIL20的仿真实验表明,相对于非负矩阵分解算法及其基于稀疏表示的改进算法,所给算法均具有更高的聚类精度.  相似文献   

19.
针对传统的协同过滤推荐算法存在数据稀疏性、冷启动,影响推荐结果的准确性等问题,提出了一种改进的协同过滤推荐算法。使用基于随机梯度下降优化求解的矩阵分解方法,将原始矩阵分解为较低维的用户特征矩阵和特征产品矩阵;引进产品外部属性信息,运用谱聚类算法对产品聚类,构建属性—特征之间的映射关系,填充特征产品矩阵。所提出的算法不需要对原始评分矩阵进行数据填充,相较于传统的固定值填充方法,不需要系统提供大量的空间存储评分矩阵,并且在评分预测过程中采用降维技术,可以有效地缓解数据稀疏性对推荐结果准确性的影响。  相似文献   

20.
非负矩阵分解方法(non-negative matrix factorization,NMF)广泛应用于图像聚类、计算机视觉、信息检索等领域。但是,现有的NMF方法还存在一些不足之处:①NMF方法直接在高维原始图像数据集上计算它的低维表示,而实际上原始图像数据集的有效信息常常隐藏在它的低秩结构中;②NMF方法还存在对噪声敏感以及鲁棒性差的缺点。为了提高NMF算法的鲁棒性和可解释性,提出一种稀疏图正则化的非负低秩矩阵分解算法(sparse graph regularized non-negative low-rank matrix factorization,SGNLMF)。通过低秩约束和图正则化,SGNLMF算法同时利用了数据的几何信息和有效低秩结构;此外,SGNLMF算法还对基矩阵加以稀疏约束,使得其鲁棒性和可解释性均有一定的提升。还提出了一种求解SGNLMF的迭代算法,并从理论上分析了该求解算法的收敛性。通过在ORL和YaleB数据库上的实验结果表明SGNLMF算法的有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号