首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基因表达数据聚类为肿瘤新类别的发现提供了重要手段。然而,直接对原始数据进行聚类会在一定程度上丢失数据本身隐含的流形结构信息,影响子空间分割方法的聚类效果。为解决这一问题,提出模式收缩最小二乘回归(pattern shrinking least square regression, PSLSR)子空间分割方法。该模型能够同时进行模式收缩和仿射矩阵的学习,并利用交替优化方法进行求解。在6个基因表达数据上的实验结果表明该方法优于现有子空间分割方法。  相似文献   

2.
提出一个基于核聚类算法的高校定位模型.引入核函数,将原始数据由数据空间映射到特征空间中进行聚类.核聚类算法经过了核函数的非线性映射,使原始数据的特征更完整地显现出来,从而使聚类结果更客观、有效,可以解决传统方法主观性强、偏差大的缺陷.将核聚类算法应用于我国16所高校定位的研究,结果表明该方法可行且有效.通过聚类结果的分析,提出高校可分为教学科研生态位协调型、低教学生态位高科研生态位型、高教学生态位低科研生态位型3类,并对不同类型高校提出发展建议.  相似文献   

3.
无监督极限学习机在投影过程中保持原始高维空间中的稀疏或近邻结构,样本在高维空间中存在冗余信息,原始的数据结构不一定适应于投影后的低维特征空间.为此,结合无监督极限学习机和子空间聚类的自表示学习,提出投影自表示无监督极限学习机模型.该模型是面向聚类的特征提取方法,在投影过程中学习自表示子空间结构,从而使无监督极限学习机提取的特征自适应于聚类任务.在IRIS数据集、 6个基因表达和2个医学影像高维数据集上进行实验,结果表明该模型和算法是有效的.  相似文献   

4.
基于核的自组织映射聚类   总被引:1,自引:0,他引:1  
将核学习的方法应用于自组织映射聚类中,提出了一种核自组织映射聚类算法.该算法以核函数代替原始数据在特征空间中映射值的内积,并且神经元权值向量的初始化和更新都可由其组合系数向量表示,从而获得了直观而简单的迭代公式.分析了算法中学习速率过高会降低学习稳定性、学习速率过低又会降低收敛速度等参数选择问题,给出了一组折中考虑学习稳定性和收敛速度要求的参数初始值.实验结果表明,核自组织映射聚类对于非椭圆型的类分布数据,如环形数据,聚类正确率也能够达到99.886 4%.对IRIS数据集和入侵检测报警数据的聚类也证明了核自组织映射聚类方法的良好性能.  相似文献   

5.
[目的]直接利用模糊C均值(FCM)对原始数据进行聚类,容易导致聚类结果受到噪声和离群点的影响,但通常利用松弛技术对样本点模糊隶属度或空间位置关系进行松弛的解决方法只能降低,而无法完全剔除噪声和离群点的影响.为了解决这个问题,提出了基于截断技术的鲁棒模糊C均值(TRFCM)聚类算法.[方法]基于模糊局部信息C均值(FLICM)聚类模型,通过引入截断技术,提出TRFCM算法.该算法的主要思路为:(1)利用FLICM,在学习数据聚类结构的同时保留样本点的局部邻域结构;(2)基于FLICM的聚类结果动态调整原始数据,使其满足期望的聚类结构;(3)将聚类结构特征学习与原始数据的调整(即截断掉部分样本点),统一在一个优化框架中,从而实现组合最优化.将TRFCM算法与近年来相关算法进行比较以检验TRFCM的参数敏感性、收敛性、鲁棒性、时效性等性能.[结果]实验包括5个部分:参数敏感性与收敛性分析、鲁棒性检验、图像分割实验、Benchmark数据集实验和各算法计算时间对比实验.在参数敏感性和收敛性分析中,TRFCM算法在合适的范围内对参数不敏感且在大多数情况下可以获得良好的聚类效果.同时,算法对各数...  相似文献   

6.
针对稀疏投影CT重建图像中的条形伪影问题,提出一种稀疏表示与低秩矩阵填充相结合的正弦图分区修复方法.首先,将正弦图子块依据灰度熵大小分为两类;然后,采用字典学习算法修复边界区域的正弦图子块,为了保留正弦图的内部结构,设计一种联合修复模型用于内部子块的修复,将正弦图的低秩特性融入稀疏表示模型中,以便引入非局部信息;最后,组成完整的正弦图并经滤波反投影(FBP)重建获得最终图像.实验结果表明,与经典算法相比,该算法在投影域与图像域皆有较优表现,能够较好地修复正弦图的结构,明显改善稀疏重建图像中的条形伪影及结构模糊问题.  相似文献   

7.
针对目前深度多视角子空间聚类算法因为缺少对自表达矩阵的低秩表示约束而导致的模型缺乏鲁棒性的问题,提出了深度低秩多视角子空间聚类算法。在深度多视角子空间聚类算法的基础上,通过矩阵分解将自表达层分解为多视角一致性自表达层和单视角特异性自表达层,得到具有低秩线型约束的双层自表达模块;强制所有视角的一致性自表达层的参数相同、特异性自表达层的参数各不相同,充分利用多视角数据的互补性;将自表达模块嵌入到每个视角的深度自编码器中,得到可以通过反向传播算法求解的深度低秩多视角子空间聚类模型;在深度模型训练中,一致性自表达层学习多视角数据的一致性信息,特异性自表达层学习单个视角的独特信息,双层自表达模块隐性地添加了低秩表示约束。6个公开数据集上的实验结果表明:与深度多视角子空间聚类算法相比,所提算法的聚类正确率平均提升了0.064,标准化互信息提升了0.064;所提算法的正确率和标准化互信息优于其他11种先进聚类算法的,聚类正确率最大提升了0.097,标准化互信息最大提升了0.103。  相似文献   

8.
针对网格聚类方法在高维子空间聚类中网格规模随着维度急剧升高的问题,以及差别阈值方法引入干扰小聚簇的问题,提出一种具有两个网格划分阶段的密度意识子空间聚类模型。该模型第一阶段采用粗网格找出可能存在聚类的子空间区域,第二阶段在这些区域中进行等效精度更高的网格划分并找出所有致密单元。该模型在两个阶段处理的网格规模均远低于密度意识子空间聚类模型在相同划分精度下的网格规模,同时利用第一阶段对网格空间的筛选作用降低小聚簇干扰,提高聚类质量。合成数据集实验表明:该模型聚类精准率和查全率性能明显优于原模型;基于真实数据集实验,相比一次划分模型,该模型以损失0.4%数据点的代价提高输出聚类密度19.4%,聚类质量大幅提升。  相似文献   

9.
k-means和谱聚类是两种应用最广泛的聚类技术.k-means是基于矩阵分解的聚类方法,并且是在数据空间上基于误差极小化的聚类方法.谱聚类是基于图的聚类方法,并且是基于两点在数据空间和特征空间的相似性保持的聚类方法.为了利用两者的优势,提出一种基于乘法更新规则的k-means和谱聚类的联合学习方法,该方法将k-mea...  相似文献   

10.
针对聚类中忽略局部结构、 低秩表示张量与亲和矩阵高度依赖性等问题, 提出一种基于图形正则化低秩表示张量与亲和矩阵的多视图聚类方法. 首先, 提出一个统一的框架学习多视图子空间的图正则低秩表示张量和亲和矩阵; 其次, 进一步通过基于张量核范数的张量奇异值分解分析高阶交叉视图关联性, 并利用图形正则化保留嵌入在高维空间中的局部结构; 最后, 利用约束二次规划为每个视图分配自适应权重. 在7个数据集上的实验结果证明了该方法聚类效果更好.  相似文献   

11.
传统的基于空间向量的文本谱聚类方法容易忽略文本上下文之间的语义联系,通过图结构进行文本表示可以很好的解决这一问题,在此基础上,本文提出了基于最大公共子图的谱聚类算法——SC-MCS算法。该算法通过求解文本之间的最大公共子图来进行文本相似度的计算,最后进行文本聚类。实验结果表明,与传统的基于空间向量的文本谱聚类方法相比,该算法在准确率和召回率都取得了一定的提升。  相似文献   

12.
提出一种新颖的多视图子空间聚类算法,不再对包含各种噪声以及冗余信息的原始数据进行特征融合,而是通过对不同视图的低维子空间表示进行融合,得到一个公共的低维子空间表示.将这个子空间表示作为相似度矩阵进行谱聚类,以得到更优的聚类效果.在3个广泛使用的多视图基准数据集上进行了实验,实验结果证明了所提出算法的有效性.  相似文献   

13.
研究表明,高维数据的聚类都隐含在低维的子空间内,而这些子空间就是把原始数据投影到某些维度上的交集,于是相应的聚类算法就变成如何寻找合适的子空间内容。在此提出了一种新的划分子空间方法——基于Parzen窗子空间划分方法,并在这基础上提出了新的投影聚类方法PCPW。通过与最新的EPCH算法的实验结果对比表明,两者聚类效果相当,但PCPW算法更简单,易于实现。  相似文献   

14.
为了进一步提升基于核范数和F范数最小化的子空间聚类算法的性能,使用加权核范数扩展上述两种范数.提出的算法中含有一个参数γ,当γ=0时,可得到核范数;当γ=1时,可得到F范数;当0γ1时,可得到介于核范数和F范数之间的范数.采用交替方向乘子方法和线性交替方向乘子方法求解所提算法的目标函数,并由此得到了2个基于加权核范数最小化的低秩子空间聚类算法.利用Extended Yale B人脸数据集、MNIST手写字符数据集和USPS手写字符数据集进行实验.实验结果表明:和现有的子空间聚类方法相比,所提算法可以得到较高的聚类精度.  相似文献   

15.
半监督学习方法在多流形学习领域的应用越来越广泛,文章提出了一种基于MPPCA模型的半监督多流形识别算法M2SMPPCA。该算法首先通过MPPCA模型将原始数据集划分成m个"局部数据块",再根据标签信息对这些数据块进行进一步的分解,使每一个数据块中的标签信息一致;然后利用切空间偏差构造能反映出数据点之间局部几何特性的相似图,并通过谱聚类实现多流形的识别;最后利用共协矩阵集成多次分解结果,提高了子流形分解结果的鲁棒性,得到最终的子流形。实验结果表明,该算法在人造数据和实际的高维图像数据上都能有效地分解开相交多流形数据,相较于其他算法极大地提高了分解精度。  相似文献   

16.
在非结构化数据挖掘结构模型——发现特征子空间模型(DFSSM)——的运行机制下,提出了一种新的Web文本聚类算法——基于DFSSM的Web文本聚类(WTCDFSSM)算法.该算法具有自稳定性,无须外界给出评价函数;能够识别概念空间中最有意义的特征,抗噪声能力强.结合现代远程教育网应用背景实现了WTCDFSSM聚类算法.结果表明:该算法可以对各类远程教育站点上收集的文本资料信息自动进行聚类挖掘;采用网格结构模型,帮助人们进行文本信息导航;从海量文本信息源中快速有效地获取重要的知识.  相似文献   

17.
针对基于颜色特征的图像检索中的图像特征降维问题,提出了自适应局部保持映射(ALPP:Adaptive Locality Preserving Projection)的图像特征降维算法.在考虑了每个特征向量与其近邻关系的基础上,通过研究贝叶斯准则在图像分类中的作用,将聚类引入降维算法中,解决特征空间维数的自适应确定问题.使降维结果既保证了最大化地消除高维向量间的相关性和冗余度,又不破坏原始数据近邻间的拓扑结构.实验结果表明,对Coral图像库,应用HSV直方图特征,在查询返回图像为50幅的情况下,基于ALPP算法图像检索的查准率为67.7%,查全率为57.3%.相对PCA(Principal Component Analysis)算法的查准率(45.8%)和查全率(49.2%),具有较高的检索精度.  相似文献   

18.
维数减少是在损失较少特征信息的条件下处理高维图像数据的关键技术,已成为高维数据处理中的热点问题.样本的类内和类间散度判别信息被用于判断当前样本对属于相同类还是不同类,同时考虑未标签样本对算法性能的影响,提出了一种判别型半监督非线性维数减少算法(discriminativesemi-supervised nonlinear dimensionality reduction,DSSNDR),可有效避免奇异性.DSSNDR采用高斯核和多项式核组合得到的混合核,将原始数据以一系列"有用的"特征形式投影到一个较低维的嵌入空间,便于分类,同时能够保持已标签和未标签样本的内部特征,可有效执行半监督学习.引入样本数据的子模式,将DSSNDR推广到子模式特征空间下的非线性方法,简称Sp-DSSNDR,进一步增强了DSSNDR的学习能力,提高分类精度.多个典型数据集上的分类和可视化实验表明,不同类的样本数据的投影在DSSNDR和Sp-DSSNDR构造的特征空间中存在较少的混叠现象,具有更好的可分离性.当维数被减少到较低水平时,本文算法几乎总是取得最好的结果,甚至超过了经典的主成分分析(PCA),核主成分分析(KPCA)和核Fis...  相似文献   

19.
子空间聚类能有效的发现各簇与所属于的子空间的联系,同时减少高维数据中因为数据冗余和不相关属性对聚类过程产生的干扰.已有的子空间聚类方法强调各子空间中簇的发现,往往忽略子空间的划分.提出了基于属性最大间隔的子空间聚类,该方法主要思想是对子空间的划分时信息的丢失达到最小,从而子空间聚类的结果的效果比较好.主要工作包括:第一,建立了子空间划分的目标函数,也就是使各划分的子空间相互依赖达到最小,第二,设计了基于属性最大间隔的子空间聚类算法Maximum Margin Subspace Clustering(MMSC)进行子空间聚类集成.最后,采用UCI和NIPS2013比赛等数据来做实验,结果表明,在大多数数据上MMSC算法比其他子空间算法能得到更好的聚类结果.  相似文献   

20.
一种基于核的模糊聚类算法   总被引:6,自引:2,他引:4  
结合核技术与改进的模糊c均值算法聚类准则提出一 种基于核的模糊聚类算法. 通过引入核函数, 样本点被非线性变换映射到高维特征空间进行聚类, 提高了聚类性能. 同时, 算法改进了模糊c-均值聚类模型中的概率型约束条件, 使其对噪声和野值点具有较好的鲁棒性. 在真实数据和人造数据上与常用聚类算法进行了对比实验, 结果表明该算法具有较低的时间、 空间复杂度与较好的聚类性能.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号