首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 68 毫秒
1.
一种鲁棒的子空间聚类算法   总被引:2,自引:1,他引:1  
针对聚类分析常面临的维数灾难和噪声污染问题,将样本加权思想与子空间聚类算法相结合,提出了一种鲁棒的子空间聚类算法.该算法结合现有子空间聚类方法,为每个类簇计算一个反映各维度聚类贡献程度的权矢量,并利用该权矢量对各维度加权组合,得到各类簇所处的子空间.此外,算法还为每个样本分配一个反映离群程度的尺度参数,以区分正常样本和离群点在聚类过程中的地位,保证算法的鲁棒性.在二维数据集、高维数据集以及基因数据集上的对比实验结果表明,对于具有不同噪声比例的各种维度数据集,该算法均能取得较高的聚类精度,表现出较好的鲁棒性.  相似文献   

2.
由于在高维空间中,基于固定维数的经典方法和结果不再适用,样本协方差矩阵不可逆,估计逆协方差矩阵时存在不稳定、计算成本高和非精确等问题,提出了一种L1范数最小化方法来有效估计高维逆协方差矩阵即精确矩阵.当总体分布满足指数类型条件或者多项式类型条件时,所提估计方法在各种范数下的收敛速率优于其他现存的方法.经分析验证,所提方法为凸优化问题,可采用交替方向乘子算法来解决.之后通过R语言在模拟数据和实际数据下进行仿真分析,并与Glasso方法对比逆协方差的估计性能和图恢复性能,结果表明所提估计方法准确率高、计算成本低.最后,将所提估计方法用来分析白血病数据集,并运用聚类分析对白血病人进行分类.  相似文献   

3.
针对传统多视角学习算法只关注从多视角中提取共享信息而忽略了各视角的特有信息和高阶关联的问题,提出了一种基于截断核范数的低秩张量分解的多视角谱聚类算法。计算各视角的样本相似度矩阵和转移概率矩阵,构建一个包含各视角马尔可夫转移概率矩阵的张量,从而保留各个视角的信息。采用基于张量奇异值分解的截断核范数约束目标张量的秩。通过最小化张量截断核范数,学习到一个既包含各个视角共享信息又具有高阶关联的张量。利用迭代最优化算法求解目标函数,将求得的目标张量输入谱聚类算法得到聚类结果。在4个不同类型数据集上进行实验并与传统聚类算法进行了对比,结果表明:所提算法在4个数据集上的标准互信息度量值比标准谱聚类算法的分别提高了7.9%、24.9%、29.5%、8.1%,比LT-MSC算法的分别提高了3.4%、18.1%、17.6%、6.6%。通过对非负平衡参数在0.000 1~100之间的测试发现,所提算法表现基本稳定,在非负平衡参数取0.1~1之间表现良好。与传统多视角聚类算法相比,所提算法可有效增强各视角之间的互补性和高阶关联,并且具有良好的准确性和鲁棒性。  相似文献   

4.
针对含有较大奇异值的矩阵秩最小化问题,采用对数行列式函数代替核范数作为秩函数的非凸近似,应用增广拉格朗日交替方向法求解矩阵秩最小化问题。当罚参数β1时,证明此算法产生的迭代序列收敛到原问题的稳定点。最后利用实际数据和随机数据,通过数值实验验证所提出的算法较现有的求解核范数矩阵秩最小化问题的算法更高效。  相似文献   

5.
针对闵可夫斯基子空间聚类算法对特征权重分配的问题,提出了一种混合测量子空间聚类算法(iMWK-HD),以实现调节特征权重因子和提高算法性能的目的。利用闵可夫斯基距离与余弦相结合的混合测量来分配特征权重,构造新的目标函数;在聚类迭代过程中,采用智能K-means进行初始化来解决选择正确类数的问题;根据新的目标函数,使用拉格朗日乘子法求解新的隶属度和特征权重更新公式,使类中心更加稳定,从而促进特征空间转换,获取数据集最优聚类结果。采用UCI数据集设计了对比实验,实验结果表明,iMWK-HD算法优于iK-means、iWK-means、iMWK-means这3个现有的聚类算法,所提算法能有效提升聚类精确度和聚类结果的稳定性。  相似文献   

6.
为恢复被混合噪声污染的低秩矩阵,提出了一种新的广义鲁棒主成分分析(GRPCA)算法。它通过最小化核范数、1范数和2,1范数的组合问题,从观测矩阵中分离出低秩部分和混合噪声部分,并用随机排序的交替方向乘子法求解。利用本文方法进行垃圾邮件分类的实验结果表明,与经典的主成分分析(PCA)和鲁棒主成分分析(RPCA)算法相比,本文方法可以有效提高垃圾邮件分类的精确度和稳定性。  相似文献   

7.
基于加权的软子空间聚类是处理高维数据的一种有效手段,在原有的软子空间聚类算法基础上对目标函数进行改进,从而结出一种新的软子空间聚类算法.相较之原算法,此算法具有更高的抗噪性及聚类效率;通过与典型的软子空间聚类算法比较试验,结果表明可有效提高海量高维数据的聚类处理效率.  相似文献   

8.
针对维吾尔词书写粘连和手写笔画漂移等问题,提出一种基于多信息融合路径寻优的字符分割算法.利用笔画提取、切分和聚类,过分割单词图像得到主体和附加字段,通过字段模糊匹配获得鲁棒的字根序列描述,以抑制笔画漂移造成的干扰;由建立的匹配位置高斯模型来估算字段匹配信息,经对单字分类器输出进行置信度转换,从而得到字符识别信息,再运用数据统计获取单词语义信息;由构建的字符序列二阶Markov语言模型,基于Bayes准则,提出了单词后验概率的多信息加权融合计算方法,通过字段匹配及字根合并的路径寻优,可得到最佳字符分割结果.在手写维文样本库上的实验表明,所提算法能有效提升字符分割的准确率和稳定性.  相似文献   

9.
随机子空间聚类集成通过属性随机采样产生属性子空间,并将子空间上的基聚类结果进行集成得到最终聚类结果.在这一过程中,子空间产生的随机性虽然为聚类集成提供了很大的差异度,但是无法保证基聚类结果的有效性,这是因为随机产生的子空间有可能只包含极少的重要属性.针对这一不足,提出了一种带核随机子空间生成策略:首先依据粗糙集理论中的互补互信息选出对于刻画数据集整体信息至关重要的属性子集,作为每个属性子空间的"核心",再从剩余属性集中随机选择一定数量的属性与核心属性共同构成聚类子空间.这种策略在兼顾子空间之间差异性的同时也提高了每个属性子空间对数据整体信息的刻画能力,从而得到更好的聚类集成结果.在大量UCI数据集上的实验证实了所提方法的合理性和有效性.  相似文献   

10.
针对样本基数较大、维数较高、特征较复杂的数据集训练问题,将支持向量机与蚁群优化算法相融合,提出一种自适应多核学习算法.利用吸引子传播聚类算法自适应地发现相似特征,并据此利用蚁群算法自适应地选择核函数参数,从而快速选择最优核函数.通过UCI数据集的5组数据实验表明,该算法相比于传统的支持向量机分类准确率和F1值更高,验证...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号