首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 234 毫秒
1.
特征选择是从特征集合中选择相关特征子集,方便数据聚类、分类和检索等.现有的无监督特征选择算法是将高维数据映射到低维空间并计算每个特征的得分,选择排名靠前的特征.提出一种基于稀疏聚类的无监督特征选择算法:首先利用流形学习的特征映射思想将高维空间的数据映射到低维空间中,用样本构造近邻图,通过图的嵌入找到低维空间,降维后的空间能保持原始数据集的流形结构.其次,得到的样本嵌入矩阵表示特征的重要性,是区分特征对每一个聚类簇的贡献大小的指标,利用低维空间对高维空间的拟合,构造一个目标函数.最后,目标函数本质是回归问题,求解回归优化问题常用最小角回归算法,使用L_1范数进行稀疏回归计算每个特征的得分,选出得分靠前的特征.在六个现实数据集上的实验结果表明:该算法在聚类精度和互信息上取得了较好的实验结果,能有效地选出重要特征,在降维方面具有良好性能,优于其他对比算法.  相似文献   

2.
改进了局部线性嵌入LLE变换中的两个参数最近邻点数目K和高维空间维数d的选择方式,然后将数据集的敏感属性用随机LLE方法嵌入到高维空间中,从而使敏感属性得到加密保护,由于LLE方法可以保持数据集的内部拓扑结构,可使加密变换后的数据集以同样的精度找到正确的最近邻点.通过在一个具体旅游数据集上的实验结果表明,该算法能使安全性和精确度都达到要求.  相似文献   

3.
基于局部线性嵌入的半监督仿射传播聚类算法   总被引:1,自引:0,他引:1  
针对运用半监督仿射传播聚类算法处理高维数据时聚类精度低和计算量大的问题,提出一种基于局部线性嵌入的半监督仿射传播聚类算法.该算法首先通过LLE算法将高维输入数据集映射到低维空间得到低维数据集,计算低维数据集的相似度矩阵,再用半监督算法调整相似度矩阵,最后用仿射传播聚类算法对低维数据进行聚类分析.仿真结果表明,本文提出的算法与半监督仿射传播聚类算法相比,在处理高维数据时聚类效果更好,精度更高,迭代次数更少.  相似文献   

4.
一种自适应局部线性嵌入与谱聚类融合的故障诊断方法   总被引:4,自引:1,他引:3  
针对数据维数高、非线性且从高维观测空间分析数据模式困难的问题,将改进的流形学习算法引入到数据聚类中,提出了一种结合自适应局部线性嵌入和递归调用规范切融合的新方法.采用自适应局部线性嵌入对原始数据进行非线性降维,应用递归调用规范切对低维空间数据进行聚类,通过对3组UCI标准测试数据集的仿真实验表明,新方法能够将高维数据有效地映射到低维本质空间,克服了传统方法对数据集结构的依赖性,从而显著提高了谱聚类算法分类的准确性和稳定性.同时,对于田纳西-伊斯曼过程的数据实验,表明了该方法对故障模式识别的可行性和有效性.  相似文献   

5.
基于多元图形特征融合原理的降维方法研究   总被引:1,自引:0,他引:1  
降维是将高维模式映射到低维子空间的过程.在降维后的低维子空间进行分类往往能得到更好的效果.本文以高维数据为研究对象,采用多元描述图对高维数据进行可视化表达,采用多元图图形特征融合的方法对高维数据进行降维,用K邻分类器进行分类效果评价.与Fisher线性判别及其他一些常用非线性降维方法相比,本文所提方法在数据的可视化以及分类精度等方面均有较好效果.  相似文献   

6.
分析了人脸与非人脸之间的本质区别,提出了运用局部线形嵌入(LLE)的非线性降维方法,解决非线性结构的高维数据(图象)低维表示的问题,实现了高维输入数据点映射到一个全局低维坐标系,同时保留了邻接点之间的空间关系(即高维空间的几何结构).此算法不仅能够有效地发现数据的非线性结构,同时还具有平移、旋转不变性.运用LLE算法对图象进行降维,再对降维后的数据运用支持向量机(SVM)分类器进行人脸和非人脸的分类.实验结果表明,该人脸检测方法测率较高,并且不受姿态、表情和光照的影响.  相似文献   

7.
使用深层限制波尔兹曼机实现高维数据非线性降维,再结合极速学习机算法,提出了一种复合的DBMELM深层网络模型.该模型在复杂高维数据的分类问题上,能较好的将高维数据简化到低维空间,进而得到较好的分类效果,实现复杂函数的表示.最后在人脸和手写数字识别实验上得到了很好的证明.  相似文献   

8.
提出一种基于流形距离的局部线性嵌入算法,以流形距离测度数据间的相似度,选择各样本点的近邻域,解决了欧氏距离作为相似性度量时对邻域参数的敏感性.在MDLLE算法中引入最大边缘准则(maximum margin criterion,MMC)来构建最优平移缩放模型,使得算法在保持LLE局部几何结构的同时,具有MMC准则判别能力.通过正交化低维特征向量可消除降维过程中的噪声影响,进而提高算法的监督判别能力.由实验结果得到,所提出的方法具有良好的降维效果,能有效避免局部降维算法对邻域参数的敏感.随机投影独立于原始高维数据,将高维数据映射到一个行单位化的随机变换矩阵的低维空间中,维持映射与原始数据的紧密关系,从理论上分析证明了在流形学习算法中采用随机投影可以高概率保证在低维空间保持高维数据信息.  相似文献   

9.
免疫进化的投影寻踪模型在文本分类中的应用   总被引:1,自引:0,他引:1  
投影寻踪是通过寻找最能反映原高维数据的结构或特征的投影方向,把高维数据投影到低维子空间上,从而实现在低维空间上研究分析高维数据的目的.针对文本分类中维数灾难问题,采用投影寻踪模型,将高维的文本数据降到超低维.投影寻踪的关键是构造能够找到最佳投影方向的有效算法,本文根据免疫进化的思想提出了免疫进化的投影寻踪模型,该模型能...  相似文献   

10.
针对原始高维空间数据特征冗余的特征问题,提出了一种自适应Lasso流形规整的特征提取方法.在原始空间中的样本,经过投影后可以保持在原始空间中的近邻结构,投影到低维空间后也可像高维空间中那样相近.通过模型做完特征选择后,以这些被选的特征子集作为输入,在数据集中做了一系列的分类实验.结果表明,该算法可以精准提取高维样本集的低维流形结构,具有较小的尺寸误差递减,特征提取性能较好.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号