首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 218 毫秒
1.
数据降维就是将数据集从高维特征空间向低维特征空间的映射.传统的主成分分析(PCA)算法是一种常用的线性数据降维算法.但是耗时太长,降维结果不够好,同时不能满足实际分类要求.为此,通过引入互信息可信度,提出了一种基于互信息综合可信度的主成分分析(MIS-PCA)数据降维算法.该算法首先介绍互信息(MI)、相对互信息可信度(MIR)和绝对互信息可信度(MIA)的思想;然后根据MIA和MIR求解互信息综合可信度(MIS),利用互信息综合可信度进行特征筛选;最后再运用PCA算法对处理后的数据进行降维,并将降维后的数据采用KNN、SVM算法进行分类.对比PCA、E-PCA算法,通过试验表明该方法的降维结果较好、分类精确度较高.  相似文献   

2.
为提高铸坯质量预测的准确率,本文提出了一种基于最大信息系数(MIC)和主成分分析(PCA)的两阶段特征降维方法。采集某钢厂铸坯生产过程数据,根据冶金原理得到铸坯夹杂类质量缺陷的影响因素,构造原始特征集。第一阶段进行特征选择,使用随机森林分类器的分类准确率来评价ReliefF、IG和MIC三种算法的特征选择效果,结果显示,基于MIC度量指标选出的特征维度更低、分类准确率更高。第二阶段使用PCA方法对特征选择后的特征集进行降维,并将其与原始特征集、MIC、PCA算法的分类准确率进行比较,结果表明,本文提出的基于MIC和PCA的两阶段降维方法优于其他算法,能有效降低原始特征集的维度并提高对铸坯夹杂类质量缺陷的预测精度。  相似文献   

3.
以高维分类为目标,从分类的准确率与模型解释性角度探讨了降维的必要性,分析了特征选择与抽取2类方法特点,并对常用的特征抽取方法,包括主成分分析(PCA)、偏最小二乘(PLS)和非负矩阵分解(NMF)进行了阐述.考虑到约减后的数据缺乏稀疏性与可解释性,提出了基于稀疏正则化的特征抽取模型,为高维特征降维提供了一种新思路.  相似文献   

4.
针对KNN文本分类算法在高维数据集上分类计算开销大、效率低的缺点,采用一种基于矩阵奇异值分解的文本特征向量降维方法实现向量降维的同时保留更多的分类信息.同时,采用信息增益的方式对原始文本特征词进行了初步筛选,过滤掉对分类系统几乎没有贡献的特征词,以克服文本特征维数增长所带来的奇异值分解计算开销过大的缺点.实验表明此方法能在保持分类精度的同时极大地降低分类计算开销.  相似文献   

5.
一种基于分形维的快速属性选择算法   总被引:9,自引:0,他引:9  
属性选择是数据挖掘、文档分类和多媒体索引等领域研究的一个热点问题·利用分形维进行属性选择是一种新的方法,它利用数据集的分形维作为属性的重要性度量·基于分形维的快速属性选择算法(IFAS),利用后向属性选择策略和降维操作的投影特性,根据E维的分形树导出E 1维的分形树(用来计算分形维的数据结构)·因此,只需扫描一次数据集,避免了FDR算法多次扫描数据集的问题·通过图像特征数据集合和合成的分形数据集对两种算法进行性能测试·实验结果显示,IFAS算法明显优于FDR算法·IFAS算法的时间和空间复杂度都为O(n),响应时间与属性维数呈线性关系·  相似文献   

6.
煤与瓦斯突出发生的内在机理复杂,突出影响因素与突出事件之间的相关规律具有不确定性、模糊性,使得基于经验的传统预测方法和基于数学建模的统计预测方法的应用受到很大限制.在研究非线性降维等距特征映射和序贯最小优化算法的基础上,提出一种基于等距特征映射的煤与瓦斯突出序贯最小优化算法,该方法改进了样本向量之间的距离度量,用测地距离代替传统的欧式距离,有助于挖掘高维数据内在的几何结构.实例验证表明,该算法能可靠预测煤与瓦斯突出的危险性分类,实验进一步将Isomap和主成分分析的降维结果相比较,结果显示Isomap优于传统的线性降维技术,这说明非线性降维技术在地学数据分析中具有一定的应用潜力.  相似文献   

7.
传统属性约简的目标是在决策表中的所有条件属性中,选择一组分类代价最小的约简,算法构建了测试代价最小的约简.以往的测试代价约简算法查找成功率不够理想,性能不稳定,提出了一种改进的测试代价约简算法.通过运行2个UCI数据集实验,证明算法是有效的,并为提高测试代价约简算法性能提供了新途径.  相似文献   

8.
为了得到一个低误分类代价的特征子集,本文通过定义样本间的代价距离并将代价距离引入了现有的特征选择架构,把流形学习和代价敏感特征选择问题相结合得到了一个新的代价敏感特征选择方法,称之为基于流形学习的代价敏感特征选择算法。以前提出的代价敏感特征选择算法在选择特征的过程中只考虑到了特征与误分类代价的关系,并对特征一个一个的进行选择,而本文所提出的代价敏感特征选择算法同时考虑了特征与误分类代价的关系和特征之间内在的判别信息,从而提高了代价敏感特征选择效果。在六个现实世界数据集上的实验证明了本文所提出的算法效果优于现有的相关算法。  相似文献   

9.
为了在保持数据局部几何结构不变的同时使数据分类边界最大化,提出了一种用于分类的线性局部切空间判别分析算法.该算法是改进的流形学习算法的监督版,样本的局部切空间排列矩阵确保样本低维嵌入的局部几何结构不变;基于最大边界准则的数据散度矩阵确保数据分类的类内散度最小和类间散度最大;对上述2个矩阵和进行特征分解,获得平衡的投影向量基,使样本投影后的子空间被优化.对Yale,UMIST与MIT这3个人脸数据库的实验结果表明,与现有多种经典分类方法相比,提出的算法在降维的同时提取了用于人脸识别的更有效特征,识别性能较好,具有较高的判别分析能力.  相似文献   

10.
针对以往手势识别研究中更关注识别率而弱化实时性的情况,首次将偏最小二乘降维思想引入手势识别领域,提出一种基于特征联合和偏最小二乘降维的手势识别方法。首先进行手势分割,在此基础上提取手势样本的梯度方向直方图和局部二值模式特征,并将二者进行联合。然后采用偏最小二乘法对手势联合特征进行降维,并将降维后的手势训练样本特征输入到支持向量机中进行分类训练。最后用训练好的支持向量机对降维后的手势测试样本进行识别测试。基于Jochen Triesch手势库及自制手势库的实验结果表明,同已有方法相比,本文所提方法在取得较高手势识别率的同时也取得了较好的实时性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号