首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 328 毫秒
1.
张毅斌  马盈仓 《河南科学》2019,37(4):521-527
多标签特征选择已成为处理多标签数据的重要方法之一.利用一种基于模糊互信息的多标签特征选择算法,通过模糊离散化,给出模糊联合熵和模糊条件熵吸模糊互信息的计算方式.将原先的互信息特征选择算法推广到模糊情形中,提出一种基于模糊互信息的多标签特征选择算法.最后在同一准则下,将模糊互信息与原先的互信息特征选择算法及其他几种经典的特征选择算法进行比较.实验表明,此方法在一定程度上效果优于其他特征选择算法,是一种有效的多标签分类问题的特征选择方法.  相似文献   

2.
针对目前基于互信息图像配准方法中存在的不足,提出结合图像二维信息(如轮廓和边缘)与互信息的图像配准算法.它首先利用小波多尺度积提取两幅图像的特征点及其角度信息,再根据得到的特征点和角度信息,定义了特征点对互信息匹配准则,得到相应的匹配点对.最后进行了仿真实验,并将结果与由相关度、对齐度准则得到的结果进行比较,所提出的算法匹配误差最小.结果表明该算法具有匹配精确、鲁棒性好和效率高等优点.  相似文献   

3.
互信息过滤式特征选择算法往往仅局限于互信息这一度量标准.为规避采取单一的互信息标准的局限性,在互信息的基础上引入基于距离度量的算法RReliefF,从而得出更好的过滤式准则.将RReliefF用于分类任务,度量特征与标签的相关性;应用最大互信息系数(maximal information coefficient,MIC)度量特征与特征之间的冗余性、特征与标签的相关性;最后,应用熵权法为MIC和RReliefF进行客观赋权,提出了基于熵权法的过滤式特征选择算法(filtering feature selection algorithm based on entropy weight method, FFSBEWM).在13个数据集上进行对比实验,结果表明,FFSBEWM所选择的特征子集的平均分类准确率和最高分类准确率均优于其他对比算法.  相似文献   

4.
提出一种基于子问题分类能力的特征选择算法,利用互信息度量特征对子问题的分类能力,根据特征的判别结构互补确定目标特征子集.该算法既会选择总分类能力强的特征,也会选择子问题分类能力强的特征.将该算法与已有的6个特征选择算法在6个公开的数据集上进行比较实验,结果表明,所提算法的性能优于其他特征选择算法.  相似文献   

5.
一种组合型中文文本分类特征选择方法   总被引:2,自引:1,他引:1  
根据基于频数分布和基于互信息的特征选择模式的特点,将传统的tf-idf因子以及基于互信息的特征选择方法分别进行了改进,并在此基础上提出了一种新的组合型特征选择方法。试验结果表明,该算法提高了文本分类的准确率。  相似文献   

6.
基于互信息度量的特征约简是一种重要的Filter特征约简方法,其目的是剔除条件特征中与决策类别不相关的特征,并使约简子集中特征间的相关性最小.为此,本文基于特征间的区分性评价准则,提出了互信息下二进制区分矩阵的特征约简模型,并从理论上证明了二进制区分矩阵模型与互信息模型下特征约简的等价性;其次给出了条件特征的重要性度量准则,并利用渐进式计算方法构造了一种快速的特征约简算法;最后通过实验进一步验证了算法的可行性.  相似文献   

7.
隐写检测特征维数的增加,不仅增加了分类器训练时间和预测时间,甚至还会造成"维数灾难".因此,为达到特征降维的目的,对空域隐写检测特征选择进行研究,提出了一种基于条件互信息的特征选择算法.该算法首先选取一个与类标签具有最大互信息的特征,接着选取与此特征和类标签具有最大条件互信息的一个特征;然后通过前向寻找方式,从未选择特征子集中循环选取与刚选取特征和类标签具有最大条件互信息的特征,一直到选出规定数目的特征后结束循环.实验结果表明,与其他算法相比,所提算法取得了较好的特征选择效果.  相似文献   

8.
基于互信息和文化基因算法的网络流量特征选择   总被引:1,自引:0,他引:1  
利用文化基因框架的引导,提出一种结合了封装和过滤的混合型特征选择算法.该算法在传统的遗传算法中采用了基于互信息的局部搜索算法,全局搜索以分类器精度为适应度函数,保证得到全局最优解;局部搜索以联合互信息为评价指标,加快了寻找最优特征子集的收敛速度.实验表明,与现有算法相比,该算法在特征数量和计算复杂度上有显著改进,采用该算法的网络流量识别方法能以更少的特征获得更高的分类精度.  相似文献   

9.
一种改进的互信息特征选取预处理算法   总被引:4,自引:1,他引:3  
讨论了基于互信息的特征选取算法在文本分类中的性能问题,分析了利用这种特征选取算法存在分类精度不高的原因,认为互信息为负值的特征在分类中具有很重要的作用.在此基础上提出了一种基于互信息特征选取的改进算法,该算法加强了互信息为负值的特征在分类中的作用.实验结果表明,改进后的算法可以有效地提高文本分类精度。  相似文献   

10.
针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy, mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的相关度,使用每项相关度占其相关度之和的比例设计了标记权重,由此构建了特征和标记集间的相关度,初选与标记集相关度高的特征;其次,计算对象在特征上的距离,构建了新的特征权值更新公式,基于标记权重改进多标记ReliefF模型.然后,基于互信息和标记权重构建了最大相关性,设计了最小冗余性及其新的最大相关最小冗余评价准则,并将其应用于多标记特征选择,进一步剔除冗余特征;最后,设计了一种基于ReliefF和最大相关最小冗余的多标记特征选择算法,有效提高了多标记分类性能.在8个多标记数据集上测试所提算法的平均分类精度、覆盖率、汉明损失、1错误率和排序损失,实验结果证明了该算法的有效性.  相似文献   

11.
应用特征选择处理多标签数据分类时"维度灾难"问题已成为重要研究方向,因此提出一种基于邻域维护准则的特征选择算法(NPFS,feature selection algorithm based on neighborhood preservation criterion)。通过近似基于特征子空间和基于标签空间的2个相似度矩阵来构建相似性维护表达式,再通过线性近似扩展相似性维护公式得到邻域关系维护公式,并计算出邻域关系维护得分(NRPS,neighborhood relationship preserving score)来评估特征子集的重要性,结合贪婪方法设计具有NRPS的多标签特征选择算法(NPFS)。仿真结果表明,对比MMIFS算法和MDMR算法,所提出的算法在平均准确率、覆盖率、汉明损失、1-错误率、排名损失5个性能指标上均有改善。  相似文献   

12.
针对高维数据的特点并基于线性回归模型,利用变量选择降维技术,提出了一种新的、有效的变量选择(或称特征提取)的正则化估计方法.新的正则化估计方法主要考虑了数据的噪声(方差)对正则化估计的影响,在寻找估计的正则化路径时能对方差进行有效估计,且基于凸优化问题的KKT条件和坐标算法思想给出了正则化估计算法的实施细节.实验结果表明,该方法能够提高高维数据集进行估计和变量选择的准确性,是高维数据挖掘中新的、有效的特征提取方法.  相似文献   

13.
利用非线性流形学习的轴承早期故障特征提取方法   总被引:8,自引:0,他引:8  
针对早期故障微弱特征难以提取的问题,提出了一种基于非线性流形学习的滚动轴承早期故障特征提取方法.在由时域指标和小波频带能量组成的原始特征空间中,结合局部切空间排列学习算法的特点,采用散布矩阵分类测度指标,实现了局部邻域的优化选取,从而提取出最优的敏感故障特征.通过实例应用,表明该方法有效地克服了主分量分析和非线性核主分量分析方法的不足,提取的融合特征敏感性更好,从而提高了故障模式的分类性能,实现了轴承的早期故障诊断.  相似文献   

14.
针对在脉冲噪声环境下的直接序列扩频信号的伪随机(PN)码盲估计问题,提出了一种利用最大熵准则投影逼近子空间(MCC-PAST)算法和滑窗技术相结合的PN码盲估计方法。该方法利用最大熵准则,实现了在脉冲噪声背景下对扩频信号的特征进行稳定快速的追踪。通过对迭代过程中的特征子空间进行梯度估计,实现了可变遗忘因子(VFF)的自适应更新,使得权值的收敛精度和收敛速度得到了同时的优化。算法数据存储量小,复杂度低,易于硬件实现和实时数据处理。仿真结果表明,在脉冲噪声环境下该方法对PN序列估计的正确率和稳定性优于传统方法。  相似文献   

15.
针对基于流形正则化自表示(MRSR)的无监督特征选择算法直接从原始的样本空间构造相似矩阵可能会 导致重构空间中样本的相似性描述得不够准确的问题,提出了基于自适应流形正则化自表示的无监督特征选择 (AMRSR)算法。 基于自适应流形正则化自表示的无监督特征选择算法在 MRSR 算法的基础上通过对相似矩阵施 加概率最近邻约束将相似矩阵的学习嵌入到优化过程中,在重构空间中自适应地学习样本的相似性,使得在每一 次迭代中获取更加精确的样本局部几何流形结构,从而选择具有代表性且保持局部几何流形结构的特征。 最后, 在四个公开数据集上进行了大量的对比实验,通过将算法的特征选择结果用于 K-means 聚类并采取两种常见的聚 类评价指标:聚类精确度和归一化互信息评价聚类效果。 实验结果表明,AMRSR 算法与现有的一些算法相比有更 高的聚类精确度和归一化互信息,进一步表明该算法特征选择效果更好。  相似文献   

16.
为了减少噪声对配准精度的影响,降低误匹配率,提出了一种新的、有效的块匹配运动估计算法.算法利用Canny算子提取当前帧的轮廓,从而得到特征块,并将参考帧进行2值化处理,在新的匹配准则下,对特征块与参考帧进行配准.实验结果表明,匹配精度有明显提高.  相似文献   

17.
王帆  赵春晖  张志 《应用科技》2009,36(3):11-14
针对经典PCA算法在人脸特征提取上的局限性,提出了一种基于克隆选择算法的特征选择方法.克隆选择算法的收敛速度快,具有较强的全局搜索能力,可以快速搜索到最有利于分类的特征空间;因此利用克隆选择算法对PCA变换后的特征向量进行选择,可以有效避免PCA只选择人脸轮廓信息,而忽略细节信息的不足,在人脸识别中取得了较好的效果.通过对ORL和Yale人脸库的仿真实验表明,该方法无论在识别率、降维效果还是稳定性方面,性能均优于遗传算法,不但有效降低了特征向量维数,还将人脸识别率提高到91.5%,因此研究该算法具有很强的现实意义.  相似文献   

18.
针对连续空间优化问题,提出基于新型蚁群算法和模式搜索策略的组合蚁群优化算法。该算法将解空间的每维变量都划分成若干子域,根据每维变量各个子域中信息量占每维变量总信息量的比例来决定蚂蚁在各个子域间的转移,并在各子域中引入遗传操作实现蚂蚁品质的提升。同时,当最优解经过若干代没有改进时,对所有蚂蚁通过模式搜索策略加快收敛进程。以非线性连续优化问题为例进行仿真,结果表明:该方法比遗传算法具有更好的性能。最后,将该算法应用于反应动力学模型参数估计,取得良好的效果。  相似文献   

19.
针对非线性特征提取问题,基于核最大间距准则(KMMC),提出一种新的特征提取方法,即一组具有统计不相关性的最优核鉴别矢量集的简单计算方法.与原KMMC特征提取方法相比,新的特征提取方法消除了最优核鉴别矢量间的统计相关性,提高了特征提取的有效性.通过在ORL人脸库和YALE人脸库上进行试验,结果表明提出的特征提取方法在有效性方面整体上好于原KMMC特征提取方法和常用的核主成分分析(KPCA)法.  相似文献   

20.
基于知识发现中的局部异常因子思想, 提出一种基于局部密度比的模糊隶属度设置算法, 该算法根据样本的邻域密度比设置样本的隶属度, 并采用一种单参数选择策略. 数值实验表明, 所提出的算法在带噪声的非线性函数估计方面具有很好的鲁棒性, 有效地解决了模糊支持向量机中的模糊隶属度设置问题, 对处理带噪声的分类和非线性函数估计问题具有重要的意义.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号