首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
针对在基于惯性传感器人体行为识别的研究中,集合经验模态分解(ensemble empirical mode decomposition,EEMD)无法自适应地筛选出对不同分类行为更有用的固有模态函数的问题,特别是对步行、上楼、下楼3种易混淆行为的识别,提出一种改进的自适应集合经验模态分解特征提取方法,通过对不同分类行为筛选不同固有模态函数并提取窗口均值差异等新颖特征,有望在不同的分辨率下得到更准确、更有效的原信号特征信息。为了验证该方法的有效性,实验分别用典型时域频域特征与该方法提取的特征集训练K近邻(K-nearest neighbor,KNN)与支持向量机(support vector machine,SVM)分类器,并采用留一法(leave-one-out,LOO)交叉验证算法进行测试。结果表明,当分别采用KNN和SVM进行分类时,相比于原方法,改进的方法对步行、上楼和下楼3种行为的平均识别准确率分别提高了29.22%(KNN)和15.79%(SVM),对分类的7种不同行为的总平均识别准确率分别提高了95.11%(KNN)与93.14%(SVM)。  相似文献   

2.
针对ARCO(AUC and rank correlation coefficient optimization)算法在进行两类问题特征选择时,采用斯皮尔曼等级相关系数度量已选特征子集冗余性带来信息损失和特征相关性与冗余性度量取值范围不一致的缺陷,提出改进的Pearson相关系数度量特征冗余性,并归一化特征相关性和冗余性度量范围,得到APCO(AUC and improved Pearson correlation coefficient optimization)算法以克服ARCO算法的不足。同时,针对实现多类特征选择的MAUCD(using MAUC as the relevance metric to rank features directly)和MDFS(MAUC decomposition based feature selection method)算法没有考虑特征冗余,且MDFS易选择到局部最优特征子集的问题,提出适于多类问题的改进Pearson相关系数度量特征冗余性,得到基于mRMR(maximal relevance-minimal redundancy)框架的MAUCP和MDFSP算法,克服MAUCD和MDFS算法的缺陷。以SVM、NB和KNN为分类工具,构造基于所选特征子集的相应分类器,以其AUC(MAUC)值度量相应特征子集的性能。7个二类和3个多类不平衡基因数据集的实验结果表明:提出的APCO、MAUCP和MDFSP算法分别优于ARCO、MAUCD和MDFS算法,也优于其他经典基因选择算法。  相似文献   

3.
在南方水稻遥感分类中,耕地细碎化;干扰性其他植被多是造成分类效果差主要因素。针对此类因素可对多时相影像进行特征提取、叠加成多时相特征集合,利用随机森林并结合归一化特征重要性对多时相影像特征集合进行特征测试,分析每个特征对分类结果的影响。根据每个变量的影响程度(贡献程度)的不同进行一个排序,从而选出最优的分类的特征优选子集。再利用随机森林作为分类器,对特征优选子集进行水稻的分类提取的识别方法。与3组未进行特征选择的SVM(支持向量机)算法的分类结果进行对比。实验结果表明:1)多时相影像的特征集合的分类精度高于单时相影像的特征集合的分类精度;2)基于随机森林对原始特征集合进行特征选择后的总体精度92.09%和Kappa系数90.36%,特征选择能有效去除冗余信息,从而提高分类精度。综上所述,在耕地细碎化,多植被干扰的南方丘陵地带中,结合随机森林的归一化特征选择的方法为水稻的识别和提取研究提供了有效方法。  相似文献   

4.
支持向量机(SVM)已经成为药物构效关系数据分析的一种常用统计方法,但其存在变量子集选择问题,且大量的冗余变量还可能影响SVM模型的预测精度,因此需要借助变量筛选来实现降维﹒本文提出了一种新的基于受试者工作特征曲线下面积(AUC)的支持向量机分类方法(AUC-SVM)﹒首先,计算出变量的AUC值;其次,利用AUC值和前向选择算法选择最具信息量的变量子集,并剔除数据中无关和冗余的变量;最后,以AUC作为提取变量重要性的标准,通过真实的药物构效关系数据集来评估AUC-SVM性能,并与传统SVM方法相比较﹒实证结果表明,AUC-SVM算法能明显提高分类预测性能﹒  相似文献   

5.
针对原始故障数据集因"高维"和"海量"引发的"维数灾难"问题,提出一种基于类内类间距离判据和遗传算法相结合的故障特征选择方法.在提取出时域、频域、小波包频带能量作为描述系统状态的原始故障特征集基础上,经类内类间距离判据初次选择剔除不相关特征之后,引入遗传算法二次选择去除冗余特征,得到一种近似最优特征子集.结果表明:基于类内类间距离判据和遗传算法的故障特征选择方法可以剔除不相关和冗余特征,最终得到精简特征子集,并且筛选出的特征子集对故障类型的判别有很高的识别能力.  相似文献   

6.
文本自动分类的一项关键技术是特征选择。本文针对信息过滤的特点,对特征选择方法进行了改进,提出了一种基于语义神经网络的文本特征选择方法。首先对原始特征集进行初始筛选,去除冗余特征及噪声后,对得到的特征子集采用语义神经网络进行智能的特征选择,其核心是关联度及激活变量的计算。从而得出代表问题空间的最优特征子集,实现降维并提高分类精度。实验证明,该方法可以极大地降低文本的维数,提高文本过滤的质量。  相似文献   

7.
密集烤房内烤烟烘烤阶段的自动识别是建立智能化烟叶烘烤系统的重要环节.为了有效地识别烤房内烤烟的烘烤阶段,该文提出了一种基于图像特征和GA-SVM(Genetic Algorithm-Support Vector Machine)相结合的方法.该方法将机器视觉系统提取的烤烟图像特征作为SVM的输入参数,通过GA全局搜索特性选取出模型的最优特征子集,最后通过多分类SVM实现对烘烤阶段的识别,同时验证了选取特征的有效性.仿真结果表明:从9个原始特征中筛选出5个图像特征,总体识别精度从93.7%提高到96.5%,能有效地识别烤烟的烘烤阶段,具有良好的在线应用前景.  相似文献   

8.
针对目前特征选择算法应用于数据分类精度不理想的问题, 提出一种基于最大相关最小冗余的特征选择算法, 该算法结合特征选择算法和聚类分析算法对特征进行处理, 将分类中冗余的特征去除. 利用支持向量机对一组心脏病患者实际测量得到的数据进行分类实验, 实验结果表明, 该方法可有效筛选影响分类的特征, 进而提高分类准确率.  相似文献   

9.
为了从高维基因表达谱数据中识别出与肿瘤分类高相关的基因子集,提出一种基于最小冗余最大相关(minimal redundancy maximal relevance,mRMR)和改进磷虾群(improve krill herd,IKH)算法的两阶段混合特征选择算法,即采用最小冗余最大相关算法评价特征重要性以筛选出高相关、...  相似文献   

10.
特征选择作为一种常见的降维方法,一直以来都是机器学习和数据挖掘领域的热点话题.针对传统特征选择算法没有充分考虑特征全局冗余性,导致选择的特征子集对分类识别精度不够高的问题,提出基于复杂网络节点重要度评估和遗传算法的特征选择算法,将每个特征视为网络节点,根据互信息建立边,将特征选择问题转化为节点重要度评估问题,利用遗传算法选择最优特征子集.实验结果表明此算法能够找到较为优秀的特征子集,有效降维并提高分类精度.  相似文献   

11.
【目的】随着遥感技术迅猛发展,在影像解译过程中提取的信息越来越繁杂多样。为提高地物分类准确率,常加入更多的特征信息,而由此往往造成一定的信息冗余,导致分类效率甚至准确率降低。笔者利用随机森林(RF)和支持向量机(SVM)分类器,探索在遥感分类过程中保证分类精度的同时又能降低特征维度的方法。【方法】以吉林省安图县福兴林场部分区域为研究对象,利用2015年Landsat-8影像为数据源,提取光谱信息(红、绿、蓝、近红外和短波红外波段)、植被指数(NDVI、增强型植被指数、比值植被指数和裸土植被指数)、纹理(同质性、均值、二阶矩、方差、差异性、对比度、熵和相关性)和地形信息(坡度和坡向)共19个指标作为分类特征变量。以RF分类器估测的特征重要性进行特征选择为对照,分别以单个特征在RF和SVM两分类器中的分类准确率为依据进行特征选择,并对选取的特征进行主成分分析,与未做主成分分析的进行区分,再分别用RF和SVM分类器进行分类,评价分类精度,确定最优特征和分类器组合。【结果】①基于SVM单个特征分类准确率选取特征,对选取的特征进行主成分分析,再用RF进行分类,该方法与其他方法相比分类性能最好,当特征维度为5时,总体精度为0.86,Kappa系数为0.83; 与输入全部特征进行分类相比,不仅提高了分类精度,而且降低了特征维度,使分类效率得以提升。基于RF特征重要性选取特征的RF分类取得了较高的分类准确率,但特征维数小于7时,分类准确率波动较大; 在特征维数为4时分类准确率增至最大值(0.88),随后骤降为0.83,之后基本保持在此水平。而基于单个特征分类准确率选取特征,分类准确率变化较为平缓,如上所提最优分类性能方法的分类准确率波动范围基本在0.02。②基于单个特征在RF和SVM分类器中的分类准确率进行特征选择,在随后的分类过程中,SVM分类器分类精度总体高于RF。基于RF单个特征分类准确率选取特征的SVM分类,及基于SVM单个特征分类准确率选取特征并对选取特征进行主成分分析的RF分类,较仅利用SVM或RF单个分类器选取特征并分类的分类准确率更高。【结论】①基于单个特征分类准确率的特征选择方法,可在保证分类精度的同时降低特征维度,且在较低维度时,基于该方法选取特征的分类精度较基于特征重要性选取特征的分类精度更稳定。②基于单个特征分类准确率进行特征选择,不同分类器选取的特征有所差异,分类准确率也不同,利用多个分类器较单个分类器选取特征并分类的性能更好。③在中低维度时,RF分类器的分类准确率可能与特征输入顺序有关,对输入特征进行主成分分析有利于提高分类器的分类精度及稳定性。  相似文献   

12.
Automatic recognition of skin micro-image symptom is important in skin diagnosis and treatment. Feature selection is to improve the classification performance of skin micro-image symptom.This paper proposes a hybrid approach based on the support vector machine (SVM) technique and genetic algorithm (GA) to select an optimum feature subset from the feature group extracted from the skin micro-images. An adaptive GA is introduced for maintaining the convergence rate. With the proposed method, the average cross validation accuracy is increased from 88.25% using all features to 96.92 % using only selected features provided by a classifier for classification of 5 classes of skin symptoms. The experimental results are satisfactory.  相似文献   

13.
针对非侵入式负荷辨识中,单一V-I轨迹特征无法对相似的轨迹特征进行有效识别以及所提取特征易出现冗余甚至噪声特征的问题,提出了一种基于K-means聚类与PSO特征优选的分级非侵入式负荷识别方法。首先,利用K-means算法对负荷V-I轨迹的HOG特征进行初步分类,将轨迹相似的电器分为一类;然后,对每一类中的电器电流数据进行多维特征提取并采用PSO算法选取最优特征子集;最后,利用KNN模型进行二级负荷识别。实验结果表明,该方法有效提高了负荷识别准确率;提取V-I轨迹的HOG特征解决了同一电器V-I轨迹波动的问题;对一级分类后的每一大类单独进行PSO特征优选KNN二级分类,解决了部分电器对特征子集适应性差的问题。所提方法在一定程度上解决了冗余特征甚至噪声特征对辨识准确率的影响,为负荷特征的选取提供了新的思路,对负荷辨识的实际应用具有重要的参考意义。  相似文献   

14.
为解决采用表面肌电信号(surface electromyography, sEMG)进行手势识别时电极贴片位移、受试者动作变化等复杂情况下分类识别准确率下降这一问题,提出了一种基于表面肌电信号与迁移学习的手势分类模型。首先对4通道表面肌电信号进行活动段提取与降噪处理,然后提取活动段信号的四种时域特征与两种频域特征。采用流形嵌入分布对齐(manifold embedded distribution alignment,MEDA)方法将源领域和目标领域的特征矩阵嵌入到格拉斯曼流形中进行流形特征学习,减小两域之间的数据差异,消除特征退化;同时根据自适应因子执行动态分布对齐,动态调整数据不同分布差异下边缘分布和条件分布的相对重要性。对多名受试者开展实验以验证所提方法的合理性,实验结果表明:所提方法与决策树(decision tree, DT)、支持向量机(support vector machine,SVM)、k临近(k-nearest neighbor,KNN)三种传统机器学习方法相比,识别准确率分别提高了13%、21%、9%。与未执行流形学习与动态分布对齐的联合分布适配(joint distribution adaptation,JDA)迁移学习方法相比,识别准确率提高了52%,达到93%。  相似文献   

15.
【目的】通过研究随机森林(random forest, RF)特征筛选对单木树种分类精度的影响,以及多源遥感数据协同下单木树种分类的有效性,分析不同特征对单木树种分类的影响程度。【方法】以东北林业大学帽儿山实验林场中林施业区的两块100 m×100 m样地为研究对象,首先,以机载激光雷达(LiDAR,light detection and ranging)和多光谱遥感CCD(charge coupled device)影像为数据源,分别基于机载LiDAR数据提取高度、强度和树冠大小等共37个特征,基于CCD影像提取光谱和纹理共21个特征;其次,以随机森林方法进行特征筛选,之后以随机森林和支持向量机(support vector machine, SVM)两种非参数分类器,结合不同数据源和特征,采用12种分类方案,利用总体精度(overall accuracy, OA)、用户精度(user’s accuracy, UA)和生产者精度(producer’s accuracy, PA)对分类结果进行对比与精度评价。【结果】经随机森林特征筛选后,分类结果优于未进行特征筛选的结果,总体精度可以平均提高3.47%,使用机载LiDAR和CCD影像协同分类相较于仅使用CCD影像总体精度平均提高6.07%。【结论】随机森林特征筛选可以优化特征,减少特征冗余,提高分类精度;多源数据结合也可以提高分类精度;在多源数据结合时,光谱特征最重要,LiDAR提取的强度特征相较于高度特征更稳定。  相似文献   

16.
针对传统局部二值模式(local binary pattern,LBP)算子提取的图像纹理特征不完整、不能全面刻画人脸局部特征的问题,提出一种基于邻域相关度的改进LBP算子.该算子首先计算窗口内每个像素点的邻域相关度;其次利用邻域相关度的均值和方差构造新的NC_LBP算子,进而提取图像局部直方图特征,作为人脸识别的依据;最后利用Chi平方统计法计算直方图的不相似度,并用KNN算法进行分类.仿真实验表明,改进NC_LBP算子在ORL,JAFFE和YALE人脸数据库的识别中效果较好,特征区分度明显,识别准确率较高.  相似文献   

17.
中文文本数据的半结构化甚至非结构化的特点使得其分类存在着特征高维的问题,传统单一的特征降维方法难以满足大数据时代的文本分类需求.基于此,提出了一种基于卡方统计(Chi-square statistics,CHI)和主成分分析(principal component analysis,PCA)的混合特征降维方法(CHI-...  相似文献   

18.
针对K近邻方法分类准确率较高的特性,提出了一种基于相似度判据的K近邻分类器车牌字符识别方法.通过大量实验,选取字符的网格特征和轮廓特征作为分类依据,用特征融合方法将两种特征合并,实现特征的串行融合.根据相似度判据作K近邻分类,实现了一个车牌字符识别系统.实验表明,这种方法具有良好的识别效果,鲁棒性强,具有较大的实用价值.  相似文献   

19.
针对大数据量音频的高速处理,提出一种快速的声学特征超向量生成方法,有效提高音频识别系统的识别速度和精度.所提方法首先将多个连续音频帧的常用声学特征构成声学特征图,进而使用低复杂度的运算方法在其中快速提取维数达数十万的Haar-like声学特征;然后使用AdaBoost.MH算法,筛选出具有较高代表性的Haar-like声学特征模式组合,用以构成声学特征超向量;进而提出Random AdaBoost特征筛选方法,进一步提高特征筛选速度.实验结果表明,在音频事件识别、说话人识别、说话人性别识别3种场合下,使用Haar-like声学特征可以使SVM、C5.0、AdaBoost等识别算法获得比MFCC、PLP、LPCC等常用声学特征更高的识别准确率,同时可以获得7~20倍的训练速度提升和5~10倍的识别速度提升.   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号