首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对SVM中当训练样本数非常多时,分类算法训练阶段的计算量庞大;当训练样本集中存在噪声时,影响训练阶段超平面划分的准确度,导致分类准确率降低等问题,提出了一种基于密度的训练样本裁剪的SVM算法。首先应用密度裁剪算法裁剪掉原始训练样本集中存在的噪声和冗余样本,作为新训练样本集,使用网格搜索算法在新的训练样本集中对SVM参数(C,g)寻优,进行SVM训练并建模,达到分类的目的。实验结果表明,该算法同无样本裁剪的SVM算法相比分类准确率有所提高、训练阶段的时间耗费大大降低。  相似文献   

2.
基于SVM的特征加权KNN算法   总被引:19,自引:1,他引:19  
作为一种非参数的分类算法,K-近邻(KNN)算法是非常有效和容易实现的.它已经广泛应用于分类、回归和模式识别等.在应用KNN算法解决问题的时候,要注意两个方面的问题--样本权重和特征权重.利用SVM来确定特征的权重,提出了基于SVM的特征加权算法(FWKNN,feature weighted KNN).实验表明,在一定的条件下,FWKNN能够极大地提高分类准确率.  相似文献   

3.
针对多通道脑电信号特征提取过程中存在的特征向量稳定性低及区分度差的问题,提出相位同步与空间位置相结合的特征提取算法.首先,利用相位锁定值(PLV)衡量不同模式下不同脑区的相关程度,通过相关性分析发现感觉运动的作用机制,并按相关程度选取特征电极;然后,采用共空间模式算法(CSP)对所选电极间的PLV进行特征提取;最后,使用支持向量机(SVM)完成运动想象分类.本方法在持续4 s和1 s的左右手运动想象分类中分别获得平均91.3%和82.7%的准确率,相较于传统CSP算法具有更高的分类准确率,需要的电极更少,能快速响应短时不连续性运动想象.  相似文献   

4.
一种新的选择性支持向量机集成学习算法   总被引:8,自引:2,他引:6  
针对支持向量机(SVM)在应用于集成学习中会失效的问题,提出一种选择性SVM集成学习算法(SE-SVM),利用ξα误差估计法估计个体SVM泛化性度量,并基于负相关学习理论引入差异性度量,通过递归删除法选择出一组泛化性能优良、相互间差异性大的SVM参与集成学习.基于UCI数据的仿真实验表明,SE-SVM能够平均提高SVM的分类正确率0.4%,比常规的Bag-ging集成学习方法和负相关集成学习方法的分类正确率分别提高了0.24%和0.16%.  相似文献   

5.
摘要: 为完成ECG(Electrocardiogram)信号特征点提取, 并对ST 段分类, 提出了一种基于离散小波变换和支持向量机的ST 分类算法。首先对信号进行预处理, 完成噪声消除, QRS 波群检测和提取特征值; 然后计算ST段平均值、曲线面积和标准差, 并结合使用SVM(Support Vector Machine)对ST段进行分类。Matlab 仿真结果表
明, 小波去噪效果明显,ST 段未出现失真现象, 特征点提取完整。经MIT鄄BIT 数据库验证, 分类结果显示交叉验证准确率平均值为80. 70%, 训练准确率平均值为91. 83%, 测试准确率平均值为74. 28%。  相似文献   

6.
支持向量机(support vector machine,SVM)是分类算法中集高效性、准确率和实时性于一体的分类方案。但由于在SVM分类决策的过程中,无关的分类器也参与了投票,使得方案的实时性和分类可靠性有一定程度的降低。提出了基于相似度的高效SVM网络流量识别方案(efficient SVM based on similarity,ESVMS)。ESVMS通过估算待分类实例可能所属的类别范围,排除SVM中那些无关分类器的投票决策。实验结果表明ESVMS较SVM分类准确度几乎没有降低,但分类实时性进一步提高。  相似文献   

7.
概率数据关联是多源信息融合算法中的关键问题,本文主要对基于雷达和电子支援措施(ESM)双传感器融合的数据关联问题展开研究.由于雷达和ESM传感器方位角数据分布近似相同,可以通过对ESM数据的分析得到判别函数,使用相应的判决规则对点迹和航迹进行关联,这本质上可以看作是一个模式识别问题.本文考虑到支持向量机(SVM)模型在模式分类中的良好表现,建立了基于SVM的雷达ESM系统的点迹-航迹关联模型,使用ESM传感器航迹数据训练SVM模型,对雷达点迹数据进行分类,获得关联结果.最终模拟结果表明:与经典的多假设跟踪算法相比,所提出的算法可有效提高关联准确率.  相似文献   

8.
支持向量机在表面肌电信号模式分类中的应用   总被引:3,自引:0,他引:3  
采用小波变换的方法对实验采集的原始四通道表面肌电信号(sEMG)进行了分析,并提取小波分解系数的奇异值构建特征矢量,利用“一对一”分类策略和二叉树设计的多类支持向量机(SVM)分类器,很好地实现了对前臂8种运动表面肌电信号的模式分类,8种运动模式的平均识别率为98.75%.研究表明SVM分类准确率明显优于传统的BP神经网络、Elman神经网络和RBF神经网络分类器,且识别精度高,鲁棒性好,对肌电信号及其他非平稳生理电信号的模式识别,提供了一种具有良好应用前景的新方法.  相似文献   

9.
具有模糊隶属度的模糊支持向量机算法   总被引:8,自引:1,他引:7  
针对传统支持向量机(SVM)由于样本中存在孤立点数据或噪声而导致的过学习问题,通过分析模糊支持向量机(FSVM)的特点,指出其关键在于如何构建模糊隶属度,为此结合k近邻法思想提出了一种新的隶属度函数构造方法.该方法不仅考虑了样本点到类中心的距离,而且对各样本点排列的紧密程度也进行了估计,与传统SVM相比,它对样本的分类更为清晰和准确.将该方法应用于汽车发动机的实际故障诊断中,结果表明:SVM与普通FSVM的分类正确率较低,而采用新的模糊隶属度的FSVM算法却有较高的识别率,当k为5时分类正确率达到了70.93%,因此验证了该算法的有效性.  相似文献   

10.
在大样本测试集下国内现有成熟的OCR识别软件的首位识别准确率为95%~97%之间,在准确率和方法上仍有提升和改进的空间。提出一种基于概率特征和结构特征融合的自适应文字识别算法,模拟人类学习的模式,通过对训练样本的不断学习去构建汉字在测量空间的概率分布矩阵,然后比对原始图像和标准汉字库中汉字的概率分布矩阵的相似度来达到汉字分类的效果。其中相似度度量准则是从矩阵空间的结构和概率2个角度出发去构建的,充分考虑了结构模式识别和统计模式识别的优缺点。实验结果显示算法在训练样本下的首位识别正确率可以达到99.66%,在1 623张非训练样本文字图像下的首位识别正确率可以达到99.13%,在5 515张非训练样本文字图像下的首位识别正确率可以达到98.57%。可以证明提出的相似度度量方法在文字识别中的有效性。  相似文献   

11.
为弥补特征提取中的语义缺陷,提出了一种利用领域知识规则填补特征与高级语义之间鸿沟的思想,从体育视频中对语义对象进行有效的特征提取,并采用支持向量机元分类器和组合策略对体育视频进行分类的方法.实验表明,该分类方法对大部分体育视频都具有很好的分类效果,平均准确率可达92.23%,优于其他提取特征无语义关联的分类方法.  相似文献   

12.
评价准则对分类器的构建起着重要作用, 在不平衡数据学习(IDL)中这更是如此. 众多研究已表明, 绝大部分传统的以精度准则为优化目标而获得的分类器是不适于IDL的. 那么其他准则又如何呢? 本文致力于回答这个问题. 通过在支持向量机(SVM)模型上进行“元学习”(Meta-Learning), 我们研究了若干常用的评价准则对IDL的影响, 这些准则包括ACC(精度)、BAC(平衡精度)、 GMean(几何平均)、F1(F1得分)、 IG(信息增益)、AUC(ROC曲线下方图面积)以及本文提出的两个新准则GAF和GBF. 在16个来自UCI的不平衡数据集上进行了仿真实验; 对实验结果的统计分析表明, 不同的准则对分类器性能的影响有显著差异. 即便是对于先进的学习方法SVM而言, 若以精度准则最大化选择分类器, 那么得到的SVM分类器也容易偏向预测多类(majority class). 然而, 通过在其他准则上优化, 我们能输出纠偏了的SVM分类器, 它们的整体性能更高, 尤其是在预测少类(minor class)能力方面得到了显著提高. 进一步地, 仿真实验发现在GAF以及GBF准则上优化所得的SVM分类器具有稳定且良好的性能, 这表明它们是值得采用的评价准则.  相似文献   

13.
宋建  王宇峰  梁家睿  李东 《科学技术与工程》2022,22(27):12000-12005
针对注塑生产过程中人工质量检测存在的效率低、成本高等问题,提出了一种基于注塑加工过程数据对产品尺寸是否合格进行预测判定的方法,首先对于清洗后的数据集采用5折交叉验证筛选出LR模型、SVM模型等5个分类模型,然后以ROC曲线和AUC值作为性能评估指标,综合比较和分析了5个分类模型在不同特征选取方法下的分类性能。结果表明:基于树模型特征选取与LR算法组合对本文的数据集表现出优良的分类性能,准确率可达96.42%,具有一定的工程应用价值。  相似文献   

14.
为了提升传统随机森林算法的分类精度,本文首先对传统随机森林模型中的决策树根据分类性能评价指标AUC值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度并生成相似度矩阵,然后根据相似度矩阵对这些决策树进行聚类,从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI数据集的实验表明,改进后的随机森林算法分类精度上最大提高了2.91%。  相似文献   

15.
利用车辆传动系统试验数据对车辆进行故障诊断和性能评价可以实现车辆故障预警,提高可靠性,从而提高车辆性能,但测试数据有数据量大、不平衡、维度高、噪声多的特征,使得传统数据分析算法会产生次优的分类模型.针对上述问题,提出了一种改进的不平衡数据分类支持向量机算法.该算法赋予各样本不同的权值,用马氏距离改进模糊隶属度的设计以排除变量相关性干扰,同时可以输出正常状态下的故障概率.实验结果表明,该算法能够有效提高故障诊断的准确性,概率输出模型可用于故障预警和性能分析.   相似文献   

16.
为克服支持向量机中模型参数的随意选择对分类性能造成的不利影响, 提出了基于混沌人工蜂群算法的支持向量机(CABC鄄SVM: Chaotic Artificial Bee Colony algorithm of Support Vector Machine)参数优化方法。该方法采用Logistic 混沌映射初始化种群和锦标赛选择策略, 对支持向量机的惩罚因子和核函数参数进行优化时以分类准确率作为适应度函数。通过UCI 标准数据集实验证明, CABC 具有较强的局部和全局搜索能力, 其优化的支持向量机可在很大程度上克服局部极值点, 从而获取更高的分类准确率, 并有效缩短了搜索时间。将该方法应用于实际齿轮故障诊断中, 采用小波相对能量作为特征输入支持向量机, 分类准确率达到99. 4%, 验证了该方法的可行性和有效性。  相似文献   

17.
胡婧  刘伟  马凯 《科学技术与工程》2019,19(33):296-301
为了探讨中文病历文本预处理后高维稀疏性的特点,导致文本分类精度低、算法模型收敛速度慢等性能问题,提出一种基于粗糙集的词袋(BOW)模型结合支持向量机(SVM)的文本分类算法(BOW+SVM)。该算法首先采用BOW模型对特征词提取构建高维度文本空间向量,然后利用粗糙集的属性约简算法对文本特征处理,把模糊的、冗余的属性从决策规则中清除,降低空间向量维数,最后利用所提纯的特征与SVM分类器交叉结合进行文本分类。在Python+TensorFlow环境中设计六种交叉结合的算法仿真对比实验,结果表明:基于BOW+SVM高血压病历文本分类模型精准度可达97%。可见改进后的模型,能够解决样本分部不均,克服高维度稀疏特征空间的问题,有效改善病案管理工作流程。  相似文献   

18.
针对信用评价数据存在离群点和噪声问题, 提出一种基于离群点剔除的支持向量机(SVM)信用风险评价模型. 该模型利用模糊c-均值聚类算法剔除样本离群点, 采用粒子群算法优化支持向量机分类参数, 进而提高支持向量机的分类性能. 将该方法应用于信用风险评价中的结果表明, 相比于其他模型, 该方法分类精度更高.  相似文献   

19.
提出了一个在快速序列视觉呈现任务下的脑电信号分类算法.将图片序列快速呈现给受试者并将同步采集脑电信号,将脑电信号截取分段作为样本集.通过约束有监督降维后样本与样本中心差值的趋近方向,使用训练集脑电数据训练得到映射矩阵;通过特征提取函数将训练集和测试集的脑电数据样本变换为特征矢量,使用支持向量机对样本进行分类.实验结果表明,算法对24名受试者的脑电信号分类的平均正确率为91.5%,平均AUC达到了0.95,证明脑电分类算法具有良好的分类性能,可以在快速序列视觉呈现任务中准确地识别目标图片.  相似文献   

20.
【目的】随着遥感技术迅猛发展,在影像解译过程中提取的信息越来越繁杂多样。为提高地物分类准确率,常加入更多的特征信息,而由此往往造成一定的信息冗余,导致分类效率甚至准确率降低。笔者利用随机森林(RF)和支持向量机(SVM)分类器,探索在遥感分类过程中保证分类精度的同时又能降低特征维度的方法。【方法】以吉林省安图县福兴林场部分区域为研究对象,利用2015年Landsat-8影像为数据源,提取光谱信息(红、绿、蓝、近红外和短波红外波段)、植被指数(NDVI、增强型植被指数、比值植被指数和裸土植被指数)、纹理(同质性、均值、二阶矩、方差、差异性、对比度、熵和相关性)和地形信息(坡度和坡向)共19个指标作为分类特征变量。以RF分类器估测的特征重要性进行特征选择为对照,分别以单个特征在RF和SVM两分类器中的分类准确率为依据进行特征选择,并对选取的特征进行主成分分析,与未做主成分分析的进行区分,再分别用RF和SVM分类器进行分类,评价分类精度,确定最优特征和分类器组合。【结果】①基于SVM单个特征分类准确率选取特征,对选取的特征进行主成分分析,再用RF进行分类,该方法与其他方法相比分类性能最好,当特征维度为5时,总体精度为0.86,Kappa系数为0.83; 与输入全部特征进行分类相比,不仅提高了分类精度,而且降低了特征维度,使分类效率得以提升。基于RF特征重要性选取特征的RF分类取得了较高的分类准确率,但特征维数小于7时,分类准确率波动较大; 在特征维数为4时分类准确率增至最大值(0.88),随后骤降为0.83,之后基本保持在此水平。而基于单个特征分类准确率选取特征,分类准确率变化较为平缓,如上所提最优分类性能方法的分类准确率波动范围基本在0.02。②基于单个特征在RF和SVM分类器中的分类准确率进行特征选择,在随后的分类过程中,SVM分类器分类精度总体高于RF。基于RF单个特征分类准确率选取特征的SVM分类,及基于SVM单个特征分类准确率选取特征并对选取特征进行主成分分析的RF分类,较仅利用SVM或RF单个分类器选取特征并分类的分类准确率更高。【结论】①基于单个特征分类准确率的特征选择方法,可在保证分类精度的同时降低特征维度,且在较低维度时,基于该方法选取特征的分类精度较基于特征重要性选取特征的分类精度更稳定。②基于单个特征分类准确率进行特征选择,不同分类器选取的特征有所差异,分类准确率也不同,利用多个分类器较单个分类器选取特征并分类的性能更好。③在中低维度时,RF分类器的分类准确率可能与特征输入顺序有关,对输入特征进行主成分分析有利于提高分类器的分类精度及稳定性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号