首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 115 毫秒
1.
提出了基于KFST(核Foley-Sammon变换)特征提取的KNN算法(KNNKFST):首先利用KFST来提取特征, 然后在按照特征被提取的先后关系赋权重, 再利用KNN算法进行分类. 实验表明, KNNKFST能够在大多数情况下极大地提高分类准确率.  相似文献   

2.
提出了一种新的异常行为检测方法,将SVM算法和KNN算法结合,在对识别样本判别时,当其与最优分类面的距离大于给定阈值时,采用SVM分类算法,否则采用KNN算法,从而减少了SVM算法的错误率.实验结果表明,SVM-KNN算法对异常行为检测的准确率达到95.86%.  相似文献   

3.
为了实现哈萨克语文本分类,根据哈萨克语语法规则,给出了哈萨克语文本词干的提取方法;结合DFR特征选择方法和VSM文本表示模型实现哈萨克语文本的预处理,提出了一种SVM和修正KNN协同的文本分类算法,分别在自行构建的语料集和整理的《新疆日报》哈萨克语数据集上进行大量文本分类仿真实验.结果表明,该方法在哈萨克语文本分类上具有良好的分类性能,并比SVM,KNN的测试性能优越.  相似文献   

4.
提出了一种新的异常行为检测方法,将SVM算法和KNN算法结合,在对识别样本判别时,当其与最优分类面的距离大于给定阈值时,采用SVM分类算法,否则采用KNN算法,从而减少了SVM算法的错误率。实验结果表明,SVM-KNN算法对异常行为检测的准确率达到95.86%。  相似文献   

5.
K-近邻算法(K-nearest neighbor,KNN)是一种思路简单、易于掌握、分类效果显著的算法。决定K-近邻算法分类效果关键因素之一就是距离的度量,欧氏距离经常作为K-近邻算法中度量函数,欧式距离将样本的不同特征量赋予相同的权重,但是不同特征量对分类结果准确性影响是不同的。采用更能体现特征量之间相对关系的卡方距离度量作为KNN算法的度量函数,并且采用灵敏度法进行特征权重计算,克服欧氏距离的不足。分类实验结果显示,基于卡方距离的改进算法的各项评价指标优于传统的KNN算法。  相似文献   

6.
基于演化超网络的中文文本分类方法   总被引:2,自引:0,他引:2  
为了提高中文文本的分类效果,提出了一种基于演化超网络的中文文本分类方法.采用中国科学院计算技术研究所的汉语词法分析系统对中文文本进行分词,保留文本中的名词、动词和形容词作为特征;以X2统计方法进行特征选择;利用布尔权重计算特征权值.经处理后的特征向量作为系统的训练集和测试集数据.运用超边替代策略训练超网络分类模型,并实现对测试集特征向量的分类.对不同阶数设定下的演化超网络模型进行了性能分析,并将其与传统的KNN和SVM算法进行了比较.结果表明,本方法对复旦大学语料和搜狐语料可获得87.2%和72.5%的宏识别率、86.9%和70.5%的宏召回率、87.0%和71.5%的宏F1,接近或优于KNN和SVM分类方法.所提出的方法是一种有效的中文文本分类手段.  相似文献   

7.
TF-IDF方法是文本向量化过程中一种常用的特征项权重计算方法,衡量的是特征项在整个文档集中的重要性.针对文本分类过程中TF-IDF方法未能体现特征项对类别的区分能力和对类别的代表性问题,基于文档类别,结合特征项的类间区分度和类内贡献度,提出一种改进的TF-IDF权重计算方法,并采用KNN和SVM模型对改进后算法的分类性能进行了验证.实验结果表明,与传统的TF-IDF方法相比,改进后的权重计算方法不仅在整个测试数据集上能够取得较高的宏平均精确率、宏平均召回率和宏平均F1,而且使测试数据集绝大部分类别的分类性能得到了较大提升.因此,改进后的TF-IDF权重计算方法是有效且可行的.  相似文献   

8.
基于特征相关的改进加权朴素贝叶斯分类算法   总被引:1,自引:0,他引:1  
朴素贝叶斯分类算法的特征项间强独立性的假设在现实中是很难满足的.为了在一定程度上放松这一假设,提出了基于特征相关的改进加权朴素贝叶斯分类算法,该算法采用一种新的权重计算方法,这种权重计算方法是在传统词频反文档频率(TF-IDF)权重计算基础上,考虑到特征项在类内和类间的分布情况,另外还结合特征项间的相关度,调整权重计算值,加大最能代表所属类的特征项的权重,将它称之为TF-IDF-FC权重计算.与基于传统TF-IDF权重的加权朴素贝叶斯分类算法和其他常用加权朴素贝叶斯分类算法比较,如基于属性加权的朴素贝叶斯分类算法,这种算法的分类效果均有一定的提高.  相似文献   

9.
提出一种基于分块小波的人脸识别新算法.在充分考虑提取局部特征,又克服小样本问题的基础上,提出分块小波的概念.首先,对小波分解后的低频子图进行分块,提取局部特征,从而降低图像维数并除去冗余噪声;将其先后进行PCA和LDA变换,得到组合特征向量;最后,根据KNN的快速分类能力及SVM在少数类别分类上的优势,提出KNN+SVM融合分类器对组合特征向量进行分类识别.研究结果表明:该方法识别率高,识别速度快,具有一定的实用价值.  相似文献   

10.
针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高了北京市密云区土地覆盖分类精度。实验结果表明:相对于支持向量机(support vector machine,SVM)、随机森林、BP神经网络和KNN算法,改进算法分类精度最高,达到了95.20%,分类精度比未改进KNN算法提高了6.43%。改进算法的Kappa系数在对比算法中也是最高的,达到0.93。此外,实验结果也表明改进算法可应用于中分辨率遥感图像分类中。  相似文献   

11.
针对目前特征选择算法应用于数据分类精度不理想的问题, 提出一种基于最大相关最小冗余的特征选择算法, 该算法结合特征选择算法和聚类分析算法对特征进行处理, 将分类中冗余的特征去除. 利用支持向量机对一组心脏病患者实际测量得到的数据进行分类实验, 实验结果表明, 该方法可有效筛选影响分类的特征, 进而提高分类准确率.  相似文献   

12.
故障诊断在工业生产过程中具有很重要的作用,尤其是对于要求比较高的分子蒸馏来说,微小的故障都会造成其提纯率,因此本文提出一种基于改进鲸鱼算法优化支持向量机的故障分类方法(IWOA-SVM),加入反向学习策略和对数权重因子到普通鲸鱼算法中。首先用反向学习策略(OBL)代替随机初始种群,用反向学习策略选取出反向种群,对种群进行择优选择,一方面OBL能够高效的提高群智能算法的全局搜索能力,另一方面提高鲸鱼算法在重复迭代中的多样性,使其跳出局部最优解,然后引入自适应权重因子并将其加入到鲸鱼优化算法中,利用权重因子的动态变化,很大程度上增强了全局搜索能力。最后采用改进之后的鲸鱼算法对SVM的参数进行寻优,并利用优化之后的支持向量机对刮膜蒸发过程获得的故障数据进行诊断识别,将IWOA-SVM的结果与WOA-SVM、SVM、PSO-SVM以及GWO-SVM做对比。结果表明,相比之下本文提出的IWOA-SVM算法分类准确率提升了2%,且其准确率保持在98%以上,IWOA-SVM在分类结果的准确性以及算法的鲁棒性方面于其他算法。  相似文献   

13.
一种基于Pauli分解和SVM的全极化SAR监督分类算法   总被引:1,自引:0,他引:1  
全极化SAR影像准确分类的一个重要前提是充分提取反映地物实际物理性质的特征。然而现有的全极化SAR特征提取算法和分类算法众多,却均存在各种各样的问题。无论极化特征提取方法还是分类算法,都会影响最终的分类精度。针对此问题,在多次实验的基础上,提出一种综合Pauli极化特征分解和SVM的分类策略,简称为Pauli-SVM算法。首先通过经典的Pauli分解法提取全极化SAR影像的奇次散射、偶次散射、体散射等极化特征,并将这些信息组合成一个特征向量,然后引入高精度的SVM分类算法,选择训练样本后对全极化SAR影像进行监督分类。在江苏溧水和南京横溪镇两个研究区,以ALOS卫星的PALSAR影像为研究数据,进行监督Wishart分类算法、Freeman特征提取法结合SVM的分类算法、Yamaguchi特征提取法结合SVM的分类算法、Pauli-SVM算法的分类对比实验。结果表明,新提出的Pauli-SVM算法可以有效的提高分类的准确性。  相似文献   

14.
本研究旨在弥补传统的广义线性模型(generalized linear model, GLM)方法的不足,并探索模式识别在运动脑科学当中的应用价值。使用支持向量机(support vector machine, SVM)模式识别算法,以低频振幅(fractional amplitude of low-frequency fluctuations,fALFF)、局部一致性(regional homogeneity,ReHo),以及度中心度(degree centrality, DC)作为学习特征,对射击运动组和滑冰运动组(分类1)、射击运动组和对照组(分类2)以及速滑运动组和对照组(分类3)之间进行二分类,并计算每一个脑区在分类算法当中的权重。使用留一交叉验证法计算分类正确率,使用总的准确率、ROC曲线(receiver operating characteristic curve)、以及预测准确率来衡量机器分类算法的优劣性。研究结果表明:1)分类1中SVM算法的正确率较高且分类效果更稳定,总的准确率(total accuracy, tACC)可以维持在96.67%以上,AUC(area under curve,AUC)均为1,说明SVM算法对区分不同项目运动员脑静息态功能特征时更有优势;2)在分类2和分类3中,SVM算法效果取决于使用的指标。其中,使用fALFF或者综合使用三个静息态指标的分类效果较稳定(tACC均在80%以上,AUC均在0.88以上);3)小脑在分类1算法中占较多的权重,提示不同运动项目运动员的脑功能活动之间差异最明显的部位主要在小脑上。而分类2和3中,除了小脑,还有一些与运动执行和控制及其他功能活动相关的脑区参与了算法的构成。通过SVM分类算法的应用,本研究获得了较为理想的结果,展示了模式识别方法在运动科学领域的应用价值。这些发现或许有助于体育科学研究者从新的角度更加全面地理解运动与脑的关系。  相似文献   

15.
基于支持向量机的苹果检测技术   总被引:2,自引:1,他引:2  
由于苹果果梗和缺陷的识别是苹果检测中的难点,两者的误分类会造成苹果等级的误判.作者提出了苹果果梗和缺陷图像分形特征提取的改进算法,构建了支持向量机并采用SMO算法对其进行训练.用计算机视觉系统采集苹果图像,然后提取苹果果梗和缺陷的分形特征作为支持向量机的输入进行识别.用富士苹果进行试验,得到的平均识别正确率为90.6%.  相似文献   

16.
针对信用评价数据存在离群点和噪声问题, 提出一种基于离群点剔除的支持向量机(SVM)信用风险评价模型. 该模型利用模糊c-均值聚类算法剔除样本离群点, 采用粒子群算法优化支持向量机分类参数, 进而提高支持向量机的分类性能. 将该方法应用于信用风险评价中的结果表明, 相比于其他模型, 该方法分类精度更高.  相似文献   

17.
胡婧  刘伟  马凯 《科学技术与工程》2019,19(33):296-301
为了探讨中文病历文本预处理后高维稀疏性的特点,导致文本分类精度低、算法模型收敛速度慢等性能问题,提出一种基于粗糙集的词袋(BOW)模型结合支持向量机(SVM)的文本分类算法(BOW+SVM)。该算法首先采用BOW模型对特征词提取构建高维度文本空间向量,然后利用粗糙集的属性约简算法对文本特征处理,把模糊的、冗余的属性从决策规则中清除,降低空间向量维数,最后利用所提纯的特征与SVM分类器交叉结合进行文本分类。在Python+TensorFlow环境中设计六种交叉结合的算法仿真对比实验,结果表明:基于BOW+SVM高血压病历文本分类模型精准度可达97%。可见改进后的模型,能够解决样本分部不均,克服高维度稀疏特征空间的问题,有效改善病案管理工作流程。  相似文献   

18.
基于核主元分析与支持向量机的监控诊断方法及其应用   总被引:3,自引:0,他引:3  
为了及时反映密闭鼓风炉冶炼过程状态,实现对密闭鼓风炉炉况的监控与诊断,提出核主元分析和多支持向量机分类的相结合的过程监控与故障诊断方法.其原理是:首先,用核主元分析方法提取过程数据特征,建立核主元分析的监控模型;然后,将代表过程特征的核主元送入多支持向量机分类器中,利用"一对其余"算法对故障进行诊断与分类.实验结果表明,所提出的方法与传统的主元分析方法相比,整个样本集的可分性变大,分类正确率提高,能更准确地诊断炉子的各种故障,可有效地用于密闭鼓风炉冶炼过程的故障诊断.  相似文献   

19.
一种重复二分CSP4类运动想象脑电信号特征提取算法   总被引:1,自引:1,他引:0  
针对脑机接口(BCI)系统中4类运动想象的脑电信号ERD/ERS现象进行研究,提出了一种重复二分共同空间模式(RB-CSP)算法用于4类运动想象脑电信号的特征提取,并运用SVM进行分类研究. 实验结果表明,该方法与传统的4分类CSP扩展算法OVR-CSP相比,减小了算法复杂程度,缩短了信号处理时间,提高了准确率,为在线脑机应用提供了一种新的解决方法.   相似文献   

20.
提出运用双层卷积神经网络模型实现基于足底压力图像的步态识别方法.首先,对足底压力数据采集系统采集的图像作相应预处理;然后,用双层卷积神经网络模型学习得到足底压力图像的单层和双层卷积特征;最后,将卷积特征训练分类器得到分类结果.实验结果验证了该算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号