首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 687 毫秒
1.
【目的】机器学习中不同算法适用于具有不同分布特征的数据集。在用整个训练集上训练得到的单个分类器预测新样本类别时,由于缺少对局部区域样本的针对性,可能导致分类器对某一区域数据的预测能力较差而产生错误分类。为了解决这个问题,提出基于k-means+ +的多分类器选择算法。【方法】首先用3种分类综合性能较好的算法———Ada-Boost、SVM、随机森林(RF)在训练集上分别训练得到3个分类器作为候选基分类器,然后利用k-means++算法将训练数据集分为k个簇,用3个候选分类器分别对每个簇进行分类测试,选择对这一簇中数据分类精度最高的分类器作为与它的数据相似数据的分类器。在对新样本进行类别预测时,首先判定样本属于哪个簇,然后用它的分类器进行分类预测。【结果】实验结果表明,新算法在9个UCI数据集上优于单个分类算法。【结论】基于局部区域动态选择最优分类器可以提高模型分类准确性。
  相似文献   

2.
为提高铸坯质量预测的准确率,本文提出了一种基于最大信息系数(MIC)和主成分分析(PCA)的两阶段特征降维方法。采集某钢厂铸坯生产过程数据,根据冶金原理得到铸坯夹杂类质量缺陷的影响因素,构造原始特征集。第一阶段进行特征选择,使用随机森林分类器的分类准确率来评价ReliefF、IG和MIC三种算法的特征选择效果,结果显示,基于MIC度量指标选出的特征维度更低、分类准确率更高。第二阶段使用PCA方法对特征选择后的特征集进行降维,并将其与原始特征集、MIC、PCA算法的分类准确率进行比较,结果表明,本文提出的基于MIC和PCA的两阶段降维方法优于其他算法,能有效降低原始特征集的维度并提高对铸坯夹杂类质量缺陷的预测精度。  相似文献   

3.
发展了一种基于极化散射特征的全极化SAR影像分类方法,探索了Stokes矢量特征作为分类特征的有效性,通过遗传算法耦合SVM的特征选取方法(GA-SVM)有效解决了分类器泛化不足的问题.以一景高分三号(GF-3)全极化影像作为主要的数据源,与同步外业调查获取的地面实况数据进行对比,结果表明所设计的待选分类特征集与特征选取方法得到的特征组合取得了较好的分类效果,总体精度达到90.00%,Kappa系数为0.87,影像部分地物的错分、误分现象得到改善.这表明:(1)GA-SVM的特征选取方法可以在有效地降低分类特征维度的同时提升目标SVM分类器的分类精度;(2)将Stokes矢量元素及其分解特征作为分类特征,可有效提升非参数模型分类的精度.  相似文献   

4.
采用同一地区、不同时相的Landsat 8OLI影像数据,结合影像的光谱、纹理和地理特征等24个变量,分别采用随机森林分类法(RF)和支持向量机分类法(SVM)对宁夏石嘴山地区进行影像分类,研究发现:影响分类模型精度的有DEM数据、归一化差异植被指数(NDVI)、短波红外波段、归一化差异湿度指数(NDMI)与第一主分量均值(M)等重要参量。RF的分类精度略高于SVM,总体分类精度为95.492%,Kappa系数为0.947;盐碱地的分类精度为98.510%,计算效率是SVM的16.5倍;RF方法更适合进行盐碱地目标级的变化检测。根据两个时相影像的RF分类结果,得到2014—2017年研究区盐碱地面积减少约133.56km2,减少比例56.368%,生态环境改善和盐碱地改良趋势较好。  相似文献   

5.
基于生理信号客观评估心理压力状态成为目前的研究热点,但最佳评估算法有待进一步探索.本文选择心算任务诱发受试者的心理压力,采集了21位在校大学生的脑电、心电、皮肤电导、脉搏波4种生理信号.提取各生理信号时域和频域的多种特征,使用方差分析(ANOVA)、最大相关最小冗余(mRMR)、单个特征支持向量机(SVM)分类准确率、随机森林(RF)特征重要性、梯度上升决策树(GBDT)特征重要性、极端梯度提升(XGBoost)特征重要性6种特征选择方法筛选出有效特征,利用SVM、K近邻(KNN)、高斯朴素贝叶斯(GNB)、自适应提升算法(Adaboost)、GBDT、XGBoost 6种分类器对提取的特征进行分类.结果得出,GBDT特征筛选与XGBoost分类器的组合模型对心理压力的等级评估效果最佳.  相似文献   

6.
为了提高蛋白质O-糖基化位点的预测准确率,提出了把核主成分分析(KPCA)与支持向量机(SVM)相结合的方法。实验样本用稀疏编码方式编码,窗口长度为21。首先,用核主成分分析提取了样本的核主成分(特征);然后,在特征空间中用改进的支持向量机(ISVM)进行分类(预测)。在使用支持向量机分类时,设置了一个边界系数来减少运算的复杂度。实验结果表明,使用KPCA ISVM的方法预测的效果优于PCA SVM的预测效果。预测准确率为87%。更进一步,用不同长度的样本做实验(w=5,7,9,11,21,31,41,51),使用多数投票法综合各子分类器的优势。结果表明,组合分类器的预测准确率优于子分类器的预测准确率,预测准确率为88%。  相似文献   

7.
【目的】通过研究随机森林(random forest, RF)特征筛选对单木树种分类精度的影响,以及多源遥感数据协同下单木树种分类的有效性,分析不同特征对单木树种分类的影响程度。【方法】以东北林业大学帽儿山实验林场中林施业区的两块100 m×100 m样地为研究对象,首先,以机载激光雷达(LiDAR,light detection and ranging)和多光谱遥感CCD(charge coupled device)影像为数据源,分别基于机载LiDAR数据提取高度、强度和树冠大小等共37个特征,基于CCD影像提取光谱和纹理共21个特征;其次,以随机森林方法进行特征筛选,之后以随机森林和支持向量机(support vector machine, SVM)两种非参数分类器,结合不同数据源和特征,采用12种分类方案,利用总体精度(overall accuracy, OA)、用户精度(user’s accuracy, UA)和生产者精度(producer’s accuracy, PA)对分类结果进行对比与精度评价。【结果】经随机森林特征筛选后,分类结果优于未进行特征筛选的结果,总体精度可以平均提高3.47%,使用机载LiDAR和CCD影像协同分类相较于仅使用CCD影像总体精度平均提高6.07%。【结论】随机森林特征筛选可以优化特征,减少特征冗余,提高分类精度;多源数据结合也可以提高分类精度;在多源数据结合时,光谱特征最重要,LiDAR提取的强度特征相较于高度特征更稳定。  相似文献   

8.
一种基于分类精度的特征选择支持向量机   总被引:1,自引:0,他引:1  
在综合序列前向选择(sequential forward selection,SFS)方法和广义序列前向选择(generalized sequential forward selection,GSFS)方法的基础上,提出了基于分类精度的特征选取(sequential forward selection based on classification accuracy, CA-SFS)方法。它依次改变GSFS方法中的r值,并以支持向量机(support vector machine,SVM)作为分类器,将得出的分类精度作为准则函数对特征进行取舍。仿真实验表明CA-SFS算法不但选择了较少的特征,而且取得了较好的分类效果。  相似文献   

9.
目前情绪识别的分类方法很多,但情绪分类模型多具有被试依赖性,基于SEED数据集探索了跨被试情绪识别模型.首先将所有被试的脑电(Electroencephalogram,EEG)数据合并为一个被试,共提取675个trial三类情绪(正性(positive)、中性(neutral)、负性(negative)情绪)的短时傅里叶变换(Short-Time Fourier Transform,STFT)、离散小波变换(Discrete Wavelet Transformation,DWT)特征,并使用ReliefF特征选择算法对特征进行权重排序.其次,从排序好的特征中选择600个trial作为训练集,剩余的作为测试集;然后将K最近邻(K-Nearest Neighbor,KNN)、二次判别分析法(Quadratic Discriminant Analysis,QDA)、支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)、深度置信(信念)网络(Deep Belief Network,DBN)五种分类算法作为分类器,对比研究选出最优的分类框架.结果表明,五种分类器的平均分类精度分别为:KNN 69.21%±3.4%,QDA 52.17%±9.41%,SVM 78.41%±3.8%,RF83.49%±2.6%,DBN 81.73%±2.22%,可见RF的分类效果最好.分别计算每个分类模型对负性、中性、正性情绪的分类准确率,结果如下:不同分类器对正性情绪的识别效果都比较好;KNN,QDA,SVM对负性和中性情绪的分类效果较差,准确率不高;DBN和RF对负性和中性情绪的识别率较高,能有效地进行情绪识别.以上研究可望为跨被试的情绪识别模型提供参考.  相似文献   

10.
微阵列数据具有样本小、维度高的特点,给数据分析带来了困难。因此,在生物信息学的研究和应用中,从微阵列数据里挑选主基因(特征选取)是十分重要和有意义的。本文采用基于最优正交质心特征选取算法(OCFS)来挑选主基因,并与基于信噪比的主基因挑选法和基于遗传算法的主基因挑选法进行了对比。利用挑选出的主基因,采用支持向量机(SVM)对数据样本进行了分类研究。通过实验,在经典的白血病数据集上,对于34个样本的测试集,达到了33/34的分类准确率,表明了本方法的适用性。  相似文献   

11.
获取震后建筑物震害信息有利于开展人员救援和灾后重建工作。由于高分辨率合成孔径雷达(SAR)数据少有震前数据存档,利用震后单时相高分辨率SAR数据评估建筑物震害成为研究热点,但利用高分辨率SAR数据对单体建筑物的研究却很少。本文以北川老县城震后0.24mTerraSAR-X聚束模式(ST)数据为数据源,经多视处理后提取建筑物纹理特征,对比分析不同视数大小和纹理计算窗口大小对建筑物震害识别影响,确定最佳纹理计算窗口大小和视数大小。结合震前光学数据,获得SAR单体建筑物轮廓图,随机选取建筑物轮廓样本作为训练样本,引入支持向量机(SVM)和随机森林(RF)分类器识别建筑物震害信息。结果表明,基于纹理特征的SVM、RF方法能有效地识别高分辨SAR影像单体建筑物震害信息,SVM识别精度可达到88.24%,RF识别精度可达到92.47%。可见基于高分辨率SAR数据的纹理特征识别建筑物震害方法稳定有效,可为灾后应急、灾害评估和灾后重建工作提供可靠信息支撑。  相似文献   

12.
针对已有分类器存在的缺陷, 提出一种以分类错误率为标准选择组合特征的分类方法, 提高分类器的分类精度. 先提取图像的4种分形维数作为纹理特征, 再通过组合不同分形维数特征应用于支持向量机(SVM)进入样本训练阶段. 将分类错误率最低的特征组合作为分类器的特征向量, 应用于测试阶段的分类, 提高分类器的分类精度. 实验结果表明, 该方法具有较好的推广性, 为图像特征组合提取提供了新途径.  相似文献   

13.
为弥补特征提取中的语义缺陷,提出了一种利用领域知识规则填补特征与高级语义之间鸿沟的思想,从体育视频中对语义对象进行有效的特征提取,并采用支持向量机元分类器和组合策略对体育视频进行分类的方法.实验表明,该分类方法对大部分体育视频都具有很好的分类效果,平均准确率可达92.23%,优于其他提取特征无语义关联的分类方法.  相似文献   

14.
目前面向对象的分类研究中,对于研究区影像的分割尺度问题多以试验者的多次试验以及主观推断为主,缺乏定量化的评价标准。同时,在对遥感影像分类的算法选择以及在分类过程中,有效特征空间的选取均存在一定程度的主观性。针对遥感影像面向对象分类过程中分割尺度选择盲目及分类空间构造主观性较强的问题,以World View-2遥感影像数据为例,首先利用改进的全局最优分割尺度的方法获取研究区影像的最优分割尺度,在此基础上选取了研究区分割对象的48个特征,利用OOB误分率对各个特征的重要性排序;然后按重要性顺序以5为步长讨论特征数量对分类精度的影响,构建了用于分类的最优特征空间;最后将采用最优特征空间的随机森林算法获得的最佳分类结果,与面向对象的最邻近像元、决策树以及支持向量机分类算法进行了比较。结果表明,用于分类的特征数量与分类精度之间,并不是简单的正相关关系;与面向对象的最邻近像元、决策树以及支持向量机分类算法相比,利用最优特征空间进行随机森林分类的分类精度最高,表明该方法更适合于高分辨率World View-2数据的分类。  相似文献   

15.
针对自动睡眠分期任务,提出了一种基于正态逆高斯和特征贡献度的睡眠分期实验框架.提取睡眠脑电信号特征,并对信号进行可调Q因子小波分解(TQWT),针对TQWT子带提取正态逆高斯参数特征;基于SVM模型实现特征贡献度排序与筛选,针对高贡献度特征,比较多种分类器的分期结果并设计多分类器组合自动睡眠分期算法.采用PhysioBank的Sleep-EDF数据集进行验证,取得了89.88%的平均睡眠分期准确率,相较于单一分类器的分期准确率有较大提升,对睡眠障碍的临床诊断与研究具有较大价值.   相似文献   

16.
【目的】为了降低高光谱遥感数据噪声,提高土地利用分类信息提取精度,探索结合纹理和空间信息的分类方法。【方法】以河南镇平县Hyperion高光谱成像光谱仪获取的高光谱影像为数据源,借鉴决策树分类思想,采用了一种结合光谱、纹理和空间信息的高光谱遥感多特征地类提取方法,先通过提取光谱特征初步提取地类,再分别采用提取纹理特征和基于空间信息的植被提取进行详细地类信息的分层提取,最后,用地面实测样点验证各类土地利用类型的分类精度,比较了用不同方法对不同地类的提取效果。【结果】基于多特征的地类分层提取体系中,采用各波段光谱反射率区分大的地类,再用纹理特征进行光谱差异较小的地类划分,而基于空间信息进行植被的分类。通过结合纹理和空间信息提取方法的总分类精度达86.7%,较最大似然法分类精度提高13.3%。【结论】高光谱与纹理和空间信息相结合的遥感分类方法能有效减小噪声,提高分类精度,可为土地利用分类提取研究提供一定的参考。  相似文献   

17.
人脸识别领域中常用Gabor小波系数表示人脸特征.然而,提取的人脸Gabor特征是高维数据,不可避免存在冗余和随机噪声的干扰.为了有效利用Gabor特征进行人脸识别,提出一种新的Gabor特征选取方法.首先计算训练集上的任两张人脸图像的Gabor特征差,生成类内空阃和类外空间.用单个Gabor特征训练筒单两值分类器,以其在类内空间和类外空间的分类错误率作为判据评价该Gabor特征的分类能力.在选取分类错误低的特征的同时还要再评估候选特征与已选特征间的互信息,这样优选出具有无冗余、低误差率的特征.最后对这些优选的Gabor特征进行主成分分析和线性判别分析完成人脸识别.在CAS-PEAL大型人脸数据库上的实验结果表明,所提出的方法不但可大大降低Gabor特征的维数,而且还有效提高了识别精度.  相似文献   

18.
针对由于高光谱图像存在数据量大、数据相关性强、图谱合一等特点导致高光谱图像分类难度较大的问题,构建一种基于多分类器融合的高光谱图像分类模型.该模型首先使用双边滤波算法进行去噪处理,然后使用LDA算法与PCA算法相结合、单独PCA算法、Gabor滤波与PCA算法相结合三种方式分别对数据进行降维与特征提取,并分别使用SVM...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号