期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《应用基础与工程科学学报》2021,(2)

基于Landsat OLI影像运用支持向量机和随机森林分类方法进行下辽河平原地区面向对象土地利用分类,同时探讨DEM因素对分类精度的影响.结果表明:(1)研究区随机森林分类的总体精度和Kappa系数优于支持向量机分类的结果,同时参考DEM因素有助于提高分类精度,总体精度最高为91.80%.(2)研究区支持向量机分类方法下水田和建设用地的分类精度较高;而旱地、林地、水域和未利用地更适用于随机森林分类方法.DEM因素对于水田、旱地、水域及未利用地的分类精度有提升作用,而对林地的分类精度有一定的削减.(3) 2015年研究区土地利用以耕地为主,其次是建设用地和林地,水域、未利用地和草地的面积相对较少.中等分辨率遥感影像的面向对象土地利用分类的适用性较好,可为区域土地利用信息提取提供参考. 相似文献

2.

基于人工神经网络法的遥感影像分类研究

《山西师范大学学报：自然科学版》2017,(1)

在遥感和GIS的支持下,采用人工神经网络(ANN)法对研究区土地利用/覆盖进行信息提取,并对ANN改进前后的分类结果和最大似然法(MLC)的分类结果进行对比分析.实验发现采用改进后的ANN分类总体精度达到了93.91%,较改进前提高了2.16%,较MLC提高了6.44%.研究表明:使用ANN进行遥感图像分类,精度优于MLC,改进后的ANN精度优于改进前的ANN.与传统方法相比,ANN分类达到的精度更高,可更好地区分土地利用地类,提高土地利用信息的精度. 相似文献

3.

基于小波变换和K-means算法的遥感影像分类

《杭州师范大学学报(自然科学版)》2016,(2)

在研究K均值聚类算法的基础上,采用小波变换辅助K均值算法对遥感影像进行分类,以此提高遥感影像的分类精度.以云南省玉溪市抚仙湖附近地区作为研究区,结合研究区的具体情况,根据查维茨最佳指数因子法OIF计算得到遥感影像的最佳波段组合,并通过对各类地物的样本图像和遥感影像进行二维小波分解,得出样本特征向量;然后利用K均值算法结合样本特征向量对遥感影像进行分类,得到分类结果并进行精度验证.再与单纯采用K均值算法的分类结果进行对比分析,结果表明:其总体精度和Kappa系数分别达到83.74%、0.7753,比单纯采用K-means算法分别高出14.26%、0.1697,尤其是林地、裸地和农田的分类精度得到了显著提高. 相似文献

4.

基于Sentinel-2A影像的森林类型提取研究

郑振灿陈文惠林莉平刘育圳《海南师范大学学报(自然科学版)》2021,34(1):70-81

基于Sentinel-2A遥感影像的光谱特征、指数特征和纹理特征,结合野外调查数据、森林二类调查数据和DEM数据等辅助数据,采用分层多尺度分割提取技术,对研究区主要森林类型进行提取。研究表明：主成分变换前三个分量的加入有助于提高影像分割效果和分类精度;在影像光谱特征基础上,加入指数特征和纹理特征可在一定程度上提高森林类型提取精度;在多元数据的支持下,选取合适的特征和阈值进行分层与分类是一种有效的森林类型分类策略,取得了较高的分类精度,其中杉木、马尾松、竹林和其它林地的总体分类精度达79.80%,Kappa系数为0.725;通过决策树和随机森林两种分类器的优势互补,以分类精度混淆矩阵中的生产精度和用户精度平均值作为先验知识进行多分类器决策级投票融合,相比于单一决策树和随机森林分类器,组合分类器具有更高的分类精度,总体分类精度分别提高了3.32%和2.13%。相似文献

5.

基于随机森林的全国第三次土地调查面向对象分类方法研究

王舒李岩《甘肃科技》2019,(3)

全国第三次土地调查内业当中要求作业员将不同地物进行分类,常用的方法是在Arcgis中对地物进行手动勾绘,此操作对作业员的目视解译要求较高且费时费力。基于此本文提出利用面向对象的随机森林方法对研究区进行分类。首先通过选择最优分割尺度与影像特征,再利用随机森林进行分类得到分类结果,并与面向对象的最近邻分类方法进行对比,结果表明:随机森林的总体分类精度为89%,比面向对象提高了4%,随机森林的Kappa系数为0.74,比面向对象提高了0.09。因此利用随机森林分类方法更适合第三次全国土地调查的分类。相似文献

6.

基于特征优选的随机森林算法在湿地信息提取中的应用——以湖北洪湖湿地自然保护区为例

夏盈厉恩华王学雷张莹莹杨娇周瑞《华中师范大学学报(自然科学版)》2021,55(4):639-648

以湖北洪湖湿地自然保护区为研究区,采用随机森林算法对研究区内湿地信息提取.以Sentinel-2A遥感影像为数据源提取光谱特征、植被指数、水体指数、红边指数、纹理特征等特征变量,在随机森林算法框架下,对不同特征变量进行特征重要性评估,比较分类后精度并对特征组合进行优选.将基于随机森林算法的分类精度与传统的基于像元的支持向量机分类方法和最大似然分类方法的分类精度相比较,并通过双比例Z检验比较各算法中正确分类像元的比例统计各分类算法之间的分布差异.结果表明： 1) 特征个数为13时,分类精度达到最大,随着特征个数的增多,分类精度呈现波动减小的趋势; 2) 特征变量中蓝光波段重要性得分最高,达到2.85,可见光(B2、B3)与红边指数(IRECI、MCARI)重要性排名靠前,对于提取湖泊湿地信息具有重要意义; 3) 基于特征优选的随机森林方法分类精度优于支持向量机和最大似然法分类后的精度,其总体精度分别高出6.02%和7.57%;经检验, χ2分别达到25.891和38.895,具有显著差异,表明基于特征优选的随机森林算法分类对湿地信息提取发挥重要作用。相似文献

7.

图像分割与SVM的城市森林植被分类技术研究 总被引：1，自引：0，他引：1

《青海大学学报》2017,(3)

为了实现城市森林植被种类的信息提取,文中采用面向对象结合支持向量机的分类方法,基于无人机影像数据对上海某校区内的城市森林进行了植被分类技术的研究。利用影像数据中各类地物的光谱、纹理等特征信息,将城市森林植被类别分为四类,并将分类结果与最大似然法分类结果进行对比分析。结果表明:该方法实现了高分辨率遥感影像的城市森林植被分类,不仅消除了分类过程中的"椒盐现象",而且有效提高了植被分类精度。最大似然法分类结果的分类精度为55.12%,面向对象结合支持向量机的分类精度达83.60%,提高了28.48%。实验结果满足精度要求,可为城市规划提供数据支持。相似文献

8.

基于随机森林算法的特征选择的水稻分类——以南昌市为例

苏亚麟吕开云《江西科学》2018,(1)

在南方水稻遥感分类中,耕地细碎化;干扰性其他植被多是造成分类效果差主要因素。针对此类因素可对多时相影像进行特征提取、叠加成多时相特征集合,利用随机森林并结合归一化特征重要性对多时相影像特征集合进行特征测试,分析每个特征对分类结果的影响。根据每个变量的影响程度(贡献程度)的不同进行一个排序,从而选出最优的分类的特征优选子集。再利用随机森林作为分类器,对特征优选子集进行水稻的分类提取的识别方法。与3组未进行特征选择的SVM(支持向量机)算法的分类结果进行对比。实验结果表明:1)多时相影像的特征集合的分类精度高于单时相影像的特征集合的分类精度;2)基于随机森林对原始特征集合进行特征选择后的总体精度92.09%和Kappa系数90.36%,特征选择能有效去除冗余信息,从而提高分类精度。综上所述,在耕地细碎化,多植被干扰的南方丘陵地带中,结合随机森林的归一化特征选择的方法为水稻的识别和提取研究提供了有效方法。相似文献

9.

基于非参数分类算法和多源遥感数据的单木树种分类

赵颖慧张大力甄贞《南京林业大学学报(自然科学版)》2019,43(5):103

【目的】通过研究随机森林(random forest, RF)特征筛选对单木树种分类精度的影响,以及多源遥感数据协同下单木树种分类的有效性,分析不同特征对单木树种分类的影响程度。【方法】以东北林业大学帽儿山实验林场中林施业区的两块100 m×100 m样地为研究对象,首先,以机载激光雷达(LiDAR,light detection and ranging)和多光谱遥感CCD(charge coupled device)影像为数据源,分别基于机载LiDAR数据提取高度、强度和树冠大小等共37个特征,基于CCD影像提取光谱和纹理共21个特征;其次,以随机森林方法进行特征筛选,之后以随机森林和支持向量机(support vector machine, SVM)两种非参数分类器,结合不同数据源和特征,采用12种分类方案,利用总体精度(overall accuracy, OA)、用户精度(user’s accuracy, UA)和生产者精度(producer’s accuracy, PA)对分类结果进行对比与精度评价。【结果】经随机森林特征筛选后,分类结果优于未进行特征筛选的结果,总体精度可以平均提高3.47%,使用机载LiDAR和CCD影像协同分类相较于仅使用CCD影像总体精度平均提高6.07%。【结论】随机森林特征筛选可以优化特征,减少特征冗余,提高分类精度;多源数据结合也可以提高分类精度;在多源数据结合时,光谱特征最重要,LiDAR提取的强度特征相较于高度特征更稳定。相似文献

10.

基于遥感和GIS的土地利用分类方法研究

《山西师范大学学报：自然科学版》2015,(4)

本文基于遥感卫星数据,在遥感软件ENVI 5.1和地理信息系统软件Arc GIS 10.0的支持下,通过最大似然法(MLC)、支持向量机(SVM)、人工神经网络(ANN)三种方法,对研究区土地利用/覆盖(LUCC)分类进行信息提取,并对不同分类方法的结果进行比较分析和精度检验.研究表明:使用支持向量机进行遥感图像分类,精度优于最大似然法和人工神经网络,且学习速度也较快,可更好地区分土地利用类型,提高土地利用信息的精度,适用于不同地貌单元,能够作为小尺度范围内遥感影像LUCC分类研究的有效工具. 相似文献

11.

结合植被覆盖度指数的土地覆盖分类方法研究

孙娜赵祥穆宝慧赵嘉诚刘乃精《北京师范大学学报(自然科学版)》2022,58(6):917-925

基于Landsat 8 OLI反射率数据,结合定量遥感反演植被覆盖度（fractional vegetation cover, FVC）提取的植被物候特征数据,对比了神经网络、支持向量机和随机森林3种土地覆盖分类方法．结果表明:随机森林分类方法具有较好的结果,反射率结合植被特征数据的分类方法的总体精度为85.52%,Kappa系数为0.8212,比仅用反射率的土地覆盖分类总体精度提高了3.45百分点,Kappa系数提高0.0429;植被覆盖度提取的植被特征数据能有效改善耕地、草地和裸地的制图精度和用户精度,对林地与水体的用户精度分别提高了7.79百分点与1.81百分点,灌木与人造地表的制图精度分别提升了7.69百分点与0.59百分点．整体来看,结合植被覆盖度及其派生植被特征进行土地覆盖信息的提取,在简单易行的同时,为提高分类精度提供了有效支持．相似文献

12.

基于机器学习的内核恶意程序检测研究与实现

田东海魏行张博郁裕磊李家硕马锐《北京理工大学学报》2020,40(12):1295-1301

随着计算机科学的发展,世界对计算机的依赖越来越强,计算机安全也越来越重要,恶意代码是计算机安全面临的最大敌人.针对传统的恶意代码检测和分析技术在现在已经无法满足需求的问题,提出使用机器学习并应用新的分类特征来识别恶意程序,并且对他们进行初级的家族分类,指出以往机器学习在恶意代码检测和分类上的不足,筛选出更好的区分特征.首先使用了n-gram算法来优化恶意代码反汇编代码中的操作码特征,然后使用词袋模型和TF-IDF算法优化API调用特征,最后编程实现模型并使用数据集进行了模型的训练和测试.实验中使用决策树算法的模型的分类准确率上达到了87.41%,使用随机森林算法的模型的分类准确率上达到了90.06%,实验结果表明提出的特征相比以往在恶意代码检测分类上应用的特征有着更好的效果. 相似文献

13.

基于分类精度和相关性的随机森林算法改进研究

王日升谢红薇安建成《科学技术与工程》2017,17(20)

为了提升传统随机森林算法的分类精度,本文首先对传统随机森林模型中的决策树根据分类性能评价指标AUC值进行降序排列,从中选取出AUC值高的决策树,计算这些决策树之间的相似度并生成相似度矩阵,然后根据相似度矩阵对这些决策树进行聚类,从每一类中选出一棵AUC最大的决策树组成新的随机森林模型,从而达到提升传统随机森林算法分类精度的目的。通过UCI数据集的实验表明,改进后的随机森林算法分类精度上最大提高了2.91%。相似文献

14.

噪声大数据的MapReduce高度随机模糊森林算法

王梅雒芬张保华《西南师范大学学报(自然科学版)》2019,44(11):110-117

为解决日趋增长的噪声大数据分类问题,提出了一种高度随机模糊森林算法.该算法在决策树学习中生成连续属性的模糊分区,并给出在MapReduce框架中所提算法的分布式实现,用于受属性噪声污染的大数据集中学习模糊决策树的集合,该分布式实现模型可以适应计算的有效分配策略,从而产生良好的可扩展性数据,这种分布式算法使得模糊随机森林能够处理大数据集的学习和分类.高度随机模糊森林算法能够实现噪声大数据的高精度分类,为以后的大数据分析打下良好的基础.实验结果表明,所提算法比现有算法准确率更高,在属性噪声情况下,该文分类准确率也高于随机森林算法,说明该文算法的可行性和有效性. 相似文献

15.

基于随机森林结合地球物理测井资料的煤体结构识别方法及应用

肖航张占松郭建宏秦瑞宝余杰《科学技术与工程》2021,21(24):10174-10180

在更加复杂的地质因素影响下,常规测井方法识别煤体结构准确度低,为精确识别煤体结构,研究了煤体结构测井曲线响应机理以及随机森林决策树个数的优选,从而建立煤体结构与测井曲线的随机森林分类模型进行煤体结构识别。结果表明:决策树个数为500时,随机森林分类模型效果最佳;通过袋外误差和模型对测试集样本的预测结果可知,随机森林分类模型的结果稳定且泛化性强,并且适合处理非均衡数据,预测精度较高。可见随机森林算法能有效识别煤体结构,为煤层气开发提供帮助。相似文献

16.

基于多特征属性相似的糖尿病早期预测方法

乔瀚容芷君许莹但斌斌赵慧《科学技术与工程》2021,21(36):15497-15502

考虑样本数据集的差异性和相关性对疾病预测结果有着直接影响,提出一种基于多特征属性患者相似的糖尿病早期预测方法,根据患者之间特征具有相似性这一特点,对患者特征进行混合属性相似预分组,再把分组结果导入随机森林分类器进行疾病预测。首先以临床概念作为患者的特征项,通过聚类定量化分析不同特征属性类型间的距离来度量患者之间的混合相似度,根据患者混合相似度将患者集预分组为多个患者相似组。最后以随机森林分类器对相似组进行细分类,得到最终的疾病预测结果,该结果与基于全样本数据的随机森林分类结果相比,分类准确率提高了8.3%;与基于单一属性相似组的随机森林分类结果相比,分类准确率提高了5.1%。结果表明该方法具有较高的预测准确率,可为糖尿病诊断预测提供支持。相似文献

17.

结合冠层密度的森林净初级生产力遥感估测

李陶李明阳钱春花《南京林业大学学报(自然科学版)》2021,45(5):153

【目的】森林冠层密度与林分年龄、植被生长状况有关,在区域森林净初级生产力遥感估测中,结合森林冠层密度以期提高估测精度。【方法】以广东省韶关市为研究对象,选用2017年Landsat-8 OLI影像、2017年357块森林资源连续清查固定样地数据为主要信息源,分别采用随机森林、多元线性回归、人工神经网络和K最近邻分类法等4种模型,结合森林冠层密度制图器(FCD)进行区域森林净初级生产力特征变量的选取、参数建模、模型精度评价和森林净初级生产力空间制图。【结果】特征变量中,红光波段(B4)、归一化植被指数(NDVI)、比值植被指数(RVI)、叶面积指数(LAI)、缨帽变换土壤植被因子、纹理特征和地形特征在森林净初级生产力反演中有重要作用。将森林冠层密度因子加入反演模型后,4种遥感估测模型精度均有大幅度提高。对4种遥感估测模型进行性能比较,随机森林模型精度最高,其次是多元线性回归模型、人工神经网络模型,K-最近邻分类模型精度最低。研究区内森林净初级生产力平均值为10.689 t/(hm²·a),高森林净初级生产力 [≥18 t/(hm²·a)]林分面积仅占研究区的19.61%,主要分布在海拔较高的西北部。【结论】结合冠层密度进行森林净初级生产力的建模,可有效提高模型估测精度。相似文献

18.

Research on internet traffic classification techniques using supervised machine learning

李君《高技术通讯(英文版)》2009,15(4):369-377

Internet traffic classification is vital to the areas of network operation and management. Traditional classification methods such as port mapping and payload analysis are becoming increasingly difficult as newly emerged applications (e.g. Peer-to-Peer) using dynamic port numbers, masquerading techniques and encryption to avoid detection. This paper presents a machine learning (ML) based traffic classification scheme, which offers solutions to a variety of network activities and provides a platform of performance evaluation for the classifiers. The impact of dataset size, feature selection, number of application types and ML algorithm selection on classification performance is analyzed and demonstrated by the following experiments: (1) The genetic algorithm based feature selection can dramatically reduce the cost without diminishing classification accuracy. (2) The chosen ML algorithms can achieve high classification accuracy. Particularly, REPTree and C45 outperform the other ML algorithms when computational complexity and accuracy are both taken into account. (3) Larger dataset and fewer application types would result in better classification accuracy. Finally, early detection with only several initial packets is proposed for real-time network activity and it is proved to be feasible according to the preliminary results. 相似文献