首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
K-最近邻分类技术的新发展与技术改进   总被引:1,自引:0,他引:1  
K-最近邻算法是数据挖掘分类方法中最常用的算法之一.在很多实际问题上都有应用.本文对近年来基于K-最近邻算法的各种改进技术进行了分析.从速度提高和准确度提高两个方面给予了归纳.  相似文献   

2.
提出了一种网络信息文本分类模型的建立方法,根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型,分别进行了基于最近邻决策和K-近邻决策的分类效果试验研究,结果显示,K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

3.
分析了分段对文本分类的影响,提出了与文本语义密切相关的最大语义标志原则(MSMR)和段落间的语义激励原则(SIR),在模糊K-最近邻分类算法的基础上,应用这2个原则设计并实现了一种基于上下文的文本片断模糊分类算法.该算法依据SIR判断文本片段分类的相互影响,降低了片段分类的错误率,当某一片断类隶属度大于某一阈值时,依据MSMR判定可知,同一文档的后续片断均属于同一类别,这样就不用计算所有片断的类隶属度.实验表明:与模糊K-最近邻分类算法相比,所提算法能有效提高系统的查准率、查全率和正确率,其中查全率可提高16%以上;在同一会话中,由于被明确分类后的后续片段不需要计算类隶属度,所以算法总计算时间明显少于模糊K-最近邻分类算法,具有较高的分类效率.  相似文献   

4.
提出了一种网络信息文本分类模型的建立方法。根据网络报文的特点,抽取其中关键词作为分类特征词条,并以报文关键词进行词频统计分析建立文本分模型。分别进行了基于最近邻决策和K-邻近决策的分类效果试验研究,结果显示:K-近邻决策的分类效果要优于最近邻决策的分类效果。  相似文献   

5.
中文文本分类是中文信息处理过程中的关键技术。本文介绍了中文文本分类的基本过程和基本原理,讨论了朴素贝叶斯(NB)、K-最近邻(KNN)、支持向量机(SVM)这三种中文文本分类方法,并对这三种分类方法进行分析和比较。  相似文献   

6.
最近邻搜索广泛应用于分类问题,其最显著的优点是分类准确率高、泛化性能好.但现有最近邻分类算法都存在着一个弱点——样本集增大分类计算量也显著增大.为了克服这一不足,本文基于一个新的思路,提出了最近邻分类方法的一种改进方法.该方法在进行最近邻分类时,不一定要找到待分类点的最近邻点,而只要知道最近邻点的类别即可,大大地减少了最近邻搜索时的计算量.用经典的分类问题双螺线问题(TSP)以及其他几个例子,就该改进方法的分类效果、分类速度和学习性能等3个方面进行了测试,并与经典的K维双叉树(KD树)最近邻搜索法以及压缩近邻法进行了比较.结果表明,就综合性能而言,本文改进方法是有竞争力的.  相似文献   

7.
中文文本分类是中文信息处理过程中的关键技术。本文介绍了中文文本分类的基本过程和基本原理,讨论了朴素贝叶斯(NB)、K-最近邻(KNN)、支持向量机(SVM)这三种中文文本分类方法,并对这三种分类方法进行分析和比较。  相似文献   

8.
基于J-M距离的多时相Sentinel-1农作物分类   总被引:1,自引:0,他引:1  
为准确获取云雨天气较多地区的农作物分布信息,以敦化市西北部的黑市乡和额穆镇为研究区,以高分一号(GF-1)卫星宽视场(wide field view, WFV)传感器和哨兵一号(Sentinel-1)为数据源,通过WFV数据提取耕地范围,利用J-M(Jeffries-Matusita)距离可分性进行Sentinel-1影像最优分类时相组合的判断,根据选取Sentinel-1数据通过最近邻分类器多次循环对研究区主要农作物的分布信息进行提取。研究结果表明,进行多次循环产生的分类结果优于单次循环结果,循环次数达到5次结果趋于稳定,总体分类精度为84.23%。可见利用Sentinel-1数据进行敦化市农作物分类是可行的,多次循环的最近邻算法有利于获取更精准的农作物分布信息。  相似文献   

9.
在基于传统的遥感影像分类方法的基础上,结合面向对象分析理论与方法,提出了面向对象的遥感影像的分类方法,通过实验分析探讨了面向对象影像分类的关键技术。包括多尺度的分割,分类器的建立,包括最近邻分类和模糊聚类分类。实验表明,面向对象的分类方法较传统基于像素分类法有较高的精度,具有很大的发展潜力。  相似文献   

10.
笔者以2007年11月中巴资源卫星多光谱遥感影像数据为例,选择山东省济宁市市中区作为研究区,利用ERDASImagine9.2遥感影像处理软件对数据进行预处理后,运用最大似然法(Maximum Likelihood)、马氏距离法(Mahalanobis Distance)、最小距离法(Minimum Distance)进行监督分类试验.然后对分类后的结果进行主观和客观的分析,并评价各种分类结果的精度,为用户进行影像分类前选择分类方法提供参考.  相似文献   

11.
交叉覆盖算法分类时着重在于两类的交界部分,混杂在另外一类中往往无助于提高分类器的效率,反而会增加分类器的计算负担。本文提出一种基于交叉覆盖算法的最近邻交叉覆盖算法(NN-ACA):对进行训练的原始样本数据进行预处理,删除这些不同类的最近邻点,得到精简后的样本集,再对该样本集使用交叉覆盖算法。通过实验和与SVM的比较,结果表明NN-ACA在一定的样本规模表现了速度和分类正确性上的优越性。  相似文献   

12.
Quick Bird(QB)、IKONOS等高分辨率遥感影像是Google Earth(GE)影像中的重要来源,经过图形化处理后,免费提供给公众浏览和使用.通过对相同区域、同期QB及其GE影像分别采取基于像素和面向对象的分类方法实施土地利用分类,对比分析两类影像在不同土地利用类型、不同分类方法上的分类效果,阐明GE影像进行土地利用分类的可行性,并就其在不同分类方法、不同分类类型情况下的适应性进行评价和建议.  相似文献   

13.
针对传统K最近邻(KNN)分类法执行效率低的问题,提出一种改进的K最近邻分类法。先采用最短距离聚类法分别对训练样本和测试样本进行聚类,生成一些小簇和孤立点,再对小簇或孤立点使用改进的K最近邻方法进行分类。改进后的方法能极大地缩小分类样本的规模,降低计算成本,提高分类效率。  相似文献   

14.
用于文本分类的快速KNN算法   总被引:1,自引:0,他引:1  
KNN(k Nearest Neighbor)算法是一种简单、有效、非参数的文本分类方法.传统的KNN方法有着样本相似度计算量大的明显缺陷,使其在具有大量高维样本的文本分类中缺乏实用性.提出了一种快速查找精确的k个最近邻的TKNN(Tree-k-Nearest-Neighbor)算法,该算法建立一棵用于查找的树,加速k个最近邻的查找.首先以整个样本集合中心为基准,按照距离中心的距离将所有样本进行排序,并等分L组,作为根结点的孩子,每个孩子以同样方式处理,直到每组样本数量在[k,2k]间为止.根据这棵树查找k个最近邻,减小了查找范围,极大地降低了相似度计算量.  相似文献   

15.
不同融合算法对ETM+遥感影像分类精度的影响分析   总被引:2,自引:0,他引:2  
以福州市南台岛的ETM+遥感影像为基础数据,利用ERDAS Imagine 8.7、ENVI4.0等遥感影像处理软件,运用主成分法(PCA)、乘积法(MLT)、Brovey变换和HIS变换融合算法对ETM+遥感影像全色波段(第8波段)与多光谱波段(第1-5、7波段)进行融合试验;从融合影像的光谱保真度、高频空间信息融入度等角度对融合后的影像进行比较分析;对各种融合后影像进行非监督分类,并评价各种分类结果进行精度,为用户进行影像分类前选择融合方法提供参考.  相似文献   

16.
针对kNN分类算法对不平衡数据进行分类可能偏向多数类的问题,提出了象限壳近邻分类算法。该算法仅选择测试样本象限方向上的最近邻的训练样本来判断其所属类别,从而有效地避免了kNN算法对选取k个最近邻训练样本时可能产生偏向多数类的问题。通过在UCI真实不平衡数据集上的实验,该文提出的分类算法在Recall、F-value和G-mean等评价标准明显优于传统的kNN分类算法。  相似文献   

17.
文章针对传统K-近邻分类方法学习效率低下的问题,提出一种基于并行计算的加速K-近邻分类方法(K-nearest neighbor classification method based on parallel computing,PKNN),即并行K-近邻分类.该方法首先将所需要分类的样本划分为不同的工作子集,然后在每个子集上进行并行的K-近邻分类.由于划分后每个工作子集的规模均远小于整个数据集的规模,因此降低了分类算法的复杂度,可有效处理大规模数据的分类问题.实验结果表明,PK-NN方法能提高分类效率.  相似文献   

18.
根据元音数据处理方法和选取的特征,提出了三种基于统计学的模式分类方法:线性判别、二次判别和七一最近邻,并通过模型选择方法,对实际数据进行测试与比较,得出尼.最近邻分类模式最为合适,同时提出进一步改进的思路。  相似文献   

19.
提出一种基于稀疏表示的时间序列最近邻分类模型,旨在通过提取时间序列的关键特征,去除冗余信息,达到减少噪声干扰的目的.该模型首先求解时序数据基于过完备字典的稀疏表示,然后利用非零系数及其对应的原子重构原始序列,最后利用基于距离的分类器进行分类.在18个时间序列公开数据集上的实验结果表明,最近邻分类模型能够提高传统的最近邻分类器的分类准确率.  相似文献   

20.
结合IKONOS影像和LiDAR数据,应用面向对象分类分析方法试验提取高分辨率多光谱卫星影像城区建筑物.处理流程包括如下步骤:(1)影像融合增强;(2)影像分割;(3)影像对象分类;(4)建筑物对象几何形状规则化处理.试验结果表明,面向对象分类分析是一种适于利用高空间分辨率遥感影像数据进行城区建筑物制图的有效方法.该方...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号