首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
基于ELM特征映射的kNN算法   总被引:1,自引:0,他引:1  
研究了基于ELM特征映射的kNN算法,利用ELM特征映射,将原始数据映射到这种高维特征空间当中,使得数据间变得更加线性可分,即数据结构会变得简单,因此,在利用kNN算法进行分类时,利用ELM特征空间中对应的特征数据代替原始空间中的数据进行分类将会取得更好的分类效果.最后,来自MNIST和UCI中的几个数据集的仿真实验进一步验证了该算法的优良性能.  相似文献   

2.
几种常用文本分类算法性能比较与分析   总被引:9,自引:0,他引:9  
分析了几种典型的文本分类算法的特点,并基于中文文本数据集和英文文本数据集对算法性能进行了综合评价.实验结果表明:对于英文文本数据,支持向量机具有最优的性能,但时间开销最大,贝叶斯算法速度较快;对于中文文本数据,由于分词的困难,使得算法性能普遍低于同等规模下在英文数据集上的性能.几种算法性能均随训练集规模的增大而有改善.  相似文献   

3.
欧式空间中的反k最近邻查询算法不适用于空间网络环境,故采用任意度量空间中的M-tree索引结构,进行空间网络数据库中的反k最近邻查询处理.首先通过预计算的方法得到网络距离信息,依据此距离信息,对空间网络对象建立M-tree索引结构.然后,给出并证明了M-tree中间结点修剪定理,提出一种适用于空间网络环境的反k最近邻查询算法.最后实验验证了该算法的有效性.  相似文献   

4.
图像分类作为图像处理和计算机视觉的重要组成部分,能够快速准确地对数字图像进行分析和管理.对基于bag of word(BOW)模型的分类问题进行了研究,针对图像理解中的图像相似度之间的关系,提出了一种最大间隔最近邻居分类算法,通过对成对约束的度量学习算法,在优化目标中增加原空间数据分类的约束,学习到了一个可以反映当前样本数据的距离函数,并且在k-Nearest Neighbor(KNN)分类器上使用该学习到的距离函数来构建分类器,并在多个国际标准图像数据集上进行实验,结果表明:该算法相比传统的基于欧式距离的算法具备更高的正确率.  相似文献   

5.
蔡贺  张睿 《甘肃科技》2012,28(18):15-16
从介绍和分析k最近邻域分类算法入手,对该算法进行了分析与研究,剖析了kNN分类算法中的关键问题,为读者呈现了分类效果,并指出了该算法存在的问题以及解决方法,并对算法未来的发展进行了展望。  相似文献   

6.
苟和平 《科学技术与工程》2012,12(20):4926-4929
K最近邻算法(KNN)被认为是向量空间模型下最好的分类算法之一,在准确率和召回率方面比较出众,但随着样本数量的增加其相似度计算开销很大。本文提出一种改进算法RS-KNN,主要是利用粗糙集的相关理论,计算训练样本集中各样本子类的上近似空间和下近似空间,根据待分类文本出现在不同的近似空间,以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够有效地降低分类计算开销。  相似文献   

7.
kNN算法在文本分类中的改进   总被引:4,自引:0,他引:4  
kNN算法用已归类的数据训练分类器,它是一种基于实例研究(instance_based learning)文本分类算法,本文在研究kNN算法的基础上,结合k邻近法和最近特征线法的思想,提出了新的分类方法,k最近特征线法(k nearest feature line,kNFL),将其运用于文本分类中,汲取了kNN算法和NFL算法的优点,降低了偶然误差,提高了算法适应性和分类精度。  相似文献   

8.
基于词向量空间模型的中文文本分类方法   总被引:4,自引:0,他引:4  
大多文本分类方法是基于向量空间模型的,基于这一模型的文本向量维数较高,导致分类器效率难以提高。针对这一不足,该文提出基于词向量空间模型的文本分类方法。其主要思想是把文本的特征词表示成空间向量,通过训练得到词-类别支持度矩阵,根据待分文本的词和词-类别支持度矩阵计算文本与类别的相似度。实验证明,这一分类方法取得了较高的分类精度和分类效率。  相似文献   

9.
K-最近邻分类技术的新发展与技术改进   总被引:1,自引:0,他引:1  
K-最近邻算法是数据挖掘分类方法中最常用的算法之一.在很多实际问题上都有应用.本文对近年来基于K-最近邻算法的各种改进技术进行了分析.从速度提高和准确度提高两个方面给予了归纳.  相似文献   

10.
一种基于分类的关联规则Apriori算法   总被引:2,自引:0,他引:2  
关联规则的Apriori算法,在频繁项集的过程中要多次扫描数据库,而事务数据库中含有较多的冗余数据,极大地影响了频繁项集的提取效率。针对这些问题,提出一种基于分类的Apriori算法,在频繁项集提取以前,用分类的方法去掉无关冗余数据。实验结果表明这种方法较好地提高了Apriori算法的性能,在实践中有一定的应用价值。  相似文献   

11.
一种改进的kNN方法及其在文本分类中的应用   总被引:25,自引:0,他引:25  
介绍了基于kNN的文本分类方法,分析了kNN方法实质,指出了该方法的不足,然后指出了一种改进方法。改进方法是基于文本属性关系和概念共现等基础上提出来的。它实质上是强化了文本中语义链属性因子的作用,修正了次要因素的噪声影响,使文本分类结果更加理想,已有的测试结果证明了这一点,尤其在测试文本与训练文本集中的某些文本直观上较相似时,结果更佳。  相似文献   

12.
介绍了一种基于贝叶斯定理的文本分类模型“树桩网络(stump network)”。将该方法与朴素贝叶斯文本分类器和TAN(tree augmented naive bayes)文本分类器进行实验比较。结果表明,在大多数数据集上该文本分类方法具有较好的分类正确率。  相似文献   

13.
为提高计算机对古典诗歌自动分类的准确性,提出一种基于特征项聚合的分类方法.首先从文本中提取特征项并用向量表示,向量的每一分量表示该特征项在不同类别中的比重;然后通过聚类算法把相似的特征项聚合为一组,从而形成特征项聚合的诗歌模型;最后利用分类器对诗歌进行分类.《全唐诗》语料库的实验结果表明,利用该模型及算法可明显提高诗歌分类的准确率.  相似文献   

14.
研究了一种基于改进贝叶斯算法的短信分类方法。对中文文本短信,采用文档频度(DF)的特征项提取方法,借助自建短信语料库对改进的贝叶斯分类器进行了实验测试。实验结果表明:改进的分类器可以提高正常短信的通过率,并可以根据新的训练集训练出个性化的分类器,适应短信变化,满足用户的个性化需求,还结合黑白名单过滤机制实现对短信的过滤...  相似文献   

15.
分类是数据挖掘领域研究的热点,产生式与判别式是数据挖掘中两种不同的分类模型。产生式模型具有通用性、灵活性及清晰的分层结构,学习得到的模型很容易满足模型解释要求;判别式模型没有明显的对系统中变量的基本分布建模的企图,仅仅对输入到输出之间映射的最优化感兴趣,可以提供更好的分类性能。从准确率、建模时间及渐进误差等方面对产生式与判别式分类方法进行了分析与比较,为研究人员在分类模型的选择上提供了参考。  相似文献   

16.
随着数据存储规模的海量增长,降低存储系统的总拥有成本,提高数据访问效率是海量数据分级存储系统的关键.在分析了两种典型的数据分级算法后,结合两种算法的优点对算法进行了改良,提出了基于数据访问频率和数据设备依赖度的自动分级算法,实验结果验证了算法的有效性和数据分级算法具有较高的准确率.  相似文献   

17.
讨论基于核方法的分类算法的原理及其用于统计建模的一般步骤,研究了支持向量机和核Fisher线性判别分类算法的性能,数值实验表明基于核的分类算法与传统分类算法相比具有高精度,自适应的优点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号