期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

古丽娜孜孙铁利胡西旦伊力亚尔库瓦特拜克《东北师大学报(自然科学版)》2014,(2)

将文本分类理论应用于哈萨克语中,给出了哈萨克语文本预处理过程.介绍一种改进的KNN算法,并结合自己构建的哈萨克语料集实现基于改进KNN算法的哈萨克语的文本分类.仿真实验数据表明,该方法在哈萨克语的文本分类上获得了较好的效果. 相似文献

2.

王恒《宁夏大学学报(自然科学版)》2009,30(3):248-250

阐述了注入式攻击及KNN算法的相关概念并探讨了注入式攻击行为检测与文本分类技术的关系.结合KNN算法的优点及注入式攻击行为检测与文本分类的相似性,提出了Web日志中基于KNN算法的注入式攻击检测方法,给出了其计算模型,并进行了检测对此.结果表明,该方法具有良好的检测准确度. 相似文献

3.

基于模糊C-Means的改进型KNN分类算法

朱付保谢利杰汤萌萌朱颢东《华中师范大学学报(自然科学版)》2017,51(6):754-759

KNN算法是一种思想简单且容易实现的分类算法,但在训练集较大以及特征属性较多时候,其效率低、时间开销大.针对这一问题,论文提出了基于模糊C-means的改进型KNN分类算法,该算法在传统的KNN分类算法基础上引入了模糊C-means理论,通过对样本数据进行聚类处理,用形成的子簇代替该子簇所有的样本集,以减少训练集的数量,从而减少KNN分类过程的工作量、提高分类效率,使KNN算法更好地应用于数据挖掘.通过理论分析和实验结果表明,论文所提算法在面对较大数据时能有效提高算法的效率和精确性,满足处理数据的需求. 相似文献

4.

基于超长方体与KNN的分类算法

陈发张公敬赵忠帅《青岛大学学报(自然科学版)》2013,(4):57-61

提出了超长方体与KNN相结合的分类算法.在训练阶段,该算法为训练集中的每一个类别构造多个超长方体,区域分离每一类训练样本.在测试阶段,该算法首先检查测试样本是否被某一个超长方体包围,如是则其类别被识别出,否则用KNN方法确定其类别.实验采用四个真实数据集进行测试.实验结果表明基于超长方体与KNN的分类算法在四个数据集全部优于两个基于多球覆盖的分类方法,是一种有效的分类方法. 相似文献

5.

一种新颖的基于马氏距离的文本分类方法的研究 总被引：1，自引：0，他引：1

张素莉潘欣《长春工程学院学报(自然科学版)》2011,12(2):102-105

KNN(k最近邻算法)是文本挖掘领域最成熟最简单的分类方法之一.该方法对文本分类中的距离参数的选取敏感,错误的选择将导致分类精度降低,影响最终分类效果,该缺陷限制了KNN分类器在文本数据挖掘中的应用.因此,本文将马氏距离引入到文本分类领域,并将其与KNN算法相结合,提出了一种基于马氏距离的新的文本分类方法(Mahala... 相似文献

6.

基于SVM的特征加权KNN算法 总被引：19，自引：1，他引：19

陈振洲李磊姚正安《中山大学学报(自然科学版)》2005,44(1):17-20

作为一种非参数的分类算法,K-近邻(KNN)算法是非常有效和容易实现的.它已经广泛应用于分类、回归和模式识别等.在应用KNN算法解决问题的时候,要注意两个方面的问题--样本权重和特征权重.利用SVM来确定特征的权重,提出了基于SVM的特征加权算法(FWKNN,feature weighted KNN).实验表明,在一定的条件下,FWKNN能够极大地提高分类准确率. 相似文献

7.

基于Hadoop平台的KNN分类器的优化和实现

王江涛陈锻生温新竹《太原理工大学学报》2016,(4):513-517,526

分析了KNN分类算法的流程,然后在K值的动态获取和分类加权两个方面对分类算法进行改进;利用MapReduce编程思想完成KNN分类算法在Hadoop集群环境下的移植和实现。实验数据证明,改进后的KNN分类算法在人脸识别精度、识别效率和稳定性3个方面得到了有效提高。相似文献

8.

KNN文本分类算法中的特征选取方法研究 总被引：1，自引：0，他引：1

曹勇吴顺祥《科技信息》2006,(12):26-28

对基于中文的文本分类过程进行了介绍,重点介绍了文本分类中几种特征选取的方法,详细介绍了KNN分类算法,最后介绍了文本分类的评估方法并通过实验测试对比了几种特征选择的方法在基于KNN技术的文本分类中的使用效果. 相似文献

9.

KNN算法及其在月电量预测中的应用

周芳杨玲《咸宁学院学报》2009,29(6):91-93

目前对用电量的预测方法很多,本文利用数据间的相关性,应用改进的KNN分类算法,提出了基于KNN分类算法的月用电量模型,并进行试验预测．预测结果表明此方法简单、有效．相似文献

10.

基于BP改进的KNN算法在北京密云土地覆盖分类中的应用

王佃来宿爱霞刘文萍《科学技术与工程》2020,20(23):9464-9471

针对k近邻(k-nearest neighbor,KNN)算法在土地覆盖分类中存在将山体阴影覆盖下植被误分成水体的问题,提出改进的KNN算法。改进算法充分利用神经网络能有效区分山体阴影覆盖下植被和水体的特性,实现BP神经网络与KNN算法的融合,整体提高了北京市密云区土地覆盖分类精度。实验结果表明:相对于支持向量机(support vector machine,SVM)、随机森林、BP神经网络和KNN算法,改进算法分类精度最高,达到了95.20%,分类精度比未改进KNN算法提高了6.43%。改进算法的Kappa系数在对比算法中也是最高的,达到0.93。此外,实验结果也表明改进算法可应用于中分辨率遥感图像分类中。相似文献

11.

基于粗糙KNN算法的文本分类方法

王渊刘业政姜元春《合肥工业大学学报(自然科学版)》2014,(12):1513-1517

在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。相似文献

12.

基于KNC算法的中文网页分类方法研究

李旻杜海顺王琪《河南大学学报(自然科学版)》2010,40(5)

针对中文网页分类问题,提出一种基于KM和CV的KNN改进算法——KNC算法.基于该方法的网页分类实验结果表明,KNC算法在保持分类质量的情况下,较大地提高了分类的速度. 相似文献

13.

基于并行遗传算法的KNN分类方法

王小青《西南师范大学学报(自然科学版)》2010,35(2)

针对KNN的K值难以确定的问题,提出一种基于并行遗传算法的KNN分类方法.该方法采用粗粒度模型的并行遗传算法进行设计,通过种群内的遗传、变异和种群间的并行进化、联姻得到优化的K值和分类结果.实验结果表明,该方法有效的提高了KNN算法的分类效果,是一种精确高效的分类方法. 相似文献

14.

基于纹理基元与颜色的室外自然场景分类

陆培源王建中施家栋《北京理工大学学报》2011,31(11):1342-1346

为解决算法生成纹理地图时时间耗费量大的问题,提出采用KD-tree算法对数据结构进行划分、减小KNN算法搜索复杂度、提高搜索速度的方法.针对基于纹理基元的分类算法无法准确检测室外某些纹理相似性较高的自然场景,提出加入颜色特征、设置相应权值构建混合模型的方法.实验结果表明,基于KD-tree的KNN算法可缩短分类时间、满足实时性的要求,基于纹理基元与颜色的分类算法在室外自然场景中能够获得较高的分类精确度. 相似文献

15.

基于粗糙集与KNN的Web文本分类的研究

桂海霞孟祥瑞《安徽理工大学学报(自然科学版)》2008,28(4)

为了从海量的信息资源库中快速、准确地进行分类并提取出有用的信息,提出了一种基于粗糙集和KNN混合的Web文本分类模型。利用粗糙集的属性约简理论降低了文本分类过程中的向量维数,使用一种基于分明矩阵的属性约简算法,特征选择过程采用互信息量计算方法,并对该混合算法进行了实验,同时结合传统的KNN方法对该混合算法进行比较,验证该算法的可行性。相似文献

16.

基于MapReduce的粒子群投影寻踪模型的设计与实现 总被引：1，自引：0，他引：1

黄奕平万剑怡万中英王明文* 《江西师范大学学报(自然科学版)》2012,(4):388-394

利用MapReduce模式设计并实现了粒子群投影寻踪算法的并行化,以提高算法的效率.在分类阶段使用了基于MapReduce的KNN分类算法并行,实验结果表明:基于MapReduce实现的粒子群投影寻踪模型能够有效地寻找到较好的投影方向,确保分类效果;并且与其串行算法相比,在实现效率上有较大的提高. 相似文献

17.

基于XML Schema的Deep Web查询接口分类研究

苟和平景永霞吴多智《长春大学学报》2016,(4):13-18

Deep Web在线数据库蕴含大量的信息,但由于这些信息检索困难,利用率不高,本文提出一种基于XML Schema的查询接口分类方法,建立数据查询接口的XML Schema文档,通过各数据源名的语言学相似度实现查询接口的初次分类;根据查询接口标签属性,建立特征-接口向量空间模型实现查询接口向量化,再采用KNN算法进行二次分类,减少KNN算法分类带来的计算开销,提高Deep Web数据检索的效率。相似文献

18.

基于阈值聚类和KNN分类的入侵检测

谭三刘宁《郑州大学学报(理学版)》2010,42(1)

利用基于阈值聚类算法首先对带类标记的样本数据集进行有指导性聚类,其主要目的是压缩训练数据集,解决KNN分类算法的样本选择问题以及孤立点的发现,用少量的更具代表性的聚类中心替代KNN算法中巨大的样本集,然后利用聚类密度改进KNN分类算法,从而提高KNN分类检测的准确度和速度. 相似文献

19.

一种基于KNN的半监督分类改进算法 总被引：1，自引：0，他引：1

陆广泉谢扬才刘星张师超《广西师范大学学报(自然科学版)》2012,30(1):45-49

本文提出一种新的基于KNN分类的半监督学习self-training改进算法,并以多个UCI数据集为实验,对基于KNN的半监督分类模型算法进行改进,充分利用已知类别标签数据的正确知识进行自训练,以得到最终分类结果.实验结果表明,该方法能显著提高分类准确率. 相似文献

20.

基于概率模型LVQ的改进KNN分类新方法

刘仲民徐炎赵彦敏胡文瑾《兰州理工大学学报》2013,39(3):70-74

KNN是基于实例的算法,对于大规模样本算法分类性能不高.针对这一缺点,提出一种基于概率模型的学习矢量量化神经网络的改进KNN分类新方法.考虑到最优参考点训练的重要性,结合概率方法得到最佳参考点的判断准则函数,采用梯度下降最优化算法利用LVQ训练参考点的最佳位置.在对未知样本进行分类时选出样本x的K个近邻,采用"投票选举"机制最后判断样本x的所属类别.新方法减少KNN的计算复杂度和时间,弥补了KNN在处理大规模数据问题上的不足.在UCI中数据集上的仿真实验表明改进算法的可行性. 相似文献