期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

梁淑蓉陈基漓谢晓兰《科学技术与工程》2021,21(7):2760-2766

信息采集技术日益发展导致的高维、大规模数据,给数据挖掘带来了巨大挑战,针对K近邻分类算法在高维数据分类中存在效率低、时间成本高的问题,提出基于权重搜索树改进K近邻(K-nearest neighbor algorithm based on weight search tree,KNN-WST)的高维分类算法,该算法根据... 相似文献

2.

随机近邻分类的算法研究

胡远来母智弘《成都理工大学学报(自然科学版)》2002,29(6):690-693

对随机近邻分类方法做了深入的研究 ,采用了随机近邻判决准则 ,对一事例数据进行了计算 ,并与多元系统聚类得出的结果进行对比 ,显示出随机近邻分类方法具有较好的非线性、非球形分类的特点 ,值得进一步推广应用相似文献

3.

使用模糊加权距离的模糊K—近邻算法

鲁宇《枣庄师专学报》1990,7(2):71-76

本文用自定义的模糊加权距离代替K—近邻分类器中的明氏距离,这种替代突出了每一样本中占有优势的特征分量对距离的贡献。仿真实验及实用结果表明这种替换可进一步改善分类器的性能。相似文献

4.

一种改进的随机近邻算法 总被引：1，自引：0，他引：1

胡远来《成都理工大学学报(自然科学版)》2004,31(1):96-99

提出一种随机近邻分类的改进算法,它仍采用随机近邻判决准则,利用全局寻优思想,设计了最邻近生成算法,在理论和实践上说明了新算法分类良好的非线性、非球形性的特点,获得了与样本输入顺序无关的确定性结果.该算法原理简单,计算步骤明确,易于编程,可操作性强,便于应用推广. 相似文献

5.

一种基于K近邻团的聚类算法

曲超《科学技术与工程》2013,13(19):5696-5701

在K近邻和逆K近邻理论基础上提出了K近邻团的概念。通过度量对象间的相似度,任意两个元素都互为K近邻和逆K近邻的对象集合构成一个K近邻团。利用同一个K近邻团中的对象彼此都具有较高相似性的特点,选取不同的K值对目标集合进行聚类。通过实验证明了该方法的有效性。相似文献

6.

基于K近邻分类间隔的特征选择方法研究

李云张腾飞杨文杰《南京邮电大学学报(自然科学版)》2009,29(6):68-74

特征选择是机器学习和模式识别领域的一个关键问题.文中详细分析研究一类基于K近邻分类间隔的特征选择算法,并着重讨论当K>1时,特征选择的评价准则和搜索策略的设计,同时在多个数据集上验证其性能. 相似文献

7.

融合互近邻和可信度的K-近邻分类算法

石鑫鑫胡学钢林耀进《合肥工业大学学报(自然科学版)》2014,(9):1055-1058

文章提出一种融合互近邻和可信度的K近邻算法,根据互近邻的概念删除噪声数据;利用由近邻诱导待分类样本标签的可信度,避免待分类样本近邻中大类吃小类的概率。该算法不仅可以减小噪声数据对分类的影响,而且一定程度上增强了K近邻分类算法的稳定性。该算法在UCI标准数据集上进行了测试,性能相当或优于其他分类器。相似文献

8.

KNN分类算法研究

李秀娟《科技信息》2009,(31):81-81,383

KNN算法是应用最广泛的分类技术之一。文章简要介绍了KNN算法的基本原理,重点论述了研究人员针对KNN算法的不足所做的各种改进。主要从距离计算的改进、降低计算复杂度、K值的选择、与其它方法集成几个方面进行分析研究。相似文献

9.

K近邻的自适应谱聚类快速算法

范敏王芬李泽明李志勇张晓波《重庆大学学报(自然科学版)》2015,38(6):147-152

谱聚类算法建立在谱图划分理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。然而,谱聚类算法涉及如何选取合适的尺度参数σ构造相似度矩阵的问题。并且,在处理大规模数据集时,聚类的过程需要较大的时间和内存开销。研究从构造相似度矩阵入手,以传统NJW算法为基础,提出一种基于K近邻的自适应谱聚类快速算法FA-SC。该算法能自动确定尺度参数σ;同时,对输入数据集分块处理,并用基于K近邻的稀疏相似度矩阵保存样本信息,减少计算的内存开销,提高了运行速度。通过实验,与传统谱聚类算法比较,FA-SC算法在人工数据集和UCI数据集上能够取得更好的聚类效果。相似文献

10.

动态心电图QRS波形检测算法的分析

黄国言邹沐昌《燕山大学学报》2002,26(2):163-166,169

基于对动态心电图QRS波形进行特征分析和特征提取的基础上，采用线性分析方法对QRS波形的检测算法进行语法描述。大量的实验证明该方法是确实有效的。相似文献

11.

基于Spark和SimHash的大数据K-近邻分类算法

翟俊海沈矗张素芳王婷婷《河北大学学报(自然科学版)》2019,39(2):201

在笔者之前的工作中,提出了一种基于MapReduce和SimHash的大数据K-近邻算法(H-MR-K-NN).虽然该算法能够有效解决大数据K-近邻算法的计算效率问题,运行时间远远低于基于MapReduce的K-近邻(MR-K-NN)所用的运行时间.然而,用MapReduce处理大数据时,需要从磁盘读取数据,再将中间结果写回磁盘,导致系统的I/O开销极大,这大大降低了MapReduce的效率.与MapReduce不同,Spark是一种基于内存的计算框架,它将数据第1次从磁盘读入内存,生成一种抽象的内存对象RDD(resilient distributed datasets).此后,Spark只操作内存中的RDD,计算过程只涉及内存读写,因此大幅提升了数据处理效率.基于这一事实,对算法H-MR-K-NN进行了改进,提出了一种改进的算法(简记为H-Spark-K-NN),可以进一步提高大数据K-近邻分类的运行效率. 相似文献

12.

改进K-means聚类的自适应加权K近邻指纹定位算法

邬春明齐森南《重庆邮电大学学报(自然科学版)》2021,33(6):946-954

针对指纹定位精度易受指纹数据K-means聚类预处理效果不佳、加权K近邻算法采用固定K值进行匹配定位精度差等问题,提出一种基于改进K-means聚类的自适应加权K近邻算法.算法在对指纹数据进行聚类计算过程中充分考虑参考点间接收信号强度值与实际物理坐标的双重影响,以避免参考点分类不明确;根据每个测试点的匹配参考点之间实际距离的均值和标准差设置阈值,动态选择K值.实验结果证明,改进K-means聚类的自适应加权K近邻算法相较于传统室内定位算法定位精度提高了44％,可为相关应用提供更精确的定位服务. 相似文献

13.

最近邻搜索用于分类问题的一种改进

肇莹刘红星王仲宇王元庆《南京大学学报(自然科学版)》2009,(4)

最近邻搜索广泛应用于分类问题,其最显著的优点是分类准确率高、泛化性能好.但现有最近邻分类算法都存在着一个弱点——样本集增大分类计算量也显著增大.为了克服这一不足,本文基于一个新的思路,提出了最近邻分类方法的一种改进方法.该方法在进行最近邻分类时,不一定要找到待分类点的最近邻点,而只要知道最近邻点的类别即可,大大地减少了最近邻搜索时的计算量.用经典的分类问题双螺线问题(TSP)以及其他几个例子,就该改进方法的分类效果、分类速度和学习性能等3个方面进行了测试,并与经典的K维双叉树(KD树)最近邻搜索法以及压缩近邻法进行了比较.结果表明,就综合性能而言,本文改进方法是有竞争力的. 相似文献

14.

基于粗糙KNN算法的文本分类方法

王渊刘业政姜元春《合肥工业大学学报(自然科学版)》2014,(12):1513-1517

在文本分类中,数据规模过大或文本分布不均匀对传统KNN算法的准确率和效率具有重要影响。为了解决该问题,文章提出一种基于粗糙KNN(k-nearest neighbor)算法的文本分类新方法。首先引入粗糙集中的上下近似概念定义各类文本的上下近似空间,将文本向量空间分为核心和混合2大区域;然后改进传统KNN算法的隶属度函数;再针对不同的文本区域,采取差异化的分类策略以提高分类的效率和准确率。实验表明,基于粗糙KNN算法的文本分类方法在提高分类准确率的同时,分类的效率也有很大提高。相似文献

15.

一种基于融合的词袋模型和大裕度最近邻分类算法的图像识别方法

杨亦波王斌王剑锋《上海师范大学学报(自然科学版)》2017,46(4):584-589

图像分类作为图像处理和计算机视觉的重要组成部分,能够快速准确地对数字图像进行分析和管理.对基于bag of word(BOW)模型的分类问题进行了研究,针对图像理解中的图像相似度之间的关系,提出了一种最大间隔最近邻居分类算法,通过对成对约束的度量学习算法,在优化目标中增加原空间数据分类的约束,学习到了一个可以反映当前样本数据的距离函数,并且在k-Nearest Neighbor(KNN)分类器上使用该学习到的距离函数来构建分类器,并在多个国际标准图像数据集上进行实验,结果表明:该算法相比传统的基于欧式距离的算法具备更高的正确率. 相似文献

16.

基于概率模型LVQ的改进KNN分类新方法

刘仲民徐炎赵彦敏胡文瑾《兰州理工大学学报》2013,39(3):70-74

KNN是基于实例的算法,对于大规模样本算法分类性能不高.针对这一缺点,提出一种基于概率模型的学习矢量量化神经网络的改进KNN分类新方法.考虑到最优参考点训练的重要性,结合概率方法得到最佳参考点的判断准则函数,采用梯度下降最优化算法利用LVQ训练参考点的最佳位置.在对未知样本进行分类时选出样本x的K个近邻,采用"投票选举"机制最后判断样本x的所属类别.新方法减少KNN的计算复杂度和时间,弥补了KNN在处理大规模数据问题上的不足.在UCI中数据集上的仿真实验表明改进算法的可行性. 相似文献

17.

基于维样本近邻区间的分类算法研究

李娟王宇平《华中科技大学学报(自然科学版)》2012,40(12):39-43

针对传统KNN算法忽略样本分布对分类的影响,易受到孤立样本、噪音等干扰,时间代价大等问题,提出了一种改进的近邻分类算法.该算法首先采用类维样本存储,打破了样本的整体性,转换了训练样本存储模式;其次按类维度寻求未知样本的类维近邻域,计算类维相似度进而得到未知样本的类别相似度;最后以最大类别相似度标识未知样本.该算法提高了分类效率,降低了独立样本对样本分类的影响.同时可处理连续型和标识型样本分类,并可适应各类样本分布情况,扩大了算法的应用范围.实验结果表明,该算法较传统的近邻算法与邻域分类算法在分类精度与分类时间上有了较大提升. 相似文献

18.

一种动态自适应最近邻聚类学习算法在工业污水处理中的应用

陈先中侯庆文柳瑾庄严孟广军《北京科技大学学报》2006,28(1):84-87

为了建立工业污水pH值中和系统的正模型,研究了具有大滞后非线性特性的加药中和过程.利用一种动态自适应最近邻聚类(DANNC)学习算法,全面调整网络参数完成了污水pH值加药中和控制系统网络的学习和训练.采用中和过程神经网络内模控制系统的逆模型充当控制器,进行了各种工业条件下污水中和的仿真实验.结果表明,该系统实现了△pH≤0.2的工业污水的控制精度目标,系统实时跟踪和抗干扰性良好. 相似文献