首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 98 毫秒
1.
杨莉云  颜远海 《河南科学》2019,37(4):507-513
孤立点的存在使聚类中心的计算产生较大误差,影响K-means算法的聚类效果.针对该问题,引入谢林模型,使孤立点能够自动移动到其邻居所在位置,消除孤立点,同时,对K-means算法过程中的距离计算、初始聚类中心选取环节进行改进,提出基于孤立点自适应的K-means算法.该算法首先对原始数据进行归一化处理,以提高距离计算的准确性;然后,根据谢林模型的基本思想,将孤立点移动到其最近的多邻邻居;接着,由类簇的数目确定邻居样本的搜索范围,确定初始聚类中心;最后,根据移动后的数据集和初始聚类中心,进行K-means聚类.在UCI机器学习数据库中经典聚类数据集上的实验结果表明,该算法可显著提升聚类的精度,同时,簇的内聚性也比较好.  相似文献   

2.
一种改进的离群点检测方法   总被引:1,自引:0,他引:1       下载免费PDF全文
现有的离群点检测算法运用于规模较大的数据集时,其时间效率和检测效果通常不够理想.通过对离群点分布特征的分析,在计算每个数据点到其kth最近邻对象距离的同时,结合其k最近邻的分布情况,给出一种改进的离群点度量方法.基于上述思想构造的离群点检测算法DokOF能够处理混合属性数据.实验表明,该算法具有良好的适用性和有效性.  相似文献   

3.
为提升异常检测算法在处理局部异常、异常簇和复杂分布数据集时的检测精度,降低对数据先验信息的依赖性,提出一种基于逆K最近邻的密度峰值异常检测方法(Rknn-DP).首先结合逆K最近邻(Rknn)改进密度峰值算法中局部密度和相对距离的计算方式,通过引入邻域信息更准确地刻画异常点的特征,然后根据特征分布选取局部密度低、相对距离高的点作为粗选异常点集合,最后通过逆K最近邻计算粗选集合的异常因子,根据异常程度进行剪枝,排除噪声点、降低连带错误效应,自适应得到最终的异常点集.通过与ABOD、LSCP、HBOS、IForest等算法在真实数据集与人工数据集上的对比实验,证明了Rknn-DP算法的自适应性和有效性.  相似文献   

4.
针对文本分类存在的高维文本问题,提出文档频率(DF)-卡方统计量特征提取方式,对特征项进行有效约减,降低文本维度,提高分类精度.在K最近邻(KNN)算法的基础上,针对待分类文本需要和大量训练集样本进行相似度计算的问题,提出一种基于分组中心向量的KNN算法,对类别内的样本集分组求出各组中心向量,使其重新代表训练库计算相似度,降低计算复杂度,提升算法的分类性能.通过实验表明:相较传统KNN算法,改进的算法在准确率、召回率及F值方面都有提升,与其他分类算法相比,具有一定的优势.  相似文献   

5.
将经典的PageRank算法和汉明距离相似度算法结合,提出一种新的网页排序方法。通过结合汉明距离(Hamming distance)相似度算法,计算检索词和网页文本相似度,提高搜索查准率;在增加检索词的同义词的搜索过程中,通过改进汉明距离相似度算法,提高搜索查全率。实验结果表明,该方法与PageRank算法相比,拥有了更好的效果。  相似文献   

6.
利用尺度不变特征点的提取方法提取特征点,并对SIFT方法提取出的特征点用最近邻算法进行配准,在搜索最近邻特征点和次近邻特征点时使用了在K-D树搜索算法基础上进行改进的搜索算法BBF(Best Bin First)算法。实验证明该算法具有配准精度高,鲁棒性好的特点。  相似文献   

7.
本文提出一种基于内容和最近邻(k-近邻)的多臂老虎机推荐算法:把推荐问题转化成多臂老虎机问题,把冷启动问题转化成EE(explore exploit)问题;通过观察用户特征,以用户特征为内容,计算用户之间的相似度并得出用户的最近邻;最近邻用户基于内容对推荐池物品进行预期评价,根据用户最近邻的预期评价情况,选择综合最优的物品推荐给用户. 并通过采用来自Movielens和Jester的真实数据集进行实验,实验结果表明:结合内容和最近邻算法的推荐算法更优且更具实用性,尤其在解决冷启动问题上效果显著.  相似文献   

8.
针对无线传感器网络(WSN)节点在随机部署时,存在分布不均匀的情况,从而导致覆盖率较低的问题,提出了一种改进的灰狼优化(GWO)算法.首先利用Tent混沌映射初始化种群,增加种群的多样性;其次利用改进的非线性收敛因子,平衡算法的全局搜索能力与局部搜索精度;最后将差分进化(DE)算法的变异、交叉的理念融入GWO算法,避免算法陷入局部最优,并提高算法的收敛速度.基本测试函数仿真结果验证了改进算法的有效性,随后将其应用于WSN覆盖优化问题,可以使节点的分布更加均匀,显著提高覆盖率,进而改善网络性能.  相似文献   

9.
针对当前空间数据库聚类方法未考虑降维后的距离特征反向结果, 导致空间数据分量失真, 存在聚类精度低、 耗时长的问题, 提出一种空间数据库反向最近邻聚类方法. 首先, 通过选取训练样本集实现核矩阵的特征分解, 获得其距离特征修正值去除初始值的影响; 然后, 根据核主成分分析(KPCA)降维并结合降维后的距离特征反向结果, 利用反向最近邻聚类方法与扩展的部分失真搜索法相结合, 实现空间数据的聚类; 最后利用选定的聚类中心对数据集进行计算, 计算数据集第一维分量与聚类中心第一维分量之间的失真, 得到反向最近邻, 直至所有空间数据均找到所属类别, 最终完成空间数据库反向最近邻聚类. 实验结果表明, 该方法提高了空间数据的聚类精度, 减少了空间数据聚类所用时间.  相似文献   

10.
基于案例推理的方法是一种基于知识获取的方法,也是一种新型的基于数据驱动的建模方法。基于案例推理的核心是案例检索。针对基于案例推理系统中案例检索工作,本文提出了一种改进的K最近邻回归建模算法。首先,基于聚类思想的最近邻回归算法可以实现对案例库的有效划分,从而提高案例检索质量;其次,针对K最近邻算法中邻居个数的选取问题,采用粒子群算法确定需要的邻居个数,取代传统的依靠经验确定邻居个数K的做法。通过对Mackey-Glass混沌时间序列数据进行仿真预测,验证了该方法的可行性。  相似文献   

11.
为迅速、准确、无过多人工干预的进行图像分割,提出了一种K最近邻算聚类方法并将其应用于图像处理。与经典K最近邻算法在样本库中寻找最近邻点不同,该算法在待分割图像的RGB空间中寻找每一个像素点的K个最近邻点,参考所有像素点同最近邻点之间的平均距离,引入聚类阈值并对像素点的归属进行判断。对火焰图像的分割实验结果表明,在分割精度相接近的情况下,该算法的分割速度要快于其它几种常见算法。  相似文献   

12.
基于曲线推进的符号距离函数生成方法   总被引:1,自引:0,他引:1  
目的构造水平集方法中所采用的符号距离函数,以提高曲线演化算法的速度。方法通过对水平集曲线形状的分析,给出了曲线内外点的判断方法,然后以距离等于1为步长推进边界,同时进行邻域最近点扫描,寻找任一网格点在曲线上的最近点,从而给出该点到曲线的距离。结果内外点的判断以及符号距离函数的构造均只需要经过图像的一次扫描即可给出结果,计算复杂度为O(N)。结论数值实验分析结果表明,新的方法计算稳定,比其他方法速度快。  相似文献   

13.
考虑为移动中的查询对象连续返回k个距离近并且满足空间多样化约束的对象,提出了空间多样化约束下的移动k近邻(SDC-MkNN)查询.在此,满足空间多样化约束代表对象之间的相互距离大于距离阈值.为了高效处理SDC-MkNN查询问题,提出了两种基于安全区域技术的算法.算法均通过减少重新计算查询结果的次数来提高查询效率.其中一种为精确算法EA,可连续返回精确的查询结果;另一种为近似算法ρAA,可连续返回具有近似率保障的近似查询结果.采用真实数据集验证了所提出算法的有效性.  相似文献   

14.
基于最近邻法的短时交通流预测   总被引:3,自引:0,他引:3  
针对交通流量变化存在周期性和随机性的特点,提出一种基于最近邻法的预测方法.着重介绍了状态向量构造、近邻范围确定和权重计算方法三方面的研究.根据流量与速度、占有率的关系,认为状态向量中不必考虑速度和占有率这两个交通参数;与传统最近邻法不同,近邻的个数不设为常量,而取决于所能搜索到的记录数;通常根据距离远近赋予权重的规则不可靠,而采用了等权重法.通过实际数据检验,预测误差低于7%.  相似文献   

15.
RNN(相互最近邻)算法是一种基于层次的聚类算法,它比其他传统的层次聚类算法聚类更快.由于利用RNN算法对同一个数据集聚类,若选择不同簇间距离度量方式,那么聚类结果就会不同.因此在分析聚类结果对距离度量方式依赖性的基础上,采用用聚类聚集的思想,找出一种新的聚类方式,从而使得聚类效果更好.  相似文献   

16.
针对毫米波雷达数据均匀性差,数据量小,噪点多等问题,提出一种基于DBSCAN (density-based spatial clustering of applications with noise)的雷达自适应聚类算法.改进算法能够根据K近邻距离和目标反射截面自适应调整聚类半径.首先给出一种聚类半径根据K近邻距离动态调整的机制:目标第K个近邻的距离与阈值相比较,以确定阈值半径取值.再提取雷达提供的目标反射截面,基于该值计算目标假象半径作为聚类半径的补充量.实现根据目标反射截面与数据稀疏程度自适应聚类的效果.将改进算法与不同参数的DBSCAN聚类算法在真实雷达点云数据进行实验对比.相较于选取合适参数的DBSCAN算法,改进算法能够更好适应毫米波雷达点云特征,对行人目标识别准确率提高4.18%,对车辆目标识别准确率提高5.63%.  相似文献   

17.
一种改进的LLE方法   总被引:1,自引:0,他引:1  
局部线性嵌入(Locally Linear Embedding,简称LLE)是一种较好的非线性降维方法,这种方法对于位于某种非线性流形上的数据的降维有着比较好的效果.但是这种方法对于其中一个重要参数——近邻个数,太过敏感.文章将另一种非线性降维方法Conformal-Isomap中的一种度量数据之间距离的方法引入到LLE方法中.经过实验发现,新引入的距离对于近邻个数的选择有比较好的效果,可以使得实验的结果对近邻个数的选择不那么敏感.  相似文献   

18.
 针对以表面网格表示的软组织形变过程中受力点最近邻质点求取算法存在的不足,提出了基于随机点搜索平面最近邻质点的改进算法.该算法将以往穷举集合的方式改为随机点树形搜索方式,使得算法减少了受力点与各个质点之间的距离大小的比较次数,在模拟平面组织形变时具有较好的实时性.实验表明,面积匹配算法结合质点弹簧算法能很好地模拟软组织形变的过程,达到良好的实时与准确性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号