共查询到19条相似文献,搜索用时 109 毫秒
1.
为了提高相似最近邻搜索(ANN)算法的精度,提出了一种在度量空间下基于距离的相似最近邻搜索算法-优化的VP森林(OVF)算法。在传统VP树(VT)算法的基础上,首先采用改进的选择优势点的方法,通过从数据集采样优势点候选集,对其进行评估,选取其中区分度大的点作为优势点;然后提出构建多棵VP树的新方法,改进距离优势点远的子树中最近邻不紧凑问题;接着提出使用优先队列与剪枝搜索方法结合的新搜索方法查找最近邻,减少了很多不必要的距离计算。最后通过实验结果表明,本文方法在数据维度、数据集大小、返回不同邻居个数、不同的距离函数及建树个数方面精度有了很大的提高。 相似文献
2.
研究了在最近邻预测中如何选择最近邻的阶数的问题。考虑了两种根据训练样本来确定近邻阶数kn与kn的方法。还证明了使用这些近邻阶数来进行预测可以达到最优预测以及进行了随机模拟计算,计算结果与文中理论相当吻合,并且揭示了最优近邻阶数k0n与样本量n之间关系。 相似文献
3.
分析北京地区日降雨量资料,相较于其他降雨事件,大雨或暴雨事件发生的次数较少,因此该地区的降水量预报属于样本不均衡问题。在样本不平衡的情况下,K最近邻(PNN)算法的分类误差率将会大大提高,这也就使传统的基于K最近邻算法的降水量预报方法的应用受到了限制。针对北京地区降水量预报这一样本不均衡问题,应用伪最近邻算法构建了北京市的降水量预报模型。该方法利用北京地区日降雨量资料和美国国家环境预报中心全球格点资料,将降雨量作为类,将美国国家环境预报中心全球格点资料的各种因子场作为天气样本特征,通过决策规则实现最优分类。利用提出的降水预报模型对北京地区2010年6~8月进行了24 h降水预报,实验结果表明,提出的预报方法对于降水等级预报的预报准确率以及晴雨预报的TS评分、正样本概括率和漏报率均优于传统的K最近邻预报方法,该方法具有较好的预报效果。 相似文献
4.
5.
随着无线通讯及连续移动对象寻轨技术的高速发展,迫切需要提出解决大量移动对象查询的有效方法。本文提出了一个解决连续移动点反向最近邻查询的算法,同时也提出了解决连续移动点的最近邻查询算法。 相似文献
6.
针对度量空间中的无索引空间数据库,提出一种基于最优点的集合最近邻查找算法及其改进算法.采用真实数据集与人工生成的数据集对算法进行测试,评估所提出算法的效率.实验结果表明,所提算法的效率优于组最近邻居查询算法,并且对于高维数据空间,所提出的算法有较高的稳定性.由于查询区域中数据点的数量比较少,改进的基于最优点的集合最近邻... 相似文献
7.
8.
提出基于K-最近邻算法的话务智能预测技术,利用机器学习算法从电信话务信息的历史数据中提取规律,从而预测未来的电信话务信息情况。在算法中根据时间间隔对样例的距离度量进行了特征加权。针对互联互通来话数据的实验表明,该算法具有良好的性能。 相似文献
9.
基于有界k-d树的最近点搜索算法 总被引:2,自引:0,他引:2
提出了一种基于有界k-d树的最近点搜索算法.算法的原理是:由根节点中的包围盒确定树中数据的空间范围,并在搜索过程中不断划分包围盒来缩小搜索范围,同时递归地计算查询点到包围盒的距离.结合优先级队列,基于有界k-d树的最近点搜索算法拓展到搜索按距离远近排列的多个最近点.实测和仿真分析表明,本搜索算法的计算效率高于传统的搜索算法. 相似文献
10.
移动查询点的最近邻查询在时空数据库查询的领域具有很重要的地位。本文提出了一个以处理动态环境下的K个最近邻居(K-NN)查询问题的有效的方法。 相似文献
11.
钱付兰 《安庆师范学院学报(自然科学版)》2007,13(4):51-53
交叉覆盖算法分类时着重在于两类的交界部分,混杂在另外一类中往往无助于提高分类器的效率,反而会增加分类器的计算负担。本文提出一种基于交叉覆盖算法的最近邻交叉覆盖算法(NN-ACA):对进行训练的原始样本数据进行预处理,删除这些不同类的最近邻点,得到精简后的样本集,再对该样本集使用交叉覆盖算法。通过实验和与SVM的比较,结果表明NN-ACA在一定的样本规模表现了速度和分类正确性上的优越性。 相似文献
12.
基于最近邻法的短时交通流预测 总被引:3,自引:0,他引:3
针对交通流量变化存在周期性和随机性的特点,提出一种基于最近邻法的预测方法.着重介绍了状态向量构造、近邻范围确定和权重计算方法三方面的研究.根据流量与速度、占有率的关系,认为状态向量中不必考虑速度和占有率这两个交通参数;与传统最近邻法不同,近邻的个数不设为常量,而取决于所能搜索到的记录数;通常根据距离远近赋予权重的规则不可靠,而采用了等权重法.通过实际数据检验,预测误差低于7%. 相似文献
13.
一种新的最近邻聚类算法 总被引:1,自引:0,他引:1
在分析现有最近邻聚类算法所存在问题的基础上,提出了一种先利用均值规格化的思想来确定算法的初始半径,然后根据启发式规则修改聚类半径的新的最近邻聚类算法.同时,给出了聚类有效性函数对得到的聚类结果进行合理性判断. 相似文献
14.
用周期模型和近邻算法预测话务量时间序列 总被引:1,自引:1,他引:1
客服中心话务量虽然具有周期性,但在不同时间遵循不同变化规律,这是话务量预测的难点。针对这个问题,以某电信公司一年的实际话务数据为基础,分别采用周期模型和基于实例的近邻算法进行话务量时间序列预测,并对比分析了两种预测方法的效果。实验数据表明,对工作日话务量的预测,周期模型的预测效果优于近邻算法;对非工作日话务量的预测,近邻算法的预测效果优于周期模型。为取得更好的预测效果,实现了周期模型和近邻算法相结合的预测方法。结果表明,在最好的情况下,该方法的预测精度比周期模型提高约19.7%,比近邻算法提高约48.8%。 相似文献
15.
研究了220 kV/330 kV高压带电清扫机器人的绝缘瓷瓶视觉识别系统中的高维特征索引问题.该系统采用了基于局部尺度不变性特征的方法,在生成匹配假设的过程中,尝试将简单最邻近搜索算法用于高维特征的索引.在离线阶段,对给定向量集合中每个向量的每一维进行排序,生成排序的数据结构.在线搜索阶段:①对排序数据结构的第一维确定位于边界条件内的所有向量,构成候选队列;②依次检查候选队列中向量的其他维,剔除不满足边界条件的向量;③采用穷举法寻找与查询向量最邻近的向量.比较了简单最邻近搜索算法和k-d树算法.实验结果证明,简单最邻近搜索算法用于具有更强的边界约束,通过选择合适的边界条件能够获得更高的运算效率.该算法能广泛用于基于高维特征的物体识别和定位. 相似文献
16.
根据两种渐近量的定义,研究了七种能谱涨落模型之紧邻间距分布函数的渐近性质及其物理内涵,并在此基础上对紧邻间距分布函数作出了系统分类和适用性说明。研究结果表明Brody分布函数具有最为广泛的普适性。 相似文献
17.
TSP邻近算法在Euclid平面上的性能比分析 总被引:1,自引:1,他引:1
刘剑平 《华东理工大学学报(自然科学版)》2004,30(3):336-338
旅行推销员问题(TSP)邻近算法的性能比已经被证明有一个关于点数的对数函数上界,本文就该方法在欧几里得平面上给出了性能比的一个对数下界。 相似文献
18.
刘久彪 《吉林大学学报(理学版)》2019,57(2):387-392
针对当前空间数据库聚类方法未考虑降维后的距离特征反向结果, 导致空间数据分量失真, 存在聚类精度低、 耗时长的问题, 提出一种空间数据库反向最近邻聚类方法. 首先, 通过选取训练样本集实现核矩阵的特征分解, 获得其距离特征修正值去除初始值的影响; 然后, 根据核主成分分析(KPCA)降维并结合降维后的距离特征反向结果, 利用反向最近邻聚类方法与扩展的部分失真搜索法相结合, 实现空间数据的聚类; 最后利用选定的聚类中心对数据集进行计算, 计算数据集第一维分量与聚类中心第一维分量之间的失真, 得到反向最近邻, 直至所有空间数据均找到所属类别, 最终完成空间数据库反向最近邻聚类. 实验结果表明, 该方法提高了空间数据的聚类精度, 减少了空间数据聚类所用时间. 相似文献