首页 | 本学科首页   官方微博 | 高级检索  
     

一种基于编码的双距离树高维索引
作者姓名:庄毅  庄越挺  吴飞
作者单位:浙江大学计算机科学与技术学院,杭州,310026
基金项目:国家自然科学基金重点项目;国家杰出青年科学基金;国家自然科学基金;高等学校中英文图书数字化国际合作项目
摘    要:提出一种基于编码的双距离树(EDD-tree)高维索引结构.对于高维空间中的数据点,首先通过k平均聚类算法将其聚成若干类,然后分别计算每个点对应的始点和质心距离,并对其进行编码得到对应的统一化索引键值,最后用基于分片的B+树建立索引.这样,高维空间的查询就转变成对一维空间的检索.实验证明该方法能更有效地缩小搜索空间,减少距离计算的代价.理论分析和实验都表明,EDD-tree索引在查询效率方面要明显优于其他的索引方法,尤其适合海量高维数据的查询.

关 键 词:k近邻查询  类超球  质心片  始点片
收稿时间:2007-06-16
修稿时间:2007-08-06
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号