一种基于编码的双距离树高维索引 |
| |
作者姓名: | 庄毅 庄越挺 吴飞 |
| |
作者单位: | 浙江大学计算机科学与技术学院,杭州,310026 |
| |
基金项目: | 国家自然科学基金重点项目;国家杰出青年科学基金;国家自然科学基金;高等学校中英文图书数字化国际合作项目 |
| |
摘 要: | 提出一种基于编码的双距离树(EDD-tree)高维索引结构.对于高维空间中的数据点,首先通过k平均聚类算法将其聚成若干类,然后分别计算每个点对应的始点和质心距离,并对其进行编码得到对应的统一化索引键值,最后用基于分片的B+树建立索引.这样,高维空间的查询就转变成对一维空间的检索.实验证明该方法能更有效地缩小搜索空间,减少距离计算的代价.理论分析和实验都表明,EDD-tree索引在查询效率方面要明显优于其他的索引方法,尤其适合海量高维数据的查询.
|
关 键 词: | k近邻查询 类超球 质心片 始点片 |
收稿时间: | 2007-06-16 |
修稿时间: | 2007-08-06 |
本文献已被 CNKI 维普 万方数据 等数据库收录! |
|