首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种LSH索引的自动参数调整方法
引用本文:卢炎生,饶祺.一种LSH索引的自动参数调整方法[J].华中科技大学学报(自然科学版),2006,34(11):38-40,57.
作者姓名:卢炎生  饶祺
作者单位:华中科技大学,计算机科学与技术学院,湖北,武汉,430074
摘    要:针对LSH技术的固有缺点提出了一种根据数据自动调整LSH索引结构关键参数的方法,该方法面向数据集,使得索引结构可以针对不同数据集的统计特征选取适当的散列函数,而不用手工调整LSH索引结构中的关键参数,提高了LSH算法的准确性,且在进行查询时不增加额外的时间空间开销.模拟实验表明,和使用原始LSH算法相比较,使用该方法进行最近邻查询得到结果集的相似性可以提高10%左右,相似偏差可以减小8%左右;并且由于参数调整过程在查询过程之前,因此改进LSH算法和原始LSH算法在进行查询时有相同的时间空间性能.

关 键 词:高维数据索引  相似度查询  近似最近邻查询
文章编号:1671-4512(2006)11-0038-03
收稿时间:2005-09-20
修稿时间:2005年9月20日

A self-tuning method of LSH index
Lu Yansheng,Rao Qi.A self-tuning method of LSH index[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2006,34(11):38-40,57.
Authors:Lu Yansheng  Rao Qi
Abstract:To overcome the handicap of original LSH indexing, an improving approach is presented which enables self-tuning of key parameters of indexing structure. The new approach is dataset-oriented, which make it possible to select appropriate hashing functions according to the statistic feature of a dataset automatically, instead of settling the key parameters manually. This approach improves the indexing performance while not increasing storage and query overhead experiment study shows that comparing to the original LSH method the new approach can improve the inter similarity of result set of query by about 10 %, reduce the error of result set by about 8 %. Meanwhile the new approach has the same temporal-spatial overhead as original LSH when performing query, since the query process is preceded with tuning process.
Keywords:high dimensional data indexing  similarity search  approximate nearest neighbor search
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号