首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种支持高维数据查询的并行索引机制
引用本文:王寅峰,刘昊,狄盛,胡昊宇.一种支持高维数据查询的并行索引机制[J].华中科技大学学报(自然科学版),2011,39(Z1):156-160.
作者姓名:王寅峰  刘昊  狄盛  胡昊宇
作者单位:1. 香港大学计算机系,香港;深圳信息职业技术学院,广东深圳518029
2. 香港大学计算机系,香港
基金项目:国家高技术研究发展计划资助项目(2006AA01A111); Hong Kong RGC Grant(HKU7176/06E); 香港教资会专用设备建设基金资助项目(SEGHKU09)
摘    要:提出了一种基于独立特征的并行索引体系结构以检索符合正态分布的高维数据.通过分析并行搜索的多维数据及其复杂度,结合用户设定的维度权重返回待核实的结果,最后通过加权相似度计算函数合并检索结果以完成kNN查询.针对高维数据的异构性特点,给出了规范情景上下文信息数据的算法.通过联合香港大学的2个社区和深圳先进研究院的CNGrid社区进行的测试,证明基于并行检索机制的100NN查询准确率可达93%,在千万个高维数据中的检索时间小于0.7s,结果表明所提出的并行索引机制能有效提高查询效率,尤其适合海量高维数据的有偏组合特征查询.

关 键 词:组合查询  高维数据索引    位置敏感哈希函数  中国国家网格

A parallel index mechanism for large scale high dimensional data
Wang Yinfeng,Liu Hao,Di Sheng,Hu Haoyu.A parallel index mechanism for large scale high dimensional data[J].JOURNAL OF HUAZHONG UNIVERSITY OF SCIENCE AND TECHNOLOGY.NATURE SCIENCE,2011,39(Z1):156-160.
Authors:Wang Yinfeng  Liu Hao  Di Sheng  Hu Haoyu
Institution:Wang Yinfeng1,2 Liu Hao1 Di Sheng1 Hu Haoyu1(1 Department of Computer Science,University of Hong Kong,Hong Kong,China,2 Shenzhen Institute of Information Technology,Shenzhen 518029,Guangdong China)
Abstract:A new parallel index mechanism suitable for searching large scale high dimensional information,with independent features according to normal distribution was proposed.By analyzing parallel search of the multi-dimensional data as well as its combinatorial complexity,a weighted similarity function on user-defined weights to finish the kNN queries was leveraged.In addition,a data normalization algorithm for enhancing the index classification capability was further developed.The methods are evaluated on the CNG...
Keywords:query composition  high dimensional indexing  entropy  locality sensitive hashing  CNGrid  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号