首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于后缀数组改进的全文索引结构研究
引用本文:刘畅,张猛.基于后缀数组改进的全文索引结构研究[J].吉林大学学报(信息科学版),2013,31(2):183-186.
作者姓名:刘畅  张猛
作者单位:吉林工商学院信息工程学院,长春,130062;吉林大学网络中心,长春,130012
基金项目:吉林省教育厅科技发展规划基金资助项目
摘    要:为在网络数据中搜索到所需相关数据, 通过对基于后缀数组的全文索引结构的改进研究, 设计和实现一种降低空间占用率并有效提高索引速度的全文索引结构加权有向词图。通过实验证明, 加权有向词图在相同问题规模下能降低存储空间, 同时不影响检索的效率, 是一种更为高效的全文索引结构。

关 键 词:后缀自动机  全文索引结构  加权有向词图
收稿时间:2011-11-26

Improved Suffix Array-Based Full-Text Indexing Structures
LIU Chang , ZHANG Meng.Improved Suffix Array-Based Full-Text Indexing Structures[J].Journal of Jilin University:Information Sci Ed,2013,31(2):183-186.
Authors:LIU Chang  ZHANG Meng
Institution:1. Department of Information Engineering, Jilin Business and Technology College, Changchun 130062, China;2. Network Center, Jilin University, Changchun 130012, China
Abstract:How to search the data needed in the vast network data becomes the dominant Web search technology. Study on effective information retrieval algorithms and data structures becomes an important issue in this article suffix array-based full-text indexing structure. The goal is to design and implement a reduce space occupancy rate and effective full-text indexing speed to improve the index structure WDWG (Weighted Directed Word Graph). Experiments show that the WDWG with the same size of the problem can reduce the word graph storage space, while not affecting the retrieval efficiency, a more efficient full-text index structure.
Keywords:suffix automaton  full-text index structure  suffix automaton  
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《吉林大学学报(信息科学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(信息科学版)》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号