首页 | 本学科首页   官方微博 | 高级检索  
     

基于改进哈夫曼编码的全文索引结构压缩算法
引用本文:阚君满. 基于改进哈夫曼编码的全文索引结构压缩算法[J]. 吉林大学学报(信息科学版), 2011, 29(5): 473-476
作者姓名:阚君满
作者单位:吉林工商学院 计算机科学系,长春 130062
基金项目:吉林省教育厅科技发展规划基金资助项目(2008158)
摘    要:
为解决全文索引的索引结构压缩问题,提出了文本的基于正规哈夫曼编码小波树形式,并将该结构与后缀数组结合,实现了基于正规哈夫曼编码的小波树和高效构造算法.实验结果表明,在不降低运行效率的前提下,存储空间得到有效的压缩,从而证明了改进方法的有效性.

关 键 词:全文索引  压缩  正规哈夫曼编码

Compressed Format Full-Text Index Based on Improved Huffman Code and Its Implement
KAN Jun-man. Compressed Format Full-Text Index Based on Improved Huffman Code and Its Implement[J]. Journal of Jilin University:Information Sci Ed, 2011, 29(5): 473-476
Authors:KAN Jun-man
Affiliation:Department of Computer Science,Jilin Technology and Business College,Changchun 130062,China
Abstract:
To solve the problem of index structures compression of full-text indexes,we introduce the canonical Huffman code to encode the BWT(Burrows-Wheeler Transform) of a text.In the end,we present an efficient construction algorithm for this index,which is on-line and linear.Experimental results show that,without reducing the efficiency,the effective storage space compression is gained,which improves the effectiveness of the method.
Keywords:full-text indexes  compressed  canonical Huffman code  
本文献已被 CNKI 等数据库收录!
点击此处可从《吉林大学学报(信息科学版)》浏览原始摘要信息
点击此处可从《吉林大学学报(信息科学版)》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号