首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
倒排索引压缩及在RDBMS全文检索中的实现   总被引:2,自引:0,他引:2  
提出了一种对倒排索引进行压缩的方法,在保证较高压缩率的前提下,对压缩后的数据提供了随机访问的能力.这种方法将压缩后的数据分为两部分,第一部分用来表示单词在子区间的出现次数,第二部分用来表示单词在子区间的具体出现位置,详细描述了检索过程,通过第一部分的信息可以直接对第二部分的任意位置进行解压缩,体现了其随机访问能力,并分析了压缩比和检索效率,讨论了该压缩方法在RDBMS全文检索中的实现,以及如何用表格形式对其进行存储,针对多关键字的检索对算法进行了优化.该实现方法一方面充分利用了数据系统的优点,获得了良好的动态性能,另一方面节省了倒排索引对空间的需求,并提高了检索效率.  相似文献   

2.
随着互联网的迅速发展,搜索引擎变得越来越重要,人们对信息检索的要求越来越高.XML不仅仅关注文档结构.而且关注其中的语义内容.而倒排索引则是搜索引擎的核心技术.结合两种技术设计了一个基于XML的检索系统.并对其中的关键技术倒排索引更新优化提出新的方法.  相似文献   

3.
黄羿  马新强  李丹宁 《贵州科学》2009,27(3):47-50,57
随着Intemet网络的迅猛发展,个性化信息服务越来越成为信息检索领域的研究热点。本文分析了国内外个性化信息服务研究现状,提出了基于综合倒排索引的搜索思想,从关键词、主题词和评语3个角度出发建立综合倒排索引进行全文搜索;达到用户个性化搜索的目的。  相似文献   

4.
对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压缩率的文档重排算法--Star-Scan算法.该算法是利用聚类算法将相似的文档排列到一起,从而减少编码文档编号(DocID)之间的差值所需要的字节数,达到提高索引压缩率的效果.在TREC12数据集上进行的多个实验表明,与随机排列相比,通过Star-Scan算法重新排列后的倒排表在Delta编码方式上压缩率平均提高了大约30.22%,从而有效地提高了搜索引擎的效率.  相似文献   

5.
倒排索引是搜索引擎的核心组成部分,对搜索的效率与质量有着较大的影响.在一些主题搜索引擎中,关键词被划分为多个域以提高检索质量,针对这种特点,本文提出了一种新的面向域的高效倒排索引结构,以及实时更新倒排索引的算法.实验结果表明,在每个域内索引词项个数接近词典大小的情况下,本文提出的倒排索引结构可以有效地提高搜索引擎的检索效率.  相似文献   

6.
针对主题爬行器获取网页更新速度快的特点, 提出一种用于网络搜索引擎的增量索引结构. 在建立倒排索引时, 每个词项的记录表以链接块的形式存放于倒排索引文件中, 每次新分配的块大小递增. 该索引结构解决了倒排索引连续存储所带来的难以更新问题. 实验结果表明, 与支持实时更新的传统链表式存储方式相比, 这种索引结构能提供更高效的检索, 采用以空间换时间的方法有效地提高了索引的更新效率.  相似文献   

7.
针对传统搜索引擎的不足,论述了个性化综合倒排索引的基本思想,结合词频渠道奖励算法、遗忘算法和文档关注度算法来动态获取用户兴趣变化,从而满足个性化搜索的需求.  相似文献   

8.
为了提高自然语言网络答疑系统(Natural Language Web Answer System,简称NLWAS)中问答对的匹配速度和精度,提出了基于倒排词的倒排索引设计方案,详细阐述了索引体系结构,数据结构,匹配策略,动态维护,并对时间复杂度进行了分析.实际应用结果表明,使用倒排索引后系统性能优化效果明显增强.  相似文献   

9.
提出了一种自适应图象压缩编码算法(ACC),该算法将绝对矩方块截断编码算法(AMBTC)、内插法和四叉树技术有机结合起来,根据图象的局部特性调节编码算法.仿真结果表明ACC算法与文献[5]中自适应算法相比,在相同的压缩倍数下,能得到更好的编码性能.  相似文献   

10.
探讨了一类海量数据的倒排文件组织的理论和技术,以一部1100余万字的巨著的数据组织为例,阐述了主索引文件的生成、变长记录的处理、记录排序方法及检纠错技术等。  相似文献   

11.
在对词典的查找算法作了回顾基础上,根据跨语言信息检索系统的要求,提出了一种词典查找的新机制,与其他查找算法的不同之处在于本方法支持模糊查找.查找机制结合Trie树和单字倒排的方法,既实现了查找的高效率又实现了模糊查找的算法,实验证明这种方法能够满足实际系统的需要.  相似文献   

12.
论述了基于提升框架下整数小波变换与矢量量化相结合的图像压缩.经仿真认为此方法可降低计算复杂度,实现快速小波变换,利用局部搜索法量化的速度高于全局搜索法,且可通过调整局部搜索范围调整恢复图像的质量,达到提高编码速度和恢复图像质量的目的。  相似文献   

13.
一种改进的图像分形压缩算法及其复杂性分析   总被引:2,自引:0,他引:2  
通过采用动态改变图像子块数目及引入误差界限ε的方法,提出一种改进的IFS方法,并从并行处理角度讨论了算法的并行化。算法复杂性分析表明该方法计算量少、效率较高。  相似文献   

14.
为弥补室内试验对MSW主压缩参数研究不完善之处,在人工配制MSW试样的基础上进行了大量的室内试验,对MSW的主压缩指数在不同组成及含水率下的变化规律等进行了研究.试验结果表明:组成变化对MSW主压缩指数的变化存在较大的影响,而含水率变化对主压缩指数影响很小.  相似文献   

15.
针对基于GPS及GPRS的手持式防走失终端的存储空间小、GPS定位数据量大、累积GPRS传输GPS定位数据流量大导致通信费用高的问题,提出一种专用于NMEA-0183标准GPS定位数据压缩的改进型位映射-半字节压缩算法.经过理论分析以及实际验证,该算法总压缩比不低于74.29%,并且减少了GPRS向监控中心传输的GPS定位数据量,降低了通信费用和GPRS信道的占用时间,提高了定位的实时性.  相似文献   

16.
目的解决XML技术在物流数据交换中产生的庞大信息量影响物流数据交换效率的问题。方法通过结合XML文档的层状嵌套结构和自描述特点,使用数据压缩技术。结果提出了一种支持在压缩数据上进行查询的XML数据压缩算法。结论降低了物流系统负荷,提高了物流数据的处理效率。  相似文献   

17.
We study an approach to integer wavelet transform for lossless compression of medical image in medical picture archiving and communication system (PACS). By lifting scheme a reversible integer wavelet transform is generated, which has the similar features with the corresponding biorthogonal wavelet transform. Experimental results of the method based on integer wavelet transform are given to show better performance and great applicable potentiality in medical image compression. Biography: Yang Yan (1964-), female, Lecturer. Research direction: image processing, wavelet analysis and its application  相似文献   

18.
针对稀疏矩阵图像提出了一种低复杂度智能无损压缩算法.首先通过图像分块,采用列坐标和标志位相结合表示非常规像素位置;然后基于图像特性分析,得出非常规像素列坐标相对值的概率分布,从而根据非常规像素位置分布的连续性,对其相对列坐标提出一种基于Rice编码的智能码字分配方法.并且,针对非常规像素灰度值分布的连续性,引入预测的方式去除统计相关,对预测冗余采用简单有效的Golomb编码.实验结果表明,该算法压缩效率高,且结构简单,易于硬件实现.  相似文献   

19.
一般小波变换,零树编码优点很多,但对于能量集中性较差的整形小波变换就显得力不从心。因此对整形小波变换存在的这一特点结合零树编码的优点提出了一种新算法。第一,根据整形小波变换后各子带系数幅值的动态变化较小;小波图像能量较一般小波差的特点,提出了利用整数平方作为量化阈值的整数平方算法,充分利用了整型小波变换;第二,提出一种基于索引表和游程编码的小波零树编码的新思路,简化了编码与解码的过程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号