首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
一种面向域的高效倒排索引结构及实时更新   总被引:1,自引:1,他引:0  
倒排索引是搜索引擎的核心组成部分,对搜索的效率与质量有着较大的影响.在一些主题搜索引擎中,关键词被划分为多个域以提高检索质量,针对这种特点,本文提出了一种新的面向域的高效倒排索引结构,以及实时更新倒排索引的算法.实验结果表明,在每个域内索引词项个数接近词典大小的情况下,本文提出的倒排索引结构可以有效地提高搜索引擎的检索效率.  相似文献   

2.
高效FTP搜索引擎的设计与实现   总被引:1,自引:0,他引:1  
为了解决传统FTP搜索引擎对检索结果优化程度不够而造成的检索质量低的问题,在对FTP用户查询日志进行统计分析的基础上,采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎.双字节倒排是对文件名中每两个字节建立倒排索引表,自动分类是对检索结果按主题划分为层次结构,查询自动纠错是以用户查询日志中的高频查询词为数据源构建拼写错误词典.试验结果表明,该方案能够有效地提高FTP搜索引擎的文件检索效率与质量.  相似文献   

3.
针对主题爬行器获取网页更新速度快的特点, 提出一种用于网络搜索引擎的增量索引结构. 在建立倒排索引时, 每个词项的记录表以链接块的形式存放于倒排索引文件中, 每次新分配的块大小递增. 该索引结构解决了倒排索引连续存储所带来的难以更新问题. 实验结果表明, 与支持实时更新的传统链表式存储方式相比, 这种索引结构能提供更高效的检索, 采用以空间换时间的方法有效地提高了索引的更新效率.  相似文献   

4.
本文主要分析研究维、哈、柯全文搜索引擎索引器出现的关键问题,介绍了一系列有效的解决方法.这螳主要包括符合维、哈、柯语言的倒排索引表的结构,检索过程中的计算疗法,更新倒排索引表的措施和处理低频词等等.通过试验和实际应用过程中证明了以上方法很符合处理维、哈、柯全文搜索引擎索引器的出现的关键同题,明显提高维、哈、柯全文搜索引擎索引器的索引功能.  相似文献   

5.
一种基于XML前缀编码的路径查询   总被引:1,自引:0,他引:1  
为了解决XML文档树子结点过多时前缀编码长度增加的问题,提出一种改进的XML前缀编码——IPE编码.基于IPE编码,结合倒排索引表,给出XPath路径查询算法,可以有效地提高XML文档的查询速度.  相似文献   

6.
如何高效利用网络资源一直是人们关注的焦点。XML可扩展性标记语言不仅支持自定义标记,还能表达语义,因而为提高网络搜索的准确性提供了可能。文章主要介绍了基于XML可扩展标记语言搜索引擎技术实现的核心部分——索引数据库的建立和查询,并提出了现行网络环境下的XML搜索引擎模型。  相似文献   

7.
对于提高网络搜索引擎系统的性能而言,有效的存取倒排索引表和快速的响应搜索操作起着关键的作用,故提出了一种能够有效提高索引压缩率的文档重排算法--Star-Scan算法.该算法是利用聚类算法将相似的文档排列到一起,从而减少编码文档编号(DocID)之间的差值所需要的字节数,达到提高索引压缩率的效果.在TREC12数据集上进行的多个实验表明,与随机排列相比,通过Star-Scan算法重新排列后的倒排表在Delta编码方式上压缩率平均提高了大约30.22%,从而有效地提高了搜索引擎的效率.  相似文献   

8.
针对支持关键字搜索的XML非结构化查询,本文提出借助关系数据库存储XML数据,利用SQL查询。为此讨论了XML结构与关系模式的映射方法,倒排索引结构设计与存储,并对XML-QL进行扩展,使其支持关键字查询。  相似文献   

9.
FTP(file transfer protcol)搜索引擎的重点在于中文分词技术和检索技术.使用了一种面向FTP搜索优化的最大前向匹配分词算法,并将用户查询作为反馈来更新分词算法中所使用的字典,结合倒排索引技术实现了一个高性能的FTP搜索引擎的原型系统.压力测试结果表明此FTP搜索引擎具有很高的性能.  相似文献   

10.
针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号