首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
高效FTP搜索引擎的设计与实现   总被引:1,自引:0,他引:1  
为了解决传统FTP搜索引擎对检索结果优化程度不够而造成的检索质量低的问题,在对FTP用户查询日志进行统计分析的基础上,采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎.双字节倒排是对文件名中每两个字节建立倒排索引表,自动分类是对检索结果按主题划分为层次结构,查询自动纠错是以用户查询日志中的高频查询词为数据源构建拼写错误词典.试验结果表明,该方案能够有效地提高FTP搜索引擎的文件检索效率与质量.  相似文献   

2.
针对主题爬行器获取网页更新速度快的特点, 提出一种用于网络搜索引擎的增量索引结构. 在建立倒排索引时, 每个词项的记录表以链接块的形式存放于倒排索引文件中, 每次新分配的块大小递增. 该索引结构解决了倒排索引连续存储所带来的难以更新问题. 实验结果表明, 与支持实时更新的传统链表式存储方式相比, 这种索引结构能提供更高效的检索, 采用以空间换时间的方法有效地提高了索引的更新效率.  相似文献   

3.
为了解决传统FTP搜索引擎对检索结果优化程度不够而造成的检索质量低的问题,本文在FTP用户查询日志的统计分析基础上采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎,试验表明该方案能够有效地提高了FTP文件检索效率与质量。  相似文献   

4.
为解决偏序域上的skyline查询问题,本文提出一种高效的偏序域上的skyline查询处理方法,来满足人们对查询效率日益增长的需求.首先,为提高偏序域上skyline的查询效率,将倒排索引引入skyline查询,提出一种基于倒排的索引结构.其次,提出基础算法(Basic Partially-ordered Skyline Processing based on inverted index,PSP_B),PSP_B包含两个阶段:第一阶段,能够通过映射将偏序域转化成全序域,并建立倒排索引;第二阶段,通过倒排索引提前找到扫描结束点,得到最终的skyline结果.再次,在PSP_B的基础上,进一步提出优化算法(Improved Partially-ordered Skyline Processing based on inverted index,PSP_I).PSP_I通过先分组再建索引的方法能够进一步提高计算效率.最后,用大量的实验证明本文所提算法的正确性和高效性.  相似文献   

5.
本文主要分析研究维、哈、柯全文搜索引擎索引器出现的关键问题,介绍了一系列有效的解决方法.这螳主要包括符合维、哈、柯语言的倒排索引表的结构,检索过程中的计算疗法,更新倒排索引表的措施和处理低频词等等.通过试验和实际应用过程中证明了以上方法很符合处理维、哈、柯全文搜索引擎索引器的出现的关键同题,明显提高维、哈、柯全文搜索引擎索引器的索引功能.  相似文献   

6.
针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性.  相似文献   

7.
针对图像视觉特征的快速检索问题,提出了一种增强型残差量化的不完全检索方法。建立在增强型残差量化的基础上,提出利用多层低复杂度的码书构建包含较大规模倒排列表的多维倒排索引结构,使得只需根据图像视觉特征的量化编码就可以将其快速地插入到倒排索引结构中。此外,结合倒排索引结构,设计了一种不完全检索方法和图像视觉特征之间近似距离的计算方法。通过在公开数据集进行实验和性能对比,所提出不完全检索方法较典型的三种不完全检索方法具有更好的检索精度和检索效率。  相似文献   

8.
为了提高FTP搜索引擎的并发效率,避免单点失效,通过引入分布式和P2P技术建立了一种基于P2P技术的大型分布式FTP搜索引擎,叙述了其3个主要部分:搜集、索引和检索模块,并针对分布式的搜集模式和基于DHT的倒排索引算法的实现进行了讨论。  相似文献   

9.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

10.
随着互联网的迅速发展,搜索引擎变得越来越重要,人们对信息检索的要求越来越高.XML不仅仅关注文档结构.而且关注其中的语义内容.而倒排索引则是搜索引擎的核心技术.结合两种技术设计了一个基于XML的检索系统.并对其中的关键技术倒排索引更新优化提出新的方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号