首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 406 毫秒
1.
一种面向域的高效倒排索引结构及实时更新   总被引:1,自引:1,他引:0  
倒排索引是搜索引擎的核心组成部分,对搜索的效率与质量有着较大的影响.在一些主题搜索引擎中,关键词被划分为多个域以提高检索质量,针对这种特点,本文提出了一种新的面向域的高效倒排索引结构,以及实时更新倒排索引的算法.实验结果表明,在每个域内索引词项个数接近词典大小的情况下,本文提出的倒排索引结构可以有效地提高搜索引擎的检索效率.  相似文献   

2.
全文检索的效率依赖于数据结构-倒排索引,存储倒排索引需要较大的硬盘存储空间。提出了一种新的压缩算法,主要用于倒排索引中文档标识符的压缩。对于给定的文档集合使用信息检索工具Terrier,使用不同的压缩算法压缩倒排索引中的文档标识符,从而生成倒排索引文件,然后比较倒排索引文件的大小。实验结果表明,使用新的压缩算法能够节省倒排索引文件的存储空间。  相似文献   

3.
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统.针对汉语词法的特殊性,在基于词表的全文索引方面,本文应用了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新.并根据其特征,设计了优化的查询策略.  相似文献   

4.
随着互联网的迅速发展,搜索引擎变得越来越重要,人们对信息检索的要求越来越高.XML不仅仅关注文档结构.而且关注其中的语义内容.而倒排索引则是搜索引擎的核心技术.结合两种技术设计了一个基于XML的检索系统.并对其中的关键技术倒排索引更新优化提出新的方法.  相似文献   

5.
高性能网页索引器JU_Indexer的实现   总被引:4,自引:1,他引:3  
高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间.  相似文献   

6.
为提高大数据环境下的数据查询分析效率,该文结合内存计算技术和批量更新技术提出一种优化倒排索引方法——内存磁盘索引(RFDirectory)。基于Lucene实现内存和磁盘相结合的倒排表管理技术。将新增数据写入缓存中,并周期性地写入磁盘索引结构中,从而提升倒排索引的写入性能。通过整合磁盘和内存的多分块倒排结构,为用户提供高效的数据查询分析结果。实验结果表明:在大数据环境下,RFDirectory方法的索引构建时间缩短为磁盘索引(FSDirectory)、内存索引(RAMDirectory)方法索引构建时间的50%,返回1个关键字的检索结果耗时缩短了近15%。  相似文献   

7.
针对基于位置的web搜索需要将网页中位置信息和文本信息相结合进行索引的应用需求,提出了先倒排表再R-tree索引和先R-tree再倒排表索引两种混合索引结构,同时处理文本和位置信息.大规模真实数据集上的实验表明,这两种方法在查询效率上明显优于已有的倒排表和R-tree相互独立的索引模式.  相似文献   

8.
本文主要分析研究维、哈、柯全文搜索引擎索引器出现的关键问题,介绍了一系列有效的解决方法.这螳主要包括符合维、哈、柯语言的倒排索引表的结构,检索过程中的计算疗法,更新倒排索引表的措施和处理低频词等等.通过试验和实际应用过程中证明了以上方法很符合处理维、哈、柯全文搜索引擎索引器的出现的关键同题,明显提高维、哈、柯全文搜索引擎索引器的索引功能.  相似文献   

9.
针对支持关键字搜索的XML非结构化查询,本文提出借助关系数据库存储XML数据,利用SQL查询。为此讨论了XML结构与关系模式的映射方法,倒排索引结构设计与存储,并对XML-QL进行扩展,使其支持关键字查询。  相似文献   

10.
针对空间文本对象流和订阅流的匹配,采用一种混合索引树来组织数据对象,包括多叉树空间索引、谓词索引和倒排文件三个部分,其中多叉树空间索引用于空间区域管理,谓词索引和倒排文件用于订阅谓词管理.在此基础上,提出了谓词索引建立算法、空间文本对象与倒排项匹配算法和混合索引树检索算法.与基于空间网格加倒排文件的检索方法进行了对比实验,结果表明:所提出的算法提高了用户的检索效率,并验证了其有效性.  相似文献   

11.
介绍基于线序划分(LOP)的时态拟序索引技术TQD-tree,基于前期研究成果实现增量更新.能否实现增量更新是时态索引技术成败的关键.首先,讨论TQD-tree所需数据结构和LOP实现算法;其次,讨论实现增量更新算法;再次,讨论批量更新的可行性;最后,完成仿真评估以表明更新技术可行性和有效性.实现批量更新,减少扫描重构TQD-tree次数,能大大提高系统效率.研究时态数据索引更新技术能解决大数据管理框架中实时响应和频繁更新的基本需求.  相似文献   

12.
随着XML文档的大量涌现,如何高效地像存取整个文档一样直接存取文档中任意元素已成为一个亟待解决的关键问题,另外,能够快速高效地支持XML文档更新的索引技术在商业领域也更加急需,提出了一种基于倒排表的索引,能很好地支持文档结构和内容的动态更新,给出了利用关系数据库实现该索引的方法。  相似文献   

13.
为了解决传统Web应用程序在页面重载循环方面的局限性,采用了Ajax与Struts框架相结合的技术,并以商情网站应用为例,介绍了在数据校验和级联菜单两个方面的应用。其中主要利用XMLHttpRequest以异步方式向Servlet发送请求,然后利用DOM解析服务器的返回并完成对页面的更新。通过一系列的应用,证明了与传统web应用程序相比,它在减轻服务器的负担,无刷新更新页面,调用外部数据,以及促进页面呈现与数据的分离等几个方面都存在优势。  相似文献   

14.
We introduce a model to implement incremental update of views. The principle is that unless a view is accessed, the modification related to the view is not computed. This modification information is used only when views are updated. Modification information is embodied in the classes (including inheritance classes and nesting classes) that derive the view.We establish a modify list consisted of tuples (one tuple for each view which is related to the class) to implement view update. A method is used to keep views from re-update.  相似文献   

15.
聚类分析算法作为一种主要的Web使用挖掘技术,在个性化推荐系统中得到了广泛应用,然而面对Web动态性所引起的网页的更新以及用户行为方式的改变,已有的聚类算法并不能很好地解决这一问题。针对这一问题,本文以一种无向图的形式表示用户对网站的访问,提出一种可实时反映网站及用户行为变化情况的增量式页面聚类算法,并在页面聚类的基础上提出相应的推荐决策算法动态生成页面推荐。  相似文献   

16.
在CDMA蜂窝移动通信系统的软切换过程中,要求BSS系统为每个小区维护一个邻区列表,保证移动台搜索邻区信号强度的效率。由于网络扩客、传输地形及环境变化等诸多因素的影响,导致网络拓扑结构发生变化,要求邻区列表也随之更新。该文提出了一种自动更新邻区列表的算法,可高效、准确地完成邻区列表的维护工作。  相似文献   

17.
0 IntroductionToretrieveXMLdata ,severalquerylanguageshavebeenproposed.ExamplesareXPathandXQuery[1] thatisthefirstpublicworkingdraftofaquerylanguageforXMLreleasedrecentlyfromtheW3C .ThecommonfeaturesoftheselanguagesaretheuseofXPathpathexpressionsorregular…  相似文献   

18.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号