首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
根据全文检索Apache Lucene引擎原理与流程,设计了一种网络视频信息的索引方法.可以对所有的视频信息进行索引,解决了视频搜索引擎排序信息不明以及局域网站搜索的局限性等问题.  相似文献   

2.
当今搜索引擎已经成为人们在网上搜索信息的重要工具,分析索引机制架构和全文检索系统结构,探讨了实现Tomcat+JSP+Lucene的运作流程和核心代码,对如何提高索引性能进行了研究.  相似文献   

3.
本文基于Java体系开源框架Spring3.0、Struts2、Hibernate3.3和Compass2.1设计与实现了一个B/S模式的图书文献全文检索系统,系统采用MVC框架,集成Spring3.0、Struts2、Hibernate3.3实现/AOP以及事务管理、控制层,数据持久层,应用Compass实现索引的创建与数据库同步更新,系统应用在图书馆海量图书文献的检索中,此传统的C/S模式的基于SQL的数据库检索系统,检索结果的呈现要提高教倍,耗时为毫秒级.  相似文献   

4.
提出一种基于语义Web的信息检索模型,它能够实现准确高效的网络信息检索,克服传统信息检索的局限。介绍了语义Web、本体以及Lucene全文检索技术,详细阐述该模型的六大模块,其中在本体基础之上充分利用Jena查询和推理技术进行查询扩展,以及Lucene技术来建立索引和检索,改进排序算法使得返回结果更加满足用户需求。  相似文献   

5.
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点。Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量。针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作。为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并。通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率。  相似文献   

6.
实现了中文单字切分模块,并在Lucene API基础上建立支持中英文混合检索的全文数据库。在电子文献全文检索系统项目中作为全文检索工具。中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。  相似文献   

7.
采用基于Lucene的全文检索工具包,对采集的数据进行倒排索引和索引检索,用Json作为前后端数据格式,APP提供霍兰德职业测评,为学生就业选择提供帮助.毕业生就业交流平台还可以统计毕业生就业信息,为高校编制毕业生就业年度质量报告提供科学准确的依据.  相似文献   

8.
本文主要分析了中文全文检索技术中有关内容,并根据此内容设计实现了一个中文全文检索系统.针对汉语词法的特殊性,在基于词表的全文索引方面,本文应用了一种改进的倒排索引结构,同传统索引结构相比,更便于索引的构建、维护、更新.并根据其特征,设计了优化的查询策略.  相似文献   

9.
检索系统构建了用于记录各数据项在数据表和字段中位置的索引结构,以及基于数据库关系图的用于描述各个数据表之间关联关系的主外键关系表,根据索引结构和主外键关系表检索出与用户输入的多个关键词相关联的记录.为了进一步提高检索效率,又构建了一个查询结果存储结构,把查询过的关键词和对应的结果存入其中.当用户输入关键词进行检索时,检索系统先去查询结果存储结构中检索,如果检索到就直接输出结果,否则再通过访问索引结构和主外键关系表构建SQL语句到原始数据库中进行检索得到结果.实验结果表明,这种基于索引结构和查询结果存储结构的检索机制具有较好的检索性能.  相似文献   

10.
随着信息技术的发展,国家电网公司亟待改变人工项目审核的现状,实现项目重复审核自动化。因此,提出了基于Lucene的全文检索技术在电力项目计划审核方面的应用方案。首先深入分析了国家电网公司的项目审核现状和全文检索技术的研究现状,其次简单介绍了全文检索技术和Lucene全文检索引擎的概念,然后详细介绍了全文检索过程;最后将全文检索技术引入电力企业项目计划审核,给出了一个基于全文检索的电力企业项目计划审核系统的架构设计。使用Lucene全文检索引擎进行企业专项项目重复审核,可以方便、快速地获得检索排序结果和文档相似度,并且检索准确度高。  相似文献   

11.
介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程。用Tika获取文档的元数据以及文档内容的文本提取。用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点。利用Spring MVC实现搜索服务的Web访问处理。可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务。在该论文研究基础上可建立个性化的内容搜索服务系统。  相似文献   

12.
在全文数据库发展过程中,人们一直在寻求一种好的索引方式以满足巨量数据信息管理的需要.本文论述了全文库中索引技术发展现状,并针对其在索引维护方面存在的不足,分析一种基于B+树的新数据结构--多B树结构在全文索引技术方面的优势、实现的可行性以及发展前景.  相似文献   

13.
分析了当前信息检索多是建立在语词匹配基础上的搜索,索引库不断增大,搜索时间长等问题.通过对文本检索步骤和索引结构的研究表明,索引结构是决定文本检索效率的关键.提出对动态索引结构B+树进行改进,通过改进减少了索引层数,提高了检索速度,降低了索引存储空间,研究结果对改进文本检索效率具有积极意义.  相似文献   

14.
随着人类步入信息时代,网上庞大的数字化信息与人们获取所需信息能力之间的矛盾日益突出,怎样快速地检索相关信息已经成为研究热点。阐述了全文检索系统的原理,分析了基于字表结构的索引组织方法和索引库的建立。通过和B-树的对比,提出了基于B+树的索引存储方法及其算法思想,对提高索引的存储效率和查找速度具有一定意义。  相似文献   

15.
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索.  相似文献   

16.
分析了门户网站全文信息检索系统的功能,对该系统的结构(包括数据采集引擎、索引数据库、索引引擎、文本分析引擎、数据查询引擎)进行了研究,重点讨论了数据采集引擎中的数据库采集器和HTML采集器.统一整合频道后建立的全文信息检索系统,能够提供高效、便捷的信息检索服务,提高用户对网站内容的搜索效率.  相似文献   

17.
根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Lucene是一个用java语言开发的开源的全文搜索引擎架构.本文利用Lucene设计和实现一个基于查询与内容的文档表示模型的站内搜索引擎,实验结果表明该模型能有效的提高信息检索的查准率.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号