排序方式: 共有31条查询结果,搜索用时 265 毫秒
1.
随着大数据应用发展,如何从海量数据中进行高效信息搜索成为研究热点。Lucene全文搜索引擎通过索引段合并来提高索引效率,但Lucene索引段合并过程大多需要从磁盘加载各索引段,将占用大量系统资源,降低系统吞吐量。针对该问题,提出基于Lucene索引段合并优化策略,该策略通过负载系数来选择不同的索引段合并操作。为提高数据的检索速度,进一步建立索引段相似度评价模型来选择出最优合并索引段集合进行合并。通过与现有Tiere,LogByte,LogDoc等合并策略进行实验对比,提出的优化策略能有效减少索引段合并次数,提升系统吞吐量及索引效率。 相似文献
2.
汪涛 《湖北民族学院学报(自然科学版)》2009,27(1)
当今搜索引擎已经成为人们在网上搜索信息的重要工具,分析索引机制架构和全文检索系统结构,探讨了实现Tomcat+JSP+Lucene的运作流程和核心代码,对如何提高索引性能进行了研究. 相似文献
3.
阐述和分析了全文检索系统的概念及其特点,研究了Lucene.Net架构及其主要模块,在此基础上,实现了具有用户权限的全文检索系统. 相似文献
4.
5.
全文检索是现代信息检索技术的一个非常重要的分支,它是处理非结构化数据的强大工具,也是搜索引擎的核心技术之一。本文首先介绍了全文检索技术,其次概括了全文检索技术的发展现状,明确了全文检索开发的意义和内容,分析了搜索引擎全文检索机制,最后对开源全文检索引擎的优势进行了概括。 相似文献
6.
平行语料库研究是近年来语料库语言学横向发展的新趋势。人们清楚的认识到大规模的高质量汉英平行语料库在自然语言处理、比较语言学研究和第二语言教学等众多领域中的巨大价值。文章介绍了一个大规模汉英双语平行语料库的构建系统,利用互联网上存在的海量多语言文本资源,通过网页的内容分析和链接分析,实现了一个双语语料挖掘的自动获取系统,包括其总体规划、实施模型和流程细节。目的是通过学习国内外资料。最终建设一个基于互联网的平行语料库自动构建系统。 相似文献
7.
基于Lucene.Net框架,利用.NetRemoting技术,结合多种数据挖掘和推荐算法构建面向大规模文本数据的厦门人才网分布式全文检索与推荐系统.提出把大索引切割成小索引,采用多台服务器并行处理的分布式解决方案,完成招聘企业、职位、应聘人员信息的整合与聚集,实现信息的智能推荐.实验结果表明,本系统取得了较高的索引效率、较快的检索速度以及较为精准的推荐结果,并在实际应用中取得了良好的效果. 相似文献
8.
针对传统基于关键字的信息检索系统查全率和查准率都不高的缺点,提出了一种基于语义Web的智能信息检索模型,此模型在语义Web的环境下,利用本体技术,将最初的检索词通过查询扩展模块得到更完善的检索词集,然后利用扩展的检索词集进行检索。将基于关键字匹配的信息检索系统提升为基于本体知识库扩展查询的智能检索系统,从而提高了查全率与查准率,满足了人们对信息检索系统的要求。最后给出了模型的一种实施方案。 相似文献
9.
Nutch是一个开放源代码的Web搜索引擎,由于不夫杂商业利益,它对搜索结果的排序算法较为透明公平。未来的搜索引擎的发展趋势之一是个性化和智能化,本文在研究开泺Nutch的基础上设计实现了一个具有关联用户搜索行为的搜索引擎。 相似文献
10.
《云南民族大学学报(自然科学版)》2019,(6):606-611
Lucene是一个优秀的全文检索框架,布尔查询是其实现精准数据检索的重要功能.对于布尔查询执行计划的深入研究,有利于灵活应用布尔查询,优化查询表达式,提高执行效率.本文从Lucene架构下布尔查询的执行计划入手,研究了布尔查询的表示方式、执行时序、逻辑运算规则和子查询归并算法.根据布尔查询的执行计划,提出了深度为2的复杂布尔查询的化简规律和布尔逻辑运算满足交换律的特性,并从理论上证明它们的正确性.最后通过实验模拟仿真,验证这些规律的有效性. 相似文献