首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
为了解决传统FTP搜索引擎对检索结果优化程度不够而造成的检索质量低的问题,本文在FTP用户查询日志的统计分析基础上采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎,试验表明该方案能够有效地提高了FTP文件检索效率与质量。  相似文献   

2.
FTP(file transfer protcol)搜索引擎的重点在于中文分词技术和检索技术.使用了一种面向FTP搜索优化的最大前向匹配分词算法,并将用户查询作为反馈来更新分词算法中所使用的字典,结合倒排索引技术实现了一个高性能的FTP搜索引擎的原型系统.压力测试结果表明此FTP搜索引擎具有很高的性能.  相似文献   

3.
为解决因网络中共享文件大量增加而造成的现有文件搜索引擎查准率和查全率低、查询结果可用性不强的问题,在分析用户查询日志的特征和统计文件服务器文件特点的基础上,提出了一种新的文件搜索引擎实现方案,在查询中使用基于资源的匹配来替代传统的字符串匹配,并对查询结果进行个性化排序,从而有效地提高了查询结果的质量,并提供了自动纠错等功能.在天网千帆文件搜索引擎上通过了该方案的系统实现,实验结果证明了该设计的有效性.  相似文献   

4.
一种面向域的高效倒排索引结构及实时更新   总被引:1,自引:1,他引:0  
倒排索引是搜索引擎的核心组成部分,对搜索的效率与质量有着较大的影响.在一些主题搜索引擎中,关键词被划分为多个域以提高检索质量,针对这种特点,本文提出了一种新的面向域的高效倒排索引结构,以及实时更新倒排索引的算法.实验结果表明,在每个域内索引词项个数接近词典大小的情况下,本文提出的倒排索引结构可以有效地提高搜索引擎的检索效率.  相似文献   

5.
为了提高FTP搜索引擎的并发效率,避免单点失效,通过引入分布式和P2P技术建立了一种基于P2P技术的大型分布式FTP搜索引擎,叙述了其3个主要部分:搜集、索引和检索模块,并针对分布式的搜集模式和基于DHT的倒排索引算法的实现进行了讨论。  相似文献   

6.
高性能网页索引器JU_Indexer的实现   总被引:4,自引:1,他引:3  
高性能网页索引器JU_Indexer用倒排索引表存储网页索引数据, 以多线程并行的方式对网页建立索引数据, 采用经过优化的检索算法实现用户的查询. 首先给出了JU_Indexer的系统框架, 然后描述了索引数据在JU_Indexer中的存储结构、 建立网页索引的算法、 以及实现用户查询的检索算法. 实验结果表明, JU_Indexer能在毫秒级的时间内完成用户的查询, 它采用的经过优化的词组检索算法缩短了词组的检索时间.  相似文献   

7.
为提高大数据环境下的数据查询分析效率,该文结合内存计算技术和批量更新技术提出一种优化倒排索引方法——内存磁盘索引(RFDirectory)。基于Lucene实现内存和磁盘相结合的倒排表管理技术。将新增数据写入缓存中,并周期性地写入磁盘索引结构中,从而提升倒排索引的写入性能。通过整合磁盘和内存的多分块倒排结构,为用户提供高效的数据查询分析结果。实验结果表明:在大数据环境下,RFDirectory方法的索引构建时间缩短为磁盘索引(FSDirectory)、内存索引(RAMDirectory)方法索引构建时间的50%,返回1个关键字的检索结果耗时缩短了近15%。  相似文献   

8.
用户行为分析是改进搜索引擎的重要依据,为了更好地理解中文搜索用户的检索行为,在引入分词的基础上对搜狗搜索引擎在一个月内的真实查询日志进行了分析,对查询语言、查询长度、rank和网页深度与点击次数四个方面的用户行为进行分析。所得结论对改进中文搜索引擎的设计和更准确地评测检索效果都有较好的指导意义。  相似文献   

9.
由于通用搜索引擎具有搜索信息量大、查询不准确、深度不够等缺点,本文在通用搜索引擎技术的基础上,依据专业领域搜索策略,设计并实现了一个面向教育主题的垂直搜索引擎系统,着重研究了专业网络蜘蛛定制、基于VSM的主题相关度算法和倒排索引建立等关键技术及其实现细节.实验结果表明,该系统能够快速地响应用户的查询请求,并且返回结果具有较高的准确性.实现了教育资源的共享,具有较高的应用价值.  相似文献   

10.
元搜索引擎中基于用户兴趣的个性化调度模型   总被引:7,自引:0,他引:7  
元搜索引擎的调度策略是研究元搜索引擎如何为用户选择数量合适并贴近用户查询需求的成员引擎,以较小的资源耗费,帮助用户获得较高的查询质量.该文提出了基于兴趣分类采样的成员引擎特征表示的方法和基于用户兴趣的成员引擎个性化调度算法.调度算法根据用户的兴趣计算出各成员引擎与用户查询的相关度,为用户选择最具有潜在有用的多个成员引擎来为用户提供查询服务.实验表明,该模型提高了用户的检索效率和质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号