首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 109 毫秒
1.
利用信息检索、本体和个性化搜索等相关知识,构建一种基于本体的个性化搜索引擎模型PSMBO.该模型由用户界面、查询请求处理模块、检索模块、查询结果处理模块、兴趣学习模块以及用户兴趣知识库和本体知识库七个部分组成.该模型在一定程度上提高了搜索引擎在查准率和查全率方面的性能.  相似文献   

2.
提出了一种新的基于文本语义扩展的记忆网络模型,用于生成环境感知的查询建议。采用基于注意力机制的分层编码器-解码器模型,利用外部记忆网络,生成查询与查询相关文档之间的神经注意力向量。模型融合了查询层、会话层和文档层语义信息,与目前的研究方法相比,能生成具有更高相关性的环境感知查询建议。使用真实的商业搜索引擎查询日志进行了实验,实验结果表明了该模型的有效性。  相似文献   

3.
现代搜索引擎普遍采用简单的关键词形式来表达查询,这为用户带来便利的同时也增加了准确获取信息的难度.搜索引擎很难基于少量的几个关键词准确捕捉用户的信息需求.查询推荐作为缓解上述问题的关键技术,已经开始应用于目前主流的搜索引擎.然而,绝大多数现有的查询推荐技术基于群体智慧,以搜索引擎日志为数据源,从中挖掘用户群体在构造查询方面的习性及查询之间的语义关联性,未考虑不同用户个性化的信息喜好,而且在搜索引擎服务器端进行查询推荐计算也会影响搜索引擎的响应效率和查询吞吐率.为此,本文提出一种运行于客户端的个性化查询推荐策略,该策略以用户浏览历史为数据源,采用LDA模型,并从中学习用户的信息喜好,在此基础上利用原始查询被主题模型生成的概率确定用户的查询意图,以词条与查询意图之间的关联来度量词条作为扩展查询被推荐的强度,最后选择Top N强度最强的词条作为查询推荐的结果.以人工标注的测试数据对本文所提出的算法进行了实验验证,结果表明,该算法在推荐扩展查询的准确率方面明显优于单纯基于词条与原始查询语义相关的方法  相似文献   

4.
元搜索引擎中基于用户兴趣的个性化调度模型   总被引:7,自引:0,他引:7  
元搜索引擎的调度策略是研究元搜索引擎如何为用户选择数量合适并贴近用户查询需求的成员引擎,以较小的资源耗费,帮助用户获得较高的查询质量.该文提出了基于兴趣分类采样的成员引擎特征表示的方法和基于用户兴趣的成员引擎个性化调度算法.调度算法根据用户的兴趣计算出各成员引擎与用户查询的相关度,为用户选择最具有潜在有用的多个成员引擎来为用户提供查询服务.实验表明,该模型提高了用户的检索效率和质量.  相似文献   

5.
基于位置服务的应用中,针对没有可信任的服务器人们的隐私信息将受到严重威胁的问题,提出了一个位置服务查询处理模型.该模型是移动和固定用户在不显示其位置信息的情况下使用基于位置服务的新框架.实验结果显示:该模型位置匿名器采用的金字塔结构较其它算法有一定的优越性,用户数可达到50000个或更多,且用户数越多,位置匿名器的性能越高;隐私感知查询处理器使用过滤算法可大幅减少查询处理时间.该模型具有一定的理论价值和实用价值.  相似文献   

6.
提出了一种基于模糊语言方法的搜索引擎,通过引入语言变量和模糊约束的概念,把隐含在模糊查询中的模糊约束显示化,从而使搜索引擎返回真正与用户查询相关的信息.与现有的搜索引擎相比,该模型能对自然语言进行某种程度的语义理解,更好地满足了用户的检索需求.  相似文献   

7.
当前主流的搜索引擎根据查询词在网页中的出现频率,辅以网页权威性等信息,生成查询结果.但用户提供的查询词往往非常简单,因此搜索引擎难以确定用户的查询意图.为此,给出了一种利用海量clickthrough数据进行网页内容相关性挖掘的方法,在此基础上给出了一种反馈式搜索引擎(FSE)框架及相关算法.FSE根据网页相关性动态生成查询结果,以期提供给用户更中肯和个性化的信息.基于真实点击数据,进行了网页相关性矩阵的压缩实验和有效性实验,证明了该框架的可行性.  相似文献   

8.
针对手机等移动设备具有小屏幕、操作不方便和具有惟一标识的特点,提出了适用于移动环境下搜索引擎的个性化搜索的新方法.首先用户的查询历史可以通过惟一的手机号自动记录下来;其次利用用户的查询历史,建立用户描述文件以及基于关键词空间的用户兴趣模型;最后根据用户兴趣模型,采用关键词扩充算法优化用户查询.此方法能够较好地实现移动环境下的个性化搜索,提高检索效率.  相似文献   

9.
通过分析用户的查询日志, 模拟用户与搜索引擎之间的交互过程, 提出一种基于查询加权的用户建模方法。首先, 对查询日志进行会话分割; 然后, 利用会话中用户查询出现的次数、持续时间及所点击的URL排名等行为信息, 计算查询权重; 最后, 采用兴趣投票的方式, 完成用户模型的构建。在AOL (美国在线)查询日志数据集上的测试结果表明, 基于查询加权的用户建模方法在用户兴趣预测上取得较好的效果。  相似文献   

10.
分析了目前搜索引擎研究的现状,利用语义Web和本体论的相关技术,实现了一个基于本体论的智能搜索引擎模型。主要研究了本体论的建立,网页本体标注,用户查询本体表达以及本体匹配等几个方面。通过对模型的原型设计运行和分析,结果表明通过本体论技术的支持该模型可以较好的理解采集到网页信息以及用户查询请求,从而提高了搜索引擎的自动化和智能化程度。  相似文献   

11.
搜索引擎中页面更新策略的分析与改进   总被引:2,自引:0,他引:2  
网上信息资源不断变化,搜索引擎需要不断更新它所访问过的网页,提高更新效率是搜索引擎的关键技术所在,在总结搜索引擎现有页面更新策略(统一更新策略和个体更新策略)进行了比较,指出了两种方案的优劣所在,进而提出了一种改进的折衷方案即分类更新策略。并从理论上论证其优越性,在实际应用中评价了有其有效性,结果表明分类更新策略很大程度上改进的搜索效果。  相似文献   

12.
网页更新策略的好坏直接影响到专业搜索引擎的整体性能。在分析了专业搜索引擎中网页更新模块结构和它所采用的监控技术的基础上,考虑了重要性、时新性、估计频率、点击率等综合因素,提出了一种新的增量式更新算法P2FC。实验证明,该算法在保证时新性和提高更新效率上都取得了很好的效果。  相似文献   

13.
搜索引擎通过网页搜索软件查询互联网上的链接,访问网络公开域中的每一个站点,将它们的网址带回搜索引擎,同时给web页上的文本建立索引,从而创建出一个详尽的网络目录。由于网络文档的不断变化,搜索软件也不断地更新以前已经分类的目录。搜索引擎目前广泛应用于网络资源搜索和商业智能系统。  相似文献   

14.
0 IntroductionTIon tceorpneet w ,itthhefr cerqauwelnetr sch oafn sgeeasr cohf tehneg iinnfeo rnemeadti toon uopnd tahteethe web pages visited. Different pages have different changefrequencies[1].Sothe crawlers must firstly esti mate which pa-ges need to b…  相似文献   

15.
通常搜索引擎网站都有存储大量远程站点复制网页的数据库.为保持复制网页和源网页的同步,需要花费大量的时间和资源.本文提出了保持复制网页和源网页一致的多种同步新策略,并提出源端网页变化的泊松模型,给出了刷新率和刷新时长的规范性描述,对各种同步策略的性能进行了研究和比较分析,发现其较大地改善了网页数据库刷新率.  相似文献   

16.
提出一种将关键词查询转换为SPARQL查询的方法来进行RDF数据的搜索.首先,根据RDF本身的关联特点,构建一个压缩实体摘要图;然后,借助关键词与所在实体的索引,将所查询的关键词在该摘要图上进行定位,通过图双向搜索算法找出包含关键词实体的前k子图,获得查询实体之间的关系,再联合最初的关键词及他们的属性,构建SPARQL查询;最后使用SPARQL搜索引擎执行查询.实验结果表明,所提方法较其他方法有更快的响应时间及更高的准确率.  相似文献   

17.
基于Nutch的搜索引擎技术   总被引:1,自引:0,他引:1  
Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询.为了使它能够支持中文搜索,在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能.  相似文献   

18.
介绍了搜索引擎的总体结构,分析了搜索引擎中爬行器的爬行策略和网页库的更新模式。介绍了其中一种较为合理的爬行和更新模式及其实现技术,实现了渐增式地爬行高质量网页和提高网页库新鲜度的目的。  相似文献   

19.
A passage retrieval strategy for web-based question answering (QA) systems is proposed in our QA system. It firstly analyzes the question based on semantic patterns to obtain its syntactic and semantic information and then form initial queries. The queries are used to retrieve documents from the World Wide Web (WWW) using the Google search engine. The queries are then rewritten to form queries for passage retrieval in order to improve the precision. The relations between keywords in the question are employed in our query rewrite method. The experimental result on the question set of the TREC-2003 passage task shows that our system performs well for factoid questions.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号