排序方式: 共有22条查询结果,搜索用时 0 毫秒
1.
以企业检索为代表的Intranet信息检索是人们所关注的一个新的应用领域。虽然该领域对于信息检索技术的需求很紧迫,也有很大的市场,但是由于与传统的通用信息检索不同,使得通用检索技术无法直接在该任务上加以利用并取得很好的效果。通过阐述以企业信息为代表的Intranet检索的特点和算法,从而揭示Intranet信息检索与传统信息检索的不同之处,并从两个方面给出一些可能的应用和发展的技术方向的展望。 相似文献
2.
在Web上存在一些长文档,它们包含着多个子主题,如果把这样的文档分成段,每个段的内容只围绕一个主题,将会提高检索质量.阐述了使用HTML结构中带有语义特征的标记来将多主题的文档分成段,在此基础上,对10G规模的Web数据实现了分段检索的方法,并通过使用TREC-9的查询做实验,比较了分段检索方法和传统的文档检索方法的检索质量.实验结果显示,在多主题文档集上分段检索方法比文档检索方法的11点平均准确率提高了大约9%,而在所有文档集上分段检索比文档检索提高了大约1.6%.分析发现,分段检索方法可以明显改善结果的排序,而且实际检索质量提高的幅度比现有的评价结果显示的更显著. 相似文献
3.
以往的竞价排名算法,大多只考虑搜索关键词与广告的语义相似度,但语义上的相似并不代表提交该查询需求的用户具有购买广告对应产品的意向,也就是说不代表该搜索关键词具有商业价值。本文从搜索关键词的商业价值入手,分析搜索关键词词性、长度以及热门程度等方面的特征与搜索关键词商业价值之间的关系,对推荐搜索关键词和广告商有效投放广告,提供了一些可供考虑的特征,并给出了一定的分析。 相似文献
4.
网页作弊与反作弊技术综述 总被引:1,自引:0,他引:1
随着网络信息爆炸式的增长,搜索引擎成为人们首选的获取信息的主要途径。能否在搜索引擎的排名中占有比较靠前的位置,将在一定程度上决定网页的访问量。一些网站并不是通过提高网页质量来提高其在搜索引擎中的排名,而是根据搜索引擎自身的特点,采用欺骗手段来提高排名,这就是网页作弊。网页作弊是搜索引擎面临的重大挑战之一。本文将结合常见的网页作弊的方法,阐述当前已经存在的比较有效的反作弊技术。 相似文献
5.
智能技术与系统国家重点实验室筹建于1987年,1990年通过国家正式验收对外开放运行。多年来,我们始终注意发挥实验室原有多学科、多层次研究的优势,不断加强基础理论研究,扩展研究领域,加强国际合作,开展战略性、基础性和前瞻性的科学研究。围绕“智能信息处理的 相似文献
6.
针对大模式类识别问题 ,介绍基于神经网络球面领域覆盖构造方法的思想 ,并给出覆盖构造法在典型大模式类识别问题的应用 ;通过比较覆盖方法在实际应用中的效果 ,说明基于神经网络球面覆盖构造法从根本上解决了前馈神经网络大模式类识别遇到的学习训练慢、不收敛的问题 .同时 ,与其他方法的有机集成 ,能极大地提高解决大模式类识别问题的速度和准确度 . 相似文献
7.
为了帮助用户浏览网页时更快的找到他所需要的信息,提出了一种新的用户个人代理当用户浏览网页时,这种用户代理可以为用户自动加亮所感兴趣的词.用户访问过的网页首先根据内容被分到事先分好的几个目录中,这个分类用于理解用户访问的上下文.在每个目录中可以根据用户的访问历史纪录,用统计的方法得到用户的兴趣地描述.这些个性化的描述,可以为用户快速浏览,定位所需要的信息提供很好的帮助.实验结果证明了该做法改善了用户对网页的浏览状况. 相似文献
8.
一、实验室建设与发展历程 智能技术与系统国家重点实验室依托清华大学,1987年7月开始筹建,1990年2月通过国家验收,并正式对外开放运行。实验室由中心实验室和智能信号处理分室、智能图形图像处理分室及人机 相似文献
9.
现有的查询结果多样化研究很难准确得到用户多样性需求并提供与用户查询各个方面需求相关的文档。针对这个问题,本文基于HITS算法的网页间链接分析特性,根据网页链接图直接计算查询结果列表中的文档可能满足用户多样性需求的程度,并将其应用到结果列表的重排序中以实现搜索结果多样性。在TREC大规模数据集合上的实验结果表明了该方法的有效性。 相似文献
10.
提出了一系列基于搜索结果页面的特征用于学习分类器,自动预测用户的偏好性,并尝试将预测模型与用户实验结合起来。实验结果表明,尽管异质环境下搜索结果页面有着丰富的信息,但仅基于搜索结果页面的展现形式难以对用户的偏好性做出可靠的预测。 相似文献