首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
以企业检索为代表的Intranet信息检索是人们所关注的一个新的应用领域。虽然该领域对于信息检索技术的需求很紧迫,也有很大的市场,但是由于与传统的通用信息检索不同,使得通用检索技术无法直接在该任务上加以利用并取得很好的效果。通过阐述以企业信息为代表的Intranet检索的特点和算法,从而揭示Intranet信息检索与传统信息检索的不同之处,并从两个方面给出一些可能的应用和发展的技术方向的展望。  相似文献   

2.
信息检索中通过网页链接信息提取文档内部关系进行搜索结果重排可以提升检索系统的性能。通过Markov网络来展现文档内部关系,该网络更直观地解释了文档间的语义相关性,利用这种文档内部语义关系计算文档重要性对检索结果进行重排。根据文档分布特征阐述了Markov文档网络的构造算法,讨论了Top-k及其相关文档的重要性评分算法,修正初始检索的文档评分。通过这种方式,既保持了文档图的查询相关性,又丰富了文档内部关系,扩大了重排序范围。实验表明,在多个标准文档集上基于Markov网络的结果重排技术对检索性能有较大的稳定提升。  相似文献   

3.
Internet的普及和发展 ,使互联网中的信息量与日俱增 ,人们普遍采用搜索引擎进行各种信息检索 ,但效率及精确度偏低 .从用户的角度及检索机制上 ,比较客观地分析了目前造成这种现象的原因 ,并从多方面给出了提高信息检索精度的几种策略 .实验结果表明 ,检索效果有一定的提高  相似文献   

4.
针对维吾尔语Web文档的有效检索问题,提出一种基于相关反馈和文档相似度的检索词加权方法.首先,对维吾尔语文档进行预处理,获得相应的词干集.然后,当用户输入多个检索词时,执行初始检索,并基于局部相关反馈思想提取出排名靠前的N个文档.接着,利用TF-IDF算法计算检索词与反馈文档之间的词频相似度,通过余弦距离计算文档之间的相似度,并以此对检索词进行两次加权.最后,根据加权后的检索词进行文档检索.实验结果表明:该方法能够准确地检索出用户所需的文档,并将其靠前排序.  相似文献   

5.
本设计并实现了一个基于内容信息过滤的智能Agent:CuteSeareher.它能够根据用户提交的示例档,采用机器学习的方法对用户的兴趣进行建模.并通过与www上的搜索引擎相互作用,自动查找用户所需的信息.在两个方面解决了现有过滤系统在学习方法方面的不足:第一,采用了概念推理网解决词组分割问题;第二,使用基于协同演化的遗传算法解决档的特征抽取问题.测试表明它可以有效地帮助用户在www上搜索信息.  相似文献   

6.
A passage retrieval strategy for web-based question answering (QA) systems is proposed in our QA system. It firstly analyzes the question based on semantic patterns to obtain its syntactic and semantic information and then form initial queries. The queries are used to retrieve documents from the World Wide Web (WWW) using the Google search engine. The queries are then rewritten to form queries for passage retrieval in order to improve the precision. The relations between keywords in the question are employed in our query rewrite method. The experimental result on the question set of the TREC-2003 passage task shows that our system performs well for factoid questions.  相似文献   

7.
针对当前定量化的地理信息检索模型无法有效处理自然语义导致检索结果不理想的问题, 以语义匹配为原则, 以定性表达为基础, 以推理方法为手段, 提出基于定性空间推理的定性地理信息检索的方法及其形式化模型, 实现Web文档信息内容与查询请求的定性表达和信息提取, 支持基于语义的检索匹配和结果排序, 并进行原型系统的实验验证。这种定性检索方法符合人类常识性认知和表述习惯的方式, 基于定性知识表达和推理决策技术的地理信息检索问题解决方法可以提高现代地理信息检索技术的有效性。  相似文献   

8.
随着互联网的普及和Web资源的日益丰富,从网上获取基于药品本体的信息成为人们常用的方式,但用户在检索信息时经常会出现找不到或者查不准的情况。针对这样的问题,提出了一种基于本体的信息检索系统,并将相似度等算法融合其中,从而大大提高了查询的效果。  相似文献   

9.
基于概念网的智能信息服务系统的设计与实现   总被引:1,自引:0,他引:1  
针对如何组织、管理与有效获取信息问题,介绍了一个基于概念网的集信息收集、检索与管理的智能信息服务系统设计与实现.依靠概念网,采用文本类别特征提取及文本匹配和概念角色提取算法完成待收录文档的自动分类组织,利用概念检  相似文献   

10.
介绍了利用Lucene结合Tika实现站点内容的全文检索设计的编程过程。用Tika获取文档的元数据以及文档内容的文本提取。用Lucene实现文档的索引创建和检索服务,结合实例详细分析了Lucene API的具体使用特点。利用Spring MVC实现搜索服务的Web访问处理。可对网站的HTML、PDF、word、PPT、mht等各种类型的文档提供统一的内容检索服务。在该论文研究基础上可建立个性化的内容搜索服务系统。  相似文献   

11.
Web上大量、分布、动态的信息,造成了用户在查询Web上的信息时产生“信息过载”和“信息迷向”现象.智能信息Agent是解决此问题的研究热点.设计并实现了一种以智能化、主动搜索为标志的互联网智能信息Agent-CIRs,从用户日常的行为中自动学习出用户兴趣模型,从而为用户提供个性化Web信息服务.  相似文献   

12.
基于多查询数据融合和正相关反馈的检索算法   总被引:4,自引:0,他引:4  
为提高信息检索系统的性能,提出了一种多查询数据融合与正相关反馈相结合的检索算法.算法的核心思想是:利用基于向量表示的余弦相似度测度计算查询与文档之间的相似度,采用多查询数据融合技术将多个检索结果融合,以及从上一次检索结果中取出前M个相关文档和初始查询一起构成新的查询,将新查询提交给系统并继续下一次的检索,如此反复,直到获得满意的结果.实验结果表明,该算法相对于仅使用了多查询数据融合技术的算法和仅使用了正相关反馈技术的算法,其平均准确率分别提高42.6%和23.17%.  相似文献   

13.
To efficiently retrieve relevant document from the rapid proliferation of large information collections, a novel immune algorithm for document query optimization is proposed. The essential ideal of the immune algorithm is that the crossover and mutation of operator are constructed according to its own characteristics of information retrieval. Immune operator is adopted to avoid degeneracy. Relevant documents retrieved am merged to a single document list according to rank formula. Experimental results show that the novel immune algorithm can lead to substantial improvements of relevant document retrieval effectiveness.  相似文献   

14.
基于本体的信息检索模型研究   总被引:23,自引:2,他引:23  
在传统的信息检索模型中,由于档逻辑视图和用户信息需求逻辑视图不能有效地代表档和用户信息需求,所以尽管根据逻辑视图的特点选取了合适的排序函数,但检索性能总是不能令人满意.提出基于本体的信息检索模型,使用较好的兼顾了知识表达能力和推理效率的描述逻辑来构建本体,利用tableau算法和只含有原子角色情况下个体间的等价关系分别生成概念集和个体集的商集,从而得到具有语义的索引项集合,利用这些具有语义的索引项来生成较好地反映档和用户信息需求语义的档逻辑视图和用户信息需求逻辑视图;由于逻辑视图能够有效地代表档和用户信息需求,再根据逻辑视图的特点选取合适的排序函数,从而可以使检索性能大大提高.  相似文献   

15.
一种改进的Lucene语义相似度检索算法   总被引:2,自引:0,他引:2  
 Lucene的基础上,结合检索词项的语义信息,利用外部词典Wordnet分析检索词项与被检索文档中词项的语义相似度,在此基础上实现对文档语义信息的检索。通过分析现有的相似度量函数的核心特征,选择合适的语义相似度量方法,提出了一种新的词项语义相似度检索函数,该函数能够对检索文档按照语义相似度进行排序。实验结果表明,所提出的方法能够有效地提升文献检索的准确度。  相似文献   

16.
本文总结了我馆利用Quick Mis建立馆藏期刊检索信息系统的初中经验,系统具有数据库维护,倒排,检索查询,打印输出等多项功能,可从8个途径进行馆藏信息的单项及复合检索,可定义格式打印输出馆藏期刊目录,能较好地满足期刊管理及期刊馆藏信息检索的要求。  相似文献   

17.
基于本体的个性化检索技术研究   总被引:1,自引:0,他引:1  
林洁 《贵州科学》2009,27(4):50-52
近几年信息检索技术飞速发展,但很多搜索引擎都存在检索精度不高,检索结果不够个性化等问题。本文提出一种基于本体的个性化检索方法,在记录用户手动标注的信息生成一个个性化倒排索引的同时,再将其与本体知识相结合,进一步明确概念和语义关系,使得用户榆入相同或相近的检索词时也能反馈用户曾经标注过的文档信息,从而满足用户的个性化需求。  相似文献   

18.
智慧检务是进一步发展检察信息化的重要步骤,它的实施和普及能更好地提升检察院工作质量和工作效率。实际上,检察官在办公流程中往往会处理大量的检察院法律文书,若不能有效地组织和利用这些文书中的信息,会降低其工作效率,信息检索技术恰好可以解决这一问题。在法律领域,中文信息检索数据集的缺失在一定程度上制约了法律信息检索的发展。在这一背景下,针对检察院法律文书的特点,提出了一种构建检察院法律文书检索数据集的方法,并构建了一个可用于法律领域信息检索研究的小型中文数据集。通过实验分析,验证了该数据集在不同检索模型上的性能。  相似文献   

19.
当前流行的搜索引擎工具多数是针对Internet网络上的信息,但对于内部网上具有等级性的信息,通用搜索引擎就显得有些力不从心。本文设计了一种基于访问控制的内部网搜索引擎。该搜索引擎可以根据用户在内部网中的授权情况,返回在其权限范围内可以看到的信息,而其他信息被访问控制系统过滤掉,保证了信息检索的准确性和安全性。  相似文献   

20.
WWW信息检索综述   总被引:10,自引:3,他引:7  
WWW是目前全球最大的信息系统,在WWW上查询信息和文档主要依靠Internet搜索引擎。现在也出现了许多实用商业搜索引擎站点,例如Yahoo!、InfoSeek、Excite、Lycos等。主要介绍了信息检索系统的结构(Robot,搜索引擎,索引数据库,查询服务等4个部分),信息检索系统的分类(检索工具站点和检索服务站点),信息搜寻的基本原理,信息检索模型(包括经典的布尔模型,概率模型和新兴的概念模型等),其他的检索技术(例如Push技术,Mobile Agent技术等),对WWW信息检索做了比较全面的介绍。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号