首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 211 毫秒
1.
根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Lucene是一个用java语言开发的开源的全文搜索引擎架构.本文利用Lucene设计和实现一个基于查询与内容的文档表示模型的站内搜索引擎,实验结果表明该模型能有效的提高信息检索的查准率.  相似文献   

2.
搜索引擎的技术发展趋势   总被引:1,自引:0,他引:1  
作为互联网信息传播的有效载体之一,随着google、百度在纳斯达克神话的上演,越来越多的人开始关注搜索引擎,越来越多的人也开始借助搜索引擎加快对网络信息的浏览。Web上信息量的快速增长,为信息检索工具带来新的挑战与机遇,越来越多的人喜欢基于关键词的自动搜索引擎来完成对信息的快速查询和综合浏览,搜索引擎经过几年的发展和摸索,也越来越贴近人们的需求,成为互联网信息传播的主要方式之一。  相似文献   

3.
现代搜索引擎普遍采用简单的关键词形式来表达查询,这为用户带来便利的同时也增加了准确获取信息的难度.搜索引擎很难基于少量的几个关键词准确捕捉用户的信息需求.查询推荐作为缓解上述问题的关键技术,已经开始应用于目前主流的搜索引擎.然而,绝大多数现有的查询推荐技术基于群体智慧,以搜索引擎日志为数据源,从中挖掘用户群体在构造查询方面的习性及查询之间的语义关联性,未考虑不同用户个性化的信息喜好,而且在搜索引擎服务器端进行查询推荐计算也会影响搜索引擎的响应效率和查询吞吐率.为此,本文提出一种运行于客户端的个性化查询推荐策略,该策略以用户浏览历史为数据源,采用LDA模型,并从中学习用户的信息喜好,在此基础上利用原始查询被主题模型生成的概率确定用户的查询意图,以词条与查询意图之间的关联来度量词条作为扩展查询被推荐的强度,最后选择Top N强度最强的词条作为查询推荐的结果.以人工标注的测试数据对本文所提出的算法进行了实验验证,结果表明,该算法在推荐扩展查询的准确率方面明显优于单纯基于词条与原始查询语义相关的方法  相似文献   

4.
为了解决蒙古族网络用户获取信息困难的问题,通过分析多语言语义词典在跨语言信息检索中的应用,提出采用多语言本体技术构建面向跨语言信息检索的蒙汉语义词典的方法,详细介绍了词典的信息组织模式,并给出计算机术语蒙汉语义词典的查询、推理及词典测试方法.  相似文献   

5.
提出一种定性地理信息检索方法, 用于地理信息的定性表达、语义匹配、推理和结果排序, 可以避免目前定量地理信息检索中语义信息丢失问题。采用命题逻辑方法综合表达查询和文档中的主题信息和地理语义信息, 将文档与查询的相关性度量分为主题相似度和地理相似度。前者通过命题关键词间加权本体距离获得。后者可进一步分为概念相似度和位置相似度, 分别基于地理本体和空间语义度量。由于信息的表达形式为命题和信息单元, 采用证据理论和模糊逻辑对上述子相关性度量进行统一建模。所提方法可以基于语义检索网页中的定性地理信息, 并对相关文档进行排序。这种检索和排序方法符合人类空间认知, 因此可以有效提高地理信息检索的效率。  相似文献   

6.
针对信息检索模型检索性能的问题,将本体及本体语义相似度度量方法运用于基于贝叶斯网络的信息检索模型中,通过利用领域本体表达信息的规范性及本体语义推理的准确性对查询需求进行扩展,提高查询的性能。给出了信息检索模型和概念语义相似度计算及查询检索方法与过程,实验证明该方法在一定程度上能够提高检索系统的性能。  相似文献   

7.
WWW信息检索综述   总被引:10,自引:3,他引:7  
WWW是目前全球最大的信息系统,在WWW上查询信息和文档主要依靠Internet搜索引擎。现在也出现了许多实用商业搜索引擎站点,例如Yahoo!、InfoSeek、Excite、Lycos等。主要介绍了信息检索系统的结构(Robot,搜索引擎,索引数据库,查询服务等4个部分),信息检索系统的分类(检索工具站点和检索服务站点),信息搜寻的基本原理,信息检索模型(包括经典的布尔模型,概率模型和新兴的概念模型等),其他的检索技术(例如Push技术,Mobile Agent技术等),对WWW信息检索做了比较全面的介绍。  相似文献   

8.
相对于目前常用的基于关键词字面匹配的检索方法,语义网的信息组织作为一种全新的信息组织方法和理念,为网络信息组织带来了新的变革。本体是语义网信息组织的核心,本体及其推理能力代表了现代信息组织,特别是网络信息组织的发展趋势,它不仅有利于信息的形式化描述,而且依据本体这种信息组织方法而建立的检索系统,更能满足用户进行语义检索特别是智能检索的需要。面向语义的课程知识的检索以语义理解为基础,在很大程度上揭示了信息语义的扩展性,加大了对知识的处理和理解能力。基于本体的语义信息检索在构建领域知识本体结构的基础上,通过对领域本体资源的语义信息的获取,来理解用户的检索需求,语义描述检索语句和文档的资源,从而实现信息检索。因此,如何构建课程知识本体成为现阶段教育变革的热点话题。本论述以谭浩强所著《C程序设计(第三版)》课本为基础,以创建该门课程的本体模型为例,讲述面向语义的课程知识本体的构建。  相似文献   

9.
提出一种基于语义Web的信息检索模型,它能够实现准确高效的网络信息检索,克服传统信息检索的局限。介绍了语义Web、本体以及Lucene全文检索技术,详细阐述该模型的六大模块,其中在本体基础之上充分利用Jena查询和推理技术进行查询扩展,以及Lucene技术来建立索引和检索,改进排序算法使得返回结果更加满足用户需求。  相似文献   

10.
传统的基于关键词的信息检索不能理解用户的需要,仅仅对关键词进行简单的匹配,其结果往往包含大量与用户实际需要毫不相干的信息,同时却丢失用户实际需要的信息,使得检索的效率很低.基于本体的语义检索技术的出现,弥补了基于关键词检索的不足,成为目前构建信息检索系统的应用热点.本文主要针对燃气管网的材料腐蚀信息,设计一个基于GIS(Geography Information System)的管网材料腐蚀信息语义检索系统,使用户检索管网空间数据和腐蚀数据时为其提供相关数据的语义信息,同时也使得检索结果更加符合用户需求.  相似文献   

11.
利用Lucene开源全文本搜索技术框架建立了校园搜索引擎,设计并实现了资源采集、信息检索、数据检索等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的校园搜索引擎能满足校园用户的需要并提升了搜索的准确性.  相似文献   

12.
基于概念检索的中文搜索引擎   总被引:7,自引:0,他引:7  
随着Internet中文信息的增加,智能化引擎已成为中文检索技术未来的发展目标与趋势,概念检索作为一种实现技术有着广泛的应用前景,文中阐述了概念检索的意义,介绍了一种基于概念语义网络且针对特定领域的中文搜索引擎模型与实现。  相似文献   

13.
利用基于校园网的搜索引擎来搜索学校局域网内的信息已成为人们关注的热点,一方面是因为校园网内信息量不断增加,利用搜索引擎可以提高搜索效率;另一方面是因为由于网络设计的限制,百度等搜索引擎搜索不到局域网内的很多信息.在研究搜索引擎基本原理和技术的基础上,设计了基于Lucene的校园网搜索引擎.测试表明,本系统能很好地完成用户的搜索要求.  相似文献   

14.
基于领域本体的信息搜索模型   总被引:3,自引:0,他引:3  
针对目前的搜索模型局限于语法层次上关键词匹配的特点,以领域本体作为知识组织方式,提出了一种语义环境下基于本体的信息搜索模型.在此模型的基础上,分别提出了文档语义标注算法和搜索词语义扩展算法,两种算法分别对文档集语义分析和搜索词语义关系理解,实现双向语义信息搜索的目的.实验结果表明,提出的信息搜索方法能够克服关键词匹配搜索的不足,获得较好的搜索效果  相似文献   

15.
针对当前的概念检索模型存在没有语义特征的词典和缺乏知识库层面上的推理机制等问题,采用具有很强的表达能力和可判定推理功能的描述逻辑来实现概念的扩展检索.设计了一个基于描述逻辑的概念检索模型,并对其核心的推理算法作了进一步扩展,给出了相应算法的数学定义及其知识库的逻辑描述,并据此采用Jena和Racer推理引擎实现了一个基于描述逻辑的汽车导购的概念检索系统,可向用户提供有关汽车的分类、性能、报价等信息.实验结果表明:基于描述逻辑的概念检索模型实现了有效的隐含语义的检索,并通过关联概念联想实现了良好的用户启发和信息导航.  相似文献   

16.
Internet中文信息检索技术   总被引:1,自引:0,他引:1  
本文主要介绍了INTERNET中文搜索引擎索引数据库建设中的分词技术、文档的相关性等技术特点;中文搜索引擎的系统结构;网上中文信息检索方法。并提出了中文搜索引擎存在的检索方式单一、缺少全文引擎等问题。  相似文献   

17.
提出了一种基于搜索代理的自动提取和分析纺织企业信息的搜索系统。该搜索代理以搜索引擎技术为核心,结合用户反馈信息和专业领域词汇,对特定领域进行划分,同时利用网页结构特征信息剖析有价值内容,并将提取的信息置于数据库中,以进行广泛应用。  相似文献   

18.
介绍了在互联网信息检索领域中搜索引擎的产生及发展状况,以及元搜索引擎的基本工作原理.元搜索是建立在搜索引擎之上的,提供统一的用户查询界面与信息反馈形式,应用不同的结果选择策略满足用户不同的需求.  相似文献   

19.
如何有效地构建面向领域的垂直搜索引擎,是信息检索领域众多研究者关注的问题.本文提出了一种通用的基于专业词汇表构建垂直搜索引擎的方法,通过分析网页特征,提出了基于链接结构和文本内容的启发式网页爬取策略.该策略结合网页的结构信息特征,在网页和主题相关度计算中考虑了特征词汇在网页中的权重,有效地提高了专业搜索引擎的查询效率.通过具体实现一个面向医疗领域的垂直搜索引擎,验证了本文所提出的方法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号