首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为了进一步提升语义检索的精度和改善用户体验,提出了一种基于多分类语义分析和个性化的语义检索方法.首先,利用改进的多分类语义分析方法实现目标文档的向量化,并建立词向量库;然后,利用支持向量机对文档进行分类,并结合文档类别生成标签索引.在检索时,根据词向量库的引导,使用用户历史检索记录和个人信息优化检索结果.实验结果显示,基于该方法的系统的检索精度、平均DCG和nDCG指标值分别达到0.7,7.267和0.890,较基于Lucene方法和Yahoo Directory方法所得结果的均值分别高出31%,36%和19%.在时间复杂度上,每次检索的平均耗时为0.669 s,较Lucene方法仅增加了0.326 s.由此可见,该方法提高了检索的精度和综合相关度,且额外的时间消耗较少.  相似文献   

2.
张香梅  徐立 《科技信息》2009,(28):95-96
本文对Lucene中文切词算法进行改进,提出将基于网络有向图的双向匹配分词算法应用于Lucene的中文切词器,提高了检索的准确性和检索性能。  相似文献   

3.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

4.
由于Lucene自带的ChineseAnalyzer和CJKAnalyzer两种中文分析器不能够满足全文检索系统的应用,本文给出了一种新的中文分词算法,用于改进Lucene中文分析器。该算法基于字符串匹配原理,实现了正向和逆向相结合的最大增字匹配分词算法。通过实验仿真,比较改进后的分析器与Lucene自带的两种分析器在分词效果和效率上的差异。结果显示,改进后的分析器分词效果明显优于Lucene自带的两种分析器,提高了全文检索系统的中文处理能力,系统的查全率和查准率都达到用户的需求。  相似文献   

5.
利用Lucene开源全文本搜索技术框架建立了校园搜索引擎,设计并实现了资源采集、信息检索、数据检索等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的校园搜索引擎能满足校园用户的需要并提升了搜索的准确性.  相似文献   

6.
个性化搜索引擎研究的目的是使搜索结果尽可能满足不同用户的信息需求,而排序算法在搜索引擎技术中占有着核心的地位.提出了一种基于改进的DBSCAN聚类的个性化排序算法,在全文搜索包Lucene与开源搜索引擎Nutch的基础上,实验证明该方法提高了用户搜索的准确率和召回率.  相似文献   

7.
利用Lucene开源全文本搜索技术框架建立了校园搜索引擎,设计并实现了资源采集、信息检索、数据检 索等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的校园搜索引擎能满足校园用户的需 要并提升了搜索的准确性.  相似文献   

8.
垂直搜索引擎是针对某一个特定领域的专业搜索引擎,是搜索引擎的细分和延伸.垂直搜索引擎可以帮助用户在海量数据中进行快速、专业、精准的检索.文章实现了基于Lucene技术的山西高校图书垂直搜索引擎,其可以为读者提供专业的图书信息检索服务.  相似文献   

9.
为提高信息检索的准确率和全面性, 在对语义检索技术和领域本体的构建进行充分研究的基础上, 在网络教育资源的检索工作中应用了本体语义的概念, 提出对用户输入的查询条件进行基于本体的查询扩展算法,设计实现了使用Lucene 对扩展后的查询条件进行检索的语义检索模型。实验结果表明, 该检索模型的综合查全率为81郾5%, 综合查准率为83郾1%, 这两项指标均优于传统的关键字检索方法。  相似文献   

10.
以Lucene为主要索引引擎,集成其他智能引擎,在同义词扩展方面有良好的效果,可把Lucene应用于查询扩展模块中。分析了语义检索技术的优势,提出一种基于Lucene的语义检索模式,为数字图书馆的信息服务体系提供有参考价值的优化方案。  相似文献   

11.
数字图书馆的核心任务之一就是提供良好的信息检索系统,而传统的信息检索技术以关键字匹配为主,缺乏语义推理能力,对用户的查询请求没有提供语义指导,因此造成信息的误检、漏检.本文将Ontology用于数字图书馆信息检索,首先分析了数字图书馆特点和需求,接着提出了基于 Ontology 数字图书馆信息检索模型、体系结构,深入研究了关键技术,最后对研究进行了验证.  相似文献   

12.
分析了网络环境下用户信息检索的特点,阐述了网络检索中的双重信息质量评价指标,从信息服务商和用户双重角度对如何提高网络检索中的信息质量进行了评价。  相似文献   

13.
Ontology与Agent在图像检索中的应用   总被引:1,自引:0,他引:1  
提出了利用本体论和智能主体理论设计的一种新的图像检索技术——图像检索服务器.它集成了五种智能主体,并利用本体论的方法描述图像的语义特征继而对图像进行领域分类,同时规范化了用户的查询条件.使用该系统,图像检索的性能得到了很大的改进.  相似文献   

14.
为了解决传统依据关键字、概念和属性值等检索技术没有考虑不同主体中情报信息间的语义关系,无法提供令用户满意的情报检索结果问题,通过语义Web方法研究了多功能情报信息自适应检索技术。设计基于语义Web的多功能情报信息自适应检索模型,检索模型包括人机交互层、知识处理层以及知识存储层。在知识存储层建立本体语义模型。在知识处理层,从检索的多功能情报信息关键词中推断和其语义有关的概念,依据概念有关词汇对原始查询进行扩展,对语义相似度进行计算。在人机交互层,将用户反馈情况看作判断检索结果优劣的衡量因素,依据相似关键词获取相似结果集,按照反馈因子完成对所有相似结果的排序,把排序结果发送给用户,实现多功能情报信息自适应检索。结果表明,所提方法能够同时保证召回率与精度;排序误差率低;检索结果和用户查询结果最相符,检索结果准确,可令用户满意。可见所提方法检索性能强。  相似文献   

15.
传统的基于关键词的信息检索不能理解用户的需要,仅仅对关键词进行简单的匹配,其结果往往包含大量与用户实际需要毫不相干的信息,同时却丢失用户实际需要的信息,使得检索的效率很低.基于本体的语义检索技术的出现,弥补了基于关键词检索的不足,成为目前构建信息检索系统的应用热点.本文主要针对燃气管网的材料腐蚀信息,设计一个基于GIS(Geography Information System)的管网材料腐蚀信息语义检索系统,使用户检索管网空间数据和腐蚀数据时为其提供相关数据的语义信息,同时也使得检索结果更加符合用户需求.  相似文献   

16.
基于多级检索的自动问答系统研究   总被引:1,自引:0,他引:1  
问答系统通过采用自然语言处理技术,用简洁准确的语言回答用户用自然语言提出的问题。文中设计并实现了一种基于本地知识库和网络检索的中文问答系统,利用知识共享平台构建大规模的真实用户问题知识库,通过对知识库和网络资源的多级检索,使用句法分析和实体识别对答案进行抽取,有效提高了问答系统的响应速度和准确率。  相似文献   

17.
为提高组合检索系统的性能,提出一种基于混合模型的多搜索引擎融合方法.该方法利用高斯、指数密度函数分别描述相关、非相关文档的相关分值分布,用基于混合模型的算法规范化处理相关分值,估计非相关文档的相关分值,并进行分值合并.这样做既考虑到相关、非相关文档在分值分布上的差异,又考虑了用户对成员搜索引擎的性能评价.实验结果表明,利用该方法的平均查准率要比成员搜索引擎平均提高37.8%,也明显高于Sum-CombSUM、Sum-CombMNZ和Standard-CombSUM3种常用的融合方法。  相似文献   

18.
中文检索是信息产业中发展较快且很重要的领域,在对全文索引进行深入的理论分析基础上,设计实现了基于倒排索引结构的中文文本检索系统.该系统采用词库匹配法对文本文档进行关键词的切分,并对关键词建立索引,最后通过索引实现对关键词的检索.  相似文献   

19.
We propose a content-based parallel image retrieval system to achieve high responding ability. Our system is developed on cluster architectures. It has several retrieval servers to supply the service of content based image retrieval. It adopts the Browser/Server (B S) mode. The users could visit our system though web pages. It uses the symmetrical color-spatial features (SCTSF) to represent tile content of an image. The SUSF is effective and efficient for image matching because it is independent of image distortion such as rotation and flip as well as it increases the matching accuracy. The SCSF was organized by M tree. which could speedup the searching procedure. Our experiments show that the image matching is quickly and efficiently with the use of SCSF. And with the support of several retrieval servers, the system could respond to many users at mean time.  相似文献   

20.
基于蚁群聚类的信息检索系统研究   总被引:2,自引:0,他引:2  
宫占华 《山东科学》2008,21(3):64-67
网络信息量的急剧增加,使得信息检索的速度急剧下降。本文利用蚂蚁堆形成原理,进行了聚类分析,提出了一种蚁堆聚类算法,并应用到Web信息检索系统中。实验结果表明:蚁堆聚类精度高、速度快,提高了信息检索速度和效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号