首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 187 毫秒
1.
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩展方法将大量无关词加入查询的问题.实验表明,该方法有效地提高了查询结果的查准率.  相似文献   

2.
基于用户兴趣及术语间关系的查询扩展方法   总被引:1,自引:0,他引:1  
针对传统查询扩展方法无法根据不同用户的需求进行检索的不足,提出一种基于用户兴趣和术语间关系进行查询扩展的方法。通过对用户浏览的网页文档及得到的网页日志进行挖掘得到一系列代表用户兴趣的术语,根据与初始查询词存在同义关系的用户兴趣术语及其权重对初始查询词权重进行调整,利用兴趣术语中与初始查询词存在本体关联关系的术语对初始查询进行扩展。实验结果表明,该方法相对于传统查询扩展方法在一定程度上提高了信息检索的查全率和查准率。  相似文献   

3.
当搜索日志存在查询词稀疏性和时效性问题时,基于搜索日志的查询扩展方法无法保证查询扩展的质量,无法满足具有时效性查询请求的需求.提出了基于搜索日志与局部上下文的查询扩展方法,通过发掘搜索日志中用户查询词和相关文档的关联关系,抽取查询扩展词,并用局部上下文从相关文档集中提取出频率较大,同时具有时效性的查询扩展词.通过对查询扩展词的查询性能和时效性的计算,该方法为原始查询补充更高质量的查询扩展词.实验结果表明,该方法能够有效地提升准确率和召回率,使原始查询获得更好的查询性能.  相似文献   

4.
传统的基于关键词匹配的查询方法因查询词短少,微博博文短小,容易引起歧义性,对查询效率有较大影响.提出一种基于本体和局部查询反馈的微博查询扩展算法,首先结合安全领域文档构建安全领域本体知识库,然后利用本体提供的语义知识对初始查询词进行扩展,再结合局部查询反馈对候选扩展词集进行筛选,最后通过二次查询和迭代操作得到最终查询结果.实验结果表明,基于本体和局部查询反馈的微博查询扩展算法比基于关键词的查询扩展算法、基于本体的查询扩展算法和基于"伪相关反馈"的查询扩展算法有更好的查全率和查准率.  相似文献   

5.
针对现有专利检索中的用户意图理解及查询扩展不足问题,提出了一种基于自动查询扩展的专利文档检索方法。首先结合专利文档特点,采用基于改进TF-IDF公式的专利领域词表提取方法,构建专利领域词表。在检索阶段,对查询输入串进行分析得到查询关键词汇,同领域词表相结合,确定查询所在领域及查询扩展难度。利用基于伪相关反馈的自动查询扩展技术,根据伪相关文档的术语分布差异分析,生成查询扩展项并排序,最后将扩展项与原始查询条件相结合,重新组成查询条件,完成专利查询。实验结果表明,该方法具有较高的召回率和平均准确率。  相似文献   

6.
一种基于同义词词典的模糊查询扩展方法   总被引:2,自引:0,他引:2  
在信息检索系统中,查询扩展是一种非常有效的改进检索性能的方法. 为此,提出一种基于同义词词典的模糊查询扩展方法. 该方法中的同义词词典是基于著名的语义词典WordNet中的同义词集合建立的,同义词之间的贴近度[0, 1]使用Tanimoto系数获得. 利用该词典,能够进行较好的查询扩展. 将该方法与向量空间模型结合应用于文本信息检索系统中,所构造的检索模型相当于一种简单的语义模型,并且可以根据阈值来控制查询扩展的程度. 所得试验结果表明,使用该查询扩展方法的信息检索系统较常规信息检索系统的检索性能有一定改善.  相似文献   

7.
一种基于知识的关系数据库模糊查询方法   总被引:1,自引:0,他引:1  
在数据库查询中,针对传统DBMS不支持模糊查询的弱点,提出了基于知识的数据库模糊查询转换方法.以模糊集理论为基础,介绍了数据库模糊查询条件的构成形式,并提出利用隶属函数、领域知识和模糊集的α-截集运算相结合的方法实现模糊查询转换,模糊查询条件的转换和扩展考虑了查询条件的重要程度和用户偏好.该方法无需改变传统SQL语言或数据库引擎就能够实现模糊查询,提高了用户与系统之间的交互能力.  相似文献   

8.
针对RDF含相对量词模糊查询问题,提出支持分组机制的相对量词RDF模糊查询方法.利用语言层次结构理论,构造语言层次结构表,通过在FILTER子句中增加模糊条件并调用GROUPBY和HAVING子句实现特定属性上的分组操作,实现对SPARQL语法的扩展.分析了两种典型情况下的RDF相对量词模糊查询问题,给出将扩展的模糊SPARQL查询转换为标准SPARQL查询的处理方法,从而可利用现有的SPARQL查询引擎完成RDF基于相对量词的模糊查询处理.实验系统及相应的实验结果验证了所提方法的可用性.  相似文献   

9.
基于特定问题类别的汉语问答系统查询扩展   总被引:1,自引:0,他引:1  
针对汉语问答系统的特点,提出一种通过统计问答对方式获得各种问题类别的关联词,并根据类别关联词进行查询扩展的方法.在计算问题和答案文本相似度时,实现了一种基于最小匹配距离的计算方法,该方法充分考虑了查询词及查询扩展词在文本中的词频及位置分布信息.实验结果说明在汉语问答系统答案文本检索中,按照问题类别关联词进行查询扩展比未进行查询扩展在性能上有很大的改进.  相似文献   

10.
目前困扰查询扩展的主要问题是主题漂移.为了降低主题漂移对查询扩展优化的影响,提出了一种基于任务上下文信息的查询扩展方法,旨在通过任务上下文中的信息来选择合适的查询扩展词添加到查询中,使得查询的结果更加精确.实验结果表明,该方法有效降低了主题漂移对查询扩展精度的影响.  相似文献   

11.
基于Dempster-Shafer理论的查询扩展模型   总被引:3,自引:0,他引:3  
查询扩展是提高信息检索召回率的有效方法,已有许多研究者提出了诸多扩展方法,但大多数方法均是简单地把扩展的词添加到查询中.这样如若不加区分原查询词和扩充词,则扩展后的查询就可能偏离原查询的语义.该文基于Dempster-Shafer证据理论,提出了一个查询扩展的计算模型,该模型把原始查询项看作主证据,扩展项为原始查询项的辅助证据,为了能组合这两类证据,该文给出了两个带权重的Dempster-Shafer组合规则,实验表明该方法能有效地提高检索效率.  相似文献   

12.
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法。该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前”个文档进行分析,提取出与查询相关的文档作为反馈文档。该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率。实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能。  相似文献   

13.
伪相关反馈(pseudo-relevance feedback)是一种可有效提升查询性能的查询扩展技术。对这项技术而言,如何选取参数来平衡原始查询和扩展词的比重以达到最优的查询效果是一个非常重要的问题。在以往的反馈模型中,该平衡参数在所有数据集上需要设置成固定的经验值。但是,由于数据集之间的差异性,该平衡参数应该随着数据集的变化而改变。通过分析数据集的统计特征来发掘其与最优平衡参数之间的关系,进而指导最优参数的选择,主要分析了文档长度离散度、低频词项在数据集和查询扩展词中的比重等特征。通过分析在6个标准TREC数据集上的实验结果得出结论:特殊词项的比例越高,文档长度离散度越大,越需要给原始查询更大的比重。  相似文献   

14.
针对LSH技术的固有缺点提出了一种根据数据自动调整LSH索引结构关键参数的方法,该方法面向数据集,使得索引结构可以针对不同数据集的统计特征选取适当的散列函数,而不用手工调整LSH索引结构中的关键参数,提高了LSH算法的准确性,且在进行查询时不增加额外的时间空间开销.模拟实验表明,和使用原始LSH算法相比较,使用该方法进行最近邻查询得到结果集的相似性可以提高10%左右,相似偏差可以减小8%左右;并且由于参数调整过程在查询过程之前,因此改进LSH算法和原始LSH算法在进行查询时有相同的时间空间性能.  相似文献   

15.
网络环境下XML数据库查询应用,目前国内外已存在多种优化技术,查询重写,语义缓存等,但在冗余去除方面却缺乏研究。在已有技术的基础上,从减少网络流量的角度改进原XPath查询集冗余去除方案,利用XPath树模式和DTD对查询集在不同XML文档结构下冗余度进行评估,并在算法中权衡网络流量和XPath查询复杂度,来满足用户需求。  相似文献   

16.
0 IntroductionSearchingthe webis not always sosuccessful as users expect .Most of the retrieved sets of documents in a web searchmeet the search criteria but do not satisfy the user’s needs. Onecrucial reasonis that users generallylack of specificityin the for-mulation of the queries.Some causes of this are that most of theti mes ,the user does not knowthe vocabulary of thetopic,or que-ryterms do not come to user’s mind at the query moment .One possible solutiontothis problemis the process …  相似文献   

17.
One of important reasons caused low precision was presented, which was due to inaccurate express of the query. So a new method of automatic query expansion based on tolerance rough was put forward. In the algorithm, the uncertain connection between query terms and retrial documents was described as term tolerance class. The upper approximation set of query sentence was considered as query expansion. The new additional terms were also given weight numbers. The results of experiment on collection of Google 5 000 Web pages showed that the approach was effective on query expansion and high search precision was gained.  相似文献   

18.
In Chinese question answering system, because there is more semantic relation in questions than that in query words, the precision can be improved by expanding query while using natural language questions to retrieve documents. This paper proposes a new approach to query expansion based on semantics and statistics Firstly automatic relevance feedback method is used to generate a candidate expansion word set. Then the expanded query words are selected from the set based on the semantic similarity and seman- tic relevancy between the candidate words and the original words. Experiments show the new approach is effective for Web retrieval and out-performs the conventional expansion approaches.  相似文献   

19.
基于构件的自动查询系统   总被引:1,自引:0,他引:1  
基于构件思想,采用SQL Server数据库系统的系统数据库和系统表、ASP等技术,实现了自动查询系统。系统用户可以自行设置筛选条件、显示结果。同时,系统具有一定的通用性,支持多种查询方案,根据查询条件对结果进行筛选,然后将查询结果导入Excel文件,完成打印输出。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号