首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩展方法将大量无关词加入查询的问题.实验表明,该方法有效地提高了查询结果的查准率.  相似文献   

2.
为了提高传统云环境下密文检索技术的查询准确率,在本体语义技术的基础上,提出了一种基于本体语义扩展的密文检索方案。通过构建混合云密文检索模型,将明文检索中的本体技术引入到密文检索,对查询关键词进行语义扩展,并利用本体中语义相似度过滤扩展结果,以更好地理解用户的查询意图。实验结果表明:在保证检索速度的同时,该方法能够提高检索结果的查准率。  相似文献   

3.
在中文文本信息中,同一个语义往往有多种不同的表达方法,不同的个体对同一个词语理解也会有一定的偏差,这将导致在信息检索时,出现查询项与检索数据"词不匹配"的问题.虽然,模糊检索是改善这一问题的有效方法之一,但仅仅利用已知信息进行模糊检索,已不能满足充斥着大规模无标定文本信息的网络时代的检索需要.提出一个基于词向量的模糊检索查询扩展方法,通过词向量计算查询项的相似词,进而进行查询项扩展.相比与传统的模糊检索方法,在同一测试集中,基于词向量的模糊查询扩展方法测评出的查全率、查准率以及两者的调和平均数均得到了有效提升.  相似文献   

4.
为提高垂直搜索引擎中面向服务行业的页面搜索查准率,提出了一种语义模型的设计与实现方法.该模型以面向服务行业的垂直搜索引擎为研究对象,根据服务行业领域知识将查询词分成三种语义(品牌词、类别词、服务项目),针对三种语义设计差异化搜索方案;并改进了页面搜索排序方法.该语义模型首先通过识别查询词的类型,得到相应的过滤条件;然后由过滤条件限制搜索范围,去掉不相关的搜索结果;最终通过改进页面搜索排序算法,提高搜索准确率.实验结果表明,应用该语义模型得到搜索过滤条件,使用过滤条件限制搜索范围,搜索的正确率提高了2个百分点~7个百分点,有效提高搜索引擎的查准率,提升用户体验和工作效率,对其他领域或行业也有一定的借鉴意义.  相似文献   

5.
提出一种基于本体知识查询树(OKQT)的混合P 2P语义路由检索模型,通过对路由节点中OKQT的查询,使得用户节点能够根据检索词和OKQT中知识的匹配,在网络中进行快速准确的查询定位,对所需知识进行精确查询。同时对于网络中无法和检索词匹配的查询,通过计算它和其他知识的语义相似度,对检索词进行相应的缩放,返回相应的知识供用户参考。实验表明,这种先定位后查询的方法提高了语义路由效率,具有较强的查准率、查全率和扩展性。  相似文献   

6.
为解决中文数据的重复检测问题,在SNM(Sorted-Neighborhood Method)算法的基础上提出了一种融合《同义词词林扩展版》和中文分词于一体的重复记录检测算法,通过利用《同义词词林扩展版》和Jaccard算法计算词语相似度,同时采用Python中Jieba中文分词的方式对语句进行分词,从而达到优化余弦相似度算法计算语句相似度.改进后的算法能有效的对记录为中文的字段和语句进行重复记录检测.并通过对某辅导机构学生测验信息数据集进行实验,实验结果表明,该算法的查全率及查准率比传统SNM算法有了很大提高.  相似文献   

7.
基于用户兴趣及术语间关系的查询扩展方法   总被引:1,自引:0,他引:1  
针对传统查询扩展方法无法根据不同用户的需求进行检索的不足,提出一种基于用户兴趣和术语间关系进行查询扩展的方法。通过对用户浏览的网页文档及得到的网页日志进行挖掘得到一系列代表用户兴趣的术语,根据与初始查询词存在同义关系的用户兴趣术语及其权重对初始查询词权重进行调整,利用兴趣术语中与初始查询词存在本体关联关系的术语对初始查询进行扩展。实验结果表明,该方法相对于传统查询扩展方法在一定程度上提高了信息检索的查全率和查准率。  相似文献   

8.
为解决传统的协同过滤算法不能准确理解用户的喜好,影响推荐准确率和推荐效果,提出基于社会化标签语义相似度的协同过滤算法.算法以标签语义相似度为基础,将项目资源和相关标签的语义信息纳入,显著提高了推荐系统的预测性能.研究结果表明:与以具体评分数据为基础的算法相比,该算法较好地解决了词相似度和句子相似度计算问题,推荐准确度和性能较以往的协同过滤算法有明显提高,改善了推荐效果.  相似文献   

9.
针对传统基于关键字的信息检索系统查全率和查准率都不高的缺点,提出了一种基于语义Web的智能信息检索模型,此模型在语义Web的环境下,利用本体技术,将最初的检索词通过查询扩展模块得到更完善的检索词集,然后利用扩展的检索词集进行检索。将基于关键字匹配的信息检索系统提升为基于本体知识库扩展查询的智能检索系统,从而提高了查全率与查准率,满足了人们对信息检索系统的要求。最后给出了模型的一种实施方案。  相似文献   

10.
垃圾邮件问题日益严重,受到研究人员的广泛关注.通过利用基于词频的权值计算,同时改进传统文本相似度计算概率模型,改进SVM算法实现邮件过滤系统.实验表明在邮件过滤的查全率、查准率等几个性能评价指标上,比传统的Rocchio方法有明显改善.  相似文献   

11.
徒手体操术语与定位法舞谱作为描述形体动作的工具,它们在理论体系上是不同的,本文通过比较,总结了构成它们各自理论体系的基本原理、描述依据与构成因素等,并指出二者在运用时的准确性、简炼性、易懂性的差异.  相似文献   

12.
领域现象术语常常是复合型短语,很难根据局部上下文特征用传统的机器学习方法来抽取.为此,文中提出了一种领域现象术语的抽取方法.该方法首先用基于上下文的方法抽取得到分隔符集,然后结合分隔符集和上下文术语用改进的NC -value算法进行候选领域现象术语抽取,最后在候选领域现象术语中过滤掉名词性术语,进而得到最终结果.实验表...  相似文献   

13.
在 Snee和 Marquardt 的 XVERT 法基础上对 Draper和John的倒数项混料模型及朱伟勇和胡晨江的对数项混料模型的试验设计用计算机进行了证明与构造。其中给出了构造试验点的新方法,并对倒数项及对数项的线性混料模型的七点及八点设计,分别计算了 T_r[M~(-1)(ξ)],|M~(-1)(ξ)|与G效。  相似文献   

14.
杜艳楠  王丽瑾  王显志 《科技信息》2010,(33):I0034-I0035
随着社会飞速发展,语言也在不断变化:原本固定在某一领域的专业词汇也不断突破原有领域,跨入其他领域。专业词汇移用增强了语言的表达能力,为新词义的产生创造了条件.极大推动了语言的发展。本文通过对实际的专业词汇移用现象的分析,得出专业词汇移用的类别及其特点,为人们研究语言发展变化提供一些借鉴。  相似文献   

15.
本文主要对现代语言学中一些不尽合理的术语加以分析,并提出了应该采用的科学合理的术语;同时对一些尚未引起注意的文字间的关系,进行了分析说明。  相似文献   

16.
将语义信息引入闭域问答系统的研究,并通过实验来验证其对闭域问答系统性能的改善.主要方法是寻找一个领域特征词集来描述候选答案集与问题间的相关度.  相似文献   

17.
18.
阐述了物料平衡和电荷平衡书写方法,较为详尽的对不同组成的电解质溶液的质子平衡进行讨论,从而达到快速书写质子平衡的目的。  相似文献   

19.
试论植物词汇的隐喻   总被引:1,自引:0,他引:1  
分析了汉语植物词汇的隐喻,总结归纳出植物隐喻的两种方式:比拟性隐喻和借用性隐喻,说明了隐喻是人们认知事物的方式。它的本质是一种认知活动。  相似文献   

20.
人们对颜色词汇的语言学研究一直关注把语言的“基本”颜色词语分离出来:说话者可以说出任何一个颜色词语的一种语言学层面的最小一组的简单语言表达。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号