首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 78 毫秒
1.
基于中文WordNet的中英文词语相似度计算   总被引:3,自引:0,他引:3  
介绍一种基于中文WordNet的中英文词语相似度计算方法.在WordNet同义词集的上下位关系图中,引入了距离、密度、深度3个因素来估计同义词集之间的相似度,采用一个自适应的方案来解决候选同义词集组合的权重和取舍问题.实现了一个可以计算英-英、汉-英、汉-汉词语之间相似度的算法,所得结果比较符合人们对词语的理解.  相似文献   

2.
申丽平 《科技信息》2009,(14):219-220
在信息检索研究领域中,词的不匹配现象是一个日益严重的问题。正因为如此,解决词的不匹配现象已成为信息检索研究的重要课题之一。对查询进行有利于检索的扩展(query expansion),可以有效地解决大部分词的不匹配现象,达到提高信息检索效果的目的。WordNet是一个在线的词汇参照系统,它的独特之处在于它是依据词义而不是依据词形来组织词汇信息。  相似文献   

3.
4.
一种基于义原重合度的词语相似度计算   总被引:1,自引:0,他引:1  
通过分析知网中的义原关系,认为在同一棵树中两个相等距离的义原,公共节点对相似度大小起着决定性作用;距离根节点越远,分类越细致,描述的信息越详细;它们的相似度也就越大.提出了一种基于知网的相似度的计算方法,定义了知网义原间的相似度公式.实验表明,利用本文方法计算词语相似度,所得结果在一定程度上更加与人的直观相符.  相似文献   

5.
基于动态特征词的中文句子相似度计算   总被引:2,自引:0,他引:2  
目的针对当前常用的汉语句子相似度计算方法存在的问题,结合语言习得特点,提出了一种基于动态特征词的中文句子相似度计算方法。方法首先以特征词作为语块切分边界,提取左右语块信息,采用语义向量空间模型;然后计算2个句子对应的左右组块的相似度;最终将各组块的相似度量值加权求和作为2个句子的相似度。结果实验表明,提出的方法计算结果较为理想,与人工判断的相似度较为一致。结论基于动态特征词的中文句子相似度计算方法在常用句式中具有更好的效果。  相似文献   

6.
基于本体的关系数据库关键词语义查询扩展方法   总被引:2,自引:0,他引:2  
目前关系数据库关键词查询技术主要利用关键词的语法匹配,而没有利用数据之间的语义关系进行匹配,导致查询效果往往都不太令人满意。为了改善查询效果,结合本体概念,提出了基于本体的关系数据库关键词查询的语义查询扩展方法,把用户提交的查询关键词扩展为基于本体的语义关键词。实例分析表明,扩展后的语义关键词尽可能符合用户的真实意愿。  相似文献   

7.
针对基于关键词匹配的搜索引擎存在的问题,提出一种基于语义词典的局部查询扩展方法,首先利用共现分析法和语义相似度选取扩展词,再对原始查询词和扩展词加权,最后计算文档相似度从而获得排序后的扩展查询结果.该方法克服了其它局部扩展方法将大量无关词加入查询的问题.实验表明,该方法有效地提高了查询结果的查准率.  相似文献   

8.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

9.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一.鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1.….K wk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法.这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足.  相似文献   

10.
语义相似度计算是自然语言处理中的一个关键过程,在机器翻译、自动问答、句法分析、词义排歧等领域都有着广泛的应用.列举并分析了几种典型的基于知网的相似度计算方法,并提出一种改进的基于知网的相似度计算方法,实验结果表明该方法是有效的.  相似文献   

11.
基于智能聚类的相关度内容检索方法   总被引:3,自引:0,他引:3  
为了提高内容检索的相关度与检索效率,基于信息系统理论与自组织神经网络理论,提出基于智能聚类的相关度检索方法,并设计了检索算法.经过训练的自组织神经网络通过对查询需求进行聚类,使得内容的检索只在与查询需求同类的文本内容中进行,提高了检索效率,并通过在同一个向量空间对查询向量与文本内容的语义向量进行相似度衡量,为用户选择更相关的内容提供依据.设计开发了基于智能聚类的内容检索试验平台,验证了该方法的有效性.  相似文献   

12.
分析了当前GO语义相似性的几种常用度量方法,提出了一种基于语义子图计算GO术语语义相似性的新方法,并以GO图的一小部分为例,进行了算法研究,使语义相似性度量更加精确.  相似文献   

13.
基于文本内容分析的过滤技术研究   总被引:7,自引:1,他引:7  
提出一种基于特征词和局部语义分析的文本分类与过滤方法,在基于特征词统计特性分析的基础上,将特征词的知识属性和局部语法匹配引入信息过滤模型,实验结果表明,这种方法对于某些领域的文本信息可以有效地进行识别和过滤.  相似文献   

14.
一种改进的基于Web的新闻视频内容语义分析方法   总被引:1,自引:0,他引:1  
视频内容安全分析是多媒体内容安全的重要研究领域和热点问题.该文针对视频ASR识别精度不高的问题,提出一种改进的基于Web的新闻视频内容语义分析方法.该方法根据脚本在语音上的相似性来优化语义关键词,然后利用Web获得较为准确的新闻视频内容语义.通过对TRECVID2005内中文新闻视频CCTV4-NEWS进行的实验表明,提出的方法是可行的.  相似文献   

15.
文章选用教材义特征向量作为信息抽取的基础,并用神经网络方法对语料进行训练学习并自动获取模板语义特征向量,最后结合目标模板抽取出所需信息.这种方法避开语法分析,具有较细的处理粒度,对语义元素搭配形式相对规范的领域具有一定的普遍适用性.实验结果表明,基于中文框架语义的信息抽取方法具有相对较高的准确率.  相似文献   

16.
从蛋白质的氨基酸组成出发,用信息聚类方法给出了蛋白质的聚类树状图,发现树状图的分支与蛋白质二级结构的含量有较强的相关性.  相似文献   

17.
基于关键字和基于内容的图像检索是图像检索系统中的两种重要方法.而当今,图像检索系统重点强调在图像检索过程中,高层语义与低层视觉特征的结合.最近,一些研究者在检索周期中采用用户互交,使用上述方法和半自动图像检索的结合,取得了一些成果,但没有自学习的动态语义功能,检索效率不高.论文给出的方法是基于一个分层的语义网络,在图像检索领域能够响应不能的需求,并且根据用户的反馈,执行一个新的动态学习检索过程,可以明显的提高图像检索效率.  相似文献   

18.
提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集RB数据实验结果表明,该方法在计算语义相似度问题上有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号