首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 468 毫秒
1.
为了解决现有句子相似度算法未考虑句子语义信息的问题,提出了一种基于词法、句法和语义的句子相似度计算方法.将句子相似度分为词法层、句法层、语义层3个层次.在词法层,通过构建句子的词汇相似度矩阵和数字序列相似度矩阵来计算词法相似度;在句法层,使用概念词汇转化成的RDF三元组相似度来计算句法相似度;在语义层,基于本体树状结构中最短路径表示的语义距离来计算语义相似度.然后,提出句子语义相似度计算模型,采集图书领域句子对作为测试集,构建图书领域本体作为知识源.实验结果表明,所提方法具有更高的准确率和召回率,其F-度量值达0.649 9,与余弦相似度算法、基于编辑距离的算法和基于TF-IDF的算法相比分别提高约12%、17%和16%.  相似文献   

2.
信息检索模块是自动问答系统中的主要组成部分.实现问题检索的关键问题是句子相似度计算问题.提出的基于特定领域的加权语义相似度算法,首先计算FAQ库中某问句关键词的权重,再利用语义相似度方法,分别计算目标问句各分词与FAQ库问句关键词的相似度矩阵,最后求得2个句子的最终相似度.逐一计算和比较目标问句与FAQ中每个问句的相似度,在大于一定阈值时,最大相似度所对应问句答案输出给用户.由于考虑词语语义和权重2方面信息,实验表明其具有较好的匹配效果.  相似文献   

3.
分析了当前GO语义相似性的几种常用度量方法,提出了一种基于语义子图计算GO术语语义相似性的新方法,并以GO图的一小部分为例,进行了算法研究,使语义相似性度量更加精确.  相似文献   

4.
针对在文本分类和信息检索中,由于句子之间的同义、近义引起的信息冗余、计算复杂等问题,给出句子语义相似度计算模型.从词和词组语义相似出发,对句子进行语法分析,结果表明,句子的语法与语义是不可分割的,不能完全孤立语法去研究语义,要综合考虑.  相似文献   

5.
句子的语义是一个系统,组成句义系统的语义单位可以从小到大划分为义征、义词、义组和义句.义征规定着义词之间组合的可能性以及组合后的语义关系;义词是语义结构的最小单位;义词和义词之间通过义征匹配关系组成义组;义句是以句子的形式负载一个完整信息的语义单位,是句子语义结构的最大单位.  相似文献   

6.
语义相似度计算广泛应用于自然语言处理中,但现有语义相似度计算方法没有充分挖掘本体结构中概念间的关系.笔者针对当前概念相似度计算的片面性和不完善性等不足,提出一种计算概念间语义相似度和相关度的混合方法.从有向边包含的特征属性对语义距离进行扩展,结合概念深度,将语义距离转换成语义相似度,通过引入概念间相关度计算,使最终概念语义相似度计算更加精确.并将该方法与人的主观判断结果进行比较,验证了该方法的可行性和有效性.  相似文献   

7.
为弥补传统的基于文本相似函数(如编辑距离、语音距离等)的方法在重复记录的识别方面的不足,对记录内部单个字段的语义以及字段之间的语义进行了研究;采用字段名与统计分析相结合的方法来识别字段内部的语义,采用语义规则库来识别字段之间的层次语义和依赖关系;将语义引入到优先队列算法中,提出了改进的优先队列法(IPQM),在计算记录之间的相似度时,显式考虑字段之间的层次语义关系,对不同的字段类型调用不同的相似度计算方法.同时将语义规则库引入到数据清理框架,在预处理阶段利用语义来处理等价类型错误,在处理阶段利用IPQM来计算记录之间的相似度.实验结果表明该框架提高了数据清理的质量,遗漏率低于7%,误判率不超过3%.  相似文献   

8.
进行GO(gene ontology)语义相似性度量是解决生物学数据集成中语义异构问题的重要方法. 传统方法主要是基于距离的度量和基于信息量的度量.文中提出了一种基于语义路径覆盖的度量方法,并实现了其中Combine算法.该算法首先计算出每个节点的信息量,然后分别计算两个节点的语义路径的交的节点信息量之和以及这两个节点语义路径的并的节点信息量之和,将这两者之间的比率作为相似性度量值.实验结果表明该算法具有较高的相关系数.  相似文献   

9.
针对目前基于语义的服务匹配系统中的匹配方法存在对同一等级概念区别不清的问题,采用Web Services和语义Web技术,提出了一个基于UDDI和OWL-S的服务匹配模型,即对传统服务匹配模型的UDDI中引入语义化服务描述和基于数值计算的语义匹配功能.并综合利用基于几何距离和基于信息容量两种语义相似度算法的优点,设计了一种综合语义匹配算法,最后通过实验验证了该方法的优越性.  相似文献   

10.
基于词联接的语义分析原理及其算法   总被引:2,自引:0,他引:2  
现有自然语言处理方法主要采取自下而上的由词到句、由句到篇的语言分析过程,而且语义分析能力有限,因此难以对大规模真实文本进行语义处理.笔者提出了一种基于词联接的语义分析方法.该方法以词联接的语义知识为基础,采取整句切入、先下后上的语义分析过程,核心算法是句子最优树搜索和词联接语义符合度计算.目前该方法已应用于国家自然科学基金资助的计算机辅助诗词创作研究项目.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号