首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
提出了一种中文问句语义相似度计算的新方法.该方法分为两步:第一步采用基于问句句型模板规则匹配的方法提取问句语义表征;第二步根据问句语义表征计算问句语义相似度.采用该方法开发了一个面向常问问题集(FAQ)的问答系统.实验结果表明,采用该方法获得的相似度计算的准确率约为85%.  相似文献   

2.
针对汉语语句分析不能提供深层语义信息的问题,提出一个基于HNC和描述逻辑的问句语义块分析模型,利用HNC概念符号知识深入到词语的语义层面,从概念类别的内涵出发,对问句的逻辑结构进行了初步分析。采用描述逻辑推理机制得到了问句的语义视图,并实际验证了语义视图的有效性。  相似文献   

3.
本体问答系统需要实现从自然语言问句到本体查询语句的转换,目前的解决方法主要有自然语言接口和问句相似度方法。针对现有问句相似度方法在本体问答系统中应用的不足,设计了改进的相似度计算方法。通过建立常问问题的查询模式集合,综合考虑问句的统计、语义、结构特征计算目标问句的相似度,分别以自动选择和用户交互两种方式选择目标问句的查询模式,并将其转换成实际SPARQL查询语句,最终检索本体及抽取出答案。两种方式的准确率分别为83.8%和92.1%。  相似文献   

4.
语义相似度计算是自然语言处理中的一个关键过程,在机器翻译、自动问答、句法分析、词义排歧等领域都有着广泛的应用.列举并分析了几种典型的基于知网的相似度计算方法,并提出一种改进的基于知网的相似度计算方法,实验结果表明该方法是有效的.  相似文献   

5.
提出了一种基于特征融合的问句匹配框架来解决问句相似度检测方法,利用答案特征、词序特征、统计特征和语义特征相结合来解决问句相似度计算问题.在Yahoo!Answers上抽取的真实标注数据集上进行实验,实验结果表明:该方法在性能上得到了较好的结果.  相似文献   

6.
计算文本相似度常用的方法是计算以VSM表示的文本之间的夹角余弦值,但这种方法并没有考虑文本中词语之间的语义相似度.另外由于计算余弦值时要考虑VSM向量对齐,从而导致计算的高维度、高复杂性.《知网》作为一个汉语常用的知识库得到广泛的研究,利用该知识库能方便地求得汉语词语之间的相似度.利用《知网》计算每篇文本中词语之间的相似度,对VSM进行改进,用少量特征词的TF/IDF值作为改进后的VSM向量中的权重,进而计算文本之间的相似度.通过比较改进前后的VSM的维数、召回率和准确率,结果显示,改进后的算法明显降低了计算的复杂度并提高了召回率和准确率.  相似文献   

7.
问句相似度计算是FAQ问答系统的核心问题,直接关系到FAQ问答系统的准确率。对义或反义的词语有着很高的词语相似度值,如果直接用于问句相似度计算中,有可能导致相反的两个问句有着很高的相似度,因此,本文提出了一种基于词语情感的问句相似度计算方法,采用了负加权法降低相反的问句成为相似的问句的可能,实验结果验证了该方法有助于提高问句相似度计算的准确度。  相似文献   

8.
基于语义相似度的文本表示降维方法   总被引:2,自引:1,他引:1  
数据降维是文本表示中不可或缺的一个环节,有效的数据降维方法不仅能够减少计算量,同时有助于文本处理精度的提高.不同于传统的利用统计信息进行降维的方法,本文提出了一种基于词汇的语义相似度的文本表示的降维方法,该方法结合自然语言处理的知识,在降维环节考虑了特征词的语义信息和词性信息.实验结果表明:该方法能够有效地降低文本表示的维数,并在降维后的空间获得较高的文本处理精度,基于语义相似度的降维方法是一种适合文本处理的降维方法.  相似文献   

9.
在《知网2002》的基础上,充分利用其层次结构,引入了马尔科夫模型来计算词汇语义相似度,实验证明,算法取得较理想的实验结果.  相似文献   

10.
阐述了面向开放领域和受限领域中文问句处理方法的异同,讨论了在受限领域(图书信息领域)中文问句处理的思路.在当前汉语言句法分析技术尚无法达到应用级别水平的前提下,提出了基于语义块识别的中文问句浅层语义分析技术.给出了语义块的定义、规约规则以及问句向量的生成方法,最终实现对中文问句的浅层语义挖掘,以满足实际应用的需要.实验证明,该方法在语料较为稀疏时,具有良好的效果.  相似文献   

11.
提出了一种基于向量空间模型的句型识别方法,该方法通过基于句型模式的问句句法树规约,得到句子关于句型模式的句型结构,再计算句型结构与句型模式之间的相似度来实现问句的句型识别.并在汉语疑问句句型系统的基础上,通过句型识别实现了对问题的分类和问题理解.测试结果表明,该方法提高了问题理解的准确度.  相似文献   

12.
银行领域汉语自动问答系统BAQS的研究与实现   总被引:13,自引:2,他引:13  
介绍BAQS的研究背景和系统框架.探讨基于问点块和语义块识别以及句模匹配分析问句的新方法,并用向量表示整个问句语义.借鉴本体和知网思想,构建银行领域本体库和银行知网.采用预先对金融领域实用文本进行标注,依据问句向量从标注树中提取答案.并针对某银行实现汉语自动问答系统.实验表明该方法可行,对自动问答系统的设计具有借鉴意义和深入研究的价值.  相似文献   

13.
潜在语义索引在FAQ构建中的应用研究   总被引:1,自引:0,他引:1  
研究了潜在语义索引在中文自动问答系统FAQ库构建中的应用,并着重阐述了句子相似度的计算方法以及使用LSI对FAQ库去重的实验选取方法,结果显示LSI方法在一定程度上优于TF×IDF方法。  相似文献   

14.
介绍了问答系统及问句分类,重点阐述了问句的类型和问句分类的方法,最后对问句分类工作未来的发展进行了展望。  相似文献   

15.
利用选择类问题具有明确候选项的特点, 简化问题分类过程, 并针对长文本语义蕴含短文本语义的语言现象, 提出一种根据文本蕴含强度大小对候选答案进行排序的方法。在没有大规模问答对的情况下, 采用维基百科中文语料库, 以全国各省市高考地理选择题作为实验数据, 通过句子相似度和文本蕴含两种方法来解答地理选择题。实验表明, 基于文本蕴含方法的准确率为36.93%, 比基于词嵌入的句子相似度方法提高2.44%, 比基于向量空间模型的句子相似度方法提高7.66%, 验证了该文本蕴含强度计算方法的有效性。  相似文献   

16.
FAQ问答系统句子相似度计算   总被引:3,自引:0,他引:3  
句子相似度计算是FAQ问答系统的核心问题,提出一种改进的基于多重信息的方法,即结合关键词信息、句子结构信息和语义信息的句子相似度计算方法,并用实例验证了方法的可行性.  相似文献   

17.
基于支持向量机的汉语问句分类   总被引:5,自引:0,他引:5  
目前汉语问句分类一般都依据疑问词及其相关词的组合规则,但由于规则的提取很深地依赖于语言知识,而且很难穷举出所有的特征规则,因此会影响分类的效果.支持向量机(SVM)是建立在统计理论基础上的机器学习方法,对于小样本分类问题有很好的识别效果.文中分析和定义了汉语问句的类型,建立了以SVM为基础的问句分类模型,详细描述了问句分类特征的选取过程,并在句法特征的基础上引入语义特征进行汉语问句分类实验,分类准确率达88.7%,表明结合句法和语义特征以SVM进行汉语问句分类具有很好的效果.  相似文献   

18.
基于知网的语义相关度计算   总被引:24,自引:0,他引:24  
为解决句法分析中的结构性歧义,引入了语义相关度计算.基于语义相似度计算及知网的语义信息,提出了语义相关度计算方法;利用知网的义原纵向与横向关系及实例信息计算不同词性的相关度.在计算义原距离时,考虑了义原之间的解释关系,对义原的距离进行修正.根据相似度的对称性,计算实例的影响因素提高了相关度的准确率.实验结果表明,使用该计算方法得出的语义相关度结果更加合理.  相似文献   

19.
特定领域的FAQ问答系统通常存在以下3个问题:(1)如何有效地对句子进行语义表示;(2)如何有效地进行句子间的语义匹配;(3)领域词汇的分词问题。为解决上述3个问题,提出一种基于Tri-BiLSTM-CNN的深度学习模型。首先,将双向长短期记忆网络和卷积神经网络结合构建网络模型,综合利用了BiLSTM处理序列化数据的优势和CNN捕获局部特征的优势。然后,采用Triplet并列式排列结构进行句子之间的匹配。最后,使用字向量替代词向量,避免了分词错误对模型的影响。在钻井安全领域的真实数据集上进行实验验证,结果表明,Tri-BiLSTM-CNN模型能更好地对句子语义进行向量化表征,显著提升句子相似度计算的准确率,而且效果明显优于CNN和LSTM两种网络结构。将该模型用于钻井安全领域的FAQ问答系统中,有效减少了人工成本,对改善钻井工作的效率和质量具有重要意义和应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号