首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出了一种基于特征融合的问句匹配框架来解决问句相似度检测方法,利用答案特征、词序特征、统计特征和语义特征相结合来解决问句相似度计算问题.在Yahoo!Answers上抽取的真实标注数据集上进行实验,实验结果表明:该方法在性能上得到了较好的结果.  相似文献   

2.
结构化自动问答系统采用传统方法缺少对词汇、词序和结构的划分,导致语句相似度较低,为了解决该问题,提出了基于Web语义的混合问句相似度计算方法。根据结构化自动问答系统结构,设计系统语句分析模型,通过正向匹配方法,对模型专业词库中的用户输入自然语句进行分词处理,并对字符串之间的关系展开分析。采用非恒定相似度系数来描述2个字符串的相似情况,并由此分析词形、词序和结构相似度,完成不同语句相似度的计算。通过实验对比可知,文章提出的基于Web语义的混合问句相似度计算方法最高计算精准度可达到96%,可提升自动问答系统的整体性能。  相似文献   

3.
基于传统向量空间模型的问答系统在向量维数较大时所需的时间开销较大。为了尽可能地减少所需时间,利用数据库SQL语句及视图来统计词在句子中出现的频率和词对句子的分辨能力。实验结果表明,随着向量维数的增大,该方法在时间开销上优于传统的处理方法。  相似文献   

4.
针对社区问答系统问句相似度计算问题,提出了一种改进的TFIDF算法.按照用户的查询意图对问句进行分类,根据特征词在类别中的分布对权值进行调整;将问句的主题词归入特征项进行TFIDF计算.实验结果表明,本文改进的TFIDF算法的P@3比传统的TFIDF算法提高了7.66%,比TFIDF-IG算法提高了5.31%,而且P@5和P@10也有不同程度的提高,与传统TFIDF算法和参考改进算法相比,该算法明显提高了检索性能.   相似文献   

5.
随着互联网的迅速发展和Web2.0概念的提出,问答系统以直接返回给用户精确的答案而逐渐成为一种新的信息检索技术.由于问句都是自然语言的形式,涉及到对问句的语义理解及相似度的判断.本文提出了一种基于问句的表层和语义相似度计算方法,通过聚类去除冗余信息,再通过熵的特征计算权值,最后融合多种特征计算问句相似度,进行答案抽取....  相似文献   

6.
面向中文问答系统的问句句法分析   总被引:3,自引:0,他引:3  
中文句法分析是汉语研究和信息处理中的一个关键环节,同时也是难点之一.探 讨了中文问句的结构特征,在面向中文问答系统的问句句法分析算法中,运用语料库句法处理技术,并对问句长度短、含疑问词、有疑问结构句式等特点加以利用,初步实验结果达到了预期目标.  相似文献   

7.
8.
近年来,社区问答服务系统(CQA)越来越受到人们的欢迎,但随着提问规模的膨胀,获得回答的问题比重逐步降低,且答案质量无法得到保障.为了提高问答系统中问题被解答的概率,并提升答案可信度,文中提出了基于社交关系相似度的社交问答系统(SQA),主动寻找与提问者社交关系紧密且能够回答问题的用户,并提出了针对提问者与最佳回答者的推荐方法.实验结果表明,在主观性强或实时性强等问题集上,文中方法能更快地得到让提问者满意的答案.  相似文献   

9.
句子相似度计算是自然语言处理领域中比较重要的研究课题,有着非常广泛的应用,直接决定某些领域的发展。本文介绍了中文句子相似度计算存在的特点和难点,分析了当前常用的中文句子相似度计算方法的优点以及存在的问题。  相似文献   

10.
在搜索引擎中对用户问题直接给出简要的答案(即答案摘要)可以帮助用户更快捷的获取信息。针对这一任务,设计一种基于特征的答案摘要抽取方法。为了进行句子相似性的计算,提出通过使用卷积神经网络表示句子语义和计算相似性,同时给出基于最大间隔学习的网络训练方法。在百度知道问答语料上的实验结果表明,所提出的答案摘要抽取方法能够生成质量良好的简短回答。与基于词袋的相似性计算相比,使用卷积神经网络能够更好地描述句子语义,计算问题和句子之间的相似性,有效地改善答案摘要的质量。  相似文献   

11.
针对问答社区中问题主题类别划分的粗糙性,应用粒子群优化算法,引入问答社区种子和问答社区主题的概念,首先挖掘问答社区中存在的显性联系,构建基本问答社区结构,然后,深入分析问答社区内容,根据问题节点之间的隐性特征,定义问答社区主题,精分细化问答社区主题类别,直到结构稳定.实验结果表明,该算法能加速问题节点的收敛,极大地提高了问答社区主题挖掘精度.  相似文献   

12.
黄玉  陈军 《山东科学》2009,22(4):59-63,85
基于社区的问答是近几年出现并流行的一种有效的信息搜寻网络应用.本文测试了百度知道、搜搜问问、雅虎知识堂、爱问知识人等四个基于社区的问答站点搜索引擎检索结果重合情况和差异情况,以期对问答内容搜索有所助益.实验结果表明这四个站点搜索引擎返回结果第1页的的重合率为0.16%,独有率平均为93.76%,仅使用其中1个搜索引擎,漏检率平均为74.17%.  相似文献   

13.
本体问答系统需要实现从自然语言问句到本体查询语句的转换,目前的解决方法主要有自然语言接口和问句相似度方法。针对现有问句相似度方法在本体问答系统中应用的不足,设计了改进的相似度计算方法。通过建立常问问题的查询模式集合,综合考虑问句的统计、语义、结构特征计算目标问句的相似度,分别以自动选择和用户交互两种方式选择目标问句的查询模式,并将其转换成实际SPARQL查询语句,最终检索本体及抽取出答案。两种方式的准确率分别为83.8%和92.1%。  相似文献   

14.
中文问答系统的研究   总被引:1,自引:0,他引:1  
介绍了有关中文问答系统的一些研究.问答系统是集知识表示、信息检索、自然语言处理技术于一体的难度很高的研究课题,本文从问题处理、检索系统、答案抽取三个方面进行了详细说明.  相似文献   

15.
特定领域的FAQ问答系统通常存在以下3个问题:(1)如何有效地对句子进行语义表示;(2)如何有效地进行句子间的语义匹配;(3)领域词汇的分词问题。为解决上述3个问题,提出一种基于Tri-BiLSTM-CNN的深度学习模型。首先,将双向长短期记忆网络和卷积神经网络结合构建网络模型,综合利用了BiLSTM处理序列化数据的优势和CNN捕获局部特征的优势。然后,采用Triplet并列式排列结构进行句子之间的匹配。最后,使用字向量替代词向量,避免了分词错误对模型的影响。在钻井安全领域的真实数据集上进行实验验证,结果表明,Tri-BiLSTM-CNN模型能更好地对句子语义进行向量化表征,显著提升句子相似度计算的准确率,而且效果明显优于CNN和LSTM两种网络结构。将该模型用于钻井安全领域的FAQ问答系统中,有效减少了人工成本,对改善钻井工作的效率和质量具有重要意义和应用价值。  相似文献   

16.
介绍了有关中文问答系统的一些研究.问答系统是集知识表示、信息检索、自然语言处理技术于一体的难度很高的研究课题.本文从问题处理、检索系统、答案抽取三个方面进行了详细说明.  相似文献   

17.
语义相似计算驱动领域自动问答   总被引:3,自引:0,他引:3  
研究实体相似性的认知心理特征和受限领域自动问答(QA)系统的形式特点.基于结构对齐和几何相似模型,把词语概念描述分解为属性部分和语义角色部分,各部分结构分别对齐后,计算对齐义原的关系距离,加权组合计算词语的相似度.该方法也适用于解析成语义向量表示的疑问句的相似度计算.融合通用本体、领域本体和领域知识文本,构造了支持语义计算求解某一银行QA问题的知识库.实验表明,该方法可以提高领域QA系统的用户满意度.  相似文献   

18.
王慧慧 《科技信息》2007,(29):94-95
中文自动问答系统是集知识表示、信息检索、自然语言处理技术于一体的研究课题。从问题处理、信息检索、答案抽取三个方面进行详细说明,同时分析了段落权重以及句子语义相似度的计算方法,在答案抽取阶段还阐述了利用话语结构树提取摘要信息的方法。  相似文献   

19.
问句相似度计算是FAQ问答系统的核心问题,直接关系到FAQ问答系统的准确率。对义或反义的词语有着很高的词语相似度值,如果直接用于问句相似度计算中,有可能导致相反的两个问句有着很高的相似度,因此,本文提出了一种基于词语情感的问句相似度计算方法,采用了负加权法降低相反的问句成为相似的问句的可能,实验结果验证了该方法有助于提高问句相似度计算的准确度。  相似文献   

20.
海川化工论坛是化工领域最具权威性的问答及社交网站,但随着问答社区规模的增大,用户专业水平差异明显,导致问题回答质量参差不齐,提问者对答案筛选辨别难度大大增加.通过分析海川化工论坛问答相关数据,从答案的文本特征和基于网络表示学习的用户特征两个方面构建答案特征.利用因子分解机(F M)算法构建了答案质量预测模型.实验结果表...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号