首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 234 毫秒
1.
针对高校校园这一应用领域,设计并实现了一种基于多层策略的校园问答系统.提出了校园知识的3种类型,即服务型知识、常见问题型知识及文本检索型知识.针对不同类型的知识,建立了特定服务查询、常见问题查询和自由文本检索多级策略的问答系统模型,逐级匹配查询问句的答案:特定服务查询通过模式匹配将问句转换为服务接口;常见问题查询通过特征关键词提取、问题分类和问句相似度计算算法将问句与常见问题库中的问题-答案对匹配;自由文本检索对全文检索引擎solr返回的候选文档进行答案抽取,获取答案段落.性能测试表明:对80%以上的查询问句,若问题相关知识存在于系统中,则系统都能给出满意的答案.  相似文献   

2.
王慧慧 《科技信息》2007,(29):94-95
中文自动问答系统是集知识表示、信息检索、自然语言处理技术于一体的研究课题。从问题处理、信息检索、答案抽取三个方面进行详细说明,同时分析了段落权重以及句子语义相似度的计算方法,在答案抽取阶段还阐述了利用话语结构树提取摘要信息的方法。  相似文献   

3.
基于概念和统计的问答系统实现机制   总被引:2,自引:0,他引:2  
问答系统与搜索引擎相比答案精练准确、“噪音”较少.为此给出了基于概念和统计的问答系统实现机制.首先确定焦点类型和答案类型,对于不同类型的焦点实行分级概念扩充;以段落为基本单元,利用潜在语义分析技术获取相关文本段落;给出了问题与句子的匹配算法和基于问题相似度的答案抽取算法,通过对语料进行潜在语义索引和增加FAQ反馈,不断增强系统的回答能力.依此研制的大学概况问答系统获得了较好的效果.  相似文献   

4.
依照所回答的问题类型区分,图像和文本的视觉问答大体分为2类,第1类是可以从图像中直接获取答案的问题,第2类是需借助外部知识获取答案的问题。目前的视觉问答方法只能在一类问题上具有较高的准确率,回答另一类问题的技术尚不成熟。为了扩大可回答的问题类型,设计了一种知识图谱辅助下的视觉问答方法——K-VQA。在基于深度学习VQA的基础上,通过查询知识图谱区分问题类型,对不同类型的问题采用最合适的方法进行回答,对于需借助外部知识进行回答的问题,利用图像和问题中的信息判断回答问题所需的实体和属性,抽取知识图谱中的三元组,获取问题答案。结果表明,不同的视觉问答技术适用于不同类型的问题,K-VQA方法既能回答简单问题也能回答推理性问题,准确率高达56.67%。因此,作为知识图谱辅助下的视觉问答方法,K-VQA可以回答更多类型的问题并获得较高的准确率,对于深入研究VQA和VQA方法具有重要的参考价值。  相似文献   

5.
将语义信息引入闭域问答系统的研究,并通过实验来验证其对闭域问答系统性能的改善.主要方法是寻找一个领域特征词集来描述候选答案集与问题间的相关度.  相似文献   

6.
阅读理解系统作为开发、评估和比较自然语言问答方法的可控测试平台,引起了自然语言领域越来越多学者的关注,设计并实现了一个中文的阅读理解系统,着重分析了问题分析、答案定位和答案提取等关键技术;并根据不同的问题类型,设计了不同的答案提取策略.实验表明,系统的性能比基准测试方法提高了近5个%.  相似文献   

7.
提出一种基于模式匹配与命名实体识别相结合的领域答案抽取方法,该方法用答案模式串、答案模式权值和答案类型三要素来定义并构建答案模式库,结合旅游领域命名实体识别方法和模式匹配方法,实现了旅游领域实体答案的抽取.在旅游领域进行实体答案抽取实验,取得了较好的效果,其中召回率达88.78%,准确率达86.04%.  相似文献   

8.
自动问答系统综合应用各种自然语言处理技术,允许用户以自然语言的形式提问,返回给用户明确的答案。本文针对限定领域内的定义类问题回答进行了一定研究,引入MIRA算法对答案进行排序。在对候选答案句子进行排序时比较了SVM方法和MIRA(Margin Infused Relaxed Algorithm)算法,MIRA算法成绩较好。本文在MIRA算法的基础上提出了BA-MIRA算法。BA-MIRA算法具有较好的泛化能力。  相似文献   

9.
针对传统问答系统答案抽取方式对答案片段的分词和上下文语义理解准确性的依赖严重,抽取过程耗费大量的人力和时间的问题,提出采用分步抽取答案的方法,先从答案片段中抽取包含答案的句子,再从提取的答案句中进行最终答案的抽取方式。在答案句抽取过程中使用Bi-LSTM( Bi-directional Long Short-Term Memory)和Max Pooling 结合的方法构建答案句抽取模型。实验结果表明,在答案句的抽取中,该模型的MRR( Mean Average Precision) 指数接近0. 75。  相似文献   

10.
针对经典的文本匹配模型在问答系统中应用的缺陷和不足,提出了一种基于增强问题重要性表示网络BIWN的答案选择算法.目前,现有的答案选择模型普遍将问题句子和答案句子直接进行匹配,忽略了问题句子和答案句子中的噪声词对匹配的影响.针对这个问题,首先,利用自注意力机制修改问题句子中各个词的权重,生成“干净”的问题句子向量;然后,利用词级交互矩阵捕捉问题句子和答案句子之间的细粒度语义信息,从而有效地弱化了噪声词对正确答案的影响;最后,利用多窗口CNN提取特征信息得到预测结果.基准数据集上的对比实验表明,BIWN模型在答案选择任务的性能优于主流的答案选择算法,MAP值和MRR值提升了约0.7%~6.1%.  相似文献   

11.
面向财税领域非事实型问题, 提出基于语义检索的方法来抽取答案。首先使用领域知识库对问题及领域文档进行语义标注, 引入语义相似度特征提高法规及案例的检索准确率; 其次使用排序学习算法融合领域文本的多种特征对法规检索结果优化; 最后使用法规特征对案例检索结果进行筛选, 并从相似案例中抽取相应答案。在真实数据集上的测试结果表明, 该方法在准确率和效率上比基准方法有显著提升。  相似文献   

12.
鉴于问题分类是问题分析的主要任务,提出一种结合本体和焦点的问题分类方法.首先依存分析和语义角色标注对问题进行浅层语义分析,再根据预定义的问题焦点结构和焦点抽取规则,获取问题焦点语义表征;然后标示问题的类别为问题焦点中疑问对象在领域本体中的标识;最后,根据焦点不同则问题不同这一事实,将焦点相同的问题归为一类,从而实现问题分类.使用该方法对计算机故障诊断领域1 905个特指问题分类,取得了93.91%的准确率,验证了领域本体和焦点对问题分类方法的有效性.  相似文献   

13.
基于互动问答社区问句中多字词表达和问句理解的关系,提出针对互动问答社区问句进行多字词表达抽取,并基于互动问答社区问句中多字词表达的特点,提出适用于互动问答社区的多字词表达提取方法.该方法在利用互信息和停用词表的方法从问句中抽取候选多字词表达的基础上,将候选多字词表达分为正确串、残缺串、冗余串和错误串4类,借助搜索引擎对查询串的优化和候选多字词表达在互联网上的检索结果,设计候选多字词表达校正方法,实现对多字词表达的提取.以新浪爱问知识人问题库中的问句进行实验,结果表明,多字词表达抽取的准确率、召回率和F值分别达到84%,52%和0.64,验证了该方法的有效性.  相似文献   

14.
刘继明  孙成  袁野 《科学技术与工程》2021,21(18):7635-7641
为进一步提高客户语音问句实体信息抽取的准确性,增强智能问答系统知识图谱中信息抽取技术的整体效果,首先对语义标注进行优化,随后在BiLSTM-CRF(bidirectional long short-term memory conditional random filed)基础上加入BERT(bidi-rectional encoder representation from transformers)模型对句子进行实体抽取学习.在具体实验中,以语音问句事件文本为数据来源,对其进行语义标注和实体抽取实验.结果 表明,在语义标注优化的基础上同时加入BERT改进模型,信息抽取结果均高于BiLSTM-CRF方法,且改进模型的调和平均值达到91.53%,即可为增强事件实体信息抽取提供实践意义.  相似文献   

15.
就汉语语言的特点,对中文口语自动问答系统中用户问句的处理方法作了系统的分析.提出了口语问句规范化处理的方法,使得系统能够对口语表达形式多样(甚至病句),但语义相同的问句可以采用相同的分析算法.同时此法所得出的规范化问句将反馈给用户,用于用户确认,实现了人机交互.规范化问句通过主题词的方法,确定搜索的知识源,明确和缩小了搜索范围,减少了对无用信息的搜索.  相似文献   

16.
基于多级检索的自动问答系统研究   总被引:1,自引:0,他引:1  
问答系统通过采用自然语言处理技术,用简洁准确的语言回答用户用自然语言提出的问题。文中设计并实现了一种基于本地知识库和网络检索的中文问答系统,利用知识共享平台构建大规模的真实用户问题知识库,通过对知识库和网络资源的多级检索,使用句法分析和实体识别对答案进行抽取,有效提高了问答系统的响应速度和准确率。  相似文献   

17.
中文问答系统的研究   总被引:1,自引:0,他引:1  
介绍了有关中文问答系统的一些研究.问答系统是集知识表示、信息检索、自然语言处理技术于一体的难度很高的研究课题,本文从问题处理、检索系统、答案抽取三个方面进行了详细说明.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号