首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
问答对的规模和质量是影响基于常问问题集问答系统性能的重要因素,目前所使用的问答对库一般是人工构建的,往往需要耗费大量的时间和人力物力.针对此问题,提出一种基于改进贝叶斯的领域问答对自动获取方法.该方法将HTML页面解析成DOM树,选择DOM树的节点信息和结构信息作为问答对的分类特征,结合受限领域知识库,利用改进贝叶斯分类模型.从HTML页面中自动获取问答对并过滤出领域问答对.实验结果表明,该方法效果显著.  相似文献   

2.
针对当前自动问答数据增强方法需要大量外部数据的问题,提出一个面向问答模型缺陷的数据增强方法.首先,在训练集上训练好问答模型、问题生成模型以及问答匹配模型;然后,获取问答模型在训练集上预测的所有答案,并选取其中预测错误的答案;再后,使用问题生成模型对这些答案生成相应问题;最后,通过问答匹配模型对生成的问答对进行过滤,保留...  相似文献   

3.
机器阅读理解是利用算法让计算机理解文章语义并回答用户提出的问题,同时可以衡量机器对自然语言理解的能力.以机器阅读理解的技术与应用场景为研究目标,完成机器阅读理解任务的定义,并概述该任务在国内外的研究现状.文章首先对当前机器阅读理解任务所采用深度学习模型进行研究,具体包括注意力机制模型、预训练模型和推理模型,从而进一步梳...  相似文献   

4.
基于FAQ(Frequent Asked Questions)问答技术构建智能客服系统,是当前业界普遍采用的技术方案.基于FAQ构建的问答系统,其返回的结果具有稳定、可靠、质量高的优点;但因受限于人工标注的知识库规模,识别能力有限,容易遇到瓶颈.为了解决FAQ数据集规模有限的问题,给出了数据层面和模型层面的解决方法:在数据层面,利用百度知道爬取相关数据并挖掘语义等价问题,保证了数据的相关性和一致性;在模型层面,提出了一种面向迁移学习的深度神经网络transAT,该模型融合了Transformer强大的特征抽取能力和注意力机制,适用于句子对之间的语义相似度计算.实验表明,该方法可以显著提升模型在FAQ问答任务中的效果,在一定程度上解决了FAQ数据集规模有限的问题.  相似文献   

5.
机器阅读理解(Machine Reading Comprehension,MRC)一直是自然语言处理(Natural Language Processing,NLP)领域的研究热点和核心问题.近期,百度开源了一款大型中文阅读理解数据集DuReader,旨在处理现实生活中的RC(Reading Comprehension)问题.该数据集包含1000k的文本、200k的问题和420k的答案,是目前最大型的中文机器阅读理解数据集,在此数据集上发布的阅读理解任务比以往更具有实际意义,也更有难度.针对该数据集的阅读理解任务,分析研究了一种结合双向注意力流与自注意力(self-attention)机制实现的神经网络模型.该模型通过双向注意力流机制来获取query-aware上下文信息表征并进行粒度分级,使用自注意力机制捕捉文本和问题句内的词语依赖关系和句法信息,再通过双向长短期记忆(Long Short-Term Memory,LSTM)网络进行语义信息聚合.实验结果最终得到相同词数百分比(BLEU-4)为44.7%,重叠单元百分比(Rouge-L)为49.1%,与人类测试平均水平较为接近,证明了该模型的有效性.  相似文献   

6.
为了更好地评价阅读理解模型的鲁棒性, 基于Dureader数据集, 通过自动抽取和人工标注的方法, 对过敏感、过稳定和泛化3个问题分别构建测试数据集。还提出基于答案抽取和掩码位置预测的多任务学习方法。实验结果表明, 所提方法能显著地提高阅读理解模型的鲁棒性, 所构建的测试集能够对模型的鲁棒性进行有效评估。  相似文献   

7.
在受限领域自动问答系统中,用户问句的语义理解是提高查询效率的关键。提出了一种基于本体的自动问答系统模型,对领域知识本体的构建进行了研究。利用本体中丰富的语义关系,对用户的问题查询请求进行语义扩展,提高问答系统的准确性。  相似文献   

8.
随着深度学习的快速发展,行人轨迹预测任务已经成为计算机视觉领域的研究热点之一,在自动驾驶、视频监控、人机交互等领域基于深度学习的行人轨迹预测方法得到了广泛应用。首先,介绍过去几年该领域的概况(特别关注基于知识学习的方法),将这些算法分成基于统计学模型的轨迹预测方法和基于知识学习的轨迹预测方法两大类,并分析每类方法的主要算法;然后,讨论行人轨迹预测任务中使用的数据集和常见的评估指标,对比基于知识学习分类的各个方法在主流数据集下的预测性能。最后,对行人轨迹预测的发展进行展望。  相似文献   

9.
抑郁症患者对自身认知的不足以及早期筛查方法的缺乏导致很多患者在治疗时就已经是重度抑郁障碍,为改善现状,本研究从抑郁症论文摘要中抽取其知识三元组,构建抑郁症知识图谱,并基于抑郁症知识图谱,开发自动问答系统.该问答系统可以将用户输入的问题进行中文分词,然后用BiLSTM+CRF模型识别问题中的医学实体,再根据模板匹配理解问题中的语义,在所建构的抑郁症知识图谱中查询到对应的答案,以自然语言的形式返回给用户.实验结果表明,基于抑郁症知识图谱的自动问答系统可以有效回答抑郁症相关的问题,具有较高的准确率和使用价值.  相似文献   

10.
大数据正在实现人类工作、生活与思维的大变革,其"威力"也强烈地冲击着整个教育系统,正在成为推动教育系统创新与变革的颠覆性力量。在大数据时代,当在线学习逐渐成为学生获取知识的主要途径之时,传统课程则起到辅助教学的效果。大数据时代会给大学教师提供创新性的专业发展机遇,广大的教师必须与时俱进,抓住机遇促进个人核心能力的提升。  相似文献   

11.
针对目前机器阅读理解任务中缺乏有效的上下文信息融合方式和丢失文本的整体信息等情况,提出基于时间卷积网络的机器阅读理解模型.首先将文本的单词转化成词向量并加入词性特征;接着通过时间卷积网络获取问题和文章的上下文表示;之后采用注意力机制来计算出问题感知的文章表示;最后由循环神经网络模拟推理过程得到多步预测结果,并用加权和的方式来综合结果得到答案.实验使用了SQuAD2.0数据集,在EM和F1值上相比基准实验分别提升了6.6%和8.1%,证明了该方法的有效性.  相似文献   

12.
现有的自然语言处理技术对学生编程题目理解不能达到很好的效果,基于深度学习优势提出一种基于联合神经网络模型的题目理解方法.通过联合模型分析编程题目语义并提取关键信息,充分理解编程题目.结果表明,联合神经网络模型在使用双向学习和机器提取特征的情况下,准确率、召回率和F1值都有更高的精确度.  相似文献   

13.
机器阅读理解是自然语言处理领域的一个重要任务,然而许多研究工作表明目前的模型在鲁棒性方面仍存在一些缺陷。文章针对机器阅读理解模型鲁棒性中的过敏感性问题和过稳定性问题,提出了一种基于数据增强的策略。首先使用回译数据增强法和传统的EDA数据增强法扩充数据,然后采用基于离群点检测的方法对扩充后的数据进行过滤,从而提高模型的鲁棒性。在DuReaderrobust数据集上的实验结果表明,本文方法可以提高模型在过敏感性和过稳定性方面的性能,F1值分别得到2.75%和1.18%的提升。  相似文献   

14.
王勇 《河南科学》2020,38(1):63-68
为了实现油井工况的自动评估与智能管理,达到防范风险的目标,基于深度学习技术建立了油井工况智能监测与风险防控方法.将实际油田数万条示功图数据整理为卷积神经网络模型的训练集,并基于该训练集,利用监督误差反向传播算法对基于卷积神经网络模型的示功图识别模型进行了训练和测试.结果表明,基于深度学习技术的示功图识别模型的准确度达到95%以上.研究成果应用于国内某油田,采油系统效率总体提升2.67%,工况合格率提升11%,防范风险成功率提高60%.研究成果为同类油田提供了一定的技术借鉴.  相似文献   

15.
智能问答系统(Question Answering System,QAS)是一种让人类通过自然语言与机器进行问答来获取信息的人机交互系统,是自然语言处理的一个集综合性与广泛性于一体的应用.现有的智能问答系统模型研究主要考虑单一型数据.然而,现实生活中结合表格和文本的混合型数据十分普遍,如金融领域的财务报表.本文对已有的财务报表智能问答模型进行改进并提出了一个新模型,该模型有更好的效果.  相似文献   

16.
基于Web的数学概念知识问答系统研究   总被引:1,自引:0,他引:1  
数学领域知识的获取和管理受到越来越多的关注。介绍了数学知识工程NKIMath中融合本体、框架与逻辑的概念知识表示方法。给出半结构化的数学知识自动获取途径。给出了基于Web的数学概念知识问答系统,研究了问答系统中查询语言的命名独立性及实现方法。  相似文献   

17.
中文分词是中文自然语言处理中的关键基础技术之一.目前,传统分词算法依赖于特征工程,而验证特征的有效性需要大量的工作.基于神经网络的深度学习算法的兴起使得模型自动学习特征成为可能.文中基于深度学习中的双向长短时记忆(BLSTM)神经网络模型对中文分词进行了研究.首先从大规模语料中学习中文字的语义向量,再将字向量应用于BLSTM模型实现分词,并在简体中文数据集(PKU、MSRA、CTB)和繁体中文数据集(HKCity U)等数据集上进行了实验.实验表明,在不依赖特征工程的情况下,基于BLSTM的中文分词方法仍可取得很好的效果.  相似文献   

18.
现有自动解题系统从试题文本及相关资源获取解题知识,但由于试题本身潜在的复杂性与多样性,所获取的知识可能不足以支持实际解题,需要进一步获取其他解题知识.本文基于三支概念分析理论,通过构造试题文本三支概念格和决策规则提取,进一步挖掘试题文本中隐含的解题知识,在所收集数据集上进行的试验结果表明,本方法有效提升了自动解题系统的...  相似文献   

19.
深度学习技术往往需要大量的标记训练样本,然而真实环境中获得大量标记样本的代价昂贵,甚至难以获得.提出一种新的深度主动识别框架,借鉴人类逐步学习并获取新知识的认知过程,在基于少量样本分析模型认知错误的基础上首先定义认知错误转化,得到相应的知识来主动增强模型的认知信息.基于认知知识,选取敏感样本对模型进行在线微调,同时为了避免遗忘先前学习的知识选取先前的训练样本作为刷新样本.在通用数据集上的实验表明,敏感样本有利于提高目标识别能力,提出的认知学习机制能有效提高深度模型的性能;认知信息的特征化能有效抑制其他样本对模型认知的干扰,在线训练方法能明显节省大量训练时间.提供了一个有效的认知学习在少量数据样本情境中的应用.  相似文献   

20.
深度学习中卷积神经网络在行为识别领域有着良好的识别效果,但是由于深度学习需要较大数据集训练模型,而现今公开数据集中危险行为识别相关方向没有大量数据集。针对危险行为识别领域样本少、无法进行深度学习训练等问题,建立了危险行为识别数据集,并采用迁移学习方法对C3D网络模型进行迁移训练。结果表明,迁移学习后C3D网络模型对危险行为识别数据集平均识别率达到了83. 2%,可以有效识别危险行为动作。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号