首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
对话系统效果主要取决于自然语言理解与对话管理组件的表现。在构建特定领域的对话系统时,标注数据和语料不足、面临多轮对话中不合作对话的干扰,而且很难将一个构建完的系统扩展到新的领域。在少量特定领域样本的基础上,将来自机器翻译模型的双向编码表征预训练模型应用到意图识别模块,在对话管理组件提出了基于神经图灵机的循环嵌入对话策略,使系统具备了更强的特征抽取能力,并初步具备了跨任务对话能力。该对话策略通过神经图灵机对历史对话和系统行为给予了特别关注,在用户和系统记忆中使用了不同的注意力机制,有效地学习了对话状态与系统行为的向量嵌入。实验结果表明,在样本不足的垂直领域对话测试中更好地完成了意图识别与槽位填充,基本避免不合作对话导致的对话状态错乱,同时能够将学到的对话控制策略迁移到另一领域。  相似文献   

2.
由于论辩挖掘任务的复杂性,其往往需要大规模的相关语料进行训练;但当前的研究工作大多是针对单一领域数据进行建模求解,在数据较为匮乏的新兴领域中,论辩挖掘任务难以开展。因此,提出了一种面向低资源场景的多任务学习的论辩挖掘方法。该方法首先通过卷积神经网络(CNN)和高速神经网络(Highway)对原文本的字符信息进行编码,获得多个数据集在词级的共享信息表示,然后由双向的有序神经元-长短时记忆循环神经网络(Bi-ON-LSTM)进一步处理词级信息和任务相关特征的联合表示,挖掘文本中潜藏的层级结构信息。最后使用条件随机场(CRF)对模型进行求解得到最终的序列标注结果。该文实验采用德国UKP实验室的学生论文数据集、维基百科文章等六个数据集进行相关的对比实验。实验结果表明,该文提出的方法在宏观F1值上较基准模型有1%-2%的提升,有效地提升模型的整体性能。  相似文献   

3.
对话推荐技术旨在通过与用户的对话交互完成高质量的信息推荐.针对已有研究存在的对话目标预测准确性不高的问题,提出一种利用对话模型引导的对话生成推荐(dialogue guided recommendation of dialogue generation, DGRDG)模型.首先,利用对话模型生成对话目标,通过经典的Seq2Seq模型融合输入的对话历史、用户画像以及知识信息来生成对话目标;其次,提出目标重规划策略(goal replan policy, GRP)来修正生成的对话目标,以提高对话目标预测的准确率.在DuRecDial数据集上进行实验的结果表明,对话目标生成模块在引入目标重规划策略后,对话目标预测的准确率提高了3.93%;总体模型在BLEU,DISTINCT,F1以及人工评价指标上具有较好的效果.  相似文献   

4.
针对单一领域数据进行建模求解时,在数据较为匮乏的新兴领域中论辩挖掘任务难以开展的问题,提出一种面向低资源场景的多任务学习的论辩挖掘方法.该方法首先通过卷积神经网络和高速神经网络对原文本的字符信息进行编码,获得多个数据集在词级的共享信息表示;然后由有序神经元-长短时记忆循环神经网络进一步处理词级信息和任务相关特征的联合表示,挖掘文本中潜藏的层级结构信息;最后使用条件随机场进行求解.采用德国UKP实验室的六个数据集进行相关的对比实验.实验结果表明,所提出的方法在宏观F1值上较基准模型有1%~2%的提升,有效地提升模型的整体性能.  相似文献   

5.
随着人工智能技术的快速发展,任务型对话系统成为了人机交互领域的热点研究方向。管道式方法是其一种经典的设计框架,在任务型对话系统的研究和应用中扮演着重要角色。本文对管道式任务型对话系统的研究进展进行了综述,并重点探讨了其在医疗领域的应用。首先介绍管道式对话系统各模块的基本原理、评价指标以及常用的数据集。然后,梳理了近年来深度学习技术在管道式对话系统研究中取得的重要进展,并进一步归纳了所用模型的优缺点。接着,重点关注了管道式对话系统在医疗领域的应用,并讨论了医疗对话系统的需求和挑战。最后,对全文进行总结并展望了未来的研究方向和发展趋势。  相似文献   

6.
考虑到句法结构与语义结构之间的紧密联系, 尝试将句法信息融入UCCA语义分析模型中来增强语义分析的性能。基于目前性能最好的基于图的 UCCA语义分析模型, 提出并比较4种不同的融入依存句法信息的方法。采用SemEval-2019国际评测语义分析任务的英文数据集进行实验, 在本领域和跨领域两个数据集上的结果均表明, 句法增强的方法能够给显著地提高UCCA分析性能。引入BERT特征后, 句法信息仍然可以提供一定的帮助。  相似文献   

7.
针对基于贝叶斯滤波器模型的目标跟踪算法非常依赖先验知识,在复杂场景中跟踪性能下降的问题,提出了一种神经过程和运动模型混合驱动的机动目标跟踪算法。利用神经网络构建一个目标运动的随机微分方程来提高对目标运动的建模能力;使用加速度模型作为领域知识约束目标状态的微分方程,构造一个混合驱动的解码器;利用所构成的混合驱动解码器替换神经过程的解码模块,形成一种无监督学习的混合驱动滤波器。仿真实验结果表明:所提算法同时具有数据驱动和模型驱动算法的优势,依赖先验知识少,能在不同场景下保持稳定的跟踪精度,生成的轨迹较神经过程滤波器更加平滑且具有目标动力学特征;与经典的贝叶斯滤波器相比,所提算法的状态估计峰值误差平均降低了20%。  相似文献   

8.
针对现有大部分车辆检测与跟踪数据集通常存在的采集场景单一、数据集长尾分布以及图像采集环境简单等问题,本文构建一个车辆数据集VeDT-MSS,用于城市以及乡村监控场景下4种车辆类别(小汽车、卡车、公交车和摩托车)的检测以及跟踪研究。该数据集具有交通场景多样化、卡车的类内多样性大、摩托车标注实例占比高以及背景复杂程度高4个显著特性。为了验证该数据集的有效性,在目标检测以及多目标跟踪任务上进行了大量的基线实验。实验结果表明,VeDT-MSS数据集在评估现有算法的鲁棒性和泛化性方面具有实用性。该数据集的提出对促进车辆检测与跟踪研究具有相当的潜力,并为计算机视觉社区评估算法性能提供一个新的数据选择。  相似文献   

9.
用于文本情感分析的深度学习模型如递归神经网络等参数较多,因此需要大量高质量标记训练数据对模型进行训练和优化。在实际应用中,特定领域难以获取高质量带情感标签评论数据。在跨领域文本情感分类任务中,针对不同领域数据分布差异性,提出了基于句法结构迁移和领域融合的跨领域文本情感分类方法,可以解决特定领域对带标签数据依赖问题。句法结构迁移方面,将依存语法特征加入到递归神经网络中,设计了一种可迁移的依存句法递归神经网络模型,通过句法结构迁移有效地迁移跨领域结构信息,为情感迁移提供支撑。领域融合方面,在传统的最大均值差异领域度量方法上细化了跨领域同类别距离度量信息。通过约束源领域和目标领域的分布,可以保证2个领域距离在学习过程中尽可能减小,有效地提取领域通用特征。实验结果表明,该方法比已有方法有效提高了跨领域情感分类准确率。  相似文献   

10.
在对话过程中,人们通常根据对方上一句话的关键词做出相应的回复。为了生成与关键词含义相关的回复,提出了拓展关键词信息注意力机制的对话生成模型。首先从输入语句中提取关键词,然后根据关键词词向量余弦相似度找出与关键词相关的词语构成拓展关键词集合,将集合中词语的词向量通过注意力机制的方式加入解码过程来影响回复生成。在中文微博数据集及英文Twitter数据集上的实验表明,该模型在回复语句的相关性及多样性方面取得了优于其他模型的结果。  相似文献   

11.
针对航空不安全事件领域命名实体识别任务,以航空安全信息周报为数据源,分析并构建航空不安全事件命名实体识别数据集和领域词典。为解决传统命名实体识别模型对于捕获领域实体边界性能较差的问题,基于BERT(bidirectional encoder representations from transformers)预训练语言模型提出融合领域词典嵌入的领域语义信息增强的方法。在自建数据集上进行多次对比实验,结果表明:所提出的方法可以进一步提升实体边界的识别率,相较于传统的双向长短期记忆网络-条件随机场(bi-directional long short term memory-conditional random field, BiLSTM-CRF)命名实体识别模型,性能提升约5%。  相似文献   

12.
为解决目标跟踪过程中快速运动模糊、背景相似干扰、目标状态变化等问题,基于孪生网络跟踪算法,提出三联区域候选神经网络(TripleRPN)算法与跟踪区域自适应策略(TAA)相融合的目标跟踪方法(TAA+TripleRPN).三联区域候选神经网络根据当前跟踪结果实时更新网络匹配模板,提高了跟踪器对目标状态变化的敏感性.通过区域自适应策略,根据区域候选回归网络分类分支的得分在网络的两组输出间择优选择,提高算法长时跟踪的鲁棒性.针对背景相似干扰和目标状态变化的问题时,TAA+TripleRPN跟踪器能达到更好的跟踪性能.在OTB2015数据集上,算法的AUC达到66.31%,CLE达到88.28%.在实际场景中实现验证与应用,跟踪效果良好.   相似文献   

13.
基于大规模领域内标注数据训练的句法分析模型在领域外数据上测试时,性能会急剧下降.导致该现象的原因之一是缺乏高质量的目标领域标注数据.由于人工标注数据耗时耗力,自动生成目标领域标注数据是一种有效的解决方法.其中,三元训练(tri-training)作为一种典型的多模型决策协同训练方法,旨在利用多个模型的预测结果来保证自动标注数据的质量.本文针对跨领域依存句法分析任务,系统比较了3种常用的tri-training方法,在NLPCC-2019评测数据集上取得了目前最佳的性能,并大幅度超过了目前最好结果.此外,还设计了详细的分析实验以深入理解跨领域模型性能下降的原因以及tri-training所起的作用.  相似文献   

14.
基于对话的多Agent协作交互模型   总被引:1,自引:0,他引:1  
针对传统协作设计过程中任务分解、任务分配的随意性和盲目性,提出了一种基于对话的多智能体协作交互模型.初始承担者首先通过信息搜索对话,依次询问设计辅助智能体的专业领域及参与完成设计任务的能力、愿望和机会,以确定其能否作为潜在的协作组成员,然后选用劝说对话,依次劝说潜在协作组成员把实现设计任务作为其意图,最后再次以劝说对话的形式,使潜在协作组成员意识到组内其他成员也都拥有承担设计任务的独立意图和相关意图,以联合信念的形式予以确认,并广播到每个成员.给出了一个达成的对话过程,总结了对话模式的效用与代价公式.实际应用表明,所提对话交互模型在没有固定消息顺序的情况下,可限制每个点上的可能响应,同时其Agent可以表达特定言语行为的态度,并产生这一态度的逻辑推理过程.  相似文献   

15.
为了解决计算机深度学习时标注数据工作量大、准确度不高、耗时耗力等问题,需要将预先训练好的模型中的数据进行跨领域跨任务迁移学习。基于对不同数据集的迁移效果的研究,试验时将视觉领域中表现良好的ImageNet预训练模型迁移到音频分类任务,通过剔除无声部分、统一音频长度、数据转换和正则化处理这4个步骤,采用经典图像增强和样本混淆两种数据增强方法,以5种不同的方式训练数据集,实验证明:ImageNET目标训练模型的跨领域迁移学习效果显著,但源领域的模型效果和目标领域的最终效果并没有必然联系,且使用同领域相似数据分布的数据集的预训练效果比ImageNet上的预训练效果更差。  相似文献   

16.
在人工智能领域,智能对话系统有着重要的研究意义和应用价值。智能对话系统是一种通过自然语言与人进行沟通交流的人机交互系统,它被定义为未来各种服务的入口。然而针对问题诊断领域的智能对话系统研究相对较少。本文设计并实现了应用于问题诊断领域的任务型智能对话系统,采用了管道方法(Pipeline Method)的架构设计了包括自然语言理解、对话管理、知识库和自然语言生成的对话流程,并提出了一套新颖的知识库模型和对话管理方法:基于问题症状和问题根因的二分图知识组织方式和基于概率分布的问题根因对话策略。该系统作为远程诊断的一个解决方案,利用人工智能打通医疗全科领域的关键技术点,形成可落地、可用、可工程化的全科辅助诊断对话系统。针对从公开出版物上随机选取的23种常见疾病的病例数据,本系统的召回率得到了较好的结果,其中前四召回率接近专业医生的诊断结果。本系统达到了缩短响应时间,降低成本,提升客户满意度的效果。  相似文献   

17.
多模态数据的急剧增长带来了跨模态检索的应用需求,促进了对跨模态检索方法的研究。本文追溯该领域最新进展,跟踪并深入研究国内外基于表示学习的跨模态检索方法,对跨模态检索问题进行定义并梳理该领域常用技术方法、主流模型、常用数据集、评价方法和面临的主要挑战。主要从统计相关分析、图正则化和度量学习3方面介绍基于表示学习跨模态检索方法,并分析其优缺点。为了分析上述方法的优劣性,实验分别在4个数据集上复现14种方法进行对比评价。实验结果表明:基于统计相关分析方法训练效率较高且易于实施;基于图正则化方法通过挖掘模态内和模态间的相似性,实现语义关联;基于度量学习方法是在公共子空间中尽可能保留数据语义相似/不相似的信息。本文介绍基于表示学习的跨模态检索方法的研究现状,为跨模态检索方法研究提供参考。  相似文献   

18.
多模态数据的急剧增长带来了跨模态检索的应用需求,促进了对跨模态检索方法的研究。本文追溯该领域最新进展,跟踪并深入研究国内外基于表示学习的跨模态检索方法,对跨模态检索问题进行定义并梳理该领域常用技术方法、主流模型、常用数据集、评价方法和面临的主要挑战。主要从统计相关分析、图正则化和度量学习3方面介绍基于表示学习跨模态检索方法,并分析其优缺点。为了分析上述方法的优劣性,实验分别在4个数据集上复现14种方法进行对比评价。实验结果表明:基于统计相关分析方法训练效率较高且易于实施;基于图正则化方法通过挖掘模态内和模态间的相似性,实现语义关联;基于度量学习方法是在公共子空间中尽可能保留数据语义相似/不相似的信息。本文介绍基于表示学习的跨模态检索方法的研究现状,为跨模态检索方法研究提供参考。  相似文献   

19.
张杨帆  丁锰 《科学技术与工程》2022,22(29):12945-12953
利用文本分析技术可以帮助民警快速地准确地提取电子数据,使用预训练语言模型进行下游任务能够有效减轻过拟合,在使用微调BERT进行文本分类的时候一般将[CLS]位对应的隐含层表示作为句向量输入到全连接层中进行分类,这会产生一部分语义信息的丢失从而导致分类准确率的下降。针对这一问题,提出在BERT后接一个语义特征提取器以充分利用高层的语义信息,使用不同大小的二维卷积核对BERT输出的隐藏状态进行卷积,然后用共享权重的Squeeze-and-Excitation模块对通道进行加权,通过最大池化层后连结起来,最后输入到全连接层进行分类。在自建的涉案对话文本数据集和公开数据集THUCNews上进行测试,结果表明,与BERT基线模型和其他分类模型相比,改进后的微调BERT模型具有更好的分类效果。  相似文献   

20.
结构化数据和非结构化文本被视为两种不同的模态。数据到文本生成是自然语言生成领域中一个重要的跨模态任务,该任务的目标是对于给定的结构化数据,生成一段文本用以描述结构化数据中包含的关键信息。近年的研究工作通常关注于描述性文本的生成,虽然取得了一定的研究进展,但仅能做到信息的传递而不能带来任何增益。为解决这一问题,本研究数据到分析性文本的生成,并针对该任务提出一个基于主题感知的跨模态序列到序列模型。该模型在编码器-解码器结构的基础上,引入数据表的主题信息以保证生成文本与数据表之间的主题一致性,提高生成文本的质量。为验证模型的性能,提出两个真实数据集,并与其他6个模型进行对比实验,结果表明,提出的模型取得了最好的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号