排序方式: 共有316条查询结果,搜索用时 15 毫秒
1.
属性抽取的目标是从非结构化文本中抽取与文本实体相关的属性和属性值,然而在电商场景下基于序列标注的模型缺少应对大规模属性抽取任务的可扩展性和可泛化性能力。本文提出基于阅读理解的商品属性抽取模型,通过额外加入问句来强化模型对属性的理解,结合双仿射注意力机制捕获问句和文本之间的语义特征,进一步提高模型的抽取性能。本文在电商数据集上对不同类型问句和不同解码器进行了对比实验,结果表明本文提出的方法优于多个基线模型,相较于OpenTag和SUOpenTag模型,属性抽取的F1值分别提升7.70%和3.26%,未登录词识别的F1值分别提升15.51%和8.12%。 相似文献
2.
事件指代消解任务比实体指代消解难度大, 主要原因为事件描述在非结构化文本中分布稀疏, 且不具备同指关系的单链占很大比例, 同时事件自身承载的语义信息比实体更加丰富。为了准确地抽取文本中的同指事件, 针对以上特点, 提出一种融合篇章表征的事件指代消解模型。该模型通过CRF有效地区分非事件句、单链以及同指链, 同时利用分层注意力机制捕捉句子级别和篇章级别的重要信息。在KBP2015和2016数据集上进行的事件指代消解实验验证了该模型的有效性, 在CoNLL评测标准下F1值达到43.07%。 相似文献
3.
4.
常识问答是一项重要的自然语言处理任务,旨在让模型结合常识对给定的问题进行解答。然而,现有模型容易受到知识源中噪声知识的干扰,且对多知识源的融合与利用不够充分,所以问答效率低。为此,文章从筛选知识和利用多知识源的角度出发,提出了由多知识源信息获取和多通道融合推理级联而成的常识问答方法。该方法首先从多个外部知识源检索或匹配知识,再根据贪心筛选策略对噪声知识进行过滤,最后利用多个编码通道对知识和问题进行编码,融合各知识源不同类型的信息并推断出答案。算法在数据集Commonsense QA上的结果表明,本文方法在测试集上取得了78.3%的准确率(Accuracy),与不引入外部知识和引入多种外部知识的两个基线方法相比,分别提升了4.8%和3.0%。表明文章提出的知识筛选策略能有效地过滤噪声,且多通道信息融合推理框架能充分融合多知识源的信息进行常识推理。 相似文献
5.
中文篇章零元素语料库构建 总被引:1,自引:0,他引:1
针对中文零指代问题, 从篇章视角进行理论分析, 并完成中文篇章零元素语料库(Chinese Discourse Zero Corpus, CDZC)的构建工作。首先, 整理和分析已有的理论研究以及语料资源, 探究篇章层面中文零元素语料库标注的必要性。然后, 采用自底向上、前向搜索的标注策略和人机结合的半自动标注方式, 完成CDZC语料库的构建。最后, 对该语料库进行一系列详细的统计分析。结果表明, CDZC能够充分反映出中文零元素省略的语言特点, 为相关研究提供语料资源支持。 相似文献
6.
嵌入式实时操作系统内核的主要工作就是对任务进行管理和调度,而任务管理是其核心功能.详细研究任务管理机制所需要的任务模板、空闲任务、就绪任务队列数组、任务操作信号量和时间片等执行要素以及任务状态转换关系,对任务的管理机制和任务队列进行了详细剖析.通过实例给出MQX系统中任务的使用方法.最后,提出了MQX嵌入式工程中任务编程的基本要点;为合理分配处理器资源、提高系统的稳定性与可靠性、以及调度速度和信息处理的完整性等提供了很好的建议. 相似文献
7.
现有的神经机器翻译模型的注意力机制仅考虑目标端对应源端的关联信息,未考虑源端单词之间的关联信息.通过在源端进行关联性建模,融入依存关联指导,以此加强源端单词之间的关联性,提高机器翻译的性能.首先构建源端隐藏层之间的关联性,其次构建依存关联损失函数,从而将依存关联指导融入基准的神经机器翻译系统.利用循环神经网络基准模型和Transformer基准模型分别在大规模的中-英测试数据集上进行实验,结果表明,相较于基准神经机器翻译系统,融入依存关联指导可以有效提升机器翻译质量. 相似文献
8.
针对中文篇章中的零指代问题,提出一种基于中英文可比较语料进行中文零指代识别和消解的方法,并提出英文对等句的概念。利用对等句,重新定义句子间隔,并引入双语词对齐特征。在基准平台基础上,从零指代项识别和零指代项消解两个方面进行研究。在Onto Notes5.0语料上的实验结果表明,与目前性能最好的系统相比,新提出的基于中英对等语料的中文零指代方法取得更好的性能。 相似文献
9.
为避免采用随机抽样模型对Ad hoc网络消息传播过程进行定量分析时存在的高估消息覆盖节点数的问题,对现有模型进行修正,提出了一种高阶描述模型.该模型在转发消息时考虑了会对下一次消息转发到达新节点的概率产生影响的2个参数:节点被访问次数和节点度.节点被访问的次数越多,模型的阶数越高.在包含2 000个节点的随机图网络拓扑上的仿真试验结果表明,当消息覆盖的节点数超过1 800时,无论拓扑是否连通,一阶模型和二阶模型对Ad hoc网络消息传播过程的拟合度均优于随机抽样模型.当网络拓扑不连通时,一阶模型和二阶模型仍会高估消息覆盖的节点数;相反,当网络拓扑连通时,两者对仿真结果的拟合度较好,最终误差分别为-7%和-1%. 相似文献
10.
基于Manjunath Aradhya等提出的四步细化算法(MA)和Hilditch算法思想的分析,充分融合两种细化算法各自的优点,提出了一种新的文本图像细化方法。该算法首先采用改进的MA细化算法对二值图像作预处理;然后采用Hilditch算法进行细化。实验表明,提出的算法能有效的避免断笔,更好的保留字体拓扑信息,细化结果无畸变。 相似文献