首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
医疗文本具有实体密度高、句式冗长等特点,简单的神经网络方法不能很好地捕获其语义特征,因此提出一种基于预训练模型的混合神经网络方法。首先使用预训练模型获取动态词向量,并提取实体标记特征;然后通过双向长短期记忆网络获取医疗文本的上下文特征,同时使用卷积神经网络获取文本的局部特征;再使用注意力机制对序列特征进行加权,获取文本全局语义特征;最后将实体标记特征与全局语义特征融合,并通过分类器得到抽取结果。在医疗领域数据集上的实体关系抽取实验结果表明,新提出的混合神经网络模型的性能比主流模型均有提升,说明这种多特征融合的方式可以提升实体关系抽取的效果。  相似文献   

2.
实体关系抽取作为文本挖掘和信息抽取的核心任务,是知识图谱构建过程中的关键一环。然而人工建立大规模有标签的数据耗时耗力。使用小样本学习来进行关系抽取,仅仅需要少量样本实例就能使模型学会区分不同关系类型的能力,从而缓解大量无标签数据带来的标注压力。本文对中文关系抽取数据集FinRE进行了重构使之适用于少样本学习,并引入了语义关系网络HowNet对实体进行更为精确的语义划分,并在此基础上使用双重注意力机制提高句子编码质量,从而提高了模型在面对噪声数据时的效能,减轻了长尾关系的影响。使用本文的方法在该中文数据集进行了评估,与原始原型网络相比,基于句子级别与实体级别的注意力机制的原型网络在抽取准确率上提升了1%~2%的性能。  相似文献   

3.
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。  相似文献   

4.
关系抽取是许多信息抽取系统中的一个关键步骤, 旨在从文本中挖掘结构化事实. 在应用传统的远程监督方法完成实体关系抽取任务时存在 2 个问题: ① 远程监督方法将语料库中的文本与已标注实体和实体间关系的知识库启发式地对齐, 并将对齐结果作为文本的标注数据, 这必然会导致错误标签问题; ② 目前基于统计学的方法过于依赖自然语言处理工具, 提取特征处理过程中生成的噪声积累严重影响抽取结果. 为了解决远程监督存在的弊端, 提出了一种基于注意力机制的端到端的分段循环卷积神经网络(convolutional neural network, CNN)模型. 为了检测更加细微的特征, 在网络输入层添加了注意力机制, 自动学习句子中与关系抽取相关的内容; 基于位置特征和词向量特征对句子进行编码, 并使用分段卷积神经网络(piecewise CNN, PCNN)抽取句子特征进行分类, 在网络中使用了效率较高的最大边界损失函数来衡量模型的性能. 该方法在 New York Times (NYT)数据集上的准确率比经典的 PCNN+MIL 模型提高了 2.0%, 比经典的 APCNN+D 模型提高了 1.0%, 与其他几种基线模型相比, 该模型准确率表现出色.  相似文献   

5.
属性抽取的目标是从非结构化文本中抽取与文本实体相关的属性和属性值,然而在电商场景下基于序列标注的模型缺少应对大规模属性抽取任务的可扩展性和可泛化性能力。本文提出基于阅读理解的商品属性抽取模型,通过额外加入问句来强化模型对属性的理解,结合双仿射注意力机制捕获问句和文本之间的语义特征,进一步提高模型的抽取性能。本文在电商数据集上对不同类型问句和不同解码器进行了对比实验,结果表明本文提出的方法优于多个基线模型,相较于OpenTag和SUOpenTag模型,属性抽取的F1值分别提升7.70%和3.26%,未登录词识别的F1值分别提升15.51%和8.12%。  相似文献   

6.
针对关系抽取任务中文本特征提取不充分及核心词表现弱的问题,提出了一种多特征注意力卷积神经网络的实体关系抽取方法.利用位置、词性及实体标签作为输入特征,充分捕获文本信息,构建注意力模型,获得单词与目标实体之间的相关性,并将注意力机制与卷积神经网络相融合以进行关系预测.以新疆旅游领域为研究对象,总结归纳15种实体关系.采用...  相似文献   

7.
目前,细粒度情感分析已在观点挖掘、文本过滤等域获得广泛应用,通过细粒度情感分析,能完成更精准的文本理解和结果判断.其中,包含方面、观点和情感极性的情感三元组抽取任务是一个具有代表性的细粒度情感分析任务,且大多数相关研究是基于管道模型和端到端模型开展的.然而,一方面,管道模型本质为两阶段模型,存在错误传播的问题;另一方面,端到端模型也无法充分利用句子中各组成之间的联系,存在高层次语义关系捕获能力欠缺的问题.为解决以上问题,本文对句法和语义知识进行特征补充,提出一个基于语义增强和指导路由机制的情感三元组抽取方法(ASTE-SEGRM).首先,基于键值对网络学习源文本的句法特征和词性特征.区别于以往的建模方式,本文所提方法动态捕捉不同句法及词性类型的重要程度,并赋予不同的权重,以实现语义增强;其次,受启发于迭代路由机制,引入指导路由机制构建神经网络,使用先验知识指导情感三元组的抽取;最后,在四个基准数据集上的实验结果证明,本文所提方法优于数个基线模型.  相似文献   

8.
基于CNN-BLSTM的食品舆情实体关系抽取模型研究   总被引:1,自引:0,他引:1  
食品舆情实体关系抽取是构建食品舆情知识图谱的关键技术,也是当前信息抽取领域的重要研究课题。针对食品舆情中常出现的实体对多关系问题,在卷积神经网络(convolutional neural network,CNN)中引入基于位置感知的领域词语义注意力机制;在双向长短时记忆(bidirectional long short-term memory,BLSTM)网络中引入基于位置感知的语义角色注意力机制,构建基于CNN-BLSTM的食品舆情实体关系抽取模型。在食品舆情数据集上进行了对比实验,实验结果表明:基于CNN-BLSTM的食品舆情实体关系抽取模型在食品舆情数据集上准确率比常用的几种深度神经网络模型高出8.7%~13.94%,验证了模型的合理性和有效性。  相似文献   

9.
实体关系抽取是信息抽取的重要组成部分.描述了一种融合多信息的实体语义关系抽取方法,充分利用中文的各种特征和信息来提高关系抽取的性能.该方法主要结合特征向量和树核函数两种方法;特征向量表示了文本的语言信息,树核方法表示了文本的结构化信息.并且在2005年的自主内容抽取(automatic content extraction,ACE)基准语料上进行关系检测和6个关系大类抽取的实验.实验结果表明,该方法能识别出大部分的非关系实例,各种关系类型识别的精确率和召回率也有一定提高.  相似文献   

10.
通过结合2 738个领域词汇组成的词典对新疆旅游领域语料进行预处理操作,对文本信息进行实体关系抽取研究,提出基于旅游领域的词典信息,融合多级特征的Bi-LSTM、CNN和Attention机制的领域级关系抽取模型.该模型首先使用预训练模型生成含较强的语义表征能力的词向量;再使用Bi-LSTM获取更好的语义信息和词向量拼接以捕获长距离的语义特征;用CNN进行特征提取,加强局部特征的学习,并使用注意力池化层(Attentive-pooling)用以强化特征的表达;最后通过Softmax完成关系抽取任务.结果表明:该模型在SemEval-2010 Task 8公开数据集中F1值达到83.46%,证明了其有效性.且模型在新疆旅游领域语料的关系抽取任务中的F1值达到92.73%,优于目前的主流关系抽取模型.  相似文献   

11.
考察了文题所述塔的操作特征及隔板高度对其影响。为了提高此种塔的流通能力,作者引入温和的脉冲,并对此改进塔的特性进行了研究,比较了改进前后的塔的性能。作者发现,引入温和脉冲后塔的流通能力可增加一倍以上,各种操作性能也较好。可以认为,脉冲闭式涡轮搅拌萃取塔是一种性能优良的萃取塔。  相似文献   

12.
钪萃取分离的研究进展   总被引:2,自引:0,他引:2  
综述了近十多年来溶剂萃取、液膜萃取、离子交换等方法富集纯化钪的研究进展,并对各种类型的萃取剂萃取钪的机制进行了总结,溶剂萃取法仍是钪最主要的分离方法.  相似文献   

13.
基于 DOM 的 Web 信息抽取规则的构造与实现   总被引:1,自引:0,他引:1  
为了实现对Web信息的查询重、构和再利用,人们采用了Web信息抽取技术.本文主要讨论基于 DOM 的 Web 信息抽取,研究如何构造抽取规则,才能提高信息抽取的准确度、提高抽取规则的适应能力,并给出了抽取规则的生成过程.  相似文献   

14.
预分散溶剂萃取及其在生物产品分离中的应用   总被引:1,自引:0,他引:1  
对预分散溶剂萃取技术的原理及研究现状进行了综述,并对其在生物产品分离中的优势进行了论述.  相似文献   

15.
超临界CO2流体萃取法提取紫杉醇的研究   总被引:6,自引:0,他引:6  
利用超临界CO2流体萃取法从红豆杉枝叶中提取分离紫杉醇,用反相高效液相色谱法(HPLC)测定萃取物中的紫杉醇含量,并用液质联用(LC/MS/MS)进行产物鉴定.结果表明,粒径为0.25—0.45mm的红豆杉枝叶在27.6MPa,31℃下,以甲醇为修饰剂和吸收液进行萃取时,在120min内可使紫杉醇萃取完全,萃取率达96.7%,萃取物中紫杉醇纯度可达到1%以上.与传统的乙醇三次提取方法相比,超临界流体萃取法流程简单,步骤少,耗时短,无废渣溶剂残留,是一种环境友好的提取方法.  相似文献   

16.
分析了混合澄清器与传统塔式萃取器的优缺点,开发设计了一种新型的液液传质设备——塔式混合澄清萃取器。选择合适的物系(煤油一苯甲酸一水、环己烷一丙酮一水)对该设备进行了传质特性的研究,并考察了桨叶形式、搅拌速率、两相流量以及级数等因素对萃取的影响。结果表明:在实验条件下,该设备的单级效率可达到96%以上;在403r/min搅拌速率下,经过四级萃取,萃取率可达95%左右。  相似文献   

17.
用恒界面搅拌池研究了伯胺N_(1923)萃取盐酸、硝酸和高氯酸的动力学。从实验结果推断出萃取反应速率控制步骤是下述两步界面化学反应: RNH_(2(i)) HA(?)RNH_3A_((i)) RNH_3A_((i)) RNH_(2(o))(?)RNH_3A_((o)) RNH_(2(i)) 文中就不同酸根离子对萃取选率的影响作了讨论。  相似文献   

18.
三种微波萃取秦皮中秦皮甲素和秦皮乙素的方法   总被引:6,自引:4,他引:2  
以秦皮甲素和秦皮乙素的含量为指标, 研究了3种微波萃取秦皮的方法. 3种方法分 别为家用微波炉连续引入溶剂萃取法、 微波谐振腔连续引入溶剂萃取法和实验室专用微波 炉萃取法. 结果表明, 溶剂浓度、 辐射时间、 微波功率、 样品粒度等均对萃取有影响. 3种微波萃取法与索氏萃取法相比, 提取效率高且可省时节能.  相似文献   

19.
主成份和最小成份抽取的新算法   总被引:1,自引:0,他引:1  
给出了用于主成份分析和最小成份分析的神经网络学习算法,两者之间仅差一个符导,即刻生成份分析算法经改变符号后又是一个最小成份分析算法,两算法不仅能计算主成份空间和最小成份空间,而且学习所得的子空间以及主向量/最小向量的左奇异向量,数值模拟证实了算法是有效的。  相似文献   

20.
运用关于瓦斯抽采的各种研究理论,结合永佛寺煤矿瓦斯地质情况,对一水平下部8号煤层开采时的瓦斯及煤与瓦斯突出造成的影响进行了分析,并提出了治理方案,即运用卸压抽采和未卸压抽采相结合的方法,通过计算确定了抽采参数,预计可以达到良好的抽采效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号