首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
实体关系抽取在挖掘结构化事实的信息抽取系统中扮演着重要的角色。近年来,深度学习在关系抽取任务中取得了显著的成果,同时,注意力机制也逐步地融入到神经网络中,进一步提高了关系抽取的性能。但是,目前的注意力机制主要关注一些低层次的特征,比如词汇等。本文提出一种基于高层语义注意力机制的分段卷积神经网络模型(PCNN_HSATT,high-level semantic attention-based piecewise convolutional neural networks),该模型将注意力机制设置在分段最大池化层后,动态地关注了高层次的语义信息。除此之外,由于中文实体关系语料稀疏性较大,本文利用同义词词林对COAE2016语料进行增强以扩大数据规模。最后在COAE2016和ACE2005的中文语料上进行实验,F1值分别达到了78.41%和73.94%,与效果最好的SVM方法相比分别提高了10.45%和0.67%,这充分证明了PCNN_HSATT模型在中文关系抽取上的有效性。  相似文献   

2.
药物相互作用是指药物与药物之间相互促进或抑制.针对现有的药物关系抽取方法利用外部背景知识和自然语言处理工具导致错误传播和积累的问题,以及现有大多数研究在数据预处理阶段对药物实体进行盲化,忽略了有助于识别关系类别的目标药物实体信息的问题.论文提出了基于预训练生物医学语言模型和词汇图神经网络的药物相互作用关系抽取模型,该模型通过预训练语言模型获得句子的原始特征表示,在基于数据集构建的词汇图上进行卷积操作获得与句子相关的全局特征信息表示,最后与药物目标实体对特征进行拼接从而构建药物相互作用关系提取任务的特征表示,在获得丰富的全局特征信息的同时避免了使用自然语言处理工具和外部背景知识,提升模型的准确率.论文的模型在DDIExtraction 2013数据集上的F1值达到了83.25%,优于目前最新方法2.35%.  相似文献   

3.
基于有监督机器学习算法的蛋白质相互作用关系抽取方法仍然面临一个问题:标注数据集有限,导致算法无法得到充分学习。该文首先构造了一个丰富的特征空间,包括句法、词汇、词性等特征;然后,该文对不同数据集数据分布的不一致性进行了分析,在此基础上提出了一种基于自训练的数据添加算法,通过不断从未标注数据集中选择置信度高的样本加入到已标注数据集中,扩大数据集规模,提高算法效率。实验结果表明:在5个常用的蛋白质相互作用关系数据集上,该方法均有助于提高抽取性能。  相似文献   

4.
远程监督通过已有知识库的关系三元组和自然语言文本语料库进行启发式匹配,获得数据来完成关系抽取任务,解决有监督学习方法完全依赖人工标注数据的问题,但远程监督数据中会存在大量噪声关系标签.针对以上问题,提出了一种结合自注意力机制和分段卷积神经网络的实体关系抽取模型SAPCNN,首先通过自注意力机制捕获词与词之间的全局相关性...  相似文献   

5.
为了增加对不同类别样例的区分度,提高模型的分类效果,提出了结合类别关键词和注意力机制的药物相互关系(DDI)抽取模型KA-BERT.首先基于卡方检验和文档频率获取每个类别的关键词,然后在预训练BERT模型中加入关键词与药物对的位置编码,以增加样例的差异性,并通过注意力机制学习关键词与句子中其他词的分布信息.针对药物关系...  相似文献   

6.
实体关系抽取是信息抽取领域的一项关键技术,在知识库自动构建、问答系统等领域有着极为重要的意义.远程监督关系抽取技术利用大型知识库(Knowledge Base,KB)自动对语料进行标注,但存在噪声过大的问题.前人提出的注意力模型中利用实体对的向量表示相减得到关系语义表示,进而使用关系表示来达到降噪的效果,然而同一实体对...  相似文献   

7.
文档级关系抽取旨在从文档中抽取出多个实体对之间的关系,具有较高的复杂性。针对文档级关系抽取中的多实体、关系相关性、关系分布不平衡等问题,提出了一种基于注意力机制(Attention)语义增强的文档级关系抽取方法,能够实现实体对之间关系的推理。具体来说,首先在数据编码模块改进编码策略,引入更多实体信息,通过编码网络捕获文档的语义特征,获得实体对矩阵;然后,设计了一个基于Attention门控机制的U-Net网络,对实体对矩阵进行局部信息捕获和全局信息汇总,实现语义增强;最后,使用自适应焦点损失函数缓解关系分布不平衡的问题。在4个公开的文档级关系抽取数据集(DocRED、CDR、GDA和DWIE)上评估了Att-DocuNet模型并取得了良好的实验结果。  相似文献   

8.
药物相互作用是指药物之间存在的抑制或促进等作用. 针对目前方法在不同关系类别上的抽取结果差异较大的问题,论文提出了一种利用外部知识的关系抽取模型,该方法首先对外部药物数据库中的信息进行处理,构建带有药物描述信息的数据集,然后在该数据集上进行模型训练,并保存最优模型,最后将该最优模型与药物关系抽取模型相结合,进行药物关系抽取,从而更好的利用了药物数据库中已有的知识,缓解了不同关系类别抽取结果差异较大的问题,提高了抽取效果. 在DDIExtraction 2013数据集上的实验结果表明,论文方法的F1值优于目前最优方法2.47%.  相似文献   

9.
在信息抽取中,关系抽取是一项准确识别自然语言中实体间关系的关键技术。针对关系抽取模型中容易丢失关键语义特征问题及远程监督的基本假设容易引入噪声数据的问题,本文提出一种基于远程监督的ENCODER_ATT关系抽取模型。基于循环神经网络构造的ENCODER模型在以词级别进行特征记忆提取,并在句子层面进行语义特征信息整合,保证不遗失关键语义特征的同时去除冗余特征。然后在句子层面引入了注意力机制来降低噪声数据对实验结果的影响。在真实的数据集上进行实验,并绘制准确率-召回率曲线,实验结果表明ENCODER_ATT模型对比同类型的关系抽取方法有明显的提升。  相似文献   

10.
针对关系抽取任务中文本特征提取不充分及核心词表现弱的问题,提出了一种多特征注意力卷积神经网络的实体关系抽取方法.利用位置、词性及实体标签作为输入特征,充分捕获文本信息,构建注意力模型,获得单词与目标实体之间的相关性,并将注意力机制与卷积神经网络相融合以进行关系预测.以新疆旅游领域为研究对象,总结归纳15种实体关系.采用...  相似文献   

11.
为了解决目前Java主流模型-视图-控制器(MVC)框架日益庞大,从而导致性能低下的问题,提出了一个轻量级的MVC框架.该框架利用面向方面编程(AOP)技术实现了横向业务的剥离,采用控制反转设计模式实现了模块间的最低耦合,并通过Java反射技术实现了数据库记录与Java对象的自动转换.实验结果表明:该框架以仅仅70 KB左右的JAR包实现了比其庞大数百倍的类似框架的主要功能,同时支持网络应用和移动应用的开发,具有更高的执行效率.  相似文献   

12.
字向量表示质量对中文文本处理方法有重要影响。目前,常用中文字向量表示方法Word2Vec、GloVe在很多任务中表现优异,但存在向量质量依赖训练数据集、稳定性差、没有考虑汉字整体字形结构所隐含的语义信息、没有利用字典包含的语言知识等问题。为了克服现有方法的不足,该文首先采用字形自编码器自动捕获汉字字形蕴含的语义,再利用字义自编码器抽取字典包含的稳定字义信息,提出了融合中文字形和字义的字向量的表示方法(Glyph and Meaning to Vector)。结果表明,GnM2Vec在近邻字计算、中文命名实体识别和中文分词三项任务中均取得了较好的结果,在命名实体识别中,F1值较GloVe、word2vec、G2Vec(基于字形向量)分别提高了2.25、0.05、0.3;在中文分词中,F1值分别提高了0.3、0.14、0.33,提高了字向量稳定性。  相似文献   

13.
刘祥楼 《科学技术与工程》2012,12(12):2849-2851,2855
摘要:本文针对基于语义的人眼特征自动提取技术进行研究并探索出一条新的路径:首先,在人眼特征研究的基础上,自行建立了描述人眼特征的几何模型并定义了四个眼部特征参量;其次,采用三庭五眼规则分割出人眼区域;然后,利用梯度二值化及积分投影技术对人眼特征进行提取;最后,对人眼特征进行语义化并建立数字化标签。通过自建图库中1000幅彩色免冠照片的实验测试表明:计算机能够通过语义比对的方式实现快速人脸检索,最高重复率为8‰。  相似文献   

14.
VRML与JAVA的结合是当前常用的交互式虚拟现实技术.分析了虚拟现实建模语言VRML与JAVA语言相结合构建动态交互式虚拟现实场景,给出了JAVA与VRML相结合的几种方式,并进行了归纳和总结.  相似文献   

15.
Density-based approaches in content extraction, whose task is to extract contents from Web pages, are commonly used to obtain page contents that are critical to many Web mining applications. However, traditional density-based approaches cannot effectively manage pages that contain short contents and long noises. To overcome this problem, in this paper, we propose a content extraction approach for obtaining content from news pages that combines a segmentation-like approach and a density-based approach. A tool called BlockExtractor was developed based on this approach. BlockExtractor identifies contents in three steps. First, it looks for all Block-Level Elements (BLE) & Inline Elements (IE) blocks, which are designed to roughly segment pages into blocks. Second, it computes the densities of each BLE&IE block and its element to eliminate noises. Third, it removes all redundant BLE&IE blocks that have emerged in other pages from the same site. Compared with three other density-based approaches, our approach shows significant advantages in both precision and recall.  相似文献   

16.
关于语用学与语法学的渗透   总被引:1,自引:0,他引:1  
语用以语法为基础,语法离不开语用。将语用概念适当地应用于语法教学实践中,有助于语法应用能力的提高,因而有助于交际能力的培养。  相似文献   

17.
针对目前从遥感影像中提取的河流, 尤其是细小河流容易出现中断的情况, 将深度学习与多次棋盘分割法相结合, 应用于高分辨率遥感影像的河流提取。基于对山区、平原和城市3景高分二号卫星遥感影像的实验表明, 与现有的方法相比, 该方法提取的河流更加连续, 并且能够提取高分二号卫星遥感影像中两个像元的细小河流。  相似文献   

18.
简述黑洞与磁场的相互作用及能量提取的进展情况及取得的主要成果。  相似文献   

19.
本文首先通过对历史上主要英语语法流派的简单回顾 ,将教学语法 (pedagogicalgram mar)与科学语法 (non - pedagogicalgrammar)区分开来。本文的重点在于以格语法为例 ,阐述如何利用格语法来改进传统语法教学的某些方面 ,说明语义学与语言教学的密切联系。  相似文献   

20.
针对缸体表面特征以沟槽为主、方向性显著的特点,提出了使用高阶高斯回归滤波预处理与Radon变换相结合对表面的沟槽特征进行提取的方法。高阶高斯回归滤波抑制了边界效应,使得表面数据能被全部用于分析,提高了数据的使用率,同时减轻了异常值对滤波结果的影响,防止了沟槽形状带来的极值对滤波中线提取的干扰。在Radon变换过程中,为了防止沟槽密集处由于特征方向性减弱造成的特征提取困难,将沟槽特征整体的提取简化为对沟槽中心线的提取。考虑到沟槽底部极小值点分布与中心线之间的强相关性,使用深沟槽底部极小值点拟合确定中心线的位置。浅沟槽与轻微划痕也会留下极小值点,对深沟槽极小值点的提取造成干扰,因此引入深度阈值将两者区分。对样本分析后,得到沟槽的主要角度为19.5°、91.1°、165.6°。表面沟槽整体缺陷率为35.95%,大于单条沟槽缺陷率。与从二维轮廓线提取的表面特征结果对比表明,采用该方法所提取的缸体三维表面特征不仅包含了更多的特征信息,而且特征提取结果对表面局部的极值具有更强的稳健性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号