期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

杨佳乐王俊豪钱卫宁罗轶凤《华东师范大学学报(自然科学版)》2020,(4):88-97

提出了一种企业破产事件抽取框架,该框架可以从法律裁定书等卷宗资料中检测出相应的法律事件,并抽取出与事件相关的结构化要素信息.该框架结合从法院所获得的裁定书等卷宗信息,运用远程监督技术来构建模型训练数据;再通过命名实体识别技术对句级别的文书进行序列标注;最后结合自定义的事件触发词表与事件字典,运用事件抽取技术对法律文书进行事件识别,并给出对应事件的结构化信息.实验结果表明本框架能够取得较高的事件识别精度,是一种有效的企业破产事件抽取框架. 相似文献

2.

基于多特征双向门控神经网络的领域专家实体抽取方法

张柯文李翔严云洋朱全银马甲林《南京师大学报(自然科学版)》2021,44(1):128-135

命名实体识别是自然语言处理和信息提取的基本任务,传统专家命名实体识别方法存在过度依赖人工特征标注和分词效果、专家简介中大量专业新词无法识别等问题.本文提出一种基于多特征双向门控神经网络结构并结合条件随机场模型进行领域专家实体抽取方法.该方法首先通过构建领域专家语料库以训练实体抽取模型;接着,使用Bert方法进行字嵌入表... 相似文献

3.

基于角色分离的中文事件抽取研究

张旭朱艳辉曾志高欧阳康孔令巍《山西大学学报(自然科学版)》2022,(4):936-946

端到端的事件抽取涉及两个子任务：事件检测和事件元素抽取，当前大多数研究工作并未解决元素抽取中角色重叠的问题，并且忽略了数据集提供的静态信息。文章提出一种基于两个独立编码器的事件抽取模型，通过词典增强的序列标注方法检测触发词和事件类型，再将事件类型、实体类型和边界信息作为元素抽取阶段的补充特征，使用多个角色二分类网络实现“分离式”的元素识别和角色分类，最后将基于静态数据统计得到的角色辨识度对所有分类器的损失函数加权求和，作为最终的损失函数，进而更好地拟合数据集特点。在两个公开的中文数据集ACE2005和DuEE上，实验F1值分别达到57.1%和76.1%，并且该方法有效提高了对角色重叠事件的识别准确率。相似文献

4.

多特征中文命名实体识别 总被引：1，自引：0，他引：1

胥小波王涛康睿周刚李天宁《四川大学学报(自然科学版)》2022,59(2):022003-63

命名实体识别任务是对文本中的实体进行定位，并将其分类至预定义的类别中.目前主流的中文命名实体识别的模型是基于字符的命名实体识别模型.该模型在使用句法特征之前，需先进行分词，不能很好的引入句子的句法信息.另外，基于字符的模型没有利用词典中的先验词典信息，以及中文偏旁部首蕴含的象形信息.针对上述问题，论文提出了融合句法和多粒度语义信息的多特征中文命名实体识别模型.实验证明论文模型相对目前主流模型有了较大的提高，同时论文还通过实验分析了各种特征对模型识别效果的影响. 相似文献

5.

基于BoBGSAL-Net的文档级实体关系抽取方法

冯超文吴瑞刚温绍杰刘英莉《南京大学学报(自然科学版)》2023,(6):1013-1022

文档级实体关系抽取的主要任务是提取文档中实体之间的关系.相较于句内实体关系提取,文档级实体关系抽取需要对文档中多个句子进行推理.为了解决文档中不同实体之间的复杂信息交互问题,提出一个混合提及级图MMLG (Mixed Mention-Level Graph)策略,用于拟合文档中不同实体之间的复杂信息交互,提高模型对于文档级实体关系的感知能力.此外,为了应对实体关系中存在的关系重叠问题,构建了实体关系图ERG (Entity Relation Graph)模块,该模块融合了路径推理机制,主要针对实体间的多个关系路径进行推理学习,更准确地识别提及级节点实体及关系.通过将MMLG策略与ERG模块聚合到实体关系抽取模型中,构建BoBGSAL-Net (Based on Bipartite Graph Structure Aggregate Logic Network)模型,并在公开数据集DocRED和作者实验室构建的数据集AlSiaRED上开展实验,结果证明BoBGSAL-Net在文档级实体关系抽取任务中性能得到提升,其中BoBGSAL-Net+BERT模型在AlSiaRED数据集上的关系抽取... 相似文献

6.

基于多粒度认知的命名实体识别方法

李攀锋陈樱珏钟泠韵林锋《四川大学学报(自然科学版)》2022,59(2):022004-70

在数据匮乏的领域,命名实体识别效果受限于欠拟合的字词特征表达,引入常规的多任务学习方法可以有所改善,但需要额外的标注成本.针对这一问题,提出了一种基于多粒度认知的命名实体识别方法,在不产生额外标注成本的前提下,增强字特征信息,提高命名实体识别效果.该方法从多粒度认知理论出发,以BiLSTM和CRF为基础模型,将字粒度下的命名实体识别任务与句子全局粒度下的实体数量预测任务相联合,共同优化字嵌入表达.三个不同类型的数据集上的多组实验表明,引入多粒度认知的方法有效地提升了命名实体识别效果. 相似文献

7.

融合依存信息和卷积神经网络的越南语新闻事件检测

王吉地郭军军黄于欣高盛祥余正涛张亚飞《南京大学学报(自然科学版)》2020,(1):125-131

新闻事件检测是自动检测新闻文本中出现的相关事件,需要大量人力设计模板,而且难以获取句中隐含的语义信息,识别触发词时多存在歧义.为解决以上问题,利用融合依存句法信息的卷积神经网络(Dependency Parsing Convolutional Neural Networks,DPCNN),针对句子级别越南语新闻事件进行检测.该模型在编码过程中融合了词义、位置信息、词性信息和命名实体信息,利用传统卷积编码连续词之间的特征,利用融合依存句法信息的卷积编码非连续词之间的特征,再融合两部分特征作为事件编码,进而实现事件检测.实验结果表明,该方法在越南语新闻事件检测中取得了很好的效果. 相似文献

8.

融合事件信息的复杂问句分析方法

刘小明樊孝忠刘里《华南理工大学学报(自然科学版)》2011,39(7):140-145

问答系统中的复杂问句通常涉及很多事件信息,正确处理其中的事件内容对提高系统准确率有重要的影响.为此,文中提出了一种融合事件信息的复杂问句分析方法.该方法将事件视为由多个要素构成的复杂数据对象,从而定义了事件的语义表征模型,给出了相似度计算方法.文中首先利用相关的事件抽取方法获取复杂问句中的事件信息,生成事件的语义模型实... 相似文献

9.

基于浅层语义分析的主题事件的时间识别

李风环郑德权赵铁军《山东大学学报(理学版)》2015,50(11):74-80

时间识别是自然语言处理中极其重要的课题。事件中与主题相关的时间信息体现了事件在时间维度的主题特征。当前面向事件的时间识别大多是基于句子或短语的,并采用静态时间值机制。本文提出了一个面向主题事件的时间识别模型。该模型采用参考时间动态选择机制对时间表达式规范化。结合事件抽取和浅层语义分析,将浅层语义分析结果和时间表达式进行映射,将基于句子或短语的时间识别转化为基于篇章的时间识别,从而识别主题事件片段的时间。实验表明所提出的方法使主题事件片段的时间识别的性能提高了9.6%。相似文献

10.

基于反馈图卷积神经网络的事件检测方法

刘浏丁鲲 ? 刘姗姗刘茗《湖南大学学报(自然科学版)》2023,(8):205-212

事件检测是自然语言处理领域的重要任务之一,其结果可以有效支撑信息抽取、文本分类和事件推理等下游任务. 预训练语言模型BERT在事件检测任务上取得了显著的成绩,然而该类方法无法有效获取长距离和结构化的文本信息. 为了缓解该问题,本文提出基于反馈网络的图卷积神经网络模型进行文本结构信息捕获,同时这种新方法能够有效解决图卷积神经网络带来的语义信息衰减性问题. 本文首先使用BERT预训练模型获取文本的语义特征,然后使用融入反馈网络的图卷积神经网络提取文本的句法结构特征,最终使用多分类器实现对事件触发词的识别和分类.公开数据集ACE 2005上的实验结果表明,本文提出的事件检测方法在事件触发词识别和分类任务上的F1值分别达到了74.46%和79.49%,较现有工作平均提高了4.13%和4.79%. 相似文献

11.

一种面向微博的突发事件触发词识别方法研究

孙小川吴警尹浩然芦天亮《中国人民公安大学学报(自然科学版)》2019,25(4)

事件触发词识别是事件抽取技术中核心任务之一,在面向微博的突发事件触发词识别中,提出一种基于扩展触发词表和多值分类模型(P-Multi模型)相融合的触发词识别方法,进行事件触发词识别。以多值分类模型以扩展触发词为基础,结合基于模式规则匹配,对文本进行潜在语义分析,进一步挖掘触发词语义信息,将模式匹配和语义分析融合在微博突发事件触发词识别之中。实验结果在触发词识别准确率、召回率上均有所提升,证明了该方法的有效性。相似文献

12.

融合音节部件特征的藏文命名实体识别方法

洛桑嘎登群诺索南尖措仁增多杰《厦门大学学报(自然科学版)》2022,(4):624-629

藏文命名实体识别是藏语自然语言处理的基础任务，是完成机器翻译、网络舆情检测和知识图谱构建等任务的前提.传统的基于深度学习的藏文命名实体识别将藏文音节(字嵌入)作为模型输入的方法容易忽略藏文音节的局部特征.针对这一问题，本文提出了一种融合构成藏文音节部件特征和藏文音节特征的藏文命名实体识别神经网络模型SL-BiLSTM-CRF(syllable level long short-term memory conditional random field).其中，SL模块对构成音节的部件信息和藏文的单个音节进行特征编码，将两种不同模态的特征融合之后送入BiLSTM模型进行特征提取并预测实体标签，再通过CRF对BiLSTM模型的预测结果进行矫正，最终输出藏文实体识别结果.实验证明，该方法在藏文命名实体识别任务中相比基于单个藏文音节(字嵌入)的BiLSTM-CRF模型的F₁值提高了1.58个百分点，验证了该方法在藏文命名实体识别任务中的有效性. 相似文献

13.

基于注意力机制多特征融合的虚假信息检测

地力夏提·阿布都热依木马博杨雅婷王磊《厦门大学学报(自然科学版)》2022,(4):608-616

在虚假信息识别任务中,面对图文结合的虚假内容,基于单模态的模型难以进行准确识别.社交媒体中的虚假信息为吸引关注和迅速传播的目的,会使用夸张的词汇煽动读者的情绪.如何将情感特征引入多模态虚假信息检测模型进行多特征融合,并准确地识别虚假信息是一个挑战.为此,本文提出了基于注意力机制多特征融合的虚假信息检测方法(att-MFNN).该模型中先将文本特征和情感特征基于注意力机制融合,再与视觉特征组成多模态特征送入虚假信息识别器和事件分类器中.通过引入事件分类器学习不同事件中的共同特征,提高新事件的识别性能.att-MFNN在微博和推特(Twitter)数据集的准确率达到了89.22%和87.51%,并且F₁、准确率、召回率指标均优于现有的模型. 相似文献

14.

基于条件随机场的中文命名实体识别研究

许晓丽卢志茂张格森《中国新技术新产品精选》2009,(2):15-15

条件随机场模型是文本信息抽取的重要方法之一,在命名实体识别方面CRF性能要明显优于隐马尔科夫模型和最大熵模型。本文以基于字一级的条件随机场模型实现了中文命名实体识别,取得了较好的识别效果。相似文献

15.

面向网络文本的中文产品命名实体识别

梅丰孙承杰孙珂程明波林磊《郑州大学学报(理学版)》2010,42(1)

分析电子数码领域的产品命名实体识别的难点和特点,提出了一种基于知识库的最大熵模型的产品命名实体识别方法,实现了从中文网络文本中抽取产品命名实体.实验表明,该系统在电子数码领域中能较好地识别出产品命名实体,对产品命名实体的F1值识别性能达到86.91%. 相似文献

16.

基于预训练语言模型与多任务学习的事件检测方法

韩如雪杨苗宫小泽胡镑王永利熊伟赵显伟徐琳《南京理工大学学报(自然科学版)》2023,(6):748-755

为了解决现有事件检测方法存在语料稀疏和触发词一词多义导致的触发词抽取不准确以及类型判断错误等问题,该文将双向Transformer编码表示(BERT)的预训练模型与条件随机场(CRF)结合,并联合多任务学习,提出了一种基于BERT-CRF模型与多任务学习的事件检测方法(MBCED)。该方法同时进行事件检测任务和词义消歧任务,将词义消歧任务中学习到的知识转移到事件检测任务中,既补充了语料,也缓解了一词多义所导致的触发词分类不准确问题。在ACE2005数据集上的传统事件检测模型对比实验结果表明,与动态多池卷积神经网络(DMCNN)、基于循环神经网络的联合模型(JRNN)、基于双向长短期记忆和条件随机场(BiLSTM-CRF)的联合模型、BERT-CRF方法相比,MBCED方法触发词识别的F值提升了1.2%。多任务学习模型对比实验结果表明,与基于多任务深度学习的实体与事件联合抽取(MDL-J3E)模型、基于共享BERT的多任务学习(MSBERT)模型、基于CRF多任务学习的事件抽取模型(MTL-CRF)相比,MBCED在触发词识别和触发词分类2个子任务上的准确率都较好。相似文献

17.

基于BLSTM-CRF模型的安全漏洞领域命名实体识别

张若彬刘嘉勇何祥《四川大学学报(自然科学版)》2019,56(3):469-475

非结构化文本资源提供了大量与漏洞相关的信息,传统的特定领域实体识别依赖特征模板和领域知识来识别相关实体,其识别性能很大程度上依赖于人工选取的特征函数质量.如何利用机器挖掘文本隐含的特征,而不需要人工详细地制定领域术语的特征表达是一项具有挑战性的任务.该文针对安全漏洞领域,提出一种双向长短期记忆网络BLSTM与条件随机场CRF相结合的安全漏洞领域实体识别模型,并使用基于词典的方法对结果进行校正,F值可达到85%以上.实验表明,该方法在提高实体识别的准确率和召回率的同时,能够显著地降低人工选取特征的工作量. 相似文献

18.

体育赛事命名实体识别研究

《河南师范大学学报(自然科学版)》2015,(4):163-167

为了准确地从中文文本中识别出复杂体育赛事命名实体,提出了一种基于双层条件随机场模型的命名实体识别方法.该方法首先在低层条件随机场模型中识别出简单体育赛事命名实体,然后在高层条件随机场模型中识别出嵌套了简单体育赛事命名实体的复杂命名实体如赛事名、参赛球队名和比赛场馆名.在对大规模真实语料进行的开放测试中,赛事名、参赛球队名和比赛场馆名识别的F值分别达到97.09%,97.81%和98.03%. 相似文献

19.

融合篇章表征的事件指代消解研究

吴瑞萦孔芳《北京大学学报(自然科学版)》2020,56(1):82-88

事件指代消解任务比实体指代消解难度大, 主要原因为事件描述在非结构化文本中分布稀疏, 且不具备同指关系的单链占很大比例, 同时事件自身承载的语义信息比实体更加丰富。为了准确地抽取文本中的同指事件, 针对以上特点, 提出一种融合篇章表征的事件指代消解模型。该模型通过CRF有效地区分非事件句、单链以及同指链, 同时利用分层注意力机制捕捉句子级别和篇章级别的重要信息。在KBP2015和2016数据集上进行的事件指代消解实验验证了该模型的有效性, 在CoNLL评测标准下F1值达到43.07%。相似文献

20.

一种多源领域自适应命名实体识别方法

李佳芮刘健陈钰枫徐金安张玉洁《厦门大学学报(自然科学版)》2022,(4):617-623

领域自适应是解决低资源问题的一种通用方式，可应用于各种自然语言处理的任务中.当前针对命名实体识别(named entity recognition, NER)任务的领域自适应研究通常从单一的源领域迁移到目标领域，在目标领域和源领域相近的情况下，这种方式能够取得较好的识别效果，但是在目标领域与源领域相关度不高的情况下，单一领域迁移方式存在很大的局限性.针对这一问题，提出一种融合多源领域贡献度加权的自适应NER模型(multi-domain adaptation NER model based on importance weighting, MDAIW).1)通过多个领域的知识迁移来提升目标领域的实体识别性能；2)根据不同领域及其领域内样本对目标领域的重要性，计算领域贡献度；3)将领域贡献度引入到NER模型中，以此来实现更好的模型领域适应性.最终在多个目标领域上进行实验，性能皆优于当前性能最好的方法，验证了模型的有效性. 相似文献