期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张俸玺吴丞楚张运泽董洛兵《广西科学》2023,30(1):100-105

针对自然语言处理(Natural Language Processing, NLP)任务中,命名实体识别(Named Entity Recognition, NER)存在实体类别样本不平衡的问题,提出一种基于改进损失函数的实体类别平衡优化算法。新算法是对神经网络模型中的损失函数进行优化处理,通过分析命名实体识别数据特点,在平衡正负样本的基础上引入平滑系数和权重系数,保证模型在梯度传递的过程更关注于实体类别较少和带有嵌套的难识别样本,同时减少对样本数较多的、易识别样本的关注。利用公共数据集ACE05、MSRA进行实验对比,结果表明改进的损失函数在数据集ACE05和MSRA上,F1值分别提高1.53%和0.91%。上述结果表明改进的损失函数能够较好地缓解实体中正负难易样本的不平衡。相似文献

2.

多神经网络协作的军事领域命名实体识别

尹学振赵慧赵俊保姚婉薇黄泽林《清华大学学报(自然科学版)》2020,60(8):648-655

互联网公开数据蕴含着大量高价值的军事情报,成为获取开源军事情报的重要数据源之一。军事领域命名实体识别是进行军事领域信息提取、问答系统、知识图谱等工作的基础性关键任务。相比较于其他领域的命名实体,军事领域命名实体边界模糊,界定困难;互联网媒体中军事术语表达不规范,随意性的简化表达现象较普遍;现阶段面向军事领域的公开语料鲜见。该文提出一种考虑实体模糊边界的标注策略,结合领域专家知识,构建了基于微博数据的军事语料集MilitaryCorpus;提出一种多神经网络协作的军事领域命名实体识别模型,该模型通过基于Transformer的双向编码器(bidirectional encoder representations from transformers, BERT)的字向量表达层获得字级别的特征,通过双向长短时记忆神经网络(bi-directional long short-term memory, BiLSTM)层抽取上下文特征形成特征矩阵,最后由条件随机场层(conditional random field, CRF)生成最优标签序列。实验结果表明:相较于基于CRF的实体识别模型,应用该文提出的BERT-BiLSTM-CRF模型召回率提高28.48%,F值提高18.65%;相较于基于BiLSTM-CRF的实体识别模型,该文模型召回率提高13.91%,F值提高8.69%;相较于基于CNN (convolutional neural networks)-BiLSTM-CRF的实体识别模型,该文模型召回率提高7.08%,F值提高5.15%。相似文献

3.

基于知识蒸馏的高效生物医学命名实体识别模型

胡滨耿天玉邓赓段磊《清华大学学报(自然科学版)》2021,61(9):936-942

在生物医学文献挖掘领域中,已有的BioBert采用预训练的方式在生物医学命名实体识别(BioNER)任务中表现出优秀的实体识别性能,却存在模型规模过大、速度过慢的缺点。针对BioBert网络模型如何高效压缩问题,该文提出了一种高效生物医学名称实体识别模型,命名为FastBioNER模型。该模型采用动态知识蒸馏方式对BioBert模型进行压缩,首先,通过动态权重函数模拟真实的学习行为,即在模型训练过程中动态调整各部分损失函数的重要程度;其次,采用动态知识蒸馏方式将训练后的BioBert作为教师模型,压缩到一个规模较小的学生模型中;最后,对提出的FastBioNER模型在已公开数据集NCBI疾病、 BC5CDR-chem和BC4CHEMD上进行了实验验证。实验结果表明:提出的FastBioNER模型在3个数据集中获得除BioBert外最高F1值分别为88.63%、 92.82%和92.60%,并分别以损失1.10%、 0.86%、 0.15%的F1值为代价,将BioBert的模型大小压缩了39.26%,同时推理时间缩短了46.17%。相似文献

4.

纵向数据下变系数模型的一种稳健同质寻踪算法

汤恒郑智张伟平《中国科学技术大学学报》2021,(12):857-867

探讨了变系数模型中参系数函数的同质性,其中同一个子群中的个体的系数函数是相同的.在重复观测的条件下,我们用B样条来拟合变系数模型的系数函数,同时用变点检测的方法来进行子群识别.为了解释可能的异常值或重尾分布,我们在M估计的框架下拟合系数函数,在本文中以绝对值(LAD)损失为例.模拟数据表明,当模拟数据集存在异常值或参数... 相似文献

5.

竖直方向弹性约束悬臂梁的固有频率分析

杨帅王太勇《天津大学学报(自然科学与工程技术版)》2011,44(1)

针对固定端部竖直方向为弹性约束的悬臂梁结构进行了模态分析.用欧拉-伯努利梁模型,推导出前3阶固有频率方程和振型函数.针对不同刚度,采用数值方法求解固有频率方程,得到固有频率随约束刚度变化的关系曲线.运用最小二乘法对该曲线进行函数拟合.以不同尺度梁为例,通过有限元方法对该拟合函数的正确性进行了验证,其误差小于2%.应用该函数,通过固有频率对端部刚度进行识别,其误差小于6%. 相似文献

6.

融合领域词典嵌入的航空不安全事件命名实体识别

下载免费PDF全文

许雅玺孟天宇王欣刘炳南《科学技术与工程》2024,24(8):3284-3290

针对航空不安全事件领域命名实体识别任务,以航空安全信息周报为数据源,分析并构建航空不安全事件命名实体识别数据集和领域词典。为解决传统命名实体识别模型对于捕获领域实体边界性能较差的问题,基于BERT(bidirectional encoder representations from transformers)预训练语言模型提出融合领域词典嵌入的领域语义信息增强的方法。在自建数据集上进行多次对比实验,结果表明：所提出的方法可以进一步提升实体边界的识别率,相较于传统的双向长短期记忆网络-条件随机场(bi-directional long short term memory-conditional random field, BiLSTM-CRF)命名实体识别模型,性能提升约5%。相似文献

7.

基于训练模型改进的语音问句信息抽取方法

刘继明孙成袁野《科学技术与工程》2021,21(18):7635-7641

为进一步提高客户语音问句实体信息抽取的准确性,增强智能问答系统知识图谱中信息抽取技术的整体效果,首先对语义标注进行优化,随后在BiLSTM-CRF(bidirectional long short-term memory conditional random filed)基础上加入BERT(bidi-rectional encoder representation from transformers)模型对句子进行实体抽取学习.在具体实验中,以语音问句事件文本为数据来源,对其进行语义标注和实体抽取实验.结果表明,在语义标注优化的基础上同时加入BERT改进模型,信息抽取结果均高于BiLSTM-CRF方法,且改进模型的调和平均值达到91.53％,即可为增强事件实体信息抽取提供实践意义. 相似文献

8.

基于局部对抗训练的命名实体识别方法研究

李静程芃森许丽丹刘嘉勇《四川大学学报(自然科学版)》2021,58(2):023003-023003-8

命名实体识别研究中,数据集内普遍存在实体与非实体,实体内部类别间边界样本混淆的问题,极大地影响了命名实体识别方法的性能.提出以BiLSTM-CRF为基线模型,结合困难样本筛选与目标攻击对抗训练的命名实体识别方法.该方法筛选出包含大量边界样本的困难样本,利用边界样本易被扰动偏离正确类别的特性,采用按照混淆矩阵错误概率分布的目标攻击方法,生成对抗样本用于对抗训练,增强模型对混淆边界样本的识别能力.为验证该方法的优越性,设计非目标攻击方式的全局、局部对抗训练方法与目标攻击全局对抗训练方法作为对比实验.实验结果表明,该方法提高了对抗样本质量,保留了对抗训练的优势,在JNLPBA、MalwareTextDB、Drugbank三个数据集上F1值分别提升1.34%、6.03%、3.65%. 相似文献

9.

预训练模型下航天情报实体识别方法

魏明飞潘冀陈志敏梅小华石会鹏《华侨大学学报(自然科学版)》2021,(6):831-837

为了快速处理航天情报,基于数据驱动的深度学习技术,提出融合多源异构知识标注中文航天情报数据集的方法流程,以及基于预训练(pre-training)模型的航天情报实体识别(AIER)方法;通过对航天情报进行命名实体识别,达到对航天情报进行信息抽取的目的.通过融合BERT(bidirectional encoder representation from transformers)预训练模型和条件随机场(CRF)模型构建AIER模型(BERT-CRF模型),将其与隐马尔可夫模型(HMM)、条件随机场(CRF)模型、双向长短期记忆网络加条件随机场(BiLSTM-CRF)模型进行实体识别对比实验.结果表明:基于预训练模型的AIER模型能够取得93.68%的准确率、97.56%的召回率和95.58%的F₁值;相比于其他方法,基于预训练模型方法的性能得到提高. 相似文献

10.

基于MacBERT-BiLSTM-CRF的反恐领域细粒度实体识别

焦凯楠李欣叶瀚朱容辰孙海春《科学技术与工程》2021,21(29):12638-12648

为验证基于深度学习的命名实体识别框架在反恐领域的有效性,参照ACE 2005实体标注规范,制订了细粒度反恐实体标签体系,构建了反恐实体语料集Anti-Terr-Corpus;提出基于MacBERT-BiLSTM-CRF的实体识别模型,通过能减少预训练和微调阶段差异的MacBERT(masked language modeling as correction bidirectional encoder representations from transformers)预训练语言模型获得动态字向量表达,送入双向长短时记忆(bidirectional long short-term memory, BiLSTM)和条件随机场(conditional random field, CRF)进行上下文特征编码和解码得到最佳实体标签;替换框架中的预训练语言模型进行对比实验。实验表明该模型可以有效获取反恐新闻中的重要实体。对比BiLSTM-CRF模型,MacBERT的加入提高了24.5%的F_1值;保持编码-解码层为BiLSTM-CRF时,加入MacBERT比加入ALBERT(a lite BERT)提高了5.1%的F_1值。可见,深度学习有利于反恐领域实体识别,能够利用公开反恐新闻文本为后续反恐形势预判服务,同时有助于反恐领域信息提取、知识图谱构建等基础性任务。相似文献

11.

负三项分布的性质研究

王慧卓泽朋《淮北煤炭师范学院学报(自然科学版)》2014,(1):16-20

负三项分布是一种基于伯努利试验的概率分布模型.文章以随机变量的特征函数为主要工具,研究负三项分布的若干重要性质.首先计算出负三项分布的特征函数,然后利用特征函数的性质和相关定理推出负三项分布的数学期望和方差,证明相互独立的负三项分布具有可加性,计算过程简洁,最后给出负三项分布取得概率的最大值点. 相似文献

12.

基于弹性网惩罚的复合分位数回归估计

下载免费PDF全文

张国浩《重庆工商大学学报(自然科学版)》2023,40(5):104-112

针对高维数据的建模分析问题,提出一种基于弹性网络法和复合分位数回归相结合的稳健估计方法。在该估计方法中,所提出的模型能够有效进行变量选择与系数压缩,并处理数据间的多重共线性与群组效应问题,在大数据时代下具有较广的适应性。同时,与已有的惩罚最小二乘估计和惩罚分位数回归估计相比,该估计方法不仅放宽了对模型误差项的分布要求,而且综合考虑了多个分位点的损失,在面对离群值或呈现尖峰、厚尾分布数据时能够保持更强的稳健性和抗干扰性。在一定条件下,对所构建模型估计的相合性与稀疏性进行了理论分析,结果表明:所提出的模型能够将不相关的变量完全压缩至零,且估计量和真实系数以趋于 1 的概率相同。此外,在数值模拟方面,设置了 5 种误差项分布条件,根据设定的 4 项指标,通过与其他惩罚函数模型以及损失函数模型进行比较,结果表明新提出的方法具备更好的稳健性与有效性。相似文献

13.

网络控制系统中迭代学习控制算法的鲁棒收敛性分析

曹伟徐凤霞张剑飞姚芝凤《重庆邮电大学学报(自然科学版)》2020,32(1):15-22

针对网络控制系统中受输入扰动和初态干扰的非线性系统,提出了一种迭代学习控制算法,讨论了输出数据丢失情况下系统输出对期望轨迹的跟踪问题。采用一个概率已知的随机贝努利序列来描述网络控制系统中的数据丢失现象,即如果输出数据没有丢失,则利用跟踪误差来修正上一次迭代学习时的控制量,从而获得系统当前控制量;如果存在输出数据丢失现象,则系统当前控制量保持上一次迭代时的控制量不变。给出了保证算法收敛的充分条件。从理论上证明了系统满足给定的收敛条件时,在数据丢失网络环境下具有输入扰动、初态扰动的被控系统随迭代学习次数的增加,系统输出除初始点以外都能够收敛于期望轨迹。通过仿真算例进一步验证了所提方法的有效性。相似文献

14.

基于BERT的危险化学品命名实体识别模型

下载免费PDF全文

陈观林程钊邹凌杨武剑李甜《广西科学》2023,30(1):43-51

针对危险化学品实体识别及关系识别的问题,本文基于双向长短期记忆网络连接条件随机场(Bidirectional Long Short-Term Memory with Conditional Random Field, BiLSTM-CRF)模型,通过引入双向编码器表示(Bidirectional Encoder Representation from Transformers, BERT)模型结合多头自注意力机制,提出了一种预训练命名实体模型BERT-BiLSTM-self-Attention-CRF,通过对危险化学品的文本进行字符级别编码,得到基于上下文信息的字向量,增强了模型挖掘文本全局和局部特征的能力。实验结果表明,在自行构建的数据集上,本文模型优于其他传统模型,其F1值为94.57%。相似文献

15.

基于双有序性约束的人脸年龄估计研究

王荀黄振生《重庆工商大学学报(自然科学版)》2024,(2):86-95

目的人类年龄是人类识别和搜索任务中的重要特征,现有研究一般将人脸年龄估计视为传统的分类任务,忽略了年龄之间的有序特征,导致估计年龄与真实年龄之间的差距较大,因此,有必要寻找一种方法以缩小估计年龄与实际年龄的差距。方法提出一种基于双有序性约束卷积神经网络模型(DO-CNN)的人脸图像年龄估计方法。首先,DO-CNN使用基于广义Logistic分布的有序回归模型作为卷积神经网络的分类器,并验证比其他有序分类器在人脸估计任务上的优越性;接着,进一步提出有序竞争比损失函数,在传统竞争比损失函数上,通过引入风险项使损失函数注意到预测年龄与真实年龄的误差,进而指导模型缩小估计年龄与真实年龄的差距。结果在开源人脸图像年龄数据集FGNET和AgeDB上的对比实验显示：相比现有研究方法,DO-CNN分别提升约12%和3%的准确率,当允许的误差范围扩大后,该优势依然保持。此外,基于广义Logistic分布的有序回归分类器相比基于其他分布的有序回归分类器具有明显提升。结论实验结果表明：基于双有序性约束的卷积神经网络模型可以明显提升人脸年龄估计的准确率,并减少年龄估计的实际误差。相似文献

16.

变分自动编码器的潜变量空间解耦方法

下载免费PDF全文

曾青耀郑茜颖俞金玲《福州大学学报(自然科学版)》2022,50(3):337-344

潜变量空间解耦是深度生成领域一个越来越热门的研究方向。对数据潜变量空间进行解耦带来最直观的好处是在生成数据时能选择性地调整数据的不同属性,实现更可控的数据生成。本文专注于潜变量空间解耦,提出一种能够进一步提高解耦任务度量指标的重要方法。本文方法基于变分自动编码器,在编码器阶段运用了自注意力机制和残差网络,使模型更有效地捕捉长期依赖关系,增强模型的维度适应性。在训练阶段,提出一种更好地驱使潜变量空间编码维度与属性值趋向单调关系的新颖损失函数。它更好地调节损失函数所处区间范围,更易于优化。该模型使潜在空间拥有较好的解耦程度和可解释性,有效地操纵生成图像的数据属性。实验结果表明,本文模型和方法在图像的潜变量空间解耦生成上优于目前许多先进方法,且具有更为轻量级的网络架构。相似文献

17.

一种改进的深度网络残差学习的图像降噪方法

靳华中刘阳叶志伟《华中师范大学学报(自然科学版)》2020,54(6):949-955

近年来,基于深度卷积神经网络的学习方法在图像降噪方面取得了前所未有的成果,通过调整网络结构和参数来获取更好的图像降噪效果已成为研究热点.降噪卷积神经网络在深度神经网络中采用残差学习方法,在提高降噪效果的同时,在一定程度上解决了盲降噪问题.其不足之处在于算法收敛时间长.该文针对降噪卷积神经网络结构做了进一步的改进,提出了一种基于反卷积降噪神经网络的图像降噪算法.该文工作的主要特色如下：1) 在原有的网络结构中,引入反卷积神经网络,优化了残差学习方式;2) 提出一种新的损失函数计算方法.使用BSD68和SET12测试数据集对本文提出的方法进行验证,实验结果表明,该文算法的降噪性能与降噪卷积神经网络算法相比,在相同降噪效果情形下,该文算法的收敛时间缩短了120%～138%.同时,与传统的深度学习图像降噪算法比较,该文方法的降噪效果和运行效率也都有提高. 相似文献