首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
现有蒙古文文字存在元样本尺寸较小、使用标准VGG-Net进行字元识别不能达到较好效果的问题,提出基于改进VGG-Net的蒙古文字元识别方法.通过改进的VGG-Net模型对手写蒙古文字元图像数据增强后的23类手写蒙古文字元样本进行识别.结果表明,改进的VGG-Net对字元图像识别的准确率达到96.83%,相比传统VGG-...  相似文献   

2.
针对工业钢材表面缺陷检测过程中存在的样本采集困难、成本较高,以及缺陷种类较多难以覆盖全部导致的小样本问题,提出一种改进循环生成对抗网络(cycle-consistent generative adversarial networks, CycleGAN)的钢材表面缺陷图像生成方法。首先,将通道注意力(class activation map, CAM)和空间注意力(spatial attention map, SAM)机制嵌入到CycleGAN模型中,增强模型的特征提取能力;其次,引入权重解调(weight demodulation, WD)机制修复特征伪影和白斑,进一步提高生成图像的质量;再次,引入形状一致性损失对生成器训练过程进行监督,解决图像几何变换过程中内在模糊性问题;最后,将改进前后的模型在NEU-DET数据集上进行试验。结果表明,改进后的模型在缺陷图像生成的效果上更具多样性和准确性,PSNR,SSIM分别提高了13.0%和7.8%,FID值降低了33.1%。该方法能够稳定地生成高质量的各类钢材表面缺陷图像,可以达到增加训练数据的目的,对于其他缺陷数据集的扩增具有参考价值。  相似文献   

3.
针对抽油机故障数据不足、样本分布不均衡的问题,提出一种基于自注意力机制的条件深度卷积生成对抗网络(CDCGAN:Conditional Deep Convolutional Generative Adversarial Networks)模型。该模型在CDCGAN的基础上引入自注意力机制,并在损失函数中加入约束生成图像分布的正则项,提高了生成图像的质量和多样性,有效地防止了模式崩溃的发生。采用Alexnet、VGG16等网络对生成的抽油机故障样本进行分类测试,实验结果表明,改进网络的生成数据质量更高,能够有效平衡抽油机故障数据,进一步提升了抽油机故障诊断的准确率。  相似文献   

4.
针对显著性目标检测任务中识别结果边缘模糊的问题,提出了一种能够充分利用边缘信息增强边缘像素置信度的新模型。该网络主要有两个创新点:设计三重注意力模块,利用预测图的特点直接生成前景、背景和边缘注意力,并且生成注意力权重的过程不增加任何参数;设计边缘预测模块,在分辨率较高的网络浅层进行有监督的边缘预测,并与网络深层的显著图预测融合,细化了边缘。在6种常用公开数据集上用定性和定量的方法评估了该模型,并且与其他模型进行充分对比,证明设计的新模型能够取得最优的效果。此外,该模型参数量为30.28 M,可以在GTX 1080 Ti显卡上达到31 帧·s-1的预测速度。  相似文献   

5.
在现有的医学影像诊断报告自动生成模型中,仅利用输入图像的视觉特征来提取相应的语义特征,并且生成词之间关联较弱和缺乏上下文信息等问题。为了解决上述问题,提出一种对比增强的关联记忆网络模型,通过对比学习提高模型区分不同图像的能力,设计了注意力增强关联记忆模块根据上一时间步生成的单词来持续更新,以加强生成医学图像报告中生成词之间的关联性,使得本模型可以为医学图像生成更准确的病理信息描述。在公开IU X-Ray数据集和私有胎儿心脏超声数据集上的实验结果表明,提出的模型在Cider评估指标方面明显优于以前的一些模型(与经典的AOANet模型相比较,在IU X-Ray上Cider指标提升了51.9%,在胎儿心脏超声数据集上Cider指标提升了3.0%)。  相似文献   

6.
针对司法领域阅读理解数据集缺乏、现有模型在不可回答问题样本和噪声样本上表现不佳等问题,提出了三种优化策略.首先,采用通用领域阅读理解数据集对RoBERTa-wwm模型进行预训练;然后,采用基于UniLM的问句生成模型生成不可回答问题样本,扩充已有训练集;最后,在微调阶段采用对抗训练算法对模型进行优化,增强模型的鲁棒性....  相似文献   

7.
在对话过程中,人们通常根据对方上一句话的关键词做出相应的回复。为了生成与关键词含义相关的回复,提出了拓展关键词信息注意力机制的对话生成模型。首先从输入语句中提取关键词,然后根据关键词词向量余弦相似度找出与关键词相关的词语构成拓展关键词集合,将集合中词语的词向量通过注意力机制的方式加入解码过程来影响回复生成。在中文微博数据集及英文Twitter数据集上的实验表明,该模型在回复语句的相关性及多样性方面取得了优于其他模型的结果。  相似文献   

8.
利用卷积神经网络在图像识别方面的优势,提出了一种基于深度卷积神经网的哈萨克手写字母识别方法(DCNN-KLR),成功建立了一种哈萨克手写文字识别模型。 与传统的方法(SVM+HOG)相比,不仅训练方便、速度快,而且提高了哈萨克手写文字的识别率。在5708个数据样本上进行训练和测试,将样本分为33类和100类,正确识别率分别达到93.29%和92.38%。  相似文献   

9.
中国非物质文化遗产水书文化面临失传威胁,近年大量深度学习的方法用于手写古籍文字的识别.但水书古籍文字识别面临数据集建立和标注困难、样本不平衡等问题,研究进展不大,且鲜少进行水书古籍页面级的文字检测与识别.首先建立了一个较大规模的水书手写文字数据集,通过几种数据扩增方式,获得包含80个文字类别,共110610个带标签的字...  相似文献   

10.
针对深度卷积生成对抗网络(DCGAN)在小规模手写体汉字数据集下生成数据重复多样、分类效果较差的问题,提出结合传统数据增强方法的结合式生成方法X-DCGAN。该方法通过预增强模块给予神经网络部分更充足多样的训练数据,减少因网络过拟合与训练不充分而出现的样本重复率高、学习效果较差的状况。实验结果表明,本文方法生成的样本数据较单一方法在样本多样性方面显著提高,生成数据进行分类测试时获得的平均识别率较DCGAN方法提升了9.67%。X-DCGAN充分发挥了传统数据增强方法和生成式方法各自的优势,能够更加有效地解决小规模数据集的扩展与增强问题。  相似文献   

11.
场景文字识别的一个具有挑战性的方面是处理具有扭曲或不规则布局的文字.尤其是侧视文字和曲线文字在自然场景中较为常见,且难以识别.本文提出了一个带有灵活矫正功能的注意力增强网络,将其用于任意形状场景文字识别.此网络由基于卷积神经网络的文字矫正网络和基于注意力增强的识别网络两部分组成.矫正网络自适应地将输入图像中的文字进行矫正,降低识别难度,使基于注意力增强的序列识别网络直接根据矫正后的图像预测字符序列.整个模型可以进行端到端的训练,训练只需要图像和相应的文字真实标签.在各种公开数据集上进行了广泛的实验,包括SVT、ICDAR 2003和CUTE80等数据集,验证了此网络具有优异的性能.  相似文献   

12.
手写文字识别是计算机视觉、自然语言处理领域中的重要问题和研究热点.本文针对手写文字识别问题,提出一种基于双向LSTM网络的手写文字识别方法.首先根据数据集特点进行归一化等预处理;然后使用CNN网络对图像的特征进行提取;接着通过双向LSTM网络来记忆手写文字序列的字句关系,并对文字序列进行预测;最后使用CTC-Loss作为损失函数,可以让整句标注的训练集在上述网络下收敛.对比实验表明本文提出的算法模型的有效性.  相似文献   

13.
针对互联网虚假评论大肆横行,在虚假评论研究领域却没有完全公开的中文数据集可供中文虚假评论检测研究的问题,提出了一种基于生成对抗网络的中文虚假评论数据生成模型.首先,对生成器生成的文字序列通过蒙特卡洛搜索获取一批样本;然后,采用强化学习方法将判别器、分类器和重构器的反馈化为奖励分数;最后,传回生成器,对生成器进行参数优化,以生成贴近真实世界的具有相应类标签属性及特征的虚假评论数据.以BLEU值为评估指标,实验结果表明,所提出的模型在本文数据集上取得了更好的BLEU值,具有较好的生成效果.  相似文献   

14.
指法估计模型的性能除了与自身的结构有关,数据本身的数量和质量也是其重要影响因素.然而,乐谱指法的标注需要标注者有一定演奏经验,且标注过程费时费力,导致现有乐谱-指法数据集稀少,且增速缓慢.为解决数据集样本数量有限带来的模型表现不佳、参数过拟合等问题,提出了两种针对键盘类乐器乐谱音高差指法数据的数据增强方法.通过分析乐谱-指法数据的统计特征,一方面结合键盘类乐器和指法的映射关系,提出了基于隐马尔可夫模型的数据增强方法,另一方面结合双手手部生理学特性,提出了左右手镜像变换的数据增强方法.将本文提出的两种增强方法生成的数据加入训练集,经过与人工确定指法思路相近的双向长短期记忆网络学习后,一般匹配率提高了2.24%,最高匹配率提升了3.73%.结果表明数据增强有助于模型更好地学习音指特征.将基于隐马尔可夫模型的数据增强方法生成的“再采样数据集”和基于手部生理学特性生成的“左右手镜像变换数据集”分别加入训练,对指法估计结果中单音和复音占比75%以上的乐谱匹配率分别进行统计,结果表明再采样数据可以增强数据集本身的统计特征,左右手镜像变换数据可以弥补一些数据集原先没有的音指规律,说明了两种数据增强方...  相似文献   

15.
卷积神经网络已被广泛应用于各种计算机视觉任务中,然而研究发现卷积神经网络极易受到精心设计的对抗样本攻击。为了抵御对抗攻击,提出一种基于注意力机制的条件生成对抗网络防御方法(attention conditional generative adversarial net, Attention-CGAN)。本算法利用对抗样本作为Attention-CGAN的训练样本,同时将生成器的生成样本输入分类器,得到注意力损失和分类损失;通过这两种损失函数训练Attention-CGAN,从而保证去噪样本的注意力区域与原始干净样本一致。在CIFAR10(Canadia Institute for Advanced Research)和ILSVRC2012(ImageNet Large Scale Visual Recognition Challenge)2个数据集上进行大量试验,结果表明去噪之后的样本分类准确率保持在70%以上。基于注意力机制CGAN的对抗样本去噪方法能提高卷积神经网络的鲁棒性,可为深度学习模型防御对抗攻击提供参考。  相似文献   

16.
通过对笔画的对称边缘特点与文字几何特征的认识,根据二阶边缘检测算子捕捉边缘点亮暗变化趋势的能力,使用高斯型拉普拉斯算子寻找"边缘点对",并构建来自笔画等窄带区域的"对称边缘点对"样本集.从样本集的分布规律中自适应地定出文字笔画搜索窗的尺度及方向.利用最小生成树算法实现由系列搜索窗得到的所有笔画子区域的关联聚类,通过剪枝、伪区域鉴别和阈值分割,将文字以行(含非水平行)或列的形式提取出来.实验表明,该方法对复杂背景下不同的语言类型、亮暗类型、文字行方向及文字尺度具有适应性,在ICDAR数据集上的查准率和查全率分别达到76%和75%.  相似文献   

17.
在自然场景文本图像超分辨中,针对先验信息利用不准确、不充分以及文本边缘恢复不完整的问题,提出了一种基于文本语义指导的自然场景文本图像超分辨方法。该网络结构由超分辨重建模块和文本语义感知模块组成。为进一步提高超分辨网络的表达能力,提出使用循环十字交叉注意力,捕获全局上下文信息,使得模型在训练的过程中更加关注文本区域,同时,提出软边缘损失、梯度损失对重建过程进行约束,生成具有锐利边缘的超分辨结果。采用公开的自然场景文本图像超分辨数据集TextZoom对提出模型的性能进行验证,与8种主流深度网络模型进行了对比,结果表明:该模型在3个不同识别器下的平均识别率相比TSRN分别提升了2.06%、1.80%和2.89%,在PSNR和SSIM指标上也具有一定的优势。  相似文献   

18.
针对供水管道漏水声音信号数据集匮乏、漏水情况多样需反复采集确定漏水、检测准确率低等问题,提出一种基于条件生成对抗网络的增强漏水信号数据集的方法。将深度对抗网络与条件生成对抗网络相结合对漏水信号数据集进行数据增强,用扩充后的数据集对一维卷积神经网络进行训练并对不同实地采集的样本进行漏水信号识别。验证表明:一种管质的某种程度漏水信息经对抗网络进行数据增强后,具有该管质未采集的漏水信号特征,能用于更加细微的漏水信号检测。该方法也适用于其它管质各种情况的漏水检测,具有良好的实用性。  相似文献   

19.
针对现有的深度伪造检测方法的偏重于局部伪造纹理信息以及对于未知伪造类型人脸泛化性检测精度低的问题,提出了一种基于全局视野的多层次检测网络,利用多头注意力机制聚合空域中Query的像素级别强度以及梯度信息生成Key和Value,使得网络在空域中构建长距离依赖关系便于获取全局伪造信息,并结合多层次特征增强策略对检测网络不同层次之间的提取伪造特征进行增强,用于提升网络的空间感知局部伪造信息能力。实验结果表明在数据集内和跨伪造类型数据集上均有较高的ACC和AUC测试得分,消融研究验证了模型各个子模块的有效性。  相似文献   

20.
将条件变分自编码器作为辅助模块,引入预训练语言模型的编码解码过程,通过数据增强(潜在的语义扩充)以提高模型的鲁棒性。通过建立陈述句与疑问句之间的高维分布联系,由分布采样实现一对多的问题生成。结果表明,融合条件变分自编码器不仅能生成多样性的问题,也有助于提升问题生成的模型性能。在基于SQuAD数据集划分的2个答案可知问题生成数据集Split1和Split2上,BLEU-4值分别被提升到20.75%和21.61%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号