首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 218 毫秒
1.
为了进一步提高基于深度神经网络的语音增强方法的性能,针对单独使用卷积神经网络难以对含噪语音中的长期依赖关系进行建模的问题,提出一种基于卷积门控循环神经网络的语音增强方法.该方法首先采用卷积神经网络提取含噪语音中的局部特征,然后采用门控循环神经网络将含噪语音中不同时间段的局部特征进行关联,通过结合两种网络的不同特性,在语音增强中更好地利用含噪语音中的上下文信息.实验结果表明:该方法能够有效提高未知噪声条件下的语音增强性能,增强后的语音具有更好的语音质量和可懂度.  相似文献   

2.
为了有效地管理和利用网络文本信息,实现文本内容自动标签标注,提出采用多种深度学习模型对多标签文本分类进行研究。采用神经网络词向量模型word2vec获取文本数据的语义特征。对循环神经网络和卷积神经网络进行模型融合,引入注意力机制,形成TextRCNN_Attention神经网络模型。实验结果表明,TextRCNN_Attention模型结构融合了循环神经网络和卷积神经网络模型的优点,能更好地理解语义信息。Attention机制对文本特征提取更加合理,使模型将注意力聚焦在对文本分类任务贡献分值较大的特征上,分类效果更好。  相似文献   

3.
为了解决低光照图像存在的对比度低、噪声大等问题,提出一种基于 Retinex 理论的卷积神经网络增强模型 (Retinex-RANet)。 它包括分解网络、降噪网络和亮度调整网络 3 部分:在分解网络中融入残差模块(RB)和跳跃连 接,通过跳跃连接将第一个卷积层提取的特征与每一个 RB 提取的特征融合,以确保图像特征的完整提取,从而得 到更准确的反射分量和光照分量;降噪网络以 U-Net 网络为基础,同时加入了空洞卷积和注意力机制,空洞卷积能 提取更多的图像相关信息,注意力机制可以更好地去除反射分量中噪声,还原细节;亮度调整网络由卷积层和 Sigmoid 层组成,用来提高光照分量的对比度;最后将降噪网络去噪后的反射分量和亮度调整网络增强后的光照分 量融合,得到最终的增强结果。 实验结果显示:Retinex-RANet 在主观视觉上不仅提高了低光图像的亮度,还提高了色彩深度和对比度,在客观评价指标上,相较于 R2RNet,PSNR 值上升了 4. 4%,SSIM 值上升了 6. 1%。 结果表 明:Retinex-RANet 具有更好的低光图像增强效果  相似文献   

4.
针对现阶段航空发动机单一剩余使用寿命预测模型数据挖掘深度不足导致预测精度低的问题,提出一种双通道模型的预测方法。首先,构建双通道网络结构:通道一使用时间卷积网络,通过残差结构和空洞卷积使得网络具有更大的感受野和计算速度;通道二使用卷积长短时间记忆网络,提取多维时空特征,捕捉数据长期依赖关系。其次,利用多头注意力机制为双通道网络特征重新赋予权重。最后,将双通道网络进行特征融合输出,实现对航空发动机剩余寿命预测。使用涡扇发动机退化数据集进行实验验证,并与其它文献中提到的卷积双向长短时间记忆网络模型、多特征注意力模型、多头注意力模型、卷积门控单元循环神经网络模型进行对比。结果表明,所提模型在3种评价指标上均取得更好的表现,为航空发动机剩余寿命预测提供了一种新思路。  相似文献   

5.
传统的情感分析方法不能获取全局特征,以及否定词、转折词和程度副词的出现影响句子极性判断.在深度学习方法基础上提出了基于卷积神经网络和双向门控循环单元网络注意力机制的短文本情感分析方法.将情感积分引入卷积神经网络,利用情感词自身信息,通过双向门控循环网络模型获取全局特征,对影响句子极性的否定词、转折词和程度副词引入注意力...  相似文献   

6.
针对滚动轴承信号易受噪声干扰和智能诊断模型在不同工况下自适应性差的问题,提出了一种多尺度注意力卷积神经网络(MSACNN)模型.首先,将一维时间序列转化为二维图像作为模型的输入,在特征提取过程中,利用多尺度卷积结构拓宽网络的宽度并实现不同维度敏感特征的提取;然后,通过注意力机制对数据不同维度的特征赋予不同的权重,使模型...  相似文献   

7.
能谱式计算机断层扫描(CT)成像技术具备良好的能量分辨率,能够精确地鉴别人体组织成分,从而为后续诊断提供更准确的检测信息.随着辐射剂量的降低,能谱CT图像中噪声水平显著提高,对成像质量产生严重影响,进而降低了组织成分的解析精度.基于卷积神经网络(CNN)的去噪模型虽然可以显著降低图像中的噪声含量,但随着卷积层数的增加,深层神经网络通常会丢失高频信息.为了解决这一问题,并实现在低剂量条件下重建出高质量能谱CT图像,本文提出了一种结合通道注意力机制(CA)和持续自注意力机制(PSA)的密集连接持续注意力网络(DCPAN).两种注意力机制分别建立特征图像在通道和全局维度的联系以提高网络对图像高频分量的敏感程度,进而抑制高频细节信息的丢失.该模型所采用的密集连接结构通过特征复用的方式可以在前馈传播中保留高频信息,使用复合损失函数来监督网络的训练可以使该模型对边缘特征和组织细节信息更加敏感.实验结果表明,经该模型处理的腹部切片CT图像峰值信噪比、结构相似性指数和特征相似性指数分别达到了38.25 dB、0.993 7和0.973 2以上.相比于目前先进的CT噪声去除方法,该方法具有更好的噪声抑制...  相似文献   

8.
基于视频序列的面部表情识别问题主要有两个特点:空时性和显著性。近年来,许多研究人员利用卷积神经网络、循环神经网络、三维卷积神经网络等深度学习方法处理该问题的空时特性。但是,面部表情的显著性问题却往往被忽视。随着注意力机制在深度学习网络中的应用发展,其能够有效地解决各类任务中的显著性问题。该文将空时注意力机制应用到面部表情识别中,使得深度网络更多地关注空时特征中的显著性。具体地,该文将空间注意力模块嵌入到卷积网络中,以使空域特征更加关注对表情识别重要的区域,将时间注意力模块嵌入到门控循环单元(gated recurrent units,GRU)后,使得时域特征更加关注信息丰富的视频帧。在RECOLA情感数据库上的实验表明,与一般的深度模型相比,该文的深度空时注意力网络显著提高了面部表情识别的性能。  相似文献   

9.
为提高被噪声干扰的语音的可理解性和语音质量,针对用于语音增强的深度复数网络对语音复数谱中关键声学特征提取不充分、关联信息建模不合理的问题,提出了基于多维度注意力机制和复数Conformer的单通道语音增强方法(SE-MDACC)。在复数U-Net架构下引入复数Conformer,对语音幅度和相位的相关性进行建模;利用多维度注意力机制,构造更加丰富的特征来增强卷积层的表示能力;在残差连接中加入注意力门控机制强化重构语音的细节信息。实验结果显示,相比于深度复数卷积递归网络,SE-MDACC的客观评价指标语音质量感知评估和短时客观可懂度分别提升15.299%、1.462%,表明SE-MDACC可充分提取语音声学特征并对幅度和相位相关性进行合理建模,有效提升语音质量和可理解性。  相似文献   

10.
针对噪声环境下滚动轴承故障难以诊断的问题,提出一种基于深度学习融合网络的轴承故障识别新方法。该方法首先对轴承振动信号进行一定程度的随机损坏,并将加噪后的数据输入卷积降噪自编码器(convolutional denoising autoencoder, CDAE)中对网络进行训练,目的是降低信号中的噪声干扰并提取浅层特征;然后,利用深度信念网络(deep belief network, DBN)学习深层特征并建立轴承状态识别模型,输出故障识别结果。在融合模型中,将卷积降噪自编码器作为网络的第一层以增强网络的抗干扰能力,提高故障的识别精度。使用凯斯西储大学(CWRU)滚动轴承数据对所提模型进行验证,结果表明提出的融合模型在噪声环境下能够较好地实现轴承的故障状态识别。  相似文献   

11.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。  相似文献   

12.
近年来,基于深度卷积神经网络的学习方法在图像降噪方面取得了前所未有的成果,通过调整网络结构和参数来获取更好的图像降噪效果已成为研究热点.降噪卷积神经网络在深度神经网络中采用残差学习方法,在提高降噪效果的同时,在一定程度上解决了盲降噪问题.其不足之处在于算法收敛时间长.该文针对降噪卷积神经网络结构做了进一步的改进,提出了一种基于反卷积降噪神经网络的图像降噪算法.该文工作的主要特色如下:1) 在原有的网络结构中,引入反卷积神经网络,优化了残差学习方式;2) 提出一种新的损失函数计算方法.使用BSD68和SET12测试数据集对本文提出的方法进行验证,实验结果表明,该文算法的降噪性能与降噪卷积神经网络算法相比,在相同降噪效果情形下,该文算法的收敛时间缩短了120%~138%.同时,与传统的深度学习图像降噪算法比较,该文方法的降噪效果和运行效率也都有提高.  相似文献   

13.
目的 低光工况或拍摄技巧影响都可能获得低光照图像,为解决此类图像对比度低、噪声大、颜色失真等问 题,提出一种卷积神经网络增强模型 RetKIND,包括分解网络、亮度调整网络和降噪网络。 方法 它借助残差模块 (RB)和跳跃连接,有效抑制分解网络在分解时产生的噪声;融合 U-Net 架构、空洞卷积和 EBAM 高效注意力机制 构建降噪网络,利用空洞卷积扩大感受野,提取更多图像信息,提高 EBAM 在通道和空间上提取反射图的细节、纹 理、颜色等特征的能力,实现图像去噪;由 UC(亮度调整网络中的自定义模块)和普通卷积组成亮度调整网络,旨在 减少光照图细节缺失,提高光照分量对比度。 融合去噪后的反射分量和增强后的光照分量,得到正常光照图像。 结果 仿真结果表明:在 LOL 数据集上,相较 R2RNet,FPSNR 和 FSSIM 值分别上升了 6. 2%和 4. 2%;相较 URetinexNet,FPSNR 和 FSSIM 值分别上升了 5. 9%和 1. 2%;相较 DEANet,FPSNR 和 FSSIM 值分别上升了 2. 9%和 1. 1%。 结论 Ret -KIND 模型既能提升图像亮度,又能降低图像的噪声,有助于推动低光图像增强模型应用到目标检测领域。  相似文献   

14.
提出了一种新颖的语音情感识别结构,从声音文件中提取梅尔频率倒谱系数(Melscale frequency cepstral coefficients,MFCCs)、线性预测倒谱系数(linear predictive cepstral coefficients,LPCCs)、色度图、梅尔尺度频谱图、Tonnetz表示和频谱对比度特征,并将其作为一维卷积神经网络(convolutional neural network,CNN)的输入.构建由一维卷积层、Dropout层、批标准化层、权重池化层、全连接层和激活层组成的网络,并使用Ryerson情感说话/歌唱视听(Ryerson audio-visual database of emotional speech and song,RAVDESS)数据集、柏林语音数据集(Berlin emotional database,EMO-DB)、交互式情绪二元运动捕捉(interactive emotional dyadic motion capture,IEMOCAP)数据集这3个数据集的样本来识别情感.为提高分类精度,利用增量方法修改初始模型.为...  相似文献   

15.
针对驾驶员分心驾驶行为检测,设计一种级联卷积神经网络检测框架。检测框架由第一级分心行为预筛选卷积网络和第二级分心行为精确检测卷积网络两个全卷积网络级联构成。预筛选卷积网络是一个轻量级的图像分类网络,负责对原始数据进行快速筛选,其网络层数少、训练速度快,结构特征冗余较少,能够减少后续网络的计算负担;分心行为精确检测卷积网络采用VGG(Visual geometry group)模型特征提取的深度迁移学习检测算法网络,通过迁移学习重新训练分类器和部分卷积层。提出的级联神经网络最终可以实现9种驾驶员分心驾驶行为的准确识别检测。实验结果表明,相比主流单模型检测方法,在保证算法效率的同时准确率均有明显提升,准确率达到93.3%,有效降低了误检率。该方法具有较好的鲁棒性和泛化能力。  相似文献   

16.
遥感影像去噪对于影像后续的使用和研究具有重要意义。高斯噪声与椒盐噪声是影像中常见的噪声,目前的去噪算法对于这类混合噪声普遍存在去噪效果不佳、去噪后影像边缘模糊等缺点。针对以上问题,提出了一种遥感影像混合噪声二阶去除方法。该方法第一阶段是在DnCNN网络框架的基础上引入扩张卷积来增加网络的感受野,便于在遥感影像中提取更多的特征信息;同时在深卷积层后引入DropoutLayer层构建降噪模型,以防止网络出现过拟合,简化训练难度,然后使用该模型对影像进行初步降噪。为进一步提高初步降噪结果的影像质量,有效去除混合噪声中的椒盐噪声,保留更多的影像边缘细节及纹理特征。该方法第二阶段是在自适应中值滤波的基础上采用最近邻域像素加权中值替换原滤波窗口中值,对初步降噪结果进行二次处理,得到遥感影像混合噪声最终去噪结果。为验证算法的可行性和有效性,进行了遥感影像去噪实验及去噪影像边缘检测实验。分析实验结果,无论从主观视觉还是客观评价指标上进行对比,提出的方法对于遥感影像混合噪声去噪效果优于传统去噪方法,并且能够较好地保留影像边缘细节及纹理特征,获得更清晰的影像结果。  相似文献   

17.
张膑  张运杰  白明明 《科学技术与工程》2021,21(26):11253-11262
卷积稀疏编码网络模型(convolutional sparse coding network, CSCNet)虽然能够有效解决去噪问题,但是该算法并没有考虑到迭代求解近似编码向量过程中卷积层、反卷积层之间的叠加会改变原始数据分布方式。为解决该问题,借鉴深度学习领域常用方法对原始模型进行改进。讨论了在CSCNet模型中加入以及不加入批处理标准化(batch normalization, BN)、非线性激活函数、残差学习(residual learning, RL)对模型图像去噪效果的影响,然后再此基础上分别设计了两个不同的网络模型结构。为使输入数据分布方式不因模型层与层之间传播而改变,模型1是在原始CSCNet网络的每一层加入非线性激活函数以及BN层。CSCNet模型中所训练的卷积核都是同样大小,为增加图像特征的多样性,模型2在模型1基础之上加入了简单残差块结构改变了原始模型参数传播方式,并将其通过Shortcut Connections结构与原始输入联结起来。从实验结果可以看出,在不降低原始模型计算效率的前提下,使用文中设计的模型所得去噪后的结果相比原卷积稀疏编码网络略有提升。  相似文献   

18.
针对目前的人脸识别算法在面对不同姿态下的人脸图像时识别率低的问题,提出了一种基于改进的卷积神经网络的算法。该算法通过对经典的卷积神经网络LeNet-5 的卷积核数目、卷积核尺寸、池化层方式和正则化手段等参数进行了优化改进,从而能对多姿态人脸图像特征进行有效提取。仿真实验结果表明,该算法在识别率与识别时间上均有显著提高。  相似文献   

19.
将卷积神经网络(convolutional neural networks,CNN)声学模型应用于中文大词表连续电话语音识别任务中,分析了卷积层数、滤波器参数等变量对CNN模型性能的影响,最终在中文电话语音识别测试中,CNN模型相比传统的全连接神经网络模型取得了识别字错误率1.2%的下降.由于卷积结构的复杂性,常规的神经网络加速方法如定点量化和SSE指令加速等方法对卷积运算的加速效率较低.针对这种情况,对卷积结构进行了优化,提出了2种卷积矢量化方法:权值矩阵矢量化和输入矩阵矢量化对卷积运算进行改善.结果表明,输入矩阵矢量化方法的加速效率更高,结合激活函数后移的策略,使得卷积运算速度提升了8.9倍.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号