首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 85 毫秒
1.
为了解决语音分离中非负矩阵分解(non-negative matrix factorization,NMF)、深度神经网络(deep neural network,DNN)等算法没有考虑语音时序相关性的问题。结合NMF和长短时记忆网络(long short-term memory,LSTM)算法提出NMFLSTM单通道语音分离算法:将语音信号的幅度谱作为模型的输入特征,通过训练NMF和LSTM模型获得目标语音的基矩阵和系数矩阵,并对其结果进行语音重构最终实现语音分离。实验结果表明:相比于未考虑语音时间连续性的算法,使用NMFLSTM算法分离语音的客观语音质量评估值(perceptual evaluation of speech quality,PESQ)有明显提升,其最大值超过3. 1,获得良好的分离效果。  相似文献   

2.
为了减少跟踪网络中存在的参数量和计算量大的问题,提出了基于深度可分离卷积的剪枝方法。深度可分离卷积将跟踪网络中的传统卷积层分解为逐点卷积和逐层卷积两部分。在逐点卷积中,通过逐点卷积层中权重的大小来评估输入特征图通道在线性组合中的重要程度,将较小的权重及其关联的特征通道裁减掉。在逐层卷积中,通过K-L散度来衡量逐层卷积中滤波器的相似性,将相似的滤波器裁剪掉,减少冗余。通过上述方法进行多轮迭代剪枝,从而减少跟踪网络的参数量和计算量。在VOT数据集上的实验结果表明,在精度没有下降的前提下,剪枝后网络的参数量下降了22.54%,计算量下降了17.8%。在NVIDIA TX2设备上的实验结果表明,剪枝后网络的跟踪速度在CPU上提升了14.95%,在GPU上提升了13.07%。  相似文献   

3.
深度学习在肺部影像方面的研究主要集中于肺部CT图像。对肺结节的快速准确检测是肺部疾病治疗的关键步骤。结节检测本身就是一项具有挑战性的工作,且已有的研究均很难得到较高的检测率。针对这样的问题,提出一种改进的深度半监督稀疏自编码的肺结节检测方法。首先,采用局部感受野对肺结节图像进行多层特征提取。然后,利用半监督稀疏自编码自主学习肺部影像中的结节特征。最后,融合多种临床信息实现对肺结节的准确检测。实验结果表明,该方法可以达到准确率90.14%,敏感度89.67%和平均检测率96.64%,明显优于其他方法检测性能,更适用于肺结节的精准检测。  相似文献   

4.
5.
针对视网膜血管分布复杂且多变,提出一种基于上下文特征提取的视网膜血管分割算法。首先通过霍特林变换(Karhunen-Loeve, K-L)生成灰度图并经过预处理增强对比度。然后经过局部信息熵进行采样。该网络编码部分的多感受野残差编码模块在兼顾速度的同时对特征进行充分的提取。同时底部的特征融合模块由非对称融合非局部模块和非对称金字塔非局部模块两部分组成,用于融合图片的上下文特征。而解码部分由多个微型U型网络组成,保证将底层特征和高层映射特征有效融合并进行深层次的再提取。本文算法在血管分割的数字视网膜图像数据集(digital retinal image for vessel extraction, DRIVE)数据集进行仿真,准确率为96.45%,特异性为98.37%,敏感度为82.7%,实验结果表明能有效地分割视网膜血管。  相似文献   

6.
7.
针对当前工业互联网的攻击行为复杂,其网络数据具有海量、高维、时序性和非线性等特征,导致传统入侵检测方法的特征提取困难、检测率低、泛化能力差等问题,提出一种融合深度信念网络(deep belief network,DBN)和双向长短时记忆网络(Bi-directional long short-term memory,B...  相似文献   

8.
付燕  马钰  叶鸥 《科学技术与工程》2021,21(14):5855-5861
为解决当前视频描述任务中,生成描述视频的文本整体质量不高的问题,提出一种融合深度网络和视觉文本的视频描述模型.首先在编码阶段,将注意力机制引入3D残差模块,通过一维通道注意力与二维空间注意力增强视频特征映射,降低无关目标与噪声的影响;其次,解码阶段利用双层长短期记忆(long short-term memory,LSTM)深度网络的时序性特征,输出表述视频高层语义的文本描述;最后,为有效利用视觉文本信息丰富视频生成的语义描述,利用基于神经网络的主题模型提取出视频中的主题作为视觉文本融合进模型中.实验结果表明,本文方法在不同性能指标方面具有较好的准确性,能够更加准确地利用自然语言描述视频高层语义信息.  相似文献   

9.
针对传统序列图像拼接算法中的误差累积问题,提出一种基于全局和局部特征的图像拼接方法. 同时拍摄大视场角、低分辨率全局图像和小视场角、高分辨率局部图像,利用深度学习替代传统算法提取两者匹配点,进而根据两者面积比等比例扩大全局图像的匹配点坐标,将局部图像无缩放地投影至全局图像所在平面,最后融合投影后局部图像的重叠区域,拼接形成一幅大视场角、高分辨率全景图像. 实验结果表明,该方法中深度学习快速且精准地实现了特征匹配,同时局部图像间相互独立,有效地解决了拼接顺序限制和拼接误差累积.   相似文献   

10.
视频动作检测研究是在动作识别的基础上进一步获取动作发生的位置和时间信息.结合RGB空间流和光流时间流,提出了一种基于SSD的区域时空二合一动作检测网络.改进了非局部时空模块,在光流中设计了像素点筛选器来提取运动关键区域信息,只对空间流中筛选出的动作关键区域进行相关性计算,有效获得动作长距离依赖并改善非局部模块计算成本较...  相似文献   

11.
针对现有机器人基于深度网络的地形识别方法准确率低、网络训练时间长且需要大量训练数据的问题,提出一种基于深度残差网络与迁移学习的地形识别方法。首先,基于Resnet网络构建一种深度残差网络;其次,利用现有Imagenet大型数据集对构建的深度残差网络进行预训练,作为预训练网络,保留预训练网络除全连接层的训练权重,实现预训练网络大规模的参数迁移;最后,利用自建地形图像数据集对深度残差网络的全连接层进行训练,实现深度残差网络微调。实验结果表明,通过迁移学习的方法,利用深度残差网络对石子路、水泥路、砖地、沥青、草地、泥地6种自建地形图像进行分类,平均准确率达到了99.3%,同时网络训练时间也显著降低。  相似文献   

12.
基于DCNN的图像语义分割综述   总被引:3,自引:0,他引:3  
图像的语义分割是计算机视觉中重要的基本问题之一,其目标是对图像的每个像素点进行分类,将图像分割为若干个视觉上有意义的或感兴趣的区域,以利于后续的图像分析和视觉理解.近年来,深度卷积神经网络(Deep Convolutional Neural Network,DCNN)的出现,极大地推动了语义分割的发展.本文从语义分割的基本定义出发,对语义分割中存在的困难和挑战进行了分析和描述.总结了目前用于评测语义分割算法的典型数据库,并以PASCAL VOC数据库为主线对近年来基于DCNN的语义分割算法进行了梳理和总结.最后对语义分割未来的研究重点进行了探讨和预测.  相似文献   

13.
作为一类网络安全的基础研究,网络异常检测技术目前还存在检测准确率低、误报率高以及缺乏标签数据等问题。为此提出一种融合联邦学习和卷积神经网络的网络入侵检测分类模型(CNN-FL),可有效解决多个参与者在不共享隐私数据的情况下进行一个全局模型的协作训练时所带来的问题。该模型无需汇集模型训练所需要的数据进行集中计算,只是传递加密的梯度相关数据,即可利用多源数据协同训练同一模型,并解决缺乏标签数据的问题。随后将该模型应用于二分类和多分类方法中,并在同一基准数据集NSL-KDD上进行了实验比较与分析,实验结果表明,与其他研究方法相比,所提CNN-FL分类模型在二分类以及多分类中具有较高的识别性能和分类精度。  相似文献   

14.
光谱分类识别一直是天文学家研究中的基础问题,也是LAMOST巡天计划的一项重要任务.从LAMOST发布的海量天体光谱数据库中选取F、G、K 3种型星光谱数据,采用深度学习模型进行分类识别研究和对比实验研究,解决原有方法对光谱分类可信度低的问题.实验结果证明:对于F、G、K 3种型星的分类精确度问题,深度学习方法明显优于原有其他分类方法.  相似文献   

15.
提出一种基于免疫遗传优化神经网络的盲信号分离算法。该算法用网络的第一层先对观测矢量作预处理,将其降维与白化,再用网络的第二层对信号进行分离:分离层的权矩阵设计成正交矩阵,并采用免疫遗传优化与独立分量分析相结合的算法,对网络分离层的权值进行训练,其中,取高阶统计量峭度的变形作为训练的代价函数。实验表明,该算法对于盲信号分离是有效的。  相似文献   

16.
传统人脸识别方法手工设计特征过程复杂、识别率较低,对于开集人脸识别通用深度学习分类模型特征判别能力较弱。针对这两方面的不足,提出了一种以分类损失与中心损失相结合作为模型训练监督信号的深度卷积神经网络。首先,利用构建的应用场景数据集优调从公共数据集获得初始化参数的深度人脸识别模型,解决训练数据过小和数据分布差异问题,同时提高模型训练速度;然后,以传统损失函数和新的中心损失作为迁移学习过程中的监督信号,使得类内聚合、类间分散,提高模型输出人脸特征的判别能力;最后,对人脸特征进行主成分分析,进一步去除冗余特征,降低特征复杂度,提高人脸识别准确率。实验结果表明,与传统人脸识别算法相比该算法可以自动进行特征提取,并且相对于通用深度学习分类模型该算法通过度量学习使特征表示更具判别力。在自建测试集和LFW、YouTube Faces标准测试集上都取得了较高的识别率。  相似文献   

17.
针对单幅图像超分辨率重建问题(SISR),提出了一种新的基于Dirac残差的超分辨率重建算法.算法使用全局跳跃重建层来直接利用输入LR图像的低频特征,通过多个dirac残差块来自适应学习输入LR图像的高频特征,通过亚像素卷积进行图像重建.算法通过权重参数化来改进残差层,同时使用输入图像的卷积特征与残差网络学习特征结合进行重建.实验采用Adam优化器进行网络训练.使用L1范数作为损失函数.在PSNR、SSIM和视觉效果与其他先进算法进行对比,实验结果表明,在常用测试集上与其他深度学习算法相比有较大提高.  相似文献   

18.
网络拓扑发现对于现代网络管理是一个重要的课题,尤其是第2层网络拓扑发现是一个难题.针对这一难题,基于大多数网络设备都支持的SNMP协议,提出了一个快捷、高效的算法,并对该算法进行了详细的描述,用该算法进行了真实环境的测试,测试结果和真实网络情况完全吻合,说明了此算法是一个有效的拓扑发现算法.  相似文献   

19.
页岩储层总有机碳(Total Organic Carbon,TOC )含量的地震预测普遍采用密度回归拟合法,仅考虑了单因素的线性关系,预测结果误差较大。针对常规方法的不足,提出基于深度学习的TOC含量预测方法。首先,从测井资料中优选出与TOC含量曲线相关度相对较高的多个弹性参数曲线作为样本集输入数据,TOC含量曲线作为样本集输出数据,构建针对TOC含量预测的深度前馈神经网络模型;然后,调试网络模型结构,并利用共轭梯度法进行网络参数寻优;最后,将叠前振幅随偏移距变化(Amplitude Versus Offset,AVO )反演得到的弹性参数数据体输入到深度前馈神经网络模型,预测得到最终的TOC含量数据体。通过四川盆地页岩储层实际测井、地震资料的应用,对比了该方法相对于常规回归拟合法的优越性,验证了方法的实用性和可行性,为页岩储层TOC含量预测提供了新思路。  相似文献   

20.
从低分辨率图像中提取特征图恢复高分辨率图像中的高频信息是超分辨率重建的一个关键问题,针对该问题提出一个新的基于卷积神经网络的超分辨率重建算法.网络结构由卷积层与子像素卷积组成,特征提取网络中卷积层提取低分辨率图像的特征,重建网络中子像素卷积神经网络作为上采样算子.针对不能充分利用多级特征图的问题,采用跳跃连接和特征图联结在特征提取网络末端跨通道融合特征图,同时降低特征图的维度.并在此基础上再次提取特征图应用于重建.实验结果表明,算法在PSNR、SSIM和人类视觉效果上与其他基于深度学习的算法相比有着显著的提高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号